人工智能技術(shù)在硅谷的實(shí)踐
人工智能飛速發(fā)展,金融領(lǐng)域大有可為
隨著人工智能技術(shù)的快速發(fā)展,多個領(lǐng)域都迅速收獲了突破性成效,在金融領(lǐng)域內(nèi)也是如此。具體來說,在信用評估、投資和個人財務(wù)管理上都有所運(yùn)用。實(shí)際上,金融領(lǐng)域是人工智能適合運(yùn)用的領(lǐng)域之一,這是因?yàn)槿斯ぶ悄芗夹g(shù)的數(shù)據(jù)和算法缺一不可,而運(yùn)用的領(lǐng)域需要滿足能夠?qū)⒁欢ǖ牧鞒虡?biāo)準(zhǔn)化、模式(pattern)化。金融領(lǐng)域是跟數(shù)據(jù)大量打交道的領(lǐng)域,全球化的波動導(dǎo)致交易市場瞬息萬變,而智能設(shè)備等傳感器的普及產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù)。金融領(lǐng)域的風(fēng)險定價正可以利用數(shù)據(jù)和算法進(jìn)行更高效的評估,可有效的降低金融機(jī)構(gòu)的成本,同時挖掘到更多有價值的信息,幫助市場進(jìn)行決策。
作為全球創(chuàng)新的中心之一硅谷,近年來也涌現(xiàn)了大量的以人工智能為核心技術(shù)的創(chuàng)業(yè)金融科技公司。未央研究拜訪了這其中16-17年之間成立的公司,以發(fā)現(xiàn)最新人工智能技術(shù)是如何改進(jìn)或重塑原有金融格局。
人工智能技術(shù)在借貸領(lǐng)域的運(yùn)用
近年來智能設(shè)備的興起圍繞用戶產(chǎn)生了大量的信息,這為評估個人信用風(fēng)險產(chǎn)生了大量的挖掘價值。同時,傳統(tǒng)的FICO分?jǐn)?shù)缺陷也一直存在,事實(shí)上,由于FICO分?jǐn)?shù)極大依賴于信用歷史。(FICO分?jǐn)?shù)考慮的五個指標(biāo)包括:(1)償還歷史記錄,占比35%,庫卡機(jī)器人驅(qū)動器維修,包括各種信用賬戶的償還信息和負(fù)面的公共記錄;(2)信貸欠款額度,占比30%;(3)信貸歷史年限,占比15%;(4)新開設(shè)的信用賬戶,占比10%;(5)正在使用的信用類型,占比10%。)這導(dǎo)致FICO分?jǐn)?shù)在實(shí)際運(yùn)用中產(chǎn)生了一些問題:
一、對于缺乏信用歷史的人,如移民或者年輕人無法評估;
二、對于已有FICO分?jǐn)?shù)的人群來說,其假設(shè)和準(zhǔn)確性也存疑,例如,如果用戶由于遭受了短期經(jīng)濟(jì)打擊失去房子,但是保留工作的車輛則應(yīng)該判定其有穩(wěn)定的還款意愿,但在FICO分?jǐn)?shù)里則被認(rèn)為是不可靠的。而FICO數(shù)據(jù)迭代較慢,這導(dǎo)致了一些分?jǐn)?shù)較高的用戶同樣存在違約狀況。
近年來,F(xiàn)ICO分?jǐn)?shù)越來越成為一個供金融機(jī)構(gòu)參考而不是決定性的指標(biāo)之一,對于個人用戶的信息,機(jī)構(gòu)會自行收集并用自己的風(fēng)控模型進(jìn)行評估。甚至有公司不再使用FICO,例如,2016年1月,硅谷最大的線上貸款公司SoFi就宣布不再使用FICO分?jǐn)?shù)。
人工智能算法的使用也對于個人用戶信用畫像能起到完善作用。MIT一篇工作論文通過將2009-2012年的消費(fèi)者信用歷史數(shù)據(jù)和消費(fèi)類數(shù)據(jù)利用分類和回歸決策樹算法為消費(fèi)者進(jìn)行信用分?jǐn)?shù),并將結(jié)果與利用信用局的數(shù)據(jù)利用傳統(tǒng)方法計算的分?jǐn)?shù)結(jié)果進(jìn)行對比。下圖顯示兩種模型對于信用優(yōu)良和信用差的人群都有較好的識別作用,但對于信用中等的人群,前者更能準(zhǔn)確的預(yù)測該人群的預(yù)期行為。
作為近年來發(fā)展最快的深度學(xué)習(xí)技術(shù)來說,以往可能被信貸員判斷為無關(guān)變量的信息,如地址信息,APP使用習(xí)慣等,通過挖掘和整合可能形成有用的變量,從而反映/指向跟用戶的還款意愿或者還款能力相關(guān)的變量。
未央研究在硅谷實(shí)地參訪的兩家公司Upgrade和RandomForestCapital都使用了人工智能技術(shù)對于用戶的信用進(jìn)行了評估當(dāng)然前者的方法早已經(jīng)運(yùn)用在了國內(nèi)。Upgrade自稱推出了評估模型2.0版本,一是使用了地理位置數(shù)據(jù),這些位置數(shù)據(jù)能夠和宏觀經(jīng)濟(jì)因素結(jié)合起來,反映了不同地方的經(jīng)濟(jì)狀況;二是平臺行為模式是連接到了用戶的checkingaccount,通過分析用戶的自由現(xiàn)金流來看用戶的支付習(xí)慣,例如是否由有逾期、懲罰費(fèi)用,或者錯過了某些支付日期,這種分析方式如同分析中小企業(yè)的現(xiàn)金流的方法。Upgrade將其運(yùn)用在了個人風(fēng)控上。
RandomForestCapital在2016成立,是一家位于舊金山的跨平臺機(jī)器學(xué)習(xí)和數(shù)據(jù)工程投資管理公司。RandomForest稱,目前現(xiàn)存的承銷方法昂貴、低效、不準(zhǔn)確,無法準(zhǔn)確地評估這些債務(wù)的風(fēng)險。RandomForest使用跨平臺的機(jī)器學(xué)習(xí)算法來定價債券;在大大提高準(zhǔn)確性和效率的同時,也解決了投資者和借款方的利益沖突。因?yàn)槠脚_獲得的很多數(shù)據(jù)是類別數(shù)據(jù),所以公司使用樹類的模型---基于樹的(treebase)算法很有用,此外Boosting算法也被證明很有效果。
需要指出的是,受限于美國對于個人數(shù)據(jù)和隱私保護(hù),很多金融機(jī)構(gòu)需要帶著腳銬跳舞在不破壞個人隱私的情況下盡可能挖掘多的關(guān)于主體的信息。
人工智能在投資領(lǐng)域的運(yùn)用
人工智能技術(shù)早期在投資領(lǐng)域中已有所運(yùn)用,人工神經(jīng)網(wǎng)絡(luò)(ANN)就是被認(rèn)為較有用的算法之一,人工神經(jīng)網(wǎng)絡(luò)已被證明能過夠有效處理金融市場中的不確定性,相比于線性回歸模型能夠挖掘數(shù)據(jù)中的非線性關(guān)系,同時能夠有效的處理大量數(shù)據(jù)中的噪音信息。更吸引人的是,人工神經(jīng)網(wǎng)絡(luò)模型可以通過新數(shù)據(jù)的訓(xùn)練來更新現(xiàn)有的模型,在瞬息萬變的市場中能做到快速反應(yīng)。
自2004年以來,美國國內(nèi)量化基金的財產(chǎn)規(guī)模不斷增加。從2004到2016年,量化基金總財產(chǎn)規(guī)模從300億美金迅速增長至3000億美金。一些著名的量化基金包括TwoSigma、DEShaw、Citadel等。相對于傳統(tǒng)的量化投資基金,人工智能型基金的一大優(yōu)勢即是它更大限度地回避了人為操作的誤差,可以在短時間內(nèi)處理更大量的數(shù)據(jù),并可以動態(tài)地更新模型的參數(shù)以及模型本身,所以使得算法更加靈活且適應(yīng)性強(qiáng),使其在長期超越靜態(tài)的傳統(tǒng)量化模型的表現(xiàn)。相對于傳統(tǒng)的量化模型來說,人工智能型基金算法更加靈活,甚至設(shè)立了一些隨機(jī)性,這使得其算法相關(guān)性相對于傳統(tǒng)量化模型更弱。
下圖為EUREKAHEDGE在2017年1月的研究。途中藍(lán)線為人工智能型量化基金收益,紫色線為傳統(tǒng)基金收益,綠色線為指數(shù)型基金收益,紅色線為偏傳統(tǒng)型量化基金收益。可見,自2010年起,相比于任何其他種類的基金,人工智能型基金收益都更高。
此外,由下表的相關(guān)性矩陣看出,人工智能型的量化投資基金和其同類型基金的相關(guān)性都較低,和一般的對沖基金的相關(guān)性甚至是負(fù)數(shù)。Pit.AI就是一家用人工智能開發(fā)對沖基金交易策略的公司。Yves-LaurentKomSamo希望將對沖基金從由人工驅(qū)動,轉(zhuǎn)向機(jī)器驅(qū)動。公司通過節(jié)省行業(yè)中開銷最大的人力成本,來提升整個公司的盈利能力。Pit.AI只向投資人收取與盈利相關(guān)的費(fèi)用,并不收取基金管理費(fèi)。只有當(dāng)基金表現(xiàn)更好的時候,Pit.AI與投資人對收益分成。收入分成比例是三七開,Pit.AI收取收益的30%。未來,Pit.AI希望將收費(fèi)模式變成曲線形式,當(dāng)收益表現(xiàn)不好的時候,收費(fèi)相應(yīng)減少,當(dāng)收益增加的時候,收費(fèi)比例相應(yīng)提高。
Pit.AI認(rèn)為通過雇傭很多交易員,產(chǎn)生眾多交易算法從而競爭的形式并不能很好的產(chǎn)生很優(yōu)質(zhì)的算法。因?yàn)椋刹呗缘娜耍蠖鄶?shù)都用同一種思路在嘗試,發(fā)現(xiàn)的算法通常具有很強(qiáng)的相似和相關(guān)性。這些相關(guān)度很高的算法,并沒有對分散交易風(fēng)險起到應(yīng)有的作用。