| 首頁(yè) | | | 資訊中心 | | | 貿(mào)金人物 | | | 政策法規(guī) | | | 考試培訓(xùn) | | | 供求信息 | | | 會(huì)議展覽 | | | 汽車(chē)金融 | | | O2O實(shí)踐 | | | CFO商學(xué)院 | | | 紡織服裝 | | | 輕工工藝 | | | 五礦化工 | ||
貿(mào)易 |
| | 貿(mào)易稅政 | | | 供 應(yīng) 鏈 | | | 通關(guān)質(zhì)檢 | | | 物流金融 | | | 標(biāo)準(zhǔn)認(rèn)證 | | | 貿(mào)易風(fēng)險(xiǎn) | | | 貿(mào)金百科 | | | 貿(mào)易知識(shí) | | | 中小企業(yè) | | | 食品土畜 | | | 機(jī)械電子 | | | 醫(yī)藥保健 | ||
金融 |
| | 銀行產(chǎn)品 | | | 貿(mào)易融資 | | | 財(cái)資管理 | | | 國(guó)際結(jié)算 | | | 外匯金融 | | | 信用保險(xiǎn) | | | 期貨金融 | | | 信托投資 | | | 股票理財(cái) | | | 承包勞務(wù) | | | 外商投資 | | | 綜合行業(yè) | ||
推薦 |
| | 財(cái)資管理 | | | 交易銀行 | | | 汽車(chē)金融 | | | 貿(mào)易投資 | | | 消費(fèi)金融 | | | 自貿(mào)區(qū)通訊社 | | | 電子雜志 | | | 電子周刊 | ||||||||||
——量化派王倪在湯森路透演講實(shí)錄
湯森路透成立于2008年4月17日,是由加拿大湯姆森公司與英國(guó)路透集團(tuán)合并組成的商務(wù)和專(zhuān)業(yè)智能信息提供商,主要為專(zhuān)業(yè)企業(yè)、金融機(jī)構(gòu)和消費(fèi)者提供財(cái)經(jīng)信息服務(wù)。近日,國(guó)內(nèi)領(lǐng)先的科技公司——量化派的聯(lián)合創(chuàng)始人王倪先生受邀出席湯森路透論壇,作為前谷歌的資深數(shù)據(jù)科學(xué)家,王倪在論壇上做了關(guān)于人工智能(AI)發(fā)展簡(jiǎn)史以及AI是如何更好的服務(wù)金融客戶(hù)的分享。
以下為現(xiàn)場(chǎng)實(shí)錄:
尊敬的領(lǐng)導(dǎo)和同學(xué)們,今天非常有幸受湯森路透的邀請(qǐng)我能來(lái)到中關(guān)村(7.40 +0.54%,診股)軟件園和大家做一些分享。
作為機(jī)器學(xué)習(xí)行業(yè)里從業(yè)多年的老兵和創(chuàng)業(yè)者,我今天想和大家分享一下自己對(duì)人工智能發(fā)展歷程以及和產(chǎn)業(yè)結(jié)合的一些看法,希望大家能夠從其中看到更多未來(lái)的趨勢(shì)以及更好的商業(yè)機(jī)會(huì)。
人工智能發(fā)展簡(jiǎn)史
人工智能這個(gè)概念其實(shí)提出的是非常早的, AI這個(gè)名詞是在五幾年的時(shí)候就被提出了,研究和探討用機(jī)器模擬人類(lèi)智能的有關(guān)問(wèn)題。 如果機(jī)器能夠通過(guò)圖靈測(cè)試,讓常人已經(jīng)辨識(shí)不出來(lái)它是一個(gè)真人還是一個(gè)機(jī)器了,這是最開(kāi)始關(guān)于人工智能最簡(jiǎn)單的概念。當(dāng)時(shí)的技術(shù)方法和現(xiàn)在是完全不一樣的,像符號(hào)系統(tǒng),lisp語(yǔ)言,專(zhuān)家系統(tǒng)等等,其中也包括邏輯回歸;而到80年代,一個(gè)很有標(biāo)識(shí)性的神經(jīng)網(wǎng)絡(luò)的迅速發(fā)展,其實(shí)神經(jīng)網(wǎng)絡(luò)從結(jié)構(gòu)上就是多層邏輯回歸。在學(xué)術(shù)界,神經(jīng)網(wǎng)絡(luò)是獨(dú)立在AI之外,成為一門(mén)新的獨(dú)立學(xué)科。1996年我在中科大上大學(xué)讀的是電子工程系, 當(dāng)時(shí)在學(xué)術(shù)界經(jīng)常會(huì)喊一句“AI is dead, long live neural networks神經(jīng)網(wǎng)絡(luò)萬(wàn)歲”。90年代后,以統(tǒng)計(jì)方法為基礎(chǔ),計(jì)算機(jī)科學(xué)家和統(tǒng)計(jì)學(xué)家提出了很多新的方法,例如隨機(jī)森林,boosting tree等快速的推動(dòng)了機(jī)器學(xué)習(xí)的發(fā)展,這些方法在當(dāng)時(shí)已經(jīng)能夠比當(dāng)時(shí)淺層的神經(jīng)網(wǎng)絡(luò)能更快速的運(yùn)算,做更好更準(zhǔn)確的預(yù)測(cè)和判斷;到了2010年之后, 以“深度學(xué)習(xí)”為代表的技術(shù)突破,讓人工智能概念大爆發(fā),帶來(lái)的是在各行各業(yè)的在技術(shù)上從量變到質(zhì)變的跳躍。
我2007年到2014年的時(shí)候是在紐約的谷歌研究院,最開(kāi)始的時(shí)候,當(dāng)時(shí)的語(yǔ)音識(shí)別團(tuán)隊(duì)也是在研究院, 當(dāng)時(shí)和我們統(tǒng)計(jì)組一起也有合作項(xiàng)目。在2012年左右的時(shí)候, 開(kāi)始使用深度學(xué)習(xí)來(lái)處理語(yǔ)音識(shí)別,之前大家都用的是隱馬爾科夫模型,引入了深度學(xué)習(xí)之后,大大的提高了成功率,這在當(dāng)時(shí)是非常驚人的提高。后來(lái)的話整個(gè)團(tuán)隊(duì)就被安卓團(tuán)隊(duì)全部并過(guò)去了,調(diào)到加州硅谷那邊,開(kāi)發(fā)了android語(yǔ)音助手,成為android系統(tǒng)的一個(gè)和蘋(píng)果ios比較的亮點(diǎn)。當(dāng)時(shí)語(yǔ)音識(shí)別的發(fā)展的,屬于是跳躍式的,是非常激動(dòng)人心的事情。
AI技術(shù)的發(fā)展一直是和產(chǎn)業(yè)的結(jié)合起來(lái)的,因?yàn)樵诋a(chǎn)業(yè)里面,你有一個(gè)新技術(shù)出來(lái),如果能夠立馬的運(yùn)用和結(jié)合上,更優(yōu)化更高效。比如在最開(kāi)始的50年代,當(dāng)時(shí)的邏輯回歸,也是迅速的應(yīng)用到金融領(lǐng)域。FICO公司把幾大征信局的數(shù)據(jù),用邏輯回歸的方法進(jìn)行提煉、總結(jié)、形成FICO評(píng)分,后續(xù)成為個(gè)人征信體系的一個(gè)基礎(chǔ)。從那時(shí)起,這樣的方法也被各大銀行,作為評(píng)分卡的底層技術(shù)被引用一直延續(xù)到現(xiàn)在。在80年代的神經(jīng)網(wǎng)絡(luò)開(kāi)始快速發(fā)展, Yann Lecun提出的卷積神經(jīng)網(wǎng)絡(luò)CNN,最開(kāi)始是用來(lái)識(shí)別這種手寫(xiě)字母的。那時(shí)候大家還是普遍用手寫(xiě)郵件來(lái)交流,自動(dòng)識(shí)別郵政編碼能夠快速的對(duì)郵件來(lái)進(jìn)行分類(lèi)傳遞。神經(jīng)網(wǎng)絡(luò)被提出來(lái)之后, 在消費(fèi)金融領(lǐng)域里頭主要運(yùn)用在反欺詐里,美國(guó)圣地亞哥那邊一個(gè)公司用神經(jīng)網(wǎng)絡(luò)開(kāi)發(fā)了一個(gè)系統(tǒng)叫 Falcon 獵鷹,這個(gè)反欺詐系統(tǒng)后來(lái)在美國(guó)銀行的信用卡里已經(jīng)是一個(gè)標(biāo)準(zhǔn)配置,各家都會(huì)用這套系統(tǒng),公司后來(lái)也被FICO收購(gòu)了。 在2000年這些之后的話,像隨機(jī)森林,adaboost這些新的方法出來(lái)之后對(duì)于整個(gè)行業(yè)所帶來(lái)的影響和改變是非常大的,而且現(xiàn)在中國(guó)Fintech公司用的主流的技術(shù)也是那個(gè)時(shí)期的。記得2006年的時(shí)候,那時(shí)候在美國(guó)的Capital One,他們那邊的話也是在試點(diǎn),用 TreeNet 也就是 boosting tree來(lái)構(gòu)建授信模型,反欺詐模型,然后替代傳統(tǒng)的SAS邏輯回歸。但是其實(shí)在美國(guó),最重要的是金融監(jiān)管的原因,需要模型的可解釋性,所以導(dǎo)致整個(gè)推進(jìn)是非常緩慢的。但是在中國(guó),F(xiàn)intech領(lǐng)域是一個(gè)階躍性的發(fā)展,相比美國(guó)的同行已經(jīng)進(jìn)步的是非常快了,并且中國(guó)已經(jīng)比美國(guó)的同行業(yè)在Fintech要領(lǐng)先,沒(méi)有太多歷史包袱。
在2016年深度學(xué)習(xí)被大家廣泛認(rèn)知之后,對(duì)于國(guó)內(nèi)的Fintech公司的影響是非常大的,現(xiàn)在深度學(xué)習(xí)技術(shù)對(duì)人臉識(shí)別的大幅優(yōu)化提高,就單從產(chǎn)品流程上來(lái)說(shuō),大家能直觀感受到的就比如像支付寶、刷臉支付或者是在網(wǎng)貸平臺(tái)上,需要你手持身份證進(jìn)行人臉識(shí)別匹配,保證申請(qǐng)人是本人。 這個(gè)在授信以及風(fēng)控的時(shí)候它是一個(gè)首先和必要的環(huán)節(jié)。
人工智能正悄然改變所有行業(yè)
人工智能現(xiàn)在已經(jīng)涵蓋的范圍非常多了,其實(shí)它是計(jì)算機(jī)制,聽(tīng)、說(shuō)、讀、寫(xiě)、預(yù)測(cè)這些方面它做的要比人好很多。現(xiàn)在在金融科技行業(yè)里,人工智能更像是一個(gè)工具類(lèi)的階段,就是把它當(dāng)做一個(gè)工具使用,我告訴它我想要它怎樣,它就給我一個(gè)結(jié)果。在人臉識(shí)別和語(yǔ)音識(shí)別上面,它這個(gè)效果非常明顯是有原因的。人臉的構(gòu)成是有多層次的結(jié)構(gòu)組成的, 眼睛兩個(gè)點(diǎn),還有眉毛,嘴是一道弧線,其實(shí)就是這些細(xì)小的結(jié)構(gòu)就能被感知出來(lái);卷積網(wǎng)絡(luò)其實(shí)就是用一個(gè)濾波,對(duì)圖片逐行的進(jìn)行掃描。就相當(dāng)于用美圖秀秀的小刷子,一行一行的點(diǎn)過(guò)去,來(lái)把相關(guān)的圖像特征提取出來(lái)成為一個(gè)新的特征。語(yǔ)音識(shí)別也是,語(yǔ)音的句子有單詞構(gòu)成,單詞有音節(jié)組成,又有元音、輔音等,層層疊加起來(lái)的結(jié)構(gòu)。通過(guò)深度學(xué)習(xí),把這些結(jié)構(gòu)進(jìn)行自動(dòng)化的挖掘,目前已經(jīng)達(dá)到了上百層的深度學(xué)習(xí),是非常驚人的。
目前,整個(gè)AI+是什么情況呢?AI的爆發(fā)點(diǎn)是在語(yǔ)音和圖像上面,從語(yǔ)音圖像延伸到AI+機(jī)器人(20.71 +0.98%,診股)、AI+醫(yī)療、AI+VR、AR,AI+無(wú)人駕駛,這些已經(jīng)是AI運(yùn)用到一個(gè)非常高級(jí)的階段的內(nèi)容了,像Facebook、谷歌,它們也是從以前的mobile first到后來(lái)的 AI first。現(xiàn)在AI+金融,AI+Fintech的影響其實(shí)也是越來(lái)越顯著的。AI+金融它不是一個(gè)很陌生的東西,其實(shí)之前機(jī)器學(xué)習(xí)加金融就已經(jīng)是非常普遍的,就像我們經(jīng)常聽(tīng)到的一個(gè)詞---量化交易,它就是用數(shù)據(jù)挖掘的東西來(lái)分析股票交易等。之前在量化交易領(lǐng)域,一家非常成功的企業(yè)是文藝復(fù)興基金,創(chuàng)始人是世界級(jí)數(shù)學(xué)家James Simons,之前基金的CTO是貝爾實(shí)驗(yàn)室科學(xué)家,和我在谷歌的上司之前是同事。和他們交流,也知道一些行業(yè)大咖的一些事情,以及這些科學(xué)家是如何用科技來(lái)改變金融交易行業(yè)。大家如果知道一些股票知識(shí),知道里頭的技術(shù)流派是通過(guò)交易的過(guò)去走勢(shì)來(lái)判斷未來(lái)走勢(shì)。很重要的一個(gè)環(huán)節(jié)是把這些無(wú)序和混亂的信號(hào),噪音去掉。小波分析對(duì)于這種時(shí)間序列數(shù)據(jù)去噪比較有用,當(dāng)時(shí)斯坦福大學(xué)的教授,David Donoho也是小波分析行業(yè)頂級(jí)專(zhuān)家,他也一段時(shí)間離開(kāi)斯坦福,去這個(gè)基金做了一年,幾位大神級(jí)科學(xué)家通過(guò)技術(shù)手段在股票市場(chǎng)上頭呼風(fēng)喚雨。當(dāng)然,AI的重要性不是為這些超級(jí)富豪服務(wù),更多的是普惠的,很多的技術(shù)創(chuàng)新已經(jīng)影響了整個(gè)行業(yè),滲透到社會(huì)當(dāng)中。
金融科技目前我們應(yīng)用的還是很小一塊,主要還是在消費(fèi)金融里頭的應(yīng)用,其實(shí)在這個(gè)整體金融領(lǐng)域,這么大的一個(gè)盤(pán)子里面是其實(shí)一個(gè)小的板塊。 除去房貸之外,這種小的消費(fèi)金融的市場(chǎng)可能是現(xiàn)在是一個(gè)幾萬(wàn)億的這樣一個(gè)市場(chǎng)的規(guī)模。 中國(guó)的消費(fèi)金融市場(chǎng)每年增長(zhǎng)20%以上,占GDP的占比也越來(lái)越高,后續(xù)會(huì)趨近于美國(guó)的規(guī)模,也就是gdp占比在20%左右。美國(guó)的消費(fèi)市場(chǎng)規(guī)模非常大,大家消費(fèi)透支經(jīng)濟(jì)消費(fèi)驅(qū)動(dòng),除了給你發(fā)信用卡,你如果還清房貸,他又給你開(kāi)一個(gè)home equity loan,你的房子就相當(dāng)于一個(gè)ATM機(jī),你可以隨時(shí)去你的房子里面借錢(qián),美國(guó)就是這樣的不斷的循環(huán)來(lái)刺激消費(fèi)。中國(guó)雖然現(xiàn)在只是差不多6萬(wàn)億的市場(chǎng)規(guī)模,每年20%增速,未來(lái)幾年內(nèi)就會(huì)到12萬(wàn)億這樣一個(gè)規(guī)模。當(dāng)前,行業(yè)的巨頭比如說(shuō)像BAT這樣的,像花唄借唄微粒貸,或者是京東白條、京東商城等等,他們都是每年幾千億的規(guī)模;而巨頭往下一層的Fintech公司里面的領(lǐng)頭企業(yè),這里面也包括量化派,每年會(huì)有幾百億的規(guī)模。
消費(fèi)金融應(yīng)用場(chǎng)景,不僅能夠提供用戶(hù)交易,同時(shí)還能帶來(lái)用戶(hù)數(shù)據(jù),我們需要把這些用戶(hù)數(shù)據(jù)結(jié)合起來(lái),更好的去幫助我們做一個(gè)事情----定價(jià),包括我給不給這個(gè)用戶(hù)通過(guò)?我給這個(gè)用戶(hù)通過(guò)多少?我給他的額度是多少?我給他的費(fèi)率是多少?這些其實(shí)是一個(gè)最重要的東西,就是這個(gè)定價(jià)體系。這個(gè)應(yīng)用場(chǎng)景規(guī)模非常大,每個(gè)場(chǎng)景都能撐起一批規(guī)模比較大的創(chuàng)業(yè)公司是非常有機(jī)會(huì)的。所以這些場(chǎng)景怎樣去和科技相結(jié)合,怎樣找新的增長(zhǎng)爆發(fā)點(diǎn)是我們需要思考的問(wèn)題,像過(guò)去的醫(yī)美、3C、旅游等,它們都有非常垂直行業(yè)的消費(fèi)金融消費(fèi)分期公司,也給用戶(hù)帶來(lái)了非常多的便捷,但如果風(fēng)控做的不完善,也會(huì)發(fā)生一些不好的現(xiàn)象,比如說(shuō)線下醫(yī)美行業(yè),我們雖沒(méi)有做線下醫(yī)美,但我們也從行業(yè)中了解到,線下醫(yī)美是比較容易發(fā)生群體勾結(jié)騙貸的,中介會(huì)帶著一群虛假整容的客人和門(mén)店勾結(jié)去做套現(xiàn)。
消費(fèi)金融的核心是風(fēng)險(xiǎn)管理和風(fēng)險(xiǎn)定價(jià),它需要通過(guò)用戶(hù)數(shù)據(jù)和場(chǎng)景數(shù)據(jù)的匯總,讓機(jī)器能夠更好的對(duì)用戶(hù)做整體的畫(huà)像和判定。現(xiàn)在大概的流程和思路是這個(gè)樣子的:上端對(duì)接數(shù)據(jù)員,每個(gè)用戶(hù)以前是上萬(wàn)條數(shù)據(jù)幾百條特征,現(xiàn)在慢慢的都演變成幾千條特征,或者是上萬(wàn)條特征,然后通過(guò)多個(gè)維度的AI數(shù)據(jù)的挖掘,形成一些評(píng)分,這些評(píng)分便于做風(fēng)控策略、做風(fēng)控政策等。現(xiàn)在為什么特征可以這么多?第一個(gè)是數(shù)據(jù)的多樣化,包括現(xiàn)在很多的交易數(shù)據(jù)、明細(xì)數(shù)據(jù)、文本數(shù)據(jù)等等。而且最重要的是,現(xiàn)在有了深度學(xué)習(xí)之后,特征提取是自動(dòng)的,例如通過(guò)卷積網(wǎng)絡(luò),一個(gè)用戶(hù)進(jìn)來(lái)可能就是幾千上萬(wàn)甚至更多的特征。
現(xiàn)在做消費(fèi)金融,最少需要有三個(gè)板塊的信息,每個(gè)版塊它都需要人工智能更優(yōu)化的去做一些事情,比如最開(kāi)始你需要是做用戶(hù)驗(yàn)真系統(tǒng),證明你是本人,里頭用到人臉識(shí)別和身份證比對(duì),包括還有設(shè)備指紋,你用的手機(jī)是不是你自己常用的手機(jī),以及它的這個(gè)手機(jī)的這些設(shè)備號(hào),這些設(shè)備信息和它的這種關(guān)聯(lián)性,是否能夠保證這個(gè)手機(jī)也是你本人使用,而不是說(shuō)經(jīng)常被刷機(jī),或者是去做一些其他類(lèi)的東西。另外一類(lèi)是有關(guān)系網(wǎng)絡(luò)。中國(guó)的欺詐案例相對(duì)多些,但魔高一尺,道高一丈,這是雙方的一個(gè)博弈。現(xiàn)在有些金融科技公司把這個(gè)過(guò)程做成了自動(dòng)化,當(dāng)用戶(hù)以及它周?chē)年P(guān)聯(lián)人形成一個(gè)關(guān)系網(wǎng)絡(luò),比如說(shuō)如果這人的周?chē)芏喽际巧暾?qǐng)用戶(hù)或者是騙貸用戶(hù)的話,可能這人就是一個(gè)中介,而這個(gè)中介是能夠幫助別人包裝,包裝用戶(hù)資料,去各個(gè)平臺(tái)騙貸、擼錢(qián)的角色。現(xiàn)在機(jī)器學(xué)習(xí)對(duì)于這種關(guān)系圖譜也有更好的表達(dá),類(lèi)似于以前word2vec,現(xiàn)在有node2vec來(lái)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行降維處理。另外還有一塊,就是信用評(píng)分,預(yù)測(cè)模型從邏輯回歸,到單層神經(jīng)網(wǎng)絡(luò),到多層神經(jīng)網(wǎng)絡(luò)到機(jī)器學(xué)習(xí)方法,在技術(shù)上演變的更復(fù)雜了已經(jīng)變得更準(zhǔn)了;如何用好這個(gè)分?jǐn)?shù)以及你如何制定政策去做精準(zhǔn)定價(jià)和獲利,如何從這些復(fù)雜的節(jié)點(diǎn)中找出來(lái)用戶(hù)之間的信息,去對(duì)于用戶(hù)本身的這種信用和風(fēng)險(xiǎn)進(jìn)行一個(gè)判斷,這都是很需要花時(shí)間研究的,很多細(xì)節(jié)的學(xué)問(wèn)。
關(guān)系圖譜和信用評(píng)分,這些體系整合起來(lái)就能夠?qū)τ脩?hù)有一個(gè)非常真實(shí)和準(zhǔn)確的畫(huà)像,而這是消費(fèi)金融公司、金融科技公司一個(gè)非常核心的能力,它能夠保證你的風(fēng)險(xiǎn)是可控的,保證你對(duì)用戶(hù)的識(shí)別是精準(zhǔn)的,保證你的定價(jià)體系是完備的。在這些每一個(gè)小的細(xì)節(jié)上,AI都是在不斷的在滲透,默默的改變,我覺(jué)得它的這個(gè)改變到一定程度上,又將是一個(gè)量變到質(zhì)變的過(guò)程。就像當(dāng)年AI改變?nèi)四樧R(shí)別和語(yǔ)音識(shí)別一樣, AI也正在潤(rùn)物細(xì)無(wú)聲改變金融行業(yè),金融科技領(lǐng)域想要發(fā)展的更好,是離不開(kāi)AI、離不開(kāi)數(shù)據(jù)的。數(shù)據(jù)是源頭和基礎(chǔ),在數(shù)據(jù)基礎(chǔ)上,這些人工智能的技術(shù)才能夠把它更好的整合起來(lái)以及優(yōu)化到位,接下來(lái)消費(fèi)金融行業(yè)接下來(lái)將會(huì)是一個(gè)階段性的提高,我們拭目以待,也希望在座的各位領(lǐng)導(dǎo)和專(zhuān)家多多指導(dǎo)和多多支持,希望各位同行、同事、同學(xué)們我們一起來(lái)共同推動(dòng)這個(gè)行業(yè)的良性、快速發(fā)展。
