創新工場李開復看2018趨勢:AI項目估值中國是硅谷一倍,庫卡機器人何服電機維修,明年一批公司會倒掉
過去5周,創新工場董事長李開復在北美轉了一圈,目的是了解美國AI的發展現狀。他密集拜訪了美國投資人,以及Hinton,LeCun,Bengio三大深度學習研究領域的傳奇人物。
他發現AI領域有兩批朝著不同方向進發的人:一批正在將AI技術產品化,主要是BAT和創新工場已投資的一些公司,另一批在思考如何讓深度學習更好,譬如研究增強學習和遷移學習技術,實現以更少的數據量讓機器的判斷更精準,能夠自我學習。
后者多數來自研究界,工業機器人維修,就比如前述的三位泰斗。我們學校的機器沒有Facebook,谷歌那么多,要比數據量做的最好,比不過。所以人臉識別、語音識別我們不搞。我們要更深層的只會,把技術推到更高的層次。更接近人類只會的狀態他們說。
李開復認為,在Facebook、微軟、谷歌、亞馬遜四大AI巨頭中,Facebook做的最深,微軟在聚攏實力,谷歌吸納了全世界一般的AI頂尖人才,而亞馬遜起初看似不懂語音和自然語言,卻以Alexa突然趕超。
我在美國看到工業界意識到AI的價值巨大,但也存在安全和隱私方面的挑戰。盡管過去的AI毀滅人類論太過激,但如今美國的四大巨頭只將AI好的方面,認為不會造成失業問題,其實是想開心賺一些錢,不想承擔輿論的指責。李開復告訴36氪。
他同時表示,如今AI項目的估值的確偏貴,中國是硅谷的一倍,硅谷是美國東岸和加拿大的一倍。盡管現在公司融資很多,金額巨大,但AI人才也越來越貴。他預測明年底會有一批公司用完融資倒掉。
在媒體溝通會上,李開復博士做了關于2018年投資趨勢的分享,經過36氪編輯略有刪節如下:
AI有弱人工智能、強人工智能之分,強人工智能我們就不討論了,可能以后會發生,現在還沒有基礎。但是弱人工智能,即針對某一個領域用大量的數據、做出比人更強大的判斷,這件事情正在發生。弱人工智能會創造巨大的價值。
財富普華永道對于未來AI能帶來的價值的最保守的預測,是人工智能在2030年將帶來中國GDP20%左右。
創新工場會分析人工智能大概有4波浪潮,他們同時發生,沒有先后的順序,但是都會帶來巨大的商機:
第一,互聯網AI;
第二,商業AI化;
第三,實體世界感知AI化;
第四,全自動AI化;
互聯網AI化,是AI以數據作為能源和燃料,所以數據越多,它發展越快,人類有史以來有架構化標志的數據最多就是互聯網。因此現在的七大巨頭都在互聯網領域,它們有幸在過去20年累計大量的數據,在推動AI,數據做好了,AI就會做好,雇更多人、收集更多的數據。
第二個商業智能化,除了BAT、互聯網公司,還有誰有數據?非互聯網公司因為商業的理由存了一套數據,可能它要備份、為了理財、為了客戶的滿意度,累計很多的數據,這些數據同樣有價值,不像互聯網那樣爆炸式的增長,但是醫院、物流公司都有數據,這數據足夠大,也會激活產生價值,而且它在商業流程產生價值。
互聯網AI化和商業AI化是把已有的數據來出來賺錢。實體世界感知AI化是把沒有數據變成有,然后產生價值,比如安防、購物中心鋪的攝像頭,就把真實的世界捕捉起來,用這個產生有價值的應用。
全自動AI化不僅僅采集數據,這個AI就要動起來,就像科幻片的機器人、無人駕駛,我們不認為這個機器人有感情、控制欲望,但是能動、能觸摸、能拿起來東西,這是第四波。這四波累計起來,對人類的價值是非常大的。
第一波我剛才講過了,我們每天都在為BAT貢獻數據,而且做免費的標注、捕捉,每次我們在百度、在騰訊、在朋友圈打開一篇文章,更重要在淘寶購買一個貨都被捕捉起來,可能這樣一個人會看到這個、點這個,以后我們看類似這個人會推類似的東西。我們發現5年前到今天,淘寶廣告越來越精準,是因為它越來越了解你,今日頭條是不是越來越推送你想點的文章,這都是AI在后面做的工作。
這個領域創業很難創業,創業做新的APP出來,靠這個流量做,幾乎不是AI公司、要做流量。但是已有的流量公司轉AI很容易的,看今日頭條、快手。
舉一個例子就是美圖,啟動很早,剛開始不是AI公司,現在美圖介紹自己都是AI公司。你有沒有發現過去三年你自動美化越來越美?因為你們不斷的貢獻數據、標注數據,你自拍怎么標注數據,你自拍之后三個動作是什么?
是刪除、保存、還有分享。這個刪除代表不好、儲存代表好、分享表示很棒,這就是你深度學習的標注,他以后就會希望幫助你這樣的人,做出更多你想分享的照片,做出更少你想刪除,這些都是AI的背后,還有新的卡通功能,那些其實也是AI。
第二波浪潮把AI用在已有數據,用它產生價值,進入商業。最好的領域肯定是金融,金融是人類的虛擬游戲,我們有大量的數據都不是真的東西,比如說股票、存款、利息,本身就是一個數字,數字收集起來標注很簡單,你股票一年之后不是漲就是跌了,你貸款不是還了就是沒有還,所以只要我們能累計一段時間數據,你往一年前、半年前、一個月前推算,都在標注你一切的過去,對發生意外的人,可能要收更多的保費,貸款如果你沒有還就少借給你。金融就是大量的數據好標注、還有只要做的好錢就到了。金融本身是虛擬的東西,只要把參數調好,我投資的概率變多我錢就調出來了。
另外,醫療是很應該做的,計算機視覺用在影像醫學、用在病例、發射科最合適。但因為醫療的數據不足、醫院不愿意分享、用戶隱私這些世界性的問題,醫療并沒有像金融那么推動。
如果數據沒有格式化就用不上,還有一些甚至還沒有數據,這都是很麻煩的事情。美國數據相對格式化,因為中國有很多傳統企業數據是亂七八糟的,所以中國趕超可能有一些挑戰。
做這個領域的創業需要有大數據經驗的工程師,不是AI大牛,反而是百度搜索出來的團隊,它需要一個CEO需要能賣軟件。
我們投了一個項目叫追一科技,這個團隊來自騰訊搜搜,把搜索技術跟語音技術加起來做客服,為什么客服靠AI來做,因為很大量的企業都把客服數據儲存下來,還有評估客服很好的方法不在于你最后點了幾顆星,你有沒有很好的完成任務,沒有客戶流失,這是堆用戶的需求做一個分類。
客服不僅僅取代人類,還可以推薦品牌的延伸等等的工作,我們認為這是非常好的自然語言延伸的領域。
第三波浪潮是OMO,經過傳感器的普及,我們要把整個世界數字化,用攝像頭、用天貓精靈這樣的產品捕捉你的語音、視頻,捕捉之后我們可以把前臺、線下的東西線上化。
我們在線上的軌跡就捕捉下來,可以用在未來的預測上。可以想象真實生活中,你進入大潤發,可能被阿里的攝像頭捕捉下來,跟你在淘寶做一個混合,所以線上線下無論是供應鏈、進貨、還有客服人員對你的溝通,知道你是什么樣的人,都有非常好的認知,線上線下的數據可以結合在一起。