12月14日的谷歌開發者大會上,最激動人心的消息應該就是谷歌AI中國中心的成立了。身著紅衣的李飛飛無疑是谷歌開發者大會最大的主角,她在現場宣布:谷歌AI中國中心將由她和GoogleCloud研發負責人李佳博士共同領導,激蕩起了現場一片掌聲。
李飛飛從洗衣工到斯坦福教授的傳奇經歷被傳遍全國,不得不讓人感嘆,我們又回到了崇拜科學家的時代。
或許是因為人工智能本身就是一個學術話語權極強的領域,現在的AI企業不管體量大小,總要請來幾個教授、專家坐鎮,時不時還要發篇論文,刷刷CVPR等等競賽的排名。
可問題的關鍵是,我們崇拜科學家,不僅僅是因為科學家有非凡的學術能力,還因為他們是把人工智能技術從論文中帶到我們身邊的傳火者。
科學家常有,而傳火者不常有。今天就來談談,怎樣才能稱得上人工智能領域的傳火者。
論文產品化:象牙塔內外的海水與火焰
在很多人的概念里都存有一個誤區,論文發的多、專利申請的多、競賽排名足夠高就意味著技術有著更高的實用性和商業前景。可實際上從論文到產品,再到優秀的產品,之間里程往往比我們想象中要遙遠。
不管是論文還是賽事,往往都會給出一個理想的恒定實驗環境來追求某一項技術的極致可能。比如給出統一的硬件標準或數據庫,庫卡機器人何服電機維修,而得出的結果也是在某一標準下的最佳結果。
這就導致一種尷尬的結果:很多時候論文走向一種非常刁鉆的方向,很難實際應用在生活中。像是耗費大量計算資源去追求極小的模型壓縮,或是犧牲計算速度去在極小范圍內提升模型準確率。但這些研究成果往往只能在仿真環境中起作用,要想應用到現實中來,往往會遇到這樣那樣的問題。
現在很多技術模型都是開源共享的,將公開的模型進行參數調試,從一個領域移植到另一領域并不難,可想要實現產品化,就要為模型尋找到合適場景,嵌入到適用的軟件或硬件中。在這一過程中,如何面對技術開源,難以建立壁壘的問題就是一個難點。應用成本越來越低的人臉識別,就是技術無壁壘、產品想象力匱乏形成的結果。
即使把技術成功產品化,也要考量產品的實際應用性。人工智能技術的加入是不是真的能提升用戶體驗,體驗的提升和所耗費的成本之間是否又能找到平衡點很多時候人工智能產品還未經市場檢驗,就已經在折戟在論文產品化的過程中了。
論文和排名僅僅是人工智能產業的一小部分,有一些企業靠這些可以拿到大筆融資,但這絕不僅僅是成功的標志。專家教授一臉意氣風發,可背后的投資人還雙目灼灼的盼著論文變現呢。到最后往往在學界和業界成了兩個極端,一邊歌舞升平的寫著論文開著會,另一邊則為了優化產品急成了熱鍋上的螞蟻。
總之,論文和會議競賽中的技術存在于仿真世界中,代表的是人工智能無限的可能性。而如今科學家們紛紛走出象牙塔,我們希望看到的是他們把技術從仿真世界帶到物理世界,向我們展示人工智能的應用性。
把目光投向物理世界,學術力量落足在哪?
在今天的人工智能熱潮中,既然有人靠水論文拿融資,自然也會有人可以成為技術的傳火者,把學術能力化為產品能力甚至商業能力。下面就分別介紹一下自然語言處理、計算機視覺和強化學習三個領域中的傳火者。
幫谷歌AI連接中國的李飛飛
拋開谷歌的光環,從加州理工畢業的李飛飛自身也有著極高的學術起點,在斯坦福實驗室中的身體力行培養出了不少牛人,也憑著TED上強大的演講能力吸引了不少人關注計算機視覺領域。
李飛飛對人工智能產業最大的貢獻無疑是創立了世界上最大的圖片識別數據庫ImageNet。此前機器學習一直飽受過擬合和泛化的困擾,學界一直試圖在模型上尋找解決方式,直到李飛飛開始主導ImageNet的研究,從數據集入手試圖改變游戲規則。
ImageNet的影響力越來越大,甚至從中誕生了卷積神經網絡這樣實用性極高的技術,計算機視覺和深度學習也越來越多的應用在物理世界中:社交網絡的圖像標注、自動駕駛的物體監測大量的落地應用也再不斷的向CV技術提供反饋,物理世界的技術應用也催化了仿真世界中技術的發展。
教機器人疊毛巾的PieterAbbeel
提到強化學習,www.twshmhelmet.com,大多數人會認為這是一項距離現實非常遙遠的技術,不過一直有人在嘗試著把這一技術帶到現實,Pieterabbeel就是其中之一。
在博士時期,PieterAbbeel就與吳恩達一同提出了師徒學習這一強化學習中的重要概念。在伯克利任教期間,還因讓機器人通過強化學習學會疊毛巾獲得了MIT頒發的TR35獎項。后來入職馬斯克的OpenAI,還推出了著名的機器人訓練場Gym,讓很多團隊可以在低成本的前提下快速訓練智能體。
直到今天,硅谷機器人制造商WillowGarage的很多產品中還有PieterAbbeel利用強化學習訓練的成果。如今PieterAbbeel已經離開OpenAI,創立自己的團隊,專注于利用強化學習讓現有硬件設備自主學習完成任務。
自動化的普及度不斷增高的過程,本質上也是機器人訓練成本不斷降低的過程,強化學習的應用的落足之處也在其中。
為百度布局深度學習的王海峰
NLP和CV兩個領域,都聚集了大量華人科學家。在學界和產業界都有布局的,不光有李飛飛,王海峰也是其中一個典型。
王海峰在學界的成就很多,比如在16年當選了國際計算語言學會(TheAssociationforComputationalLinguistics)的會士。在這個于影響力、權威性和活躍度兼備的學術組織中,王海峰成了是大陸首位、也是最年輕的一位ACL院士。
2010年入職百度后,王海峰也在百度獲得了很大的發揮空間,接連布局了自然語言處理、互聯網數據研發、圖片搜索和語音技術等等多個部門。在2013年協助創立百度深度學習研究院后,很快我們就看到了百度翻譯、語音搜索等等產品上的變化。
在這些用戶體驗的感受差異中,體現的是神經網絡、語音識別和知識圖譜等等技術的理性呈現。
革命來臨前夜,天秤兩端的學與業
以上三位科學家僅僅是人工智能領域眾多傳火者的代表人物,卻也能管中窺豹,領悟到一點人工智能產業發展的勢頭。
有一些生物學界的人士曾經對這次人工智能浪潮做出過忠告,說今天的人工智能特別像十幾年前的生物學,論文滿天飛、大學猛開專業、專家教授紛紛下海創業。最后生物學卻因為產業化能力不足,湮滅了學術界的星星火光。而人工智能被稱為下一次工業革命,自然要把學和業放在天秤的兩端。
學的能力,既包括了論文數量、競賽排名,也需要考量技術的創新型和實用性。
像現如今大火的DeepMind,他們發表的很多關于深度學習的論文中并沒有利用太多超前的方法論,而是引源上個世紀的認知科學方法,用來解決今天的現實問題。