為了讓你盡快用上AI,過去一年谷歌做了這些事兒
谷歌這一年,在AI方面都有哪些成果與進展?年末將至,近日谷歌在東京舉辦了一場分享會,圍繞MadewithAI對過去一年的成果做了總結。谷歌資深研究員、GoogleBrain負責人JeffDean開場提綱挈領地講到,谷歌在人工智能領域的愿景,是通過三種途徑讓每個人都從中受益:
使谷歌的產品更加實用;
幫助企業和開發者創新;
為研究人員提供工具,從而解決人類面對的各項重大挑戰。
AI賦能軟件
Jeff提到,機器學習是谷歌在人工智能領域的工作重心。作為計算機科學的一種形式,他認為機器學習編寫能使計算機自主學習如何變得智能,要比直接編寫智能程序要更為簡單。
說到谷歌開展機器學習的研究,Jeff再次使用了谷歌在2012年關于機器識貓的論文,和2015年谷歌開源TensorFlow這兩個重要事例,F在,TensorFlow是GitHub上最受歡迎的工具。
Jeff認為,機器學習仍處于發展初期。如今,KUKA機器人示教器維修,機器學習對分類、預測、理解和生成這四個關鍵方面很有幫助。這些功能幾乎被應用于谷歌所有的產品中,使產品更加實用,例如:谷歌相冊,谷歌翻譯,谷歌地圖和GoogleLens等等。下面分別做一簡要總結介紹。
谷歌相冊(GooglePhotos),被重點提出的功能是照片搜索(PhotoSearch)。谷歌相冊可以通過圖像識別妥善分類所有照片,使查找更方便。
而谷歌翻譯(GoogleTranslate),可以和谷歌相冊結合起來使用。用相機照下的圖片,它可以幫你翻譯出來。
Jeff介紹,事實上翻譯這項工作已經持續了十年。在過去,翻譯系統并非基于神經網絡,而是使用更簡單的統計翻譯模型,由50萬行代碼組成。2016年推出的新神經網絡機器翻譯系統,經過了簡單卻有效的數據訓練。新系統僅由500行TensorFlow代碼組成,而非50萬行。
我們去年秋天開始使用新的神經網絡翻譯系統后,KUKA機器人示教器維修,翻譯準確性得到了很大的改進,可比肩過去十年中取得的提升。Jeff說。
現在,谷歌將神經網絡機器翻譯應用到了97組語言當中。效果提升最明顯的是日英互譯。
谷歌地圖(GoogleMap),即便在沒有數據許可的情況下,通過衛星的介入,加上機器學習和計算機視覺等技術也可以產生可用的地圖。
GoogleLens,可以把你看到的東西搜索出來,得到相關的信息。
而文本理解能力的提升,讓Gmail更好用。比如智能系統通過讀取內容和預測回應,可以給用戶提供回復答案或建議。Gmail數據顯示,www.twshmhelmet.com,目前有12%的回復來自手機,這將使人們的日常工作更加便捷。
這里值得一提的是谷歌助理(GoogleAssistant),它的核心技術是語音識別,包含了很多機器學習的相關技術。沒有人工智能和機器學習,這個產品是不可能存在的。Jeff強調道。
使用GoogleAssistant,用戶可以與谷歌進行自由對話,從而完成不同種類的任務,比如尋找某一問題的答案、導航服務、獲取新聞或得到日程安排方面的幫助。
GoogleAssistant可以在不同設備間通用。目前,GoogleAssistant可使用的國家和地區包括:
澳大利亞,巴西,加拿大(英文和法文),德國,法國,意大利,印度(英文,印度文),印度尼西亞,日本,韓國,墨西哥,新加坡,西班牙,英國和美國(英文,西班牙文)。(是的,并沒有中國。)
在YouTube上,谷歌通過機器學習給超過10億的視頻自動加上字幕,使得有聽覺障礙的人可以看到視頻中的對白。
軟硬結合:AI賦能硬件
Jeff介紹了谷歌將新型的硬件與軟件相結合的一個實例:PixelBuds。作為一款耳機,它能將使用者周圍人說的話實時翻譯成使用者的母語,運用了語音識別和翻譯技術。
Google產品經理IsaacReynolds介紹了新款Pixel手機中的人像模式(PortraitMode)。
機器學習和計算攝像的結合為新Pixel手機的人像模式賦能。通過這個功能,使用者可以拍攝具有一定景深效果的人像。拍攝這種照片,相機一般需要比較大的光圈,而Pixel僅需正反各一個鏡頭。
這就是谷歌在硬件方面正在采用的新處理方式:讓硬件、軟件、以及AI相互結合。
接著,Isaac介紹了GoogleHome中的語音配對功能(VoiceMatch):機器學習的加入有助于識別不同的語音,使最多六個用戶連接到同一臺GoogleHome。
在機器學習和語言方面,搜索項目總監LinneHa介紹了語音搜索和文本轉語音項目。
語音搜索(VoiceSearch),指在機器學習的幫助下,自然語言處理系統能夠更好地理解人們想說的話。Linne介紹道,谷歌的語音搜索現在支持119種語言,其中包括11種印度語言和3種印度尼西亞語言。
ProjectUnison,是一個利用機器學習實現文本轉語音(Text-to-Speech)的實驗項目。通過轉換引擎,手機可以用語料并不豐富的語種,如孟加拉語、高棉語和爪哇語與用戶對話。而機器學習模型有助于減少構建文本到語音模型所需的數據量。
新浪科技總結下來,谷歌的策略就是軟硬結合、硬件打通,讓語言、語音和圖像技術在各個設備上和場景中無縫接合。
AI賦能開發者
谷歌為企業及開發者提供三種創新工具:TensorFlow,云機器學習API(CloudMachineLearningAPIs)以及張量處理器(TensorProcessingUnit,TPU)電腦芯片。
其中TensorFlow現在有1萬的全球開發者在使用。使用TensorFlow的也包括一些中國企業,比如小米。
最后一部分是谷歌產品經理LilyPeng介紹如何用AI讓世界更美好。人工智能還能應用于醫療、環保、節能、動物保護等等各方面。
讓AI惠及每一個人
分享會的最后,Jeff再次上臺,介紹了當下谷歌在AI方面的一些思路。Jeff提到,作為一家AIFirst的公司,谷歌希望讓每個人都能夠從人工智能中獲益。目前已經取得了一些進展,但是仍然有一些困難需要克服,例如:
首先,需要想方設法讓機器學習模型的創作過程更加觸手可及。
對此谷歌的解決方案是提供培訓。谷歌明年將在互聯網上提供免費的機器學習課程,現在已經有1.8萬名谷歌員工參加過此項培訓。
其次,谷歌正在研究如何使用AutoML自動創建機器學習模型。
為了確保谷歌構建的機器學習模型具有包容性,并且能夠真正為每個人所用,谷歌還啟動了People+AIResearch(PAIR)計劃,旨在將谷歌的研究人員聚集在一起,研究并重新設計人與人工智能系統交互的方式。Facets正是此計劃所孕育出的一種工具,能夠用于機器學習的訓練數據可視化。
谷歌還與GeenaDavis研究所合作建立了GD-IQ,一種利用機器學習檢測電影中性別偏見的工具?傊雀柙贏I方面的長遠目標,就是要讓機器學習和AI變得觸手可及。