當(dāng)人們認(rèn)為人工智能很遙遠(yuǎn)時(shí),Google卻打算讓每個(gè)人都用上AI
2017年11月28日,以MadeWithAI為主題,Google在日本東京舉行了一場(chǎng)關(guān)于人工智能的媒體溝通會(huì)。
更好用的Google產(chǎn)品
首先,Google資深研究員JeffDean首先登臺(tái)。他用一個(gè)通過(guò)GoogleTranslation進(jìn)行實(shí)時(shí)識(shí)別翻譯的案例,來(lái)介紹了人工智能與機(jī)器學(xué)習(xí)的區(qū)別。他表示,機(jī)器學(xué)習(xí)其實(shí)是人工智能的一部分;本質(zhì)上,機(jī)器學(xué)習(xí)是一個(gè)創(chuàng)造問(wèn)題解決系統(tǒng)的新方式。
JeffDean提到,正如GoogleCEOSundarPichai在2016年10月所言,在接下來(lái)的10年間,Google將會(huì)成為一個(gè)AIFirst的公司;而Google在人工智能領(lǐng)域的愿景是:
在演講中,JeffDean著重提到了TensorFlow。據(jù)雷鋒網(wǎng)了解,TensorFlow于2015年11月在GitHub上正式開(kāi)源;與MXNet、Caffe等其他的機(jī)器學(xué)習(xí)框架相比,TensorFlow頗受歡迎,用戶量的增長(zhǎng)速度也比較快。而根據(jù)Google方面提供的數(shù)據(jù),到目前為止,TensorFlow已經(jīng)成為用戶數(shù)量排名第一的機(jī)器學(xué)習(xí)框架。
JeffDean表示,在近20年的發(fā)展中,神經(jīng)網(wǎng)絡(luò)(NeuralNetworks)在數(shù)據(jù)量和結(jié)算模型上已經(jīng)超越其他的計(jì)算方案;總結(jié)來(lái)說(shuō),一個(gè)計(jì)算的新時(shí)代已經(jīng)到來(lái)。
實(shí)際上,作為最早開(kāi)始研究人工智能和機(jī)器學(xué)習(xí)的科技公司之一,人工功能和機(jī)器學(xué)習(xí)的元素實(shí)際上已經(jīng)出現(xiàn)在Google多項(xiàng)產(chǎn)品中。在溝通會(huì)現(xiàn)場(chǎng),JeffDean列出了一些較為典型的產(chǎn)品,并對(duì)它們的人工智能元素進(jìn)行了簡(jiǎn)單介紹:
軟硬件與AI的一體化
不過(guò),除了AI和軟件產(chǎn)品,Google在產(chǎn)品層面也已經(jīng)延伸到了硬件;也就是說(shuō),Google已經(jīng)形成了AI+軟件+硬件三位一體的布局。一個(gè)最簡(jiǎn)單的例子是:在與GooglePixel相連接的情況下,PixelBuds耳機(jī)可以實(shí)時(shí)翻譯。
不過(guò),PixelBuds當(dāng)然不是全部。在溝通會(huì)現(xiàn)場(chǎng),Google產(chǎn)品經(jīng)理IsaacReynolds登臺(tái)介紹了AIAndHardware的關(guān)系;這里說(shuō)的Hardware,主要指的是GoogleHome系列和Pixel手機(jī)。
第一款著重提到的產(chǎn)品是2016年發(fā)布的GoogleHome。IsaacReynolds表示,GoogleHome內(nèi)置了語(yǔ)音配對(duì)(VoiceMatch)功能,其本質(zhì)在于用機(jī)器學(xué)習(xí)來(lái)幫助識(shí)別不同的語(yǔ)音,可以讓最多6位用戶連接到同一臺(tái)GoogleHome;無(wú)論這六位用戶說(shuō)話的聲音大小,GoogleHome都能夠聽(tīng)見(jiàn)并給出回應(yīng),這就是硬軟件與機(jī)器學(xué)習(xí)相結(jié)合的最好案例。
與之相比,今年10月最新發(fā)布的GoogleHomeMax的音質(zhì)更好;它可以通過(guò)機(jī)器學(xué)習(xí)在數(shù)千種房間中進(jìn)行聲音模型訓(xùn)練,對(duì)不同音質(zhì)的效果進(jìn)行衡量,最后提供一個(gè)適合所在房間的聲音模型。
關(guān)于Pixel2XL,IsaacReynolds主要提到了Pixel2的人像模式。實(shí)際上Pixel2只有一個(gè)攝像頭,但它能夠通過(guò)機(jī)器學(xué)習(xí)對(duì)圖像進(jìn)行結(jié)構(gòu)化的識(shí)別,從而區(qū)分出背景和人像,并給出相應(yīng)的深度圖(DepthMaps);在形成SegmentationMask之后,對(duì)背景進(jìn)行虛化,最終實(shí)現(xiàn)人像效果。
在溝通會(huì)現(xiàn)場(chǎng),雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))就Pixel2內(nèi)置的PixelVisualCore輔助芯片進(jìn)行了提問(wèn)。Isaacreyonld表示,KUKA機(jī)器人示教器維修,PixelVisualCore實(shí)際上已經(jīng)在數(shù)年前就開(kāi)始研發(fā)了,目前可以用于HDR+照片的拍攝;隨著Android8.1的推出,第三方應(yīng)用開(kāi)發(fā)者也可以應(yīng)用Pixel2/XL的這一芯片來(lái)拍攝HDR+照片。
不過(guò)在未來(lái),PixelVisualCore也能夠被開(kāi)發(fā)者應(yīng)用于機(jī)器學(xué)習(xí)。
人類語(yǔ)言問(wèn)題的解決
接下來(lái),Google負(fù)責(zé)機(jī)器學(xué)習(xí)的一個(gè)項(xiàng)目總監(jiān)LinneHa登臺(tái)介紹了Google的機(jī)器學(xué)習(xí)在人類語(yǔ)言方面的成績(jī)。
LinneHa表示,當(dāng)今世界上,有6000多種語(yǔ)言(算上方言可能會(huì)更復(fù)雜),其中只有400多種擁有超過(guò)100萬(wàn)的使用人口。然而在互聯(lián)網(wǎng)上,有50%的內(nèi)容都是英文的,而世界使用人口數(shù)量排名第四的印度語(yǔ),其內(nèi)容量在網(wǎng)上的排名不到前30。這種人類語(yǔ)言上的不平衡,正是Google試圖通過(guò)人工智能解決的問(wèn)題。
Google在語(yǔ)言方面所做的努力包括對(duì)多種語(yǔ)言字體進(jìn)行Unicode編碼,使其不僅僅能夠用在桌面電腦上,還能用在移動(dòng)設(shè)備上。不僅如此,Google還開(kāi)發(fā)了幾乎可以支持任何語(yǔ)言的Noto字體;而針對(duì)字符數(shù)量比較多的語(yǔ)言,GoogleKeyboard能夠利用機(jī)器學(xué)習(xí)在用戶輸入時(shí)進(jìn)行預(yù)測(cè),從而讓用戶輸入效率大大增加。
利用深度神經(jīng)網(wǎng)絡(luò),Google推出了VoiceSearch功能,即使是在嘈雜環(huán)境中,用戶也可以與手機(jī)對(duì)話;目前該功能已經(jīng)支持119種語(yǔ)言,庫(kù)卡機(jī)器人,其中包括11中印度語(yǔ)言和3種印度尼西亞語(yǔ)言。另外一個(gè)值得一提的是Google的ProjectUnison項(xiàng)目,它可以利用機(jī)器學(xué)習(xí)實(shí)現(xiàn)文本向語(yǔ)音的轉(zhuǎn)換,主要針對(duì)語(yǔ)料并不豐富的語(yǔ)種,比如孟加拉語(yǔ)、高棉語(yǔ)和爪哇語(yǔ)。而機(jī)器學(xué)習(xí)模型可以減少構(gòu)建文本到語(yǔ)音模型所需的數(shù)據(jù)量。
在說(shuō)完語(yǔ)言之后,GoogleAsssitant工程總監(jiān)PraviaGupta上臺(tái)對(duì)GoogleAssistant進(jìn)行了簡(jiǎn)單介紹。除了眾所周知的功能,PraviaGupta再次強(qiáng)調(diào)稱GoogleAssistant已經(jīng)擁有Voice、Type、Tap、Lens等四種輸入方式;而且可以覆蓋iPhone&Android智能手機(jī)、Chromebook筆記本、電視機(jī)、汽車、智能手表等多種設(shè)備。
當(dāng)然在現(xiàn)場(chǎng),PraviaGupta也少不了對(duì)GoogleAssistant進(jìn)行了一番Demo。
用AI來(lái)賦能行業(yè)、應(yīng)對(duì)人類挑戰(zhàn)
當(dāng)然,除了致力于自身產(chǎn)品的發(fā)展,Google也不忘記強(qiáng)調(diào)它對(duì)其他企業(yè)和開(kāi)發(fā)者創(chuàng)新的影響。Google表示,目前它為企業(yè)及開(kāi)發(fā)者提供了三種創(chuàng)新工具,分別為T(mén)ensorFlow、云機(jī)器學(xué)習(xí)API以及TPU電腦芯片。在溝通會(huì)現(xiàn)場(chǎng),來(lái)自日本的丘比公司,就登臺(tái)介紹了它如何使用TensorFlow來(lái)提高食品材料的質(zhì)量和安全性。
在行業(yè)創(chuàng)新之外,Google表示機(jī)器學(xué)習(xí)也可以幫助我們解決人類的一些重大挑戰(zhàn),比如說(shuō)醫(yī)療保健、能源和環(huán)境問(wèn)題。比如說(shuō)機(jī)器學(xué)習(xí)目前已經(jīng)用于診斷糖尿病引起的眼部疾病、乳腺癌等疾病;實(shí)際上雷鋒網(wǎng)已經(jīng)報(bào)道過(guò),就在11月26日,Google旗下的DeepMind團(tuán)隊(duì)正式宣布將利用AI來(lái)對(duì)抗乳腺癌。
不過(guò),來(lái)自新西蘭維多利亞大學(xué)的博士生VictorAnton則試圖通過(guò)人工智能來(lái)識(shí)別鳥(niǎo)叫聲,以便來(lái)保護(hù)鳥(niǎo)類。
在溝通會(huì)的結(jié)尾,JeffDean展望了Google人工智能的未來(lái)。
他表示,www.twshmhelmet.com,未來(lái)要面臨的主要困難是如何想方設(shè)法讓機(jī)器學(xué)習(xí)模型的創(chuàng)作更加觸手可及;為此,Google明年將在互聯(lián)網(wǎng)上免費(fèi)提供機(jī)器學(xué)習(xí)課程,而且Google相關(guān)團(tuán)隊(duì)也在研究如果使用AutoML自動(dòng)創(chuàng)建機(jī)器學(xué)習(xí)模型。
最后,JeffDean補(bǔ)充稱,目前Google已經(jīng)啟動(dòng)了People+AIResearch(PAIR)計(jì)劃,這個(gè)計(jì)劃旨在研究并重新設(shè)計(jì)人與人工智能系統(tǒng)的交互方式,其最終目的是讓機(jī)器學(xué)習(xí)模型具有包容性,并能夠真正地為每個(gè)人可用。