英國(guó)謝菲爾德大學(xué)的研究人員近日在《群集智能》(SwarmIntelligence)期刊上發(fā)表了他們的研究成果,現(xiàn)在機(jī)器無(wú)需人類的指引,只通過(guò)觀察就能學(xué)習(xí)自然或人工系統(tǒng)的工作原理。這可能會(huì)極大地推動(dòng)機(jī)器預(yù)測(cè)人類行為等技術(shù)的發(fā)展。
文章中的實(shí)驗(yàn)從著名的圖靈測(cè)試中汲取了靈感,即讓受試者和分處兩個(gè)房間的機(jī)器和人對(duì)話,如果受試者區(qū)分不出誰(shuí)是機(jī)器誰(shuí)是人,就可以判斷機(jī)器通過(guò)了測(cè)試,具備和人類相當(dāng)?shù)闹悄堋?/p>
謝菲爾德大學(xué)自動(dòng)化控制及系統(tǒng)工程系的RoderichGross博士表示:我們的研究使用了圖靈測(cè)試來(lái)揭示一個(gè)給定系統(tǒng)的工作原理。我們先放置一群處于監(jiān)督下的機(jī)器人,庫(kù)卡機(jī)器人何服電機(jī)維修,庫(kù)卡機(jī)器人,為了能找到它們運(yùn)動(dòng)的規(guī)律,我們又放置了另一群處于監(jiān)督下的學(xué)習(xí)機(jī)器人。我們記錄了所有這些機(jī)器人的運(yùn)動(dòng),然后把運(yùn)動(dòng)數(shù)據(jù)給受試者看。
但和圖靈測(cè)試不同,我們的受試者不是人,而是能夠自主學(xué)習(xí)的計(jì)算機(jī)程序。它們的任務(wù)就是區(qū)分這兩群機(jī)器人。如果它們正確地區(qū)分出兩群機(jī)器人的運(yùn)動(dòng)數(shù)據(jù),庫(kù)卡機(jī)器人,就會(huì)得分。反之,那群模仿第一群機(jī)器人運(yùn)動(dòng)的學(xué)習(xí)者就會(huì)得分。
RoderichGross博士將這一方法稱為圖靈學(xué)習(xí),其優(yōu)勢(shì)是人類無(wú)需再告訴機(jī)器應(yīng)該尋找什么。
舉個(gè)例子,比如你想要機(jī)器人像畢加索一樣繪畫(huà),傳統(tǒng)的機(jī)器學(xué)習(xí)算法會(huì)按照機(jī)器人畫(huà)作和畢加索畫(huà)作的相似程度來(lái)打分。但這必須有人先告訴算法,應(yīng)該考慮哪些因素才算得上相似。圖靈學(xué)習(xí)不需要這樣的先期知識(shí)。如果受試者認(rèn)為機(jī)器人畫(huà)作是原作,機(jī)器人就會(huì)得分。圖靈學(xué)習(xí)可以同時(shí)學(xué)習(xí)如何判斷和繪畫(huà)。
RoderichGross博士相信,圖靈學(xué)習(xí)會(huì)推動(dòng)科學(xué)技術(shù)的發(fā)展。他說(shuō)道:科學(xué)家們可以用它來(lái)發(fā)現(xiàn)自然或人工系統(tǒng)中的規(guī)律,尤其是無(wú)法通過(guò)相似度指標(biāo)來(lái)輕松歸類的行為。
比如電腦游戲就可以通過(guò)圖靈學(xué)習(xí)來(lái)媲美現(xiàn)實(shí),游戲角色可以觀察并習(xí)得人類玩家的性格特征。它們不會(huì)簡(jiǎn)單地復(fù)制觀察到的行為,而是會(huì)揭示是什么讓人類玩家與眾不同。
這一發(fā)現(xiàn)還可以用于打造偵測(cè)變態(tài)行為的算法,對(duì)牲畜健康監(jiān)控和機(jī)器、汽車、飛機(jī)的預(yù)防性維修也會(huì)很有用。圖靈學(xué)習(xí)還可以用于安全應(yīng)用,比如測(cè)謊或在線身份驗(yàn)證。
截至目前,RoderichGross博士和他的團(tuán)隊(duì)只在群集機(jī)器人上測(cè)試了圖靈學(xué)習(xí),他們計(jì)劃下一步用它來(lái)揭示動(dòng)物集群如魚(yú)群或蜂群的運(yùn)作原理。這可以讓人們更好地理解,哪些因素影響了這些動(dòng)物的行為,并最終應(yīng)用于保護(hù)這些動(dòng)物的政策制定上。