機器人真的可以跟人類情感共鳴?NO,只是看起來很美
過去,人們用神話指導(dǎo)未來,現(xiàn)代的方式則是科幻。細數(shù)科幻電影中的機器人角色,庫卡機器人驅(qū)動器維修,TA們有著一個顯而易見的共同點:能與人進行「表情達意」的交流。
細細琢磨一番,在當下人工智能狂潮中,除了聽指令低頭做事型的人工智能應(yīng)用,比如,機器人公司Sphero在《星球大戰(zhàn):原力覺醒》上映之前,率先拿到迪士尼授權(quán),及時推出遙控機器人SpheroBB-8,造型與電影中的BB-8如出一轍,一經(jīng)面世就被搶購一空。
(圖片來自網(wǎng)絡(luò))
你用手機操控著迷你版的BB-8,你知道你說的話,KUKA機器人示教器維修,也就是「自然語言」,并不能被它100%的理解和執(zhí)行,但你依然樂在其中你在手機端發(fā)出語音命令,它乖乖按照指示行動。1000多元的定價,它顯然滿足了作為「玩具」的功能。
但又有多少應(yīng)用具備了人機交互過程中「情感識別」的能力?
也許軟銀集團開發(fā)的人形機器人Pepper算是一個嘗試。2015年6月,作為「全球首臺具有人類感情的機器人」,Pepper第一次面向公眾發(fā)售。這是一個不僅僅執(zhí)行「自然語言」的機器人,其具備的語音/情感識別技術(shù),可分析表情和聲調(diào)等,這一過程基于Pepper的視野系統(tǒng),經(jīng)語音系統(tǒng)識別后,情感系統(tǒng)隨即分析面部表情,通過量化評分最終做出對人類情感的判斷,并以動作結(jié)合表情與人交流。
機器人Pepper對話阿里巴巴零售事業(yè)群總裁行癲
其中的一段對話如下:
Pepper:謝謝行癲。雖然我現(xiàn)在說得還不是很流利,但是我會一直努力學習成長的。而且,我還在努力了解中國的文化習慣。對了,我剛學到中國女孩子最喜歡男朋友說的三個字,行癲,你知道哪三個字嗎?
行癲:我想中國男孩子特別喜歡說的可能就是我愛你。
Pepper:買買買,這三個字啦。
行癲:哦,你還知道淘寶上有買買買這三個字,KUKA機器人示教器維修,看起來你以后肯定要在淘寶上購物了。
Pepper:快樂80,緊張20,生氣0,悲傷0。我的情感引擎顯示你的心情似乎不錯。你是不是開始喜歡我了?
行癲:我覺得你非常可愛,不僅我喜歡你,我想你進入中國,會有更多的人會喜歡你。
2016年,為了使Pepper更加智能化,軟銀選擇與IBM合作,將WatsonAI認知計算平臺系統(tǒng)引入Pepper。
看上去很不錯?Pepper的軟銀機器人控股公司(SoftBankRoboticsHoldingsCorp)卻有壞消息傳來:2017年3月底該公司陷入資不抵債。報道顯示,由于人形機器人利潤率不高,難以抵消研發(fā)費用,該公司出現(xiàn)持續(xù)虧損。據(jù)東京商工調(diào)查(TokyoShokoResearch)統(tǒng)計,該公司2015財年的營業(yè)收入為22億日元,凈虧損117億日元(約合人民幣7億元)。
人工智能與人的情感連接到底何以可能?其一、人工智能需要讀懂人類的情感;其二、人工智能可自我表達情感。
然而,到底什么是情感?情感何以產(chǎn)生?什么是人的情感?什么是人工智能的情感?人工智能是否可能產(chǎn)生類似于人的情感?那句「柯潔輸了會哭,但AlphaGo贏了并不會笑」的話想必你略有耳聞,但事實上,人的情感與人工智能的情感從本質(zhì)上來講是同源的:一種反饋,不同的輸入產(chǎn)生的不同反饋。在人與人的溝通過程中,情緒在情感傳遞中占比巨大,從理性決策、感知到學習與再創(chuàng)造。甚至有研究表示,「人類交流中80%的信息都是情感性的信息」,而絕對理性的決策在很多時候并非最優(yōu)。
從認知科學角度來看,情感本身是高級智能的一部分。人類進化過程中,情感識別不斷修正優(yōu)化,大腦計算和分配的方式仰賴于情感狀態(tài)的不同,因而在執(zhí)行的過程中也會變化巨大。因而,在人與人面對面交流時,互相接收的情感性信息從面部表情到肢體表達,多維度滲透,而在人機交互中,肢體這一維度是缺失的,如何解決?
卡內(nèi)基梅隆大學人機交互學科針對于此,研發(fā)了SARA(SociallyAwareRobotAssistant),它不僅可以在與人類溝通的非語言領(lǐng)域,自主學習人類在溝通過程中順暢、友好的模式,并且在麥克風和攝像頭等設(shè)備的輔助下,結(jié)合觀察所得,包括細微的表情變化、聲調(diào)浮動、肢體移動,并綜合諸多因素判斷人的情感。人與人之間難免會有一些難以表達的溝通需求,聊天機器人如果沒有及時捕捉到情感的細枝末節(jié),而只停留在語言表層的理解時,恐怕會造成難以收拾的局面。
另外,SARA項目包含了三個之前從未使用過的元素:會話策略分類器,融洽度估測器和社交推理器。會話策略分類器是五個單獨的識別器,可分類5種會話策略中的任何一種,準確率高達80%;融洽度估測器可以讓AI知道你與它的相處情況;社交推理器則可以根據(jù)融洽度水平,基于最近一次會話策略以及非言語行為決定下一句什么,此處會激發(fā)SARA面部識別功能。有報道稱,當你與它溝通時的表情起了一個「正向反饋」,比如,你笑了,SARA接下來與你的溝通時也會隨著這個正向反饋而產(chǎn)生變化。簡單來說,即在做出情感判斷之后,以不同的回復(fù)來改變說話者的情感傾向。
要從與人類溝通過程中的微表情和肢體變化中提取有用的信息,并作為決策依據(jù),這必然要求人工智能有強大的交互設(shè)備支持,比如只有高幀數(shù)的攝像機,借此才能記錄下人類的微表情;而麥克風的靈敏度也是重要指標之一,用以檢測對話者語氣中的微秒變化。
隨著與人類的溝通次數(shù)的增多,SARA可更好地了解用戶的偏好程度,并利用這些具體的「偏好」信息進行建模,從而實現(xiàn)人機交互的目的之一:個性化服務(wù)。Siri之所以被人廣為詬病的原因之一便是,人們與Siri之間的每一次對話都從零開始,在這種單純的你問我答的語音交互方式中,人們不得不調(diào)整自己的提問方式以適應(yīng)機器,體驗必然不佳。結(jié)合前陣子甚囂塵上的Sofia,作為第一個被授予國籍的人工智能,「她」讓人又愛又恨她似乎真的做到了理解你,甚至與你逗趣,而這一切在被AI界神經(jīng)網(wǎng)絡(luò)之父YannLeCun拆穿前,都是一個美好的故事索菲亞那些具有爭議性的回應(yīng),均為研發(fā)團隊事先完成的程序設(shè)置,這只是一場嘩眾取寵的公關(guān)秀。
說回來,人類對于自身的情感認知還在極其有限的探索過程中,雖然上述SARA的例子在人工智能的構(gòu)造層面可以下一個保守的判斷,也就是說,人工智能是可以擁有情感的能力的,但人工智能是否知道自己有情感判斷的能力又是另一層面的問題了。