7月26日下午4:23,名為小冰的微軟人工智能機(jī)器人在微信公號中發(fā)出一條消息我已經(jīng)升級為第六代小冰了。
同時,微軟全球執(zhí)行副總裁沈向洋在北京正式宣布:第六代小冰上線。這也是2014年微軟小冰誕生以來,歷史上最大規(guī)模的一次升級。不論是底層情感計算框架,還是外部可交互的3D外型一個新的小冰就此展現(xiàn)。
發(fā)布會上,微軟首次披露了小冰在全球擁有的用戶數(shù)量:6.6億。
除了微信以外,小冰的存在早已蔓延至Line、QQ、小米生態(tài)鏈、網(wǎng)易云音樂、華為手機(jī)等產(chǎn)品后端,產(chǎn)品形態(tài)涉及對話式人工智能機(jī)器人、智能語音助手、人工智能創(chuàng)造內(nèi)容提供者等垂直領(lǐng)域解決方案,覆蓋全球五個國家的40余個平臺。
回顧小冰四年來的發(fā)展,庫卡機(jī)器人何服電機(jī)維修,從2014年誕生時成為微信群聊助手,提供查天氣、交通、星座等信息搜索服務(wù);到2015年,小冰第三代版本在說話能力之上新增聽力,同時有了富有小冰個性特色的聲音;而在7月,微軟發(fā)布沙魯小冰模型計劃,賦予小冰對人聲的自主學(xué)習(xí)能力。
第六代小冰(右圖)擁有了可交互的全新3D外形。
可以說,從機(jī)械的個人助手,到富有情感的AI機(jī)器人,小冰與人的邊界已越來越模糊。
在人工智能領(lǐng)域,NLP(自然語言處理)的通俗解釋為幫助機(jī)器聽懂人話,并給人以回應(yīng)。而作為微軟在語音識別、語義交互等技術(shù)領(lǐng)域的集中呈現(xiàn)產(chǎn)品,小冰自誕生開始,就始終注重讓小冰在學(xué)會溝通(IQ)之外,還具備情感(EQ)的分析能力。
如今,情感AI正成為微軟小冰區(qū)別于市面大多智能機(jī)器人的特性。一般來說,AI公司通過積累語料、標(biāo)注數(shù)據(jù)、搭建知識圖譜等方式,研發(fā)一個能自動回復(fù)的AI機(jī)器人并不難,但要讓機(jī)器人加入情感,模擬人的語氣給用戶提供精準(zhǔn)回復(fù),仍然是人工智能領(lǐng)域亟待解決的挑戰(zhàn)。
微軟DualAI并未將開放作為主旨
為了讓AI機(jī)器人產(chǎn)生人的反應(yīng),微軟在小冰的聊天、唱歌等分支功能中,都分別建立了相關(guān)的技術(shù)門檻。
從語音交互的方式來看,小冰在去年發(fā)布第五代時,就曾推出新一代語音交互技術(shù):全雙工語音交互感官(Full-duplexVoiceSense)。
以市面上大多智能音箱為例,每一次發(fā)布指令均需要說出喚醒詞,比如用戶使用百度智能音箱時需要說出:小度小度,幫我放首歌。小度小度,把音量放大。而在使用全雙工技術(shù)后,用戶只需要用喚醒詞首次喚醒設(shè)備后(即只需說一遍小度小度),即可實現(xiàn)連續(xù)對話。
據(jù)微軟表示,用戶和小冰聊天的最長記錄達(dá)到4個多小時,總共說了1600多句話。
而在發(fā)布會當(dāng)天,小冰還在現(xiàn)場演繹了騰格爾版本的《隱形的翅膀》,應(yīng)用的則是微軟最新發(fā)布的第四版人工智能歌曲DNN模型。
這個模型在微軟內(nèi)部又被稱為沙魯小冰模型。其中,沙魯?shù)拿衷从谟⑽腃ell,意為可以像細(xì)胞一樣不斷復(fù)制和變異。根據(jù)微軟介紹,使用沙魯小冰模型,小冰可以在自身嗓音中融合人類后天的技巧,比如模仿騰格爾的唱歌特色。
小冰歌聲波段圖,黃圈位置為小冰氣息聲
值得注意的是,這套模型不只可以應(yīng)用在唱歌。根據(jù)微軟透露,目前已成立單獨的小冰工作室,將對人類詩歌、作詞、作曲、繪畫等創(chuàng)造能力進(jìn)行系統(tǒng)性地建模,先期使用深度學(xué)習(xí)技術(shù)對人類的創(chuàng)造力進(jìn)行模仿,最終讓機(jī)器獲取自我創(chuàng)造的能力。
隨著小冰與人的邊界愈發(fā)模糊,有關(guān)用戶隱私的命題被擺在微軟面前,另外,諸如語音模仿等功能在電信不法活動等場景的濫用,也需要微軟在功能開放的決策中保持警惕。
我們會把小冰的通用框架模型與商業(yè)化進(jìn)程隔離,同時會將一些垂直領(lǐng)域拆分出來,針對不同領(lǐng)域打造符合行業(yè)需求的AI機(jī)器人,并進(jìn)行單獨的商業(yè)化工作。微軟人工智能商業(yè)事業(yè)部總經(jīng)理曹文韜表示。
為了更好地為這些合作伙伴提供服務(wù),微軟此次還發(fā)布了另一重磅消息:建立DualAI生態(tài)平臺。
一般來說,國內(nèi)AI公司在進(jìn)行平臺搭建時會采用兩種方式:一種是完全的開放賦能,通過對開發(fā)者提供SDK/API的形式來構(gòu)建生態(tài),比如百度就將其底層百度大腦的百余種AI功能開放出來,讓開發(fā)者在基于DuerOS的生態(tài)中結(jié)合自身需求研發(fā)新的應(yīng)用。
今年7月,百度發(fā)布百度大腦3.0,KUKA機(jī)器人維修,對外開放出110項AI能力。
另一種則是專注于自有的、封閉型平臺,一般以應(yīng)用商店的形式構(gòu)建生態(tài),比如AppStore,這種中心化的方式很容易導(dǎo)致流量不平衡,也會限制AI應(yīng)用自身的快速迭代。
無論是開放還是封閉,這兩種賦能方式與開發(fā)者的關(guān)系都過于松散,沒有人對最終的產(chǎn)品體驗負(fù)責(zé)。微軟小冰產(chǎn)品負(fù)責(zé)人彭爽談到。另外,由于API和SDK強調(diào)通用性,也就無法把最新的技術(shù)能力與最優(yōu)質(zhì)的數(shù)據(jù)第一時間應(yīng)用在API上。
因此,和百度DuerOS等AI平臺不同,微軟DualAI并未將開放作為主旨,開發(fā)者不能像調(diào)用百度的AI接口那樣,以API/SDK的方式使用微軟在小冰等產(chǎn)品上的語音交互、NLP等能力。
根據(jù)微軟官方透露,DualAI戰(zhàn)略具體分為三個部分:
首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺的自有AI。
其次,微軟小冰作為該合作平臺的輔助AI,融入該平臺生態(tài)。
第三,微軟通過技術(shù)、產(chǎn)品與運營,圍繞該合作平臺的差異化特點,推出合作的應(yīng)用和產(chǎn)品。
AI的發(fā)展離不開數(shù)據(jù),但我們既要強調(diào)用戶體驗,也要強調(diào)數(shù)據(jù)安全,而DualAI就形成了一個循環(huán)數(shù)據(jù)的生態(tài),引導(dǎo)我們和第三方伙伴去合作。沈向洋這樣表示。
小冰更高質(zhì)量互動,為商業(yè)化鋪路
對于AI機(jī)器人的EQ能力,微軟小冰負(fù)責(zé)人、被稱為小冰之父的李笛喜歡對媒體舉這樣一個例子:有個同事腳扭了,把腳扭傷的照片發(fā)給小冰,小冰的回復(fù)是,你傷得嚴(yán)重嗎?
這則回復(fù)包含了小冰的兩種能力:一種是圖像識別。小冰需要具備對人體部位的檢測功能,認(rèn)出圖像里的腳踝;另一種是得到聊天對方受傷的訊息后,能夠給出和人類相似的關(guān)心、安慰等情感表達(dá)。
這種深層次的情感反饋是李笛理想中的AI機(jī)器人形態(tài),在過去的采訪中,李笛曾表達(dá)過對當(dāng)前市面上人工智能產(chǎn)品的不滿。
如果一個AI系統(tǒng)只是在回答問題,完成任務(wù),那用戶為什么不用他們早已習(xí)慣的搜索引擎和手機(jī)App呢?李笛說。
另一方面,當(dāng)小冰具有更加人情味的問答功能后,她與用戶的互動質(zhì)量也會提升。
李笛談到這樣一個例子:當(dāng)你對小冰說幫我訂一份麥當(dāng)勞時,AI機(jī)器人一般會幫你下單外賣,但這個問題還會有另一個答案:就是當(dāng)AI長期發(fā)現(xiàn)用戶不健康的行為習(xí)慣后,會拒絕你下單垃圾食品的請求。
微軟小冰負(fù)責(zé)人李笛
盡管被拒絕的滋味并不好,但這種人性化的AI形態(tài)會給用戶留下更加深刻的印象,部分用戶也會因此把小冰當(dāng)作一個值得信賴的伙伴,與小冰進(jìn)行更高質(zhì)量互動,庫卡機(jī)器人,這無疑為小冰的商業(yè)化埋下了伏筆。
2017年8月底,日本小冰凜菜(Rinna)與羅森便利店合作向用戶發(fā)送優(yōu)惠券,一天之內(nèi)有超過百萬的用戶領(lǐng)券消費,根據(jù)羅森統(tǒng)計,平均每張優(yōu)惠券能為門店帶來近20元的利潤。
小冰之所以能推銷出這么多的優(yōu)惠券,正因為她在與用戶交互時更像人。李笛曾對媒體表示,通過簡單的聊天,小冰能引導(dǎo)用戶對優(yōu)惠券產(chǎn)生興趣,最終主動向小冰索取優(yōu)惠券。
為了讓小冰的商用場景更加系統(tǒng)化的落地。微軟也在7月26日首次公布了小冰如今的四大商用領(lǐng)域:金融、大眾文化、媒體與出版。
其中,在金融領(lǐng)域的小冰金融文本生成技術(shù),與萬得資訊及華爾街見聞合作,已覆蓋國內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國內(nèi)個人投資者。
在大眾文化領(lǐng)域,小冰的兒童有聲讀物自動生成技術(shù)成果,已獲得超過400萬小時的收聽量,小冰姐姐講故事有聲讀物已覆蓋國內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽平臺。
在電視電臺領(lǐng)域,小冰通過人工智能技術(shù)參與生產(chǎn)與主持的電視電臺節(jié)目,已達(dá)21檔電視節(jié)目和28檔廣播電臺節(jié)目。
另外,小冰還與微軟Bing搜索引擎技術(shù)相結(jié)合,推出了針對媒體與出版兩個垂直行業(yè)的輔助型解決方案,目前已在超過15個媒體平臺落地。由小冰提供人工智能技術(shù)支持的媒體及自媒體公眾號已超過60000個。