人工智能日益火熱,可目前的智能語(yǔ)音技術(shù),機(jī)器還不能充分理解自然語(yǔ)言,聽懂弦外之音的情景僅存在于科幻作品中。但這正在起變化!
國(guó)內(nèi)最新的智能語(yǔ)音技術(shù)成果表明:機(jī)器已能以較高的準(zhǔn)確率實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)化文字、多語(yǔ)種同步翻譯、甚至模仿某個(gè)人的聲線講話,以假亂真。
在上千人的會(huì)場(chǎng),多位嘉賓近3小時(shí)的演講交流,全程無(wú)速記員,演講內(nèi)容卻能實(shí)時(shí)轉(zhuǎn)成文字顯示在大屏幕上。
能糾錯(cuò),能秒懂
近日在科大訊飛年度發(fā)布會(huì)上看到,除了演講中個(gè)別人名地名的差錯(cuò),KUKA機(jī)器人電路板維修,以及說(shuō)話者口語(yǔ)表達(dá)中冗余的詞匯外,絕大部分演講內(nèi)容都被整理得非常準(zhǔn)確,并能同步翻譯成英、日、韓等多種語(yǔ)言。
在智能車載系統(tǒng)的展示中,面對(duì)駕駛員任性地打斷、隨意地插話,車載系統(tǒng)竟能通過(guò)上下文語(yǔ)境秒懂駕駛員意圖,甚至對(duì)故意刁難的極簡(jiǎn)指令,也能迅速聽懂弦外之音,導(dǎo)航、聽歌、團(tuán)票都不在話下。
據(jù)介紹,這些都是基于深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別技術(shù)來(lái)實(shí)現(xiàn)的。語(yǔ)音識(shí)別技術(shù),簡(jiǎn)單說(shuō)就是讓計(jì)算機(jī)聽懂人類的語(yǔ)音,將語(yǔ)音中包含的文字信息提取出來(lái)。該項(xiàng)技術(shù)在智能計(jì)算機(jī)系統(tǒng)中扮演著重要角色,相當(dāng)于給計(jì)算機(jī)裝上了耳朵,使其實(shí)現(xiàn)人機(jī)通信和交互。目前語(yǔ)音識(shí)別準(zhǔn)確率可達(dá)到97%。
隨著萬(wàn)物互聯(lián)時(shí)代到來(lái),以語(yǔ)音為主、鍵盤觸摸為輔的人機(jī)交互正逐漸成為剛需。未來(lái)5到10年,人工智能會(huì)像水和電一樣成為我們生活的必需品,www.twshmhelmet.com,深刻改變我們的世界。科大訊飛董事長(zhǎng)劉慶峰說(shuō)。
聰明的機(jī)器人會(huì)說(shuō)話
聰明的機(jī)器人要能聽會(huì)說(shuō),語(yǔ)音合成技術(shù)就是讓機(jī)器像人一樣開口說(shuō)話,它是涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科的一項(xiàng)信息處理的前沿技術(shù)。
中國(guó)工程院院士、中國(guó)人工智能學(xué)會(huì)理事長(zhǎng)李德毅表示,在人工智能領(lǐng)域,KUKA機(jī)器人示教器維修,對(duì)話是目前最直接、最便捷的交互方式,對(duì)話智能是幾乎所有服務(wù)機(jī)器人的必備技能。
目前,中國(guó)在智能語(yǔ)音技術(shù)上已經(jīng)實(shí)現(xiàn)了5到8米的遠(yuǎn)場(chǎng)識(shí)別、多輪交互對(duì)話、免喚醒詞交流、交流隨時(shí)打斷等多項(xiàng)突破,人機(jī)交互越來(lái)越流暢自然。
不僅中文語(yǔ)音合成技術(shù)取得突破,在今年的全球語(yǔ)音合成大賽中,科大訊飛的語(yǔ)音合成技術(shù)能夠聲情并茂講英文故事,在多種語(yǔ)言的測(cè)試中表現(xiàn)不俗。劉慶峰說(shuō)。
讓機(jī)器人開口說(shuō)話的技術(shù)并不新鮮,電子萬(wàn)年歷、計(jì)算器上都能用得到,但要像人一樣說(shuō)得自然流利、有聲調(diào)起伏,并非易事。
現(xiàn)場(chǎng)用手機(jī)試用科大訊飛開發(fā)的語(yǔ)音合成軟件,發(fā)現(xiàn)語(yǔ)音合成功能不僅能將文字信息轉(zhuǎn)化為可聽的聲音信息,還能將某個(gè)人的聲線特征收入語(yǔ)音庫(kù)中,然后用很短的時(shí)間將文本用被模仿者的聲線特點(diǎn)讀出來(lái),確有以假亂真之效。未來(lái),人們的聲音也可能存在被盜用的風(fēng)險(xiǎn)。