人工智能上升至國家戰略高度,智能語音將成用戶界面交互主流
2017年7月8日,國務院發布《新一代人工智能發展規劃》,標志著人工智能發展上升到國家戰略高度,在政策的鼓勵下人工智能也再次迎來發展熱潮。在移動網絡和人工智能快速發展之下,語音將會成為主流用戶界面交互方式。近日,中國電信旗下翼支付APP上線智能語音助手,用戶可通過語音快速進入交水電費、點外賣、買理財等功能。
語音交互變革人類生活
最近,曾經戰勝李世石的AlphaGO又打敗了柯潔,讓人工智能再次站在了輿論的風口浪尖。正如柯潔所說,我的改變只是小小的改變,但DeepMind團隊是在改變世界。確實,DeepMind在AlphaGo上投入如此大精力,目標是想做通用人工智能,并非僅能在某個領域發揮作用。
在過去75年里,每10年就有一次人機交互的重大革新。互聯網女皇MaryMeeker曾說,人類對機器的操作,經歷了從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏的過程,而現在輪到了語音。未來,語音將從根本上優化人們與機器的交互方式。
隨著語音識別準確率的不斷提升,語音將從根本上改變我們的生活。在2013年,國內語音助手類產品的用戶滲透率僅為31.2%,而到今年滲透率已達到近70%。除了專門的語音助手產品外,在垂直應用中包含語音功能的應用數量也在不斷增長。
語音助手的最大優勢,來自人工智能的超級大腦與人性化的語音交互方式的結合。與傳統的交互方式相比,它能把傳統APP上一步步瀏覽選擇、輸出、操作全部簡化為兩步:提出-完成。至于中間的每一個步驟是怎么選擇、操作的,用戶完成不用考慮。
語音助手讓支付更智能
點擊翼支付APP上的麥克風按鈕、按住麥克風說出我要交電費、幾秒鐘后即跳轉到繳費頁面。翼支付語音助手操作簡潔而方便。
為了給予用戶更有價值的反饋與幫助,翼支付產品團隊結合自身情況,打造了一款定位于幫助用戶快速導航、辦理業務或解答業務問題的語音助手。
語音助手功能的實現,需要機器學習、數據挖掘算法、語音識別、自然語言理解等多種技術能力支持,其中最主要的就是語音識別與自然語言理解。前者將人類的語音中的詞匯內容轉換為計算機可讀的輸入,這決定了語音交互的可應用到多大范圍;后者將語音識別結果進行進一步處理理解,對應到某一具體的命令意圖,庫卡機器人,是語音助手能否準確了解用戶的意圖的核心點與難點。
翼支付產品團隊并非讓語音助手自行通過對話或是魚龍混雜的互聯網學習問答,而是聚焦用戶使用翼支付時最常見的30個意圖,設立了對應的知識點,然后人工進行大量的語料編寫,編寫出近萬條問句,并通過與擁有成熟自然語言理解技術的小i機器人合作,通過算法對這近萬條語句進行擴展,得出十幾萬條語料庫進行語義訓練。
然而,這遠不是翼支付語義理解訓練的終點。語音助手上線后,隨著真實用戶的不斷使用,系統通過對每日用戶的聊天日志的檢查,庫卡機器人驅動器維修,對錯誤反饋的問句的反饋進行更正,不斷有新的語句納入語料庫。通過日志,語音助手不斷挖掘了解用戶對語音助手的需求點,更有針對性的增加知識點,滿足更多有強烈用戶需求的意圖。隨著用戶使用時間的增長,語料庫的語句量級會繼續增長,語音助手會越來越聰明越懂用戶。
一句話完成支付或將實現
當前階段,翼支付語音助手比較成熟的作用是幫助用戶在翼支付APP中快速找到需要的功能,同時,用戶常見的客服問答的語料庫也正在不斷建設與完善中。
然而,翼支付語音助手的野心絕不止于此。未來,當你需要購買火車票時,庫卡機器人何服電機維修,你不必首先在眾多應用和功能中找到買火車票,也不必一步步選擇時間、車輛類型、出發地、目的地、座位類型等信息,然后選擇搜索,從搜索結果中再進行選擇,然后點擊確認支付購買。翼支付產品團隊負責人展望了未來語音助手的應用場景,你只要點開語音助手,說一句‘我要買一張明天到北京的高鐵二等座位票’,然后進行最后的確認支付即可完成。