Facebook使用AI來實現文字轉語音系統
在人工智能領域中,語音也是AI技術的一部分,說到語音合成,它是通過機械的、電子的方法產生人造語音的技術。TTS技術(又稱文語轉換技術)隸屬于語音合成,它是將計算機自己產生的、或外部輸入的文字信息轉變為可以聽得懂的、流利的漢語口語輸出的技術。
據媒體報道,Facebook研究員開源了其在今年七月發表的一篇論文中的語音合成方法。在論文中,他們提出了一種新的文字轉語音的神經網絡方法,工業機器人維修,可以將從開放場景下采樣到的聲音中提取的文字轉化為語音。
說到神經網絡,該技術基于新的移位緩沖內存儲器區,評估使用者注意力,計算輸出音頻,機器人維修,KUKA機器人示教器維修,以及自身的更新,可用于在開放場景下采樣到的聲音轉化成文字,再轉化成語音。該技術的網絡架構比現存的同類架構要簡單。
此外,通過使用與上下文無關的查找表對輸入語句進行編碼,該表的每個條目包含一個字符或音素。同樣,能通過一個短向量來表示說話者,這個短向量也適用于新說話者。而且在生成音頻之前,優先準備好緩沖區可以使生成的語音具有可變性。