五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

日期:2019-03-06   人氣:  來源:互聯網
簡介:為了讓機器聽懂你的聲音,深度學習是如何發揮作用的? 深度學習在2006年嶄露頭角后,近幾年取得了快速發展,在學術界和工業界均呈現出指數級增長的趨勢;伴隨著這項技術的不斷成熟,深度學習在智能語音領域率先發力,取得一系列成功的應用。本文將重點分享……

為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

深度學習在2006年嶄露頭角后,近幾年取得了快速發展,在學術界和工業界均呈現出指數級增長的趨勢;伴隨著這項技術的不斷成熟,深度學習在智能語音領域率先發力,取得一系列成功的應用。本文將重點分享近年來深度學習在語音生成問題中的新方法,圍繞語音合成和語音增強兩個典型問題展開介紹。

一、深度學習在語音合成中的應用

語音合成主要采用波形拼接合成和統計參數合成兩種方式。波形拼接語音合成需要有足夠的高質量發音人錄音才能夠合成高質量的語音,它在工業界中得到了廣泛使用。統計參數語音合成雖然整體合成質量略低,但是在發音人語料規模有限的條件下,優勢更為明顯。在上一期我們重點介紹了深度學習在統計參數語音合成中的應用,本期將和大家分享基于波形拼接的語音合成系統,圍繞Siri近期推出的語音合成系統展開介紹,它是一種混合語音合成系統,選音方法類似于傳統的波形拼接方法,它利用參數合成方法來指導選音,本質上是一種波形拼接語音合成系統。

單元選擇是波形拼接語音合成系統的基本難題,需要在沒有明顯錯誤的條件下將合適的基元組合在一起。語音合成系統通常分為前端和后端兩個部分,前端模塊對于提高語音合成系統的表現力起到非常重要的作用。前端模塊將包含數字、縮寫等在內的原始文本正則化,并對各個詞預測讀音,解析來自文本的句法、節奏、重音等信息。因此,前端模塊高度依賴于語言學信息。后端通過語言學特征預測聲學參數,模型的輸入是數值化的語言學特征。模型的輸出是聲學特征,例如頻譜、基頻、時長等。在合成階段,利用訓練好的統計模型把輸入文本特征映射到聲學特征,然后用來指導選音。在選音過程中需要重點考慮以下兩個準則:(1)候選基元和目標基元的特征必須接近;(2)相鄰兩個基元的邊界處必須自然過渡。可以通過計算目標代價和拼接代價評估這兩個準則;然后通過維特比算法計算最優路徑確定最終的候選基元;最后通過波形相似重疊相加算法找出最佳拼接時刻,因此生成平滑且連續合成語音。

Siri的TTS系統的目標是訓練一個基于深度學習的統一模型,該模型能自動準確地預測數據庫中單元的目標成本和拼接成本。因此該方法使用深度混合密度模型來預測特征值的分布。這種網絡結構結合了常規的深度神經網絡和高斯混合模型的優勢,即通過DNN對輸入和輸出之間的復雜關系進行建模,并且以概率分布作為輸出。系統使用了基于MDN統一的目標和拼接模型,該模型能預測語音目標特征(譜、基頻、時長)和拼接成本分布,并引導基元的搜索。對于元音,有時語音特征相對穩定,而有些時候變化又非常迅速,針對這一問題,模型需要能夠根據這種變化性對參數作出調整,因此在模型中使用嵌入方差解決這一問題。系統在運行速度、內存使用上具有一定優勢,使用快速預選機制、單元剪枝和計算并行化優化了它的性能,可以在移動設備上運行。

二、深度學習在語音增強中的應用

通過語音增強可以有效抑制各種干擾信號,增強目標語音信號;有效的語音增強算法一方面可以提高語音可懂度和話音質量,另一方面有助于提高語音識別和聲紋識別的魯棒性。經典的語音增強方法包括譜減法、維納濾波法、最小均方誤差法,上述方法基于一些數學假設,在真實環境下難以有效抑制非平穩噪聲的干擾;诿し蛛x的非負矩陣分解方法也得到了一定關注,但是這類方法計算復雜度相對較高;近年來,基于深度學習的語音增強方法得到了越來越多的關注,接下來重點介紹幾種典型的基于深度學習的語音增強方法。

1.預測幅值譜信息

這類方法通過深層神經網絡模型建立帶噪語音和干凈語音譜參數之間的映射關系,模型的輸入是帶噪語音的幅值譜相關特征,模型的輸出是干凈語音的幅值譜相關特征,通過深層神經網絡強大的非線性建模能力重構安靜語音的幅值譜相關特征;神經網絡模型結構可以是DNN/BLSTM-RNN/CNN等;相比于譜減、最小均方誤差、維納濾波等傳統方法,這類方法可以更為有效的利用上下文相關信息,對于處理非平穩噪聲具有明顯的優勢。

2.預測屏蔽值信息

采用這類方法建模時模型的輸入可以是聽覺域相關特征,模型的輸出是二值型屏蔽值或浮點型屏蔽值,最常用的聽覺域特征是Gamma濾波器相關特征,這種方法根據聽覺感知特性將音頻信號分成不同子帶提取特征參數;對于二值型屏蔽值,如果某個時頻單元能量是語音主導,則保留該時頻單元能量,如果某個時頻單元能量是噪聲主導,則將該時頻單元能量置零;采用這種方法的優勢是,共振峰位置處的能量得到了很好的保留,而相鄰共振峰之間波谷處的能量雖然失真誤差較大,但是人耳對這類失真并不敏感;因此通過這種方法增強后的語音具有較高的可懂度;浮點值屏蔽是在二值型屏蔽基礎上進一步改進,目標函數反映了對各個時頻單元的抑制程度,進一步提高增強后語音的話音質量和可懂度。

3.預測復數譜信息

目前主流的語音增強方法更多的關注于對幅值譜相關特征的增強而保留原始語音的相位譜,隨著信噪比的降低相位譜失真對聽感的影響明顯增強,在低信噪比條件下,有效的相位重構方法可以有助于提高語音可懂度;一種典型的相位重構方法是利用基音周期線索對濁音段的相位進行有效修復,但是這類方法無法有效估計清音段的相位信息;復數神經網絡模型可以對復數值進行非線性變換,而語音幀的復數譜能夠同時包含幅值譜信息和相位譜信息,可以通過復數神經網絡建立帶噪語音復數譜和干凈語音復數譜的映射關系,實現同時對幅值信息和相位信息的增強。

4.PIT說話人分離

通過說話人分離技術可以將混疊語音中不同的說話人信息有效分離出來,已有的基于深度學習的說話人分離模型受限于說話人,只能分離出特定說話人的聲音;采用具有置換不變性的訓練方法得到的說話人分離模型不再受限于特定說話人;這種方法通過自動尋找分離出的信號和標注的聲源之間的最佳匹配來優化語音增強目標函數;模型的輸入是混疊語音的譜參數特征,模型的輸出包含多個任務,每個任務對應一個說話人;在訓練過程中,對于訓練集中一個樣本內,每個任務固定對應某個說話人;可以采用BLSTM-RNN模型結構建模。

5.DeepClustering說話人分離

基于深度聚類的說話人分離方法是另一種說話人無關的分離模型,這種方法通過把混疊語音中的每個時頻單元結合它的上下文信息映射到一個新的空間,并在這個空間上進行聚類,工業機器人維修,使得在這一空間中屬于同一說話人的時頻單元距離較小可以聚類到一起;將時頻單元映射到新的空間跟詞矢量抽取的思想有些類似,可以通過k均值聚類的方法對時頻單元分組,然后計算二值型屏蔽值分離出不同說話人的語音,也可以通過模糊聚類的方法描述不同的時頻單元,工業機器人維修,然后計算浮點型屏蔽值后分離混疊語音。基于深層聚類的方法和基于PIT的方法有著各自的優勢,為了更有效的解決問題,可能需要將兩種方法有效的結合。

6.基于對抗網絡的語音增強

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言
91精品国产综合久久精品麻豆| 亚洲综合小说图片| 色婷婷激情综合| 欧美一区二区三区播放老司机| 中文字幕在线免费不卡| 久草热8精品视频在线观看| 欧美中文字幕久久| 日韩一区在线免费观看| 高清av一区二区| 日韩视频免费观看高清完整版在线观看| 国产精品久久久久影院老司 | 精品夜夜嗨av一区二区三区| 色视频欧美一区二区三区| 中文字幕一区二区在线观看| 同产精品九九九| 99热这里都是精品| 国产精品久久毛片a| 波多野结衣欧美| 亚洲国产精品传媒在线观看| 久久国产剧场电影| 久久综合久色欧美综合狠狠| 国产成人在线看| 日韩女优av电影| 国产伦精品一区二区三区免费迷 | 人人狠狠综合久久亚洲| 日韩视频在线你懂得| 久久精品国产免费| 国产欧美视频在线观看| 99精品视频在线免费观看| 国产精品福利一区二区| 国产成人自拍高清视频在线免费播放| 91精品国产综合久久精品图片| 久久国产精品一区二区| 欧美国产欧美亚州国产日韩mv天天看完整| 高清不卡一二三区| 亚洲一区二区三区四区五区黄 | 一区二区三区在线看| 色视频一区二区| 亚洲精品伦理在线| 欧美日韩中文字幕一区| 免费观看日韩av| 一区在线观看免费| 欧美一级理论性理论a| 国产乱淫av一区二区三区| 亚洲欧美国产77777| 717成人午夜免费福利电影| 激情综合网天天干| 欧美国产日韩一二三区| 欧美精品视频www在线观看| 成人小视频免费观看| 亚洲一级电影视频| 欧美国产精品中文字幕| 欧美日韩精品免费观看视频| 久久99久国产精品黄毛片色诱| 国产精品网友自拍| 日韩午夜在线影院| 91蜜桃视频在线| 国产一区二区三区免费看| 亚洲第一久久影院| 国产色婷婷亚洲99精品小说| 欧美精品久久久久久久多人混战| 不卡视频免费播放| 久色婷婷小香蕉久久| 亚洲欧洲av一区二区三区久久| 91精品国模一区二区三区| av激情综合网| 成人在线一区二区三区| 精品在线播放午夜| 中文字幕在线不卡一区| 国产无人区一区二区三区| 欧美日韩电影在线| 久久精品国产一区二区| 日韩精品一卡二卡三卡四卡无卡| 中文字幕永久在线不卡| 日韩午夜激情视频| 91在线一区二区| 国产很黄免费观看久久| 日本在线观看不卡视频| 视频在线观看国产精品| 一区二区高清在线| 日本道精品一区二区三区| 日本道精品一区二区三区| 欧美激情在线免费观看| 久久久久亚洲蜜桃| 精品久久久久久久人人人人传媒| 欧美久久久一区| 欧美精选一区二区| 日韩欧美一级在线播放| 日韩欧美国产麻豆| 2020国产精品自拍| 欧美精品一区在线观看| 精品久久久久99| 久久久久国产一区二区三区四区| 91福利精品视频| 亚洲日韩欧美一区二区在线| 亚洲无人区一区| 成人毛片视频在线观看| 一本到高清视频免费精品| 最新日韩在线视频| 亚洲视频电影在线| 亚洲国产一区二区在线播放| 亚洲一区二区三区视频在线播放| 在线观看成人小视频| 91久久精品午夜一区二区| 91麻豆福利精品推荐| 欧洲在线/亚洲| 91亚洲精华国产精华精华液| 99久久精品一区二区| 欧美三级中文字幕| 日韩欧美二区三区| 精品久久久久久综合日本欧美| 久久久精品天堂| 国产精品看片你懂得 | 91精品国产一区二区三区蜜臀 | 亚洲一区在线视频| 亚洲电影一区二区| 国产精品1区2区| 97久久超碰国产精品| 欧美影院精品一区| 日韩一区二区三区av| 久久久青草青青国产亚洲免观| 国产精品对白交换视频| 亚洲成人你懂的| 粉嫩av亚洲一区二区图片| 国产经典欧美精品| 色综合久久88色综合天天免费| 欧美日韩电影在线播放| 国产欧美视频一区二区三区| 蜜桃视频在线观看一区| 国产成人免费在线| 欧美怡红院视频| 精品99一区二区| 亚洲视频网在线直播| 激情综合一区二区三区| 99re这里只有精品视频首页| 日韩一级片在线观看| 亚洲精品亚洲人成人网在线播放| 美腿丝袜亚洲三区| 在线观看一区日韩| 中文字幕字幕中文在线中不卡视频| 日本欧美肥老太交大片| 日本国产一区二区| 国产嫩草影院久久久久| 蜜臀av性久久久久蜜臀aⅴ| 91视频com| 日本一区二区电影| 黄页视频在线91| 欧美日韩视频在线第一区| 亚洲日本一区二区| 国产精品2024| 日韩午夜在线观看| 视频在线观看91| 欧美这里有精品| 伊人婷婷欧美激情| 99国产精品视频免费观看| 国产精品女人毛片| 国产精品自拍在线| 欧美mv日韩mv国产网站| 蜜臀精品一区二区三区在线观看 | 18成人在线视频| 国产精品一二三四| 2020国产精品自拍| 国产精品一区二区在线播放| 欧美一卡二卡在线| 强制捆绑调教一区二区| 欧美日韩电影一区| 免费成人在线影院| 日韩精品一区二区三区老鸭窝| 亚洲一区二区高清| 欧美精品v国产精品v日韩精品| 亚洲永久免费av| 欧美日韩一区不卡| 日韩在线a电影| 欧美一区三区二区| 九九久久精品视频| 欧美tk—视频vk| 成人午夜av在线| 亚洲欧美日韩在线播放| 在线观看国产一区二区| 午夜国产精品影院在线观看| 精品美女一区二区三区| 精品一区二区精品| 国产精品灌醉下药二区| 欧美天天综合网| 日本欧美加勒比视频| 久久精品夜色噜噜亚洲a∨| 成人激情免费网站| 亚洲一区二三区| 欧美日本在线观看| 国产盗摄一区二区| 亚洲日本成人在线观看| 9191成人精品久久| 精品一区二区成人精品| 亚洲天堂久久久久久久| 欧美日韩国产首页| 国产成人av资源| 三级不卡在线观看| 欧美极品美女视频| 欧美高清一级片在线| 成人精品小蝌蚪|