技術(shù)引領(lǐng)未來,守護美好生活
下面兩段音軌,左邊的是在消聲室中錄制的直達(dá)聲信號,沒有混響;右邊模擬房間環(huán)境處理后得到的有混響的信號;混響聲聽起來像是無混響聲的延續(xù)和拖尾。
混響時間是度量房間內(nèi)混響程度的基本指標(biāo)之一。混響時間用來描述房間內(nèi)聲音衰減快慢的程度。它的定義為:聲源停止后聲音在房間內(nèi)較初始聲壓級衰減60dB所經(jīng)過的時間,一般用T60表示。計算混響時間有一個有名的公式,叫“塞賓公式”,定義如下:
其中,V為房間體積,S為房間的表面積,為平均吸聲系數(shù)。一般的,房間越大,室內(nèi)越空曠,混響時間會越長。因此,像銀行營業(yè)大廳、金庫,這種空間較大、壁面光滑的空間里,混響時間明顯較長。
混響影響拾音音質(zhì)和語音識別率,因此需要從拾音信號中去除混響聲,這種技術(shù)就是去混響技術(shù)。一般去混響主要有三種技術(shù):第一種方法,麥克風(fēng)拾取的信號可以看作聲源信號與房間沖擊響應(yīng)的卷積生成的信號,通過這種數(shù)學(xué)模型來消除混響,在估計房間聲學(xué)模型參數(shù)之后,形成對原始信號的估計。第二種方法,通過將混響視為一種噪聲,通過適用于混響的降噪過程來抑制混響,事實上,一般的語音降噪算法都具有一定的去混響效果;第三種方法,采用深度學(xué)習(xí)的方法去混響,經(jīng)過神經(jīng)網(wǎng)絡(luò)后,得到頻域的濾波系數(shù)?;祉懶盘柦?jīng)過濾波后,輸出去混響信號。這樣的網(wǎng)絡(luò)經(jīng)過大量數(shù)據(jù)訓(xùn)練后,用于去混響處理,就能得到較清晰的信號。
上圖為混響產(chǎn)生與去混響的過程模型,為語音信號,經(jīng)過房間響應(yīng)卷積后,形成混響信號,加上引入的房間噪聲或其他噪聲,形成麥克風(fēng)處拾取的信號。信號經(jīng)過濾波器后,獲得去混響的信號。‘理想情況下,和關(guān)系如下:
多通道去混響技術(shù),采用麥克風(fēng)陣列(多個麥克風(fēng)),可以較為準(zhǔn)確的預(yù)測房間的沖激響應(yīng),從而估計逆濾波器,經(jīng)逆濾波后形成去混響的信號;
下圖左邊為去混響前的信號,右圖為去混響后的信號
引用:
全國統(tǒng)一服務(wù)熱線