VoIP技術(shù)之回聲消除技術(shù)

責(zé)任編輯:editor02

2013-06-25 06:46:18

摘自:云通訊平臺(tái)

“在PBX或局用交換機(jī)側(cè),有少量電能未被充分轉(zhuǎn)換而且沿原路返回,形成回聲。盡管電路回聲產(chǎn)生于PSTN中,但同樣會(huì)傳至于IP電話網(wǎng)關(guān),是因特網(wǎng)語(yǔ)音傳輸中的回聲源之一

“在PBX或局用交換機(jī)側(cè),有少量電能未被充分轉(zhuǎn)換而且沿原路返回,形成回聲。如果打電話者離PBX或交換機(jī)不遠(yuǎn),回聲返回很快,人耳聽(tīng)不出來(lái),這種情況下無(wú)關(guān)緊要。但是當(dāng)回聲返回時(shí)間超過(guò)10ms時(shí),人耳就可聽(tīng)到明顯的回聲了。為了防止回聲,一般需要回聲消除技術(shù),在處理器中有特殊的軟件代碼監(jiān)聽(tīng)回聲信號(hào),并將它從聽(tīng)話人的語(yǔ)音信號(hào)中消除。對(duì)于IP電話設(shè)備,回聲消除技術(shù)是十分重要的,因?yàn)橐话鉏P網(wǎng)絡(luò)的時(shí)延很容易就達(dá)到40~50ms。 ”

一、 因特網(wǎng)語(yǔ)音通信中回聲的特點(diǎn)

傳統(tǒng)電話相比,因特網(wǎng)上進(jìn)行語(yǔ)音的實(shí)時(shí)傳輸,有其致命的弱點(diǎn),那就是語(yǔ)音質(zhì)量較差,影響因特網(wǎng)語(yǔ)音質(zhì)量的因素是多方面的,最關(guān)鍵的因素之一是回聲的影響。因此,要提高因特網(wǎng)的語(yǔ)音質(zhì)量,就必須在因特網(wǎng)的語(yǔ)音傳輸過(guò)程中進(jìn)行消回聲的處理,也就是說(shuō),IP電話網(wǎng)關(guān)作為因特網(wǎng)的語(yǔ)音接入設(shè)備,幾須具有回聲的消除功能。由于因特網(wǎng)的語(yǔ)音傳輸是采用分組交換技術(shù)實(shí)現(xiàn)的一種全新的電信業(yè)務(wù),傳送的語(yǔ)音信號(hào)要經(jīng)過(guò)編碼、壓縮、打包等一系列處理,這不僅造成回聲路徑的延遲較大,而且延遲抖動(dòng)也較大。因此,在因特網(wǎng)的語(yǔ)音傳輸過(guò)程中,回聲問(wèn)題顯得尤其突出,并具有如下特點(diǎn)。

1、 回聲源復(fù)雜

系統(tǒng)中存在2-4線的轉(zhuǎn)換。完成2-4轉(zhuǎn)換的混合器因阻抗匹配,造成"泄漏",從而導(dǎo)致了"電路回聲"。從因特網(wǎng)IP電話網(wǎng)關(guān)的連接方式可以看出,IP電話網(wǎng)關(guān)一端連接PSTN,另一端連接因特網(wǎng)。

盡管電路回聲產(chǎn)生于PSTN中,但同樣會(huì)傳至于IP電話網(wǎng)關(guān),是因特網(wǎng)語(yǔ)音傳輸中的回聲源之一,因特網(wǎng)語(yǔ)音傳輸中的第二種回聲源是所謂的"聲學(xué)回聲"。聲學(xué)回聲是指揚(yáng)聲器播放出來(lái)的聲音被麥克風(fēng)拾取后發(fā)回遠(yuǎn)端,這就使得遠(yuǎn)端談話者能聽(tīng)到自己的聲音。聲學(xué)回聲又分為直接回聲和間接回聲。直接回聲是指揚(yáng)聲器播放出來(lái)的聲音未經(jīng)任何反射直接進(jìn)入麥克風(fēng)。這種回聲延遲最短,它與遠(yuǎn)端說(shuō)話者的語(yǔ)音能量,揚(yáng)聲器與話筒之間的距離、角度、揚(yáng)聲器的播放音量以及話筒的拾取靈敏度等因素相關(guān)。間接回聲是指揚(yáng)聲器播放的聲音經(jīng)不同的路徑一次或多次反射后進(jìn)入麥克風(fēng)所產(chǎn)生的回聲集合。因?yàn)橹車矬w的變動(dòng),例如人的走動(dòng)等,都會(huì)改變回聲的返回路徑,因?yàn)檫@種回聲的特點(diǎn)是多路徑、時(shí)變的。另外,背景噪聲也是產(chǎn)生回聲的因素之一。

2、 回聲路徑的延遲大

在因特網(wǎng)中的語(yǔ)音傳輸中,延遲來(lái)源有三種:壓縮延遲、分組傳輸延遲和處理延遲。語(yǔ)音壓縮延遲是產(chǎn)生回聲的主要延遲,例如在G.723.1標(biāo)準(zhǔn)中,壓縮一幀(30ms)的最大延遲是37.5ms。分組傳輸延遲也是一個(gè)很重要的來(lái)源,測(cè)試表明,端到端的最大傳輸延遲可達(dá)250ms以上。處理延遲是指語(yǔ)音包的封裝時(shí)延及其緩沖時(shí)延等。

3、 回聲路徑的延遲抖動(dòng)大

在因特網(wǎng)的語(yǔ)音傳輸過(guò)程中,由于回聲路徑、語(yǔ)音壓縮時(shí)延、分組傳輸路由等存在諸多不確定因素,而且波動(dòng)范圍較大,一般在20~50ms之間。

二、 聲學(xué)回聲消除器的結(jié)構(gòu)和相關(guān)算法

隨著消回聲技術(shù)的發(fā)展,當(dāng)前回聲消除研究的重點(diǎn),已由"電路回聲"的消除,轉(zhuǎn)向了"聲學(xué)回聲"。

(1) 周圍環(huán)境的處理

分析聲學(xué)回聲的產(chǎn)生的機(jī)理,可以知道:聲學(xué)回聲最簡(jiǎn)單的控制方法是改善揚(yáng)聲器的周圍環(huán)境,盡量減少揚(yáng)聲器播放聲音的反射。例如,可以在周圍的墻壁上附加一層吸音材料,或增加一層襯墊以增加散射,理想的周圍環(huán)境是其回響時(shí)間或RT-60(聲音衰減60dB所需要的時(shí)間)在300ms~600ms之間。因?yàn)檫@樣的環(huán)境一方面可以控制反射,又可以不會(huì)使講話者感到不適。改善環(huán)境可以有效地抑制間接聲學(xué)回聲,但對(duì)直接聲學(xué)回聲卻無(wú)能為力。

(2)回聲抑制器 回聲抑制器是使用較早的一種回聲控制方法?;芈曇种破魇且环N非線性的回聲消除。它通過(guò)簡(jiǎn)單的比較器將接收到準(zhǔn)備由揚(yáng)聲器播放的聲音與當(dāng)前話筒拾取的聲音的電平進(jìn)行比較。如果前者高于某個(gè)閾值,那么就允許傳至揚(yáng)聲器,而且話筒被關(guān)閉,以阻止它拾取揚(yáng)聲器播放的聲音而引起遠(yuǎn)端回聲。如果話筒拾取的聲音電平高于某全閾值,揚(yáng)聲器被禁止,以達(dá)到消除回聲的目的。 由于回聲抑制是一種非線性的回聲控制方法,會(huì)引起揚(yáng)聲器播放的不連續(xù)。影響回聲消除的效果,隨著高性能的回聲消除器的出現(xiàn),回聲抑制器已很少人使用了。

(3)聲學(xué)回聲消除器 聲學(xué)回聲消除的另一方法是使用聲學(xué)回聲消除器(AEC:Acoustic Echo Chancellor),AEC是對(duì)揚(yáng)聲器信號(hào)與由它產(chǎn)生的多路徑回聲的相關(guān)性為基礎(chǔ),建立遠(yuǎn)端信號(hào)的語(yǔ)音模型,利用它對(duì)回聲進(jìn)行估計(jì),并不斷地修改濾波器的系數(shù),使得估計(jì)值更加逼近真實(shí)的回聲。然后,將回聲估計(jì)值從話筒的輸入信號(hào)中減去,從而達(dá)到消除回聲的目的,AEC還將話筒的輸入與揚(yáng)聲器過(guò)去的值相比較,從而消除延長(zhǎng)延遲的多次反射的聲學(xué)回聲。根椐存儲(chǔ)器存放的過(guò)去的揚(yáng)聲器的輸出值的多少,AEC可以消除各種延遲的回聲。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)