以文本方式查看主題 - 曙海教育集團(tuán)論壇 (http://www.xinguifushi.cn/bbs/index.asp) -- DSP2000技術(shù)討論 (http://www.xinguifushi.cn/bbs/list.asp?boardid=27) ---- DSP—數(shù)字化音頻領(lǐng)域的未來(lái) (http://www.xinguifushi.cn/bbs/dispbbs.asp?boardid=27&id=1575) |
||
-- 作者:wangxinxin -- 發(fā)布時(shí)間:2010-11-20 13:38:45 -- DSP—數(shù)字化音頻領(lǐng)域的未來(lái) 隨著數(shù)字信號(hào)處理技術(shù)的日益推進(jìn), IT領(lǐng)域的科技成果越來(lái)越普遍的應(yīng)用于視音頻領(lǐng)域并大大的推動(dòng)了視音頻科技的進(jìn)步,其中DSP(Digital Signal Processor即數(shù)字信號(hào)處理器)在音頻領(lǐng)域內(nèi)的應(yīng)用就是一個(gè)很好的例子。 DSP的優(yōu)勢(shì) 要了解DSP的優(yōu)勢(shì),就必須明白DSP與傳統(tǒng)微處理器在硬件基本架構(gòu)上的不同。 Von Neumann與Harvard基本架構(gòu) 所有的微處理器都是由幾個(gè)基本的模塊所組成:運(yùn)算器以完成數(shù)學(xué)運(yùn)算、存儲(chǔ)器和解碼器以完成類(lèi)比信號(hào)與數(shù)位信號(hào)間的轉(zhuǎn)換。在程序中,在每一周期必須告知微處理器要做些什么。因此微處理器必須從儲(chǔ)存程序的存儲(chǔ)體取得控制指令與一些數(shù)據(jù)而加以運(yùn)算。但是對(duì)于所有的微處理器并不是使用相同的方法,一般來(lái)說(shuō)可分成Von Neumann與Harvard二種基本架構(gòu),同時(shí)又有取其二者優(yōu)點(diǎn)而衍生出多種的混合改良架構(gòu),在增加存儲(chǔ)器與周邊裝置后,就成為能作為數(shù)字信號(hào)處理應(yīng)用的微處理控制器。 DSP的Modified Harvard架構(gòu) DSP是屬于Modified Harvard架構(gòu),即它具有兩條內(nèi)部總線,一個(gè)是數(shù)據(jù)總線,一個(gè)是程序總線;而傳統(tǒng)的微處理器內(nèi)部只有一條總線供數(shù)據(jù)傳輸與程序執(zhí)行使用; 從上面我們已經(jīng)看到Modified Harvard架構(gòu)在大量數(shù)學(xué)運(yùn)算方面有著強(qiáng)大的優(yōu)勢(shì),在DSP內(nèi)部具有硬件乘法器,大量的寄存器,目前最快的可在一個(gè)指令周期內(nèi)完成32bit乘32bit的指令,而傳統(tǒng)的微處理器運(yùn)算系以微代碼來(lái)執(zhí)行,遇到乘法運(yùn)算指令時(shí)就得消耗掉好幾個(gè)指令周期,加上傳統(tǒng)的微處理器中的寄存器較少,不得不經(jīng)常從外部?jī)?chǔ)存器傳輸數(shù)據(jù)來(lái)進(jìn)行運(yùn)算,而DSP指令具備重新執(zhí)行功能,因此在數(shù)學(xué)運(yùn)算速度超越一般傳統(tǒng)的微處理器。 DSP在音頻領(lǐng)域的應(yīng)用 由于不存在線形放大電路非理想傳輸函數(shù)所造成的失真缺點(diǎn),運(yùn)算速度又比傳統(tǒng)微處理器快,DSP已普遍應(yīng)用于視音頻領(lǐng)域的合成、辨識(shí)與編碼;由于對(duì)硬盤(pán)存儲(chǔ)容量的要求日益提高,使得對(duì)VCM(VOICE COIL MOTOR)的定位精度的要求也越來(lái)越嚴(yán)謹(jǐn),DSP IC已成為高容量硬盤(pán)機(jī)的核心元件;DSP還廣泛應(yīng)用在DAT、DLT等磁帶機(jī)上,用以控制轉(zhuǎn)速與磁頭讀寫(xiě)位置;應(yīng)用于全球定位系統(tǒng)(GPS)的接收機(jī)之相關(guān)器(CORRELATOR)上,提供計(jì)算衛(wèi)星所發(fā)射的射頻信號(hào)至接收器距離的功能。圖象處理的離散余弦變換(DCT)應(yīng)用;電視信號(hào)的抗多經(jīng)干擾(Ghost Cancellation) 。至于對(duì)模糊失真控制(Fuzzy Control)的大量浮點(diǎn)運(yùn)算,能達(dá)到即時(shí)要求,更是得心應(yīng)手。
主動(dòng)噪聲控制 傳統(tǒng)的被動(dòng)式隔音方法,單純以隔音材料阻隔噪聲,對(duì)中、低頻噪音源產(chǎn)生的噪聲幾乎無(wú)阻隔能力,因此必須以厚重的隔音材料方能產(chǎn)生效果。主動(dòng)噪聲控制是以電子閉回路控制的方法,產(chǎn)生和原始噪聲反相的聲音,以抵消原噪聲(如圖-1)。其優(yōu)點(diǎn)在于它對(duì)于抑制低頻噪聲極為有效。其應(yīng)用上的限制在于它無(wú)法控制中高頻段的噪聲(1.5K赫茲以上)
在通訊的各個(gè)環(huán)節(jié),都可能產(chǎn)生惱人的噪聲,其綜合的影響,便是降低通訊效率、成功率。主動(dòng)噪聲控制技術(shù)能在很多層面提高信噪比,且和傳統(tǒng)簡(jiǎn)單的濾波器相比,它能動(dòng)態(tài)地適應(yīng)各種狀況,過(guò)去濾波器所無(wú)法處理的不確定噪聲也可相當(dāng)程度地克服。 語(yǔ)音訊號(hào)處理 雖然目前許多資料已由數(shù)位編碼后,經(jīng)原有的語(yǔ)音通訊通道收發(fā)。但語(yǔ)音仍然穩(wěn)占所有通訊含量的第一位。對(duì)語(yǔ)音訊號(hào)的處理的需求,近年來(lái)呈現(xiàn)指數(shù)增長(zhǎng)。語(yǔ)音技術(shù)可分為如下四項(xiàng):語(yǔ)音增強(qiáng)(Speech Enhancement),語(yǔ)音辨識(shí)(Speech Recognition) ,語(yǔ)音編解碼(Speech Coding/Decoding),回聲抑制(Echo Suppression)。語(yǔ)音增強(qiáng) 圖-2
在信號(hào)處理上,針對(duì)應(yīng)用場(chǎng)合、背景噪聲特性、語(yǔ)音清晰度對(duì)可允許的語(yǔ)音失真的相對(duì)要求等 ,我們可制定不同的方案,以滿足任務(wù)需求。例如,語(yǔ)音識(shí)別軟體對(duì)語(yǔ)音信號(hào)的要求,就有別于人耳對(duì)語(yǔ)音信號(hào)的要求,因此,在完成通訊時(shí),和在完成語(yǔ)音識(shí)別任務(wù)時(shí),需使用不同的程序。針對(duì)不同任務(wù)研發(fā)機(jī)構(gòu)若不能對(duì)語(yǔ)音特性具備全面的了解與把握,是無(wú)法在這上面取得真正優(yōu)化的結(jié)果。 語(yǔ)音辨識(shí) 語(yǔ)音識(shí)別系統(tǒng)的核心,應(yīng)具有硬件要求少,自含時(shí)間矯正,和能量矯正的特點(diǎn)。目前已實(shí)際應(yīng)用的為小辭匯量(200字)系統(tǒng)的獨(dú)立語(yǔ)音識(shí)別,中辭匯量(1800字)的核心亦完成。在自動(dòng)語(yǔ)音識(shí)別的發(fā)展方向上,將集中於發(fā)展語(yǔ)音控制技術(shù),而非語(yǔ)音輸入技術(shù)。重點(diǎn)在于首次識(shí)別的準(zhǔn)確率,而非混合語(yǔ)意的輔助識(shí)別。 語(yǔ)音編、解碼 由于在DSP具有語(yǔ)音處理上的強(qiáng)大功能,因此才有可能在語(yǔ)音編碼的設(shè)計(jì)、使用上,偏重使用壓縮比較高的“編碼激勵(lì)線性預(yù)測(cè)”(CELP)型算法。目前使用的開(kāi)放標(biāo)準(zhǔn)為ITU的G.723.1,這種算法廣泛使用于IP的編解碼上,具有6.3Kbps和5.3Kbps兩種傳輸率,語(yǔ)音品質(zhì)高,抗噪聲能力和計(jì)算負(fù)荷適中。可提供用戶使用於各種平臺(tái)上。同時(shí),專(zhuān)屬的2.4Kbps的語(yǔ)音編碼算法也在開(kāi)發(fā)中,預(yù)計(jì)該算法將在語(yǔ)音品質(zhì)、抗噪聲能力、語(yǔ)音壓縮比、計(jì)算負(fù)荷、計(jì)算延時(shí)上取得更好的平衡。因以硬體性能不斷的提升,會(huì)適配較大的計(jì)算量的編碼方式,根據(jù)信息論的原理,若在不降低確定的信號(hào)指標(biāo)的條件下,如果采用高的壓縮比方式則必然相對(duì)的應(yīng)用大運(yùn)算量的編解碼方式,以在高壓縮比的情況下取得較好的音頻性能。 回聲抑制 在長(zhǎng)距離通訊及活動(dòng)通訊中,經(jīng)常會(huì)被回聲所困擾。無(wú)論是線性回聲,或是音響回聲,當(dāng)延時(shí)超過(guò)0.5秒 ,都會(huì)在接收端清晰的收到。針對(duì)這兩種現(xiàn)象,各有適用的回聲抑制算法。基于DSP的算法穩(wěn)定、簡(jiǎn)潔,不但抑制響應(yīng)速度快,而且對(duì)Double Talk、Near-End-Speech及靜音狀態(tài),皆能保持降噪性能。同時(shí)因?yàn)榫性回聲時(shí)間延遲可在1毫秒到900毫秒的大范圍內(nèi)變動(dòng),同樣有基于DSP專(zhuān)屬的算法來(lái)克服這種變異性對(duì)系統(tǒng)帶來(lái)的額外負(fù)荷(在傳統(tǒng)的回聲抑制系統(tǒng)中,300毫秒的延時(shí)意味者系統(tǒng)性能價(jià)格比的急劇劣化)。而這些算法的源代碼亦能應(yīng)用在各種通訊平臺(tái)上,解決長(zhǎng)程通訊各環(huán)節(jié)所產(chǎn)生的問(wèn)題。 音樂(lè)訊號(hào)處理 自從數(shù)字化的音樂(lè)規(guī)范開(kāi)始流行后,因數(shù)字信號(hào)處理所附帶的彈性因素,已在影音訊號(hào)的儲(chǔ)存 、傳送、播放上,產(chǎn)生了許多開(kāi)放規(guī)范和專(zhuān)屬規(guī)范。對(duì)使用者而言,它們帶來(lái)的效果,除了更耐久更廉價(jià)的儲(chǔ)存媒介、更多元化的接收管道外,也包括更絢麗的視聽(tīng)效果。但在終端獲得和原始影音信號(hào)源相當(dāng)?shù)挠耙粜Ч侥壳盀橹苟既匀皇前嘿F且不見(jiàn)得有效的。為了實(shí)現(xiàn)所謂的“環(huán)場(chǎng)音效”,目前已有諸如Dolby Surround、Dolby ProLogic、AC-3 、THX等各式開(kāi)放規(guī)范,也有商品化的解碼晶片。但整個(gè)環(huán)節(jié)中最弱的一環(huán),是在由揚(yáng)聲系統(tǒng)到人耳的這一段。這一段的傳遞函數(shù)因不同的聽(tīng)音者,不同的聽(tīng)音環(huán)境而隨機(jī)的改變,甚至差異極大。原始錄音工程師的心血,在這一段經(jīng)常被糟蹋無(wú)遺。而且和傳統(tǒng)音響系統(tǒng)相同,這個(gè)性能最不容易把握的環(huán)節(jié),往往也是投資昂貴的一個(gè)環(huán)節(jié)。 且以DSP動(dòng)態(tài)的 補(bǔ)償聲場(chǎng)的變異,基本上可以做到使用一個(gè)低成本基于DSP技術(shù)的系統(tǒng)去替代昂貴的非DSP的高檔系統(tǒng),完整還原原始錄音效果。(如圖-3) DSP以其強(qiáng)大的運(yùn)算能力及優(yōu)良的性能價(jià)格比已經(jīng)成為越來(lái)越多的數(shù)字化視音頻設(shè)備的核心構(gòu)件,隨著科技的進(jìn)步,DSP技術(shù)的日益完善,相信DSP的未來(lái)就是數(shù)字化音頻領(lǐng)域的未來(lái)。 |