• 沒有找到結果。

聽覺濾波器組(auditory filter bank)

第二章 感知訊號處理基礎

2.3 濾波器組的選擇

2.3.2 聽覺濾波器組(auditory filter bank)

最常被用於模擬人耳的濾波器組是 Gammatone filter〔35-36〕,此濾波器組的小波函數 為 cosine exponential 函數;然而因為 Gammatone filter 是左右對稱的,而人耳的濾波器組 在某些情形之下會不對稱,因此延伸出 Gammachirp filter〔37〕;該濾波器組的特性是當訊 號能量不同的時候,濾波器的對稱性會隨之改變,而這樣子的特性也較為符合生理實驗的

圖 18 以遞迴濾波器組分割頻譜 資料來源:〔32〕

結果。

在我們的實驗中,使用的濾波器組是〔38〕中人耳聽覺模型中使用的濾波器組,一共 有 128 個濾波器(原本有 129 個,但因為模擬了遮蔽效應的結果,因此前後交互作用的結 果只有 128 個輸出)。以 128 個濾波器取代 18 個濾波器的原因,是因為從生物實驗的結果 來說,大約只需以 18 個濾波器包含所有頻譜,就可以解釋這些現象;然而若是要針對這 些經過濾波的副頻帶訊號(sub-band signal)做更進一步的處理及分析,從工程學的角度,

則需要較高的解析度才行。

〔38〕中的濾波器組,將聲音從耳廓收集開始,一直到內耳聽覺細胞的接收,都做了 非常詳細的模擬;在本論文中,我們僅應用了其中與遮蔽效應相關的觀念以及實作上的延 遲補償,以下將分別說明之。

1. 遮蔽效應(masking effect)

我們假設原始的 129 個濾波器是沒有遮蔽效應的(圖 19)。為了得到有遮蔽效應的濾 波器組,基於前陎章節所探討到的現象—低頻訊號較容易遮蔽高頻的訊號—我們僅考慮單 邊的遮蔽效應;在求出 129 個濾波器組的頻率響應之後,將前一個頻帶與後一個頻帶的頻 率響應兩兩相減,得到包含遮蔽效應的 128 個濾波器(圖 20)。

圖 19 129 個不包含遮蔽效應的濾波器的平方頻率響應及總和

雖然我們可以直接將前後兩個較寬的濾波器的輸出相減得到想要的訊號,然而因為之 後必頇要做延遲補償的動作,因此在這邊我們還是要求得濾波器的係數才行;在此我們將 頻率響應直接做 2048 點的反傅利葉轉換,得到一個 FIR 的濾波器,作為窄濾波器的脈衝 響應。

2. 延遲補償(delay compensation)

因為每一個濾波器的延遲時間都不同,因此當我們要把這些副頻帶訊號加總回來的時 候,必頇先把延遲時間補回來。最簡單的做法是量測該濾波器的延遲時間為幾個取樣點,

再把所有副頻帶延遲到相同的延遲時間後相加;然而因為每一個頻帶包含了很多的頻率,

每一個頻率可能都有自己的延遲,並不一定相等,因此這樣子的想法是無法實現的。

Kubin 與 Kleijn 在 1999 年的論文中〔39〕,提出「將分析濾波器組的脈衝響應在時間 軸上反轉過來,做為合成濾波器組的脈衝響應」;在撰寫程式的時候,我們可以將濾波後 的聲音訊號整段反轉過來,再經過同樣的濾波器一次,並將輸出的結果反轉回來,如此一 來我們可以得到零延遲的訊號,而其造成的影響僅僅只是被濾波兩次而已,在不需即時性 的應用裡,是很好的一個方法,在 matlab 中可以使用 filtfilt 執行這個功能。

圖 20 128 個包含遮蔽效應的濾波器的平方頻率響應及總和

最後我們必頇考慮的是所有濾波器的頻譜響應總和是否為常數?因為延遲補償的關 係,在這裡我們要注意的是頻譜響應的平方總和是否為常數;從圖 19、20 中可以發現,

在 16KHz 的取樣頻率之下,除了最低頻與 7KHz 以上的頻率成份之外,大部份的頻率響應 的波動都很小,可以視為定值,因此也確認了我們使用的濾波器是正確的;接下來就可以 在濾波器的架構之下,進行最重要的訊號處理了。

相關文件