• 沒有找到結果。

第三章 聽損耳蝸模型

3.1 頻譜模糊化模型

在〔14〕中,Baer 假設「聲音的激發模式是由不同單音的激發模式線性相加而成」,

在這樣的基礎之上,將聲音與基底膜的關係矩陣化,並利用反矩陣的關係,將正常人耳的 濾波效果一併考慮進去,最後結合 STFT 演算法,得到模擬聽障患者分頻解析度降低,也 就是頻譜模糊化的模型,系統架構圖如圖 21。

圖 21 頻譜模糊化演算法流程圖解 資料來源:〔14〕

首先作者將聲音訊號適當的框架化後,做傅利葉轉換得到頻率成份,並以聽覺濾波器 濾波器組與受損聽覺濾波器組的模型。許多學者利用 notch-noise test 來測量聽覺濾波器的 形狀〔28〕,而 Moore 則利用 roex filter(rounded-exponential filter)來模擬聽覺濾波器組

〔43-44〕,其數學形式如下:

( )

其中 fC為中心頻率、g 為目標頻率相對於該頻帶中心頻率正規化後的差值,W(g)為此濾波 器在特定 g 值的增益,而 p 則為控制濾波器寬窄的係數。

一般而言,在某一頻帶下,頻率與增益的關係若以 g-dB 的單位來表示的話,當 g 值 介於 0.5 到 3 之間,w 函數為近乎直線;而在 roex filter 的模型中,-p 就是這條直線的斜率,

也就大致上決定了這個濾波器的寬窄。正常人的 p 值求法是根據在一般大小聲之下,聽覺 濾波器是左右對稱的,因此 roex filter 的等效矩形頻寬(equivalent rectangular bandwidth;

ERB)為:

器組的想法來看,這種作法的重疊程度太高,而且是頻率間隔固定的,因此平滑化的 參數可能與實際聽損患者聽覺濾波器變寬的程度有落差。

 作者假設每一個頻率成份的激發模式是線性相加的,然而許多生物實驗証明並非如此,

相鄰的複音彼此會有非常密切的非線性關係,例如第二章提到的遮蔽效應就是一個最 直接的例子;也就是說這樣子的聽覺模型只是非常粗略的版本,若是想要更準確模擬 人的聽覺現象,則需要經過更詳細的測量才行。

 在圖 21 中,因為保留原訊號相位頻譜的關係,使得經過處理的訊號,若再次經過 FFT 的分析,能量頻譜會與我們原先設計的有落差,我們可以解釋為:原訊號的相位頻譜 保留了原始頻譜的結構,而我們的演算法只有針對訊號能量頻譜做修改,並沒有將 FFT 所需要的所有資訊—能量、相位—都包含在演算法之中,因此不完整的頻譜經過 IFFT 之後得到的時間訊號,已經與我們設計的不一樣了。

Baer 在〔14〕中針對此現象舉例如圖 22:

圖 22 母音/æ/的連續框架訊號模糊化前後比較圖 資料來源:〔14〕

左邊欄代表原訊號能量頻譜、中間欄代表模糊化 3 倍後的能量頻譜、而右邊欄則是經 過 OLA 之後再次做 FFT 的能量頻譜;從這三欄中我們可以發現,雖然右邊欄與中間 欄較為類似,然而右邊欄還是可以看到左邊欄中母音的頻譜結構;Baer 計算右邊欄的 能量頻譜與不同程度的模糊化能量頻譜的最小平方差,發現右邊欄相當於只有模糊化 1.5 倍的結果,與其原先設計的 3 倍有很大的落差。

3.1.4 相位頻譜補償

保留原相位頻譜是一般在聲音訊號經過 STFT 處理時常常用的方式,然而因為以上的 缺點,因此 Griffin 與 Lim 在 1984 年提出了最小平方重疊相加,在此基礎上發展了

LSEE-MSTFTM 演算法:不斷的將能量頻譜取代成我們第一次平滑化後的能量頻譜,並搭 配原來的相位頻譜,來解決相位頻譜的問題,過程如下:

作者並證明此演算法是收歛的,以圖 24 簡略說明之。在每一次的迭代中,我們將能量頻 譜修正為我們所期望的值(a),然而因為不知道理想頻譜的相位頻譜,因此只能保留原訊

圖 23 LSEE-MSTFTM 演算法 資料來源:〔22〕

號相位頻譜;再經過重疊相加後,會造成能量頻譜的偏離(b);因此透過不斷迭代的方式 來修正能量頻譜的誤差(abc…),一般來說只需要 20~50 次迭代就可以收歛得很好。

將 LSEE-MSTFTM 演算法與 Baer 的模糊化模型結合後比較如圖 25:(a)是原訊號的 聲譜圖;(b)則是我們期望的,頻譜模糊化 6 倍之後的訊號的聲譜圖;(c)是 Baer 的演算 法得到的結果。我們可以發現,雖然(c)的能量有散開,但是(a)的聲譜結構被很完整 的保留在(c)中,與我們期望的結果落差很大;(d)則是結合了 LSEE-MSTFTM 演算法,

並經過 100 次迭代的結果,與(b)比較後可以發現兩者的相差已經非常小了。

圖 24 LSEE-MSTFTM 演算法中連續迭代的變化 資料來源:〔22〕

圖 26 則是在迭代的過程中,聲譜圖的最小平方差的變化,由圖可以清楚發現,最小平方 差確實會收歛;此外,迭代大約 50 次之後,最小平方差幾乎不再變動了。

3.1.5 相位頻譜補償延伸

雖然 LSEE-MSTFTM 可以解決相位頻譜的問題,然而若是要用在即時系統上的話,則 需要強大的硬體配備,來平行處理每一次的迭代,因此我們詴著發展出一步就能得到等同 於 LSEE-MSTFM 效果的演算法。

我們將經過 LSEE-MSTFTM 後的訊號當作是目標訊號,並假設原始訊號經過一個矩陣 圖 25 結合 LSEE-MSTFTM 與 Baer 演算法的比較

圖 26 最小平方差變化圖

乘法後可以得到此目標訊號,如此一來便有希望以最小平方法來解決此問題,不但可以降

相關文件