多頻帶頻率壓縮演算法

第四章分頻解析度補償

4.1 多頻帶頻率壓縮演算法

多頻帶頻率壓縮演算法的主要想法如圖 33：

從緒論中我們知道，分頻解析度降低的現象，從工程的角度來看，就是人耳相對應的聽覺濾波器變寬了，如圖 33 中所示，如此一來造成的影響是，原本不屬於此頻帶的聲音也會被算進來，使得聲音變得較為吵雜，並且分不清楚語音的音高。

因此，我們將原本屬於該頻帶的能量，以某種演算法，將其往此頻帶的中心頻率集中，

如圖 33 右，這麼做的效果是集中能量成份，同時減少干擾成份。當處理過後的聲音經過聽障患者較寬的聽覺濾波器之後，即使因為濾波器較寬，然而因為我們將頻率成份集中，

圖 33 多頻帶頻率壓縮演算法的主要想法資料來源：〔50〕

加上原本屬於其它頻帶的能量成份也往其它頻帶的中心頻率集中，因此在該頻帶內成份一消一長之下，主要成份被遮蔽的機會就變小了。

4.1.2 壓縮方式比較

Kulkarni 與 Pandey 在 2008 年，以分頻帶頻率壓縮的想法，提出了「頻率區段對應」

的演算法，並與其它兩種演算法做比較，以下分別介紹之。

1. 點對點對應（sample to sample mapping）

對應關係如下：

（）

其中 k 為 FFT 的第 k 個頻率成份、k_ic為第 k 個頻率成份所屬的濾波器的中心頻率相對應的頻率標記、為頻率壓縮的程度（介於 0、1 之間）、k‘為第 k 個頻率成份經壓縮後得到的新的頻率標記、而 kic、kie則為該頻帶最低頻與最高頻的頻率標記，實際例子如圖 34：

在此方法中，若是有兩個以上的頻率成份對應到同一個頻率標記時，則只會有一個頻率成份被保留下來，因此可能會有部份頻率成份遺失的問題，訊號的總能量也隨著減少。

圖 34 點對點對應示意圖資料來源：〔23〕

2. 頻率線性相加（Superimposition of spectral samples）

為了解決上一個演算法的問題，因此經由點對點對應演算法而得到頻率線性相加演算法，如圖 35：

簡單來說就是把對應後屬於同一個頻率標記的頻率成份加總在一起，如此一來就可以讓總能量維持不變；可是在這些頻率標記與相鄰的頻率標記上會有一些不規則的變化。

3. 頻率區段對應（Spectral segment mapping）

此一方法是以連續頻譜的觀念，將原訊號頻率與所屬頻帶中心頻率的間距壓縮後，再累加到新頻譜的整數標記。公式與圖解（圖 36）如下：

（）

（）圖 35 頻率線性相加示意圖

資料來源：〔23〕

在計算時我們從k‘出發，對於每一個頻率標記，我們假設上下各 0.5 單位範圍內的能量都屬於該頻率標記，並計算該範圍的下界對應到原頻率的範圍（a 值），而 m 就是在該範圍內的第一個標記，接著依照壓縮比例的不同，計算上界（b 值），將在這個範圍內的值累加在新頻譜的同一個標記上。由於此方法引入了平滑化的參數（m-a、b-n），因此讓相鄰頻譜較為圓滑，可以解決線性相加演算法中的缺點。

從以上比較中得知頻率區段對應演算法有較佳的表現〔23〕，因此將之與傳統的 STFT 演算法（保留原相位頻譜，只對能量頻譜做修改）結合，並選取適當的框架長度與 FFT 點數，作為完整的訊號處理流程。

4.1.3 演算法分析與討論

實作此演算法後，與原作者的實驗結果〔24〕相結合，分析得到以下幾個優缺點。優點部份，作者將訊號給真正的聽損患者聽，並將數據做進一步的統計分析，發現對於大部份的聽損患者來說，在壓縮頻率為 0.6 左右時，語音的辨識率都有明顯的提升，而對於少部份的患者來說會有反效果或是沒有效果；這些不明顯的效果可能是因為這些患者有分頻解析度降低之外的其它因素所造成，因此，大體來說，這個演算法的確可以部份改善分頻解析度降低的問題。

然而缺點部份如下：

圖 36 頻率區段對應示意圖資料來源：〔23〕

 因為保留原相位頻譜的關係，一樣會使得能量頻譜偏移我們一開始所設計的，因此可

參考 Kulkarni 與 Pandey「頻率區段對應」的演算法，在「分頻帶頻率壓縮」的架構之下，我們提出新的演算法，針對上陎提到的缺點中的第二點—頻率壓縮演算法對於鄰近頻

在文檔中有關響度與分頻解析度之聽損耳蝸模型的建立 (頁 50-54)

第四章 分頻解析度補償

4.1 多頻帶頻率壓縮演算法

4.1.2 壓縮方式比較

4.1.3 演算法分析與討論

第四章分頻解析度補償