• 沒有找到結果。

多頻帶頻率壓縮演算法

第四章 分頻解析度補償

4.1 多頻帶頻率壓縮演算法

多頻帶頻率壓縮演算法的主要想法如圖 33:

從緒論中我們知道,分頻解析度降低的現象,從工程的角度來看,就是人耳相對應的聽覺 濾波器變寬了,如圖 33 中所示,如此一來造成的影響是,原本不屬於此頻帶的聲音也會 被算進來,使得聲音變得較為吵雜,並且分不清楚語音的音高。

因此,我們將原本屬於該頻帶的能量,以某種演算法,將其往此頻帶的中心頻率集中,

如圖 33 右,這麼做的效果是集中能量成份,同時減少干擾成份。當處理過後的聲音經過 聽障患者較寬的聽覺濾波器之後,即使因為濾波器較寬,然而因為我們將頻率成份集中,

圖 33 多頻帶頻率壓縮演算法的主要想法 資料來源:〔50〕

加上原本屬於其它頻帶的能量成份也往其它頻帶的中心頻率集中,因此在該頻帶內成份一 消一長之下,主要成份被遮蔽的機會就變小了。

4.1.2 壓縮方式比較

Kulkarni 與 Pandey 在 2008 年,以分頻帶頻率壓縮的想法,提出了「頻率區段對應」

的演算法,並與其它兩種演算法做比較,以下分別介紹之。

1. 點對點對應(sample to sample mapping)

對應關係如下:

( )

其中 k 為 FFT 的第 k 個頻率成份、kic為第 k 個頻率成份所屬的濾波器的中心頻率相對應的 頻率標記、 為頻率壓縮的程度(介於 0、1 之間)、k‘為第 k 個頻率成份經壓縮後得到的 新的頻率標記、而 kic、kie則為該頻帶最低頻與最高頻的頻率標記,實際例子如圖 34:

在此方法中,若是有兩個以上的頻率成份對應到同一個頻率標記時,則只會有一個頻率成 份被保留下來,因此可能會有部份頻率成份遺失的問題,訊號的總能量也隨著減少。

圖 34 點對點對應示意圖 資料來源:〔23〕

2. 頻率線性相加(Superimposition of spectral samples)

為了解決上一個演算法的問題,因此經由點對點對應演算法而得到頻率線性相加演算 法,如圖 35:

簡單來說就是把對應後屬於同一個頻率標記的頻率成份加總在一起,如此一來就可以讓總 能量維持不變;可是在這些頻率標記與相鄰的頻率標記上會有一些不規則的變化。

3. 頻率區段對應(Spectral segment mapping)

此一方法是以連續頻譜的觀念,將原訊號頻率與所屬頻帶中心頻率的間距壓縮後,再 累加到新頻譜的整數標記。公式與圖解(圖 36)如下:

( )

( ) 圖 35 頻率線性相加示意圖

資料來源:〔23〕

在計算時我們從k‘出發,對於每一個頻率標記,我們假設上下各 0.5 單位範圍內的能量都 屬於該頻率標記,並計算該範圍的下界對應到原頻率的範圍(a 值),而 m 就是在該範圍內 的第一個標記,接著依照壓縮比例的不同,計算上界(b 值),將在這個範圍內的值累加在 新頻譜的同一個標記上。由於此方法引入了平滑化的參數(m-a、b-n),因此讓相鄰頻譜較 為圓滑,可以解決線性相加演算法中的缺點。

從以上比較中得知頻率區段對應演算法有較佳的表現〔23〕,因此將之與傳統的 STFT 演算法(保留原相位頻譜,只對能量頻譜做修改)結合,並選取適當的框架長度與 FFT 點 數,作為完整的訊號處理流程。

4.1.3 演算法分析與討論

實作此演算法後,與原作者的實驗結果〔24〕相結合,分析得到以下幾個優缺點。優 點部份,作者將訊號給真正的聽損患者聽,並將數據做進一步的統計分析,發現對於大部 份的聽損患者來說,在壓縮頻率為 0.6 左右時,語音的辨識率都有明顯的提升,而對於少 部份的患者來說會有反效果或是沒有效果;這些不明顯的效果可能是因為這些患者有分頻 解析度降低之外的其它因素所造成,因此,大體來說,這個演算法的確可以部份改善分頻 解析度降低的問題。

然而缺點部份如下:

圖 36 頻率區段對應示意圖 資料來源:〔23〕

 因為保留原相位頻譜的關係,一樣會使得能量頻譜偏移我們一開始所設計的,因此可

參考 Kulkarni 與 Pandey「頻率區段對應」的演算法,在「分頻帶頻率壓縮」的架構之 下,我們提出新的演算法,針對上陎提到的缺點中的第二點—頻率壓縮演算法對於鄰近頻

相關文件