取樣頻率與載波比較

第五章基於濾波器組的聽損模型

5.3 取樣頻率與載波比較

圖 48 混合模型流程圖

在我們的模型發展過程中，因為是由 Moore 的模型加以延伸得來的，因此一開始設計的取樣頻率是 16KHz，然而我們使用的濾波器組會依據取樣頻率的不同，而有不同的中心頻率與頻帶，因此我們在本節中會針對取樣頻率的不同加以比較；除此之外，雖然利用白高斯雜訊來產生載波，可以避免因為保留原訊號載波，而造成聽損程度減小的現象，然而可能造成的問題是計算複雜度變高，也可能使得合成的訊號品質較不好，因此我們也將幾種方法實作比較之。

5.3.1 取樣頻率比較

當取樣頻率為 16KHz 時，我們使用的聽覺濾波器組的第一個濾波器的中心頻率約為 190Hz，也就是說太低的頻率成份會被濾掉；這樣子的濾波器組在處理男性的聲音訊號的時候，可能會有基頻消失的現象，因為我們重建聲音訊號時是以 128 個濾波器組的能量乘上其載波之後合成；基頻被濾掉的現象會影響聲音訊號語調的高低起伏，使得聲音聽起來比較像機械音。

如圖 49 所示，左圖是原來的聲音訊號聲譜圖，原始音檔的取樣頻率為 8KHz，在此我們將之升頻為 16KHz，在畫圖的時候為了看得較為仔細，因此只畫出 0~4KHz 範圍的圖；

而右圖則是將頻譜模糊化 3 倍後的結果。從圖上我們可以清楚的發現，左圖中語音的基頻，

在右圖中完全看不到了，實際聽過後的確會有機械音的現象。

圖 49 16KHz 取樣環境下，聽損模型的失真現象

因此我們將取樣頻率修改為 8KHz，如此一來第一個濾波器的中心頻率大約為 85Hz，

落在一般男性的基頻範圍中，因此我們期望在 8KHz 取樣頻率的發展環境下，可以得到較佳的語音品質，如圖 50 所示：圖 50 與圖 49 除了取樣頻率不同之外，其餘的條件均相同，

我們可以發現語音的基頻並沒有消失，而且實際比較圖 49（右）與圖 50（右）的聲音之後，可以明顯發現圖 50（右）的聲音的抑揚頓挫較為明顯，因此我們認為使用 8KHz 的取樣在我們的濾波器組下，來進行聽損現象的模型是較為合適的。

5.3.2 載波比較

將白高斯雜訊濾波過後取出載波的做法，可能會造成的影響是計算複雜度變高，以及使得合成的語音品質較差，因此我們分別實驗以下兩個產生載波的方法，並比較其與原來的方法的語音品質。

 為了避免濾波的過程，我們用以濾波器中心頻率為頻率的單頻弦波，搭配一個隨機相位，來做為這個濾波器的載波；這樣子的做法產生的聲譜圖和原先做法的聲譜圖幾乎相同，然而仔細聽聲音後會發現這樣子合成出的聲音會有單音的成份在，因此語音品質是較為不佳的。

 在過去發展聽覺模型的研究中，以迭代方代尋找相位的演算法曾被提出〔53〕，此演算法的優點是我們只要有每一個濾波器的能量，就可以用迭代的方式來找到對應的相

圖 50 8KHz 取樣頻率下，聽損模型的失真現象

位；我們比較用此演算法實作出來的結果、與 5.2 節提出來的方法之後，發現以原來提出的方法合成出來的聲音，聽起來有些破破的，好像有磨喉嚨的感覺，相較之下以迭代方式得到的結果較佳，不過從辨識度的角度來看，兩者幾乎是相同的。

5.4 實驗設計與結果分析

在文檔中有關響度與分頻解析度之聽損耳蝸模型的建立 (頁 69-72)

第五章 基於濾波器組的聽損模型

5.3 取樣頻率與載波比較

5.3.1 取樣頻率比較

5.3.2 載波比較

第五章基於濾波器組的聽損模型