• 沒有找到結果。

第五章 基於濾波器組的聽損模型

5.3 取樣頻率與載波比較

圖 48 混合模型流程圖

在我們的模型發展過程中,因為是由 Moore 的模型加以延伸得來的,因此一開始設計 的取樣頻率是 16KHz,然而我們使用的濾波器組會依據取樣頻率的不同,而有不同的中心 頻率與頻帶,因此我們在本節中會針對取樣頻率的不同加以比較;除此之外,雖然利用白 高斯雜訊來產生載波,可以避免因為保留原訊號載波,而造成聽損程度減小的現象,然而 可能造成的問題是計算複雜度變高,也可能使得合成的訊號品質較不好,因此我們也將幾 種方法實作比較之。

5.3.1 取樣頻率比較

當取樣頻率為 16KHz 時,我們使用的聽覺濾波器組的第一個濾波器的中心頻率約為 190Hz,也就是說太低的頻率成份會被濾掉;這樣子的濾波器組在處理男性的聲音訊號的 時候,可能會有基頻消失的現象,因為我們重建聲音訊號時是以 128 個濾波器組的能量乘 上其載波之後合成;基頻被濾掉的現象會影響聲音訊號語調的高低起伏,使得聲音聽起來 比較像機械音。

如圖 49 所示,左圖是原來的聲音訊號聲譜圖,原始音檔的取樣頻率為 8KHz,在此我 們將之升頻為 16KHz,在畫圖的時候為了看得較為仔細,因此只畫出 0~4KHz 範圍的圖;

而右圖則是將頻譜模糊化 3 倍後的結果。從圖上我們可以清楚的發現,左圖中語音的基頻,

在右圖中完全看不到了,實際聽過後的確會有機械音的現象。

圖 49 16KHz 取樣環境下,聽損模型的失真現象

因此我們將取樣頻率修改為 8KHz,如此一來第一個濾波器的中心頻率大約為 85Hz,

落在一般男性的基頻範圍中,因此我們期望在 8KHz 取樣頻率的發展環境下,可以得到較 佳的語音品質,如圖 50 所示:圖 50 與圖 49 除了取樣頻率不同之外,其餘的條件均相同,

我們可以發現語音的基頻並沒有消失,而且實際比較圖 49(右)與圖 50(右)的聲音之 後,可以明顯發現圖 50(右)的聲音的抑揚頓挫較為明顯,因此我們認為使用 8KHz 的取 樣在我們的濾波器組下,來進行聽損現象的模型是較為合適的。

5.3.2 載波比較

將白高斯雜訊濾波過後取出載波的做法,可能會造成的影響是計算複雜度變高,以及 使得合成的語音品質較差,因此我們分別實驗以下兩個產生載波的方法,並比較其與原來 的方法的語音品質。

 為了避免濾波的過程,我們用以濾波器中心頻率為頻率的單頻弦波,搭配一個隨機相 位,來做為這個濾波器的載波;這樣子的做法產生的聲譜圖和原先做法的聲譜圖幾乎 相同,然而仔細聽聲音後會發現這樣子合成出的聲音會有單音的成份在,因此語音品 質是較為不佳的。

 在過去發展聽覺模型的研究中,以迭代方代尋找相位的演算法曾被提出〔53〕,此演 算法的優點是我們只要有每一個濾波器的能量,就可以用迭代的方式來找到對應的相

圖 50 8KHz 取樣頻率下,聽損模型的失真現象

位;我們比較用此演算法實作出來的結果、與 5.2 節提出來的方法之後,發現以原來 提出的方法合成出來的聲音,聽起來有些破破的,好像有磨喉嚨的感覺,相較之下以 迭代方式得到的結果較佳,不過從辨識度的角度來看,兩者幾乎是相同的。

5.4 實驗設計與結果分析

相關文件