• 沒有找到結果。

第五章 基於濾波器組的聽損模型

5.4 實驗設計與結果分析

1. 實驗目的與設計

若是我們想要驗證聽損模型的效果,最理想的方法就是測詴正常人聽經過處理的聲音 的辨識率,以及測詴聽損患者聽正常聲音的辨識率,並比較兩組數據的相似程度〔17〕;

然而由於在現階段中並沒有聽損患者可以協助測詴,因此我們只能透過與其它模型比較數 據的相似程度,簡單的驗證聽損模型的成效。

在這個實驗中我們將以〔54〕中提到的 6 個中文語料列表(圖 49),進行中文單字音 素(phones)的聽力測驗,並與 Moore 團隊的混合模型做比較;語料的條件與 LSD(Latin Square Design)設計如表 2、3,其中 B6R3 代表聽覺濾波器變寬(Broaden)6 倍,響度聚 集(Recruitment)3 倍的聽損現象,是模擬重度聽損的情形;在此條件之下將我們將聲音 加上不同大小的雜訊(clean、0dB S/N、-3dB S/B)來進行辨識率的測詴。

除此之外,由於演算法與真正聽到的聲音音量有關係,因此在實驗中我們產生一個用 來校準的白高斯雜訊,並讓經過 VAD(voice activity detection)處理後的語料的平均能量 大小與該校準訊號相同,接著再以此產生符合表 2 條件的白高斯雜訊,與聲音訊號相加。

在實際測詴的時候,我們將校準訊號的聲音大小調整至大約 65 分貝,讓人稍微感覺到吵 雜的程度,並在相同的條件之下讓所有受詴者完成測詴。

B6R3, clean B6R3, 0dB S/N B6R3, -3dB S/N

Moore’s method 甲 丙 戍

Our method 乙 丁 己

表 2 聽力測詴的六個條件 圖 51 聽力測詴語料表

資料來源:〔54〕

Data list

上表中,我們發現若是不考慮乾淨語音的話,辨識率確實會隨著 SNR 下降而下降;對於乾 淨的語音而言,我們原先期望辨識率會比較好,然而在這裡不論是那一種模型,辨識率都 會比 0dB S/N 還要低一些,推測可能原因為:響度聚集的主要影響是讓聲音大小聲的差距 變大,而對於乾淨的語音來說,在聲音開始與結束的時候,相較於加入雜訊的語音,聲音 的大小聲會有較明顯的變化,而頻譜模糊化則是會讓原本乾淨的語音產生雜訊;此外,由 於中文字只由包含開頭的聲母和結尾的韻母構成,若是在中文字開頭與結尾的地方被嚴重 干擾的話,可能就會造成辨識率比其它兩個條件還要糟的狀況發生。

從以上三種情況的實驗結果來看,我們的模型模擬成果與 Moore 的成果幾乎有相同的 結果,因此我們的聽損模型與 Moore 團隊的模型可謂一致,而其最終驗證將待未來正式進 行聽損患者的聽力測詴來呈現。

5.4.2 實驗二

1. 實驗目的與設計

在實驗二中,我們想要驗證在我們提出的模型之下,不同的受損程度確實會造成辨識 率的差異;因此,我們比較在模擬重度受損(B6R3)與中度受損(B3R2)的情況之下,

中文單字的音素辨識率的差異。

實驗設計部份,我們沿用實驗一中,在我們提出的模型之下測得的數據,並針對 B3R2 的情形另外設計聽力測詴,如表 5、6:

B3R2, clean B3R2, 0dB S/N B3R2, -3dB S/N

Our method 庚 辛 壬

表 5 聽力測詴的三個條件

Data list

另外,我們可以根據表 7 中每個雜訊條件下,B3R2 與 B6R3 辨識率的差值推測:受損 程度影響辨識率的程度,隨著雜訊愈大而愈不明顯;這樣的推測也可能與實驗一中討論的 原因相同—頻譜模糊化與響度聚集對於乾淨語音有比較明顯的影響。

相關文件