• 沒有找到結果。

改良頻譜 改良頻譜 改良頻譜 KL 距離 改良頻譜 距離 距離 距離

(weighted entropy)的概念,將頻譜 KL 距離進一步改為加權頻譜 KL 距離(weighted spectral

KL distance),定義為每個子頻帶乘上對應之加權值wi的總合,如下式:

本研究使用最小分類錯誤[15-16](Minimum Classification Error,MCE)方法,此方法 之目標為期望能夠正確地區別輸入參數向量以達到最佳的辨識或分類之結果,以提升鑑別程 度。在此,首先定義觀測向量序列X 為挑選出之所有候選端點序列,X =

(

x x1, 2,⋯,xN

)

且對 於第 n 個候選端點x 含有六個子頻段信號波封之向量,表示為n xn =xn,1,xn,2,⋯,xn,6。而對 應不同頻段之加權值w=

[

w w w w w w1, 2, 3, 4, 5, 6

]

為實驗欲估測的參數值。考量一組以邊界端點作 為分類 Cm的概似度函數gm

(

X w;

)

如(5-5)、(5-6)式,為觀測向量對應至分類 Cm的概似度。

( ) (

T

) ( [ ] )

(Misclassification measure),接著利用損失函數(Loss function)來描述分類判別的錯誤損 失,最後是以最小化分類錯誤的目標來估測模型參數。本論文只有使用兩種分類。由上述將

設置,其反映出對分類判別的靈敏度,而由 S 型函數的值域曲線發現,當d X

( )

遠小於零,

( )k f

(

KL

[ ] ) (

1

(

KL

[ ] ) )

i

(

n i, KL

[ ] )

i

d c f dw n f dw n w x dw n w

∂ = − ⋅ − ⋅ −

∂ɶ (5-16)

最後之實驗結果我們得到每個頻帶所對應之加權值。如圖 5.17 所示,我們可以看出第 一個頻帶的加權值較大,依序為第三個頻帶和第六個頻帶,而第四及第五個頻帶其加權值相 對於其他頻帶較小;然而觀察相鄰音素對應發音方法不同的語音信號轉變,若其靜音接至母 音、摩擦音接至母音或是塞擦音接至母音,可由看出其頻譜差異最大的是較低頻的部分,這 與圖 5.17 的分布一致。重新將加權過後之頻譜 KL 距離用於音素端點偵測器的訓練過程中。

圖 5.17:疊代至收斂後,對應於每個頻帶的加權值

實驗結果由偏權值初始為 0.12 而得,但為了找到適當的加權值以提供重新建立音素偵 測器之模型,本論文根據不同之偏權值與調整挑選候選端點之臨限值(pthD)之間的定量分 析實驗,觀察對每個頻帶加權值的影響。挑選候選端點之臨限值越低則代表挑選出越多的音 素候選端點,圖 5.18 顯示了對於訓練加權值的樣本數量(由 509210 至 677089 個候選端點)

對加權值幾乎無任何影響,而以不同之偏權值主導了各頻帶加權值的分佈情形。

最後整理以不同加權值代入四種挑選候選端點臨限值的實驗結果,當偏權值為 0.12 且 臨限值為 0.01 時,與先前之實驗結果相比 EER 可下降約 1.6%,如圖 5.19 所示。

圖 5.18:加權值為根據不同參數偏權值與調整挑選候選端點臨限值的結果,偏權值分別為(a) 0.06 (b) 0.12 (c) 0.18 (d) 0.24

圖 5.19:加入加權頻譜 KL 距離於 TIMIT 測試語料誤報率與偵測漏失率之對應曲線圖,

藍色虛線為原本實驗結果曲線,紅色實線為加入加權值實驗結果曲線