6. 實驗設計
6.2. 實驗環境設定
我們想進行語者確認之分析,使用交通大學電信工程學系語音實驗室 TCC300 語料庫進行分析。
語者確認之型式:text independent
使用分析工具:HTK(Hidden Markov Model Toolkit)工具程式及其相關之MASV shareware(Munich Automatic Speaker Verification)進行小規模程式改寫。
實驗假設情況:我們想使用TCC300 語料庫進行語者確認之研究,以句子(sentence) 作為分析個體。但是TCC300 每位語者之語料發音多在 20 句之內,符合本研究 稀少性輸入資料之假設。
圖表 44 以句子為觀察單位,則每位語者的資料量是稀少的
首先,修該第一章之假設,將所有的語料以語者作為單位,分成四個互相獨立的 集合。
Parameters of Speaker Verification
UBM Client
System
Imposter
Parameters
圖表 45 語者確認上之參數蒐集分類
各個方塊之參數使用如下:
一、UBM(Universal background model or World model)集合內的語者,所有的 語者資料訓練一個GMM 模型。
二、Client 集合內的語者,每位語者使用自己的語料訓練屬於自己的 GMM 模型。
三、System parameters:用來求取系統參數使用,HER(half error rate), ERR(equal error rate)。
四、Imposter 集合內的語者,不需要訓練任何模型。
五、假設所有的語者識別只使用一個系統臨界值(threshold)來進行判定。
符號:
假設client 語者之中,第 位speaker 需要被確認,則第 個GMM client 模型。
記為 ,
c i c i
ˆ c
is x c
i 表示來自第c i
位client 語者的語料。有k 位 imposter 預備進行偽裝測試,
一自我判別測試(self testing):
1
( | ) ˆ , c s
id i j
:來自於client 集合中的第 i 位語者所說的第 j 句話,對應到自己的 GMM 模型之下進行 force alignment,該句話中的所有 phones 所單獨對應的 duration 總和。 GMM 模型下進行 force alignment,該句話中的所有 phones 所單獨對應的 duration 總和。Ω
Λ
:threshold表格 11 是 client 集合中,編號 0001 的語者對自己的 16mixtures GMM 模型 進行force alignment 的結果。分割單元使用的是 syllable,因為執行的語者確認 形式為text independent,所以所有的 syllable 都 tie 成一個名稱為 gmmstate 的 GMM 模型。
Î終止時間減去起始時間就是該 syllable 所對應的 duration。
由實驗的結果可以觀察得出,第一個syllable 與其它的 syllable 分數互相差 距過大,故每句話的第一個syllable 分數都予以忽略不計入平均計算。
表格 11Client 對自己的模型 force alignment 的結果
起始時間 終止時間 GMM 名稱 分數(Score)
0 91099997 gmmstate -50202.347656
91100000 91200000 gmmstate -54.636047 91200000 91300000 gmmstate -53.327332 91300000 91400000 gmmstate -56.178677 91400000 91500000 gmmstate -52.698994 91500000 91600000 gmmstate -54.373470 91600000 91700000 gmmstate -55.059395 91700000 91800000 gmmstate -56.624462 91800000 91900000 gmmstate -52.812164 91900000 92000000 gmmstate -56.019474 92000000 92100000 gmmstate -54.247986 92100000 92200000 gmmstate -58.101490
92200000 92300000 gmmstate -54.202251 92300000 92400000 gmmstate -56.527683 92400000 92500000 gmmstate -58.027462 92500000 92600000 gmmstate -57.978786 92600000 92700000 gmmstate -57.719040 .相同於上表格的內容,client 對於 UBM 模型也會得出如表格 11 的 force
alignment 結果。
將所有的資料代入公式(6.1) 中,計算出
如果先暫時假設threshold=0,則此時所計算出來的相對分數由小到大依序為:
表格 12 自我判別分數統計
偽裝者判別測試(Imposter testing)
1
偽裝者判別測試和自我判別測試最大的不同點在於資料量之多寡,因為此時 我們想要一次推估出整個偽裝者(imposter)集合所可能產生的 false alarm rate。所 以偽裝者在語者確認的處理上通常都是以集合型態出現,不會面臨稀少資料量的 問題。 本例中偽裝者集合的句子總數量為 145,偽裝者判讀如果出現錯誤時,
此時所犯的錯誤為false alarm。