實驗環境設定

6. 實驗設計

6.2. 實驗環境設定

我們想進行語者確認之分析，使用交通大學電信工程學系語音實驗室 TCC300 語料庫進行分析。

語者確認之型式：text independent

使用分析工具：HTK(Hidden Markov Model Toolkit)工具程式及其相關之MASV shareware(Munich Automatic Speaker Verification)進行小規模程式改寫。

實驗假設情況：我們想使用TCC300 語料庫進行語者確認之研究，以句子(sentence) 作為分析個體。但是TCC300 每位語者之語料發音多在 20 句之內，符合本研究稀少性輸入資料之假設。

圖表 44 以句子為觀察單位，則每位語者的資料量是稀少的

首先，修該第一章之假設，將所有的語料以語者作為單位，分成四個互相獨立的集合。

Parameters of Speaker Verification

UBM Client

System

Imposter

Parameters

圖表 45 語者確認上之參數蒐集分類

各個方塊之參數使用如下：

一、UBM(Universal background model or World model)集合內的語者，所有的語者資料訓練一個GMM 模型。

二、Client 集合內的語者，每位語者使用自己的語料訓練屬於自己的 GMM 模型。

三、System parameters:用來求取系統參數使用，HER(half error rate), ERR(equal error rate)。

四、Imposter 集合內的語者，不需要訓練任何模型。

五、假設所有的語者識別只使用一個系統臨界值(threshold)來進行判定。

符號：

假設client 語者之中，第位speaker 需要被確認，則第個GMM client 模型。

記為，

c i c _i

ˆ c

s x c

i ^{表示來自第}

c i

^位client 語者的語料。

有k 位 imposter 預備進行偽裝測試，

一自我判別測試(self testing)：

1 ( | ) ˆ , c s

ⁱ

d i j

：來自於client 集合中的第 i 位語者所說的第 j 句話，對應到自己的 GMM 模型之下進行 force alignment，該句話中的所有 phones 所單獨對應的 duration 總和。 GMM 模型下進行 force alignment，該句話中的所有 phones 所單獨對應的 duration 總和。

Ω

Λ

：threshold

表格 11 是 client 集合中，編號 0001 的語者對自己的 16mixtures GMM 模型進行force alignment 的結果。分割單元使用的是 syllable，因為執行的語者確認形式為text independent，所以所有的 syllable 都 tie 成一個名稱為 gmmstate 的 GMM 模型。

Î終止時間減去起始時間就是該 syllable 所對應的 duration。

由實驗的結果可以觀察得出，第一個syllable 與其它的 syllable 分數互相差距過大，故每句話的第一個syllable 分數都予以忽略不計入平均計算。

表格 11Client 對自己的模型 force alignment 的結果

起始時間終止時間 GMM 名稱分數(Score)

0 91099997 gmmstate -50202.347656

91100000 91200000 gmmstate -54.636047 91200000 91300000 gmmstate -53.327332 91300000 91400000 gmmstate -56.178677 91400000 91500000 gmmstate -52.698994 91500000 91600000 gmmstate -54.373470 91600000 91700000 gmmstate -55.059395 91700000 91800000 gmmstate -56.624462 91800000 91900000 gmmstate -52.812164 91900000 92000000 gmmstate -56.019474 92000000 92100000 gmmstate -54.247986 92100000 92200000 gmmstate -58.101490

92200000 92300000 gmmstate -54.202251 92300000 92400000 gmmstate -56.527683 92400000 92500000 gmmstate -58.027462 92500000 92600000 gmmstate -57.978786 92600000 92700000 gmmstate -57.719040 .相同於上表格的內容，client 對於 UBM 模型也會得出如表格 11 的 force

alignment 結果。

將所有的資料代入公式(6.1) 中，計算出

如果先暫時假設threshold=0，則此時所計算出來的相對分數由小到大依序為：

表格 12 自我判別分數統計

偽裝者判別測試(Imposter testing)

1

偽裝者判別測試和自我判別測試最大的不同點在於資料量之多寡，因為此時我們想要一次推估出整個偽裝者(imposter)集合所可能產生的 false alarm rate。所以偽裝者在語者確認的處理上通常都是以集合型態出現，不會面臨稀少資料量的問題。本例中偽裝者集合的句子總數量為 145，偽裝者判讀如果出現錯誤時，

此時所犯的錯誤為false alarm。

在文檔中稀少性的輸入資訊下所造成的分佈不匹配問題在語者確認上的可靠度分析 (頁 101-106)