使用統計觀點來看待語者確認中之分數標準化過程

2. 可靠度相關文獻回顧

2.2. 使用統計觀點來看待語者確認中之分數標準化過程

過程

本研究的主要觀點在於評估稀少資料輸入情況下對於語者確認模型強健程度的影響。研究的假設前提認為訓練模型具有強健性。但是當測試環境和訓練環境產生不匹配的問題時，這時候使用該模型的可靠度剩下多少？

本研究首先著眼於GMM 輸出值取對數之後的分佈行為。如果我們將 GMM 的輸出值取對數之後的結果視為一個隨機變數，一般在處理上都視為常態分佈。

一般在處理這類的問題時常會使用T norm 或者是 Z norm 這兩種 score normalization 技術，由於前一章已經對 T norm 或者是 Z norm 進行過介紹。此處便不再贅述。有鑒於T norm 或者是 Z norm 基本上還是在處理大樣本的問題，使用上並無法符合本研究小樣本的要求。所以本研究在此處自行提出小樣本的 score normalization 方法。對 GMM 取對數運算的輸出分數進行判別的工作，實際上可以視為是檢定兩個常態分佈隨機變數的平均值差異現象，我們可以直接將 GMM 的輸出判別過程整理如下：

(2.1)

Approximate student t distribution

ˆ ˆ ˆ ( ) ( ) ( )

Student-t Distribution of sample size n 1

function

n:sample size of random variable of score normalization :Gamma

Γ

( _j | ) ˆ

Dependent Pairwise Sampling

來進行比較，如果分數大於門檻值(threshold)，則輸出結果確認是假設中的當事人(client)，反之，則判定為偽裝者(imposter)。至目前為止，門檻值(threshold)的選取方式多半只有兩種ÎEER 或 HER，使用 deterministic 的選取方式來決策。

1 2

1 1

Sequence Decision

is single frame of feature vector,j=1,2 n ( ) log(P ( ˆ )) log(P ( ))

decide client decide imposter ( ( )) log , : threshold

Λ

Soft Decision

因為我們所研究的目標是稀少資料的小樣本情形，所以此處針對小樣本的情況引入新的criteria。給予兩個常態分佈的母體，如果抽樣的順序是成對抽取 (pairwise sampling)的模式，同時在兩個母群體中對相同的隨機變數

x _j

進行 log likelihood 之計算)，此時可以視為相關的小樣本處理。

( _k ) ( _k ) (

llr X = s X − Ω X _{k (2.9)} )

k

: k-th input frame sequence

T 分佈的參數僅和自由度（degree of freedom）有關，df=n-1。

n=5 ;t-dist=>dash

-4 -2 0 2 4

n=15 ;t-dist=>dash

-4 -2 0 2 4

n=35 ;t-dist=>dash

-4 -2 0 2 4

n=100 ;t-dist=>dash

圖表 5 difference between normal and student-t distribution

¾ 使用假設檢定的方式計算出 false alarm 和 false rejection

在統計理論上，兩個相關樣本的平均值差可以使用(2.12)的 t distribution 來近似。對(2.12)的 t distribution 定義式進行比對，可以寫出原來的 likelihood ratio test 轉換到t distribution 上的 Hypothesis test 的對應寫法。

¾ Condition Î輸入序列長度為 n

decision x

if t t reject

¾ 檢定是否為 imposter? Left-tailed test

decision x

if t t reject

: risk (level of significance) α

P value Hypothesis test

圖表 6 Hypothesis test (P value test)

如果training 的結果已經到達 optimization，Hypothesis test 的 p value 將會到達minimum。P value 值越小表示相對風險(risk)就會越小，也就是說，這時候的 GMM 參數訓練的結果，其相對於其它的值是風險最小的。

本研究之所以稱第二種假設檢定的方法為soft decision，主要的觀點在於 level of significanceÎ

α

，是我們可以自由挑選的一個參數。一般統計上在進行假設檢定時

α

的典型值是0.1 或 0.05。

小結：T norm 和 Z norm 實際上是上述 t student distribution 的變形處理，然而在語者確認上的應用卻可以增強模型的強健程度(robustness)。本研究在此處想要建立稀少資料量(sparse data)之下的語者確認(speaker verification)模型穩定度 (reliability)分析。

本研究欲進行的研究方向：

一、因為取樣數量之減少所造成的分佈不匹配(distribution mismatch)問題之下的語者確認實驗結果。

將原來的機率密度函數進行遮罩處理的研究結果在以往的研究結果中曾經有相當不錯的成果。最主要的研究方向是和時間有關的應用。例如工業工程上面用來進行生產線之產品良率估計實驗設計。在大量生產的產品線上，有時候因為產品的數量太多或者是產品的價錢昂貴，不可能讓研究者等到所有的產品都損壞之後才去推估全部產品的平均生命週期(lifetime)，這時候就必須假設產品的生命週期是服從某種分佈，然後研究者將這個分佈的左端或右端進行遮罩(mask)處理，但是估計時仍然以整個未受遮罩處理的樣本空間為對象做分析。應用這種概念可以使用少量的時間快速得到整體的實驗結果。工業上在此方面的應用稱為產品生命週期分析(lifetime analysis)。

在文檔中稀少性的輸入資訊下所造成的分佈不匹配問題在語者確認上的可靠度分析 (頁 23-29)

2. 可靠度相關文獻回顧

2.2. 使用統計觀點來看待語者確認中之分數標準化過程

過程

Approximate student t distribution

Student-t Distribution of sample size n 1

function

n:sample size of random variable of score normalization :Gamma

Γ

( j | ) ˆ

Dependent Pairwise Sampling

1 1

Sequence Decision

is single frame of feature vector,j=1,2 n ( ) log(P ( ˆ )) log(P ( ))

decide client decide imposter ( ( )) log , : threshold

Λ

 Soft Decision

x j

( k ) ( k ) (

llr X = s X − Ω X k (2.9) )

k

¾ 使用假設檢定的方式計算出 false alarm 和 false rejection

¾ Condition Î輸入序列長度為 n

decision x

if t t reject

¾ 檢定是否為 imposter? Left-tailed test

decision x

if t t reject

: risk (level of significance) α

α

α

( _j | ) ˆ

Soft Decision

x _j

( _k ) ( _k ) (

llr X = s X − Ω X _{k (2.9)} )