• 沒有找到結果。

使用統計觀點來看待語者確認中之分數標準化過程

2. 可靠度相關文獻回顧

2.2. 使用統計觀點來看待語者確認中之分數標準化過程

過程

本研究的主要觀點在於評估稀少資料輸入情況下對於語者確認模型強健程 度的影響。研究的假設前提認為訓練模型具有強健性。但是當測試環境和訓練環 境產生不匹配的問題時,這時候使用該模型的可靠度剩下多少?

本研究首先著眼於GMM 輸出值取對數之後的分佈行為。如果我們將 GMM 的輸出值取對數之後的結果視為一個隨機變數,一般在處理上都視為常態分佈。

一般在處理這類的問題時常會使用T norm 或者是 Z norm 這兩種 score normalization 技術,由於前一章已經對 T norm 或者是 Z norm 進行過介紹。此處 便不再贅述。有鑒於T norm 或者是 Z norm 基本上還是在處理大樣本的問題,使 用上並無法符合本研究小樣本的要求。所以本研究在此處自行提出小樣本的 score normalization 方法。對 GMM 取對數運算的輸出分數進行判別的工作,實 際上可以視為是檢定兩個常態分佈隨機變數的平均值差異現象,我們可以直接將 GMM 的輸出判別過程整理如下:

(2.1)

Approximate student t distribution

ˆ ˆ ˆ ( ) ( ) ( )

Student-t Distribution of sample size n 1

function

n:sample size of random variable of score normalization :Gamma

Γ

( j | ) ˆ

Dependent Pairwise Sampling

來進行比較,如果分數大於門檻值(threshold),則輸出結果確認是假設中的當事 人(client),反之,則判定為偽裝者(imposter)。至目前為止,門檻值(threshold)的 選取方式多半只有兩種ÎEER 或 HER,使用 deterministic 的選取方式來決策。

1 2

1 1

Sequence Decision

is single frame of feature vector,j=1,2 n ( ) log(P ( ˆ )) log(P ( ))

decide client decide imposter ( ( )) log , : threshold

Λ

„ Soft Decision

因為我們所研究的目標是稀少資料的小樣本情形,所以此處針對小樣本的情 況引入新的criteria。給予兩個常態分佈的母體,如果抽樣的順序是成對抽取 (pairwise sampling)的模式,同時在兩個母群體中對相同的隨機變數

x j

進行 log likelihood 之計算),此時可以視為相關的小樣本處理。

( k ) ( k ) (

llr X = s X − Ω X k (2.9) )

k

: k-th input frame sequence

1

T 分佈的參數僅和自由度(degree of freedom)有關,df=n-1。

n=5 ;t-dist=>dash

-4 -2 0 2 4

n=15 ;t-dist=>dash

-4 -2 0 2 4

n=35 ;t-dist=>dash

-4 -2 0 2 4

n=100 ;t-dist=>dash

圖表 5 difference between normal and student-t distribution

¾ 使用假設檢定的方式計算出 false alarmfalse rejection

在統計理論上,兩個相關樣本的平均值差可以使用(2.12)的 t distribution 來近 似。對(2.12)的 t distribution 定義式進行比對,可以寫出原來的 likelihood ratio test 轉換到t distribution 上的 Hypothesis test 的對應寫法。

¾ Condition Î輸入序列長度為 n

decision x

if t t reject

¾ 檢定是否為 imposter? Left-tailed test

decision x

if t t reject

: risk (level of significance) α

P value Hypothesis test

P value Hypothesis test

圖表 6 Hypothesis test (P value test)

如果training 的結果已經到達 optimization,Hypothesis test 的 p value 將會到 達minimum。P value 值越小表示相對風險(risk)就會越小,也就是說,這時候的 GMM 參數訓練的結果,其相對於其它的值是風險最小的。

本研究之所以稱第二種假設檢定的方法為soft decision,主要的觀點在於 level of significanceÎ

α

, 是我們可以自由挑選的一個參數。一般統計上在進行 假設檢定時

α

的典型值是0.1 或 0.05。

小結:T norm 和 Z norm 實際上是上述 t student distribution 的變形處理,然 而在語者確認上的應用卻可以增強模型的強健程度(robustness)。本研究在此處想 要建立稀少資料量(sparse data)之下的語者確認(speaker verification)模型穩定度 (reliability)分析。

本研究欲進行的研究方向:

一、 因為取樣數量之減少所造成的分佈不匹配(distribution mismatch)問題之 下的語者確認實驗結果。

將原來的機率密度函數進行遮罩處理的研究結果在以往的研究結果中曾經 有相當不錯的成果。最主要的研究方向是和時間有關的應用。例如工業工程上面 用來進行生產線之產品良率估計實驗設計。在大量生產的產品線上,有時候因為 產品的數量太多或者是產品的價錢昂貴,不可能讓研究者等到所有的產品都損壞 之後才去推估全部產品的平均生命週期(lifetime),這時候就必須假設產品的生命 週期是服從某種分佈,然後研究者將這個分佈的左端或右端進行遮罩(mask)處 理,但是估計時仍然以整個未受遮罩處理的樣本空間為對象做分析。應用這種概 念可以使用少量的時間快速得到整體的實驗結果。工業上在此方面的應用稱為產 品生命週期分析(lifetime analysis)。

相關文件