權重式線性鑑別分析 - 基於分類錯誤之線性鑑別式特徵轉換應用於大詞彙連續語音辨識

為了要解決LDA 的過度強調問題(over-emphasis problem)，一個可能的簡單做法是在原始的 LDA 目標函式，針對每一類別配對的並向量積

j T i j

)( )

(



m m



m 加上適當的權重值(weight)，使得原本距離較大的類別配對不會被過度強調，而距離較小的類別配對也不會被忽略。於是，在白化空間中的類別間共變異矩陣可表示為：



 







i C

ij j

i C

j T i j i j

i B

j i p p

1 1 1 1

) , 2 w(

) )(

)(

, 2 w(

S

m m m m S



 

(3.1)

其中，m





SW^¹²mi，

S

ij 

S

W^¹²

S

_W^¹²

，

w( j

, )

為類別Ci與類別C 之間的權重因子j

(weighting factor)，乃用來控制它們對於投影方向的貢獻。之後，這種權重式線性鑑別分析(weighting-based LDA, WLDA)³⁶的目標函式可被定義為：

36 本論文之後皆以 WLDA 來簡稱『權重式線性鑑別分析』。



 

 ^C

i C

T ij j

ip i j

p J

1 1

WLDA w(, )trace( ) 2

) 1

(

Θ



Θ



S



Θ



(3.2)

很明顯地，若w( ji, )獨立於任何非奇異矩陣的線性轉換，例如S_W^¹²，則類似於 LDA，WLDA 的轉換矩陣Θ也可簡單地表示為

S

_₁₂

Θ



W ，其中Θ



為矩陣

S 

之本徵值前d 大之本徵向量[

θ

1,...,

θ

d]

所組成的矩陣。

在許多關於決定權重因子的研究中，許多研究者直接用類別間之馬氏距離的乘冪作為形成權重的依據，在此我們稱之為基於乘冪之權重式線性鑑別分析 (power WLDA, PWLDA)³⁷[68-70]，其w( ji, )可普遍化如下：

0 , ) , (

w

PWLDA i j

 

^ij^k k



(3.3)

其中，k 為可自由設定的調節常數，



ij為類別C 與類別i C 之間的馬氏距離，定j

義為：

 



i j



T j i





m S m





^{ 2}¹ (3.4)

37 本論文之後皆以 PWLDA 來簡稱『基於乘冪之權重式線性鑑別分析』。

1 1.5 2 2.5 3 3.5 4 4.5 5

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4

k =1 k =2 k =3 k =4 k =5 k =6

圖3.1 PWLDA 之距離與權重關係圖

（橫軸為 ，縱軸為ij wPWLDA(i,j)）

由圖(3.1)可看出，在各種 k 值的設定下，馬氏距離愈大的類別配對，所配置的權重愈低，反之，馬氏距離愈小的類別配對，所配置的權重愈高。這種治標的方式似乎可解決LDA 的過度強調問題，但卻只能憑經驗地(empirically)設定 k 以降低 距離大的類別配對所造成的影響力，並不能連於分類實務本身。

因此，Loog 等人考慮任兩類別母體C 與i C ，二者皆為同方差性的高斯分佈，j

經過白化過程後，當投影到方向θ



i m



j m



i m





 ( )

時，其貝氏準確率(Bayes accuracy)為：



 



  

 erf 2 2 2

1 2 ) 1

( ^ij

Aij

θ



(3.5)

其證明如以下之命題3.1：

命題

3.1：任兩白化後的類別母體

C 與i C ，二者皆為同方差性的高斯分佈，當投j

影到方向θ



i m



j m



i m





 ( )

（

θ



的長度已被正規化為1）時，其貝氏準確率為Aij(

θ

)12(1 2)erf(ij 2 2)

。

圖3.2 兩個單變量高斯分佈及其貝氏錯誤示意圖

R1 R2

12

E2 E1

式(3.8)即為所求之貝氏準確率。

■

根據式(3.5)，Loog 等人找出了馬氏距離與貝氏正確率的關係。而回到 WLDA，

對於任兩類別母體C 與i C ，他們提出了如下的j w( ji, )，並稱這種方法為近似成對理論正確標準(approximate pairwise theoretical accuracy criterion, aPTAC)³⁸：



38 原本 Loog 等人稱之為近似成對正確標準(approximate pairwise accuracy criterion, aPAC)，往後許多的他人著作亦如此稱之。但為了與本論文提出『經驗』的方法有所區隔，我們在此加上

計考量了分類正確率，儘管是個近似的方法，也在一定程度上解決了LDA 的分類正確率無關問題。但是，aPTAC 仍具有潛在的限制：它假設了所有類別母體均遵循高斯分佈，且分類器的分類規則需嚴格遵照貝氏決策法則才會有較佳的分類效果。若是分類器較複雜，如自動語音辨識系統，則 aPTAC 便無法保證有較佳的辨識率。至於目標函式以類別兩兩配對(pairwise)的方式組成，亦有對正確率高估的情形，這點將在3.2 節進一步解釋之。

在文檔中基於分類錯誤之線性鑑別式特徵轉換應用於大詞彙連續語音辨識 (頁 56-62)