• 沒有找到結果。

第五章 多層貝氏網路與多層共變異數貝氏網路語音情緒辨識

5.2 多層貝氏網路(Multi-Layer Bayesian Network, MLBN)語音情

5.2.2 多層貝氏網路(MLBN)

根據上一章節之分群結果,本論文所提出之結合決策樹與貝氏網 路之多層貝氏網路語音情緒辨識架構如圖 5-7 所示,主要分成三層,

在分層分群的過程中,先將資料庫中的語音情緒特徵資料以表 5-3 之 分群方式重新歸類,並重新計算各特徵參數分群後之平均值與標準 差,以第一層(圖 5-8)之特徵參數 MFCC C8 平均值為例,主要分為兩 群,悲傷與中性為一群,快樂與生氣則為另一群,圖 5-9(a)為原始分 佈狀態,圖 5-9(b)則為分群後之分佈狀態,從圖 5-9(b)中可以發現,

分群後各群之分佈明顯分開,將有助於後續分類辨識之進行,圖 5-10(a) ~ (e)為多層貝氏網路第一層之各特徵參數分群後分佈狀態,與 原先各情緒之分佈狀態(圖 5-5)比較後可以發現,特徵參數在分群後,

各群之分佈可以明顯被分辨出來。多層貝氏網路第二層(圖 5-11)為分 三群,主要有兩種,第一種為悲傷以及中性各為獨立的一群,快樂與 生氣為第三群,另一種則為悲傷與中性為一群,快樂以及生氣則各為 獨立的一群,圖 5-12(a) ~ (j)為多層貝氏網路第二層各特徵參數分三 群後之分佈狀態。第三層則為分四群(圖 5-13),也就是最原始之情緒 類別,其分佈狀態可參考圖 5-5 之正規化後各特徵參數分佈圖。

與 KNN 及 SVM 語音情緒辨識流程類似,多層貝氏網路語音情緒 辨識之流程如圖 5-14 所示,首先,測試語者先講一段正規化用中性 情緒語音,並利用此正規化用之中性情緒語音,計算出測試語者之正 規化特徵參數因子,接著,進入語音情緒辨識流程,在得到使用者一 段情緒語音訊號後,先計算出原始特徵參數,並經由正規化特徵參數 因子對原始特徵參數做正規化,最後,將正規化後特徵參數與多層貝 氏網路資料庫做分層分群運算,計算出每一情緒類別之發生機率。以 下將就此多層貝氏網路語音情緒分類器,透過分層的方式分別加以說 明。

假設測試語者帶有情緒之語音訊號經正規化計算後所得之特徵

參數(如表 3-5 所列)為一特徵參數向量 X,X 為一231之向量,X 為1

傷與中性為同一群,快樂與生氣為另一群時,悲傷與中性發生之機

傷為獨立分群分佈下,X 發生之機率密度,i P

Xi |N,H,A

表示在中

數分群運算,主要有兩種分群方式,第一種為悲傷以及中性各為獨立

 

式中,Prob12,1表示第二層第一種分群方式中悲傷發生之機率,Pr ob12,2

 

分別為

 

上,可以根據使用平台的實際狀況,將計算所得之各情緒發生的機率 做最適當的判斷與運用。以下將就多層貝氏網路語音情緒辨識之實驗 與測試結果分別加以說明。