• 沒有找到結果。

蒙地卡羅模擬(Monte Carlo Simulation)與分析

第五章 多層貝氏網路與多層共變異數貝氏網路語音情緒辨識

5.4 蒙地卡羅模擬(Monte Carlo Simulation)與分析

蒙地卡羅模擬法(Monte Carlo Simulation)為一種數值方法,藉由統 計方式在設定條件下利用亂數取樣(Random sampling),來模擬實際可 能發生的量測值,因此,蒙地卡羅模擬法,是基於大量數值的驗證方 法,當實驗次數越多,其平均值將會越趨近理論值,在此,我們將利 用蒙地卡羅模擬法來驗證各分類器之辨識可靠度。

在蒙地卡羅隨機資料產生的過程中,使用德國語料所有語料來當 作蒙地卡羅模擬的參考資料,也就是悲傷有62筆、中性有79筆、快 樂有 71 筆、生氣有 127 筆資料,從每一筆情緒資料中計算表 3-5 所 列之 23個正規化特徵參數,因此,悲傷有2362筆,中性有2379 筆,快樂有2371筆,生氣則有23127筆特徵參數資料,接著,計 算每一種情緒之特徵參數平均值向量(為231之向量)與共變異數(為

23

23 之矩陣),並以此特徵參數平均值向量與共變異數隨機產生一 萬筆特徵參數資料,也就是2310000筆隨機特徵參數為測試資料,

因此,悲傷、中性、快樂以及生氣各有一萬筆測試資料,每一筆測試 資料均有 23 個特徵參數。以下將利用蒙地卡羅模擬方法針對本論文 所使用之各個分類器作蒙地卡羅模擬分析。

首先,使用德國語料所有資料當作訓練資料,也就是悲傷有 62 筆、中性有79筆、快樂有71筆、生氣有127 筆訓練資料,接著,以

隨機產生之各情緒各一萬筆資料當作測試資料,並以KNN 分類器對 此隨機資料進行測試,表5-12 為KNN 分類器蒙地卡羅模擬之辨識結 果,由 KNN 蒙地卡羅模擬鑑別矩陣顯示,KNN 分類器對於中性有 極佳的辨識效果,辨識率為 99.64%,對於悲傷與生氣則維持中等的 辨識率,辨識率分別為82.04%以及88.39%,對於快樂則效果最差,

辨識率只有61.03%,整體之辨識率為82.78%,從鑑別矩陣可以看出,

KNN 分類器對於快樂與生氣比較容易產生混淆,尤其是快樂,容易 被辨識歸類為生氣,而悲傷與生氣則分別有一部分易被辨識歸類為中 性及快樂,整體來看,KNN 分類器之Inside Test辨識率為88.79%, 而蒙地卡羅模擬辨識率為 82.78%,這是由於使用 KNN Inside Test 時,測試資料中會有一筆資料與訓練資料完全相同,因此造成 KNN Inside Test 辨識率較蒙地卡羅模擬辨識率高,當 KNN 運用到實際狀 況時,整體的辨識效果會變差,辨識率下降了約6%。

接著,使用SVM 分類器進行蒙地卡羅模擬,在使用SVM 分類器 作蒙地卡羅模擬前,首先,先使用德國語料庫所有資料當作訓練資 料,並以此訓練資料產生一組 SVM Model,並找出最佳切割函數,

接著,與KNN 測試資料相同,以隨機產生之各情緒各一萬筆資料當 作測試資料,並以SVM 分類器對此隨機資料作測試,表5-13為SVM 分類器蒙地卡羅模擬之辨識結果,由SVM 蒙地卡羅模擬鑑別矩陣顯

示,SVM 分類器對於悲傷與中性有極佳的辨識效果,辨識率分別為 96.38%以及 97.80%,對於生氣則維持不錯的辨識率,辨識率為 89.79%,對於快樂則效果相對較差,辨識率為 75.57%,整體之辨識 率為 89.89%,從鑑別矩陣可以看出,SVM 分類器與 KNN 相同,對 於快樂與生氣比較容易產生混淆,快樂有一部份容易被辨識歸類為生 氣,整體來看,SVM分類器之 Inside Test辨識率為100%,Outside Test 辨識率為91.74%,而蒙地卡羅模擬辨識率為89.89%,此結果顯示,

SVM 對於特定資料的分類有相當不錯的分類效果,但當測試資料不 在訓練資料中時,SVM 的辨識效果會有所下降,但仍維持不錯的辨 識率,由Outside Test 與蒙地卡羅模擬辨識結果可以發現,當訓練資 料涵蓋較多的訓練語者時,SVM之整體的辨識率將與 Outside Test結 果較為相近。

接著,使用 MLBN 分類方法進行蒙地卡羅模擬,在使用 MLBN 分類器作辨識前,與前面之 KNN 及 SVM 相同,使用德國語料庫所 有語料當作訓練資料,計算訓練資料中各情緒類別正規化特徵參數之 平均值與標準差,以此建置 MLBN 資料庫,接著,以隨機產生之各 情緒各一萬筆資料當作測試資料,並以 MLBN 分類器對此隨機資料 作可靠度測試,表5-14為MLBN可靠度測試之辨識結果,由MLBN 蒙地卡羅模擬鑑別矩陣顯示,MLBN分類器對於悲傷與中性有極佳的

辨識效果,辨識率分別為94.53%以及97.83%,對於生氣則維持中等 的辨識率,辨識率為 80.99%,對於快樂則效果相對較差,辨識率為 55.29%,整體之辨識率為82.16%,從鑑別矩陣可以看出,與SVM 分 類器狀況較為相同,MLBN對於快樂與生氣比較容易產生混淆,快樂 有一部份容易被歸類為生氣,而生氣則有一小部分易被歸類為快樂,

整體來看,MLBN分類器之 Inside Test 辨識率為 81.12%,而整體之 蒙地卡羅模擬辨識率為82.16%,此結果顯示雖然 MLBN對於特定資 料的分類效果沒有 SVM 及 KNN 好,但在辨識上卻相對穩定,而 MLBN最後所得到的是各情緒類別可能的發生機率,因此,在實際運 用上,會比SVM 及KNN 有更大的應用空間。

最後,使用 MLBNC 分類方法來進行蒙地卡羅模擬,在使用 MLBNC分類器作辨識前,與前面各分類器相同,使用德國語料庫所 有資料當作訓練資料,計算各層各群之正規化特徵參數平均值向量與 共變異數,以此建置 MLBNC資料庫,接著,以隨機產生之各情緒各 一萬筆資料當作測試資料,並以 MLBNC 分類器對此隨機資料作測 試,表 5-15 為 MLBNC 分類器可靠度測試之辨識結果,由 MLBNC 蒙地卡羅模擬鑑別矩陣顯示,MLBNC分類器與SVM 及MLBN分類 效果類似,對於悲傷與中性有極佳的辨識效果,辨識率分別為97.28%

以及99.10%,對於生氣則維持不錯的辨識率,辨識率為87.33%,對

於快樂則相對辨識較差,辨識率為65.79%,整體之辨識率為87.33%, 從鑑別矩陣可以看出,與前面幾個分類器狀況相同,MLBNC對於快 樂與生氣比較容易產生混淆,快樂有一部份容易被辨識為生氣,而生 氣則有一小部分易被歸類為快樂,整體來看,MLBNC分類器之 Inside Test 辨識率為 88.79%,而蒙地卡羅模擬辨識率為 87.33%,兩者差異 不大,此結果顯示,雖然MLBNC對於特定資料的分類效果沒有SVM 好,但整體辨識效果的穩定度卻與 SVM相差不遠,且MLBNC最後 所得到的是各情緒類別可能的發生機率,而不是單純的結果,因此,

在實際應用面上,MLBNC分類器可以提供語音情緒辨識上更大且可 靠的應用空間。

表5-16為各分類器蒙地卡羅模擬測試之辨識正確率整理,從各分 類器之辨識結果來看,四種分類器對於中性情緒均有極佳的辨識效 果,而快樂則為最不容易辨識的情緒,各分類器對於快樂與生氣皆容 易產生混淆的狀況,此結果可從圖 5-5之正規化特徵參數分佈圖中看 出,相關正規化特徵參數對於快樂與生氣的確缺乏有效的特徵來區隔 此兩種情緒,因此,找出快樂與生氣在語音中能有效區隔此兩種情緒 之特徵參數,亦為提升有效辨識的重點之一。從蒙地卡羅模擬測試辨 識結果顯示,SVM 以及 MLBNC 均提供了良好的辨識率,由於 MLBNC使用機率運算的方式來判別各情緒發生的機率,因此,在實

際應用面上,MLBNC 分類器比 SVM 分類器更可以提供較大且可靠 的應用空間。

5.5 小結

本章首先針對分類樹、貝氏決策以及貝氏網路原理做簡單的介紹 與說明,接著,根據分類樹原理,將本論文所使用之正規化特徵參數 作分群分析,並依據 5.2.1 所提出之分群的原則與步驟,對各特徵參 數做分群,並以此分群方式建立 MLBN 語音情緒分類器,MLBN 語 音情緒分類器共有三層, 第一層為分兩群,主要有三種分群方式,

第一種分群方式中,悲傷與中性為同一群,快樂與生氣則為另一群,

第二種分群方式,悲傷為獨立的一群,中性、快樂與生氣則為另一群,

第三種分群方式,中性為獨立的一群,悲傷、快樂與生氣則為另一群;

MLBN第二層為分三群,主要有兩種分群方式,第一種分群方式中,

悲傷以及中性各為獨立的一群,快樂與生氣為第三群,第二種分群方 式則為悲傷與中性為同一群,快樂以及生氣則各為獨立的一群,最 後,MLBN第三層為分四群,也就是悲傷、中性、快樂與生氣皆為獨 立的一群。

接著,利用MLBN語音情緒分類器,對德國語料庫進行 Inside Test 與Outside Test,從 MLBN Inside Test與單純使用貝氏決策之 Inside Test結果比較,多層貝氏網路語音情緒分類器的辨識效果明顯優於貝

氏決策,因此,透過結合決策樹與貝氏網路分群的辨識方式,可以有 效提升語音情緒辨識率,增加辨識的準確性,而從原始與正規化特徵 參數之MLBN Outside Test結果比較可以發現,與KNN 及SVM 之結 果相同,使用正規化特徵參數可以有效縮小語者之間在特徵參數上的 差異,並增加各情緒之間的分類效果,此外,本章亦針對 MLBN 語 音情緒分類器在訓練語料與測試語料為不同語系之情況下進行辨 識,由結果顯示,與 KNN 及 SVM 分類器相同,MLBN 分類器在訓 練語料與測試語料為不同語系時,同樣無法得到良好的分類效果。

本章亦提出一考慮特徵參數間相關性之多層共變異數貝氏網路 分類器(MLBNC),此MLBNC分類器與MLBN語音情緒分類器最大 之不同在於考慮,不同分層分群之特徵參數間相關性,因此,在 MLBNC各層各群之機率運算上採用多變數之機率密度計算,在本章 中,同樣使用MLBNC語音情緒分類器,對德國語料庫進行Inside Test 與Outside Test,由辨識結果可以發現,MLBNC之整體辨識正確率與 KNN 相近,優於MLBN Inside Test,而從 MLBNC Outside Test結果 來看,其鑑別矩陣MLBN Outside Test 類似,悲傷與生氣分別有一小 部分容易被辨識為中性及快樂,而快樂則有一部份容易被辨識為生

本章亦提出一考慮特徵參數間相關性之多層共變異數貝氏網路 分類器(MLBNC),此MLBNC分類器與MLBN語音情緒分類器最大 之不同在於考慮,不同分層分群之特徵參數間相關性,因此,在 MLBNC各層各群之機率運算上採用多變數之機率密度計算,在本章 中,同樣使用MLBNC語音情緒分類器,對德國語料庫進行Inside Test 與Outside Test,由辨識結果可以發現,MLBNC之整體辨識正確率與 KNN 相近,優於MLBN Inside Test,而從 MLBNC Outside Test結果 來看,其鑑別矩陣MLBN Outside Test 類似,悲傷與生氣分別有一小 部分容易被辨識為中性及快樂,而快樂則有一部份容易被辨識為生