• 沒有找到結果。

第五章 嬰兒哭泣情緒辨識實驗與結果

5.2 實驗介紹

5.2.5 實驗五

以 LPCC 為其特徵,使用 ANN 和 KNNR 這兩種辨識機制,利用 PCA_type2 方法降低維度,其結果如表 5.10、表 5.11、圖 5.8 和圖 5.9 所 示。

實驗目的

比較 LPCC 的不同維度,對辨識率之影響,挑選一最佳辨識維度,實驗 之維度有 LPCC24、LPCC48、LPCC60、LPCC72、LPCC96 和 LPCC120 六種。

實驗結果(ANN 測試)

表 5.10 不同維度的 LPCC 辨識率比較(ANN) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精) 不同維度的 LPCC 辨識率(ANN)

類別 LPCC24 LPCC48 LPCCC60 LPCC72 LPCC96 LPCC120 A 7.5% 47.5% 62.5% 62.5% 90.0% 65.0%

B 62.5% 62.5% 63.9% 62.5% 80.6% 69.4%

C 52.1% 65.8% 63.0% 60.3% 82.2% 56.2%

D 69.8% 67.4% 55.8% 67.4% 88.4% 79.1%

E 59.5% 75.7% 70.3% 78.4% 81.6% 86.5%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

情緒類別

不同LPCC維度之辨識率(ANN)

LPCC24 LPCC48 LPCCC60 LPCC72 LPCC96 LPCC120

圖 5.8 不同維度的 LPCC 辨識率比較(ANN)

實驗結果(KNNR 測試)

表 5.11不同維度的 LPCC 辨識率比較(KNNR) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精) 不同維度的 LPCC 辨識率(KNNR)

類別 LPCC24 LPCC48 LPCCC60 LPCC72 LPCC96 LPCC120 A 22.5% 20.0% 27.5% 30.0% 67.5% 20.0%

B 31.9% 37.5% 43.1% 45.8% 66.7% 51.4%

C 35.6% 39.7% 41.1% 39.7% 60.3% 49.3%

D 18.6% 27.9% 41.9% 14.0% 76.7% 32.6%

E 29.7% 32.4% 45.9% 43.2% 81.1% 32.4%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

情緒類別

不同LPCC維度之辨識率(KNNR)

LPCC24 LPCC48 LPCCC60 LPCC72 LPCC96 LPCC120

圖 5.9不同維度的 LPCC 辨識率比較(KNNR)

討論分析

1.由表 5.10 與表 5.11 中可發現,在相同維度的 LPCC 特徵中,ANN 辨識 機制的辨識率高於使用 KNNR 為辨識機制者,兩者差異非常大 ,KNNR 之辨識率大部分低於 50%,唯有 LPCC96 之辨識率較高,超過 60%。

2. 從圖 5.8 與圖 5.9 中可發現,隨著維度的增加,其辨識率有明顯的提升,

ANN 辨識機制與 KNNR 辨識機制皆有相同情形,尤其是當 LPCC72 增

加為 LPCC96,其辨識率的提升最為明顯。

3. 比較 LPCC24、LPCC48、LPCC60、LPCC72、LPCC96、LPCC120 六 種不同維度的辨識率,發現 LPCC96 擁有最高的辨識率,因此挑選 LPCC96 為 LPCC 最佳維度特徵。

四種不同特徵的比較

從實驗二至實驗五,比較倒頻譜、梅爾倒頻譜、線性預估編碼和 LPCC 四種特徵,擷取不同維度的特徵參數,比較其辨識率變化,接下來,針 對四種不同特徵的最佳維度,對其辨識率加以比較,找出最佳之辨識特 徵,可得倒頻譜的最佳維度特徵為 CEP96,梅爾倒頻譜最佳維度特徵為 MFCC72,線性預估編碼最佳維度特徵為 LPC60,LPCC 最佳維度特徵為 LPCC96,其結果如表 5.12、表 5.13、圖 5.10 和圖 5.11 所示。

表 5.12 四種不同特徵最佳維度辨識率比較(ANN) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精)

四種不同特徵最佳維度辨識率(ANN) 類別 CEP96 MFCC72 LPC60 LPCC96

A 60.0% 87.5% 72.5% 90.0%

B 66.7% 76.4% 66.7% 80.6%

C 54.8% 75.3% 61.6% 82.2%

D 55.8% 79.1% 69.8% 88.4%

E 63.2% 89.5% 44.7% 81.6%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

情緒類別

四種不同特徵最佳維度辨識率(ANN)

CEP96 MFCC72 LPC60 LPCC96

圖 5.10 四種不同特徵最佳維度辨識率比較(ANN) 表 5.13 四種不同特徵最佳維度辨識率比較(KNNR) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精)

四種不同特徵最佳維度辨識率(KNNR) 類別 CEP96 MFCC72 LPC60 LPCC96

A 35.0% 60.0% 32.5% 67.5%

B 45.8% 25.0% 40.3% 66.7%

C 43.8% 56.2% 27.4% 60.3%

D 14.0% 86.0% 14.0% 76.7%

E 15.8% 92.1% 50.0% 81.1%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

情緒類別

四種不同特徵最佳維度辨識率(KNNR)

CEP96 MFCC72 LPC60 LPCC96

圖 5.11四種不同特徵最佳維度辨識率比較(KNNR)

討論分析

1.由表 5.12 與表 5.13 中可發現,使用同樣的辨識特徵,ANN 辨識機制的 辨識率高於使用 KNNR 為辨識機制者,因此 ANN 辨識機制優於 KNNR 辨識機制。

2. 從圖 5.10 與圖 5.11 中可發現,四種特徵中,以 LPCC96 辨識率最高,

MFCC72 次之,在 ABC 類別中,CEP96 辨識率高於 LPC60,在 DE 類別 中 CEP96 辨識率低於 LPC60,CEP96 和 LPC60 會隨著不同的類別,其辨 識率比較有不同情形,無法斷定 CEP96 和 LPC60 何者較為優秀。

3. 觀察四種特徵之辨識率,發現 LPCC96 和 MFCC72 的辨識率遠高於 CEP96 和 LPC60,約有 10%至 20%的差異,因此可斷定 LPCC 和 MFCC 特徵較 CEP 和 LPC 特徵佳,具有鑑別性和較高的辨識率。雖然 LPCC 總 體辨識率高於 MFCC 的總體辨識率,但 MFCC 在 DE 類別的辨識上,有 較佳的成效,因此在接下來的實驗中,不再考慮 CEP 和 LPC,只針對 LPCC 和 MFCC。

4. CEP 和 MFCC 特徵雖然皆為倒頻譜特徵,但因 MFCC 特徵考慮了人 耳的聽覺特性,增加了梅爾濾波器,導致 MFCC 辨識率遠大於 CEP。

5. LPC 和 LPCC 的特徵擷取過程十分相似,但因 LPC 為線性系統,不似 LPCC 除了具有線性特徵之外,也包含了非線性之特徵,故 LPCC 辨識成 效優於 LPC。

6. 由總體辨識率上判別,LPCC 為最佳的情緒辨識特徵參數。

LPCC 和 MFCC 對五種嬰兒哭聲的辨識情形

觀察 LPCC 和 MFCC 對五種嬰兒哭聲的辨識情形,以瞭解 LPCC 和 MFCC 特徵對五種嬰兒哭聲的辨識成效,及五種情緒哭聲之間的相互關係。

其採用特徵為 LPCC96 和 MFCC72,辨識機制為 ANN 與 KNNR。

表 5.14 至表 5.21 及圖 5.12 至圖 5.15 皆為五種情緒哭聲的訊號輸入,經 辨識機制運算,所得之實際輸出與正確預期輸出之關係,A 類別使用了 40 個測試音檔,B 類別使用了 72 個測試音檔,C 類別使用了 73 個測試 音檔,D 類別使用了 43 個測試音檔,E 類別使用了 38 個測試音檔。

表 5.14 LPCC96 各類別辨識音檔數目比較(個) (ANN) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精)

LPCC96 各類別辨識音檔數目(個)(ANN)

辨識類別

A B C D E

A(40) 36 2 1 1 0

B(72) 8 58 5 1 0

C(73) 4 8 60 1 0

D(43) 0 0 3 38 2

測試類別

E(38) 3 1 0 2 31

表 5.15 LPCC96 各類別辨識音檔數目比較(%) (ANN) LPCC96 各類別辨識音檔數目(%)(ANN)

辨識類別

A B C D E A(40) 90.0% 5.0% 2.5% 2.5% 0.0%

B(72) 11.1% 80.6% 6.9% 1.4% 0.0%

C(73) 5.5% 11.0% 82.2% 1.4% 0.0%

D(43) 0.0% 0.0% 7.0% 88.4% 4.7%

測試類別

E(38) 7.9% 2.6% 0.0% 5.3% 81.6%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

測試類別

LPCC96各類別辨識數目(%)(ANN)

實際輸出A 實際輸出B 實際輸出C 實際輸出D 實際輸出E

圖 5.12 LPCC96 各類別辨識音檔數目比較(%) (ANN) 表 5.16 LPCC96 各類別辨識音檔數目比較(個) (KNNR)

(A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精) LPCC96 各類別辨識音檔數目(個)(KNNR)

辨識類別

A B C D E

A(40) 27 4 5 1 3

B(72) 11 48 10 1 2 C(73) 11 12 44 3 3

D(43) 2 1 2 33 5

測試類別

E(38) 0 3 3 1 30

表 5.17 LPCC96 各類別辨識數目比較(%) (KNNR) LPCC96 各類別辨識數目(%)(KNNR)

辨識類別

A B C D E A(40) 67.5% 10.0% 12.5% 2.5% 7.5%

B(72) 15.3% 66.7% 13.9% 1.4% 2.8%

C(73) 15.1% 16.4% 60.3% 4.1% 4.1%

D(43) 4.7% 2.3% 4.7% 76.7% 11.6%

測試類別

E(38) 0.0% 8.1% 8.1% 2.7% 81.1%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

測試類別

LPCC96各類別辨識數目(%)(kNNR)

實際輸出A 實際輸出B 實際輸出C 實際輸出D 實際輸出E

圖 5.13 LPCC96 各類別辨識數目比較(%)(KNNR) 表 5.18 MFCC72 各類別辨識音檔數目比較(個) (ANN) (A:秤重 B:洗澡 C:飢餓 D:打針 E:酒精)

MFCC72 各類別辨識數目(個)(ANN)

辨識類別

A B C D E

A(40) 35 3 2 0 0

B(72) 6 55 6 0 5

C(73) 6 9 55 1 2

D(43) 3 1 1 34 4

測試類別

E(38) 1 0 3 0 34

表 5.19 MFCC72 各類別辨識數目比較(%) (ANN) MFCC72 各類別辨識數目(%)(ANN)

辨識類別

A B C D E A(40) 87.5% 7.5% 5.0% 0.0% 0.0%

B(72) 8.3% 76.4% 8.3% 0.0% 6.9%

C(73) 8.2% 12.3% 75.3% 1.4% 2.7%

D(43) 7.0% 2.3% 2.3% 79.1% 9.3%

測試類別

E(38) 2.6% 0.0% 7.9% 0.0% 89.5%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

測試類別

MFCC72各類別辨識數目(%)(ANN)

實際輸出A 實際輸出B 實際輸出C 實際輸出D 實際輸出E

圖 5.14 MFCC72 各類別辨識數目比較(%)(ANN) 表 5.20 MFCC72 各類別辨識音檔數目比較(個) (KNNR)

MFCC72 各類別辨識音檔數目(個)(KNNR)

辨識類別

A B C D E

A(40) 24 11 5 0 0

B(72) 18 18 14 14 8 C(73) 10 16 41 3 3

D(43) 2 0 1 37 3

測試類別

E(38) 0 0 2 1 35

表 5.21 MFCC72 各類別辨識數目比較(%) (KNNR) MFCC72 各類別辨識數目(%)(KNNR)

辨識類別

A B C D E A(40) 60.0% 27.5% 12.5% 0.0% 0.0%

B(72) 25.0% 25.0% 19.4% 19.4% 11.1%

C(73) 13.7% 21.9% 56.2% 4.1% 4.1%

D(43) 4.7% 0.0% 2.3% 86.0% 7.0%

測試類別

E(38) 0.0% 0.0% 5.3% 2.6% 92.1%

0.0%

20.0%

40.0%

60.0%

80.0%

100.0%

辨識率

A B C D E

測試類別

MFCC72各類別辨識數目(%)(kNNR)

實際輸出A 實際輸出B 實際輸出C 實際輸出D 實際輸出E

圖 5.15 MFCC72 各類別辨識數目比較(%)(KNNR) 討論分析

1. 從上面的圖表中可發現,ABC 三類別的相似性較高,容易互相辨識錯 誤,DE 類別的相似性較低。

2. 從嬰兒哭聲情緒的所發生之原因探討,可發現 A 類別為秤重時,因赤 裸造成不安全感,B 類別因洗澡的溫度變化感到不舒服,C 類別為肚子 餓,D 類別為打針疼痛,E 類別為酒精消毒臍帶,造成之刺激疼痛。

從這些原因中,可將 ABC 三類別分類於生理的不舒服,DE 類別分類於 生理的疼痛,因此 ABC 三類別的相似性較高。

在文檔中 新生嬰兒哭聲情緒之辨識 (頁 66-77)

相關文件