• 沒有找到結果。

應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識

N/A
N/A
Protected

Academic year: 2021

Share "應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識"

Copied!
3
0
0

加載中.... (立即查看全文)

全文

(1)

成大研發快訊 - 文摘 1 of 3

成大研發快訊 第三十一卷 第四期 - 2017年三月三日

[ http://research.ncku.edu.tw/re/articles/c/20170303/1.html ]

應用聲學韻律學及語意標籤之多分類器於情感語音之情

緒辨識

吳宗憲

*

、梁維彬

國立成功大學資訊工程系 [email protected]

IEEE Trans. Affective Computing, VOL. 2, NO. 1, JANUARY-MARCH 2011, pp. 10~21.

【105年科技部傑出研究獎】得獎人專刊

音為人類溝通最自然且最基本之方式。近年來,口述對話系統已成功應用在多 個領域上。然而其應用仍局限在簡單資訊對話系統上,例如導航及旅遊資訊系統等[1] [2]。 為了能將其應用在較複雜之對話系統 (例如家庭照護 [3] 教育/訓練,及聊天 [4]), 情感互動將是一重要成分。然而要透過語音做情感互動,在技術上仍存在相當多之問 題。本研究提出一應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識。 圖一為應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識之架構圖。在此 研究中,對於採用聲學韻律學參數之部分,首先我們取出輸入語音中之情緒重要區段。而後利用此區段之 參數建立高斯混合模型(GMM),支持向量機模型(SVM)及多層感知模型(MLP)當成基礎辨識器。而後利用 超決策樹來結合此三辨識模型。另一方面,應用語音辨識後之文字訊息,建立一語意標籤模型。此語意標 籤乃透過中文知識庫知網(HowNet[5])來建立。而後利用文字探勘技術擷取出情緒關聯規則(EAR)。最後, 我們利用最大熵模型[6]來輸出情緒辨識結果。最後整合兩種辨識器,以得到最後情緒辨識結果。此外我們 亦考慮人格特質之因素以提高情緒辨識之效能。 在效能評量中,我們蒐集了2,033 情緒語句包含中性,快樂,生氣及悲傷四種情緒。評量結果如表一所 示。根據艾森克人格問卷, 語者A(Speaker A) 是外向型,辨識結果顯示其在高興及生氣情緒有較強之表 現。語者B(Speaker B) 既非外向亦非內向,評量結果顯示在四種情緒之表現差異不大。從評量結果可驗證 本研究所提方法有其可靠性。總結而言,本系統在考量人格特質之條件下,其辨識準確率可達85.79%,再 次肯定本方法之有效性。

(2)

成大研發快訊 - 文摘

2 of 3

圖一: 應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識之架構圖

表一: 應用聲學韻律學及語意標籤之多分類器於情感語音之情緒辨識之評量結果

參考文獻:

1. J. Liu, Y. Xu, S. Senef, and V. Zue, "CityBrowser II: A Multimodal Restaurant Guide in Mandarin," in Proc. International Symposium Chinese Spoken Language Processing (ISCSLP), pp. 1-4, 2008.

2. C.-H. Wu and G.-L. Yan, “Speech Act Modeling and Verification of Spontaneous Speech with Disfluency in a Spoken Dialogue System,” IEEE Trans. on Speech and Audio Processing, Vol.13, pp.330-344, May 2005.

3. N. Roy, J. Pineau, and S. Thrun, "Spoken Dialogue Management Using Probabilistic Reasoning," in Proc.

(3)

成大研發快訊 - 文摘

3 of 3

4. D. Jurafsky, R. Ranganath, D. McFarland, “Extracting Social Meaning: Identifying Interactional Style in Spoken Conversation,” in Proc. Human Language Technologies: The 2009 Annual Conference of the North

American Chapter of the Association for Computational Linguistics (NAACL HLT) , pp. 638-646, 2009.

5. Z. Dong, and Q. Dong, HowNet [Online] Available: http://www.keenage.com/

6. A. Berger, S. Della Pietra, and V. Della Pietra, “A Maximum Entropy Approach to Natural Language Processing,” Computational Linguistics, Vol.22, No. 1, pp. 39-71, 1996.

參考文獻

相關文件

大學教育資助委員會資助大學及絕大部分專上院 校接納應用學習中文(非華語學生適用)的「達 標」

畢業應通 過系辦規定 之「資訊證 照門檻」. 多修之學 分數得認

健康及道德議題 (3 小時) • 辨別使用資訊及通訊科技對健康造成的 威脅;建議在使用資訊及通訊科技時,實

•比起單調地教授語音知識,不同的聽、説 活動更能激發學生學習的興趣,如把語音

COBOL 語言發表於西元 1960 年,經 過不斷修改、豐富完善和標準化,被廣 泛應用在財經、會計、統計、人事等商

由於醫療業導入 ISO 9000 品保系統的「資歷」相當資淺,僅有 三年多的年資 11 ,因此,對於 ISO 9000 品保系統應用於醫療業之相關 研究實在少之又少,本研究嘗試以通過

近年來,國內外已經有很多學術單位投入 3D 模型搜尋的研究,而且在網路 上也有好幾個系統提供人使用,例如台灣大學的 3D Model Retrieval

然而,當 RFID 系統被應用在廣泛領域上的同時,不肖的使用者開始鑽研