• 沒有找到結果。

第一節 結論

在本論文的研究中,提出一個基於中文文法剖析系統的意見評分流程,改良 屬性詞與意見詞的擷取與配對方式,可以針對具大量字數的評論文章獲得更有效 的分析。並且透過本實驗系統,可以針對網路上收集回來的電影評論文章,計算 出每篇文章的意見分數,進而獲得整個電影的推薦分數,以 5 等第制的方式呈現。

實驗的結果證明本論文提出的系統的評分結果在誤差一分的情況下有 70.7%

的準確率;將五等第化為推薦與不推薦的結論時,也分別獲得了 F-score 74.3%與

51.4%的成果。透過針對不同屬性詞類別所擷取回來的意見詞,可以統計出評論 者對於特定電影及特定屬性上常用的形容詞,讓系統的使用者可以初步先了解此 電影的特性。

最後,將系統的評分結果與著名的電影評分網站 IMDb 做比較,發現大部份 電影的評分都相當接近 IMDb 會員投票的結果,這表示透過隨機擷取一定數量的 網路評論文章以自然語言處理分析意見極性的結果,可以獲得與不同評論族群的 人為投票評分相近的結果。說明在電影評論的意見極性分析上,本系統可做為參 考輔助之用;對於使用者來說,也可以透過大量收集網路評論文章來幫助判斷電 影的推薦程度,節省人工閱讀的時間。

46

第二節 未來發展

在實驗過程中,我們發現屬性詞可能會影響意見詞極性分類的潛在議題;也 就是當意見詞用來形容不同的主體時,其極性可能會剛好相反。由於本實驗標記 意見詞極性時採用獨立標記,並未參考意見詞在句子中的呈現方式,因此未能評 估此議題對結果增進的幅度。然而未來若能透過機器學習的方式針對意見詞與不 同屬性詞配對時的極性分類,應能獲得更為準確的情感分類結果。

根據實驗結果分析,也發現造成評分結果不佳的兩個主要因素。一個是當電 影改編自小說時,會導致文章作者傾向一併評論小說內容,造成系統無法正確判 斷意見持有者(opinion holder)而獲得較差的評分結果。另一個則是當評論文章 帶有明褒暗貶的語意或者強調感動的落淚時,系統無法從意見詞表面上的極性得 知作者真正的意圖。

事實上,判斷一句話在所屬情境下的實際語意,也就是語用學(pragmatics)

的研究,一向是自然語言處理中相當重要的領域之一。在情感分類的議題上,如 果能夠在處理評論文章時,從詞彙的意義、句子的意義,進而分析在整個文章情 境下的語意,就應能獲得更正確的分類結果,這也將會是未來研究的首要目標。

47

參考文獻

Minqing Hu and Bing Liu (2004), “Mining and summarizing customer reviews,”

Proceedings of the tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, New York, NY, USA, 2004, pp.168-177.

Kekang Lin (1998), “Dependency-based evaluation of MINIPAR,” Workshop on the Evaluation of Parsing Systems, Granada, Spain, 1998.

NTUSD (National Taiwan University Semantic Dictionary) , http://nlg18.csie.ntu.edu.tw:8080/opinion/pub1.html .

Ana-Maria Popescu and Oren Etzioni (2005), “Extracting product features and opinions from reviews,” Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing, Stroudsburg, PA, USA, 2005, pp.339-346.

Likun Qiu, Weishi Zhang, Changjian Hu, and Kai Zhao (2009), “SELC: A self-supervised model for sentiment classification,” Proceedings of the 18th ACM Conference on Information and Knowledge Management, New York, NY, USA, 2009, pp.929-936.

Peter D. Turney (2002), “Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews,” Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, Philadelphia, 2002, pp.417-424.

Li Zhuang, Feng Jing, and Xiao-Yan Zhu (2006). “Movie review mining and summarization,” Proceedings of the 2006 ACM CIKM International Conference on Information and Knowledge Management, Arlington, Virginia, USA, 2006, pp.43-50.

中文斷詞系統,中文詞知識庫小組,中央研究院,http://ckipsvr.iis.sinica.edu.tw/

中 文 剖 析 系 統 , 中 文 詞 知 識 庫 小 組 , 中 央 研 究 院 , http://ckip.iis.sinica.edu.tw/CKIP/parser.htm

48 學研討會論文集,1994 年,pp.203-222。

林宇中,“基於語意內容分析之情緒分類系統”,國立成功大學資訊工程學系碩

相關文件