3.5 3.5
3.5.3 .3 .3 影評摘要句 .3 影評摘要句 影評摘要句 影評摘要句
根據 3.4 小節,我們可以將一篇影評分好類『好評』或『負評』。我們先取 出影評所有包含有產品特色詞的句子,依據該篇影評分類的結果,我們取相對應
18
4.1 交叉測試 交叉測試 交叉測試 交叉測試( (( (Cross Validation Cross Validation Cross Validation) Cross Validation )) )
在本節中我們將對 3.4.2 小節中所提出的各種特徵做情感分類的準確度比
實驗資料:國內知名 BBS 站 PTT(telnet://ptt.cc)電影討論版 470 篇影評 (正評 250 篇/負評 220 篇)。表格三為各組交叉測試實驗結果。
表格 三 各種特徵判斷情緒的準確度 Test Test Test Test
第一組特徵 71.0021
第一組特徵+否定 70.7889
第一組特徵+位置 69.5096 第一組特徵+長度 70.1493
第二組特徵 78.4648
第二組特徵(否定) 79.3177 第二組特徵(位置) 71.6418 第二組特徵(長度) 79.1045
第三組特徵 76.5458
第三組特徵(否定) 75.4797 第三組特徵(位置) 70.1493 第三組特徵(長度) 78.2516
4.3 4.3 4.3
4.3 實驗討論 實驗討論 實驗討論 實驗討論
參照各組加入否定、位置、長度等特徵以後,其準確度效果均無明顯提升或 下降,表示這些特徵對文章分類並沒有太大的影響力,這實驗結果和[1]的實驗 結論雷同。而和[2]一樣的方法取文章特徵(第三組特徵)相比較,第二組實驗效
20
果有較佳的結果。根據實驗結果,本系統取第二組特徵加上否定詞做訓練預測模 型的文章特徵。
第五章 第五章 第五章
第五章、、、、結論與展望結論與展望結論與展望結論與展望
5.1 5.1
5.1 5.1 研究總結 研究總結 研究總結 研究總結
透過上述研究,我們實做了一套可以判別評論意見的系統,透過這系統我們 可以更迅速的分析網路上大量的評論並得到精簡的意見摘要。從這些摘要我們可 以花費較少的時間去得知大部分人的意見並從中判斷。從實驗結果來看,這方法 是可行的,並且可以應用在更多地方;例如企業新產品的使用心得分析等。
5.2 5.2
5.2 5.2 未來研究 未來研究 未來研究 未來研究
情感分類部分,對文章特徵,或許可以找到更好的特徵或特徵表示法使 SVM 能訓練出準確率較高的預測模型。或者也可以結合 SVM 和其他情感探勘的技巧加 強情感的分析。
摘要方面,如何找出更精確的特色名詞以及情緒詞也可以達到更棒的意見摘 要。
參考文獻 參考文獻參考文獻 參考文獻
[1] Peter D. Turney. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews . Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL), Philadelphia, July 2002, pp.
417-424.
[2] Ana-Maria Popescu and Oren Etzioni. Extracting Product Features and Opinions from Reviews. In proceedings of HLT-EMNLP’2005.
[3] 陳 正 揚. Feature Appraisal for Hotel Comparsion.2006.
[4] Bo Pang and Lillian Lee , Shivakumar Vaithyanathan . Thumbs up? Sentiment Classification using Machine Learning Techniques. Proceedings of EMNLP 2002, pp. 79–86.
[5]Thorsten Joachims . Text Categorization with Support Vector Machines : Learning with Many Relevant Features.1998.
[6] 楊昌樺,高虹安,陳信希. 以部落格語料進行情緒趨勢分析.2007.
[7] 林智仁. http://www.csie.ntu.edu.tw/~cjlin/libsvm/
[8] http://ckipsvr.iis.sinica.edu.tw/
[9] Regina Barzilay , Michael Elhadad. Using Lexical Chains for Text Summarization.
In: Mani, Inderjeet and Maybury, Mark T. Advances in automatic text summarization, Cambridge, MA: The MIT Press, pages 111–121.1999.
[10]Hongyan Jing. Sentence Reduction for Automatic Text Summarization.2000.
[11] 關英杰,林鴻飛,楊志豪,趙晶. 關鍵詞密度分佈法在偏眾摘要中的應用 研究.中國期刊第33卷16期,人工智能及識別技術.2007.
[12]Yi-Fen Chen, Automatic Concept-Based Answer-Finding System . 2003 .