第五章 結論
第二節 未來展望
本論文為人工建構資料庫,在收集資料時發現資料來源單一(只有從巴哈論壇 收集)、由於沒有加入回饋功能,故資料庫無法自動新增詞彙以及產品量其實也還 算少。未來可以架伺服器建立資料庫,利用爬蟲的方式從各大論壇如 批踢踢實 業 坊 (PTT) (https://www.ptt.cc/bbs/hotboards.html) 和 伊 莉 論 壇 (eyny) (http://www68.eyny.com/index.php)等抓取相關評論並自動學習後,將評論之摘要 及產品推薦整合成一個網頁供使用者參考討論。
在評論分析方面,由於論壇性質所以幾乎沒有反諷、釣魚等句子。比較句的 分析上雖然只有用 Breadth-First Search 和找尋標記為 Head Na 兩種方式初步與意 見詞配對,但是仍不夠完善,例如例句中的「比 PVC 本體還精緻的機槍登場」,
本論文的處理為「機槍+精緻」,但對於「PVC 本體」的極性並未處理。未來可以 朝查詢反諷語句之真義及比較句中比較詞 A 和比較詞 B 的極性分群等。
參考文獻
Agarwal, Basant, and Namita Mittal. Categorical probability proportion difference (CPPD): A feature selection method for sentiment classification. Proceedings of the 2nd Workshop on Sentiment Analysis where AI meets Psychology (SAAIP 2012), COLING. 2012.
Agerri, Rodrigo and Bermudez, Josu, and Rigau, German. 2014. Ixa pipeline: Efficient and ready to use multilingual nlp tools. In Proceedings of the 9th Language Resources and Evaluation Conference (LREC2014), pages 26–31, Reykjavik, Iceland, May.
ALTER(アルター):https://alter-web.jp/
Amazon.cp.jp:https://www.amazon.co.jp/
Baccianella, S. and Esuli, A. and Sebastiani, F. 2010. Senti- WordNet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining. In Seventh conference on International Language Resources and Evaluation (LREC-2010), Malta., volume 25.
Brown, Peter F and Desouza, Peter V and Mercer, Robert L and Vincent Pietra, J Della and Lai, Jenifer C. 1992. Classbased n-gram models of natural language.
Computational linguistics, 18(4):467–479. Rodrigo Agerri, Josu Bermudez, and German Rigau. 2014. Ixa pipeline: Efficient and ready to use multilingual nlp tools. In Proceedings of the 9th Language Resources and Evaluation Conference (LREC2014), pages 26–31, Reykjavik, Iceland, May.
Carletta, J. (1996). "Assessing Agreement on Classification Tasks: the Kappa Statistic," Computational linguistics, 22(2), pp. 249-254.
Church, K.W., Hanks, P.: Word association norms, mutual information, and lexicography. Computational Linguistics 16(1) (1990) 22–29
Clark, Alexander. 2003. Combining distributional and morphological information for part of speech induction. In Proceedings of the tenth conference on European chapter of the Association for Computational Linguistics-Volume 1, pages 59–66.
89
cLayz(クレイズ):http://clayz-online.com/
De Clercq, O., Van de Kauter, M., Lefever, E., & Hoste, V. (2015). Applying hybrid terminology extraction to aspect-based sentiment analysis. In International
Workshop on Semantic Evaluation (SemEval 2015) (pp. 719-724). Association for
Computational Linguistics.Garcıa-Pablos, A., Cuadros, M., & Rigau, G. (2015). V3: unsupervised aspect based sentiment analysis for SemEval-2015 Task 12. SemEval-2015, 714–718.
goo 辞書:https://dictionary.goo.ne.jp/
GSC(GOOD SMILE COMPANY):http://www.goodsmile.info/zh/
Hall, Mark and Frank, Eibe and Holmes, Geoffrey and Pfahringer, Bernhard and Peter Reutemann and Ian H. Witten. 2009. The WEKA data mining software: an update.
SIGKDD Explor. Newsl., 11(1):10–18, november.
Hu, M. and Liu, B. 2004. Mining and summarizing customer reviews. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, pages 168–177.
Jiménez-Zafra, S. M., Martınez-Cámara, E., Martın-Valdivia, M. T., & Urena-López, L.
A. (2015). SINAI: Syntactic approach for Aspect Based Sentiment Analysis. SemEval-2015, 730–735.
Koppula, A. R., Pallelra, R. R., Repaka, R., & Movva, V. S. (2015).
UMDuluth-CS8761-12: A Novel Machine Learning Approach for Aspect Based Sentiment Analysis. SemEval-2015, 742–747.
KOTOBUKIYA | 株式会社 壽屋 コトブキヤ:http://www.kotobukiya.co.jp/
Ku, L.-W. and Chen, H.-H. 2007. Mining Opinions from the Web: Beyond Relevance Retrieval. Journal of American Society for Information Science and Technology, Special Issue on Mining Web Resources for Enhancing Information Retrieval, 58(12), 1838-1850.
Liu, Bing and Hu, Minqing and Cheng, Junsheng. 2005. Opinion Observer: Analyzing
and Comparing Opinions on the Web. In Proceedings of the 14th International World Wide Web conference (WWW-2005). Chiba, Japan.
Liu, Kang and Xu, Liheng and Zhao, Jun 2014. Extracting Opinion Targets and Opinion Words from Online Reviews with Graph Co-ranking Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics
Liu, L., Lei, M., & Wang, H. (2013). Combining domain-specific sentiment lexicon with hownet for chinese sentiment analysis. Journal of Computers, 8(4), 878-883.
Lu, Bin and Ott, Myle and Cardie, Claire, and Tsou, Benjamin K. 2011. Multi-aspect sentiment analysis with topic models. In Data Mining Workshops (ICDMW), 2011 IEEE 11th International Conference on, pages 81–88. IEEE.
McCallum, Andrew Kachites. 2002. MALLET: A Machine Learning for Language Toolkit.
Mikolov, Tomas and Sutskever, Ilya and Chen, Kai and Corrado, Greg S and Dean, Jeff. 2013. Distributed representations of words and phrases and their compositionality. In Advances in Neural Information Processing Systems, pages 3111–3119.
Miller, George A. 1995. Wordnet: a lexical database forenglish. Communications of the ACM, 38(11):39–41.
Nielsen, Finn A° rup. 2011. A New ANEW: Evaluation of a Word List for Sentiment Analysis in Microblogs. In Proceedings, 1st Workshop on Making Sense of Microposts (#MSM2011): Big things come in small packages. pp: 93-98. Greece.
Pontiki M., Galanis D., Papageorgiou H., Manandhar S., & Androutsopoulos I.(2015, June). Semeval-2015 task 12: Aspect Based Sentiment Analysis. In Proceedings
of the 9th international workshop on semantic evaluation (SemEval 2015) (pp.
486-495).
PTT:https://www.ptt.cc/bbs/hotboards.html
Saias, J. (2015, June). Sentiue: Target and aspect based sentiment analysis in semeval-2015 task 12. Association for Computational Linguistics.
91
San Vicente, I., Saralegi, X., Agerri, R., & Sebastián, D. S. (2015, June). Elixa: A modular and flexible absa platform. In Proceedings of the 9th International
Workshop on Semantic Evaluation (SemEval 2015) (pp. 748-752).
SIGLEX(Special Interest Group on the Lexicon):http://alt.qcri.org/semeval2015/
Stone P. and Dunphy, D. and Smith, M. and Ogilvie, D. 1966. The General Inquirer: A Computer Approach to Content Analysis. Cambridge (MA): MIT Press.
Weblio 日中中日辞典:http://cjjc.weblio.jp/
Wilson, Theresa and Wiebe, Janyce and Hoffmann, Paul. 2005. Recognizing contextual polarity in phrase-level sentiment analysis. In Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing, HLT ’05, pages 347–354, Stroudsburg, PA, USA.
𝑖𝑥𝑎 - 𝑝𝑖𝑝𝑒 - 𝑛𝑒𝑟𝑐 Named Entity Recognition system. Available from :
https://github.com/ixa-ehu/ixa-pipe-nerc
中研院中文剖析系統:http://parser.iis.sinica.edu.tw/
中研院中文斷詞系統:http://ckipsvr.iis.sinica.edu.tw/
分 群 範 例 【 風 華 の 開 箱 】 ALTER 未 聞 花 名 本 間 芽 衣 子 :
https://forum.gamer.com.tw/Co.php?bsn=60036&sn=237462
巴哈姆特電玩資訊站:https://www.gamer.com.tw/
陳傳生,2014“使用廣義知網於情感詞彙之極性分析研究”,國立師範大學資訊 工程研究所碩士論文。
臉 書 社 團 「 PVC_Figure 人 型 討 論 分 享 社 」 :
https://www.facebook.com/groups/figure.hot/
93
附錄
1. 特徵詞分群
分群於身體之詞彙(65 個詞)
大腿 小腿肉 小辮子 心 手
手指 手指甲 手掌 手臂 右手
左手 皮 皮膚 耳朵 肉肉
肉體 肌膚 呆毛 屁屁 屁股
秀髮 肚臍 身體 乳量 股間
股溝 前髮 指甲 美腿 面相
香肩 馬尾 眼神 眼睛 脖子
麻花捲 單腳 短髮 腋 微乳
微笑 腰 腳 腳指甲 腳趾
腳趾 腿 裸足 嘴型 嘴唇
皺紋 膚質 膝 髮尾 髮絲
頭 頭皮屑 頭髮 臉 臉蛋
臉部 臉頰 雙手 關節 辮子
分群於整體之詞彙(135 個詞)
人 少女 方式 水手 水準
牛鬼 主題 凹凸感 凹陷感 可愛型
本體 正面 白色 立體感 份量
光澤 共通點 成品 曲線 色
95
圖騰 壽屋 槍 槍托 槍超
漆 磁鐵 窩 網襪 緊身衣
舞台 劍 噴嘴 墜飾 樣子
澎澎裙 皺褶 緞帶 緞帶花 蓮蓬頭
蝙蝠 蝴蝶結 輪胎 鞋上 鞋子
髮飾 齒輪 機身 機槍 機關槍
燈 燈籠 燒痕 興趣 褲
褲子 褲襪 貓耳超讚 頭紗 蕾絲
顆粒 點 鎖扣 鬆緊帶 爆表
繩結 霧 襪子 鐵絲 襯裙
大衣
2. 意見詞分群
分群於正向之詞彙(118 個詞)
一流 一等一 一覽無遺 大膽 不錯
分明 仔細 充分 出色 可圈可點
可愛 正點 生動 用心 光滑
全新 好 好看 好棒 成功
有意思 有趣 自然 呆呆 呈現出來
均勻 完美 完整 良好 到位
固定 性感 明確 明顯 物超所值
花俏 表現出來 亮 便宜 俐落
97
搶眼 楚楚可憐 滑 緊 緊緊
蒼白 颯爽 親民 還好 還原
舊 難得 騷 霸氣 豪棒
彎曲
分群於模糊之詞彙(34 個詞)
一樣 不行 化 反光 扎眼
如此 吹了 相當 相關 胖次
真不少 高到 高熱 掉 淋淋
深 透明 這麼 這樣 就是了
發光 黑 傻巴 實 對
緊繃 凜 黝黑 爆 難怪
飄逸 飄飄 變質
分群於負向之詞彙(36 個詞)
不佳 少 可怕 可惜 失真
失敗 失望 危險 多餘 色移
怪 怪怪 怪異 突兀 胖
凌亂 害臊 差 恐怖 草率
馬虎 乾瘦 崩 崩壞 減少
硬 微妙 腫 詭異 誇張
慘 遜色 僵硬 難 難看
99
糟糕
分群於偏負之詞彙(12 個詞)
平 扁扁 單一 短 貴
圓 塌 塌塌 溢色 溢
違和 過頭