結論與未來展望 - 利用廣義知網及維基百科於劇本文件之廣告推薦

本研究資料之劇本文件，是從金穗獎優良劇本中挑出 12 個劇本進行研究；在廣告產品簡介方面，是從維基百科查詢出廣告產品簡介內容進行分析研究；另外，

參考沈信佑研究的方法，產生劇本重點度之結果。在準備資料完成後，先從分析劇本開始，劇本經中文斷詞系統，找出所有劇本內的特徵詞。

本論文特徵詞，運用於兩大部分：第一部分利用自動化分析重點度的方法來分析劇本段落重點度為 4 及 5 分的段落，再用中文斷詞系統找出所有 NA 特徵詞，

以及利用廣義知網查詢所有 NA 特徵詞的上兩層延伸詞作為特徵詞使用。第二部分利用廣告產品簡介內容經過中文斷詞系統分析出所有詞性，以廣告產品詞找出前後 5 項的收集字，再篩選出詞性為 NA 的收集字，經過計算正規化頻率及 TF*IDF 之後，找出四組代表廣告產品的特徵詞，用來找出最佳推薦廣告。驗證方式將劇本段落特徵詞與廣告產品四組特徵詞之比對，觀察找出段落分數最高前三名，可以用來呈現最佳推薦廣告。最後，將此結果輸出，可提供結果給廣告商參考在哪個時段下廣告。

經由本次研究後，發現本系統是可以得出預想呈現的結果，但效益或其他特徵的取得，都是未來還可以改進及加強的地方，期望找到更多能夠擴充劇本及廣告產品的特徵詞，一定會對本研究有非常大的幫助。本研究未來可再發展的方向可從兩個部分進行：

一、劇本特徵詞

在劇本段落特徵詞上，本研究已實驗使用詞性 NA 尋找是非常合適的，但是如果想要更精確，可以再加入更多特徵項目，像是情感方面的特徵項目，希望未來能夠找到除了詞性特徵的其他方法，找出更多不同的特徵，使得本研究的準確

品推薦、部落格網站經由本系統能夠推薦可播放廣告，或是手機 APP 相關內容的廣告推薦等。

二、廣告商品資料庫

期許未來可以擴充增加廣告資料庫，因為目前並沒有可以公開取得相關廣告資料，如果未來可以收集到更多方面且更多元的廣告，就可以能夠進行更詳細的廣告資料分析，而針對更多相關聯的廣告可以作更多的比對，能夠把整體系統在更精細的調整且提升效能。

總而言之，在未來發展上，希望能夠使廣告產品資料庫實用化，將處理過的廣告產品能夠記錄在資料庫，使廣告產品資料庫能夠越來越豐富且加大擴充資料庫內容；而資料比對方面也可以朝更多元化的方向，找出更有效果的特徵，使得資料分析與處理方面可以更快更有效率。

參考文獻

Blackstock, A., & Spitz, M. (2008). Classifying movie scripts by genre with a MEMM using NLP-Based features. Available at December 12, 2015 from nlp.stanford.edu/course/cs224n/2008/06.pdf.

Eliashberg, J., Jonker, J. J., Sawhney, M. S., Wierenga, B. (2000) MOVIEMOD: An implementable decision support system for pre-release market evaluation of motion pictures, Marketing Science, Vol. 19, No. 3, pp. 226-243.

Gil, S., Kuenzel, L., & Caroline, S. (2011). Extraction and analysis of character interaction networks from plays and movies. Technical report, Stanford University.

John, G. H., & Langley, P. (1995). Estimating continuous distributions in Bayesian classifiers. Proceedings of the Eleventh conference on Uncertainty in Artificial

Intelligence, pp. 338-345.

Li, S., Wang, Z., Zhou, G., & Lee, S. Y. M. (2011). Semi-supervised learning for imbalanced sentiment classification. Proceedings of the Twenty-Second

International Joint Conference on Artificial Intelligence, Vol. 22, No. 3, pp.

1826-1831.

McCallum, A., Freitag, D., & Pereira, F. C. (2000). Maximum entropy Markov models for information extraction and segmentation. ICML, Vol. 17, pp. 591-598.

Mishne, G., & Glance, N. S. (2006). Predicting movie sales from blogger sentiment.

Proceedings of AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs, pp. 155-158.

Qin, Y., Zhang, Y., Zhang, M., & Zheng, D. (2013). Feature-rich segment-based news event detection on twitter. Proceedings of 2013 International Joint Conference on Natural Language Processing, pp. 302-310.

中文斷詞系統, from http://ckipsvr.iis.sinica.edu.tw/

沈信佑，2016，“劇本文件探勘與廣告推薦之研究”，國立臺灣師範大學資訊工程所碩士論文

金穗獎優良劇本, from http://www.movieseeds.com.tw/

維基百科, from https://zh.wikipedia.org/zh-tw/

廣義知網, from http://ehownet.iis.sinica.edu.tw/index.php

在文檔中利用廣義知網及維基百科於劇本文件之廣告推薦 (頁 66-69)