• 沒有找到結果。

本研究資料之劇本文件,是從金穗獎優良劇本中挑出 12 個劇本進行研究;在 廣告產品簡介方面,是從維基百科查詢出廣告產品簡介內容進行分析研究;另外,

參考沈信佑研究的方法,產生劇本重點度之結果。在準備資料完成後,先從分析 劇本開始,劇本經中文斷詞系統,找出所有劇本內的特徵詞。

本論文特徵詞,運用於兩大部分:第一部分利用自動化分析重點度的方法來 分析劇本段落重點度為 4 及 5 分的段落,再用中文斷詞系統找出所有 NA 特徵詞,

以及利用廣義知網查詢所有 NA 特徵詞的上兩層延伸詞作為特徵詞使用。第二部 分利用廣告產品簡介內容經過中文斷詞系統分析出所有詞性,以廣告產品詞找出 前後 5 項的收集字,再篩選出詞性為 NA 的收集字,經過計算正規化頻率及 TF*IDF 之後,找出四組代表廣告產品的特徵詞,用來找出最佳推薦廣告。驗證方式將劇 本段落特徵詞與廣告產品四組特徵詞之比對,觀察找出段落分數最高前三名,可 以用來呈現最佳推薦廣告。最後,將此結果輸出,可提供結果給廣告商參考在哪 個時段下廣告。

經由本次研究後,發現本系統是可以得出預想呈現的結果,但效益或其他特 徵的取得,都是未來還可以改進及加強的地方,期望找到更多能夠擴充劇本及廣 告產品的特徵詞,一定會對本研究有非常大的幫助。本研究未來可再發展的方向 可從兩個部分進行:

一、劇本特徵詞

在劇本段落特徵詞上,本研究已實驗使用詞性 NA 尋找是非常合適的,但是 如果想要更精確,可以再加入更多特徵項目,像是情感方面的特徵項目,希望未 來能夠找到除了詞性特徵的其他方法,找出更多不同的特徵,使得本研究的準確

品推薦、部落格網站經由本系統能夠推薦可播放廣告,或是手機 APP 相關內容的 廣告推薦等。

二、廣告商品資料庫

期許未來可以擴充增加廣告資料庫,因為目前並沒有可以公開取得相關廣告 資料,如果未來可以收集到更多方面且更多元的廣告,就可以能夠進行更詳細的 廣告資料分析,而針對更多相關聯的廣告可以作更多的比對,能夠把整體系統在 更精細的調整且提升效能。

總而言之,在未來發展上,希望能夠使廣告產品資料庫實用化,將處理過的 廣告產品能夠記錄在資料庫,使廣告產品資料庫能夠越來越豐富且加大擴充資料 庫內容;而資料比對方面也可以朝更多元化的方向,找出更有效果的特徵,使得 資料分析與處理方面可以更快更有效率。

參考文獻

Blackstock, A., & Spitz, M. (2008). Classifying movie scripts by genre with a MEMM using NLP-Based features. Available at December 12, 2015 from nlp.stanford.edu/course/cs224n/2008/06.pdf.

Eliashberg, J., Jonker, J. J., Sawhney, M. S., Wierenga, B. (2000) MOVIEMOD: An implementable decision support system for pre-release market evaluation of motion pictures, Marketing Science, Vol. 19, No. 3, pp. 226-243.

Gil, S., Kuenzel, L., & Caroline, S. (2011). Extraction and analysis of character interaction networks from plays and movies. Technical report, Stanford University.

John, G. H., & Langley, P. (1995). Estimating continuous distributions in Bayesian classifiers. Proceedings of the Eleventh conference on Uncertainty in Artificial

Intelligence, pp. 338-345.

Li, S., Wang, Z., Zhou, G., & Lee, S. Y. M. (2011). Semi-supervised learning for imbalanced sentiment classification. Proceedings of the Twenty-Second

International Joint Conference on Artificial Intelligence, Vol. 22, No. 3, pp.

1826-1831.

McCallum, A., Freitag, D., & Pereira, F. C. (2000). Maximum entropy Markov models for information extraction and segmentation. ICML, Vol. 17, pp. 591-598.

Mishne, G., & Glance, N. S. (2006). Predicting movie sales from blogger sentiment.

Proceedings of AAAI Spring Symposium: Computational Approaches to Analyzing Weblogs, pp. 155-158.

Qin, Y., Zhang, Y., Zhang, M., & Zheng, D. (2013). Feature-rich segment-based news event detection on twitter. Proceedings of 2013 International Joint Conference on Natural Language Processing, pp. 302-310.

中文斷詞系統, from http://ckipsvr.iis.sinica.edu.tw/

沈信佑,2016,“劇本文件探勘與廣告推薦之研究”,國立臺灣師範大學資訊工 程所碩士論文

金穗獎優良劇本, from http://www.movieseeds.com.tw/

維基百科, from https://zh.wikipedia.org/zh-tw/

廣義知網, from http://ehownet.iis.sinica.edu.tw/index.php

相關文件