• 沒有找到結果。

本論文提出並實作一個近體詩主題辨識系統,當使用者輸入詩作,本系同能 夠有效的對其詩作進行斷詞、概念標記、辨識詩作主題及辨識情感。本論文主要 貢獻如下:

1. 收集 7117 首詩作,包含 1080 首五言絕句、3362 首五言律詩、1683 首七 言絕句、992 首七言律詩。

2. 人工標記詩作主題及詩作情感 992 首七言律詩。

3. 收集 28297 個典故詞彙,包括 25490 的詩詞曲典故及 2807 的詩詞典故,

其中 3080 個典故詞彙擁有概念標記。

4. 利用結合強度、律詩對仗的特性提高斷詞程序的效能。

5. 提出詩作詞彙概念的歧義解決策略。

6. 建置近體詩處理系統,提供查詢作者、詩作內容、主題、體裁、詩作標 記平台、辨識詩作主題等多項功能。

本論文未來研究方向有下列幾點:

1. 擴充近體詩詞庫以提高近體詩作中的概念。

2. 擴充系統以提供詩作賞析之功能。

3. 針對詩作主題辨識將加強詩眼、詩句修辭等領域知識,提高辨識率。

參考文獻

[1] Chih-Chung Chang and Chih-Jen Lin, LIBSVM : a library for support vector machines (2001). Software available at http://www.csie.ntu.edu.tw/~cjlin/libsvm [2] Gerard Escudero and Lluís Màrquez and German Rigau (2004),“An Empirical

Study of the Domain Dependence of Supervised Word Sense Disambiguation Systems.”Joint SIGDAT Conference on Empirical Methods in NLP and Very Large Corpor, Hong Kong.

[3] Ling-Yan Li, Zhong-Shi He, Yong Yi(2004), “Poetry Stylistic Analysis Technique Based on Term Connections.” IEEE, 0-7803-8403-2.

[4] Keh-Jiann Chen, Shu-Ling Huang, Yueh-Yin Shih, Yi-Jun Chen(2005),

“Extended-HowNet: A Representational Framework for Concepts” , In

Proceedings of IJCNLP-05 Workshop on Lexical Semantic, Jeju Island, South Korea, p.p 1-6.

[5] Yong Yi, Zhong-Shi He, Liang-Yan Li, Tian Yu, Elaine Yi (2005), “Advanced studies on traditional Chinese Poetry style identification.” In Proceedings of the Fourth International Conference on Machine Learning and Cybernetics,

Guangzhou, China, vol.5, pp. 2936- 2939.

[6] Zhong-Shi He, Wen-Ting Liang, Liang-Yan Li, Yu-Fang Tian(2007), “SVM-Based Classification Method For Poetry Style.” IEEE, 1-4244-0973-X

[7] Rada Mihalcea(2007), “Using Wikipedia for Automatic Word Sense

Disambiguation.” In Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies.

[8] Likun Qiu, Weishi Zhang, Changjian Hu, Kai Zhao(2009),“A Self-Supervised Model for Sentiment Classification.” Proceedings of CIK’09, November2-6, Hong

[9] Xiaojun Wan (2009), “Co-Training for Cross-Lingual Sentiment Classification.” In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP, Suntec, Singapore, pp. 235–243.

[10] Mitesh M. Khapra, Salil Joshi, Arindam Chatterjee, Pushpak Bhattacharyya(2011),

“Together We Can: Bilingual Bootstrapping for WSD.” Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, page 561-569.

[11] 顏崑陽,喜怒哀樂,台北市,月房子,1994。

[12] 許清雲,部編大學用書-近體詩創作理論,臺北市:洪葉文化,1997。

[13] 俞士汶,胡俊峰,“唐宋詩之詞匯自動分析及應用”,北京大學,博士論文,

2003 年 8 月。

[14] 朱我芯,「深秋猿鳥來心上,夜靜松杉到眼前」─華文詩歌情境再現,第五屆 全球華文網路教育國際研討會,台北,2007 年 6 月。

[15] 孫瑛澤,陳建良,劉峻杰,劉昭麟,蘇豐文,“中文短句之情緒分類”,第 22 屆自然語言與語音處理研討會,南投,台灣,2010 年 9 月。

[16] 柯淑津,黃居仁,洪嘉馡,劉詩音,簡卉伶,蘇依莉,“中文詞義全文標記 語料庫之設計與雛形製作”,第十九屆自然語言與語音處理研討會,2007 年 9 月,台灣大學,台灣。

[17] 羅鳳珠,“植基於中國詩詞語言特性所建構之語意概念分類體系研究”,第 九屆海峽兩岸圖書資訊學學術研討會,武漢大學,2008 年 7 月 3-6 日。

[18] 易勇,何中市,李良炎,周建勇,瞿義玻,“基於遺傳演算法改進詩詞風格 判斷的研究”,重慶大學,2005 年,計算機科學,32 捲,7 號。

[19] 劉博榮,“近體詩自動分類研究”,國立交通大學,碩士論文,2010 年 8 月。

[20] 陳紹宜,“建構一個中文對聯創作的知識評價架構”,國立交通大學,碩士 論文,2010 年 6 月。

附錄

特徵選取結果-情愛閨怨

特徵選取結果-邊塞征戰

情感詞彙辨識結果

喜樂 怨怒 哀愁

詞彙 權重 詞彙 權重 詞彙 權重

0.944 夜長 0.941 0.947

0.938 家住 0.914 0.9

上苑 0.93 胡天 0.914 0.868

歡娛 0.93 長恨 0.914 相逢 0.868

0.921 獨眠 0.914 風塵 0.843

0.921 誰謂 0.914 0.827

0.909 0.914 0.827

歸來 0.893 0.914 0.827

退 0.893 任他 0.914 不堪 0.827

0.883 飄零 0.914 生涯 0.827

0.87 0.914 0.827

日暖 0.87 猶在 0.914 依依 0.807

0.87 無才 0.914 0.807

梅花 0.87 蓬山 0.914 茫茫 0.807

0.87 0.914 不勝 0.807

0.87 入夢 0.889 0.782

0.87 0.889 白頭 0.782

不是 0.87 0.889 往事 0.782

0.87 0.888 0.782

光輝 0.87 0.864 0.782

在文檔中 近體詩主題辨識系統研製 (頁 35-41)

相關文件