概念生成

第四章、實驗結果與討論

4.2 概念生成

在此介紹概念生成部分，HowNet 分層比對法的效能評估。實驗的比照對象為使用完全比對 HowNet 概念定義(DEF)方法找尋關連詞的效果。實驗目的為驗證使用 HowNet 分層比對法後，能改進只完全比對定義的效能，一方面能擴展得到相關概念詞的量，一方面能提升所得相關概念詞的質。實驗之範例如下例所示：

例 1：

對於概念為“急救中心＂

完全比對 HowNet 概念定義之結果如圖 4-1：

圖 4-1：“急救中心＂完全比對法之結果

本系統發展出的 HowNet 分層比對法之傳回結果如圖 4-2：

圖 4-2：“急救中心＂分層比對法之結果

在此可發現，對於一些文章中較少出現的詞，採用對 HowNet 完全比對概念定義(DEF)的方式，很容易會無法在語料庫中找到相對應的詞，因為其定義完全一樣的同義詞，可能都沒出現在系統語料庫中；相對的採用分層比對法，由於可進一步擴展出不同層級的同義詞，故對於語料庫沒有的詞，可由分層出的同義詞中，找出相對應的文章，且維持著和概念一定關連度的效果。

例 2：

概念輸入為“蛀牙＂

完全比對 HowNet 之結果如圖 4-3：

圖 4-3：“蛀牙＂完全比對法之結果

本系統發展出的 HowNet 分層比對法之傳回結果如圖 4-4：

圖 4-4：“蛀牙＂分層比對法之結果

在此例中，我們可發現完全比對法所得到的結果明顯較少，藉由分層比對法所找出的關鍵詞，則可得到較多的相關文章。如圖 4-5 所示，分層比對法除了和

“蛀牙＂相關聯的“蛀齒＂、 “齲齒＂等可找出外，更可找出和“牙齒＂這概念相關的詞，如“牙齒＂、“臼齒＂、“犬齒＂等。在此我們只看比較幾篇回傳結果有差異的部份，即虛線框起的部分。完全比對法所得的文章範例，內文明顯和“蛀牙＂並沒有明顯的關聯，如圖 4-6 所示；而藉由本系統發展的分層比對法的結果範例中，可發現皆是和蛀牙有關的內文，如圖 4-6 和圖 4-7 所示。

W_C=蛀牙 #[3]蟲牙|齲|齲齒|蛀齒|[2][1]板牙|槽牙|大牙|臼齒|門齒|門牙|犬齒|犬牙|

上下牙|牙齒|智齒|獠牙|齙|齙牙|齦|%

圖 4-5：“蛀牙＂分層比對法找出的相關詞

圖 4-6：圖 4-3 中虛線所框起的文章內容

圖 4-7：圖 4-4 中虛線所框起的文章內容

4.3 填充句替換

在此介紹填充句替換系統中，詞性詞義相似度比對的效能實驗。比照對象為無任何相似度比對之結果、單純只比對語意之結果、單純只比對文法之結果。實驗目的為驗證對回傳之填充候選句做綜合詞性、語義比對的效果會優於其它之效果。以下分別對上述三個比照對象做實驗。

例 1：

比照對象：無相似度比對，完全依照 Google 回傳之順序實驗句子：下午[忽然下起了一陣]大雨

圖 4-8：無相似度演算法之對照

上例是尋找關鍵字“下午＂和“大雨＂之替換句“忽然下起了一陣＂。圖 4-7 中左邊是完全無任何演算法處理過，即單純 Google 回傳之結果，右圖則是本系統詞性詞義相似度演算法之結果。可從圖中看出較不恰當的填充句

“Category:傾盆＂的排序明顯的被下降，而最恰當的填充句“有一場超級大的＂和“的時候忽然下起了＂則被排序到最上面，意即這兩個替換句和原替換句相似度最高。

例 2：

比照對象：單純只做 POS 詞性相似度之比對實驗句子：禮拜[四要去染]頭髮

圖 4-9：單純只做詞性相似度之對照

上例是尋找關鍵字“禮拜＂和“頭髮＂之替換句“四要去染＂。圖 4-8 中左邊是單純只比對詞性相似度，右圖則是本系統詞性詞義相似度演算法之結果。很適合當作此例的替換句“四也要去燙＂和“四我要去剪＂，在單純比對詞性的方法中，被排序到了最後，但在本系統的綜合比對下，成功的把此兩句的排序往上提升。

例 3：

比照對象：單純只做詞義的相似度比對實驗句子：開心[的坐上]計程車

圖 4-10：單純只做詞義相似度之對照

上例中，除了套進去能較符合原意的填充句“的很，坐＂、“地，今天搭＂

和“的坐著＂有成功的提高其優先權外，左方很不是合的“心搭了＂，也成功的往下移至最下方。

由以上三個例子可觀察出，由於出發點不同，詞性詞義相似度比對在此替換句系統下的效能很明顯的優於 Google 本身的排序。而單純只比對詞性或是單純只比對詞義，雖然也有一定的效果，但常常在某些情形下效果又不盡理想。故在語意文法相似度方法中，結合此兩種方法，在大多數情況下可成功的維持一定的效能。

4.4 使用者評比

由於本系統是基於生成輔助的角度，能產生貼近使用者期望之文章，並提供適當的輔助，故在此使用者評比的部分，乃是希望從使用者的角度，去對本系統做實用性方面的實驗。

在此的實驗對象包括下列 4 項：

1. 可讀性：包含文章順暢度、語意和邏輯等。

2. 切題：是否貼近部落格類或日記類之文章風格。

3. 概念符合：文章與所期待之概念是否相同。

4. 使用性：使用者對整個系統之設計、簡易使用，若使用者有需求是否會考慮使用本系統。

訂下上述的評分項目後，本系統取“颱風＂、“生日＂、“逛街＂、“感冒＂、“電影＂、“腳踏車＂、“火車＂、“運動＂、“晚餐＂和“學校＂10 種不同的概念，各取其概念生成的文章 2 篇，總計 20 篇文章作文欲評比文章。

然後請 10 人分別對 20 篇文章分別做可讀性、切題、概念符合之評比，評比分數由 1-5 分，越高分代表文章越符合評比條件，反之亦然。再由同樣 10 人，分別使用本系統，對使用性給予一評比分數 1-5 分，分數越高代表系統越方便使用，

反之亦然。結果如表 4-2 所示。

而此實驗的比照對象，中文情書生成系統也隨機產生 20 篇情書文章，由相同 10 人做可讀性、切題和使用性的評比，做為參考比較的數據。結果如表 4-1 所示。

可讀性切題使用性平均值 2.925 3.575 2.857

>=3 63.5% 87.0% 71.4%

表 4-1：中文情書自動產生系統之評比結果

可讀性切題使用性概念符合

平均值 3.445 4.07 4.571 3.83

>=3 86.5% 92.5% 99.9% 89.0%

表 4-2：本系統之評比結果

由表 4-1 及表 4-2 之結果可明顯看出，本系統在可讀性、切題兩方面的效果平分皆比中文情書產生系統要好，期可能之原因除了文章特性不同外，本系統的分類處理也過濾掉了架構、內容較不恰當的文章，進而在組成新文章時，能有較好的效果。而由於本系統式架構在網頁程式上，並盡量減少使用者過多的操控，

優化使用者介面，已達到“防呆＂的效果，故在使用性上也較中文情書自動產生系統要好。而在本系統的概念符合項目上，本系統的分層比對法也達到了近 90%

的效能。

第五章、結論與展望

5.1 研究總結

經過多次實驗與修正，本系統能藉由使用者輔助產生出與其期望相近的文章。其中輔助方面的改進，新加入的概念詞擴展和替換句的比對方法，除了在本系統能達到一定的效果外，也能應用在其它自然語言的問題。而網路擷取並分類處理過的大量語料庫，一方面能過濾掉不必要的雜訊，更能使系統產生出貼近生活且多變化的文章。本系統不但模擬了人們寫作時的狀況，更提供輔助的功能，

以期更貼近使用者的需求。由實驗結果更可瞭解，本系統無論在生成的品質、輔助效能的幫助，都能達到一定程度的效果，更貼近使用者所需。

5.2 未來工作

由於中文在自然語言處理的領域上，一直缺少實用性大的知識庫，以利架構語意的解析。故在未來希望能建立出一套相對應的知識庫，進而改進生成的方法，利用知識庫的輔助，解析出語意來提高生成文章的效果。另一方面，也希望未來能擴大語料庫的資料量，並加以分類成更細部的分類，讓生成的方向能更細部，更貼近不同使用者的不同期望。

參考文獻

[1] Hugo Liu, Push Singh. (2002). “MAKEBELIEVE: Using Commonsense to Generate Stories＂ Proceedings of the Eighteenth National Conference on Artificial Intelligence, AAAI 2002, July 28 - August 1, 2002, Edmonton, Alberta, Canada. AAAI Press, 2002, pp. 957-958.

[2] R Jin. “STATISTICAL APPROACHES TOWARD TITLE GENERATION＂ 2003.

[3] A Belz. “Probabilistic Generation of Weather Forecast Texts＂

Proceedings of NAACL HLT 2007, pages 164–171, Rochester, NY, April 2007.

[4] Fu Ren, Qingyun Du, “Study on Natural Language Generation for Spatial Information Representation＂ Fuzzy Systems and Knowledge Discovery, 2008. FSKD '08. Fifth International Conference on , vol.4, no., pp.213-216, 18-20 Oct. 2008.

[5] 楊昌樺, 高虹安, 陳信希 (2007)。 “以部落格語料進行情緒趨勢分析. ＂第十九屆自然語言與語音處理研討會論文集，2007 年九月 6-7 日，台灣，

台北，205-218。

[6] X. Ni, G. Xue, X. Ling, Y. Yu, and Q. Yang. “Exploring in the weblog space by detecting informative and affective articles.＂ Proceedings of the 16th international conference on World Wide Web, pages 281–290, 2007.

[7] 車萬翔, 劉挺, 秦兵, 李生. “基于改进编辑距离的中文相似句子检索. ＂高技術通訊,2004(7):15-19.

[8] L Dai, B Liu, Y Xia, SK Wu, “Measuring Semantic Similarity between Words Using HowNet.＂ Proceedings of the 2008 International

Conference on Computer Science and Information Technology - Volume

00, Pages 601-605, 2008.

[9] 曾元顯, “中文手機新聞簡訊自動摘要＂, 第十六屆自然語言與語音處理研討會, 台北, 2004 年 9 月 2-3 日, 頁 177-189.

[10] 中央研究院資訊科學研究所詞庫小組中文斷詞系統 URL：http://ckipsvr.iis.sinica.edu.tw/

[11] 張道行，「Automatic Chinese Unknown Word Extraction Using Small-Corpus-Based Method」，國立交通大學，博士論文.(2003) [12] 余思翰，「中文作文寫作輔助系統」，國立交通大學，碩士論文.(2007) [13] 陳智維，「中文情書自動產生系統」，國立交通大學，碩士論文.(2008) [14] Google URL：http://www.google.com.tw/

[15] HowNet 知網 URL：http://www.keenage.com/

[16] 無名小站網誌 URL：http：//www.wretch.cc/blog/

[17] Yahoo!奇摩 URL：http://tw.blog.yahoo.com/

在文檔中線上智慧型文章生成輔助系統 (頁 46-57)

第四章、 實驗結果與討論