• 沒有找到結果。

第四章、 實驗結果與討論

4.2 概念生成

在此介紹概念生成部分,HowNet 分層比對法的效能評估。實驗的比照對象 為使用完全比對 HowNet 概念定義(DEF)方法找尋關連詞的效果。實驗目的為驗證 使用 HowNet 分層比對法後,能改進只完全比對定義的效能,一方面能擴展得到 相關概念詞的量,一方面能提升所得相關概念詞的質。實驗之範例如下例所示:

例 1:

對於概念為“急救中心"

完全比對 HowNet 概念定義之結果如圖 4-1:

圖 4-1:“急救中心"完全比對法之結果

本系統發展出的 HowNet 分層比對法之傳回結果如圖 4-2:

圖 4-2:“急救中心"分層比對法之結果

在此可發現,對於一些文章中較少出現的詞,採用對 HowNet 完全比對概念 定義(DEF)的方式,很容易會無法在語料庫中找到相對應的詞,因為其定義完全 一樣的同義詞,可能都沒出現在系統語料庫中;相對的採用分層比對法,由於可 進一步擴展出不同層級的同義詞,故對於語料庫沒有的詞,可由分層出的同義詞 中,找出相對應的文章,且維持著和概念一定關連度的效果。

例 2:

概念輸入為“蛀牙"

完全比對 HowNet 之結果如圖 4-3:

圖 4-3:“蛀牙"完全比對法之結果

本系統發展出的 HowNet 分層比對法之傳回結果如圖 4-4:

圖 4-4:“蛀牙"分層比對法之結果

在此例中,我們可發現完全比對法所得到的結果明顯較少,藉由分層比對法 所找出的關鍵詞,則可得到較多的相關文章。如圖 4-5 所示,分層比對法除了和

“蛀牙"相關聯的“蛀齒"、 “齲齒"等可找出外,更可找出和“牙齒"這概 念相關的詞,如“牙齒" 、“臼齒"、“犬齒"等。在此我們只看比較幾篇回 傳結果有差異的部份,即虛線框起的部分。完全比對法所得的文章範例,內文明 顯和“蛀牙"並沒有明顯的關聯,如圖 4-6 所示;而藉由本系統發展的分層比對 法的結果範例中,可發現皆是和蛀牙有關的內文,如圖 4-6 和圖 4-7 所示。

W_C=蛀牙 #[3]蟲牙|齲|齲齒|蛀齒|[2][1]板牙|槽牙|大牙|臼齒|門齒|門牙|犬齒|犬牙|

上下牙|牙齒|智齒|獠牙|齙|齙牙|齦|%

圖 4-5:“蛀牙"分層比對法找出的相關詞

圖 4-6:圖 4-3 中虛線所框起的文章內容

圖 4-7:圖 4-4 中虛線所框起的文章內容

4.3 填充句替換

在此介紹填充句替換系統中,詞性詞義相似度比對的效能實驗。比照對象為 無任何相似度比對之結果、單純只比對語意之結果、單純只比對文法之結果。實 驗目的為驗證對回傳之填充候選句做綜合詞性、語義比對的效果會優於其它之效 果。以下分別對上述三個比照對象做實驗。

例 1:

比照對象:無相似度比對,完全依照 Google 回傳之順序 實驗句子:下午[忽然下起了一陣]大雨

圖 4-8:無相似度演算法之對照

上例是尋找關鍵字“下午"和“大雨"之替換句“忽然下起了一陣"。圖 4-7 中左邊是完全無任何演算法處理過,即單純 Google 回傳之結果,右圖則是 本系統詞性詞義相似度演算法之結果。可從圖中看出較不恰當的填充句

“Category:傾盆"的排序明顯的被下降,而最恰當的填充句“有一場超級大 的"和“的時候忽然下起了"則被排序到最上面,意即這兩個替換句和原替換句 相似度最高。

例 2:

比照對象:單純只做 POS 詞性相似度之比對 實驗句子:禮拜[四要去染]頭髮

圖 4-9:單純只做詞性相似度之對照

上例是尋找關鍵字“禮拜"和“頭髮"之替換句“四要去染"。圖 4-8 中左 邊是單純只比對詞性相似度,右圖則是本系統詞性詞義相似度演算法之結果。很 適合當作此例的替換句“四也要去燙"和“四我要去剪",在單純比對詞性的方 法中,被排序到了最後,但在本系統的綜合比對下,成功的把此兩句的排序往上 提升。

例 3:

比照對象:單純只做詞義的相似度比對 實驗句子:開心[的坐上]計程車

圖 4-10:單純只做詞義相似度之對照

上例中,除了套進去能較符合原意的填充句“的很,坐"、“地,今天搭"

和“的坐著"有成功的提高其優先權外,左方很不是合的“心搭了",也成功的 往下移至最下方。

由以上三個例子可觀察出,由於出發點不同,詞性詞義相似度比對在此替換 句系統下的效能很明顯的優於 Google 本身的排序。而單純只比對詞性或是單純 只比對詞義,雖然也有一定的效果,但常常在某些情形下效果又不盡理想。故在 語意文法相似度方法中,結合此兩種方法,在大多數情況下可成功的維持一定的 效能。

4.4 使用者評比

由於本系統是基於生成輔助的角度,能產生貼近使用者期望之文章,並提供 適當的輔助,故在此使用者評比的部分,乃是希望從使用者的角度,去對本系統 做實用性方面的實驗。

在此的實驗對象包括下列 4 項:

1. 可讀性:包含文章順暢度、語意和邏輯等。

2. 切題:是否貼近部落格類或日記類之文章風格。

3. 概念符合:文章與所期待之概念是否相同。

4. 使用性:使用者對整個系統之設計、簡易使用,若使用者有需求是否會 考慮使用本系統。

訂下上述的評分項目後,本系統取“颱風"、“生日"、“逛街"、“感 冒"、“電影"、“腳踏車"、“火車"、“運動"、“晚餐"和“學校"10 種不同的概念,各取其概念生成的文章 2 篇,總計 20 篇文章作文欲評比文章。

然後請 10 人分別對 20 篇文章分別做可讀性、切題、概念符合之評比,評比分數 由 1-5 分,越高分代表文章越符合評比條件,反之亦然。再由同樣 10 人,分別 使用本系統,對使用性給予一評比分數 1-5 分,分數越高代表系統越方便使用,

反之亦然。結果如表 4-2 所示。

而此實驗的比照對象,中文情書生成系統也隨機產生 20 篇情書文章,由相 同 10 人做可讀性、切題和使用性的評比,做為參考比較的數據。結果如表 4-1 所示。

可讀性 切題 使用性 平均值 2.925 3.575 2.857

>=3 63.5% 87.0% 71.4%

表 4-1:中文情書自動產生系統之評比結果

可讀性 切題 使用性 概念符合

平均值 3.445 4.07 4.571 3.83

>=3 86.5% 92.5% 99.9% 89.0%

表 4-2:本系統之評比結果

由表 4-1 及表 4-2 之結果可明顯看出,本系統在可讀性、切題兩方面的效果 平分皆比中文情書產生系統要好,期可能之原因除了文章特性不同外,本系統的 分類處理也過濾掉了架構、內容較不恰當的文章,進而在組成新文章時,能有較 好的效果。而由於本系統式架構在網頁程式上,並盡量減少使用者過多的操控,

優化使用者介面,已達到“防呆"的效果,故在使用性上也較中文情書自動產生 系統要好。而在本系統的概念符合項目上,本系統的分層比對法也達到了近 90%

的效能。

第五章、結論與展望

5.1 研究總結

經過多次實驗與修正,本系統能藉由使用者輔助產生出與其期望相近的文 章。其中輔助方面的改進,新加入的概念詞擴展和替換句的比對方法,除了在本 系統能達到一定的效果外,也能應用在其它自然語言的問題。而網路擷取並分類 處理過的大量語料庫,一方面能過濾掉不必要的雜訊,更能使系統產生出貼近生 活且多變化的文章。本系統不但模擬了人們寫作時的狀況,更提供輔助的功能,

以期更貼近使用者的需求。由實驗結果更可瞭解,本系統無論在生成的品質、輔 助效能的幫助,都能達到一定程度的效果,更貼近使用者所需。

5.2 未來工作

由於中文在自然語言處理的領域上,一直缺少實用性大的知識庫,以利架構 語意的解析。故在未來希望能建立出一套相對應的知識庫,進而改進生成的方 法,利用知識庫的輔助,解析出語意來提高生成文章的效果。另一方面,也希望 未來能擴大語料庫的資料量,並加以分類成更細部的分類,讓生成的方向能更細 部,更貼近不同使用者的不同期望。

參考文獻

[1] Hugo Liu, Push Singh. (2002). “MAKEBELIEVE: Using Commonsense to Generate Stories" Proceedings of the Eighteenth National Conference on Artificial Intelligence, AAAI 2002, July 28 - August 1, 2002, Edmonton, Alberta, Canada. AAAI Press, 2002, pp. 957-958.

[2] R Jin. “STATISTICAL APPROACHES TOWARD TITLE GENERATION" 2003.

[3] A Belz. “Probabilistic Generation of Weather Forecast Texts"

Proceedings of NAACL HLT 2007, pages 164–171, Rochester, NY, April 2007.

[4] Fu Ren, Qingyun Du, “Study on Natural Language Generation for Spatial Information Representation" Fuzzy Systems and Knowledge Discovery, 2008. FSKD '08. Fifth International Conference on , vol.4, no., pp.213-216, 18-20 Oct. 2008.

[5] 楊昌樺, 高虹安, 陳信希 (2007)。 “以部落格語料進行情緒趨勢分析. " 第十九屆自然語言與語音處理研討會論文集,2007 年九月 6-7 日,台灣,

台北,205-218。

[6] X. Ni, G. Xue, X. Ling, Y. Yu, and Q. Yang. “Exploring in the weblog space by detecting informative and affective articles." Proceedings of the 16th international conference on World Wide Web, pages 281–290, 2007.

[7] 車萬翔, 劉挺, 秦兵, 李生. “基于改进编辑距离的中文相似句子检索. " 高技術通訊,2004(7):15-19.

[8] L Dai, B Liu, Y Xia, SK Wu, “Measuring Semantic Similarity between Words Using HowNet." Proceedings of the 2008 International

Conference on Computer Science and Information Technology - Volume

00, Pages 601-605, 2008.

[9] 曾元顯, “中文手機新聞簡訊自動摘要", 第十六屆自然語言與語音處理 研討會, 台北, 2004 年 9 月 2-3 日, 頁 177-189.

[10] 中央研究院資訊科學研究所詞庫小組中文斷詞系統 URL:http://ckipsvr.iis.sinica.edu.tw/

[11] 張道行,「Automatic Chinese Unknown Word Extraction Using Small-Corpus-Based Method」,國立交通大學,博士論文.(2003) [12] 余思翰,「中文作文寫作輔助系統」,國立交通大學,碩士論文.(2007) [13] 陳智維,「中文情書自動產生系統」,國立交通大學,碩士論文.(2008) [14] Google URL:http://www.google.com.tw/

[15] HowNet 知網 URL:http://www.keenage.com/

[16] 無名小站網誌 URL:http://www.wretch.cc/blog/

[17] Yahoo!奇摩 URL:http://tw.blog.yahoo.com/

相關文件