前言 - 中文自動作文修辭評分系統設計

1.1 研究動機

現今學生語文能力普遍低落，其部份原因在於網路及手機通訊的發達，傳達訊息變得迅速且即時，使得一般學生慣於以簡短且口語化的文字互相溝通，結構嚴謹、詞藻洗鍊的傳統書信因而逐漸被取代，這樣一來便減少了鍛鍊文筆的機會。其次由於升學考試取消作文測驗，學生因而不重視國語文能力的培養。台積電董事長張忠謀先生曾提出「中文優勢論」[10]，在大中國市場興起的時代，中文能力已成為台灣吸引外資的人才優勢。

但是事實上隨著非華語系國家學習中文的人數不斷增加，台灣的中文優勢正逐步消失。

為了改善這個情形，教育部在民國九十三年十月宣佈，國中基本學力測驗將在民國九十五年試辦加考作文，民國九十六年正式實施。

作文可以使學生明瞭本國語言之特質、加強組織及表達概念的能力、強化寫作技巧、亦可增進文藝欣賞及創作之能力。不斷練習寫作可以整理學生從教學中零星片斷所獲得的寫作方法和知識，學生自然能增強寫作能力[2]。

不同老師的背景知識及主觀認知有相當大的差異性，因此批改作文要能有一致性的評分標準並不容易。老師在批改作文時，如果能有自動化的評分系統做為輔助，便可提高閱卷效率及評分的一致性。在西方，英文的自動作文評分系統已有長久的發展，同時也有相當成熟的文法分析工具，但在中文作文的處理上，缺乏文法分析工具，也沒有高效能的評分系統。因此我們希望建立一個自動化的作文評分系統來協助作文的評閱工作。

一般而言，老師批改作文時，主要是以該文是否符合主題、句法是否通順、文章完整性、組織架構、修辭用字等來做為評分的標準。判斷文章是否符合主題通常需要分析

句子及段落對於文章主題在語意上的關聯性。判斷文章句法是否通順需要檢查句子是否符合文法。評估文章完整性及組織架構需要對作文各段落的主要概念之間做語意及連貫性分析。而評估修辭用字則需要觀察各種修辭手法及詞彙的使用技巧。

作文要寫得動人，必然要注重修辭，修辭學探討表答情思的技巧與規則，以期達到精確明瞭、優美生動的境界[1]。本論文針對修辭用字方面，以機器學習的方式來學習老師在修辭學上的評分準則，並且發展自動化的評閱系統來協助閱卷及訓練老師的工作。

1.2 研究假設

在這一節說明一般作文測驗的評分制度，以及本論文對修辭評分工作的兩個假設。

1.2.1 傳統的作文評分方式

一般作文的評量方式是採用級分制[3]，通常為六級分，每份試卷最少由兩名老師評分。老師之間由於背景知識及主觀認知有相當大的差異，常常會影響作文評分時的標準。因此閱卷老師通常要先經過培訓，學習批改及計分的方式，使評分時盡量能達到標準化及符合一致性，以免產生爭議。如果兩名老師評分差異太大，就會找第三人仲裁，

評量出合理的分數。

1.2.2 模擬修辭評分方式

底下將簡略地描述本論文的兩個基本假設：

假設一：

作文評分採級分制，分為六個級分，修辭分數由低到高為一分到六分，雖然每位老師對於作文的評分標準不盡相同，但這個差異也不會非常大，因此我們認為相差一分為可容許的誤差，整個研究的演算法設計及效能評估都是以此為標準。

假設二：

我們認為老師評斷修辭分數時，會觀察文中是否使用各種修辭技巧詞。在描述事情時，使用修辭技法，如譬喻、排比的學生應該有較優秀的修辭水準。本論文探討是否能夠以此為基礎並且以機器學習的方式來實行自動作文評分以協助作文的評分工作。本論文將著重於設計及擷取上述的各項修辭技法來做為機器學習所需要的特徵，並設計有效的機器學習方式。

1.3 研究目的

本研究嘗試建立一個系統，使用改良式 ID3 演算法學習訓練作文中的特徵後，生成決策樹產生規則，並以這些規則評斷測試作文的等級。老師在批改作文時，可以參考此系統所做出的分類來評分。或是以此系統作為輔助工具訓練老師批改作文的技巧。更進一步，在大型考試如基本學力測驗中，需要兩名以上閱卷老師以避免過於主觀造成不公時，加入本修辭評分系統的完整作文評分系統可以取代其中一名老師，這樣便能節省大量的人力以及時間。

1.4 論文架構

第一章為前言，內容著重於說明研究的動機、作文的重要性及所處理的問題。第二章為文獻探討，首先說明英文自動作文評分系統的發展，接下來解釋中文作文處理上的困難、與英文處理之間的差異性。第三章描述各項特徵及擷取方式。第四章提出一個以 ID3 演算法為基礎的改良式演算法。第五章為實驗實作及結果的呈現與分析。第六章為本研究的結論與未來發展。

在文檔中中文自動作文修辭評分系統設計 (頁 9-12)