第四章、 中文評分的系統設計
4.3 Holistic Scoring–整體評鑑
如下圖 12 所示,在此模組中,文章的整體評鑑分為兩部份:首先擷取出測 試文章的各類特徵屬性(attribute),並依貝氏機器學習法的機率值來評估文章 的層級,接著再以系統制定的規則(rules)來做更進一步的文章層級確認,最後
Main
Area -3d
-2d -d Probability
5 6 13 18 19 20 21 α
則可得到一整體評鑑分數。
圖表 12:整體評鑑架構圖
4.3.1 貝氏機器學習法(6 項特徵)
在 2.2 節中提到,在貝氏機器學習法中,假設所有的輸入屬性間彼此獨立,
且各項屬性皆具同等重要性。因此,當測試文章輸入後,即擷取系統所需的直接 與間接特徵做為貝氏機器學習法的輸入屬性,包括概念數、字數、名詞數、主題 數、平均段落字數及口語化程度等六項特徵。
根據公式,
) (
) ( )
| ) (
|
( P d
H P H d d P
H
P i = i i ,1 ≤ i ≤ 6 在本系統中,各項次代表意義分述如下:
P(d):在所有訓練文章中,出現 d 屬性的機率
P(Hi):測試文章屬於 i 類別的事前機率(prior probability)
I. 從作文的分段角度來看,較佳的寫作分段方式為『起、承、轉、合』
四段,其中首段『起』代表文章的開頭,主要用意為提綱挈領,引領 閱讀者進入主題,字數不宜過多。因此,本系統由高分文章的訓練資 料中,訓練出一首段字數的門檻值(threshold),當測試文章的首段字 數超過此一門檻值,則酌情扣分。而以分段數量的角度來看,當分段 方式過多或過少,皆為較差的寫作方式;而根據訓練資料的觀察,這 樣的極端分段方式僅出現於低分文章,因此,當測試文章的分段數量 過多或過少,則一律視為低分文章。
II. 文章內容的好壞,可由其名詞分佈略知一二;好的文章,對於各個主 題間的組織描述,必為條理式的安排,而非毫無章法、胡亂拼湊一番;
因此,在好的文章中,用以描述的主體名詞必定是較均勻分佈於各個 議題中,而並非將所有的名詞全部擠壓於某一段落中。因此本系統由 高分文章的訓練資料中,訓練出一段落與名詞間該有的比例界限,用 以作為成為高分文章的必要條件。
III.好的文章內容,其描述的手法必為多樣化,若能利用許多不同的角色 串場則能豐富文章內容;但描述的手法若只是一直繞著同樣的主體打 轉,文章則顯枯燥乏味。當文章中,同樣的名詞反覆出現多次,往往 顯示該篇文章內容單調,仍待加強。因此本系統由高分文章的訓練資 料中訓練出名詞使用重覆的比例界限,用以作為判定內容好壞的準繩。
IV. 一篇文章的字數多寡,雖不是閱卷老師最重要的評分依據,但卻深深 影響閱卷老師的第一印象。在觀察的過程中,我們發現,字數多的文 章雖不見得必為高分,但字數過少的文章大都屬於較差的文章。有鑑 於此,本系統由低分文章中統計出一字數門檻,當文章字數低於此最 低限度者,皆視為低分文章。