Holistic Scoring–整體評鑑

第四章、中文評分的系統設計

4.3 Holistic Scoring–整體評鑑

如下圖 12 所示，在此模組中，文章的整體評鑑分為兩部份：首先擷取出測試文章的各類特徵屬性(attribute)，並依貝氏機器學習法的機率值來評估文章的層級，接著再以系統制定的規則(rules)來做更進一步的文章層級確認，最後

Main

Area ^-3d

-2d -d Probability

5 6 13 18 19 20 21 α

則可得到一整體評鑑分數。

圖表 12：整體評鑑架構圖

4.3.1 貝氏機器學習法(6 項特徵)

在 2.2 節中提到，在貝氏機器學習法中，假設所有的輸入屬性間彼此獨立，

且各項屬性皆具同等重要性。因此，當測試文章輸入後，即擷取系統所需的直接與間接特徵做為貝氏機器學習法的輸入屬性，包括概念數、字數、名詞數、主題數、平均段落字數及口語化程度等六項特徵。

根據公式，

) (

) ( )

| ) (

( P d

H P H d d P

P _i = ⁱ ⁱ ，1 ≤ i ≤ 6 在本系統中，各項次代表意義分述如下：

P(d)：在所有訓練文章中，出現 d 屬性的機率

P(H_i)：測試文章屬於 i 類別的事前機率(prior probability)

I. 從作文的分段角度來看，較佳的寫作分段方式為『起、承、轉、合』

四段，其中首段『起』代表文章的開頭，主要用意為提綱挈領，引領閱讀者進入主題，字數不宜過多。因此，本系統由高分文章的訓練資料中，訓練出一首段字數的門檻值(threshold)，當測試文章的首段字數超過此一門檻值，則酌情扣分。而以分段數量的角度來看，當分段方式過多或過少，皆為較差的寫作方式；而根據訓練資料的觀察，這樣的極端分段方式僅出現於低分文章，因此，當測試文章的分段數量過多或過少，則一律視為低分文章。

II. 文章內容的好壞，可由其名詞分佈略知一二；好的文章，對於各個主題間的組織描述，必為條理式的安排，而非毫無章法、胡亂拼湊一番；

因此，在好的文章中，用以描述的主體名詞必定是較均勻分佈於各個議題中，而並非將所有的名詞全部擠壓於某一段落中。因此本系統由高分文章的訓練資料中，訓練出一段落與名詞間該有的比例界限，用以作為成為高分文章的必要條件。

III.好的文章內容，其描述的手法必為多樣化，若能利用許多不同的角色串場則能豐富文章內容；但描述的手法若只是一直繞著同樣的主體打轉，文章則顯枯燥乏味。當文章中，同樣的名詞反覆出現多次，往往顯示該篇文章內容單調，仍待加強。因此本系統由高分文章的訓練資料中訓練出名詞使用重覆的比例界限，用以作為判定內容好壞的準繩。

IV. 一篇文章的字數多寡，雖不是閱卷老師最重要的評分依據，但卻深深影響閱卷老師的第一印象。在觀察的過程中，我們發現，字數多的文章雖不見得必為高分，但字數過少的文章大都屬於較差的文章。有鑑於此，本系統由低分文章中統計出一字數門檻，當文章字數低於此最低限度者，皆視為低分文章。

在文檔中基於貝氏機器學習法之中文自動作文評分系統 (頁 25-29)

第四章、 中文評分的系統設計

4.3 Holistic Scoring–整體評鑑

4.3.1 貝氏機器學習法(6 項特徵)

第四章、中文評分的系統設計