• 沒有找到結果。

文意理解敘述題自動評估

文意理解敘述題是請學生使用最多三個句子將文章進行重點摘要。本章將介 紹如何對文意理解敘述題,自動評估學生答案和文章語意的符合程度等級。

5-1 教師評分的標準

本研究使用機器學習的方法,由學生答案和文章語意的比對特徵值,建立用 來預測老師評分等級的分類模型,對學生的答案進行語意符合程度自動評分。

本研究參考學測英文非選擇題評分標準,訂定下列評分標準做為評分等級依 據。

表 6 語意摘要評分標準

分數類型 等級 評分標準

語意分數:

單純只看意思內 容,文法、句法結 構等之使用不在 考量範圍

A 主題清楚,並有具體、完整相關細節。

B 主題不夠清楚,部份相關敘述發展不全。

C 主題不明,文不對題或沒寫。

5-2 文意理解敘述題答案評分方法

5-2-1 文章與答案之語意表示模型

透過 4-1 節所介紹建立語意關係的方法,對於文章 A,我們先建立文章的語 意關係圖 GA,假設 GA中的語意節點所成的集合為 node(GA), GA中的語意關係

所成的集合為 edge(GA)。此外,採用 4-2 節所介紹之重要性分數計算方法後, 以得到GA中各語意節點 vi 對應的重要性分數值以 scoreA(vi)表示。

對於一個學生的文章理解敘述題答案,可視為一篇文章,因此也可建構出其

語意關係圖。令 GS表示以學生答案建立的語意關係圖,其中 GS中的語意節點所

成的集合以 node(GS)表示,GS中的語意關係所成的集合以 edge(GS)表示。根據 4-3 節所介紹, GA中的主角詞彙集合以 inode(GA)表示,GS 中的主角詞彙集合為 inode(GS)表示

以圖 3 的範例一為例,我們以雙向的語意關係圖做說明,所形成的語意關係 圖 GA如圖 12(a),圖 12(b)是由圖 11 的學生答案所構成的語意關係圖。表 6(a)是 圖 12(a)所計算出節點的重要性分數值,表 6(b)是圖 12(b)所計算出節點的重要性 分數值。

圖 14 學生答案

Gary’s father is a fifty-four-year old man, Gary’s father successfully runs a Japanese restaurant. Gary’s father is not only the boss but also a cook of that restaurant. It is a popular and nice eating place.

圖 15(a) 文章語意關係圖 GA

圖 15(b) 學生答案語意關係圖 GS

表 7(a) GA節點重要性分數值

表 7(b) GS節點重要性分數值

對應節點 1 2 7 8 9 5

節點 gary 's

father restaurant tall thin handsome cook 重要性分數 1.96 1.25 0.94 0.94 0.94 0.72

對應節點 4 12 3 11 6 10

節點 families and

friends dinner people six days a week

fifty-four

years old glasses 重要性分數 0.52 0.52 0.48 0.48 0.47 0.47

對應節點 1 3 4 5 2

節點 gary 's father restaurant boss cook man 重要性分數 1.57 1.33 0.65 0.65 0.44

5-2-2 比對特徵擷取

F16:score𝐴(rank3(𝐺𝐴))/ ∑𝑣∈𝑛𝑜𝑑𝑒(𝐺𝐴)𝑠𝑐𝑜𝑟𝑒𝐴(𝑣)

的文章,當文章中字詞數量不同可能影響特徵值,因此以 node(GA)的數 量作為分母算出相對比例值。

3. F3 特徵:取 node(GA) 和 inode(GS)兩個集合中相同字詞的數量,但同一 篇文章的答案,當答案中主角詞彙數量不同可能影響特徵值,因此以 inode(GS)的數量作為分母算出相對比例值。

4. F4 特徵:取 inode(GA) 和 node(GS)兩個集合中相同字詞的數量,但不同 的文章,當文章中主角詞彙數量不同可能影響特徵值,因此以 inode(GA) 的數量作為分母算出相對比例值。

5. F5 特徵:取 inode(GA) 和 inode(GS)兩個集合中相同字詞的數量,但同一 篇文章的答案,當答案中主角詞彙數量不同可能影響特徵值,因此以 inode(GS)的數量作為分母算出相對比例值。

6. F6 特徵:取 inode(GA) 和 inode(GS)兩個集合中相同字詞的數量,但不同 的文章,當文章中主角詞彙數量不同可能影響特徵值,因此以 inode(GA) 的數量作為分母算出相對比例值。

(二) 相同節點重要性

節點重要性分數越高,表示節點在語意關係圖中越是重要,因此分別計算文 章語意關係圖 GA和學生答案語意關係圖 GS中相同的節點在 GS和 GA的重要性 分數值,可以得知節點在兩個關係圖中各別的重要性。

1. F7 特徵:取 node(GA) 和 node(GS)兩個集合中相同字詞對應的重要性分 數值的和。但同一篇文章的答案,當答案中字詞數量不同可能影響特徵 值,因此以 node(GS)的數量作為分母算出相對比例值。

2. F8 特徵:取 node(GA) 和 node(GS)兩個集合中相同字詞對應的重要性分 數值的和。但不同的文章,當文章中字詞數量不同可能影響特徵值,因 此以 node(GA)的數量作為分母算出相對比例值。

3. F9 特徵:取 inode(GA) 和 inode(GS)兩個集合中相同字詞對應的重要性分 數值的和。但同一篇文章的答案,當答案中主角詞彙數量不同可能影響 特徵值,因此以 inode(GS)的數量作為分母算出相對比例值。

4. F10 特徵:取 inode(GA) 和 inode(GS)兩個集合中相同字詞對應的重要性 分數值的和。但不同的文章,當文章中主角詞彙數量不同可能影響特徵 值,因此以 inode(GA)的數量作為分母算出相對比例值。

5. F11、F12、F13 特徵:取 node(GS)集合中,對應的重要性分數值最高的 前三名的分數值做為特徵。

6. F14、F15、F16 特徵:取 node(GA)集合中,對應的重要性分數值最高的 前三名的分數值做為特徵。

(三) 相同字詞重要性

透過節點重要性分數可知道關係圖中節點的重要性順序,兩個語意關係圖中 的節點重要性順序越相近,表示關係圖的組成越相似,因此藉由 Mean Reciprocal Rank 統計測量的方法,比對關係圖之間節點的重要性順序。

1. F17 特徵:對於 node(GS)和 node(GA)中共同出現的字詞,根據其在 node(GA)中的重要性排序位置,取倒數後相加得到的特徵值。

2. F18 特徵:對於 node(GS)和 node(GA)中共同出現的字詞,根據其在 node(GS)

中的重要性排序位置,取倒數後相加得到的特徵值。

3. F19 特徵:對於 inode(GS)和 inode(GA)中共同出現的字詞,根據其在 inode(GA)中的重要性排序位置,取倒數後相加得到的特徵值。

4. F20 特徵:對於 inode(GS)和 inode(GA)中共同出現的字詞,根據其在 inode(GS)中的重要性排序位置,取倒數後相加得到的特徵值。

(四) 相同關係字詞

語意關係圖中除了語意節點之外,還有連結語意節點的語意關係,因此兩個 語意關係圖相同的連結關係越多,關係圖越相似。

1. F21 特徵:計算 edge(GA)和 edge(GS)相同的個數。在計算兩個 edge(GA) 和 edge(GS)的交集時,兩個 e 和 e’必須連結相同語意節點,且連結上標 示的動詞相同的才算相同的關係字詞。當答案中連結關係數量不同可能 影響特徵值,因此以 edge(GS)的數量作為分母算出相對比例值。

2. F22 特徵:計算 edge(GA)和 edge(GS)相同的個數。當文章中連結關係數 量不同可能影響特徵值,因此以 edge(GA)的數量作為分母算出相對比例 值。

【範例 5-1】

比對圖 15(a)及圖 15(b)中,相同的語意節點有 Gary’s father、restaurant 和 cook 三個節點,因此相同的語意節點數量為 3。由表 7(a)可看出圖 15(a)的主角詞彙是

Gary’s father 和 restaurant,表 7(b)則表示圖 15(b)的主角詞彙為 Gary’s father 和 restaurant,因此相同的主角詞彙數量為 2。圖 15(a)中的節點與圖 15(b)中的主角詞 彙相同的是 Gary’s father 和 restaurant,因此數量為 2。圖 15(a)中的主角詞彙與圖 15(b)中的節點相同的是 Gary’s father 和 restaurant,因此數量為 2。從表 7 的重要 性分數可觀察到重要性排序,如圖 15(b)的節點在圖 15(a)的排序,Gary’s father 在 表 7(a)中排名為 1,restaurant 排名為 2,cook 排名為 6。因此計算圖 15(a)的節點 在圖 15(a)中的 Mean reciprocal rank 值為(1/1+1/2+1/6)/5,所以 MRR 為 1/3。圖 15(b)中的主角詞彙 Gary’s father 在圖 15(a)中排名為 1,restaurant 排名為 2。因此 計算Mean reciprocal rank 值為(1/1+1/2)/2,所以 MRR 為 3/4。

圖 15(a)及圖 15(b)中,相同的語意節點有 Gary’s father、restaurant 和 cook 三 個節點,在圖 15(a)中對應的語意節點重要性分數為 1.96、0.72 和 1.25,將重要性 分數相加後結果為 3.93。圖 15(a)及圖 15(b)中相同的主角詞彙是 Gary’s father 和 restaurant,在圖 15(a)中對應的語意節點重要性分數為 1.96 和 1.25,主角詞彙的 重要性分數相加後結果為 3.21。

圖 15(a)及圖 15(b)中,相同的語意節點有 Gary’s father、restaurant 和 cook 三 個節點,這些語意節點中的語意關係相同的數量為 2。相同的主角詞彙是 Gary’s father 和 restaurant,語意節點中的語意關係相同的數量為 1。所有的特徵值如表 9 所示。

表 9 範例 5-1 特徵值

特徵 F1 F2 F3 F4 F5 F6 F7 F8

特徵值 0.6 0.25 0.4 0.17 1 1 0.77 0.40

特徵 F9 F10 F11 F12 F13 F14 F15 F16

特徵值 0.59 0.33 1 0.07 1 0.20 1 0.13

特徵 F17 F18 F19 F20 F21 F22

特徵值 0.34 0.14 0.75 0.75 0.2 0.5

5-3 評分模型建立及預測

本研究使用 LIBSVM[3]系統的 classification 方法,評估學生摘要的語意符合 程度,因此會先蒐集一定數量的學生答案與教師的評分做為訓練資料,根據 5-2 小節所提出的特徵,擷取每個答案的特徵後,使用 support vector machine 建立預 測教師評分等級的分類模型,用來對學生答案進行語意符合程度自動評分。

相關文件