知識萃取機制考量因素分析 - 實驗結果與分析 - 合作式閱讀標註之知識萃取機制研究

第六章實驗結果與分析

第三節知識萃取機制考量因素分析

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在這 317 筆標註資料中，「標註分數」的平均數為 1.8184，閱讀理解分數則為 0.5696，敘述統計結果如表 6 - 9 所示。

表 6 - 9 標註分數與閱讀理解分數敘述統計量

個數最小值最大值平均數標準差

標註分數 317 1.335 2.28394 1.8184 .14966 閱讀理解分數 317 .100 1.00000 .5696 .26447

本研究將「標註分數」與閱讀理解分數進行 Pearson 積差相關分析，計算求得 Pearson 相關係數 r = 0.122，雙尾顯著性 p = 0.030 < 0.05，顯示兩者之間呈現顯著的低度正相關。決定係數 r² = 0.014884，表示「標註分數」可以解釋閱讀理解分數 1.49%的變異量。分析結果如表 6 - 10 所示。

表 6 - 10 標註分數與閱讀理解分數的 Pearson 積差相關分析結果標註分數閱讀理解分數 Pearson 相關係數 .122*

顯著性(雙尾) .030

*. 顯著性(雙尾)達到 0.05 的顯著水準。

此一結果顯示「知識萃取機制」所計算出代表標註重要度的「標註分數」確實與實驗對象的閱讀理解分數呈現正相關，但是僅止於低度相關。因此「標註知識萃取機制」計算「標註分數」的方法在一定程度上是有效的。

第三節知識萃取機制考量因素分析

從前一節分析的結果可以確認「知識萃取機制」整體計算方式的有效性，而本節則是從探索未來可以改善「知識萃取機制」的目的著手，希望藉由分析「知識萃取機制」考量的六種因素中，各因素是否能夠反映出實驗對象的閱讀理解分數差異，以作為驗證各因素有效性的依據。

以下將先敘述「標註範圍共識」與「標註喜愛共識」二項標註共識與閱讀理解分數的分析結果，接下來探討「標註範圍長度」、「標註策略類型」、「標註範圍詞性」與「標註範圍位置」四項標註特徵與閱讀理解分數的分析結果。

‧

Pearson 積差相關分析的結果。結果顯示不論是「標註範圍共識」或「標註喜愛共識」，都無法看出與閱讀理解分數有顯著相關。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

獨立樣本 t 檢定分析兩組的閱讀理解分數平均數是否具有顯著差異。

依據上述方法分析之後的結果如表 6 - 14 所示。結果顯示不論是「標註範圍共識」或是「標註喜愛共識」，高共識組與低共識組實驗對象的閱讀理解分數都沒有顯著差異。然而分析結果發現，「標註喜愛共識」中高共識組的閱讀理解分數平均數有高於低共識組的現象。此一結果顯示「標註喜愛共識」仍具有參考價值。未來可以更大的樣本來進行驗證分析。而「標註範圍共識」則沒有顯著差異，

應該從「知識萃取機制」的考量因素中剔除。

表 6 - 14 標註共識平均數分組之閱讀理解分數的獨立樣本 t 檢定摘要表依變項：閱讀理解分數

自變項自變項分組個數平均數標準差 t 值 p 值

標註範圍共識高共識組 103 .5537 .27479 -.742 .459 低共識組 214 .5772 .27479

標註喜愛共識高共識組 55 .5773 .27243 .237 .818 低共識組 262 .5680 .26327

二、標註特徵分析

本節將分析「知識萃取機制」考量因素中的「標註範圍長度」、「標註策略類型」、「標註範圍詞性」與「標註範圍位置」四種標註特徵中，是否能夠反映出實驗對象閱讀理解分數的差異。除了「標註範圍長度」是連續變項之外，其他三種標註特徵都是名義變項，因此在統計分析方法上有所不同。以下逐一說明這四種標註特徵的分析方法與結果。

（一）標註範圍長度與閱讀理解分數相關度分析

「標註範圍長度」是連續變項，單位是字數。可採用與標註共識同樣的方式進行分析。表 6 - 15 為「標註範圍長度」與閱讀理解分數條列的結果舉例，而表 6 - 16 則為 317 筆標註資料的標註範圍長度敘述統計量。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

表 6 - 15 標註範圍長度列表舉例

標註編號標註範圍長度實驗對象編號閱讀理解分數

3112 1 17 .88

3401 1 18 .10

2973 1 19 .94

3353 1 3 .81

…… …… …… ……

表 6 - 16 標註範圍長度敘述統計量

個數最小值最大值平均數標準差

標註範圍長度 317 1 359 23.5237 44.73484

將「標註範圍長度」與閱讀理解分數兩個變項進行 Pearson 積差相關分析之後，結果如表 6 - 17 所示。在分析結果中，Pearson 相關係數 r = -0.115，雙尾的顯著性 p = 0.040 < 0.05，達到 0.05 的顯著水準，亦即「標註範圍長度」與閱讀理解分數呈現顯著的低度負相關。決定係數 r² = 0.013225，表示「標註範圍長度」

變項可以解釋閱讀理解分數變項 1.32%的變異量。

表 6 - 17 標註範圍長度與閱讀理解分數的 Pearson 積差相關分析結果標註範圍長度閱讀理解分數 Pearson 相關係數 -.115*

顯著性(雙尾) .040

*. 顯著性(雙尾)達到 0.05 的顯著水準。

（二）標註策略類型分組與閱讀理解分數差異分析

「標註策略類型」是撰寫標註時選擇的策略，包括「重要」、「質疑」、「困惑」、

「摘要」與「舉例」五種。本研究將具有名義變數特性的「標註策略類型」作為自變項，把 317 筆標註依照「標註策略類型」的不同分成五個組別，並將實驗對象的閱讀理解分數作為依變項，以單因子變異數分析比較各組之間的閱讀理解分數是否具有差異。表 6 - 18 是以「標註策略類型」分組後的組別敘述統計量。

‧

在單因子變異數分析前，必須先進行變異數同質性檢定，Levene 變異數同質性檢定的結果如表 6 - 19 所示，Levene 統計量 F=8.490，顯著性 p = 0.000 < 0.05，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

Brown-Forsythe 法所得到之 F 值為 10.036，顯著性 p = 0.000 < 0.05，也達到顯著水準。而各組別的 F 檢定統計量則是取兩種方法的平均數，即 11.003 作為代表。

根據上述分析結果可以得知「標註策略類型」這五種組別彼此之間有顯著的差異。換句話說，標註本身選擇的「標註策略類型」有所不同，撰寫此標註的實驗對象其閱讀理解分數也具有顯著差異。

表 6 - 20 標註策略類型組別均等平均數的 Robust 檢定結果依變項：閱讀理解分數

統計量^a 分子自由度分母自由度顯著性 Welch 11.970 4 100.042 .000*

Brown-Forsythe 10.036 4 182.540 .000*

a. Asymptotically F distributed.

*. 顯著性達到 0.05 的顯著水準。

3.

事後多重比較

為了深入探究具有顯著差異的組別配對，在此採用事後多重比較法來分析。

因為「標註策略類型」違反了變異數同質性的假設，多重比較需採用 Tamhane 法、Dunnett T3 法、Games-Howell 法或 Dunnett C 法來分析。計算之後發現這四種方法都呈現一樣的結果，在此僅列出以 Tamhane 法所得到的多重比較分析結果，如表 6 - 21 所示。

表 6 - 21 結果中可以發現，使用「摘要」類型組別中，實驗對象的閱讀理解分數平均數顯著的低於其他四種類型組別。其組間平均數差異的細節為：

 「摘要」類別低於「重要」類別的平均數差異為 0.21922 (p = 0.000 < 0.05)；

 「摘要」類別低於「質疑」類別的平均數差異為 0.14690 (p = 0.040 < 0.05)；

 「摘要」類別低於「困惑」類別的平均數差異為 0.15936 (p = 0.002 < 0.05)；

 「摘要」類別低於「舉例」類別的平均數差異為 0.23324 (p = 0.001 < 0.05)。

這是否意味「摘要」的「標註類型策略」對於閱讀理解較沒有幫助，仍有待深入探討。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

經過中文斷詞系統（CKIP）分析的結果，標註可能擁有的「標註範圍詞性」

共有 15 種，各別是「名詞」、「及物動詞」、「感嘆詞」、「不及物動詞」、「名物化動詞」、「定詞」、「副詞」、「介詞」、「外文標記」、「對等連接詞」、「無法辨識」、「非謂形容詞」、「連接詞」、「量詞」與「時態標記」等。依照表 6 - 22 的資料列表，

本研究以「標註範圍詞性」作為自變項，將這 1272 筆標註分成 15 種不同詞性的組別，並將實驗對象的閱讀理解分數作為依變項，以單因子變異數分析檢定各組別的閱讀理解分數是否具有顯著差異。各組別敘述統計量如表 6 - 23 所示。

1.

變異數同質性檢定

首先以 Levene 檢定各組別的閱讀理解分數是否符合變異數同質性假設，檢定結果如表 6 - 24 所示，Levene 統計量 F = 1.059，顯著性 p = 0.319 > 0.05，未達 0.05 顯著水準，表示「標註範圍詞性」這 15 種組別的閱讀理解分數符合變異數同質性的假設。

2.

變異數檢定

在符合變異數同質性假設的情況下，本研究使用 ANOVA 檢定各組別之間的閱讀理解分數是否具有顯著差異。表 6 - 25 ANOVA 檢定結果顯示，統計量 F = 1.773，顯著性 p = 0.038 < 0.05，達到 0.05 顯著水準，應拒絕虛無假設、接受對立假設。亦即不同「標註範圍詞性」的標註組別中，其實驗對象的閱讀理解分數有顯著的差異。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

表 6 - 25 標註範圍詞性組別 ANOVA 檢定結果依變項：閱讀理解分數

平方和自由度平均平方和 F 檢定顯著性組間 1.650 14 .118 1.773 .038*

組內 83.558 1257 .066 總和 85.208 1271

*. 顯著性達到 0.05 的顯著水準。

3.

事後多重比較

為了更進一步探究不同「標註範圍詞性」之間的差異，本研究以事後多重比較找出具有顯著差異的組別配對。在符合變異數同質性假設的前提下，多重比較法有許多的選擇。由於較為嚴謹的 Tukey 法跟 Scheffe 法都無法看出組別之間閱讀理解分數的顯著差異，因此本研究採用最小顯著差異法（Least Significant difference，簡稱 LSD 法）來進行多重比較分析，分析結果如附錄 F 所示。然而 LSD 法造成第一類型錯誤率偏高，易於拒絕虛無假設。因此在參考 LSD 法的分析結果時，需要格外謹慎地使用。

附錄 F 顯示以 LSD 法進行多重比較之後的分析結果，可以發現「名詞」、「定詞」、「外文標記」三種詞性組別中實驗對象的閱讀理解分數，顯著地高於其他詞性組別。重要結果歸納如下：

 「名詞」的閱讀理解分數平均數顯著大於「副詞」、「介詞」、「對等連接詞」

與「連接詞」；

 「定詞」的閱讀理解分數平均數顯著大於「副詞」、「介詞」與「連接詞」；

 「外文標記」的閱讀理解分數平均數顯著大於「名物化動詞」、「副詞」、「介詞」、「對等連接詞」、「非謂形容詞」、「連接詞」與「時態標記」。

在中文斷詞系統 CKIP 的判斷中，「定詞」可作為「名詞」的定語，例如數量定詞、數詞定詞。中文斷詞系統分析中文以外的詞彙時，例如英文，皆會判斷為「外文標記」，而本研究閱讀文章的英文多為「專有名詞」詞彙。換句話說，

不論是「定詞」或「外文標記」，其定位上都接近於「名詞」。亦即可以推論出，

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

當標註的「標註範圍詞性」屬於「名詞」的時候，撰寫此標註的實驗對象其閱讀理解分數有顯著地高於其他種詞性組別的現象。

（四）標註範圍位置分組與閱讀理解分數差異分析

「標註範圍位置」是標註位於段落中不同位置的標記，同樣屬於名義變項。

每一筆標註可能涵括了多種「標註範圍位置」。舉例來說，實驗對象 2 撰寫了編號為 3290 的標註，其標註範圍文字即含括了「開頭」、「接近結尾」兩種位置。

為了分析標註在「標註範圍位置」的不同是否能夠反映出實驗對象的閱讀理解分數差異，在此假設每一筆標註的每一種位置都是由獨立的實驗對象考量後進

在文檔中合作式閱讀標註之知識萃取機制研究 - 政大學術集成 (頁 126-138)

知識萃取機制考量因素分析

第六章 實驗結果與分析

第三節 知識萃取機制考量因素分析

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三節 知識萃取機制考量因素分析

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

二、 標註特徵分析

（一） 標註範圍長度與閱讀理解分數相關度分析

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

（二） 標註策略類型分組與閱讀理解分數差異分析

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

1.

2.

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

3.

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

（四） 標註範圍位置分組與閱讀理解分數差異分析

第六章實驗結果與分析

第三節知識萃取機制考量因素分析

立政治大學

第三節知識萃取機制考量因素分析

立政治大學

二、標註特徵分析

（一）標註範圍長度與閱讀理解分數相關度分析

立政治大學

（二）標註策略類型分組與閱讀理解分數差異分析

立政治大學

立政治大學

立政治大學

立政治大學

（四）標註範圍位置分組與閱讀理解分數差異分析