第五章 個人化閱讀焦慮預測模型
第二節、 個人化閱讀焦慮預測決策樹
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表5.4 學習者閱讀焦慮量表分數 表5.5 學習者閱讀焦慮程度轉換
座 號
性別 A1 A2 A3
0 boy 46 48 49 08 boy 63 62 58 13 boy 57 48 58 30 girl 60 76 75 31 girl 79 76 72 35 girl 83 78 77
座 號
性別 A1 A2 A3
07 boy low low low 08 boy middle middle middle 13 boy middle low middle 30 girl middle high high 31 girl high igh high 35 girl hi h high high
第二節、 個人化閱讀焦慮預測決策樹
為更有效且精準的預測出學習者個人閱讀焦慮程度,本研究採用C4.5 決策 樹演算法,該演算法繼承了ID3 決策樹演算法的優點,並修正部份先前演算法的 不足,具有不錯的預測推論能力。本研究利用WEKA 進行基於決策樹之個人化 閱讀焦慮預測模型建模,透過蒐集樣本的訓練,本研究共建置了三棵基於考量不 同閱讀標註行為特徵之閱讀焦慮預測模型決策樹,並同時採用三棵決策樹進行預 測,再利用三種預測結果進行投票後輸出預測的結果,以下將分別詳述三棵決策 樹建模的步驟與所得決策樹預測規則。
一、 決策樹 I
本決策樹係利用學習者閱讀文章A 之標註行為,搭配該篇文章之學習者閱 讀焦慮程度量表填答資料,整理成訓練樣本後,再進行此一決策樹的建置。為有 效提高此一決策樹預測的準確率,本研究以(1)資料前處理;(2)閱讀標註行 為因素與閱讀焦慮關聯性分析;(3)性別焦慮程度差異分析(4)決策樹建置三 步驟進行建模,以下分別詳述各步驟處理之細節。
1.
資料前處理為避免決策樹建模準確率受到不正確訓練樣本的影響,本研究剔除八位學習 者在閱讀文章A 之閱讀標註行為資料,列舉如表 5.6 所示。這八位學習者分別處 於不同閱讀焦慮狀態,然而卻在文章A 閱讀過程均僅有一筆標註或未進行任何 標註,為避免這些樣本影響決策樹的準確率,本研究予以刪除。
‧
5.7 所示。結果發現「評論」類型標註與閱讀焦慮達顯著負相關(p=0.048<0.05),相關係數為-.471;而在「被他人回應」標註行為因素與閱讀焦慮亦達到顯著正相 關(p=0.032<0.05),相關係數為.507;此外,「標註互動總次數」與閱讀焦慮也接 近顯著性正相關(p=0.061>0.05),相關係數為.45。從上述分析結果可以得知,「評 論」、「被他人回應」及「標註互動總次數」三種閱讀標註行為因素與學習者閱讀
Pearson 相關
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
*. 在顯著水準為0.05 時 (雙尾),相關顯著。
**. 在顯著水準為0.01時 (雙尾),相關顯著。
3.
決策樹 I 性別焦慮程度差異分析從表5.8 中可以發現,在決策樹 I 中男女生在英語閱讀焦慮程度上達到顯著 性的差異,因此為使決策樹準確率更為精準,本研究將於決策樹I 中加入學習者 性別因素來進行決策樹的建模。
表5.8 決策樹 I 性別焦慮程度差異分析 變異數相等的
Levene 檢定 平均數相等的 t 檢定
F 檢定 顯著性 t
自由 度
顯著性 (雙尾)
平均差 異
標準誤 差異
差異的 95%
信賴區間 下界 上界 a1焦慮
分數
假設變異數 相等
.020 .889 -2.859 16 .011 -12.830 77
4.48750 -22.343 84
-3.317 70 不假設變異
數相等
-2.529 5.926 .045 -12.830 77
5.07259 -25.280 64
-.3809 0
4.
決策樹 I 建模結果藉由上一步驟中分析的結果,除了考量「評論」、「被他人回應」及「標註互 動總次數」三種閱讀標註行為因素外,本研究另外加入學習者性別因素進行決策 樹的建模,建模完成的決策樹I 架構,如圖 5.1 所示。此決策樹訓練樣本個數共 18 個,採用 K-fold cross-validation(K=10)進行決策樹預測正確率評估,結果 顯示預測準確率為72.2%,詳細預測規則如表 5.9 所示。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖5.1 決策樹 I 建置結果
根據過去文獻指出,高層次閱讀策略使用程度與閱讀焦慮之間具有顯著的負 相關,因此,從決策樹I 建置結果中可以得知,在評論類型使用程度較低時,則 會有較高的閱讀焦慮程度。此外,本研究將進一步從決策樹I 中歸納閱讀焦慮減 緩輔助策略提供給教師參考及進行輔助,針對圖5.1 中紅色星號預測路徑,本研 究將於系統提供「鼓勵學習者多瀏覽他人標註並使用評論標註類型」策略建議回 傳給教師參考。
表5.9 決策樹 I 預測規則
DECISION TREE I
Rule I_1:IF comment <=0.5 and Sex = boy ,then anxiety level = Middle.
Rule I_2:IF comment <=0.5 and Sex = Girl ,then anxiety level = High.
<= 0.5
comment
> 0.5
Low Anxiety
Sex
girl boy
High Anxiety Middle Anxiety N=3
mean :53.33
N=5 mean :72
N=10
mean :52
N=18 Total mean : 59.11
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
二、 決策樹 II
本決策樹採用學習者閱讀文章A 與文章 B 閱讀標註行為紀錄,並搭配學習 者閱讀焦慮量表填答結果,整理而成決策樹建模訓練樣本。在整理決策樹II 的 學習者建模所需訓練資料時發現,所得女生訓練樣本多半為高焦慮程度,而男生 多半為低焦慮程度,顯示訓練樣本中性別因素與閱讀焦慮程度有極大的關聯性。
因此,在建置此一決策樹過程中,分別將男女學習者訓練樣本分開,並分別進行 決策樹II-男性與決策樹 II-女性的焦慮預測模型建模,最後再將兩決策樹合併成 為決策樹II。決策樹 II 建置過程說明如下:
1.
資料前處理學習者在閱讀文章B 閱讀標註行為紀錄中,「被他人回應」與「回應他人」
兩種閱讀標註行為因素皆未被學習者使用,因此為提高決策樹預測結果的正確性,
本研究刪除這兩種閱讀標註行為因素。除此之外,為使決策樹II 預測正確性不 受到不正確訓練樣本的影響,本研究刪除男女兩組各八位和九位學習者的閱讀標 註行為紀錄,如表5.10 所示。這些不同焦慮程度的學習者在文章閱讀完成後僅 有一筆標註或者無任何標註行為紀錄,為避免這些資料影響決策樹建模的預測正 確性,因此予以刪除。
表5.10 決策樹 II 建模刪除不正確樣本資料前處理
座 號
性別 螢光 標示
翻譯 評論 標註總 次數
被標示 喜愛
喜愛他 人次數
互動總 次數
焦慮程 度
14 boy 0 0 0 0 0 0 0 high 15 boy 1 0 0 1 0 0 0 high 17 boy 0 0 0 0 0 0 0 low 05 boy 1 0 0 1 0 0 0 middle 14 boy 0 0 0 0 0 0 0 high 15 boy 0 0 0 0 0 0 0 high 10 boy 0 0 0 0 0 0 0 low 12 boy 0 0 0 0 0 0 0 middle 38 girl 1 0 0 1 0 1 1 low
27 girl 1 0 0 1 0 1 1 low 30 girl 0 0 1 1 0 0 0 middle
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
34 girl 0 0 0 0 0 0 0 middle 36 girl 0 0 0 0 0 1 1 low 29 girl 0 0 0 0 0 0 0 middle 38 girl 0 0 0 0 0 0 0 high 34 girl 1 0 0 1 0 0 0 high 27 girl 1 0 0 1 1 0 1 low
2.
閱讀標註行為因素與閱讀焦慮關聯性分析同樣的,在進行決策樹建模之前,本研究將男女生閱讀標註行為因素與焦慮 分數分別進行相關性分析,以找出影響閱讀焦慮程度的關鍵閱讀標註行為因素,
結果顯示男生部份並未有閱讀標註行為因素與閱讀焦慮程度達到顯著性的相關,
如表5.11 所示。但是女生部份在「螢光標示」標註行為因素與閱讀焦慮程度接 近顯著正相關;而「喜愛他人」標註行為因素雖未達到統計上顯著相關,但從兩 者之間的皮爾森相關係數來看,仍具有中低度的相關性存在,如表5.12 所示。
因此,在男生與女生決策樹建置因素選擇上,本研究著重於前述兩個較具有關聯 性的標註行為因素進行決策樹的建置。
表5.11 決策樹 II-男生閱讀標註行為因素與閱讀焦慮程度相關性分析
螢光
標示 翻譯 評論
標註總 次數
被標示 喜愛
喜愛 他人 標註
互動總 次數
焦慮 分數 焦慮分數 Pearson
相關
-.020 .282 -.145 .199 .201 .256 .348 1
顯著性 (雙尾)
.926 .193 .508 .362 .359 .238 .103
個數 23 23 23 23 23 23 23 23
**. 在顯著水準為0.01時 (雙尾),相關顯著。
‧
-3.311 20.75 0
.003 -10.39 855
採用K-fold cross-validation(K=10)進行決策樹預測正確率評估,其預測結 果準確率達60.87%(N=14),錯誤率 39.13%(N=9);而決策樹 II-女性部份 其訓練樣本數共12 個,其預測結果準確率達 83.33%(N=10),錯誤率 16.67
%(N=2)。本研究合併兩決策樹得到如圖 5.2 所示之決策樹 II。決策樹 II 平
‧
Boy N=23
Mean : 50.89Girl N=12
Mean : 54,445Total N=35
Mean : 52.67‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
系統進行閱讀輔助,而在另外一總互動程度較高路徑中,因其學習者閱讀能力較 差,因此多半傾向於與其他學習者進行閱讀互動。而在翻譯類型使用程度介於 0.083與0.5之間之決策樹路徑結果符合過去文獻指出,閱讀焦慮程度較高學習者 傾向使用較低層次閱讀策略,然而在翻譯類型使用程度大於0.5預測路徑中,與 過去文獻明顯不符合,此預測路徑本研究將於後續討論章節中進一步探討。另外,
在女生因素預測路徑中,標示他人標註為喜愛程度越高則其閱讀焦慮程度越低,
此預測路徑與過去文獻所指出相符。
針對上述決策樹結果,本研究從中歸納三閱讀焦慮減緩輔助策略如下,首先,
針對標註程度小於等於0.083且互動總程度大於0.455路徑中學習者,本研究推論 其閱讀能力普遍較差,因此將鼓勵學習者試著使用翻譯標註類型來熟悉文章內容。
而針對翻譯類型使用程度介於0.083與0.5之間之決策樹路徑中,將提醒學習者避 免一昧的使用翻譯標註類型,並要求學習者多瀏覽其他學習者標註內容及多與其 他學習者互動。最後,針對女性因素中標示他人標註喜愛較少決策樹路徑,其輔 助策略為鼓勵學習者多去瀏覽他人標註並多利用標示喜愛等標註互動。
表5.14 決策樹 II 預測規則
DECISION TREE II
Rule II_1:IF Sex = Boy and translation <= 0.083 and Interactive total <=0.455 ,then anxiety level = Low.
Rule II_2:IF Sex = Boy and translation <= 0.083 and Interactive total >0.455 ,then anxiety level = Middle
Rule II_3:IF Sex = Boy and translation > 0.083 and translation <= 0.5 ,then anxiety level = Middle.
Rule II_4:IF Sex = Boy and translation > 0.083 and translation > 0.5 ,then anxiety level = Low.
Rule II_5:IF Sex = Girl and Like to <=0.3 ,then anxiety level = High.
Rule II_6:IF Sex = Girl and Like to >0.3 ,then anxiety level = Middle.
‧
‧
Pearson 相關
5.410 .032 -3.073 18 .007 -11.980 92
3.89828 -20.170 89
-3.790 94 不假設變異
數相等
-2.875 10.95 7
.015 -11.980 92
4.16717 -21.157 17
-2.804 66
4.
決策樹 III 建模結果經由上述閱讀焦慮程度與標註行為因素相關性的分析結果,本研究進行決策 樹III 的建模,訓練樣本個數共 20 個,採用 K-fold cross-validation(K=10)進 行決策樹預測正確率評估,結果如圖5.3 所示。此一決策樹預測閱讀焦慮程度的 準確率為70%(N=14),錯誤率 30%(N=6),決策樹詳細預測規則如表 5.18 所 示。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
圖5.3 決策樹 III 建置結果
從決策樹III結果中看來,在男性因素中預測路徑與過去文獻相符,學習者標 註被標示喜愛程度越高,顯示其標註內容較具閱讀知識內容,因此推測其閱讀能 力較好並處於較低閱讀焦慮程度。而在女性因素中顯示,雖與過去文獻不符,然 而進一步檢視其閱讀學習表現,本研究推測其為過去文獻中所指出促進性焦慮學 習者,其閱讀學習表現與閱讀焦慮程度皆較高,然而因其閱讀能力較好所標註得 標助益教具知識內容,所以在被標註喜愛程度上較高。針對上述決策樹規則,本 研究從中歸納其閱讀激將低輔助策略為鼓勵學習者多瀏覽他人標註並與他人互
從決策樹III結果中看來,在男性因素中預測路徑與過去文獻相符,學習者標 註被標示喜愛程度越高,顯示其標註內容較具閱讀知識內容,因此推測其閱讀能 力較好並處於較低閱讀焦慮程度。而在女性因素中顯示,雖與過去文獻不符,然 而進一步檢視其閱讀學習表現,本研究推測其為過去文獻中所指出促進性焦慮學 習者,其閱讀學習表現與閱讀焦慮程度皆較高,然而因其閱讀能力較好所標註得 標助益教具知識內容,所以在被標註喜愛程度上較高。針對上述決策樹規則,本 研究從中歸納其閱讀激將低輔助策略為鼓勵學習者多瀏覽他人標註並與他人互