第四章 結果與討論
根據前述的研究方法,本章將以第三章第二節所建立 32 種貝氏網路認 知診斷模式為基礎,透過實徵資料的應用,進行本研究第二部分貝氏網路認 知診斷模式診斷正確率之探討,以下將分五個部分進行結果的分析與討論:
第一節呈現使用專家診斷結果與訪談結果的作為本研究之模式評估效標的 一致性,第二節分析貝氏網路認知診斷模式應用於不同評量重點的整體成 效,第三節探討貝氏網路結構與證據型態對模式診斷正確率的影響,第四節 分析設定動態決斷值對模式診斷正確率的影響,第五節則分析訓練樣本的大 小對模式診斷正確率的影響。
第一節 專家診斷結果與訪談結果之一致性分析
首先,爲瞭解專家診斷結果是否適合作為本研究貝氏網路認知診斷模式 之效標,本研究從施測對象中抽取三所學校之 23 名學生進行教學訪談。學 生的訪談結果原案摘要詳見附錄七。透過訪談結果的原案分析,專家診斷結 果與訪談診斷結果之異同整理如附錄八。
由附錄八中,可發現在 23 名受訪學生中,有 12 名學生少部分診斷結果 不一致,其餘皆相當吻合。將所有受訪學生之專家診斷結果與訪談診斷結果 進行相關分析,分析結果如表 4-1-1,顯示相關皆達顯著水準(p<.05),因此,
23 名學生之專家診斷結果與訪談診斷結果在統計上具有一致性。
表 4-1-1 專家診斷結果與訪談結果之相關分析摘要表
個案 相關 個案 相關
1 0.694* 13 1*
2 1* 14 1*
3 0.744* 15 0.849*
4 1* 16 1*
5 0.556* 17 0.849*
6 1* 18 1*
7 1* 19 0.928*
8 0.905* 20 0.849*
9 1* 21 1*
10 0.894* 22 1*
11 0.920* 23 0.801*
12 0..920*
註 1:*表示 p<.05
2:灰色區域表示二種診斷結果有不一致的個案
針對上表中診斷結果不一致的個案加以分析,對照附錄七之原案,發現 高分組(總分85 分)5 位學生中(個案 1、5、15、17、23),5 位(100%)
皆有診斷不一致情況發生,診斷錯誤率最高,從其原案中可進一步發現:此 不一致的產生皆為原先的作答反應呈現錯誤,因此專家判定其具有某種錯誤 類型,但在後來的訪談中卻完全做對。由此顯示高分組學生的錯誤多半是因 為粗心,或一時不注意,並未形成真正的錯誤類型。而中分組(85 分>總分
70 分)9 位學生中(個案 2、3、4、6、13、14、16、20、22),僅有 2 位
(22%)發生診斷不一致情況;低分組(70 分>總分)9 位學生中(個案 7、
8、9、10、11、12、18、19、21),則有 5 位(56%)發生診斷不一致情況。
其不一致的產生與高分組大致相同,多為專家判定其具有某種錯誤類型,但 在後來的訪談中沒有出現。在所有受訪學生中,只有個案 12 出現專家診斷
但在後來的訪談中卻出現錯誤類型 A1 的情況。
此外,將各錯誤類型之二種診斷結果的不一致比率整理如表 4-1-2,可 發現在所有錯誤類型中,以小數數線表示的錯誤類型的診斷不一致性較高,
其中最高者為 D3:「數線單位非分成十等分之小單位指認錯誤」,推測可能 的原因為此部分僅以選擇題方式呈現,未要求學生留下解題過程,因此專家 僅能由學生所選的選項來加以判別,且偵測 D3 的試題是整份測驗的最後一 大題,學生比較容易因不耐煩而憑直覺作答或亂答,而訪談時,因為有老師 的問話引導,學生思考較謹慎且時間也較充裕,因此產生測驗上答錯,訪談 時卻做對的不一致情形。
表 4-1-2 各錯誤類型之診斷結果不一致比率
錯 誤 類 型
A1 A2 A3 A4 A5 A6 A7 A8 A9 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 C1 C2 C3 C4 C5 C6 D1 D2 D3 D4
不 一 致 率
4% 9% 0 0 0 4% 0 0 4% 0 0 0 4% 0 0 0 0 0 0 9% 0 0 0 0 0 13% 0 17% 0
註:灰色區域表示診斷不一致性較高的錯誤類型
整體而言,雖然專家診斷較訪談診斷傾向於判定較多錯誤類型,但就學 習的觀點而言,補救教學若涵蓋較多錯誤類型,即使學生實際上並未犯那麼 多錯誤類型,多補救一些應對學生有益無害,並且由於專家診斷結果與訪談 診斷結果在統計上具有一致性,因此,本研究以專家診斷結果作為本研究貝 氏網路認知診斷模式之效標是適當的,惟專家在進行診斷時,尤其是在選擇 題型的測驗中,需特別留意高分組的學生之錯誤多半是粗心所造成,不穩定 性極高,須訂定更高的標準才能界定為真正具有某種錯誤類型,是故後續本
第二節 固定決斷值之貝氏網路應用於不同評量重點 之成效分析
由於本單元內容分為四個評量重點(小數加法、小數減法、小數的整數 倍以及小數的數線表示),每一個評量重點有 8 種貝氏網路模式,共有 32 種 貝氏網路模式。爲探討貝氏網路應用於不同評量重點之效果,本節將以前述 專家診斷結果作為效標,探討在設定不同的固定決斷值(範圍定為 0.1~0.9)
的情況之下,貝氏網路在不同評量重點的應用成效如何,而後再進行整體成 效之綜合討論。
由於四個評量重點之診斷結果摘要表數量甚多,且結果有許多類似之 處,為了不影響閱讀的流暢性,各評量重點之詳細診斷結果請參見附錄九~
附錄十二。
一、小數加法貝氏網路之診斷結果
小數加法部分的 8 種貝氏網路,設定不同的固定決斷值之診斷正確率如 附錄九所示。以下根據附錄九的附表,將 8 種貝氏網路在不同固定分類決斷 值中,在錯誤類型部份的平均診斷正確率呈現如表 4-2-1,在子技能部份的 平均診斷正確率則呈現如表 4-2-2,其中,灰色區域表示最佳診斷正確率。
表 4-2-1 小數加法貝氏網路之錯誤類型平均診斷正確率 固定決斷值
平均診斷正
確率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分 93.89 96.26 96.85 97.12 97.15 97.12 97.11 97.01 93.89 多選項記
分 97.26 97.83 98.20 98.23 98.20 98.18 98.11 97.91 97.67 IRT 選答
率 96.84 96.71 96.54 96.49 96.46 96.45 96.43 96.43 96.42 NIRT 選
答率 96.74 96.65 96.62 96.59 96.57 96.52 96.49 96.46 96.44 二元記分
+子技能 94.12 96.36 96.89 97.07 97.18 97.10 97.19 97.07 96.98 多選項記
分+子技 能
97.35 97.94 98.20 98.29 98.21 98.20 98.11 97.97 97.76 IRT 選答
率+子技 能
96.85 96.74 96.56 96.51 96.48 96.47 96.43 96.43 96.42 貝
氏 網 路 類 型
NIRT 選 答率+子
技能
96.76 96.66 96.61 96.61 96.58 96.52 96.51 96.47 96.45
表 4-2-2 小數加法貝氏網路之子技能平均診斷正確率 固定決斷值
平均診斷正確
率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分+
子技能 89.84 89.90 90.12 91.14 91.82 92.68 93.21 93.05 78.36 多選項記
分+子技能 90.12 90.49 90.77 90.98 91.78 91.79 91.97 92.06 78.00 IRT 選答
率+子技能 89.76 89.76 89.76 89.76 89.79 89.84 89.91 90.16 77.62 貝
氏 網 路 類
型 NIRT 選答
率+子技能 89.76 89.76 89.76 89.76 89.85 90.02 90.16 90.46 77.57
由附錄九及以上表格中可發現,在小數加法部分:
(一)就錯誤類型的診斷而言,無論設定何種固定決斷值,8 種貝氏網路在 各個錯誤類型之診斷正確率皆高達九成以上,顯示貝氏網路應用於診 斷小數加法之錯誤類型具有相當良好的效果。
(二)就子技能的診斷而言,除了固定決斷值 0.9 之外,4 種加入子技能的 貝氏網路在各個子技能之診斷正確率最低值亦皆接近九成,雖然診斷 正確率不如錯誤類型,但顯示貝氏網路應用於診斷小數加法之子技能 亦具有相當良好的效果。
(三)小數加法的第四個子技能「不進位加法計算」在附錄九的附表 5~附表 8 之 4 個貝氏網路中都是診斷正確率最低的。進一步探討其可能的原 因,除了因為子技能變項位於網路的第三層,屬於間接推論,因此診 斷正確率較低之外,由於專家在診斷子技能有無時,不像診斷錯誤類 型可由選項及解題過程明確判定,必須藉由涉及此子技能的試題答對 情形與錯誤類型來綜合評斷,而由表 3-4-2 中發現偵測此技能的試題 只有 3 題,在本研究中,專家認為學生必須同時答對這三題,才判定 其具有此項子技能,不過這三題其實還涉及到其他的子技能,而且從 理論上來看,其他子技能對這三題對錯的影響程度明顯較第四個子技 能更大,因此由此三題的平均答對率來決定第四個子技能的專家效標 顯然較不適當,因此也降低了此技能的診斷正確率。第五個子技能亦 有相同的現象產生。
(四)參數型 IRT 之貝氏網路的診斷結果與無參數型 IRT 之貝氏網路診斷結 果十分類似,最佳的診斷結果皆出現在較極端的分類決斷值(錯誤類
型為 0.1,子技能為 0.8),並且診斷結果不太受分類決斷值變動的影 響。
二、小數減法貝氏網路之診斷結果
貝氏網路在小數減法部分的診斷情形與小數加法診斷結果類似。小數減 法部分之 8 種貝氏網路,設定不同的固定決斷值之診斷正確率詳見附錄十。
以下僅列出 8 種貝氏網路在不同固定分類決斷值中,在錯誤類型部份的平均 診斷正確率如表 4-2-3,在子技能部份的平均診斷正確率如表 4-2-4。
表 4-2-3 小數減法貝氏網路之錯誤類型平均診斷正確率 固定決斷值
平均診斷正
確率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分 93.12 95.17 95.96 96.08 96.17 96.17 95.79 95.59 95.26 多選項記
分 95.41 96.24 96.58 96.71 96.75 96.82 96.66 96.44 96.44 IRT 選答
率 95.11 95.03 94.96 94.85 94.77 94.72 94.69 94.67 94.65 NIRT 選
答率 95.00 94.93 94.93 94.87 94.86 94.84 94.81 94.79 94.75 二元記分
+子技能 92.87 95.09 95.92 96.10 96.21 96.20 95.89 95.58 95.29 多選項記
分+子技 能
95.36 96.25 96.62 96.81 96.76 96.84 96.71 96.54 96.49 IRT 選答
率+子技 能
95.11 94.99 94.90 94.76 94.75 94.70 94.69 94.67 94.65 貝
氏 網 路 類 型
NIRT 選 答率+子
技能
95.00 94.93 94.90 94.87 94.84 94.82 94.79 94.77 94.73
表 4-2-4 小數減法貝氏網路之子技能平均診斷正確率 固定決斷值
平均診斷正確
率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分
+子技能 84.47 85.24 85.42 85.73 86.98 88.15 89.13 89.10 45.84 多選項記
分+子技 能
85.22 86.08 86.39 86.82 87.83 88.27 88.12 88.95 46.12 IRT 選答
率+子技 能
84.42 84.42 84.42 84.42 84.42 84.53 84.76 85.67 47.32 貝
氏 網 路 類 型
NIRT 選答 率+子技
能
84.42 84.42 84.42 84.47 84.56 84.90 85.31 85.77 46.38
由附錄十及以上表格中可發現,在小數減法部分:
(一)就錯誤類型的診斷而言,無論設定何種固定決斷值,8 種貝氏網路在 各個錯誤類型之診斷正確率皆高達九成以上,顯示貝氏網路應用於診 斷小數減法之錯誤類型亦具有相當良好的效果。
(二)就子技能的診斷而言,除了固定決斷值 0.9 之外,4 種加入子技能的 貝氏網路在各個子技能之診斷正確率皆可達到 84﹪以上,顯示貝氏網 路應用於診斷小數減法之子技能亦具有良好的效果。
(三)如同小數的加法之診斷結果,小數減法的第四、五個子技能診斷表現 較差。由表 3-4-3 發現偵測此二子技能的試題分別只有 3 題及 2 題,
推測此部分診斷較差的原因與前述專家效標設定不適當有關。
(四)在小數減法部分,參數型 IRT 之貝氏網路與無參數型 IRT 之貝氏網路
診斷的成效與小數加法部份類似。
三、小數的整數倍貝氏網路之診斷結果
小數整數倍部分之 8 種貝氏網路,設定不同的固定決斷值之診斷正確率 詳見附錄十一。8 種貝氏網路在不同固定分類決斷值中,錯誤類型部份的平 均診斷正確率整理如表 4-2-5,在子技能部份的平均診斷正確率如表 4-2-6。
表 4-2-5 小數整數倍貝氏網路之錯誤類型平均診斷正確率 固定決斷值
平均診斷正
確率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分 90.16 92.07 92.20 91.83 92.11 92.04 91.86 91.64 90.46 多選項記
分 94.70 96.51 96.70 96.78 96.99 96.79 96.84 96.77 96.02 IRT 選答
率 88.77 89.13 89.13 89.13 89.13 89.13 89.13 89.13 89.13 NIRT 選
答率 88.89 89.13 89.13 89.13 89.13 89.13 89.13 89.13 89.13 二元記分
+子技能 89.83 92.27 92.43 91.90 92.02 91.99 91.70 91.73 90.42 多選項記
分+子技 能
94.66 96.29 96.55 96.73 96.72 96.99 96.70 96.65 96.06 IRT 選答
率+子技 能
88.62 89.13 89.13 89.13 89.13 89.13 89.13 89.13 89.13 貝
氏 網 路 類 型
NIRT 選 答率+子
技能
88.89 89.13 89.13 89.13 89.13 89.13 89.13 89.13 89.13
表 4-2-6 小數整數倍貝氏網路之子技能平均診斷正確率 固定決斷值
平均診斷正確
率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分
+子技能 79.48 82.12 86.72 88.57 89.44 91.77 93.62 90.61 56.62 多選項記
分+子技 能
86.06 86.78 87.21 87.78 89.30 89.35 89.18 90.16 56.10 IRT 選答
率+子技 能
79.27 79.27 79.27 79.27 79.27 79.27 79.27 78.22 55.64 貝
氏 網 路 類 型
NIRT 選答 率+子技
能
79.27 79.27 79.27 79.27 79.27 79.27 79.27 78.72 55.62
由附錄十一及以上表格中可發現,在小數整數倍部分:
(一)貝氏網路在此部分的診斷正確率略低於小數加減法,尤其是以 IRT 選 答率為證據的貝氏網路診斷正確率降低的程度較明顯。
(二)就錯誤類型的診斷而言,無論設定何種固定決斷值,8 種貝氏網路在 各個錯誤類型之診斷正確率皆可達到 88%以上,顯示貝氏網路應用於 診斷小數整數倍之錯誤類型具有相當良好的效果。不過此部分可能因 試題數較少,所得到之平均診斷正確率略低於前述小數加減法部分。
(三)就子技能的診斷而言,如同前兩個評量重點,除了固定決斷值 0.9 之 外,8 種貝氏網路在各個子技能之診斷正確率皆可達到 79﹪以上,顯 示貝氏網路應用於診斷小數整數倍之子技能亦具有良好的效果。
(四)除了多選項記分貝氏網路之外,小數整數倍的第三、四個子技能在整
體診斷表現上差異頗大,尤其在以 IRT 選答率為證據的的貝氏網路 中,診斷結果較差,由表 3-4-4 發現偵測小數整數倍的第三、四個子 技能的試題分別只有 1 題及 2 題,可能因此影響其診斷結果。
(五)在小數整數倍部分,參數型 IRT 之貝氏網路與無參數型 IRT 之貝氏網 路亦出現診斷結果相近,且不易受分類決斷值影響的情形。
四、小數數線表示貝氏網路之診斷結果
小數數線表示部分之 8 種貝氏網路,根據不同的固定決斷值之診斷正確 率詳見附錄十二,不同的貝氏網路在此部分的診斷正確率高低差異最為顯 著。以下亦分別列出 8 種貝氏網路在不同固定分類決斷值中,在錯誤類型和 子技能部份的平均診斷正確率如表 4-2-7 及表 4-2-8 所示。
表 4-2-7 小數數線表示貝氏網路之錯誤類型平均診斷正確率 固定決斷值
平均診斷正
確率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
二元記分 81.49 88.39 90.37 91.01 91.01 90.88 90.38 90.14 88.92
多選項記分 92.07 97.52 97.65 97.76 97.80 97.62 97.28 96.32 95.27
IRT 選答率 74.82 78.88 76.76 75.70 75.35 74.41 74.26 74.22 74.10
NIRT 選答
率 73.06 77.22 73.82 72.82 71.34 70.56 69.07 67.44 64.09
二元記分+
子技能 80.97 88.50 90.51 91.12 90.81 90.85 90.75 90.33 89.39
多選項記分
+子技能 90.50 97.25 97.73 97.80 97.71 97.71 97.26 96.71 95.54
IRT 選答率
+子技能 79.20 78.61 78.22 76.85 75.70 75.41 74.37 74.28 74.06 貝
氏 網 路 類 型
NIRT 選答
表 4-2-8 小數數線表示貝氏網路之子技能平均診斷正確率 固定決斷值
平均診斷正確
率(﹪) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 二元記分
+子技能 60.92 66.57 73.65 80.55 86.86 84.91 69.06 68.47 55.54 多選項記
分+子技 能
65.09 69.95 78.55 80.60 80.52 78.65 68.32 66.72 55.00 IRT 選答
率+子技 能
60.92 60.92 60.97 62.90 68.49 72.04 66.03 66.82 60.37 貝
氏 網 路 類 型
NIRT 選答 率+子技
能
60.92 60.92 61.57 62.87 66.10 71.33 66.79 68.22 56.97
由附錄十二及以上表格中可發現,在小數數線表示部分:
(一)就錯誤類型的診斷而言,8 種貝氏網路在各個錯誤類型之平均診斷正 確率最高可達到 97.8%(多選項記分貝氏網路),最低只有 64.09%(無 參數 IRT 貝氏網路),其中最主要的影響因素在於錯誤類型 D1、D2 的診斷,由表 3-4-9 發現,偵測此二錯誤類型的試題多為重複試題,
因此僅依賴對錯的二元資訊,難以區別是屬於哪一種錯誤類型的類 別,因此只有在給予明確的選項選答資訊後,才能達到最佳的診斷效 果,因此在此部分,多選項記分貝氏網路明顯診斷正確率較佳。
(二)就子技能的診斷而言,在四個評量重點中,此部分的診斷正確率最 差,尤其第三個子技能,僅在二元記分貝氏網路中,固定決斷值設為 0.5~0.6 的情況下有大於 80%診斷正確率,顯示此部分子技能所涉及
之貝氏網路結構、試題的設計以及專家效標之設定皆有必要加以修 正。
(三)在小數數線表示部分,參數型 IRT 之貝氏網路與無參數型 IRT 之貝氏 網路亦出現診斷結果相近,且不易受分類決斷值影響的情形。
五、綜合討論
整體而言,綜合以上之分析可知:
(一)在錯誤類型診斷部分,不同評量重點之 32 種貝氏網路的最佳平均診 斷正確率皆在 75%以上。所有貝氏網路在錯誤類型的診斷上都有相當 良好的表現。
(二)在子技能診斷部分,其結果雖不如錯誤類型的診斷精確,但最佳平均 診斷正確率亦可達到約 70%以上的正確診斷率。
(三)就固定式分類決斷值的設定而言,在不同評量重點中,發現若以平均 診斷正確率來看,則二元記分與多選項記分貝氏網路之錯誤類型最佳 固定分類決斷值設定多出現於 0.4~0.7 之間,而子技能之最佳固定分 類決斷值設定大多出現於 0.7~0.8,IRT 型的貝氏網路之最佳固定分類 決斷值大多出現於較極端的分類決斷值。
(四)就個別錯誤類型與子技能之診斷而言,在所有的貝氏網路中並未發現 一致的最佳固定決斷值,亦即能使每個錯誤類型與子技能達到最佳診 斷正確率的分類決斷值均不相同,此結果與 Shih & Kuo(2005)以及許 雅菱(2005)的研究結果一致。
(五)參數型 IRT 之貝氏網路與無參數型 IRT 之貝氏網路所得到的診斷結果
第三節 不同的貝氏網路結構與證據型態 對診斷正確率之影響
本節根據附錄九~附錄十二所呈現之 32 種貝氏網路的診斷正確率,進一 步探討不同的學生模式與輸入不同的證據模式對貝氏網路診斷正確率的影 響。在本研究中不同的學生模式是指有無加入子技能變項所獲得之不同的貝 氏網路結構,而不同的證據模式則是指使用二元記分作答資料、多選項記分 作答資料、參數型 IRT 選答率以及無參數型 IRT 選答率四種不同的反應資料 作為證據,以進行貝氏網路中錯誤類型與子技能的後驗機率之推論。
一、不同的學生模式對貝氏網路診斷正確率的影響
對照附錄九之附表 1 與附表 5、附表 2 與附表 6、附表 3 與附表 7、附 表 4 與附表 8 之錯誤類型診斷正確率,可發現在小數加法的部分中,所有網 路均顯示加入子技能的貝氏網路結構對錯誤類型的最佳平均診斷正確率有 提昇的效果,但影響的程度很小,將附錄十~附錄十二的附表兩兩對照分析 之後亦發現相同的結果(彙整如表 4-3-1)。因此加入子技能的貝氏網路結構 對錯誤類型的診斷非但不會產生不利的影響,反而有助於提供更多的診斷資 訊,此結果與 Lee(2003)的研究結果吻合。
表 4-3-1 加入子技能變項對錯誤類型最佳平均診斷正確率的影響
網路類型
評量重點
二元記分貝氏 網路
多選項記分貝 氏網路
參數型 IRT 貝 氏網路
無參數型 IRT 貝氏網路
小數加法
97.15%
↓ 97.19%
98.23%
↓ 98.29%
96.84%
↓ 96.85%
96.74%
↓ 96.76%
小數減法
96.17%
↓ 96.21%
96.82%
↓ 96.84%
95.11%
↓ 95.11%
95.00%
↓ 95.00%
小數的整數倍
92.20%
↓ 92.43%
96.99%
↓ 96.99%
89.13%
↓ 89.13%
89.13%
↓ 89.13%
小數的數線表 示
91.01%
↓ 91.12%
97.80%
↓ 97.80%
78.88%
↓ 79.20%
77.22%
↓ 77.44%
此外,在加入子技能變項的 16 個貝氏網路中,很明顯可以看出子技能 的診斷正確率低於錯誤類型,尤其在小數的整數倍與小數數線表示部分落差 最為明顯。根據前述分析,其原因可能是因為子技能位於網路的第三層,在 推論時較易有誤差的累積問題,並且子技能的效標是由專家綜合分析相關試 題的答對率與錯誤類型來加以設定,若測量的試題題數較少或一題同時偵測 好幾個技能,較易產生不適當的效標設定,診斷的正確率便會因此降低。不 過綜而言之,加入子技能變項的貝氏網路對於子技能的診斷仍有 70%以上的 最佳平均診斷正確率,由此可知貝氏網路可同時發揮診斷錯誤類型與子技能 的功能,並且皆達到不錯的診斷效果。
二、不同的證據模式對貝氏網路診斷正確率的影響
比較四個評量重點的 32 種貝氏網路之診斷正確率,可知採用不同的證 據模式對錯誤類型與子技能的診斷均會產生影響,比較的結果如表 4-3-2 所 示,其中,灰色區域表示最高的平均診斷正確率。
表 4-3-2 證據模式對錯誤類型與子技能最佳平均診斷正確率的影響 錯誤類型最佳診斷正確率(﹪)子技能最佳診斷正確率(﹪)
證據 類型 評量 重點
加 入 子 技 能
二元 記分
多選項 記分
參數型 IRT
無參數 型 IRT
二元 記分
多選項 記分
參數型 IRT
無參數 型 IRT
小數加 法
無 有
97.15 97.19
98.23 98.29
96.84 96.85
96.74
96.76 93.21 92.06 90.16 90.46 小數減
法 無 有
96.17 96.21
96.82 96.84
95.11 95.11
95.00
95.00 89.13 88.95 85.67 85.77 小數的
整數倍 無 有
92.20 92.43
96.99 96.99
89.13 89.13
89.13
89.13 93.62 90.16 79.27 79.27 小數的
數線表 示
無 有
91.01 91.12
97.80 97.80
78.88 79.20
77.22
77.44 86.86 80.60 72.04 71.33
根據表 4-3-2,茲將發現的結果整理如下:
(一)在錯誤類型的診斷部分,四個評量重點的診斷結果均一致顯示多選項 記分的貝氏網路之診斷正確率最佳,二元記分的貝氏網路次之,IRT 型的貝氏網路最差。而在 IRT 型的貝氏網路中,以參數型 IRT 的選項 選答率作為證據略優於以無參數型 IRT 的選項選答率作為證據,但差 異量極小。由此結果可知,在貝氏網路的診斷中,以多選項記分資料 作為診斷證據,會較二元記分資料提供更多精緻的診斷資訊,並且使
用可實際觀測到的直接證據,會比採用經過處理後的間接、模糊的證 據得到更精確的診斷結果。
(二)在子技能的診斷部分,以二元記分的貝氏網路之診斷正確率最佳,多 選項記分的貝氏網路次之,IRT 型的貝氏網路最差。而二元記分的貝 氏網路之診斷正確率之所以優於多選項記分的貝氏網路,推測其可能 原因在於試題的誘答選項完全是針對錯誤類型加以設計,並無法對子 技能提供更明確有利的診斷資訊。
第四節 分類決斷值的設定對貝氏網路診斷正確率之影響
由本章第二節中之討論可知,不同的分類決斷值會對貝氏網路診斷正確 率造成影響,至於實際決策時,該取哪一個決斷值較好,從第二節中並未發 現一致的最佳固定決斷值,因此並不能形成通則。由於能使每個錯誤類型與 子技能達到最佳診斷正確率的分類決斷值均不相同,爲求獲得最佳的貝氏網 路診斷模式,是故本研究嘗試採用根據訓練樣本所得到的動態決斷值來作為 分類決斷值,以了解是否使用動態分類決斷值的診斷正確率會優於使用固定 分類決斷值。
利用動態分類決斷值來分類的 32 種貝氏網路之診斷正確率如表 4-4-1~
表 4-4-4 所示。
表 4-4-1 採用動態分類決斷值的小數加法貝氏網路診斷正確率
小數加法貝氏網路
診斷正 確率
(﹪)
二元記分小 數加法錯誤 類型貝氏網
路
多選項記分 小數加法錯 誤類型貝氏
網路
參數型 IRT 小數加法錯 誤類型貝氏
網路
無參數型 IRT 小數加 法錯誤類型 貝氏網路
二元記分小 數加法錯誤 類型與子技 能貝氏網路
多選項記分 小數加法錯 誤類型與子 技能貝氏網
路
參數型 IRT 小數加法錯 誤類型與子 技能貝氏網
路
無參數型 IRT 小數加 法錯誤類型 與子技能貝
氏網路
A1 96.52 97.56 94.53 93.42 96.52 97.71 94.60 93.64
A2 98.08 99.56 98.08 98.08 98.08 99.56 98.08 98.08
A3 99.33 99.70 98.82 98.82 99.33 99.70 98.82 98.82
A4 97.41 98.89 97.26 97.26 97.41 98.89 97.26 97.26
A5 99.26 99.26 99.26 99.26 99.26 99.26 99.26 99.26
A6 97.41 97.41 96.97 96.97 97.41 97.48 96.97 96.97
A7 98.52 98.96 97.78 97.78 98.60 99.04 97.78 97.78
A8 96.60 98.97 95.93 95.93 96.45 98.97 95.93 95.93
A9 94.16 96.38 92.97 93.12 94.53 96.45 92.97 93.12
平均 97.48 98.52 96.84 96.74 97.51 98.56 96.85 96.76
ASkill1 98.67 96.23 95.78 94.60 ASkill2 97.41 95.93 94.68 94.82 ASkill3 94.01 93.49 92.98 92.98 ASkill4 85.50 84.61 83.51 83.58 ASkill5 99.34 94.53 88.17 88.98
平均 94.99 92.96 91.02 90.99
註:灰色區域表示最佳診斷正確率
表 4-4-2 採用動態分類決斷值的小數減法貝氏網路診斷正確率
小數減法貝氏網路
診斷正 確率
(﹪)
二元記分小 數減法錯誤 類型貝氏網
路
多選項記分 小數減法錯 誤類型貝氏
網路
參數型 IRT 小數減法錯 誤類型貝氏
網路
無參數型 IRT 小數減 法錯誤類型 貝氏網路
二元記分小 數減法錯誤 類型與子技 能貝氏網路
多選項記分 小數減法錯 誤類型與子 技能貝氏網
路
參數型 IRT 小數減法錯 誤類型與子 技能貝氏網
路
無參數型 IRT 小數減 法錯誤類型 與子技能貝
氏網路
B1 96.52 97.19 95.49 94.45 96.52 97.26 95.34 94.01
B2 98.82 98.89 98.67 98.67 98.82 98.82 98.67 98.67
B3 98.60 98.37 98.52 98.52 98.52 98.60 98.52 98.52
B4 94.97 97.93 92.46 92.46 95.34 98.08 92.46 92.46
B5 99.11 98.89 98.97 98.97 99.19 99.04 98.97 98.97
B6 92.97 96.01 91.05 91.05 93.20 96.08 91.05 91.05
B7 98.15 98.08 98.15 98.15 98.15 98.00 98.15 98.15
B8 97.71 97.78 93.20 93.34 97.71 97.63 93.42 93.49
B9 96.23 96.23 94.67 94.67 96.15 96.30 94.67 94.67
B10 92.31 93.49 89.94 89.94 92.38 93.71 89.94 89.94
平均 96.54 97.29 95.11 95.02 96.60 97.35 95.12 94.99
BSkill1 93.79 92.60 89.57 89.42 BSkill2 94.60 93.71 94.16 93.05 BSkill3 91.72 91.42 90.02 86.39 BSkill4 83.73 85.28 80.99 80.99 BSkill5 92.68 88.98 80.62 80.62
平均 91.30 90.40 87.07 86.10
註:灰色區域表示最佳診斷正確率
表 4-4-3 採用動態分類決斷值的小數整數倍貝氏網路診斷正確率
小數整數倍貝氏網路
診斷正 確率
(﹪)
二元記分小 數整數倍錯 誤類型貝氏
網路
多選項記分 小數整數倍 錯誤類型貝
氏網路
參數型 IRT 小數整數倍 錯誤類型貝
氏網路
無參數型 IRT 小數整 數倍錯誤類 型貝氏網路
二元記分小 數整數倍錯 誤類型與子 技能貝氏網
路
多選項記分 小數整數倍 錯誤類型與 子技能貝氏
網路
參數型 IRT 小數整數倍 錯誤類型與 子技能貝氏
網路
無參數型 IRT 小數整 數倍錯誤類 型與子技能 貝氏網路
C1 88.02 95.56 77.22 76.70 87.65 95.64 76.33 76.19
C2 87.58 99.11 86.09 86.09 87.58 99.04 86.09 86.09
C3 98.59 99.26 97.48 97.48 98.30 99.26 97.48 97.48
C4 97.04 98.67 95.56 95.56 97.19 98.67 95.56 95.56
C5 94.90 96.15 94.52 94.52 94.97 95.86 94.52 94.52
C6 93.49 94.75 85.13 84.98 93.57 94.90 85.13 84.98
平均 93.27 97.25 89.34 89.23 93.21 97.23 89.19 89.14
CSkill1 91.86 90.61 81.88 81.81 CSkill2 92.01 91.27 88.09 88.09 CSkill3 98.96 90.68 74.56 74.11 CSkill4 95.27 94.82 75.15 74.93
平均 94.53 91.85 79.92 79.73
註:灰色區域表示最佳診斷正確率
表 4-4-4 採用動態分類決斷值的小數數線表示貝氏網路診斷正確率
小數數線表示貝氏網路
診斷正 確率
(﹪)
二元記分小 數數線表示 錯誤類型貝
氏網路
多選項記分 小數數線表 示錯誤類型 貝氏網路
參數型 IRT 小數數線表 示錯誤類型 貝氏網路
無參數型 IRT 小數數 線表示錯誤 類型貝氏網
路
二元記分小 數數線表示 錯誤類型與 子技能貝氏
網路
多選項記分 小數數線表 示錯誤類型 與子技能貝
氏網路
參數型 IRT 小數數線表 示錯誤類型 與子技能貝
氏網路
無參數型 IRT 小數數 線表示錯誤 類型與子技 能貝氏網路
D1 90.39 97.12 72.12 73.60 90.68 97.12 71.53 73.38
D2 90.09 98.60 69.08 74.11 90.01 98.60 69.90 75.81
D3 99.48 99.04 92.61 79.96 99.48 99.04 92.53 79.44
D4 86.83 97.19 86.46 86.46 86.98 97.19 86.46 86.46
平均 91.70 97.98 80.07 78.53 91.79 97.98 80.10 78.77
DSkill1 85.95 85.36 75.00 74.93 DSkill2 91.05 89.35 83.29 84.32 DSkill3 92.75 77.22 63.31 63.31
平均 89.92 83.97 73.87 74.19
註:灰色區域表示最佳診斷正確率
由表 4-4-1~表 4-4-4 之平均診斷正確率可知:
一、 在使用動態分類決斷值的貝氏網路中,無論有無加入子技能變項,多選 項記分的貝氏網路對錯誤類型的診斷均有最佳的診斷正確率。
二、 在使用動態分類決斷值的貝氏網路中,二元記分的貝氏網路對子技能的 診斷可達到最佳的診斷正確率。
爲了方便瞭解使用動態分類決斷值的診斷正確率是否會優於使用固定 分類決斷值,茲將表 4-4-1~表 4-4-4 之錯誤類型平均診斷正確率與本章第二 節使用固定決斷值的貝氏網路之錯誤類型最佳平均診斷正確率之比較整理
表 4-4-5 動態分類決斷值與固定分類決斷值之錯誤類型診斷正確率比較表 小數加法貝氏網路
診斷正 確率
(﹪)
二元記分小 數加法錯誤 類型貝氏網
路
多選項記分 小數加法錯 誤類型貝氏
網路
參數型 IRT 小數加法錯 誤類型貝氏
網路
無參數型 IRT 小數加 法錯誤類型 貝氏網路
二元記分小 數加法錯誤 類型與子技 能貝氏網路
多選項記分 小數加法錯 誤類型與子 技能貝氏網
路
參數型 IRT 小數加法錯 誤類型與子 技能貝氏網
路
無參數型 IRT 小數加 法錯誤類型 與子技能貝
氏網路
動態 97.48 98.52 96.84 96.74 97.51 98.56 96.85 96.76
固定 97.15 98.23 96.84 96.74 97.19 98.29 96.85 96.76
小數減法貝氏網路 診斷正
確率
(﹪)
二元記分小 數減法錯誤 類型貝氏網
路
多選項記分 小數減法錯 誤類型貝氏
網路
參數型 IRT 小數減法錯 誤類型貝氏
網路
無參數型 IRT 小數減 法錯誤類型 貝氏網路
二元記分小 數減法錯誤 類型與子技 能貝氏網路
多選項記分 小數減法錯 誤類型與子 技能貝氏網
路
參數型 IRT 小數減法錯 誤類型與子 技能貝氏網
路
無參數型 IRT 小數減 法錯誤類型 與子技能貝
氏網路
動態 96.54 97.29 95.11 95.02 96.60 97.35 95.12 94.99
固定 96.17 96.82 95.11 95.00 96.21 96.84 95.11 94.99
小數整數倍貝氏網路 診斷正
確率
(﹪)
二元記分小 數整數倍錯 誤類型貝氏
網路
多選項記分 小數整數倍 錯誤類型貝
氏網路
參數型 IRT 小數整數倍 錯誤類型貝
氏網路
無參數型 IRT 小數整 數倍錯誤類 型貝氏網路
二元記分小 數整數倍錯 誤類型與子 技能貝氏網
路
多選項記分 小數整數倍 錯誤類型與 子技能貝氏
網路
參數型 IRT 小數整數倍 錯誤類型與 子技能貝氏
網路
無參數型 IRT 小數整 數倍錯誤類 型與子技能 貝氏網路
動態 93.27 97.25 89.34 89.23 93.21 97.23 89.19 89.14
固定 92.20 96.99 89.13 89.13 92.43 96.77 89.13 89.13
小數數線表示貝氏網路 診斷正
確率
(﹪)
二元記分小 數數線表示 錯誤類型貝
氏網路
多選項記分 小數數線表 示錯誤類型 貝氏網路
參數型 IRT 小數數線表 示錯誤類型 貝氏網路
無參數型 IRT 小數數 線表示錯誤 類型貝氏網
路
二元記分小 數數線表示 錯誤類型與 子技能貝氏
網路
多選項記分 小數數線表 示錯誤類型 與子技能貝
氏網路
參數型 IRT 小數數線表 示錯誤類型 與子技能貝
氏網路
無參數型 IRT 小數數 線表示錯誤 類型與子技 能貝氏網路
動態 91.70 97.98 80.07 78.53 91.79 97.98 80.10 78.77
固定 91.01 97.80 78.88 77.22 91.12 97.80 79.20 77.44
表 4-4-6 動態分類決斷值與固定分類決斷值之子技能診斷正確率比較表 小數加法貝氏網路
診斷正 確率
(﹪)
二元記分小數加法錯 誤類型與子技能貝氏
網路
多選項記分小數加法 錯誤類型與子技能貝
氏網路
參數型 IRT 小數加法 錯誤類型與子技能貝
氏網路
無參數型 IRT 小數加 法錯誤類型與子技能
貝氏網路
動態 94.99 92.96 91.02 90.99
固定 93.21 92.06 90.16 90.46
小數減法貝氏網路 診斷正
確率
(﹪)
二元記分小數減法錯 誤類型與子技能貝氏
網路
多選項記分小數減法 錯誤類型與子技能貝
氏網路
參數型 IRT 小數減法 錯誤類型與子技能貝
氏網路
無參數型 IRT 小數減 法錯誤類型與子技能
貝氏網路
動態 91.30 90.40 87.07 86.10
固定 89.13 88.95 85.67 85.77
小數整數倍貝氏網路 診斷正
確率
(﹪)
二元記分小數整數倍 錯誤類型與子技能貝
氏網路
多選項記分小數整數 倍錯誤類型與子技能
貝氏網路
參數型 IRT 小數整數 倍錯誤類型與子技能
貝氏網路
無參數型 IRT 小數整 數倍錯誤類型與子技
能貝氏網路
動態 94.53 91.85 79.92 79.73
固定 93.62 90.16 79.27 79.27
小數數線表示貝氏網路 診斷正
確率
(﹪)
二元記分小數整數倍 錯誤類型與子技能貝
氏網路
多選項記分小數整數 倍錯誤類型與子技能
貝氏網路
參數型 IRT 小數整數 倍錯誤類型與子技能
貝氏網路
無參數型 IRT 小數整 數倍錯誤類型與子技
能貝氏網路
動態 89.92 83.97 73.87 74.19
固定 86.86 80.60 72.04 71.33
綜合表 4-4-5、表 4-4-6 可知:
一、 所有網路的診斷結果均一致發現,使用動態分類決斷值所得到的錯誤類 型診斷正確率優於使用固定分類決斷值所得到的錯誤類型最佳平均診 斷正確率。
二、 使用動態分類決斷值在子技能的診斷上亦優於使用固定分類決斷值。
第五節 訓練樣本大小對貝氏網路診斷正確率之影響
雖然相關文獻指出,先驗分布的設定會影響貝氏網路推論的有效性 (Jensen,2001),但先前研究並未指出如何設定貝氏網路的訓練樣本的大小才 是適當的方法。因此,在本章的前四節中,研究者嘗試以 80%受試者的測驗 作答反應來訓練貝氏網路,以設定其先驗分佈,由於本研究之受試者人數有 1352 人,是故訓練樣本的大小為 1081 人,屬於較大的訓練樣本,前述結果 發現可獲得相當精準的診斷結果。然而,在實際教學應用時,如果訓練樣本 為小樣本,是否也能達到如前述的良好診斷結果?此為本節探討的重點。
以下便針對四個評量重點,分別使用 50 人、100 人、200 人以及 400 人的作答資料作為訓練樣本,探討訓練樣本大小對貝氏網路認知診斷模式診 斷正確率之影響,此外,爲排除分類決斷值的設定所造成的影響,此部分一 律採用動態分類決斷值。研究結果之數據詳見附錄十三所示,爲便於比較,
以下則分別針對不同大小的訓練樣本之錯誤類型與子技能的平均診斷正確 率,製成折線圖加以分析。
圖 4-5-1~圖 4-5-4 分別呈現不同評量重點中,訓練樣本大小對錯誤類型 平均診斷正確率的影響,其中,1 為二元記分錯誤類型貝氏網路,2 為多選 項記分錯誤類型貝氏網路,3 為參數型 IRT 錯誤類型貝氏網路,4 為無參數 IRT 錯誤類型貝氏網路,5 為二元記分錯誤類型與子技能貝氏網路,6 為多選 項記分錯誤類型與子技能貝氏網路,7 為參數型 IRT 錯誤類型與子技能貝氏 網路,8 為無參數 IRT 錯誤類型與子技能貝氏網路。
95.00%
95.50%
96.00%
96.50%
97.00%
97.50%
98.00%
98.50%
99.00%
1 2 3 4 5 6 7 8 小數加法貝氏網路類型
平 均 診 斷 正 確
率 訓練樣本50人
訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
94.00%
94.50%
95.00%
95.50%
96.00%
96.50%
97.00%
97.50%
98.00%
1 2 3 4 5 6 7 8 小數減法貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
圖 4-5-2 訓練樣本大小對小數減法錯誤類型之平均診斷正確率的影響
圖 4-5-3 訓練樣本大小對小數整數倍錯誤類型之平均診斷正確率的影響
87.00%
89.00%
91.00%
93.00%
95.00%
97.00%
1 2 3 4 5 6 7 8
小數整數倍貝氏網路類型 平
均 診 斷 正 確
率 訓練樣本50人
訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
圖 4-5-4 訓練樣本大小對小數數線表示錯誤類型之平均診斷正確率的影響
圖 4-5-5~圖 4-5-8 則分別呈現不同評量重點中,訓練樣本大小對子技能 平均診斷正確率的影響,其中貝氏網路類型之代碼與上述相同。
77.00%
79.00%
81.00%
83.00%
85.00%
87.00%
89.00%
91.00%
93.00%
95.00%
97.00%
99.00%
1 2 3 4 5 6 7 8
小數數線表示貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
88.00%
89.00%
90.00%
91.00%
92.00%
93.00%
94.00%
95.00%
96.00%
5 6 7 8
小數加法貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
圖 4-5-5 訓練樣本大小對小數加法子技能之平均診斷正確率的影響
84.00%
85.00%
86.00%
87.00%
88.00%
89.00%
90.00%
91.00%
92.00%
5 6 7 8
小數減法貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
圖 4-5-6 訓練樣本大小對小數減法子技能之平均診斷正確率的影響
79.00%
81.00%
83.00%
85.00%
87.00%
89.00%
91.00%
93.00%
95.00%
5 6 7 8
小數整數倍貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100人 訓練樣本200人 訓練樣本400人 訓練樣本1081人
圖 4-5-7 訓練樣本大小對小數整數倍子技能之平均診斷正確率的影響
70.00%
75.00%
80.00%
85.00%
90.00%
95.00%
5 6 7 8
小數數線表示貝氏網路類型 平
均 診 斷 正 確 率
訓練樣本50人 訓練樣本100 訓練樣本200人 訓練樣本400人 訓練樣本1081人
綜合圖 4-5-1~圖 4-5-8 的診斷結果,可發現以下現象:
一、 訓練樣本愈大,在錯誤類型部分的診斷正確率均有增加的趨勢,不過增 加的程度很小,尤其是以 IRT 或無參數 IRT 選答率為證據的貝氏網路 幾乎沒有差異。
二、 訓練樣本大小對子技能部分診斷正確率的影響未顯現一致性。
三、 在使用動態分類決斷值的前提下,訓練樣本大小對貝氏網路診斷正確率 之影響,無論是錯誤類型部分或是子技能部分影響程度均不大,因此,
即使訓練樣本為約 50 人的小樣本,若搭配動態分類決斷值之使用,貝 氏網路診斷模式亦可在錯誤類型與子技能的診斷上達到良好的診斷正 確率(診斷正確率>70%)。
四、 以 50 人的小樣本作為訓練樣本,發現最佳的錯誤類型平均診斷正確率 有時出現在以參數型 IRT 選答率為證據的貝氏網路中(小數加法),有 時出現在以二元記分作答資料為證據的貝氏網路中(小數數線表示),
此與前述以大樣本作為訓練樣本的結果不一致,結果較不穩定。100 人 以上的訓練樣本則可獲得較穩定的結果。
五、 比較訓練樣本大小為 400 人的診斷正確率與表 4-4-1~表 4-4-4 中的診斷 正確率(訓練樣本大小為 1081 人),發現差異很小,顯示約 400 人的訓 練樣本即可達成接近 1000 人之大訓練樣本的診斷正確率。