第四章 研究結果與討論
第三節 性別的試題差異功能(DIF)分析
將所得之資料重新整理,試題區塊劃分共有 13 個區塊,每個區塊有 8 題試 題,再根據每一區塊的受試者分成男女兩群,將男生設定為焦點組,女生為參照 組。因各試題區塊之抽樣人數足夠,故本研究設定 =.01,以 Mantel-Haenszel 法、
Crossing-SIBTEST 法、ETS 分類法與 Logistic Regression 法等四種方法檢測試題。
為了提高檢測方法的可靠信,研究者設定試題若出現三種以上分析方法檢測有 DIF 現象,即列入 DIF 試題。茲將四種 DIF 檢測方法的偵測結果彙整成表 4-4:
表 4-4 四種檢測法檢測出 DIF 試題之 p-value 值 檢測方法
DIF 試題
SPSS M-H 法
Crossing- SIBTEST 法
EZDIF ETS 分類法
EZDIF LR法 ITEM02 .002 .003 A***
ITEM03 .002 .002 A***
ITEM06 .005 .005 A**
ITEM012 .003 .003 A***
ITEM013 .003 .004 A***
ITEM027 .000 .000 B***
ITEM033 .009
ITEM036 .000 .000 .000 CR***
ITEM037 .003
ITEM045 .004 .005 A***
ITEM055 .000 .003
ITEM057 .000 .000 B***
ITEM064 .008 .000 .008 A**
ITEM065 .002 .002 A***
ITEM067 .000 .000 B***
ITEM068 .003 .003 A***
ITEM069 .000 .000 .000 B***
ITEM070 .000
ITEM071 .000 .000 B***
ITEM073 .003 .000 .003 A***
ITEM088 .000
ITEM091 .003 .003 A***
ITEM094 .000
ITEM098 .000 .000 B***
ITEM099 .000 .000 B***
ITEM101 .000 .000 B***
ITEM102 .000
=.01
ITEM036、ITEM064、ITEM069 與 ITEM073 皆有三種分析方法檢測有 DIF 現象,因此這四題皆列入 DIF 試題。
Crossing-SIBTEST 法能偵測到 non-uniform DIF,M-H 法與 ETS 分類法並非 為偵測 non-uniform DIF 而設計的,較無法檢出 non-uniform DIF 的現象,所以研 究者將 Crossing-SIBTEST 法檢測出而 M-H 法與 ETS 分類法未檢測出的試題也納 入本研究的 DIF 試題。因此,Crossing-SIBTEST 法檢測出 ITEM055、ITEM094 與 ITEM0102 這三題具有 DIF 現象,但 M-H 法與 ETS 分類法卻未檢測出,是否 有 non-uniform DIF 的情況,實在有必要進一步探討。所以本研究再將這七題所 在的區塊答對人數百分比曲線來輔助佐證這七題試題的 DIF 現象,整理如下。
由圖 4-1 可知,ITEM036 試題對男生的低分組與高分組均較為有利,
故研究者將其歸類為 uniform DIF。
圖4-1 ITEM036答對人數百分比曲線圖
0%
20%
40%
60%
80%
100%
0 1 2 3 4 5 6 7 8 分數
答 對 人 數 百 分 比
男生 女生
由圖 4-2 可知,ITEM055 整體而言男生表現較優,而女生只在區塊總分 7 分 略優於男生,因此研究者仍將其歸類為 uniform DIF。
圖4-2 ITEM055答對人數百分比曲線圖
圖4-3 ITEM064答對人數百分比曲線圖
0%
由圖 4-4 可知,ITEM069 試題對女生的低分組與高分組均較為有利,故研究 者將其歸類為 uniform DIF。
圖4-4 ITEM069答對人數百分比曲線圖
0%
20%
40%
60%
80%
100%
0 1 2 3 4 5 6 7 8 分數
答 對 人 數 百 分 比
男生 女生
由圖 4-5 可知,ITEM073 整體而言雖較有利於男生,而女生只在區塊總分 7 分時稍微領先男生,故研究者將其歸類為 uniform DIF 。
圖4-5 ITEM073答對人數百分比曲線圖
圖4-6 ITEM094答對人數百分比曲線圖
0%
由圖 4-7 可知,ITEM102 試題整體來說對男生較為有利,女生只在區塊總分 2 分及 6 分時些微領先男生,因此研究者仍將其歸類為 uniform DIF。
圖4-7 ITEM102答對人數百分比曲線圖
0%
20%
40%
60%
80%
100%
0 1 2 3 4 5 6 7 8 分數
答 對 人 數 百 分 比
男生 女生
再將這七題的試題參數整理成表 4-5~表 4-7。
表 4-5 ITEM036 與 ITEM055 之試題參數 ITEM036 ITEM055
男生 女生 男生 女生
a 0.406 0.631 0.641 1.134 b -0.163 -0.756 0.460 0.531 c 0.185 0.165 0.189 0.187
表 4-6 ITEM064 與 ITEM069 之試題參數 ITEM064 ITEM069
男生 女生 男生 女生
a 0.950 1.192 0.758 0.750 b -0.525 -0.301 0.010 0.364 c 0.179 0.168 0.166 0.171
表 4-7 ITEM073、ITEM094 與 ITEM102 之試題參數 ITEM073 ITEM094 ITEM102
男生 女生 男生 女生 男生 女生
a 1.111 1.353 0.772 0.466 0.831 0.819 b -0.196 -0.364 1.082 1.127 -0.719 -0.793 c 0.166 0.127 0.183 0.201 0.157 0.157
在本研究 103 題中有 7 題呈現 DIF,約佔總題數的 6.8%。ITEM036 之能力指 標為「N_2_4 能用四捨五入、進位、捨去等方式對一個數量取概數,並利用概數 作簡單的估算」,ITEM055 之能力指標為「N_2_7 能以二位小數描述具體的量,
並解決二位小數的合成、分解及簡單整數倍問題」,ITEM069 之能力指標為「N_3_3 在具體情境中,理解通分的意義並運用通分解決異分母分數的合成、分解問題」,
ITEM102 之能力指標為「N_3_4 在具體情境中,解決分數乘以分數的問題,進 而形成分數倍的概念」,此 4 題皆屬於「數與計算」。ITEM094 之能力指標為「S_3_5 能利用形體的性質解決幾何問題」,屬於「幾何」。ITEM073 之能力指標為「D_3_7 能利用比值和百分率的概念,報讀相關的統計圖表」,屬於「統計與機率」。
ITEM064 之能力指標為「A_3_2 能將生活情境中的問題表徵為含有 x、y、…的
等式或不等式,透過生活經驗檢驗、判斷其解,並能解釋式子及解與原問題情境
故檢測結果應有高一致性;而 Logistic Regression 法比對於 Mantel-Haenszel 法及 ETS 分類法時的一致性較低,根據 Finch and French (2007)的研究結果,Logistic Regression 法不容許猜題,故在三參模式且群體有不同能力時,較不易處理。