第三章 研究方法
第二節 研究變項設定
本研究欲探討不同次級量尺分數計算方法在水平與垂直等化設計測驗情境 下,對測驗分數估計之精準度。本節將分別就水平與垂直等化設計中之共同變項 設定與研究中之參數設定做說明。詳述如下。
壹、模擬實驗之變項設計
一一一一、水平等化設計水平等化設計水平等化設計水平等化設計變項設定變項設定變項設定變項設定
本研究中模擬水平等化設計,欲比較不同估計方法對於次級量尺分數之估 算,茲將本研究的變項設定整理如表 3-1。
表表表
表3-1 水平等化設計變項設定 研究變項研究變項
研究變項研究變項 變項設定變項設定 變項設定變項設定
試題長度 每個題本施測題數 60 題
題本包含之次級量尺個數 4 個
次級量尺在各試題區塊之比例
25%、25%、25%、25%;
30%、30%、20%、20%;
40%、40%、10%、10%
次級量尺相關程度 0.2、0.5、0.8
受試人數 3570 及 7560 人
每一種情形模擬次數 100 次
在水平等化設計中設定五種不同變項,如表 3-1 所示。依照各情境變項產生 模擬資料,五種研究變項敘述如下:
1. 在測驗題本長度的設定,BIB 設計下每個題本配置之試題區塊個數有 3 個,
模擬每個測驗題本長度為 60 題。
2. 在題本次級量尺個數的設定,模擬題本次級量尺個數為 4 個。
3. 在次級量尺在各試題區塊之比例設定,在題本次級量尺比例的設定,本研究
欲探討在每個試題區塊內,次級量尺題數的比例對於次級量尺分數估計的影 響,故模擬兩種題本次級量尺比例,四個次級量尺間題數的比例分別為
25%、25%、25%、25%,30%、30%、20%、20%及 40%、40%、10%、10%
三種比例。其中 30%、30%、20%、20%之比例為研究者參考許多國內外大 型測驗技術報告中,數學科測驗之次級量尺比例,如 PISA 2003 數學科及 TIMSS 2007 八年級數學科所包含四個內容領域之比例即為 30%、30%、
20%、20%(PISA 2003;TIMSS 2007);另一比例參考謝佳穎( 2009 )為探討 次級量尺比例懸殊較大時之次級量尺分數估計精準度,而定下 40%、40%、
10%、10%之比例;另一比例則為研究者為探討次級量尺比例較平均時之次 級量尺分數估計精準度,而定下 25%、25%、25%、25%之比例。
4. 在次級量尺相關程度的設定,本研究探討國內外文獻中,如: Yao, L., &
Boughton, K. A. (2007). 探討相關程度中選用 0.1、0.3、0.5、0.7、0.9;David Shin. ( 2007 ) 探討相關程度中選用 0.5、0.8、1.0;張宛婷(2008)探討相關 程度中選用 0.2、0.5、0.8、1;謝佳穎(2009)探討相關程度中選用 0.2、0.5、
0.8。故本研究為延續之前謝佳穎(2009)之研究,故設定受試者次級量尺能 力值 θ 之間的相關係數(correlation coefficients)在低相關為 0.2、在中等相 關為 0.5、在高相關為 0.8,模擬受試者之能力值 θ 服從標準多變量常態分佈
(standardized multivariate normal distribution),並假設能力值之間的相關係 數為 0.2、0.5 及 0.8 三種相關程度。
5. 在施測人數的設定上,本研究根據 NAEP 1998 年的技術性報告中,每一試 題施測需要 500 個測試樣本(Allen, Donoghue & Schoeps, 2001),藉由 BIB 設 計,本研究受試者人數有510×7=3570人及1080×7=7560人兩種人數。
6. 次級量尺估計方法中,僅比較三種估計方法(BOCK 方法、W-BOCK 方法、
MIRT 方法)的估計效果。
因此,根據模擬實驗之各變項設定,本研究在等化測驗設計中,共探討
表 表表
表3-2 垂直等化設計變項設定 研究變項
研究變項 研究變項
研究變項 變項設定變項設定 變項設定變項設定
試題長度 每個題本施測題數 60 題
題本包含之次級量尺個數 4 個
高低年級受試者群能力分佈
L 年級:N ( 0, 1),範圍-3 ~ 3 H 年級:N ( 0.5, 1),範圍-2.5 ~ 3.5 N ( 1, 1),範圍-2 ~ 4 N ( 2, 1),範圍-1 ~ 5 次級量尺在各試題區塊之比例
25%、25%、25%、25%
30%、30%、20%、20%
40%、40%、10%、10%
次級量尺相關程度 0.2、0.5、0.8
每個題本定錨比例 10%、20%、30%
受試人數 3570 及 7560 人
每一種情形模擬次數 100 次
在垂直等化設計中設定七種不同變項,如表 3-2 所示。依照各情境變項產生 模擬資料,七種研究變項敘述如下:
1. 在測驗題本長度的設定,BIB 設計下每個題本配置之試題區塊個數有 3 個,
模擬每個測驗題本長度為 60 題。
2. 在題本次級量尺個數的設定,模擬題本次級量尺個數為 4 個。
3. 在高低年級受試者群能力分佈的設定,L 年級:N (0, 1),範圍-3 ~ 3;
H 年級:N (0.5, 1),範圍-2.5 ~ 3.5;N (1, 1),範圍-2 ~ 4;N (2, 1),範圍-1 ~ 5。所以有 N (0.5, 1) vs. N (0, 1) 、N (1,1) vs. N (0, 1) 及 N (2,1) vs. N (0, 1)三 種能力分佈設定
4. 如同水平等化設計,在產生模擬資料時,亦考慮了次級量尺在各試題區塊
之比例設定、次級量尺相關程度及受試者人數的設定。次級量尺相關程度 有 0.2、0.5 及 0.8 三種相關;受試者人數有 3570 人及 7560 人兩種人數。
5. 次級量尺估計方法中,僅比較三種估計方法(BOCK 方法、W-BOCK 方法、
MIRT 方法)的估計效果。
因此,根據模擬實驗之各變項設定,本研究在等化測驗設計中,共探討 162
2 3 3 3
3× × × × = 種配置情形。
貳、參數設定
一、水平等化之參數設定 (一)受試者能力參數設定
模擬不同次級量尺水平等化之受試者能力分布,服從多變量分布。並參考自 Woods & Lin (2009)的研究中的能力參數分布之設計來作為模擬研究之能力參 數產生資料之基礎:
以常態分布為例,假設θ =(θ1,...,θj)服從多變量常態分布,記為MN(µ,Σ),其中,
θj
θ1,..., 分 別 為 截 尾 常 態 分 布 ( truncated normal distribution ), 即 )
1 , 0 (
~ ),..., 1 , 0 (
1~N θj N
θ ,平均數為0,標準差為1,範圍界定於−3~3,相關為0.2、
0.5與0.8。
(二) 試題參數設定
模擬難度參數分布為截尾常態分布N(0,1),範圍−3~3。 二、垂直等化之參數設定
(一)受試者能力參數設定
本研究將垂直等化之受試者能力分為 H 年級與 L 年級兩群,H 年級代表年級 較高之受試者,L 年級代表年級較低之受試者,進行不同年級間量尺之垂直等化。
其中,L 年級受試者取自水平等化設計之受試者。本研究共有三組垂直等化設計,
參考自 Woods & Lin (2009)的研究中的能力參數分布之設計來作為模擬研究之 能力參數產生資料之基礎,再依據不同年級受試者來模擬受試者能力分布。以 H
實驗一︰θ1 ~N(0.5,1),...,θj ~N(0.5,1),平均數為 0.5,標準差為 1,範圍界定