資料模擬

第三章研究方法與設計

第三節資料模擬

二、BILOG-MG (以下稱 BILOG)

此為常見的 IRT 估計軟體，研究者用其做 Rasch 模式下，試題難度和能力值的估計，其試題估計結果檔，也提供給 LDID 讀取，檢定違反局部獨立性情形。

三、LDID

由 Kim, Cohen, and Lin (2005) 所研發，提供、、、四個指標，

針對 BILOG 估計出的試題參數，檢測二元計分試題違反局部獨立性情形。

χ

G

Q

₃

Z

第三節資料模擬

研究者根據文獻決定模擬因子與參數後，以 SAS 撰寫程式，分別產生 45 種組合之下，受試者二元計分的反應組型，Rasch 模式以 BILOG、1-P HGLLM 則以 SAS 估計試題難度和能力值，並探討與比較兩種模式參數估計情形，其模擬流程如圖 3-3，現就流程圖詳細說明如下。

BILOG

‧試題難度估計

‧能力值估計

撰寫報告

圖 3-3 模擬流程圖決定因子水準與參數

‧試題數：( 20，40，80 )

‧樣本數：( 100，300，900 )

‧題組效果程度( ² ²)

γ

γ σ

σ

， :

(0，0)、(0，2)、(0，8)、

(2，2)、(2，8)

‧難度：服從

N

(0,1)且−2~2

‧能力值服從

N

(0,1)

SAS

產生各種模擬情況的反應組型

LDID

確認試題局部獨立性

不同組合情況之參數精準度比較

‧試題難度精準度探討與比較

‧能力值精準度探討與比較

SAS

‧試題難度估計

‧能力值估計

一、決定相關參數

許多 IRT 相關研究，能力值多服從標準常態分配，試題難度以不選取極值為原則 (Li et al., 2005; Yen, 1984)，故本研究的能力值與試題難度的範圍為：

1. 能力值：能力值服從標準常態分配。

2. 試題難度：試題難度服從標準常態分配，且取−2~2之間。

二、模擬反應組型

研究者根據公式 (24)、(25)，以 SAS 撰寫模擬程式，依照 45 種組合，產生受試者的反應組型，以利進行參數估計。

三、違反局部獨立性檢測

在進行正式模擬前，先模擬 45 種組合下受試者的反應組型各 10 次，以 BILOG 進行參數估計後，再以 LDID 偵測試題違反局部獨立性情形。LDID 提供的指標很靈敏 (sensitive)，即便是完全沒有違反局部獨立性的試題，也可能被檢測出部分試題的統計量指標達顯著。故研究者主要是檢查當題組效果越大，試題違反局部獨立性的比率，是否有越高的趨勢，以確認撰寫的模擬程式誤差在可接受的範圍，再進行正式模擬。

四、參數估計

在 Rasch 模式以 BILOG 估計試題難度與能力值外，研究者參考 Roberts and Herrington (2005) 的範例，利用 SAS 提供的巨集 GLIMMIX，進行試題難度和能力值的估計，以其代表 1-P HGLLM 的觀點。在估計法方面，BILOG 與 SAS 都採用 MLE 估計法 (Maximum Likelihood Estimate) 進行估計。

五、精準度比較

參考相關模擬研究，其精準度指標有相關係數、估計值和實際值之差的關係式 (Kamata, 1998b; Rijmen, Tuerlinckx, Meulders, Smits, & Balazes, 2005)，考量較常用的幾個指標後，試題難度的精準度指標為 RMSE、BIAS、MCSE；能力值的精準度指標為 RMSE、均差。在計算精準度前，將試題難度減去能力值的平均數，

再除以能力值的標準差，以將試題難度移至和能力值同一量尺。並進一步把能力值也標準化，才計算精準度。研究者並將參數估計精準度加以整理分析，比較兩個模式估計參數的精準度情形，並進一步探討精準度和各因子間的關係，臚列表格及圖形說明之。

在文檔中階層線性模式與Rasch模式在題組效果下之參數估計模擬比較 (頁 39-43)

第三章 研究方法與設計

第三節 資料模擬

χ

G

Q

Z

第三節 資料模擬

γ

γ σ

σ

N

N

第三章研究方法與設計

第三節資料模擬

第三節資料模擬