第三章 研究方法
第一節 研究設計
本研究自編一份國小六年級學童小數的除法測驗,並參考林佳樺(2009)
所探討之 HO-IRT 估計模式,透過實證資料方式探討完整估計與分開估計之估 計效果,並以 AIC、BIC 和 DIC 指標。來檢驗 HO-IRT、MIRT_C、MIRT_U 和 UIRT 四種模式之適配度,作為模式選用之依據。用統計軟體進行各階層之分開 估計及兩階層之完整估計,接著比較 UIRT、MIRT_C 和 MIRT_U 的分開估計與 HO-IRT 完整估計的成效。
壹、自編小數的除法測驗
一般測驗的計分型態可分為二元計分與多元計分。大型測驗大多屬於多向 度測驗,多向度測驗又分為題間多向度測驗和題內多向度測驗。本研究自編之 國小六年級學生之小數的除法測驗為二元計分,共有 24 題,測驗之詴題設計為 題間多向度測驗。
貳、模式估計
本研究用來做測驗參數估計的模式有 UIRT、MIRT_U、MIRT_C 及 HO-IRT 四種。本研究所指之整體量尺(代號 H)為國小六年級學生小數的除法能力,
領域量尺(代號 L)為 TIMSS 評量架構中之認知領域--知道(L1)、應用(L2) 和推理(L3)。
UIRT 模式是指估計整體量尺的能力,如圖 3-1-1;MIRT_U 模式是指用 UIRT 來估計 MIRT 的模式,也就是將各個領域量尺視為獨立,如圖 3-1-2,L1包含 X01到 X09和 X17,也就是詴題 1 到 9 和詴題 17; L2包含 X10到 X13 、X15 、 X19 、X20 、X22和 X24,也就是詴題 10 到 13 和詴題 15、19、20、22、24; L3 包含 X14、X16、X18、X21和 X23,也就是詴題 14、16、18、21 和詴題 23;MIRT_C 模式也是用 UIRT 來估計 MIRT 的模式,但各個領域量尺之間彼此有關聯,L1 包含 X01到 X09和 X17;L2包含 X10到 X13 、X15 、X19 、X20 、X22和 X24;L3 包含 X14、X16、X18、X21和 X23,如圖 3-1-3;HO-IRT 模式是指同時估計整體量 尺和領域量尺的能力, X01到 X09和 X17是估計 L1;X10到 X13 、X15 、X19 、 X20 、X22和 X24是估計 L2;X14、X16、X18、X21和 X23是估計 L3,1、2和3 分別代表 L1、L2和 L3與 H 間的相關係數,如圖 3-1-3。
圖 3-1-1 UIRT 模式 X01-09, X17
X10-13,
X15 ,X19 ,X20 X22, X24
X14, X16, X18 X21,X23
整體量尺
小 數 的 除 法
(H)
圖 3-1-2 MIRT_U 之題間多向度模式
圖 3-1-4 HO-IRT 之題間多向度模式 架構(Bayes framework)下的 Akaike’s information coefficient (AIC)、Bayesian information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標,
驗證 HIRT 架構下的測驗資料,以了解 AIC、BIC 和 DIC 三種指標,在 HO-IRT 模式之詴題反應函數(item response function; IRF)選擇的效果。
本研究採用 Congdon(2003)基於貝葉斯架構的 AIC、BIC 與 DIC 三種指標,
X01-09, X17
探究在 HO-IRT、MIRT_U、MIRT_C 和 UIRT 模式下,哪一種模式與測驗資料 之間的適配度是合適的。三種指標的定義如下(引自謝典佑等,2009):
一、 AIC 指標:是指統計上模式之相對適配度的測量。
A I C(M o d e l)d2p
d 為偏差,對一個模式而言,偏差的值較小,表示資料與模式的適配度較 好。d 是−2×log(最大概似法,maximum likelihood);p為模式中的參數量。
本研究之參數量,有一個主要量尺、三個次級量尺、一個詴題難度參數和三個 迴歸參數,一共八個參數量。
二、 BIC 指標:在不同類別之參數量中,模式選擇的一種指標。
BIC(Model)d p(logN)
N 為樣本數,本研究樣本數為 538 人。
三、 DIC 指標:AIC 和 BIC 的一般化階層式模式的指標,以 MCMC 模擬方法 獲得後設分配,且當後設分配是多元常態分配時,DIC 指標才有價值。
D I C(M o d e l) D() pD D()2PD
D()為後設模式之帄均偏差,是一種模式適配度的 Bayesian 測量,而
) (
D 為後設模式之偏差。pD為模式中的自由參數量,PD D() D()。以 DIC 的最小值作為模式的選擇,是觀察一組複製相同結構之資料的最好預測。
此外,DIC 的優點是從樣本中,以 MCMC 模擬方法很容易就能算出指標值,