結構方程模式的 DIF 檢核

第二章文獻探討

第四節結構方程模式的 DIF 檢核

用來檢核 DIF 的方法相當多，除了之前提到的 IRT 取向的 DIF 檢核方法,還有非 IRT 取向的 DIF 檢核方法如 Mantel-Haenszel 法（Holland & Thayer, 1988）、

標準化法（Dorans & Kulick, 1986）和羅吉斯迴歸法（Swaminathan & Rogers, 1990）。近幾年來有學者運用結構方程模式（structural equation modeling，SEM）

的方法對測驗資料做 DIF 檢核。結構方程模式是一種變項間相互關係所形成的統否真實存在(Byrne, Shavelson, & Muthén, 1989)。

以下針對結構方程模式中的多重指標與多重因果模式（multiple-indicators, multiple-causes model, MIMIC model）和平均數及共變數結構模式（mean and covariance structure analysis model, MACS model）做說明。

壹 MIMIC 模式之差異試題功能檢核方法

MIMIC 是結構方程模式中的一種模式，主要用來檢測反應變項、獨立變數與潛在變數間的間接或直接關係（Jöreskog & Goldberger, 1975）。其模式可表示為：

用 MIMIC 模式來檢測 DIF（Shih & Wang, 2009; Woods, 2009; Lee, 2009），然而以往的文獻大多將 MIMIC 模式運用在檢測 uniform DIF。的鑑別度參數(Ferrando, 1996; Mellenbergh, 1994)。

在 MACS 模式下做 uniform DIF 檢測，將虛無假設定為參數_j在各群體間

起初 MACS 是針對連續變項發展而來，而模式中的潛在反應變數x_ij^*是無法直接觀察得到的，然而可藉由 threshold model，將其轉換為可觀察的反應變項x_ij，這個程序可以在軟體 Mplus 4.21(Muthén & Muthén, 2007)下執行，因此以 Mplus 針對類別資料進行分析是較為恰當的方式。

在 threshold model，可利用以下公式將連續潛在反應變項轉換成二元的和多元的(k 個類別反應)試題反應變數。

SEM 的參數估計法有加權最小平方法(weighted least-squares, WLS)、無加權最小平方法 (unweighted least-squares, ULS) 、一般化最小平方法 (generalized least-squares, GLS)、最大概似法(maximum likelihood , ML)等。由於無加權最小平方法、一般化最小平方法、最大概似法都可以視為加權最小平方法的一種特殊應用情況，因此加權最小平方法的應用彈性較大。然而 WLS 法需要大量的樣本才能使估計較穩定，因此， Muthén 、 du Toit 和 Spisic(1997) 提出新的估算法 WLSMV(weighted least squares mean and variance adjusted)，其所估算的時間較 WLS 法短。從以往的文獻中可發現 ML 法經常被運用在檢測 DIF 上(Finch, 2005;

的限制而形成縮減模式(reduced model) (Bollen, 1989; Byran, 2001)。將兩模式的卡方值相減，得到檢定的卡方值，此卡方值服從卡方分配。Satorra 和 Bentler 提出了一個新的卡方法 Satorra-Bentler（SB） chi-square differences（Satorra & Bentler, 2001），更適切於巣套模型的比較。若兩模式的卡方差異超過設定的臨界值，則此兩模式有差異存在。

本研究以 MACS 模式檢測 DIF 試題時，可運用軟體 Mplus 中的 DIFFTEST (Muthén & Muthén, 2007)進行分析，比較縮減模式(reduced model)與擴充模式(full model)是否達顯著差異，藉以判定試題是否具有 DIF。在縮減模式中我們將強制 MACS 做類別資料的分析。(Chen, Shih, & Wang, 2009; 柯明錦，2010)

運用 MACS 法做 DIF 檢測相較於 IRT 具有以下優勢(Chan, 2000; Reise, Widaman, & Pugh, 1993)：

(1) MACS 法提供 MIs 值 (modification indices)能夠有效的偵測出哪些試題參數違反了恆定性。IRT 中並沒有提供 MIs 或是類似的指標，只是在測驗中由兩個模式，其中一個模式假設試題參數對所有的試題在不同的群體中具有恆定性，另一個模式假設除了一題的參數在相關的群體中可被自由的估計其他皆保持不變(Reise et al., 1993)相互比較來檢測，但這個過程會使型一誤差發生膨

脹而失控的現象。

(2) 研究者在 SEM 的模式下能夠處理多向度的問卷(Little, 1997)，然而在 IRT 模式下使用的軟體，例如 MULTILOG(Thissen, 1991)和 PARSCALE (Muraki &

Bock, 1996)比較適合檢測單向度的問卷。

(3) MACS 法對每一道試題只需檢測兩個參數(截距和因素負荷量)，然而在 IRT 五點計分的模式下每一道試題有 5 個參數須被估計（1 個鑑別度參數和 4 個階難度參數）。

在文檔中平均數及共變數結構法在多分題上的DIF檢核效果 (頁 19-25)

第二章 文獻探討

第四節 結構方程模式的 DIF 檢核

第二章文獻探討

第四節結構方程模式的 DIF 檢核