研究設計

第三章研究方法

第一節研究設計

本研究自編一份國小六年級學童小數的除法測驗，並參考林佳樺（2009）

所探討之 HO-IRT 估計模式，透過實證資料方式探討完整估計與分開估計之估計效果，並以 AIC、BIC 和 DIC 指標。來檢驗 HO-IRT、MIRT_C、MIRT_U 和 UIRT 四種模式之適配度，作為模式選用之依據。用統計軟體進行各階層之分開估計及兩階層之完整估計，接著比較 UIRT、MIRT_C 和 MIRT_U 的分開估計與 HO-IRT 完整估計的成效。

壹、自編小數的除法測驗

一般測驗的計分型態可分為二元計分與多元計分。大型測驗大多屬於多向度測驗，多向度測驗又分為題間多向度測驗和題內多向度測驗。本研究自編之國小六年級學生之小數的除法測驗為二元計分，共有 24 題，測驗之詴題設計為題間多向度測驗。

貳、模式估計

本研究用來做測驗參數估計的模式有 UIRT、MIRT_U、MIRT_C 及 HO-IRT 四種。本研究所指之整體量尺（代號 H）為國小六年級學生小數的除法能力，

領域量尺（代號 L）為 TIMSS 評量架構中之認知領域--知道（L₁）、應用（L₂）和推理（L₃）。

UIRT 模式是指估計整體量尺的能力，如圖 3-1-1；MIRT_U 模式是指用 UIRT 來估計 MIRT 的模式，也就是將各個領域量尺視為獨立，如圖 3-1-2，L₁包含 X01到 X₀₉和 X₁₇，也就是詴題 1 到 9 和詴題 17； L₂包含 X₁₀到 X₁₃ 、X₁₅ 、 X₁₉ 、X₂₀ 、X₂₂和 X₂₄，也就是詴題 10 到 13 和詴題 15、19、20、22、24； L₃ 包含 X₁₄、X₁₆、X₁₈、X₂₁和 X₂₃，也就是詴題 14、16、18、21 和詴題 23；MIRT_C 模式也是用 UIRT 來估計 MIRT 的模式，但各個領域量尺之間彼此有關聯，L₁ 包含 X₀₁到 X₀₉和 X₁₇；L₂包含 X₁₀到 X₁₃ 、X₁₅ 、X₁₉ 、X₂₀ 、X₂₂和 X₂₄；L₃ 包含 X₁₄、X₁₆、X₁₈、X₂₁和 X₂₃，如圖 3-1-3；HO-IRT 模式是指同時估計整體量尺和領域量尺的能力， X₀₁到 X₀₉和 X₁₇是估計 L₁；X₁₀到 X₁₃ 、X₁₅ 、X₁₉ 、 X20 、X₂₂和 X₂₄是估計 L₂；X₁₄、X₁₆、X₁₈、X₂₁和 X₂₃是估計 L₃，₁、₂和₃ 分別代表 L₁、L₂和 L₃與 H 間的相關係數，如圖 3-1-3。

圖 3-1-1 UIRT 模式 X01-09, X17

X10-13,

X₁₅ ,X₁₉ ,X₂₀ X_22, X₂₄

X_14, X_16, X₁₈ X_21,X₂₃

整體量尺

小數的除法

（H）

圖 3-1-2 MIRT_U 之題間多向度模式

圖 3-1-4 HO-IRT 之題間多向度模式 架構(Bayes framework)下的 Akaike’s information coefficient (AIC)、Bayesian information coefficient (BIC)與 deviance information coefficient (DIC) 三種指標，

驗證 HIRT 架構下的測驗資料，以了解 AIC、BIC 和 DIC 三種指標，在 HO-IRT 模式之詴題反應函數(item response function; IRF)選擇的效果。

本研究採用 Congdon(2003)基於貝葉斯架構的 AIC、BIC 與 DIC 三種指標，

X_01-09, X₁₇

探究在 HO-IRT、MIRT_U、MIRT_C 和 UIRT 模式下，哪一種模式與測驗資料之間的適配度是合適的。三種指標的定義如下（引自謝典佑等，2009）：

一、 AIC 指標：是指統計上模式之相對適配度的測量。

A I C(M o d e l)d2p

d 為偏差，對一個模式而言，偏差的值較小，表示資料與模式的適配度較好。d 是−2×log（最大概似法，maximum likelihood）；p為模式中的參數量。

本研究之參數量，有一個主要量尺、三個次級量尺、一個詴題難度參數和三個迴歸參數，一共八個參數量。

二、 BIC 指標：在不同類別之參數量中，模式選擇的一種指標。

BIC(Model)d p(logN)

N 為樣本數，本研究樣本數為 538 人。

三、 DIC 指標：AIC 和 BIC 的一般化階層式模式的指標，以 MCMC 模擬方法獲得後設分配，且當後設分配是多元常態分配時，DIC 指標才有價值。

D I C(M o d e l)  D() pD  D()2PD

D()為後設模式之帄均偏差，是一種模式適配度的 Bayesian 測量,而

) (

D 為後設模式之偏差。p_D為模式中的自由參數量，P_D  D() D()。以 DIC 的最小值作為模式的選擇，是觀察一組複製相同結構之資料的最好預測。

此外，DIC 的優點是從樣本中，以 MCMC 模擬方法很容易就能算出指標值，

在文檔中以TIMSS 2007數學評量架構中認知領域進行國小六年級小數的除法測驗編製及分析 (頁 36-40)

第三章 研究方法

第一節 研究設計

壹、自編小數的除法測驗

貳、模式估計

第三章研究方法

第一節研究設計