第二章 文獻探討
第二節 試題反應理論
測 驗 理 論 (Test Theory)是一種解釋測驗資料間實證關係(Empirical Relationships)的有系統的理論學說(Crocker & Algina, 1986; McDonald, 1999;
Nunnally & Bernstein, 1994; Suen, 1990),學者通常把它的發展劃分成二大一小 學派。
其一為以真實分數模式(True Score Model)(Gullikson, 1987; Lord & Novick, 1968)為基礎的古典測驗理論;另一學派,是以試題反應理論(Hambleton &
Swaminathan, 1985; Hambleton, Swaminathan, & Rogers, 1991; Hulin, Drasgow, &
Parsons, 1983; Lord, 1980)為架構的當代測驗理論(Modern Test Theory)。而一 小學派,則為以變異數分析,所延伸出來的概化理論(Generalizability Theory, GT)(Brennan, 2001; Cronbach, Gleser, Nanda, & Rajaratnam, 1972; Shavelson &
Webb, 1991)。
其中概化理論較少處理測驗議題,偏向統計學理論,投入的研究學者較少 且文獻較少。
測驗學界以古典測驗理論與試題反應理論為主,其中古典測驗理論主要以 整份測驗觀點,來解釋測驗分數的意義,具備理論不需太多數理統計學與電腦 背景,淺顯易懂的優點,受中小學教師或一般社會大眾所接受,適合小班級內 之測驗與評量使用。
試題反應理論以個別試題觀點,來解釋測驗分數的意義(余民寧,2009)。
理論假說嚴謹,需雄厚數學與電腦背景知識,雖不易受大眾瞭解與接受,但適 合升學考試、檢定考試等大規模的教育測驗方案(Large-Scale Educational Testing Programs)之中,隨著 1990 年代後試題反應理論模式被大量應用在大型測驗情 境與教育研究場域後,持續不斷有新的試題反應模式被提出,並被驗證其存在 價值,已成為相當普及並成熟的測驗理論學說。
本研究著重在建置一仿高中學測數學科之量尺化試題庫,可供即將參與學 測的高中三年級應屆畢業生(或數學專任教師、導師)瞭解學生的數學科能力 定位,並期待透過本研究建置之試題庫更可預測學生參加正式學測的表現,因 此採用適合大型測驗情境的試題反應理論。
試題反應理論認為受測者在某一試題上的表現與其能力之間的關係,可透 過一條連續性遞增函數-試題特徵曲線(Item Character Curve, ICC)來表達能力 不同的受測者在同一試題上的能力表現。而進一步將各試題的試題特徵曲線進 行加總,變成為描述整份測驗的測驗特徵曲線(Test Character Curve, TCC),試 題特徵曲線與測驗特徵曲線皆為迴歸線(Regression Line),試題反應理論中,
每一種試題反應模式都有相對應的試題特徵曲線。
本研究採用三參數模式(Three-Parameter Logistic Model, 3PL),適合用來 解釋學校學生受測者作答反應,包含教師課堂用的自編成就測驗、升高中基測
a
i為第 i 個試題的鑑別度參數(Item Discrimination Parameter),表示該試題 是否足以區別出學生的能力高低。b
i為第 i 個試題的難度參數(Item Difficulty Parameter),表示該試題困難或容易作答的程度。
c
i為第 i 個試題的猜測度參數(Pseudo-Chance Parameter),表示該試題被低 能力學生隨機猜題而猜中的程度。此三參數隨命題確定後已然存在,但受測者尚未作答前無法得知,需於受 測者作答後,使用程式(如本研究採用BILOG-MG)來估算數值的大小。另外,
仍 有 二 參 數 模 式 (Two-Parameter Logistic Model, 2PL) 與 單 參 數 模 式 (One-Parameter Logistic Model, 1PL),非本研究應用範圍,不另贅述。