緒論 - 局部試題依賴偵測方法之偵測效果比較

第一章緒論

第一節研究動機與目的

由於近年來，測驗的研究者已經開始發現到題組（testlet）其實是比一般選擇反應式題型擁有更多的優點，例如可以測量到資訊萃取的能力、評量較為結構化、

較單題設計來得經濟以及可以測到比較複雜且高層次的認知能力等等（王文中、

呂金燮、吳毓瑩、張郁雯、張淑慧，2008；Mehrens & Lehman, 1978；Thissen, Steinberg, & Mooney, 1989；Wainer & Wang, 2000；）。甚至也有學者認為，使用題組不僅能夠測得受測者在面對問題時的處理能力，還能真實地反映其應對時主要經歷了哪些心路歷程，故更能增加測驗的建構效度（Zenisky, Hambletom &

Sireci, 2002；Keller, Swaminathan & Sireci, 2003）。是故，在當代國內外大型的標準化成就測驗之中，都不乏可以見到題組這種題型，例如大學聯考、國中基本學力測驗（The Basic Competence Test for junior High School Students）、托福檢定

（The Test of English as a Foreign Language）、國際學生評量（The Programme for International Student Assessment）等。然而，即便題組確實擁有上述許多不同的優點，但在實際使用時，卻很有可能因為題材選用或子題設計的不當，而使得受測者能力的測量受到其他非期望的共同因素所干擾，導致單向度的假設

（unidimensionality）無法被滿足，而間接使得局部獨立性的假設（local item independent）受到影響。但由於以上兩個假設對試題反應理論（item response theory；以下簡稱IRT）來說，都是相當重要且必須成立的。因此，一旦分析者仍然決定利用IRT的技術來分析題組資料的話，勢必要在分析的程序上作一些調整，

以讓上述的兩個假設能夠重新獲得滿足，避免錯估與測驗有關的所有訊息，導致錯誤的推論（Yen, 1993；Wainer & Thissen, 1996；Ferrara et al., 1999）。

針對上述題組資料可能涉及局部獨立性假設（local item independent）違反的問題，學者們主要提出了以下兩種的調整方式來讓此假設能夠重新獲得滿足，第一

種方式主要是將單一個題組視為一個多點計分的試題，並使用一般的多點計分模式進行分析（Andrich, 1985；Rosenbaum, 1988；Thissen et al., 1989；Wilson &

Adams, 1995；Lee, 1998），而由於題組與題組之間通常是獨立無關的，故可以透過此種計分方式上的改變，讓局部獨立性的假設得以滿足。然而，以這種的構想所創造出來的多點計分題目，實際上並非一個真正的多點計分題目，而是由好幾個題目所組成的一個題組。是故，若貿然地使用多點計分模式來分析題組資料的話，不但會導致部分與受試者有關的訊息因此被遺失掉，也會使得一些測驗本身的訊息因此喪失。

由於部份學者不願意為了控制局部試題依賴（local item dependent）的問題而付出以上這些代價，所以他們即提出了第二種調整方式來解決題組的局部試題依賴問題。此方式主要是透過在一般的IRT模式中加入一個代表題組效果的隨機參數γ，形成所謂的題組反應模式，藉此將局部試題依賴的問題予以模式化，使得後續利用該模式所估計出來的試題及受測者能力參數能夠排除局部試題依賴的影響力，能有較精準的估計結果。相較於第一種方式而言，使用這種題組的反應模式來分析題組資料，除了可以有效地處理題組局部試題依賴的問題及保留住和每個題目有關的作答訊息之外，還能同時估計出各個題組之γ參數的變異數，供研究者用以判斷各個題組的局部試題依賴情形，是近年來較獲推崇的作法

（Bradlow, Wainer & Wang, 1999；Wainer, Bradlow & Du, 1999；Wang & Wilson, 2005）。

然而，即便學者們已經提出了上述幾種的調整方式來處理題組局部試題依賴的問題，但實際上，這些調整的方式大多都會使得分析的過程變得更加複雜，以致於無形之中增加了分析者在資料處理上的負擔，因此，倘若題組本身並未存有局部試題依賴問題的話，分析者也許就可以不必採用上述的調整方式來處理題組資料，分析的負擔也就能相對減輕。是故，分析者若能事先洞悉各個題組的局部試題依賴情形，必然會對於後續的整個資料過程該如何進行，有不少的幫助。然而，

判斷題組局部試題依賴情形的方法其實相當的多，主要除了有上述的γ參數變異 數之外，還有學者提出Q₃指標及相關係數來判斷題組的局部試題依賴情形，且研究者亦認為，透過對每個題組進行殘差主成分分析的方式，亦可以有效地瞭解到題組是否有局部試題依賴的問題存在。

因為局部試題依賴的偵測方法很多，每種作法所仰賴的理念也都有所不同，故研究者認為有必要進一步釐清各種偵測方法的實際偵測效果，以瞭解在什麼樣的情境之下應採用什麼樣的偵測方法來判斷題組的局部試題依賴情形。在檢視過去相關的研究之後發現，針對不同局部試題依賴偵測方法之偵測效果進行比較的研究其實相當地少，僅Chen和Thissen（1997）及Huynh、Michaels與Ferrara（1995）

進行過這類的研究。有鑑於此，本研究即以三種不同的局部試題依賴偵測方法為例，比較各種方法在不同模擬情境之下（人數、題組內試題數、題組效果）的局部試題依賴偵測效果，並以93～98年國中基本學力測驗英文科的實徵資料為例，

檢視各個偵測方法的實際偵測結果。主要的研究目的有二：

一、瞭解在不同模擬情境之下，各種局部試題依賴偵測方法的偵測效果。

二、瞭解對於 93～98 年國中基本學力測驗的英文科題組而言，各種局部試題依賴偵測方法的實際偵測結果及各題組的局部試題依賴情形。

第二節研究問題

根據上述的研究動機與目的，本研究所擬定的研究問題如下：

一、各種局部試題依賴偵測方法的偵測效果是否會因模擬情境的不同而有差異？

二、對於 93～98 年國中基本學力測驗的英文科題組而言，各種局部試題依賴偵測方法的偵測結果是否有差異？93～98 年國中基本學力測驗之英文科題組是否有局部試題依賴的問題存在？

第三節名詞釋義

一、題組（testlet）

屬於一種提供共同的文字論述、問題情境或資料背景說明，接著連續有幾個題目要求學生作答的題型。題目可以是是非題、選擇題、簡答題等，但一般來說還是以選擇題最為常見。該題型多用來測量較複雜的學習成果（王文中、呂金燮、

吳毓瑩、張郁雯、張淑慧，2008）。

二、局部試題依賴（local item dependent）

為一相對於局部獨立性假設（local item independent）的重要概念，指當題目與題目之間受到一些非期望的共同因素所干擾時，產生的答題反應相互依賴現象，

較常發生於題組類型的測驗。

三、題組效果（testlet effect）

題組反應模式主要是透過在一般的 IRT 模式中加入一個代表題組效果的隨機

參數γ，藉此將局部試題依賴的問題予以模式化，使得後續利用該模式所估計出

來的試題及受測者能力參數能夠排除局部試題依賴的影響力，能有較精準的估計結果。以 Rasch 題組模式為例， 是指受試者 k 在第 d(i)個題組上的隨機效果，

即受測者 k 答對題目 i 的機率除了會受到其能力（θk）及該題目難度（）的影響之外，還會受到該題目所屬題組之隨機參數γ 的影響。然而，隨著受測者的不 同，反映在第 d(i)個題組上的隨機效果 γ 也就有所差異，而所有受測者在第 d(i) 個題組上之隨機效果γ 的變異數（ ）大小，就代表了第 d(i)個題組的試題依 賴嚴重程度。

在文檔中局部試題依賴偵測方法之偵測效果比較 (頁 9-13)

緒論

第一章 緒論

第一節 研究動機與目的

第二節 研究問題

第三節 名詞釋義

第一章緒論

第一節研究動機與目的

第二節研究問題

第三節名詞釋義