AD1lh5Pf具試題曝光率控管之電腦適性測驗系統研發

(1)

國立台中教育大學教育測驗統計研究所理學碩士論文

指導教授：郭伯臣博士

具試題曝光率控管之

電腦適性測驗系統研發

研究生：蔡曜仲撰

中華民國九十六年六月致謝

(2)

首先我要感謝我的指導教授郭伯臣博士，於修業的兩年中給予我悉心的教導，讓我能夠循序漸進的學習電腦化適性測驗這個領域當中的精髓，另外，郭教授所擬定的試題曝光率研究方向，則讓我更深刻的體驗到這個課題在電腦化適性測驗所占的重要地位，即使在碩士修業結束後，也能保有持續研究的動機與能量。此外，我也要對我的研究伙伴陳昇座致上謝意，基於他曝光率模擬研究的成果，以及不厭其煩的修正、比對與討論，讓我在實作的過程當中能有一個比較的依據，才能完成我的實作系統。除此之外，在研究的過程當中，不僅要與模擬研究的數據相比對，還要進行實際的施測，而施測的對象則必須尋找適合的樣本，這些樣本的來源當然要感謝許多在職教師的幫忙，更重要的是受試學生的配合，缺少了任何一個環節，我的研究都將半途而廢。除了研究上的支援，精神上的支持更是讓我持續完成研究的一大主因，這一切都要感謝我的家人以及妻子在精神的鼓勵與支持，我的家人在我倦怠的時候給予我適時的能量，在我灰心的時候給我加油打氣，才能完成這項學業。修業完成似乎代表一件事情的結束，但對我而言，卻是啟發我研究精神的開始，不論在工作上或是自我期許方面都帶給我許多啟示，學術知識對我而言不再是遙不可及的天方夜譚，而是實實在在可以運用在教學與人生上的有用知識與工具，感謝一路走來幫助我的每一個人，也希望未來能以所學幫助需要幫助的人。

(3)

摘要

電腦化適性測驗(computerized adaptive testing，簡稱 CAT)是最近教育測驗的趨勢，由於電腦化適性測驗是一種變動長度及變動試題的測驗，因此在測量受試者能力時會更有效率，在考試時間的安排上也會更具彈性。然而，隨著電腦化適性測驗的普及運用，電腦化適性測驗開始面臨試題安全性的議題。現今對於題庫安全最主要的兩種評估依據就是試題重疊率(item overlap rate)以及試題曝光率(item exposure rate)，本研究則是以試題曝光率作為主要的探討對象。試題曝光率控管方法有很多，目前實務上最常使用的是

SH(Sympson & Hetter procedure，簡稱 SH)，SH 的試題曝光率控管模式是先模擬一群受試者的能力值，此群的模擬能力值通常必須和未來施測的樣本群能力值分佈相仿，利用此一群模擬能力值對試題進行模擬施測，最後每道試題即產生一個曝光控制參數，在未來進行施測時，該試題的曝光率即受此曝光控制參數控管，雖然 SH 能有效控管試題曝光率，但難以保證未來受試者樣本群能力值與模擬的受試者群能力值相仿，如果，模擬群的能力分佈與施測時受試者群的能力分佈相差太大，部分試題的曝光率控制將會大打扣。有鑑於此，Stocking & Lewis (1998)將 SH 的理論作延伸，提出一種條件曝光控管法(Stocking & Lewis conditional procedure，簡稱 SLC)，然而，由於 SLC 在選題的過程中必須使用複雜的演算方式，且這種演算對於曝光率控管成效未必有明顯幫助，因此，Chang(2003)提出，以 SHC 來代替 SLC 不但可以使用簡便的最大訊息法選題，也能分層控管試題曝光率。本研究的目的是實作一個電腦化適性測驗系統，並比較在同一題庫的條件下，分別使用改良式 SH(本文中簡稱為 SH-b)與改良式 SHC(本文中簡稱為 ASHC-b)時，對於系統實作的可行性與試題曝光率控管的優劣比較。關鍵字：電腦適性測驗、試題曝光率控管、測驗安全性

(4)

Abstract

Recently, Educational testing tends to computerized adaptive testing. Because the items and item length of CAT are variable. So, it would be more efficiency when estimating the ability of test-takers and more flexible when arranging test schedule. However, as the popular use of CAT, the subject of the security of item pool becomes seriously. Today, the major two standards of evaluating item pool security are item overlap rate and item exposure rate. In my study, item exposure rate is the major object to be investigated. There are many kinds of item exposure controlling model, the most used model in practice is SH(Simpson & Hetter procedure). What the SH model does is to simulate a group of ability in advance which is similar to the group that would be tested in the future. To take a simulation with the group of ability, you can result the exposure controlling parameter of each item. When you take a test in the future, the item exposure rate would be controlled by the item expousure parameters. Although, SH can take an efficiency control of item expouser rate. It can not ensure that the simulation group of ability would be similar to the real one.If the difference of simulation and reality is too far, some results of item exposure controlling would not be good. As a result, Stocking & Lewis(1998) extend the SH theory, they recommend a conditional controlling procedure as SLC(Stocking & Lewis Conditional procedure). But, SLC must use a complex method of selecting items, this method is not useful for

controlling expouser rate in evidence. Chang(2003) suggest that to display SLC as SHC is not only using simple method of maximum information but also controlling exposure rate of each level well.

The main purpose of my study is to implement a CAT testing system and to compare the feasibility and efficiency of improved SH and improved SHC in the sample item pool size.

(5)

目錄

摘要……… I Abstract……….. II 目錄……… III 圖目錄……… V 表目錄……… VI 第一章緒論……… 1 第一節研究動機………. 1 第二節研究目的………. 3 第二章文獻探討……… 4 第一節試題反應理論………. 4 第二節電腦化適性測驗初始階段選題法……… 6 第三節電腦化適性測驗選題法……… 7 第四節曝光率之相關研究……… 8 第五節能力估計………. 13 第六節電腦化適性測驗………. 14 第三章研究方法………. 16 第一節曝光控制參數………. 16 第二節施測樣本與內容……… 20 第三節施測工具………. 20 第四節施測流程………. 23 第四章研究結果與分析……… 28 第一節曝光率結果分析………. 28 第二節系統效能……… 30

(6)

第五章結論與建議……… 31 參考文獻……… 32 附錄 A 試題三參數……… 37 附錄 B SH-b 所使用的曝光控制參數……… 44 附錄 C ASHC-b 所使用的曝光控制參數……….. 46 附錄 D 資料庫表單…………..……… 59

(7)

圖目錄

圖 3-1-1 最大預期曝光率(r 值)區間分佈圖……… 19 圖 3-3-1 系統歡迎畫面……… 21 圖 3-3-2 系統登入畫面……… 21 圖 3-3-3 系統施測畫面……… 22 圖 3-3-4 施測結束畫面……… 22 圖 3-4-1 初始階段施測流程圖……… 25 圖 3-4-2 初始能力估計圖……… 25 圖 3-4-3 電腦適性測驗施測流程圖……… 27 圖 4-2-1 系統效能監控畫面……… 30

(8)

表目錄

表 3-1-1 各區間模擬樣本分佈表……….. 19 表 3-2-1 施測樣本比較表……….. 20 表 3-3-1 伺服器最低需求表……….. 23 表 3-3-2 區域網路最低需求表………... 23 表 4-1-1 曝光率統計結果比較表……….. 29

(9)

第一章緒論

由於傳統紙筆測驗有許多缺失，近年來電腦化適性測驗興起且有取而代之的趨勢，但電腦化適性測驗的題庫安全，也是一直以來倍受討論的議題，如何建置一個有效且可行的試題曝光率控管模式，則是本研究所要討論的主題，以下就研究動機、研究目的分節詳述。

第一節研究動機

在傳統的紙筆測驗方式當中，不論受試者能力的高低，都要將整份試卷作完，這樣子不僅浪費時間，對於高能力的受試者而言，會覺得試題太過簡單而浪費時間；對低能力的受試者而言，會覺得試題太過困難，使得受試者會猜測答案，影響測驗的準確性。電腦化適性測驗則是依據受試者逐題作答的反應來決定下一道施測的試題，如此一來，施測的試題符合受試者的能力，使受試者覺得試題難易適中，減少作答的題數，節省測驗長度與時間。另外，電腦化適性測驗可以取代傳統紙筆測驗人工出題、閱卷、計分與成績統計的工作，這些工作交由電腦來處理，會變得更精確、更省時、更節省成本。由於電腦化適性測驗採用非固定題目以及非固定長度的測驗方式，在考試時間的安排上也會比傳統的紙筆測驗更具彈性。 1960 年，美國陸軍總署、人事管理局、及其他聯邦機構，大力支持贊助有關適性測驗的研究，並舉辦專題研討會，有數百篇的相關研究論文發表，收集成冊(Wainer, 2000; Weiss, 1983; 余民寧， 1997c)。在國外許多商業機構、測驗公司，也陸續有測驗產品的發行，如Larson & Smith(1988)所發展的「西班牙電腦化適性安置測驗」(a Spanish computerized adaptive placement exam)；測驗系統公司(Assessment Systems)所發行的「MicroCAT 適性測驗系統」與「minnesota 文書性向評鑑測驗」；美國心理測驗公司(the psychological

(10)

corporation)所發行「中學區分性向測驗」(李茂能， 2000)。在大型測驗如 GRE(graduate record examinations)、TOFEL(test of english as a foreign

language)、GMAT(graduate management admission test)等亦均已實施電腦化適性測驗。總括而言，電腦化適性測驗具備了適性化選題、節省施測時間、節省施測試題以及精確估算受試者能力這幾項優點，成為現今教育測驗非常重要的測驗模式。由於電腦化適性測驗能管理大量的試題題庫以及受試者，所以非常受到現代大型測驗的青睞，但在大量受試者使用過後，便會產生試題安全性的問題，通常試題安全性由兩個重要的指標數值來觀察，一是試題曝光率(item exposed rate)，另一個則是試題重疊率(item overlap rate)，在本研究當中則是以試題曝光率作為探討試題安全的觀察值。早期對於題庫安全的控管，是在選題的時候以隨機的方式進行(Chang, 2003)，以達到均衡試題曝光率的效果，但是這種方式的控管效果很明顯無法達到預期效果，因此，就產生了直接對曝光率作控管的想法，其中最常被討論到的控制法就是SH，這個方法是在試題實際施測前，事先模擬一群受試者能力值，而這一群模擬能力值的分佈必須與未來施測對象的受試者能力分佈相仿，才能達到較佳的曝光率控管效果，為了改善這個缺點，於是產生了對不同能力分層使用不同曝光控制參數的概念，Chang(2003)將 SH 加以延伸，提出了SHC(Simpson & Hetter conditional procedure)，SHC 這種控管模式是先依能力值高低分層模擬多群的受試者進行模擬迭代，取得每道試題在各能力分層的曝光控制參數，成為一個曝光控制參數陣列，作為將來實際施測時的曝光控管依據。但是這樣的曝光控制參數，在每個能力分層的最大預期曝光率，都是使用相同的值，對於人數分佈較少的高能力層和低能力層而言，應該將最大預期曝光參數調高，反之，對於人數分佈較多中能力層，則應將最大預期曝光參數調低，才能提高題庫使用率(陳昇座， 2007)。

(11)

在本研究當中，不僅實作SH 與 SHC 這兩種曝光率控管模式，並加以改良，在初始選題階段均加入了b 值分層選題(錢永財、劉家惠、郭伯臣， 2005) 的策略，以期降低測驗長度，節省試題與時間，經改良過的SH 與 SHC 在本文中分別以SH-b 與 ASHC-b 稱之。除此之外，在 ASHC-b 控管模式中，每一個能力區間均以非固定的最大預期曝光率作為模擬測驗時的控管閾值(陳昇座， 2007)，此最大預期曝光率則是以模擬受試樣本的能力分佈為依據，對每個區間作動態的調整，以期對題庫試題作更有效的運用。在相關文獻當中(何政翰， 2004；陳俊宏， 2004；陳仁欽， 2004；Chang, 2003)均以模擬研究為主，而本研究則是建置一測驗系統，並找尋適合樣本進行實際電腦化適性測驗，觀察、整理實際施測與模擬研究之間的異同。

第二節研究目的

本研究的目的主要有兩點：一、建置一能容納大量題庫與提供多人同時施測之電腦化適性測驗系統，且該系統實作SH-b 與 ASHC-b，並提供出題、估計受試者能力值與成績報告之功能。二、比較SH-b 與 ASHC-b 在實際施測、模擬施測與模擬研究的情況下，對於題庫安全控管的影響。

(12)

第二章文獻探討

電腦化適性測驗是以試題反應理論為基礎的一種測驗模式，在應用的過程當中包含了建置題庫、選題、曝光率控管、施測以及估計受試者能力值等階段，在本章當中分別就試題反應理論、電腦化適性測驗選題法以及曝光控管等議題進行探討。

第一節試題反應理論

試題反應理論建立在兩個基本概念上(Baker, 2004; Birnbaum, 1968; 余民寧， 1997a；余民寧， 1997b)，一是受試者在某一測驗試題上的表現情形，可由一組因素來加以預測或解釋，我們把這組因素叫作潛在特質或能力；二是受試者生的表現情形與這組潛在特質間的關係，可透過一條連續性遞增的函數來加以描述，我們把這個函數便叫作試題特徵曲線（item characteristic curve， ICC）。這樣的試題特徵曲線所代表的涵義是某一道試題被答對的機率是由受試者能力以及試題特性所決定，因此試題反應理論有幾項基本假設，唯有在這些假設成立的條件下，才能夠使用試題反應理論來分析測驗資料，以下就這些假設進行討論。一、單向度：那就是測驗中的各項試題都測量到同一種潛在特質或能力，這樣的潛在特質或能力必須包含在實驗的假設當中，這就是所謂的單向度。雖然實際的測驗當中，受試者的表現很少受到單一因素的影響，但我們仍然可以將這些因素的整體表現視為一個潛在特質來看，如此便符合試題反應理論的單向度假設。二、局部性獨立：意思是說，受試者在不同的試題間的表現是沒有任何關係存在的。三、非速度測驗：測驗的過程並不限制時間，也就是說，受試者將能力完整的表現在所有試題當中，而不會受到因時間不足而沒有完成測驗的

(13)

影響。四、知道-正確假設：如果受試者知道某一道試題的答案，那麼那必然答對；如果他不知道某一道試題的答案，那麼該道試題必然答錯的假設。對於這樣的試題特徵曲線，在實際研究上有三種模式可供應用，分別為單參數模式、雙參數模式以及三參數模式，而在本研究當中所使用的是三參數模式的函數(Birnbaum, 1968)，如公式一所示。　 )) ( exp( 1 1 ) 1 ( ) ( j j j j j b a d c c P − ⋅ − + − + = θ θ (公式一) ) (θ j P ：受試者在第j 題的答對機率 θ ：受試者的真實能力。 j a ：為試題j 的鑑別度。 j b ：為試題j 的難度。 j c ：為試題j 的猜測度。 d：通常預設值為1.702 之常數。

(14)

第二節電腦化適性測驗初始階段選題法

在電腦化適性測驗當中，有一個重要的議題，那就是受試者在進行施測時，一開始尚未有受試者能力的相關資訊時，要如何選題？雖然起始點的選題法對能力估計的影響不大，但是可以有效提升題庫的使用率(Lord, 1977)，因此在本研究當中為有效提升題庫使用率，以期降低試題曝光率，選擇能有效降低試題曝光率的初始階段選題法加以應到系統當中，本節就初始階段相關的選題法進行探討。常用於起始題的決定方式，有以下幾種(王寶墉， 1995；陳麗如， 1998）：一、中等難度題目：即假設受試者為中等能力，在題庫中挑選難度適中的題目作為施測的起始題，但是若由中等難度題目開始，因題目有限，若每位受試者都使用相同的題目開始，其保密性需要考量。二、由受試者之基本資料（年齡、學習、經驗或其他測驗結果）估算受試者能力初始值，以決定測驗起始點。三、自由選題：由受試者在接受測驗的時候，自行判定自己的程度，以決定施測的起始題。四、隨機選題：由電腦隨機選題，但一般限定試題難度參數b 介於-0.5 至 0.5 間為選取範圍。初始階段b 值分層隨機選取法(錢永財、劉家惠、郭伯臣， 2005)當中指出，初始階段b 值分層隨機選取法能有效提能題庫使用率，降低整體曝光率，Lord(1977)發現不同測驗起始值對測驗標準誤影響不大。且在測驗初期能力估計尚未精確，因此分散試題的選取，以期在不降低能力的精準度下，能有效提升題庫使用率，降低題庫整體的曝光率。在本研究當中則是將題庫中所有的試題依 b 值大小區分為難、中、易三層，並分別從這三層中隨機選出一題，共選三題作為初始階段施測的試題。其實施步驟如下：

(15)

1.將題庫依 b 值大小分成三層。 2.由此三層中各隨機選取一題，使受試者在測驗前期施測難易程度相差較大的的試題。

第三節電腦化適性測驗選題法

在經過初始階段選題並施測後，就可以依據初始階段的施測資料來進行下一題的選題作業，一般而言，常用的選題方法有：一、最接近難度法：當受試者的暫時能力值估算出來之後，將此能力值與題庫中的試題難度比較，找出難度與目前受試者能力值最接近的試題，作為下一道施測的題目。二、單點式最大訊息法：訊息函數(information function)為試題反應理論中為取得最佳試題所作的演算，如公式二所示(Birnbaum, 1968; Lord, 1980)。其中Ij(θ∧)代表暫時能力值為θ 的受試者在 j 試題的訊息量，∧ P_j(θ∧)則是代表能力值為 ∧ θ 的受試者在該在第 j 題的答對機率，Pj'(θ∧)代表答對機率的導數， ( ) ∧ θ j Q 代表答錯機率。在本研究當中就是使用這個訊息函數，以及暫時估計能力值，計算出每道試題的訊息量進行比較，將最大訊息量的試題選出來，再進行SH 或 SHC 曝光控管模式的演算，來決定是否施測。 n i Q P P I i i i i 1,2,3,..., ) ˆ ( ) ˆ ( )] ˆ ( ' [ ) ˆ ( 2 = = 　　 θ θ θ θ (公式二)

(16)

第四節曝光率之相關研究

試題曝光率控管模式大致分為兩類，一種是線上控管模式，這種控管模式是使用即時的控管方式，在每次實際施測後，就對題庫內所有試題重新計算曝光控制參數並予以更新，這種控管方式的好處是，不需事先模擬曝光控制參數，且不會有模擬群體與施測群體能力分佈不同的問題，但每次實際施測後，就要重新繁複的計算；另一類控管模式是非線上的方式，這類控管模式必須事先模擬施測，計算出每道試題的曝光控制參數，在本研究當中，就是使用這類的控管模式當中的SH 與 SHC 這兩種控管模式並改良之進行比較。這兩類的控管過程詳述如下：

一、非線上控管模式

1. Sympson & Hetter procedure (SH)

Sympson & Hetter (1985)所提出的曝光控管方法 (簡稱SH) 可以有效控管曝光率，該方法是利用曝光參數來控管試題被施測的機率；當試題被選取的機率很大時，該方法就用較小的曝光參數將試題被施測的機率調降。曝光參數控管試題曝光率的原理可藉由以下關係式說明：

P(A i) = P(A i |S i) × P(S i) ≦ r max

P(A i) ：第i題被施測的機率

P(S i)：第i題被選取的機率

P(A i |S i)：在試題i被選取的情況下，可以被施測的機率

(17)

由上述的關係式可知，P(A i |S i)的功能在於調整P(S i) 使得P(A i)小於或等 於rmax。假如P(S i)大於rmax，則P(A i |S i)應小於或等於

) ( max i i|S A P r ，才能將P(A i)控 制在rmax之下；反之，若P(Si)小於或等於rmax，則P(Ai|Si)的值可定為1。透過

P(Ai|Si)便可將P(Ai)控制在rmax之下，因此P(Ai|Si)又被稱為第i題的曝光控制參 數(exposure controlling parameter)。此曝光控制參數P(A i|Si)，稱為ki，必須經過迭代的過程產生，步驟如下所示： (1) 給定曝光控制參數初始值，曝光控制參數初始值的每一個值皆設為1。 (2) 估計受試者能力後，依此估計值選出題目中訊息最大者，作為下一題施測題目。 (3) 產生一介於0與1的隨機值x。 (4) 比較曝光控制參數初始值與隨機值x，以產生下一題題目。如果x小於或等 於題目的曝光控制參數初始值，則施測此題；如果x大於曝光控制參數初 始值，則排除此題，在题庫中，選另一個資訊量最高的題目，直到選到要施測的題目，並將以選過的題目排除於題庫中。 (5) 重複上面步驟，使全部的受試者皆測驗完成，計算 N(Ei) = 第i題的受試者人數 N(Si) = 第i題被選中的次數 N(Ai) = 第i題被施測的次數 P(Si) = 第i題被選中的機率=N(S i)/N(E i)

P(Ai) =第i題被施測的機率=N(A i)/N(E i) 並計算出ki

(18)

若P(S i)≦r則新的ki=1.0

(6) 重複步驟2-5重複遞迴計算ki值，直到題庫中每一題的P(Ai)近似於事先設定 的曝光率r，則各題目的曝光控制參數被建立，作為真實資料的控制參數。 2. Sympson & Hetter conditional procedure (SHC)

SHC的控管模式是以SH為藍本，不過在預先進行模擬以求得曝光控制參數階段，需依能力值分層模擬受試者，接著使用各層的模擬能力值進行迭代，求得各層的曝光控制參數。在進行實際施測時，則是在估計出受試者的暫時能力後，便進行SH控管模式選題，共依受試者的暫時能力值，求得該使用何層的曝光控制參數，並使用此曝光控制參數來決定要不要施測該題，若不要進行施測，則回到選題步驟，迭代進行，直到選出到施測的題目為止。

3. Sympson & Lewis unconditional procedure (SL)

SL的控管模式分為兩個階段(Chang, 2003)，第一個階段為調整階段，也就是使用SH控管模式相同的步驟取得曝光控制參數，但是SL與SH不同的地方是在第二階段選題階段，SL使用一種多項式選題法以取代SH當中的最大訊息選題法，其中選題的步驟如下： (1) 使用演算法將試題依欲被施測度排列。 (2) 當我們從這些被排列好的試題當中選擇欲被施測的題目時，就進入了第二個階段，也就是選題階段。首先，建立每個被選擇控管試題的操作機率 (operant probability)，每道試題的操作機率記作 * o i k ，操作機率的計算公式三如下所示： o o o i i l l i K K K =

∏

− × − = } ) 1 ( { 1 1 * _(公式三) l：欲加入排列的題數

(19)

o i K ：第i道試題的曝光控制參數 * o i K ：第i道試題的操作機率 o l K ：所選取第1道試題的曝光控制參數

4. Sympson & Lewis conditional procedure (SLC)

SLC 與 SL 的關係，就如同 SHC 與 SH 之間一樣，SLC 的選題法和 SL 一樣，但在預先模擬曝光控制參數時必須依能力值分層模擬受試者能力值，再將這些模擬的能力值進行迭代，取得每道試題在各能力分層之間的曝光控制參數之後，就可以進行實際施測，在實際施測的過程中，取得暫時能力值後，就可以依據此能力值取得該能力分層的曝光控制參數進行曝光控管。

二、線上控管模式

1. SH online procedure (SHO)

SHO 和SH 類似，皆利用曝光控制參數ki來控管試題的曝光率，兩者差異在於前者是從線上直接取得曝光控制參數，而後者的ki是透過事前迭代模擬產生。SHO 的實施流程如下(假設題庫大小為N，測驗長度固定為L，可接受的最大曝光率rmax )： (1) 令題庫中所有試題曝光參數的初始值為1。 (2) 第m個考生施測第j題時，依其能力估計值θ 選取擁有最大訊息量的試題_j₋₁ i，抽出隨機亂數x介於0~1之間，並把x和ki作比較，如果x小於或等於ki， 則施測試題i；反之，則試題i不施測；若該試題未被施測，就用相同的方 法在θ 下，選取下一道訊息量最大的試題，重複上述作法，直到有題目_j₋₁ 被施測為止，不論所選的試題是否被施測，都要從題庫中移除。

(20)

(3) 當該考生做完第j道試題，依其答題反應估計其能力值θ ，重複步驟2、3，j

直到施測完L道試題。

(4) 當施測完第m位考生時，計算試題被選取的機率P(m)

(S)和被施測的機率 P(m) (A)，再根據P(m) (S)重新定義試題的曝光參數ki(m+1)，ki(m+1)即為第m+1 位考生施測時所使用的曝光參數，曝光參數的調整方式如下： 若P(m) (S) > r max ，則ki(m+1) = (S) P r (m) max 若P(m) (S)≦ r max ，則ki(m+1) =1.0 (為了確保考生可施測到完整的測驗，將L 題曝光參數最大者調整為1。) (5) 重複步驟2 ~ 4 直到施測完所有考生。在這些控管模式當中，線上控管模式是屬於即時的控管模式，它可以在每次測驗結束後，重新演算試題曝光控制參數，也沒有受試者能力分佈與模擬樣本能力分佈必須相符的問題，它可以在每次測驗結束後，重新演算對曝光控制數進行調整，但是若是在每次施測完後就進行重新演算，則會耗費大量時間與機器效能，因此，本研究是以非線上控管模式為主。其中SH 已是非線上控管模的始祖，而SLC 的分層控管概念則是較新的作法，SHC 也是採用分層控管的方式，只是曝光率控管的演算方式不同，Chang(2003)指出，SLC 中演算方式，未能有效提升曝光率控管效果，因此，本研究所採用的是以SHC 為基礎的曝光控管，在SHC 的分層控管概念當中，再加入動態最大預期曝光率的作法，使SHC 更加完備。此外，初始階段的選題策略，也顯著影響試題曝光率(錢永財、劉家惠、郭伯臣， 2005)，因此，在本研究當中，也加入了初始階段 b 值分層隨機選題，使試題曝光率更能達到期望的標準。

(21)

第五節能力估計

在試題反應理論當中，要估計每位受試者的能力值，必須透過受試者作答過的試題參數以及受試者的作答情形(亦即作答組型)，進行能力估計。當受試者在作答完畢後，我們將受試者在每一道試題的作答組型作連乘積，此時會得到一個聯合機率函數，其一次導函數與二次導函數如公式四、公式五所示，在作答試題三參數已知的情況下，本研究採用最大概似估計法

(maximum likelihood estimate，簡稱 MLE)，對此函數進行最佳解的逼進。逼進的方式則是採用牛頓法，如公式六所示。θ 代表目前的能力值，n θ 則是代n+1 表新的能力值，而這個估計公式的終止條件為θ -n₊₁ θ 的絕對值小於 0.01 或者n 迭代超過 30 次。本研究當中則是借由新的能力值代入訊息函數,取得新的試題。

∑

= − − − = n i i i i i i i c P c P P r a D f 1 ' ] 1 )[ ( ] ) ( )][ ( [ ) ( θ θ θ θ (公式四)

∑

= − − − = n i i i i i i i i i c P Q c P P rc a D f 1 2 2 2 2 2 '' ] 1 )[ ( ) ( ] ) ( )][ ( [ ) ( θ θ θ θ θ (公式五) K , 3 , 2 , 1 ) ( ) ( '' ' 1 = − = + n f f n n n n _θ 　 θ θ θ (公式六) θ：能力值 ) ( ' _θ f ：目標函數的一次導函數 ) ( '' _θ f ：目標函數的二次導函數 r ：代表該題的作答組反應，1 為答對，0 為答錯 ) (θ i P ：為第 i 題的答對率 ) (θ i Q ：為第 i 題的答錯率 i a ：第 i 題的鑑別度參數 i b：第 i 題的難度參數

(22)

i c ：第 i 題的猜測度參數 D：為常數 1.702

第六節電腦化適性測驗系統

電腦化適性測驗具有施測情境標準化、計分快速以及題目呈現多樣性的好處(鄧景麟， 2005)，可以使用影音等素材作為試題，對於現今的測驗具有相當大的便利性。電腦適性測驗是現今資訊科技伴隨試題反應理論所產生的測驗系統，在系統中建置試題屬性之後，使用電腦化適性測驗選題法以及能力估計方法，以取得下次測驗的題目以及受試者的暫時能力，如此反覆進行測驗，在符合終止條件的情況下終止測驗，並取得受試者的能力值。在電腦化適性測驗系統當中，通常除了施測模組之外，系統之中還會有人員管理模型、試題管理模組、計分模組以及測驗管理模組等相關模組方便管理相關的測驗資料。人員管理模組可以記錄所有人員的權限、使用紀錄、登入紀錄以及施測紀錄；試題管理模組則可以將所試題作系統化的管理，將出題、修正、題目、答案以及試題參數作統一的管理；而計分模組則可以統計每次測驗完畢以及總施測的結果。其它的相關模組則可以方便所有權限的使用者行使自己的所需的功能，因此，電腦化適性測驗可以說是便利且節省大量人力的現代化測驗系統。在傳統的紙筆測驗當中，每位受試者必須將所有的題目作完，若題目難度太高，受試者會有猜答案的情形；若題目難度太低，受試者則會容易失去耐性，因此，如何在受試者作答的過程中給依受試者能力給予適合的題目則是電腦化適性測驗所要達到的目的(陳仁欽， 2005)。電腦化適性測驗，利用受試者每次作答完畢之後的作答組型以及所作答試題的參數估算出受試者的暫時能力值，並依此暫時能力值配合電腦化適性測驗選題法

(23)

(余民寧， 1997b)選出適合受試者能力的題目進行下一題的施測。現今實作的電腦化適性測驗系統多以測驗與管理系統為主，何政翰 (2004)所實作的系統當中是以知識結構為主體，在系統中提供測驗並搭配多媒體以線上補救教學機制；鄧景麟(2005)則是建立專家結構且經由學生紙筆測驗的結果輸入系統當中，評估學生的能力，協助教師判斷學生的學習情形，再予以適當的補救教學；陳仁欽(2005)則是採用題間多向度電腦化適性測驗，充分利用測驗間的關聯性，節省施測長度；郭冠廷( 2004) 的研究當中則是採用標準化的教材格式(Sharable Content Object Reference Model, SCORM)來進行教材的建置與管理，以概念關聯架構為主軸，發展出一套以國小數學為範圍的適性化測驗雛型系統，雖然系統中有加入選題策略防止學生猜題，但未對試題曝光率進行控管。由於這些實作的系統均未考慮到試題曝光率控管，對於系統未來的使用限制有極大的影響，若系統實行大型測驗時，勢必會產生試題安全的質疑，因此，如何在實作電腦化適性測驗系統時，同時兼顧試題安全性的問題，則攸關到此系統未來運作的範圍與題庫使用壽命。

(24)

第三章研究方法

在研讀完相關文獻之後，本研究主要的方向為將SH 與 SHC 加入初始階段試題b 值分層隨機分層選取法(錢永財， 2005)，以有效降低題庫整體曝光率，SH 加入初始階段試題 b 值分層隨機選取法，在此簡稱為 SH-b，此外，在SHC 當中除了加入初始階段試題 b 值分層隨機選取法外，本研究依模擬樣本能力分佈作為動態的最大預期曝光率的機制，在此統稱為以能力分佈為基礎的SHC 控管模式(ability distribution based SHC procedure with initial b separated level)，簡稱為 ASHC-b，以此建置一電腦化適性測驗系統，提供實際施測的功能。並取得模擬施測與實際施測的結果比較其中的差異。本研究的流程大致分為兩大部分、三個階段，第一部分為模擬研究的部分，模擬研究所使用的工具為Matlab；第二部分為實測系統的部分，實測系統採用以Java2 為基礎的物件導向程式，實作 JSP/Servlet 網頁式程式，提供線上施測，這兩個部分的研究均採用相同的研究流程。研究流程則分為三個階段，第一個階段為模擬曝光控制參數，在這個階段所使用的模擬施測樣本為729 個實測樣本能力分佈，模擬出所需的樣本，求得每道試題的曝光控制參數，在ASHC-b 當中，則是分層模擬各能力分層的曝光控制參數，這些模擬出來的曝光控制參數，則同時供模擬實驗與實測系統使用。第二個階段為施測階段，在模擬實驗中，是採用729 個實測樣本作模擬施測，取得曝光率統計結果；在實測系統中，除了隨機抽取學校，作實際施測外，也將729 個實測樣本隨機抽出100 與 200 名受試者的作答組型，輸入實測系統，取得統計結果。第三階段則為統計與比較的階段。

第一節曝光控制參數

如第二章文獻探討中所述，本研究所採取的SH-b 與 ASHC-b 必須事先模

(25)

擬施測取得曝光控制參數，所謂的事先模擬施測是指，模擬出一群受試者的能力值，符合某一種分佈，使用SH 的方法迭代，最後計算出每一道試的曝光控制參數，以下就SH-b 與 ASHC-b 曝光控制參數的演算過程加以詳述：

一、SH-b 之曝光控制參數

SH-b(Sympson & Hetter procedure with b level separated)其的「b」所指的是初始階段b 值分層隨機選取法，在本研究當中，事先模擬施測的樣本是在中部某縣市抽樣取得729 名受試者，這些受試者每一位都將題庫中所有的試題作答完畢，並依其作答組型計算出每一位受試者的能力值，此即為受試者的真實能力值。在SH-b 的曝光控制參數中，就是使用這一組能力值分佈模擬出 4000 位受試者，於Chang(2003)建議使用最大預期試題曝光參數 r = 0.2，進行事先模 擬施測，取得每道試題的曝光控制參數(如附錄 B 所示)。在本研究當中，初始階段b 值分層隨機選題時就已經開始作曝光控管，以期降低題庫整體曝光率。

二、ASHC-b 之曝光控制參數

ASHC-b(ability based SHC procedure with b level separated)其的「A」所指的是以能力分佈為基礎的方法，而其中的「b」所指的則是初始階段 b 值分層隨機選取法，在ASHC-b 的曝光控制參數中，也是採用這 729 名受試者的能力值分佈，但和SH-b 不同的是，ASHC-b 所使用的曝光控制參數必須分層模擬，因此必須先定出能力值區間，本研究將整個能力值分佈分為12 個區間(陳昇座， 2007)，如表 3-1-1 所示。每個區間依其能力值分佈分別模擬出 4000 個受試者的能力值，另外，為了有效提昇題庫使用率，在ASHC-b 當中所使用的最大預期試題曝光參數必需依各區間的人數分佈作調整，本研究所使用

(26)

的各區間最大預期試題曝光參數如圖3-1-1 所示，各區間依此進行 SH 的曝光控制參數迭代作業，取得每個區間所有試題的曝光控制參數(如附錄 C 所示)。

(27)

表 3-1-1 各區間模擬樣本分佈表區間起始終點能力點間距 4000 人/區間區間個人起點區間個人終點 1 -3.73 -3.44 -3.73 0.29 0.0000725 -3.73 -3.4400725 2 -3.44 -2.84 -3.14 0.6 0.00015 -3.44 -2.84015 3 -2.84 -2.24 -2.54 0.6 0.00015 -2.84 -2.24015 4 -2.24 -1.64 -1.94 0.6 0.00015 -2.24 -1.64015 5 -1.64 -1.04 -1.34 0.6 0.00015 -1.64 -1.04015 6 -1.04 -0.44 -0.74 0.6 0.00015 -1.04 -0.44015 7 -0.44 0.16 -0.14 0.6 0.00015 -0.44 0.15985 8 0.16 0.76 0.46 0.6 0.00015 0.16 0.75985 9 0.76 1.36 1.06 0.6 0.00015 0.76 1.35985 10 1.36 1.96 1.66 0.6 0.00015 1.36 1.95985 11 1.96 2.56 2.26 0.6 0.00015 1.96 2.55985 12 2.56 2.85 2.85 0.29 0.0000725 2.56 2.8499275 附註：真實能力值範圍 -3.722134~2.842651 圖 3-1-1 最大預期曝光率(r 值)區間分佈圖

(28)

第二節

施測對象與內容

本研究的施測內容為國小數學領域五年級內容，以能力指標為命題依據的245 個試題的題庫(試題參數表，如附錄 A)，這些題目是由國立臺中教育大學、亞洲大學與階梯數位科技股份有限公司建教合作計畫「以試題結構理論為基礎之國小五、六年級數學領域電腦適性診斷測驗系統與題庫建置」(郭伯臣， 2006)中所選取出來的，在選擇施測對象時，為考慮到學生必須已完整學習五年級數學的內容，故選定的施測對象為國小六年級學生，在本研究當中所選定的施測對象為中部某縣市，學校規模都是18 班的兩所小學，這兩所小學的六年級學生都是三個班，受試者人數分別為92 與 90 個人(如表 3-2-1 所示)。表 3-2-1 施測樣本比較表施測學校曝光率控管模式施測人數學校A SH-b 92 學校B ASHC-b 90

第三節

系統建置

施測的工具則是使用以Java 為基礎的 J2EE 網頁式測驗平臺，此平臺則分別實作SH-b 與改良式 ASHC-b 曝光控管模式，網站伺服器選擇昇陽公司 (Sun Microsystems)所認可的 J2EE 網站伺服器 Tomcat5.5。程式撰寫及網站建置所選擇的整合開發環境(integrated development environment，簡稱 IDE)則是選擇自由軟體Eclipse3.1，並搭配開發 J2EE 專案的 MyEclipse5.1 套裝外掛軟體，以物件導向的設計流程進行專案開發，本研究為有效節省系統製作時程與考慮到日後程式碼的修改、維護，採用了符合MVC(model view controller) 架構的JSF(java server faces)規範，另外為有效管理程式碼與資料庫之間的連結，本系統亦採用Hibernate 函式庫，作為系統與資料庫之間的連結介面。

(29)

本研究採用網頁式的施測平臺，施測模式是由受試者開啟網頁瀏覽器後，連到指定的網址，這個時候受試者就會看到系統平臺歡迎畫面，如圖3-3-1 所示，當受試者閱讀完相關測驗規定後，按下「前往測驗」超連結，就會將受試者畫面導引到登入畫面，如圖3-3-2 所示，輸入完帳號、密碼後，便進入正式測驗，如圖3-3-3 所示，在進行完所有測驗後，系統會自動進行統計，將受試者的測驗結果呈現在最後的網頁中，如圖3-3-4 所示。另外，系統所使用到的資料庫表單如附錄D 所示。圖 3-3-1 系統歡迎畫面圖 3-3-2 系統登入畫面

(30)

圖 3-3-3 系統施測畫面

圖 3-3-4 施測結束畫面

另外在架設本系統的硬體需求方面，透過本研究實際施測的結果，以一間擁有35 台可以同時連上網路的電腦教室為例，若要使 35 位受測者同時進行施測，伺服器硬體及網路架構之建議如表3-3-1、表 3-3-2 所示：

(31)

表 3-3-1 伺服器最低需求表硬體規格

中央處理器(CPU) AMD Turion 64x2 或其它廠牌同等級以上記憶體 DDR-II 512MB 或更大硬碟容量 20G 以上網路卡 100/1000 MB/s 表 3-3-2 區域網路最低需求表硬體規格網路線 CAT 5E 或以上等級

HUB 100/1000 MB/s 至少含一個 Giga port; 建議選用 48 ports 以上的 switch Hub

第四節施測流程

施測的流程大致分為兩個階段，第一個階段為初始階段，在這個階段當中，是採用b 值分層隨機選題法，再加上 SH 曝光控管模式，取得前三個施測的題目並作答，接著依這三道題目的作答組型來決定初始能力值；第二個階段為正式估計能力值階段，在這個階段當中，是採用最大訊息法選題，再加上曝光控管模式，分別為SH 與 ASHC(陳昇座， 2007)，依受試者作答組型與作答題目的三參數進行暫時能力估計，直到符合迭代終止條件，在本研究當中的終止條件為作答題目超過30 題或能力估計誤差小於 0.01。最後，得到受試者最終的估計能力值。將所有受試者的作答記錄進行統計，取得每個試題的真實曝光率進行比較。另外，為驗證本系統對於試題曝光率控管的正確性，本研究除了對真實樣本作實際施測外，也將完整作答245 題的事先模擬測驗的 729 個樣本隨機抽取100 位、200 位，依其作答組型輸入本系統，統計結果與實際施測結果比較。除此之外，也將這729 個樣本，輸入模擬研究的 Matlab 程式當中進行

(32)

比對，模擬研究的部分，也分別使用SH-b 與 ASHC-b，並採用相同的曝光控制參數表，施測的樣本部分，則是採用在取得曝光控制參數時，進行事先模擬測驗的729 個真實能力值樣本作為施測樣本，最後取得施測結果進行比較。

一、初始階段

在初始階段當中，施測的流程如圖3-4-1 所示，一開始系統會將題庫中所有試題依試題難度(b 值)分為三層，並分別於三層中隨機選取一題，共三題作為初始階段施測的題目，當受試者將這三道試題作答完畢之後，會有四種作答組合，分別是答對0 題、答對 1 題、答對 2 題及答對 3 題，如圖 3-4-2 所示，而此時系統會自動計算作答結果給予相對應的初始能力值。將-3.0 到 3.0 的能力值區間切割成五個段落，將答對0 題與第對 3 題的初始能力分別給予-1.8 和1.8 的初始能力值，而不是給予-3.0 和 3.0，是為了避免初始能力值太靠近邊界值(-3.0 或 3.0)，會導致估計能力值時無法收歛，因此，在研究設計上給予較合理的初始能力值(-1.8 或 1.8)。

(33)

圖 3-4-1 初始階段施測流程圖圖 3-4-2 初始能力估計圖

二、正式估計能力值階段

在經過初始階段取得初始能力值後，進入正式估計能力階段時會依初始階段所取得的初始能力值代入最大訊息法公式，取得最大訊息量的試題作為接下來要施測的題目，取得試題之後則進行曝光控管模式演算，SH-b 與 ASHC-b 會有所不同。SH-b 的曝光控管模式，在此階段與 SH 完全相同，但 0 1 2 3 -3.0 -1.8 -1.2 1.2 1.8 3.0 答對題數給予初始能力值 b 值分層選題曝光率控制終止條件不成立成立 i<3 作答反應初始能力估計初始能力值

(34)

是ASHC-b 會依目前的暫時能力值，對應到該區段的曝光控制參數，並產生 一個隨機值 x 介於 0~1 之間，若 x 大於曝光控制參數則跳過該題不施測，若 系統決定跳過此題不施測，則會在題庫中將此試題刪除，並且再從題庫當中取得最大訊息量的試題，再次進入曝光控管模式演算，依此迭代，直到系統決定施測選到的試題為此(如圖 3-4-3 所示)。在系統決定施測該題時，系統就會將該題以網頁型式呈現在受試者面前，經由網頁式的操作取得受試者的作答反應，並依至此為止施測的所有題目三參與作答組型代入能力估計公式，在本研究當中所使用的方法是最大概似估計法，取得新的暫時估計能力值，並且依此能力值再次進入最大訊息法選題的步驟，依此方法迭代，直到估計能力值達收歛(相鄰兩次估計能力差的絕對值小於0.01)或測驗題數大於 30 題為止。

(35)

圖 3-4-3 電腦適性測驗施測流程圖最大訊息法選題終止條件成立作答反應能力估計終止條件能力估計結果與曝光率評估不成立成立曝光率控制不成立初始能力值

(36)

第四章研究結果與分析

在本章中分別就實際施測、模擬施測與模擬研究所獲得的數據進行分析與探討，並就實際施測經驗對系統效能進行分析。

第一節曝光率結果分析

經過實際施測、模擬施測與模擬研究後所得到的數據顯示(如表 4-1-1 所示)，在「方法」欄的部分，(s)的部份為使用 729 個樣本隨機抽出 100 個以及 200 個樣本，並依其作答組型輸入本系統的統計結果，而(s)*的部份，則是將 729 個樣本使用 Matlab 進行模擬研究所得到的結果。在表中「施測人數」所指的是實際參與該項方法的施測人數，「曝光率平均數」所指的是被使用到試題的曝光率平均數，「曝光率標準差」指的則是被使用到試題的曝光率標準差，「最大曝光率」所指的是被使用試題當中的曝光率最大值，「未使用題數」所指的是該方法在測驗完後，題庫當中未使用到的題目數量，而「高曝光率題數」所指的則是曝光率高於0.2 的試題題數。在SH-b 的部分，實際施測的人數為 92 人；SH-b(s)則是由 729 個樣本分別抽出100 及 200 個樣本，依其作答組型輸入本系統進行模擬作答；SH-b(s)* 則是將729 個樣本，使用 Matlab 程式進行模擬研究所得到的結果。在曝光率平均數的部分，92 人實際作答的平均數雖然比模擬研究的平均數低，但由 100 人以及200 人的模擬作答的統計結果可以看得出來，有逐漸增加的趨勢，曝光率標準差與最大曝光率也有相同的情形。至於未使用題數部分，本系統也隨著施測人數增加，而逐漸降至和模擬研究相同的結果，將題庫中所有試題均用完。不過，在曝光率大於0.2 的題數部分，本系統雖有隨著施測人數增加而上升的趨勢，但卻優於模擬研究的結果。

(37)

輸入本系統的部分則分別為100 人以及 200 人，使用 Matlab 模擬研究程式的人數則與SH-b 的 729 人相同。在曝光率平均數的部分，有隨著施測人數增加而逐漸升高與模擬研究結果相接近的趨勢，曝光率標準差與最大曝光率的部分也都有向模擬研究結果逼近的趨勢，在未使用題數的部分，雖未達到0 題，但是也隨著施測人數的提高而逐漸降低，至於高曝光率題數的部分，表現也向模擬研究靠近。表 4-1-1 曝光率統計結果比較表方法施測人數曝光率平均數曝光率標準差最大曝光率未使用題數高曝光率題數 SH-b 92 0.0566 0.0451 0.5326 4 2 SH-b(s) 100 0.0594 0.0486 0.4787 3 3 SH-b(s) 200 0.0598 0.0598 0.4762 0 3 SH-b(s)* 729 0.0816 0.0828 0.2961 0 34 ASHC-b 90 0.0670 0.0762 0.4889 29 14 ASHC-b(s) 100 0.0660 0.0762 0.4900 29 16 ASHC-b(s) 200 0.0664 0.0764 0.5309 13 18 ASHC-b(s)* 729 0.0816 0.0805 0.3270 0 29 附註：(s)為模擬樣本施測結果；(s)*為 Matlab 程式模擬研究演算結果。在模擬研究的部分，ASHC-b 對於曝光率控制的整體成效並沒有明顯優於 SH-b，只有在曝光率標準差以及高曝光率的題數略低於 SH-b，而本系統實際施測的部分亦與模擬研究相近，故推測本系統已成功實作這兩種曝光控管模式，且針對比較的結果，並無法明顯推論何種曝光率控管模式較佳，此部分可能需要更精確的條件控制，才能比較出在何種狀況下何種控管模式是較佳的選擇。

(38)

第二節系統效能

本系統在所施測的硬體環境，如第三章第三節所述，在單人上線施測的狀況下，均能穩定運作(如圖 4-2-1 所示)，唯在多人同時上線時，有些系統調校的問題必須設定正確，才能在多人同時使用的狀況下運作無誤。資料庫的部分，啟動時設定的最大連線數需設定在100 人至 300 人，語系的部份必需選擇big5 的編碼系統，才能正確使用中文字形。經實測結果顯示，本系統在35 人同時上線施測的狀況下，均能運作無誤，若能在效能更高的設備以及網路頻寬更大的環境下，同時施測的人數可望再增加。圖 4-2-1 系統效能監控畫面

(39)

第五章結論與建議

本研究所建置的系統在曝光率的表現上符合模擬研究的曝光率標準，在未來的使用上則端賴實際使用情況進行調整，其結論與建議條列如下：

一、建議

1. 如果在已知施測群體的能力值分佈時，建議使用 SH-b 曝光控管模式，對整體曝光率的控管會有較佳的表現。 2. 如果要施測的群體能力值分佈未知，則建議使用 ASHC-b 對於曝光率的控管會較合理。 3. 本系統於初步測試中，三十五人左右的測驗狀況均能獲得穩定運作的結果，但若要進行百人以上的大型測驗，則建議將系統移植到Unix 系統之作業系統與機架式主機，測驗進行的同時必須監控網路狀況以確保測驗順利進行。

二、結論

1. 由本系統的施測結果來看，SH-b 與 ASHC-b 的曝光率統計結果並無明顯差異，因此，必須做更精確的條件控管，或施測更多的人數才比較出在何種情況下，何種控管模式才是較佳的選擇。 2. 本系統所採用的是 Java2 物件導向模式的程式設計架構，本研究當中所研發的類別以及函式庫均可以重複使用，對於未來研究不同曝光率控管模式時，只要使用新的曝光控管模式演算法替換，就可以在不更動原有程式架構的情況下，從事新的曝光率研究，這樣的系統架構有助於未來研究不同曝光率控管模式在實際施測的狀況下的成效與比較。

(40)

參考文獻

一、中文部份

王寶墉（1995），現代測驗理論，臺北市心理出版社。朱怡君（2005），a-分層電腦適性測驗之曝光率控制，碩士論文，嘉義縣國立中正大學心理研究所，未出版。余民寧(1997a)。試題反應理論的介紹─能力與試題參數的估計。研習資訊， 9(3)，6-12。余民寧(1997b)。試題反應理論的介紹─訊息函數。研習資訊，9(6)，5-9。余民寧(1997c)。試題反應理論的介紹─電腦化適性測驗。研習資訊，10(5)， 5-9。李茂能(2000)。中文電腦化適性測驗系統之應用與評鑑。文景書局。何政翰(2004)，國小數學領域電腦適性化測驗系統之建置，碩士論文，國立臺中教育大學教育測驗統計研究所，未出版。周文欽、歐滄和、許擇基、盧欽銘、金樹人、范德鑫(2003)，心理與教育測驗，臺北市心理出版社。陳俊宏(2004)，電腦適性測驗之模擬研究，碩士論文，國立臺中教育大學教育測驗統計研究所，未出版。陳昇座(2007)，以能力分佈為基礎之 SHC 曝光率控制法，碩士論文，國立臺中教育大學教育測驗統計研究所，未出版。陳仁欽(2004)，多分題之多向度電腦適性測驗，碩士論文，國立中正大學心理學研究所。郭冠廷(2005)，電腦適性化測驗雛型系統之研究，碩士論文，中興大學資訊科學研究所，未出版。鄧景麟(2005)，以三年級數學科能力指標為基礎的電腦適性測驗評量系統，

(41)

碩士論文，健康暨管理學院資訊工程學系碩士在職專班，未出版。錢永財、劉家惠、郭伯臣(2005)，初始階段試題 b 值分層選題對曝光率之影響，第十屆人工智慧研討會論文，未出版。錢永財(2006)，以 a-鄰近法為選題策略之電腦化適性測驗模擬研究，碩士論文，國立臺中教育大學教育測驗統計研究所，未出版。

二、英文部份

Baker, F. B., & Kim, S.-H.(2004). Item Response Theory : Parameter Estimation

Techniques. Basel, N. Y. : Marcel Dekker, Inc.

Birnbaum, A. (1968). Some latent trait models and their use in inferring an

examinee’s ability. In F. M. Lord & M. R. Novick, Statistical theories of

mental test scores (chapters 17-20). Reading, MA: Addison-Wesley.

Chang, H. H. & Ying, Z. (1996). A global information approach to computerized adaptive testing. Applied Psychological Measurement, 20, 3, 231-229.

Chang, H.-H., & Ying, Z. (1999). α-Stratified multistage computerized adaptive testing. Applied Psychological Measurement, 23, 211-222.

Chang, S.-W., & Ansley, T. N. (2003). A comparative study of item exposure control methods in computerized adaptive testing. Journal of Educational

Measurement, 40, 71-103.

Chang, S.-W., Ansley, T. N., & Lin, S. H. (2000). Performance of item exposure

control methods in computerized adaptive testing: Further explorations.

Paper presented at the Annual Meeting of the American Educational Research Association, New Orleans, LA.

Chang, S.-W., Ansley, T. N., & Twu, B.-Y. (2002). Performance of item exposure control methods in computerized adaptive testing: Further Explorations.

Psychological Testing, 49(2), 235-263.

Chang, S. W., & Twu, B.-Y. (2001). Effects of changes in the Examinees’ ability

(42)

Annual Meeting of the American Educational Research Association, Seattle, WA.

Davey, T., & Parshall, C. G.(1995,April). New algorithms for item selection and

exposure control with computerized adaptive testing. Paper presented at the

annual meeting of American Educational Research Association, San Francisco.

Embretson, S. E., & Reise, S. P. (2000). Item Response Theory for Psychologists. Mahwah, N. J. : Lawrence Erlbaum.

Hambleton R. K., & Swaminathan H., & Rogers H. J.(1991) Fundamentals of Item

Response Theory : SAGE.

Hambleton, R. K., & Swaminathan, H. (1985). Item response theory: Principles

and applications. Boston: Kluwer-Nijhoff Publishing.

Hambleton, R. K., Zaal, J. N., & Pieters, J. P. M. (1991). Computerized adaptive

testing: Theory, applications, and standards.

In R. K. Hambleton & J. N. Zaal (Eds.), Advances in educational and

psychological testing: Theory and applications. Boston: Kluwer Academic

Publishers.

In W. J. van der Linden & C. A. W. Glas (Eds.), Computerized adaptive testing:

Theory and practice (pp. 163-182). London: Kluwer Academic Publishers.

Harrison, D. A. (1986). Robustness of IRT parameter estimation to violations of the unidimensionality assumption. Journal of Educational Statistics, 11, 91-115.

Hattie, J. (1981). Decision criteria for determining unidimensionality. Unpublished doctoral dissertation, University of Toronto, Canada.

Hetter, R. D., & Sympson, J. B. (1997). Item exposure control in CAT-ASVAB. In W. A.

Leung, C. K ., Chang , H. H., & Hau, K. T. (2000). Content Balancing in Stratified

Comuterized Adaptive Testing Designs. Paper for presented at the AERA

(43)

Leung, C. K ., Chang , H. H., & Hau, K. T. (2002). Comparing Three Itme Selection Approaches for Computerized Adaptive Testing with Content Balancing Requirement. The Journal of Technology, Learning, and

Assessment, volumn 2,Number, ,December 2003.

Lord, F. M. (1977). Practical applications of item characteristic curve theory.

Jaurnal of Educational Measurement, 14, 117-138.

Lord, F. M. (1980). Applications of item response theory to practical testing

problems. Hillsdale, NJ: Lawrence Eribaum Associates.

Stocking, M. L. (1994). Three practical issues for modern adaptive testing item

pools (ETS Research Report 94-5). Princeton, NJ: Educational Testing

Service.

Stocking, M. L., & Lewis, C. (1995). A new method for controlling item exposure

in computerized adaptive testing (ETS Research Report RR-95-25).

Princeton, NJ:Educational Testing Service.

Stocking, M. L., & Lewis, C. (1998). Controlling item exposure conditional on ability in computerized adaptive testing. Journal of Educational and

Behavioral Statistics, 23,57-75.

Stocking, M. L., & Lewis, C. (2000). Methods of controlling the exposure of items

in CAT.

Stocking, M. L., & Swanson, L. (1993). A method for severely constrained item selection in adaptive testing. Applied Psychological Measurement, 17 (3), 277-292.

Su, Ya-Hui (2007). Simultaneous Control over Item Exposure and Test Overlap in

Computerized Adaptive Testing for Testlet-based Items and Multidimensional Items, Department of Psychology, National Chung Cheng University.

Wainer, H. (2000). Computerized Adaptive Testing: A Primer. (2nd Ed.) New Jersey: Lawrence Erlbaum Associates, Inc.

Weiss, D. J. (1974). Strategies of adaptive ability measurement (Research Report 74-5). University of Minnesota, Department of Psychology, Psychometric

(44)

Methods Program.

(45)

附錄

A 試題三參數

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH001 0.6598 -2.6037 0.2249 MATH002 1.2989 -0.9858 0.2083 MATH003 1.4389 -0.0517 0.2108 MATH004 1.1761 -0.3154 0.2069 MATH005 1.3919 0.1376 0.1076 MATH006 1.8996 0.0172 0.2608 MATH007 1.5208 -2.1496 0.1654 MATH008 1.7526 -0.8597 0.2861 MATH009 1.5363 -0.9554 0.2408 MATH010 2.2814 -0.3294 0.2782 MATH011 2.1974 0.0476 0.2673 MATH012 1.4531 0.3144 0.1643 MATH013 1.3920 -0.5342 0.1973 MATH014 1.6329 0.5342 0.1028 MATH015 1.8085 -0.7651 0.2055 MATH016 1.5876 -1.1629 0.2167 MATH017 1.2397 -1.7524 0.1905 MATH018 1.2897 -1.6349 0.1969 MATH019 2.0020 -0.8662 0.3226 MATH020 1.4474 -1.1712 0.2045 MATH021 2.3050 -0.9058 0.2415 MATH022 2.0878 -0.7018 0.1685 MATH023 1.6835 -0.8952 0.2479 MATH024 1.5895 -0.9494 0.1598 MATH025 1.5542 -0.8684 0.1980 MATH026 1.8753 -0.4096 0.1833 MATH027 2.6310 0.1514 0.1898 MATH028 2.2066 -0.3999 0.2734 MATH029 2.1675 -0.3864 0.2862 MATH030 1.7039 -0.6293 0.2876 MATH031 1.1960 -1.5838 0.2420

(46)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH032 1.3181 -1.4419 0.2345 MATH033 1.3246 -1.4036 0.2721 MATH034 1.4538 -0.5677 0.1209 MATH035 1.2363 1.0051 0.2559 MATH036 0.9271 -2.3862 0.2187 MATH037 2.0356 -2.2307 0.1764 MATH038 1.2657 -1.5787 0.1780 MATH039 1.7685 -1.4406 0.1881 MATH040 1.8564 -0.4198 0.1580 MATH041 1.3122 -1.5814 0.1825 MATH042 1.9860 -1.9692 0.1521 MATH043 1.4001 -1.3071 0.2139 MATH044 1.9359 -1.4912 0.1861 MATH045 1.9192 -0.9342 0.2042 MATH046 2.0492 0.3827 0.2829 MATH047 2.0878 0.1839 0.2999 MATH048 1.4887 -1.3514 0.2530 MATH049 1.3617 -1.0495 0.2294 MATH050 1.7307 -0.7179 0.1721 MATH051 1.5442 -0.6461 0.1142 MATH052 1.8176 -0.6595 0.2259 MATH053 1.8336 -0.5460 0.2195 MATH054 1.6585 -0.4577 0.1945 MATH055 1.6834 -0.6882 0.2009 MATH056 1.7382 -0.8470 0.1826 MATH057 1.3103 0.2539 0.1439 MATH058 1.3476 -1.4844 0.1845 MATH059 1.3079 -2.4547 0.1790 MATH060 1.2370 -0.8944 0.2514 MATH061 1.3860 -1.7261 0.2379 MATH062 1.4820 0.2817 0.2515 MATH063 1.2337 -0.8466 0.1829 MATH064 0.7189 -1.9109 0.2047 MATH065 1.1967 -3.0894 0.1985 MATH066 1.3005 -0.4265 0.1522 MATH067 1.0449 -2.4809 0.1814 MATH068 1.4070 -0.4345 0.2098 MATH069 0.9574 -1.0713 0.2059

(47)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH070 0.7470 0.3804 0.1717 MATH071 1.3237 -1.0273 0.2174 MATH072 1.3305 -0.6709 0.1928 MATH073 1.4764 -1.1257 0.1799 MATH074 1.6650 -0.5787 0.2220 MATH075 1.0214 -1.4188 0.1836 MATH076 1.7939 1.1615 0.1279 MATH077 1.2782 -0.3616 0.2192 MATH078 1.0565 -0.5545 0.1981 MATH079 1.8868 0.1737 0.3805 MATH080 1.6179 -0.0080 0.3399 MATH081 1.8485 1.2439 0.0732 MATH082 1.0117 -0.5362 0.2951 MATH083 0.9461 -2.7444 0.1869 MATH084 0.8277 -1.6617 0.2116 MATH085 0.8083 -0.8454 0.2103 MATH086 1.2715 -1.0762 0.2205 MATH087 0.9774 -1.7915 0.1922 MATH088 1.2523 -1.9148 0.1417 MATH089 1.3645 -0.8234 0.1360 MATH090 1.4203 -1.4434 0.2146 MATH091 1.1685 -1.3669 0.1753 MATH092 1.6364 -1.7841 0.1941 MATH093 1.4577 -1.5589 0.2148 MATH094 1.3621 -1.5498 0.1795 MATH095 1.6995 -1.2237 0.3043 MATH096 1.2465 -1.2899 0.2028 MATH097 1.2201 -1.0787 0.2343 MATH098 1.3881 -1.1396 0.2449 MATH099 1.4330 0.6998 0.2505 MATH100 1.6178 -0.1727 0.2487 MATH101 1.3636 -1.6910 0.1884 MATH102 1.6218 -1.7756 0.1666 MATH103 1.3458 -1.8258 0.2143 MATH104 1.3432 -1.3603 0.2211 MATH105 1.6782 -0.7429 0.2757 MATH106 1.5132 -1.2713 0.1932 MATH107 1.1536 -1.4276 0.2417

(48)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH108 0.8373 -1.4352 0.2341 MATH109 1.6760 -0.4680 0.3843 MATH110 1.6994 -0.4219 0.3334 MATH111 1.5626 -0.4220 0.1643 MATH112 1.2965 -0.2764 0.1658 MATH113 2.4667 -0.1691 0.3305 MATH114 2.3337 0.2718 0.2047 MATH115 1.9445 -0.5471 0.1704 MATH116 1.6035 -0.5615 0.2716 MATH117 1.1496 -1.0472 0.2241 MATH118 1.2623 -1.5545 0.2277 MATH119 1.1189 -2.7156 0.1935 MATH120 0.9297 -0.1706 0.2036 MATH121 2.2693 -0.0122 0.2038 MATH122 1.1748 0.7330 0.1885 MATH123 2.5880 -0.0914 0.2630 MATH124 2.0913 0.2488 0.2786 MATH125 1.3301 0.4504 0.1396 MATH126 0.8537 2.0539 0.1999 MATH127 1.9865 -0.0420 0.2301 MATH128 1.6270 0.8774 0.2494 MATH129 1.8196 1.2085 0.1979 MATH130 1.0598 -2.0421 0.2301 MATH131 1.3611 -2.5515 0.1849 MATH132 1.3833 0.0837 0.2731 MATH133 0.9755 -2.0967 0.2007 MATH134 0.9687 -3.4808 0.2050 MATH135 1.9416 2.0477 0.2729 MATH136 1.4363 1.7808 0.2658 MATH137 0.7623 -0.8944 0.2259 MATH138 1.4190 1.4138 0.2671 MATH139 1.7251 -1.6973 0.1825 MATH140 1.9245 -0.2811 0.2318 MATH141 1.1164 -2.9881 0.2005 MATH142 0.8153 -2.0586 0.2051 MATH143 1.1831 -0.9949 0.2080 MATH144 1.0653 -2.0071 0.2359 MATH145 1.0844 -1.8593 0.1773

(49)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH146 1.2656 -0.6069 0.2049 MATH147 1.2810 -1.5961 0.1389 MATH148 1.1617 -1.5064 0.2032 MATH149 1.7248 -1.2984 0.1507 MATH150 1.3259 -1.5967 0.1811 MATH151 1.4755 -0.7243 0.1710 MATH152 1.7364 -0.5728 0.2482 MATH153 1.6586 -0.9854 0.1512 MATH154 2.0330 -0.9835 0.2509 MATH155 1.9038 -1.1834 0.1766 MATH156 1.8438 -1.2104 0.2554 MATH157 1.9324 -1.2191 0.1300 MATH158 1.8547 -0.9672 0.2193 MATH159 1.9333 -1.2210 0.1282 MATH160 2.0262 -0.9994 0.2017 MATH161 1.5937 -0.8380 0.1815 MATH162 1.6571 -0.7644 0.1845 MATH163 1.4283 -0.5276 0.1572 MATH164 1.4638 -0.2170 0.2033 MATH165 1.7462 -1.6581 0.1561 MATH166 1.5705 -0.8760 0.2273 MATH167 1.3277 -1.0019 0.1589 MATH168 1.2531 -0.9652 0.1588 MATH169 1.5046 -1.0303 0.2145 MATH170 1.5764 -0.9486 0.1485 MATH171 1.5474 -1.0848 0.2619 MATH172 1.6782 -1.1275 0.1937 MATH173 2.2519 -0.5105 0.1774 MATH174 2.1556 -0.5732 0.1862 MATH175 1.1690 -1.6900 0.2051 MATH176 1.0734 -1.2252 0.2276 MATH177 1.1117 -0.9338 0.1590 MATH178 1.3388 -0.5861 0.1859 MATH179 0.8119 0.4445 0.1882 MATH180 1.3906 -0.4093 0.2788 MATH181 1.9835 0.1317 0.3005 MATH182 0.9347 0.6525 0.2210 MATH183 1.5629 0.2056 0.4535

(50)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH184 1.8994 0.2220 0.2891 MATH185 0.7137 -0.9637 0.1837 MATH186 1.7161 0.3977 0.3674 MATH187 2.5912 0.4761 0.2627 MATH188 1.2305 0.2796 0.2334 MATH189 0.9963 -1.0042 0.1707 MATH190 1.5469 0.8062 0.2601 MATH191 1.1373 -0.9026 0.1795 MATH192 0.8546 -1.7028 0.1824 MATH193 1.4220 -0.1884 0.2063 MATH194 1.4655 0.8051 0.2242 MATH195 1.3189 -0.9898 0.2429 MATH196 1.5091 -0.4732 0.1662 MATH197 1.4188 0.7035 0.1570 MATH198 1.5622 -1.0913 0.2058 MATH199 1.3807 -0.8178 0.2374 MATH200 1.3633 -0.7711 0.1697 MATH201 1.4738 -0.3719 0.2139 MATH202 1.9615 -0.4508 0.2593 MATH203 2.1304 -0.0424 0.2334 MATH204 1.7876 -0.7399 0.2152 MATH205 2.0722 -0.8298 0.1685 MATH206 1.5301 -0.2422 0.1519 MATH207 1.9845 0.3446 0.2330 MATH208 1.3902 -0.8618 0.1600 MATH209 1.7002 -1.2097 0.1560 MATH210 1.1480 0.7980 0.1918 MATH211 1.1129 -1.1840 0.2031 MATH212 1.4393 -0.6793 0.2525 MATH213 1.5051 -0.5305 0.3325 MATH214 1.4639 -2.5163 0.1883 MATH215 1.7678 -2.4022 0.2113 MATH216 1.6905 -2.3526 0.1905 MATH217 2.2551 -2.3302 0.1803 MATH218 1.5925 -1.2786 0.1578 MATH219 2.3111 -2.2990 0.1677 MATH220 1.7282 -2.5174 0.1926 MATH221 2.1315 -0.5040 0.2621

(51)

試題編號鑑別度參數(a) 難度參數(b) 猜測度參數(c) MATH222 1.4938 -1.7257 0.1992 MATH223 1.5444 -1.5993 0.2104 MATH224 1.4637 -0.6883 0.1810 MATH225 1.9650 0.0586 0.1711 MATH226 2.3805 -1.7881 0.1612 MATH227 1.8638 -1.2246 0.2485 MATH228 1.4813 -0.3130 0.1689 MATH229 2.3842 -0.2314 0.1265 MATH230 1.6554 -1.4202 0.1693 MATH231 1.8779 -1.4911 0.1934 MATH232 1.8869 -1.0056 0.1434 MATH233 1.3491 0.2221 0.2655 MATH234 1.0418 -1.0609 0.1940 MATH235 1.5150 -1.1049 0.1390 MATH236 2.1994 -0.6951 0.2330 MATH237 1.6716 -1.2560 0.1951 MATH238 1.6731 -1.1998 0.1639 MATH239 1.4988 -0.6148 0.1547 MATH240 1.2573 -0.9050 0.1593 MATH241 1.8141 -0.9554 0.1973 MATH242 1.4487 -1.7121 0.2017 MATH243 1.2879 -1.8311 0.1816 MATH244 1.1157 -1.4191 0.1938 MATH245 1.4939 -1.3959 0.1503

(52)

附錄

B SH-b 所使用的曝光控制參數

試題編號控制參數試題編號控制參數試題編號控制參數試題編號控制參數 1 0.6451 61 1 121 0.7489 181 1 2 1 62 1 122 1 182 1 3 1 63 1 123 0.3000 183 1 4 1 64 0.7054 124 1 184 1 5 1 65 0.3516 125 1 185 1 6 1 66 1 126 0.5926 186 1 7 0.6160 67 0.6266 127 1 187 1 8 1 68 1 128 1 188 1 9 1 69 1 129 1 189 1 10 1 70 1 130 0.6528 190 1 11 1 71 1 131 0.5579 191 1 12 1 72 1 132 1 192 0.9467 13 1 73 1 133 0.6320 193 1 14 1 74 1 134 0.6041 194 1 15 1 75 1 135 0.4463 195 1 16 1 76 1 136 0.8347 196 1 17 1 77 1 137 1 197 1 18 1 78 1 138 1 198 1 19 1 79 1 139 1 199 1 20 1 80 1 140 1 200 1 21 1 81 1 141 0.4744 201 1 22 1 82 1 142 0.6607 202 1 23 1 83 0.6160 143 1 203 1 24 1 84 1 144 0.6708 204 1 25 1 85 1 145 0.7265 205 1 26 1 86 1 146 1 206 1 27 0.4870 87 0.8070 147 1 207 1 28 1 88 0.6470 148 1 208 1 29 1 89 1 149 1 209 1 30 1 90 1 150 1 210 1 31 1 91 1 151 1 211 1 32 1 92 1 152 1 212 1 33 1 93 1 153 1 213 1 34 1 94 1 154 1 214 0.5622

(53)

試題編號控制參數試題編號控制參數試題編號控制參數試題編號控制參數 35 1 95 1 155 1 215 0.6058 36 0.6320 96 1 156 1 216 0.6195 37 0.5879 97 1 157 1 217 0.5636 38 1 98 1 158 1 218 1 39 1 99 1 159 1 219 0.5467 40 1 100 1 160 1 220 0.4643 41 1 101 1 161 1 221 1 42 1 102 1 162 1 222 1 43 1 103 1 163 1 223 1 44 1 104 1 164 1 224 1 45 1 105 1 165 1 225 1 46 1 106 1 166 1 226 1 47 1 107 1 167 1 227 1 48 1 108 1 168 1 228 1 49 1 109 1 169 1 229 0.3884 50 1 110 1 170 1 230 1 51 1 111 1 171 1 231 1 52 1 112 1 172 1 232 1 53 1 113 1 173 1 233 1 54 1 114 1 174 1 234 1 55 1 115 1 175 1 235 1 56 1 116 1 176 1 236 1 57 1 117 1 177 1 237 1 58 1 118 1 178 1 238 1 59 0.5894 119 0.5770 179 1 239 1 60 1 120 1 180 1 240 1 241 1 242 1 243 1 244 1 245 1

(54)

附錄

C ASHC-b 所使用的曝光控制參數

第1 題第 2 題第 3 題第4 題第5 題第6 題第 7 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 1 1 1 1 1 1 1 第7 層 1 1 1 1 1 0.5671 1 第8 層 1 1 0.2022 0.2309 0.2018 0.2015 1 第9 層 1 1 1 1 0.8048 1 1 第10 層 1 1 1 1 1 1 1 第11 層 1 1 1 1 1 1 1 第12 層 1 1 1 1 1 1 1 第8 題第 9 題第 10 題第 11 題第 12 題第 13 題第 14 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 1 1 1 1 1 1 1 第7 層 1 1 0.4431 0.4923 1 1 0.9826 第8 層 1 1 0.2553 0.2020 0.2054 0.2711 0.2055 第9 層 1 1 1 1 0.5680 1 0.5589 第10 層 1 1 1 1 1 1 0.8480 第11 層 1 1 1 1 1 1 1 第12 層 1 1 1 1 1 1 1 第15 題第 16 題第 17 題第 18 題第 19 題第 20 題第 21 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 1 1 1 1 1 1 0.8511 第7 層 1 1 1 1 1 1 1 第8 層 1 1 1 1 1 1 1

(55)

第9 層 1 1 1 1 1 1 1 第10 層 1 1 1 1 1 1 1 第11 層 1 1 1 1 1 1 1 第12 層 1 1 1 1 1 1 1 第22 題第 23 題第 24 題第 25 題第 26 題第 27 題第 28 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 0.8678 1 1 1 1 1 1 第7 層 0.7636 1 1 1 0.5129 0.4086 0.4717 第8 層 1 1 1 1 0.2359 0.2008 0.3028 第9 層 1 1 1 1 1 1 1 第10 層 1 1 1 1 1 1 1 第11 層 1 1 1 1 1 1 1 第12 層 1 1 1 1 1 1 1 第29 題第 30 題第 31 題第 32 題第 33 題第 34 題第 35 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 1 1 1 1 1 1 1 第7 層 0.4818 1 1 1 1 1 1 第8 層 0.2861 1 1 1 1 0.2527 0.3097 第9 層 1 1 1 1 1 1 0.7094 第10 層 1 1 1 1 1 1 0.7956 第11 層 1 1 1 1 1 1 0.9512 第12 層 1 1 1 1 1 1 0.9867 第36 題第 37 題第 38 題第 39 題第 40 題第 41 題第 42 題第1 層 1 1 1 1 1 1 1 第2 層 1 1 1 1 1 1 1 第3 層 1 1 1 1 1 1 1 第4 層 1 1 1 1 1 1 1 第5 層 1 1 1 1 1 1 1 第6 層 1 1 1 1 1 1 1 第7 層 1 1 1 1 0.4916 1 1

AD1lh5Pf具試題曝光率控管之電腦適性測驗系統研發

國立台中教育大學教育測驗統計研究所理學碩士論文

指導教授：郭伯臣 博士

具試題曝光率控管之

電腦適性測驗系統研發

研究生：蔡曜仲 撰

中 華 民 國 九 十 六 年 六 月 致 謝

摘 要

Abstract

目 錄

圖目錄

表目錄

第一章 緒 論

第一節 研究動機

第二節 研究目的

第二章 文獻探討

第一節 試題反應理論

第二節 電腦化適性測驗初始階段選題法

第三節 電腦化適性測驗選題法

第四節 曝光率之相關研究

一、 非線上控管模式

∏

二、 線上控管模式

第五節 能力估計

∑

∑

第六節 電腦化適性測驗系統

第三章 研究方法

第一節 曝光控制參數