• 沒有找到結果。

第二章 文獻探討

第四節 測驗等化設計

測驗等化設計的方法眾多,如單組設計(single-group design)、等群組設計

(equivalent-grwoup design)、定錨不等組設計(NEAT)、平衡不完全區塊(BIB)

等。本研究中以 BIB 與 NEAT 等化設計進行比較,故以下簡略說明 BIB 與 NEAT 測驗等化設計,並說明大型測驗之題本設計。

壹、定錨不等組設計

NEAT 設計包含兩個獨立的單組設計,其設計方式為在兩組受試者的母群體 中,隨機抽取 P1 與 P2 兩組受試者樣本。兩組受試者於不同的施測時間,P1 組 受試者接受 A 測驗,P2 組受試者接受 B 測驗。P1 和 P2 受試樣本另外須接受同 一份共同測驗 C,即為定錨試題,為避免順序因素的影響,通常定錨試題在兩組 樣本的測驗順序一樣,而測驗內容和難度必須與 A、B 測驗相似,其測驗長度相 當於一個分測驗(von Davier, Holland, & Thayer, 2004;Dorans & Holland, 2000;

Tianyou, 2005)。NEAT 設計如表 2-1(Kolen & Brennan,1995;von Davier, Holland,

& Thayer, 2004)。

表 2-1 NEAT 設計

受試者群 A 測驗 B 測驗 定錨測驗 C

P1 V V P2 V V

註:“V”為受試者必須受測之測驗

在 NEAT 設計中,每個受試樣本皆須施測定錨試題 C 測驗,因此,定錨試題 之試題參數好壞將會影響等化連結效果。若定錨試題挑選恰當,則可以避免練習

(practice)、疲勞(fatigue)、學習(learning)、順序因素(order effects)及需要 大樣本的問題(Klein & Jarjoura, 1985)。使用 NEAT 設計測驗等化只需要假設受 試群體是隨機抽取,不必假設兩受試群體有相同的能力值。NEAT 設計的定錨試

題內容要盡可能相似且試題難度要相同,因為定錨試題是用來調整兩個不同能力 之群體所造成的等化風險(Petersen, Kolen & Hoover,1993)。

貳、平衡不完全區塊設計

平衡不完全區塊設計(balanced incomplete block design, BIB)是將試題分成 若干試題區塊(block),區塊間與區塊內的試題皆不重複,受試者只需接受若干 試題區塊的試題,且不同受試者可能接受部分相同、完全相同、或完全不同的試 題區塊。最後,將所有受試者的作答反應資料堆疊進行等化分析,以達到能力估 計的目的,BIB 設計如表 2-2(曾玉琳、王暄博、郭伯臣、許天維,2006)。表 2-2 是以 7 個題本之 BIB 設計為範例,在此設計範例中,有 7 個題本(S1~S7);7 個 試題區塊(M1~M7);每個題本包含 3 個試題區塊(k1~k3)。BIB 設計中試題區 塊序號的組合不重複,如:S1 題本是由試題區塊 M1、M2、M4 組合而成,則設 計中其他題本(S2~S7)就不會在有相同試題區塊(M1、M2、M4)的組合。

表 2-2 BIB 設計

題本序號 區塊 (k1) 區塊 (k2) 區塊 (k3)

S1 M1 M2 M4

S2 M2 M3 M5

S3 M3 M4 M6

S4 M4 M5 M7

S5 M5 M6 M1

S6 M6 M7 M2

S7 M7 M1 M3

BIB 設計的優點為試題區塊與題本的配置方式採用螺旋(spiral)式排列方 式,此種排列方式可使每一個試題區塊的施測次數相同。此設計在無作答時間

(response time)的限制情形下,BIB 設計必須符合下列限制,求出符合的最佳 解(van der Linden, Veldkamp & Carlson, 2004;Nemhauser & Wolsey, 1999):

1. 每一個題本配置的試題區塊數目,如公式(2-16);

3. 成對試題區塊在所有題本中出現的次數,如公式(2-18); 4. 成對試題區塊與組型的一致性,如公式(2-19)。

= t =

y wyx k

1

, x=1,...,b (2-16)

= b

x wyx r

1

, y =1,...,t (2-17)

= b

x zygx 1

λ, y< g =1,...,t (2-18)

ygx gx

yx w z

w + ≥2 , y< g =1,...,t, x=1,...,b (2-19)

其中:t指試題區塊數;

x 指題本序號,x=1,...,b

k指每個題本配置的試題區塊數,即區塊數目(number of blocks);

r指每一試題區塊在題本中出現的次數;

y 指題庫中個別試題區塊代號,y=1,...,t

g 指題庫中成對區塊中第二個試題區塊代號,g =1,...,tλ 指成對試題區塊在題本中出現的次數;

w 指試題區塊與題本的配置組型,其中yx wyx

{ }

0,1 , y=1,...,t, x=1,...,b, 如題本 S1 出現 M1、M2、M4 三個試題區塊,則w11,w21,w41

{}

1 ; z 指成對試題區塊與題本的配置組型,ygx zygx

{ }

0,1 ;y< g=1,...,t

b x=1,..., 。

另外,BIB 設計必須符合三項基本限制,但實際設計情況,必須考慮試題內 容、形式及作答時間(王暄博,2006):

1. 每一個題本內的試題區塊數要相同;

2. 試題區塊作結合以求出最小題本數;

3. 每一個試題區塊在所有題本中出現的次數要相同。

參、大型測驗之題本設計

國內外的大型測驗,因題庫涵蓋不同認知程度及不同難度之試題,試題數量 無法由單一受試者於短時間內完成,故多採用不同的等化設計進行,以下分別介 紹 NAEP、TIMSS、PISA 與 TASA 四個大型測驗之等化設計。

一、NAEP

以 1998 年 4 年級公民為例,使用之題本設計為 BIB 設計,設計中共包含了 6 個試題區塊(M1~M6)組合成 18 個題本(S1~S18),為了使試題區塊在題本前 後出現的次數一致,故將題本 16 到 18 與題本 13 到 15 的兩個試題區塊作交換後 組成(Andrew & Terry, 2001),以表 2-3 作說明。

表 2-3 NAEP 1998 年 4 年級公民題本區塊設計表

題本 區塊 I 區塊 II 題本 區塊 I 區塊 II

S1 M1 M2 S10 M4 M6 S2 M2 M3 S11 M5 M1 S3 M3 M4 S12 M6 M2 S4 M4 M5 S13 M1 M4 S5 M5 M6 S14 M2 M5 S6 M6 M1 S15 M3 M6 S7 M1 M3 S16 M4 M1 S8 M2 M4 S17 M5 M2 S9 M3 M5 S18 M6 M3

資料來源︰NAEP1998 Technical Report(p.408)

二、TIMSS

以 2007 年之題本設計為例,每個題本由四個試題區塊組合而成,包含數學

(M01~M14)與科學(Q01~Q14)各兩個試題區塊,為了連結不同題本,每個試 題區塊在題本中出現 2 次(Graham, Christine, Alka, & Ebru, 2008)。表 2-4 為 TIMSS2007 年之題本區塊設計。

表 2-4 TIMSS2007 年題本區塊設計表

題本 區塊(Part I) 區塊(Part II) 題本 區塊(Part I) 區塊(Part II)

S1 M01 M02 Q01 Q02 S8 Q08 Q09 M08 M09 S2 Q02 Q03 M02 M03 S9 M09 M10 Q09 Q10 S3 M03 M04 Q03 Q04 S10 Q10 Q11 M10 M11 S4 Q04 Q05 M04 M05 S11 M11 M12 Q11 Q12 S5 M05 M06 Q05 Q06 S12 Q12 Q13 M12 M13 S6 Q06 Q07 M06 M07 S13 M13 M14 Q13 Q14 S7 M07 M08 Q07 Q08 S14 Q14 Q01 M14 M01

資料來源︰TIMSS2007 Technical Report(p.34)

三、PISA

以 PISA2006 年之題本設計為例,題本設計為 BIB 設計,共包含 13 個題本

(S1~S13),每個題本包含 4 個試題區塊(區塊 I~區塊 IV),每個試題區塊在題 本中出現 4 次(r=4),以及成對試題區塊在各題本中出現 1 次(λ=1)(OECD, 2009),表 2-5 為 PISA2006 年之題本區塊設計,其中試題區塊 M1~M4 代表數學 科之試題區塊;Q1~Q7 代表科學之試題區塊;R1~R2 代表閱讀之試題區塊,每個 題本內可能包含數學、科學或閱讀三種不同科目之試題區塊。

表 2-5 PISA2006 年題本區塊設計表

題本 區塊 I 區塊 II 區塊 III 區塊 IV 題本 區塊 I 區塊 II 區塊 III 區塊 IV S1 Q1 Q2 Q4 Q7 S8 M1 M2 Q2 Q6 S2 Q2 Q3 M3 R1 S9 M2 Q1 Q3 R2 S3 Q3 Q4 M4 M1 S10 M3 M4 Q6 Q1

S4 Q4 M3 Q5 M2 S11 M4 Q5 R2 Q2

S5 Q5 Q6 Q7 Q3 S12 R1 M1 Q1 Q5 S6 Q6 R2 R1 Q4 S13 R2 Q7 M1 M3 S7 Q7 R1 M2 M4

資料來源︰PISA2006 Technical Report(p.29)

四、TASA

TASA 在題本設計方面,絕大部分之年段與科目(英語文除外)皆使用 BIB 設計(如表 2-6),只有在 2005 年與 2006 年之數學科採用 PBIB 設計;2007 年施 測科目除了英語文外,其餘科目皆使用 NEAT 設計(如表 2-7)(國家教育研究院 籌備處,2009)。

由於英語文包含聽讀與寫說,故採取每個題本由相同試題區塊數組成之題本 排列設計,為了連結各題本,試題區塊在不同題本出現不只一次,以 2007 年為 例,題本設計如表 2-8(國家教育研究院籌備處,2009)。

表 2-6 為 TASA2006 年數學科 4 年級之題本區塊設計,此設計為 BIB 設計,

每個題本由 3 個試題區塊(區塊 I~區塊 III)組合而成,共包含 13 個試題區塊

(M1~M13)組合成 26 個題本(S1~S13)(國家教育研究院籌備處,2009)。表 2-7 為 TASA2007 年國文科之題本區塊設計,此設計為 NEAT 設計,10 個題本

(S1~S10)均分成兩個試題區塊(區塊 I~區塊 II),區塊 I 為 10 個題本共有的共 同試題區塊(M),區塊 II 為 10 個題本特有的獨立試題區塊(M1~M10)(國家教 育研究院籌備處,2009)。

表 2-6 TASA2006 年數學科 4 年級題本區塊設計表

題本序號 區塊 I 區塊 II 區塊 III 題本序號 區塊 I 區塊 II 區塊 III

S1 M1 M2 M5 S8 M8 M9 M12

S2 M2 M3 M6 S9 M9 M10 M13

S3 M3 M4 M7 S10 M10 M11 M1

S4 M4 M5 M8 S11 M11 M12 M2

S5 M5 M6 M9 S12 M12 M13 M3

S6 M6 M7 M10 S13 M13 M1 M4

S7 M7 M8 M11

資料來源︰TASA2006 資料使用手冊(頁 18,未出版)

表 2-7 TASA2007 年國文科題本區塊設計表

題本序號 區塊 I 區塊 II 題本序號 區塊 I 區塊 II

S1 M M1 S6 M M6 S2 M M2 S7 M M7 S3 M M3 S8 M M8 S4 M M4 S9 M M9 S5 M M5 S10 M M10

資料來源︰TASA2007 資料使用手冊(頁 9,未出版)

表 2-8 TASA2007 英語文科之題本設計

聽力測驗 閱讀測驗

題本 區塊 I 區塊 II 區塊 I 區塊 II

S1 M1 M2 M4 M5

S2 M1 M2 M4 M6

S3 M1 M2 M4 M7

S4 M1 M3 M4 M5

S5 M1 M3 M4 M6

S6 M1 M3 M4 M7

資料來源︰TASA2007 資料使用手冊(頁 13,未出版)

相關文件