國立臺灣師範大學教育心理學系 教育心理學報,民 76 , 20 期, 107一130 頁
受試特徵曲線在能力測量之應用研究
花結鑫
本研究旨在探討試題還輯分析與安試特徵曲線 (person
characteristic
curve)在能力測量上可能之應用情形。受試者取自國中一、三年級男、女生前、後段班回三九人,以實 施普通分類測驗語文理解與方塊計算兩類試題的結果作為分析與研究的資料。具體研究項目 包括:(1)利用試題邏輯分析方法,找出造成方塊計算試眉之難度差異的因索。的探究妥試特 徵曲線在鑑定試題測量:單一能力上運用之適當性 d3)男、女限制軍體 (restricted
group)
是否影響到安說特徵曲線之運用。(釗前後段限制軍績是否影響到受試特徵曲線之運用。 (5)試 題鑑別力指數是否影響妥試特徵曲線之功能﹒ 研究結果發現: (1)試題圓形之是否清楚,和芳塊之韓列芳式影響芳塊計算試題的心理計 量的難度。 (2)妥試特徵曲線具有鑑定測驗是杏測量單一能力之功能。 (3)限制草種不影響妥試 特徵曲線立運用。凶刪除鑑別度 .30 以下之試題後,所第j優良試題仍能維持該能力測驗之特 徵。 筆者的建議: (1) 重視使用各種方法搜出造成試題困難差異之因素,以作為能力界定之 基援。 (2)使用受試特徵曲線以鑑定試題是否測量單一能力,以保障測驗之構念效度 (construct validity)
0 (3)測驗緝製者應進一步利用受試特徵曲線之功能以改進測驗之實施。能力 (abHi ty) 就是個人的學習潛能與經由敘育~訓練而撞得的知識,通常包括性向
(apti-tude) 和成就 (achievement) 二者。所謂性向是個人進一步訓練灑益之潛能,而成就係指個人已撞 得能力的程度 (Aiken , 1985) 。用來測量個人能力的測驗就是能力測驗,它包括性向測驗和成就測 驗,其中性向測驗主要是用於預測將來的成就;成說測驗則在評量現有之知識與了解。就測驗題目本 身,責難以判斷它到底是屬於性向測驗或成說測驗;以區分性向測驗組合中之機械性向測驗槓桿的擅 自為例,吾人實難以判定它是測量使向還是成就的。因此,從受試作業結果觀察界定能力,性向與成 就的差別實無意畫畫 (Carroll , 1985) 。 欲對個人的能力進行測量,應從「能力」的界說開始探究。依據美國傳統字典 (American
Heritage Dictionary)
,能力是「能做某事的才能;包括生理的、心理的、財務的或法律的作業 能力 J(the quality of being able to do something: physica
l,
mental
,
financia
l,
or legal power to
perform) 。這本字典先是把能力界定成「能做某事 J '然後又把「能J(able) 界說成有足繭的能力 (having
sufficient
ability) 。這種麓圈子的定義方式對能力一詞的界定並無直接的幫助。在日常生活中,對能力的解釋大多採事後方式 (posterìor
manner)
,
間先知道一個人在某件事的作業情形,萬?以概括性的界說。倒如某人鋪琴彈得好,就說這個人有音 樂芳面的能力。這種事後方式的說法人人習以為常,言者、聽者皆能順利溝通。 Carroll 09.部)認 為從心理與測量的觀點言,美國傳統字典對能力雖未于以明確的界定,但界說中所提及的「某事」二 字均提供心理測驗緝製者對能力測量研究之重要訊息。在心理與教育的情攬冀,定羲中的「某事」不 必一定是某類的工作 (task) 因為有運動讀音樂的能力的人未必運動~音樂上各種工作都能做得很 好。當心理學家與教育學者提到心理能力 (mentalability)
,也不應指各種心理工作上的作業(• 108 •
教育心理學報performance)
;因為一個具有音樂欣賞素養的人不一定是能擅於演奏樂器,一個擅於彈琴的λ 也未必是一個優秀的作曲家,而彈琴、作曲、欣賞翊都是音樂能力之表現方式 (Da
vies
,
1975) 。由此可見,人類能力是具有相當分化特徵的 CCarroll , 1985) 。
過去學者們(如 Thurstone ,
1938; Vernon 1965; Cattell
‘1971)
曾使用相關與因素分析的方法研究人類的心理能力。他們發現心理能力包含一些彼此不相關或相關甚低的能力,這種研究方 法已被學者們證實能提供能力的鑑定和分類資料;指出那些工作或試題可以測量某一因素所代表的能 力,那一些測量另一種能力;那些能力可以合併,那些應該分閉,也就是能提供需要不同能力的工作 分類的訊息。在心理與教育情境中,需要某一特定能力的工作不計其數,而難度是造成這些工作不同 的原因之一。到底工作難在那里,一般說來應該是可以用一些方法找出來的,例如:距離的遠近就是 造成足球員射門的困難度的原因之一,音調高低之相差量即是形成受試者辨別音調之困難的因素。但 在心理與教育測量中,通常是以能通過試題人數與總人數之比例來代表這個題目的難度。測驗的試題 就是工作受試者做對的工作愈多,分數愈高;分數愈高,則能力愈強。 試題是否測量單一能力與一個測驗的構念放度有密切的關係。所謂構盒放度就是能夠測量到理論 上的構念或特質的程度 (Anastasi 1982) 。過去初步評鑑測驗構盒放度的方法都是只從測驗中的工 作是否屬於同一種類來考慮 CCarro Il, 1985) 。例如,如果所有題目與語文推理有關,這個測驗就認 為語文推理能力的測驗。所有題目若與視覺表徵空間關係操弄有關就視為是空間能力的測驗。由於工 作的性質關係'這種直覺的工作分類常無法保證只是測量唯一語文推理能力:elG空間關係的能力,這種 情形已被學者們所證實 (Lohman , 1979) 。若有這種情形發生,不但影響能力測驗之構念投度,測 驗結果也無法作正確的解釋。 Allen 和 Yen (1979) 認為了解受試者對試題的處理過程能提供測驗 分數的構念教度之訊息。處理過程則可經由檢查試題的內容、試題間的相關研究、分析與學生之唔談 等方法達成。毫無提悶的, A Il en 和 Yen 的看法己指出了改進測驗需從受試者對試題處理的過程開 始。 Bejar (1 985) 認為,近年來對認知心理學的強調,影響心理計量學至少有兩方面:一是從認 知構念了解測驗作業之可能性;另一是利用認知心理學改進現有的測驗或騙製新的測驗。 Allen 和 Yen 認為要改進測驗必須了解受試者在試題的反應過程;和 Bejar 強調認知心理學之構念在改進 心理測量方面實相→致,都是強調在測驗設計時,構念教度需要進行試題間差異的研究。測驗編製者 一旦能夠解釋試題間特徵差異,就能掌捏住綜合利用試題特徵的知識 (Egan , 1979) 。若能統整心理 計量模式與認知科學兩者不但有助於提升心理計量工具之科學地位,而且能夠將進步的科技使用在施 測過程上。 測驗試題是否測量單一能力 (single ability) 對測驗的編製與測驗結果分數的解釋兩方面皆極
其重要。近年來單一能力之研究一直是傳統測驗理論與項目反應理論(i tem
response theory)
學者所重視,因為測驗試題是否測量單一能力不但影響到測驗結果分數的解釋,亦影響施測過程的運 用。僅從試題的相關研究結果難以判定試題是否具有單一能力的性質,原因是試題反應之雙變量分配
Cbivariate
distribution) 解釋非常困難 (Carro Il, 1985) 。過去有很多有關於能力區分的知識 ,係來自於因素分析的研究;但由於傳統因素分析方法抽取因素無絕對的標準,命名亦相當主觀,以及試題本身的缺陷,很難保證試題是否測量單一能力。近年來,有學者 (Wilson ,
W ood
,
&
Gibbsons
,
1982) 曾設計→套有別於傳統因素分析的電腦程式,極有可能解決這個問題。 英國教育理心學家 Walker(1931
,
1936
,
.1940) 會於一九三0年代提出「單一J (unig) 和「 零亂 J (hig ,聞 higgledy-piggledy) 兩個名詞,以鍍述測驗試題是否測量單→能力萬多種能力。 如果工作的難度水準和受試者之特徵晏現系統關係的測驗, Walker 稱它為單一能力測驗。所謂系 統關係,簡單的說,就是能夠做答較難試題的受試者比無法做答者,有一致較高通過較易題目之可能 性;受試者不會做答容易試題,也就無法通過較難的題目。相反地,沒有這種特性的師稱為非單一能力測驗。
根據 Walker 單一能力的說法,受試特徵函數 (person
characteristic
function) 應可用作檢驗試題是否測量單一能力之用。受試特徵函數所呈現之間形稱之為受試特徵曲線,它是表示 個人或軍體成功饑率與工作難度間潛在關係的關形。成功機率與工作難度的關係,通常有 Walker
Guttman 函數,常態肩形函數 (normal
ogive
function) 和量的模式函數 (quantalmodel .
function) 三種。其函數所形成之曲線如圖一(a) 、 (b)和(c) 。圖形中 p值表示成功之機率 , ß 表示工 •",.--.1
,I'
Jp
p
p
o 一~J A 3 3 ; i
Walker-Guttman 函數 常態肩形函數 量的模式函數 圖一 成功機率與工作難度曼首特徵函數之三種可能形式(改畫自 Carroll,1983)
3
。
-3 β. G -3 3 作的難度, α 表斜率。在心理與教育測驗情攬中,此三種函數,以常態肩形函數之出現率最高。這種 函數顯現成功撥率隨著工作難度之增加而變小。 Carroll (1985) 曾把受試者的能力(特徵)區分成高低不同的十組,繪製受試特徵曲線檢驗西沙音調感覺測驗 (Seashore
Sense of Pitch Test)
試題。各種能力組受試特徵曲線如圖二。 .6 .5 機遇 ' , ' ,
-e 可 ' ,.
.
.
、 、 、 、 30 23 17 IZ 8 5 3 2 音調是異 1HZ. LOG SCALE' 個二 西沙音詞感覺測驗+組總兮不同曼試特徵函數(改畫自 Carroll.1985)
• 110 •
教育心理學報 從圈中看出受試特徵與工作難度之函數顯現系統關舔,證實了此類測驗試題所要測量的音調辦別 能力的確是存在的。 本研究主要是以普通分類測驗中的語文理解與方塊計算兩類試題為研究材料,以探求試題邏輯分 析在能力測量上的重要性和受試特徵曲線在個人能力測量上之應用。具體研究項目包括: (1) 利用試題邏輯分析方法,蛇出造成方塊計算試題之難度差異因素; (2) 探究受試特徵曲線在鑑定試題測量單→能力運用之適當性; (3) 男女限制畫體是否影響到受試特徵曲線之運用; (4) 前後段限制畫體是否影響到受試特徵曲線之運用; (5) 試題鑑別度是否影響受試特徵曲線之鑑定功能。芳法
一、曼首者: 本研究受試者取自臺北市立和平國民中學-、二年級學生,該校為配合數學資侵麗的成立,男、 女生各取三~三盟較好的學生編為前段班,其餘的學生常態編宜。在本研究中稱之為前、後段宜。放 在取樣時考慮段別,由於前段直級較少,所以前段盟各年級只取二盟(男、女各一班) ,後段盟則各 年級取四盟(男、女各兩車) ,總共十二宜, 465 人。不合作或太多未完成之受試試卷先行剔除,最 後僅根摟 429 人之資料加以分析研究。至於受試者之年級、段別、性別等統計如衰→。 要- 1fi轍曼幫人數年
級 一-
一 l日L 計 班級類別 前 段 前 段 男 37 76 42 67 222 女 39 63 43 62 207 男+
女 76 13985
129 429 ""---二、研究材料: 本研究所使用的材料係取自於普通分類測驗中之語文理解與方塊計算兩類試題。普通分類測驗係由路君約、黃堅厚(民65) 依據美國民間出版之陸軍普通分類測驗 (Army
General Classification
Test) 修訂而戚,全測驗包括語文理解、算術推理、方塊計算等三類試題,每類試題各有五十題, 測驗材料採循環式排列,適合於園中一年級到高中三年級學生。本研究係厲探索性研究 (explora
tive study)
,故僅使用其中語文理解與方塊計算兩類試題。語文理解類題目主要測量受試者對兩個 字彙之理解能力,如「繼續」的意養和什麼最相近? (1)連綿(2) 間歇(3)始終 (4)動靜。而方塊計算類的題 目則在測量受試者某一種空間關係能力,此類題目也是選擇式試題,自受試者就每題的一堆方塊之透 祖晝去選答案方塊的個數。 三、研究程序: 本研究對象選出之後,以班級為單位賞施上述測驗,為使學生對測驗題能作最大表現,筆者商請 該校的導師或輔導老師擔任施測工作。施讀tl 時,主試者對受試者作指導說明,使其了解作答方法後,正式做此兩類試題,測驗時間約為25分鐘,但罵使學~能有充分時間作答,俟學生答完後再收卷。施 測時筆者要求主試者注意觀察那些學生不認真作答,俾便於收岡試卷後剔除之。受試者之答案係用 2 B 鉛筆塗寫在師大教心系印製之多種用途答案紙上,以便於電腦閱卷。 四、資料處理: 測驗之計分及資料統計工作係經由師大教育心理系光學閱讀棧及小型電腦處理。很據全體受試之 測驗結果,計算出每個試題的難度指數及鑑別力指數。難度指數包括 P 值(即從最高分部份向下取總 人數的27%與從最低分部份向上取27% '答對人數之比率的平均數)和公值(美國教育測驗服務社創 周之以平均數為13 '標車差為 4 之等距量尺分數)。用分數最高的27%與最低的27%答對人數比率之 差值當做鑑別力指數。其他的統計工作則由人工處理。 結果 一、語文理解與方城計算試圖之難度指數 根攘全部研究對象 429人在普通分類測驗語文理解與方塊計算兩類試題之結果,算得之各題難度 指數如表二、表三。表中難度指數A 值愈大表示題目愈難,反之,則愈簡單。又為便於讀者了解試題 內容,表中使用之題號與原測驗題本之題號相同。 聖賢三 語文理解五+眉之難度指數 題 號
1
2
3
4
5
6
7
8
9
10
A
值5.9
15.3
9.9
10.1
12.1
12.8
13.6
16.8
9.5
11.5
題 號31
32
33
34
35
46
47
48
49
50
A
值8.1
8.8
11.0
9.5
12.9
14.9
1
1.
2
10.0
7.3
1
1.
0
題 號61
62
63
64
65
76
77
78
79
80
A
值1
1.
1
11.5
9.8
18.2
12.6
14.0
9.9
9.0
12.5
9.5
題 號91
92
93
94
95
106
107
108
109
110
A
值8.6
1
1.
4
13.8
14.5
10.2
8.2
10.9
1
1.
3
1
1.
0
9.8
題 號121
122
123
124
125
136
137
138
139
140
公 值9.0
9.9
10.3
10.5
15.0
9.5
10.7
9.8
8.5
8.7
由表二資料顯示,普通分類五十個語文理解題目之難度指數(~)介於 5.9 至 18.2 之間,難度 指數在 14.5 以上者計有 2 、 8 、鈞、 64 、 94 、 125 等六個題目。• 112 •
教育心理學報費Z 芳現計算五+眉之難度指數
21
22
23
24
25
26
27
28
29
30
題 號 值6.8
6.5
7.8
7.3
8.2
11.8
7.9
8.0
8.0
8.6
A
題 號41
42
43
44
45
56
57
58
59
60
A
值8.6
7.5
8.7
7.6
13.6
10.1
9.6
8.0
10.1
9.7
題 號71
72
73
74
75
86
87
88
89
90
A
值10.9
10.8
11
.4
9.9
10.5
9
.4
10.9
11.1
10.9
12.1
題 號101
102
103
104
105
116
117
118
119
120
A
值9.5
12.1
10.7
13.0
12.0
13.2
13.0
14.0
13.5
16
題 號131
132
133
134
135
146
147
148
149
150
A
值14.8
14.0
10.5
14.5
12.0
13.6
12.2
13.3
13.1
14.8
出表三資料得知,方塊計算試眉之難度指數 C,ð.)介於 6.5 至 16.0 之間。難度指數在 14.5 以 上計有 120 一、 131 、 134 、 150 等四個題目。 如果將兩類試題按其難度指數(,ð.)由小到大之順序排列,結果如表四、表五: 要回 語文理解易難頤序要 題 號1
49
31
106
139
91
140
32
78
121
A
值5.9
7.3
8.1
8.2
8.5
8.6
8.7
8.8
9.0
9.0
題 號9
34
80
136
110
63
138
3
77122
.
A
值9.5
9.5
9.5
9.5
9.8
9.8
9.8
9.9
9.9
9.9
題 號48
4
95
123
124
137
107
33
50
109
A
值10.0
10.1
10.2
10.3
10.5
10.7
10.9
11.0
1
1.
0
11.0
題 號61
47
108
92
10
62
5
79
65
6
A
值11.1
11.2
11.3
11.4
11.5
1
1.
5
12.1
12.5
12.6
12.8
題 號35
7
93
76
94
46
125
2
8
64
A
值12.9
13.6
13.8
14.0
14.5
14.9
15.0
15.3
16.8
18.2
表四資料指出,五十個語文速解眉目乏易難順序與原測驗之排列順序並不完全吻合,這或許是巨 本研究之受試者與原修訂者之預試樣本不同所致。但為本研究分析上的需要,後面的統計分析均以土 述難度指數及其順序為依擾。 要五方塊計算五+周身難順序要 題 號
22
21
24
42
44
23
27
28
29
58
A
值6.5
6.8
7.4
7.5
7.6
7.8
7.9
8.0
8.0
8.0
題 號25
30
41
43
86
101
57
60
74
56
A
值8.2
8.6
8.6
8.7
9.4
9.5
9.6
9.7
9.9
10.1
題 號59
75
工33103
72
71
87
89
88
73
A 值10.1
10.5
10.5
10.7
10.8
10.9
10.9
10.9
11.1
11
.4 題 號26
105
135
90
102
147
104
117
149
116
A
值11.8
12.0
12.0
12.1
12.1
12.2
13.0
13.0
13.1
13.2
題 號148
119
45
146
118
132
134
131
150
120
A
值13.3
13.5
13.6
13.6
14.0
14.0
14.5
14.8
14.8
16
表五指出,此五十個方塊計算試題之易難順序與原測驗之排列順序雖較語文推理部分相符合,但 仍有部分不一致。如第 26 、 45 題竟位在易難順序表之後面,而 101 、 103 、 133 等題甜壘現在易難順 序表之前面,其可能的理由同前述語丈理解題目者。 =、語文理輝與方塊計算爾頓當眉之易難分組 由於這兩類試題各有五十題之多,若以五十題之難度指數作為試題難度水車,將有兩個缺點:第 →,因為題數多,難度水準多,將造成受試特徵曲線不易閱讀之現象。第二,這兩類試題不若前述之 西沙音調感覺測驗有造成試題難度之具體因素(音調之差別) ,相近之難度實難以表示其難度水車有 別,這是筆者進行試題分組之理由。 按試題的難度指數,將語文理解、芳塊計算兩類試題各分成四組 a 分類之基車如下:凡&值在 8.9 以下的試題列為第 I 組,在9.0-10.9歸為第 E 組,在 11.0-12.9 者列為第 E 組,在 13.0 以上 則列入第 N 組。至於題號,實際難度範圈,題數及平均難度等詳見衰六。語文理解第 I 、 E 、 E 、 N 組試題之平均難度分別為 8.01'9.88 '
11.70 和 15.12 ;方塊計算四組試題之平均難度依次為 7.83 ' 10.25'
11.83 和 13.89 ,上述各組試題之平均難度將作為以下繪製受試特徵曲線試題難度水車之 依接。• 114 •
教育心理學報 要大 語文理輝與育場計算試圖易躍分組賀科 圭"目亞 文 理 解 方 塊 計 算 題 號|臨陣|的
題 就i 輯同|吉思
l31
32
49
5.9
21
22
23
24
25 27
6.5
工8
8.01
28
29
30
41
42 43
14
7.83
91-
-
--106 - - 139
140
8-.8
44
58
8.7
一 一」生 4-g
34
48
9.0
56
57
59
60
719.4
63
77
78
80
95
E
--一-一一 --一19
9.88
72
74
75
86
87
14
10.25
107 110 121
122
123
10.9
89
101
103
133
10.9
124 136 137
138
一5
6
10
33
35
11
1
1.
1
26
73
88
90
102
E
47
50
61
62
65
14
11.7
8
11.83
105
135
147
79
92
108
109
12.9
12~2 一2
7
8
46
64
13.6
45
104
116
117
118
13.0
N
9
15.12 119
120
131
132
134
14
13.89
76
93
94
125
18.2
146
1是8149
150
16.0
三、普通分攝濁融語文理解部分單-能力之研究: 繪製受試特徵曲線,了解試題所測量之能力是否存在,除了必須有試題難度水車外,尚2頁將受苦員 按其分數高低分成若干組來表示受試者的特徵。測驗分數的高低可視為受試在此測驗所測量之能力做 高低。 H 語文理揖額全體曼試高幢幢力分組及其曼鼠特徵曲線 根攘全體受試者 429人之語文理解分數將學生區分成五組。第-組是代表語丈理解分數較低的一 組,而第五組表示分數最高的→組。由於很多受試者之分數一樣,如等分發組,將造成各組之能力無 差別之現象,因此,本研究把相同分數之受試者歸入同→能力組,但遵照每組約佔百分之廿左右之受 試為原則?詳細資料如表七: 要七語文理解顯高但能力分組資料 (N=429j組
別分數範團 i 人
平|累積百分比
五41
~
47
84
100
四39
~
40
7180.4
35
~
38
103
63.9
一30
~
34
79
39.9
一10
~
29
92
2
1.
4
而各紐曼試特徵曲線如圍三: H: .9~ 、-、、 、、 .8 、、 、、、 弓事監司 草、
、\
對
7 、 \ 、 、 、、 、、、 、 h、 .lt 五 、、 (二).
、\
等 .5
、、、 、、 \.
本、、 、、、 、‘
.
、、 、 、、、 、、、A
• 、、、‘(-) 、、、 、、. 、 、、 、、"-‘ 、、、 .3•‘
、、、 機遇 、、、 、、-
、、、 .2•-
--“百院 801' F于 題組5}1)-1
9 4‘
8. 晶。"-riE
A 13 a 14 MH5N IT7 包 12 題組平均純度 (A) 團三 全體曼誼之語文理解團組曼輯椅徵且總 由於筆者目前尚未找到造成語文理解試題困難之客觀標車,本研究暫使用美國教育服務社所創用 之試題難度指數作為基線之量尺,縱軸則為答對比率(通過比率) ,由於語文理解試眉之選項有四, 就理論上說其猜對之機率為四分之一,因此在縱轍。.25 處有一條與基線平行之蟻遇線,基線上之四個標點:
8.01
,
9. 駒,
11.70'
15.20 分別是第 I 、 E 、 E 、 N 題組之平均難度值。
由圖三可知,資料曇現極有系統的關係。在四個題組中,高分組答對比率始終高於低分組,最高 能力的受試者在較簡單的題目(第 1 組、第 E 組試題)答對比率幾近於百分之百,稍難的第 E 組試題 答對比率仍高達百分之八十七左右,到最難的-組題目才有困難;而最低能力的受試者在第 E 題組與第 E 題組試題開贈感到困難,至最難之第 N 組試題就更加感覺困難了,答對比率降至機遇之下。
口語文理解研究受試男生、女生商但能力分組及其特徵曲線 要八語文理解男、女生能力分組資科 男 生 (N=222)
女 生 (N=207)
組別|分數範團|人數|累積百
組剝|分數範圍|人數|累積百分比
主 的 4638
100
五42 -
47
30
100
四38 -
40
55
82.9
四39 -
41
49
'85
一35 "-' 37
40
58.1
一35 -
38
46
6
1.
8
一30 "-' 34
41
40.1
一30 -
34
38
39
一 一 一10 "-' 29
48
2
1.
6
一17 -
29
44
21.3
~
116.
教育心理學報 依攘男生 222 人,女生 207 人語文理解測驗上的分數,各分成五個能力不開之組別.:各組分數範 園、累積百分比、人數等資料如表入。 兩性高低能力分組之方式與全體相同,其各組分數範團與表七全體受試分組之範圈極相近蝕。男 性、女性受試者特徵曲級分別見國四與國五: 10 ‘ 口, →、計九\E
主J 9 ~、-
þ --.-司、、.\
一失\ 、\、 (包
11:
8 、、 \ 奇 4斗\、〉夫、
.7 俗、 、 -.6~、、矢志已
。5~ (一) .4~ 、、 、、... 、、、. 、.
、 、心 .3 ←機遇 、 -.、 、、.、、-
、、 、. .2~---‘
L-Bι 01....
988.
.
11 7 152•
.
•
•
...
題組別 81 9n
10 11 回 12 13 14 15N
題組萍的難度(.è:.) 圓圓 男生之語文理輝團組覺自特徵曲線 1自 咚!的 ,:9t
比 .8~' .比率 7
‘、 、 蠱、個\同
‘.
、、' ..
、 A 、、 、、.
、、.
、.
‘.
.5 、、、 \\ \ik 、、\ 、11
、\
dh 、、、 .6 .3~ 機遇 .2一-
、 、、 、 、 .1.‘
8.01 - , 品--題組別 I 988'
9rr
。10 11.
117 ~III
12 13-
14.
竿而
屆總乎j勻難度(.è:.) 國五 女生之語文理解團組受當特徵曲線由國四、圖五觀之,雖然使用限制的 (restricted) 受試,資料仍皆星現相當的系統性,高分組 的受試,大部分容易的題目都能答對,少數困難的題目(如第 N 類題組)才會有困難。低分組的受試 ,即使很簡單的問題(如第 I 類題組)作答也感困難,對困難的問題就更少有鐵會通過了。男、女生 能力最差的一組在第 N 題組之答對比率都落在機遇線以下。進一步的比較第四、五兩圖不難發現:女 生部分之受試特徵曲線斜率幾近相同,呈現有系統的排列,只有第二、第三能力組在第一試題組上答 對比率有經傲的紊亂現象,男生組中第二與第三能力組在第一試題組上答對比率有顛倒現象,在第三 、第四能力組在第 N 題組亦有反常之現象,這些顛倒現象之發生有兩個共同點: (1)發生於相鄰三組, (2)答對比率相差很小;因此,這種現象做可忽略,換言之,系統性的趨勢仍然存在的。 目語文理解前後段受當能力分組及其特徵曲輯 要丸語文理解前發段曼當能力~組資料 前 段 (N
=161)
後 段 (N=268)組 ~IJ I 分數範圓|人數|累積百分比
組則|分數範團|人數|累積百分比
五 的 4728
100
五38 -
44
54
100
四41 -
42
43
82.6
四35 -
37
56
79.9
一39 -
40
41
55.9
31 -
34
56
59.0
•37 -
38
25
30.4
一27 -
30
51
38.1
一 一 一28
~36
24
14.9
一10 -
26
51
19.0
10 A \-\\一
、、\
\\
.、.\、
\\\\、
\\、
\、、 \\ \\\、
ι\kkt
EHL九一、
2\-fr
、
~JIN\((之\又~
h1 、-\.‘、巴\~
刊.、
」丸
,9 8.7.rJ5 答對比率 3 ,__機遇 .2"‘
.1 B01 988 11 7 8 q 10 11=
12 .1 可題組到 i 一-1--AL 一一
___II1三一一之一一
超級干1句盼皮(.6.)
圖六 前聽班之語文理解圓租費扭轉徵曲線-14
叫一切
• 118 •
教育心理學報 按照前後段生之語丈理解上的分數,將其分成不同的五個能力組,各組分數範園、累積百分比、 人數分配等資料如表九。前後段生各組分數範圈相差較大,前後段受試特徵曲線如國六、圍七。 1.0 3 '、.
、、 ‘ 、 、.
、、 、、\\、\央
...
、.
、.
、 ‘、
。 PJE 祠,也 答對比率.4
日、、、. 』‘-'. (-l、'、.-"'-".-..‘-
.
‘..
' . 品,機遇'.
.
...
、、‘ ~...
-...
...
.2,1
8.01 •-m組別 I 9.88 15.2 -9-.-
m
12 周總平均難度 (L~) 後段班定語文理解圍租費誼特徵曲線n
10 13 14-FN
團七
從閏六、國七得知,大體上高分組的受試者在各題組上答對比率皆比低分組為高,除了最低分紅 以外,其他四組之斜率十分相近,前設班受試特徵曲線第三、第四能力組在第 N 題組客對比率高低羊 顛倒現象;而圍七之第三能力組在第 I 題組上的答對比率亦高於第四能力組。不過,整個圓形仍星相 當的系統性。 四、普通苦苦麵測廳育場計算麵試團軍-能力測量之研究 方塊計算類試題受試高低能力分組原則與語文理解類相同。 H 方境計算全體曼誼商幢幢力 5t租車其曼前特徵曲轉 依攘 429 位受試方塊計算試題之總分分成五個不同的能力組,分數愈高融為能力愈強,分數愈但 則視為能力愈弱。各組之分數範園、累積百分比及人數資料如表十。 要+ 全體曼誼芳塊計算高低能力分組資科組
別|分數範園|人
數|累積百分比
主 41 - 49 82 100 四 38 - 40 84 80.9 一 35 - 37 79 61.
3 一 31 - 34 90 42.9 一 一 6 - 30 94 21.
9全體受試在方塊計算類試題之特徵曲線則如圖八,圍中顯示各能力組曲線之科率除最高能力組稍 有不同外,其他大致相同。各能力組受試之平均答對比率隨工作難度之增加而減少。較高能力組在各 種工作難度水準之審對比率始終比低能力組高。能力最高一組之曲線,在前三種工作難度水準呈現逐 漸下降之趨勢,這與其他四組極為一致。但在難度為13.89 之工作難度時,其曲線走向與其他四組稍 有不同,比預期答對之比率稍微高些。大體來說,受試審對機率與系列難度工作間仍墨現相當單調的 (monotonic) 密切關係。 USB
容對比率
.7 IL_. 、、 、、.、、 、、 、、. 、、 、 ‘ ‘ 、 、 、 .6.
、.
、 、.
.
.5 wh 、、'0、\\\'.、
、 、、 、、 、 、、.
、、.4
.
.
.
、、 可麗、 、、 ‘ ‘.
‘ 、、、、
.3 機遇. .
、、 .2 、.,‘ .1門別
組 題7.83
10.25
1
1.83
13.89
•
.
•
...
a...
1
8
9
lOn
11E
2
13
N
題組平均難度 (6) 圖八 全體旻誼之7雪場計算圖紐曼富貴特徵曲線 尚方塊計算男、女曼~.佳能力分組混其特徵曲線 男、女受試在方塊計算類試題之能力分組詳細資料如表十一,資料顯示除第一組分數範園差異較 大外,其他各組之分數範圈,男、女受試十分相近。男、女受試在這類試題之特徵曲線如國丸、圍十。 實+一方塊計算男、女曼當高低能力分組資料 男 生 (N=222)
女 生 (N=207)組別|分數範團|人數|累積百分比 組則|分數範圈|人數|累積百分比
五41
~47
39
100
五41
~49
45
100
四37
~40
50
82.4
四38
~40
44
79.2
一 一]34
~36
48
59.9
35
~37
38
58.0
一29
~33
42
38.3
一31
~34
45
39.6
一 一 一6
~28
43
19.4
一13
~30
37
17.9
• 120 • 教育心理學報 1ρ
-k
答 ζ之之三三了了一 『、、 .9~ 、、、---之三、、、 對.ltβ
司、、 、 、、4 、 寺河
、
主事 .7~、
\、
\ \ \ \ 、‘、\、M
、、、
、、、、\ \ \ \
.5 ~、\\'" 、•
、恥、k 、 .H ‘(~)、 .2 、4 .1 783 10.25 11.83 13.89 ,且 ι ﹒ 71
8 9 10II
11m
12 日 t4題組別
I
題組平J~J 如!空 (b.) 國九男生之芳塊計算團組曼質特徵曲線方塊計算類試題,男、女受試特徵曲線皆曇現明顯系統之關係。兩性特徵曲線除了第四能力組以
外,其他三個能力組之曲線走勢雖乎一致。高能力組在簡單的題目之答對比率聽近於百分之百,郎使
10 。 J8.7答對比率
。、'、、.
、‘.
、、.
、、"、、.
、、.
、、 、.
其、'-、 、 、、 .6 、 、 、.
、‘ 、、 ‘ 、.
、 .5 、 、、 鴨、 、、 .4 -m 、、.
、 、 ‘ 、 ‘ 、.
、、 ‘ ‘ 機遇 “、‘革 、.
.3 .2.
‘ 、、.. .
-
.、.JtJ
9寸 題組別mHSI
10.25 11.83 司, 9 -1-1'
~a ι.呵, 12E
'
-}3 34抽」
lN
唔,‘ 10II
題組平均難度 (À) 團十女生之方讀計算團組受自特徵曲線是難的題目組平均答對比率在 .70 左右。能力差的組就是極簡單的題目答對比率也不高,到了第 E 或 第四難度題組就更感困難,而到第四題組時更是困難重重了。另外,女生第一能力組在各個試題難度 水準之客對比率皆顯著高於男生同一能力組,其他三個能力組則無太大之差別。 自芳塊計算前後段頂高低能力分組及其特徵曲線 童安+二 前後段曼試方塊計算能力分組資科 前 段 (N
=161)
後 段 (N=268)
組別 i 分數範園|人數 i 累積百分比
組別 i 分數範團|人數|累積百
五44
~49
26
100
主 的 4539
100
四40
~43
37
83.9
四36
~39
60
85.4
一38
~39
31
60.9
一32
~35
49
63.1
一35
~37
38
4
1.
6
-
27
~31
71
44.8
一 一 一13
~34
29
18.0
一6
~26
49
18.3
根據前後段旺方塊計算類試題總分分成不闊的五個能力組,詳細資料如表十二。由表中得知前段 受試各組之分數範團均顯著大於後段對應組之受試分數範圈。其特徵曲線如間十→、圍十二。 ω 答 對 9 比.8 1_率 、7
f, .5 .4.3 同空
.2 戶4 7 題組別 4、 、 、.
、 、、 、、‘ \ 、、 文 、.
川、\(-)、.、
.、色、、 、\趴、\ 、、 、可••
、 、 \ \ 、 、、' 、、""
7 83
...
10.25
.
1183
13 89
a.
‘
...
8
9
10
11
12
13
14
I
E
E
N
題組平均難度(.ð.) 回+- 前段曼誼之有塊計算團組曼扭轉徵曲線• 122 •
to
答 對 .9比 .8
率.7
.6
.5
.4
3 口里
.2
教育心理學報 、、.
瓜、、 、‘、 、.
(司 、‘
、 \、
、‘ ‘
(三ì'.、 田、
、 、 、 、 、、 、“‘
、 、 、 、 (-)‘﹒‘鴨、 ‘ 、 、‘
、 ‘.
‘
、 、 、 、 、 、 、 、 、 、 、 、 、‘﹒ 、、.
、、.
、、 、、、、 、‘'
、.、、 、、.
、‘..
. .
.
‘ "J( .11
1-+ 題組別 77.83
1025
11.83
13.89
.
s s a "-0•
•
'
BN
14
1
8
9
10
II
11
E
12
題組平均難度 (A) 圖+二後段曼誼之方塊計算團組受自特徵曲線 從圖十→、十二可以看出,前段各能力組受試在各個題組難度水準之答對比率顯著高於後段組, 前後陸各能力組受試,除了第一能力組外,其他四組在較易的題組答對比率相差甚微。在圖十一中, 第四與第五能力組及第二、第三能力組在第 I 題組之答對比率有交錯現象。在國十二中,第三、第四 能力組亦在第 I 題組有顛倒現象。整體來說,前後段各能力組受試特徵曲線具有相當系統闢係的。 五、當圖鐘別度與曼說特徵曲線之闢係 (→普通分類測驗語文推理與方塊計算兩類試題之鑑別力指數 (D 值〉分別見表十三、表十四。 聖賢+三 語文理解自固定撞到指數 題 號1
2
3
4
5
6
7
8
9
10
D
值.04
.24
.33
.36
.10
一 .11.14
.07
.18
.21
題 號31
32
33
34
35
46
47
48
49
50
D
值.21
.16
.55
.30
.50
.26
.56
.45
.10
.59
題 號61
62
63
64
65
76
77
78
79
80
D
值.41
.43
.35
.09
.57
.45
.36
.28
.53
.36
題 號91
92
93
94
95
106
107
108
109
110
D
值.22
.57
.38
.29
.42
.23
.57
.50
.49
.28
題 號121
122
123
124
125
136
137
138
139
140
D
值.27
.39
.38
.43
.32
.38
.47
.39
.26
.28
從表十三知道,語丈理解試題鑑別方指數辜負值的僅有第六題-題。根據 Ebel (1 979) 試題鑑 別力評鑑標準,鑑別指數在 .30 以上者可視為優良題目。在這種標車下,語文理解五十個試題中,屬 優良題目的共有29題。自表十四知,在五十個方塊計算試題中,有28個試題厲優良試題。 安+四 方現計算誼眉之鐘別指數 題 號
21
22
23
24
25
26
27
28
29
30
D
值 .的.10
.16
.14
.13
.07
.20
.16
.17
.25
題 號41
42
43
44
45
56
57
58
59
60
D
值.27
.12
.27
.18
.49
.30
.33
.22
.34
.34
題 號71
72
73
74
75
86
87
88
89
90
D
值.45
.36
.40
.38
.48
.26
.50
.49
.48
.42
題 號101
102
103
104
105
116
117
118
119
120
D
值.22
.58
.49
.50
.53
.26
.43
.31
.56
.19
題 號131
132
133
134
135
146
147
148
149
150
D
值.26
.45
.47
.40
.27
.30
.48
.48
.39
.23
口語文理解與方塊計算錯別力指數達 .30 以上立話題易難分組 從語文理解與方塊計算兩類試題中選出鑑別力指數 .30 以上之優良試題,再依其難度指數大小分 量要+五 語文理解與方塊計算鐘別指數 .30 以土 ZIitB屬難分組賀科 組 語 文 理 解 方 塊 計 算 車。 題 號|蓋自悶|揖
題 號悟到題數|直想
3
4
34
48
63
9.0
56
57
59
60
71
9.0
主77
80
95
107
122
15
10.03
72
74
75
87
89
12
10.38
123 124
136
137
138
10.9
103
133
10.9
33
35
47
50
61
11.0
11.0
芷62
65
79
92
108
11
11.59
73
88
90
102
6
11.82
109
12.9
105
147
12.9
一 一13.6
45
104
117
118
119 13.6
E
76
93
125
18.2
3
14.27
18.2
10
13.56
132
134
146
148
149
• 124 •
教育心理學報 組。在改除晶質不良的試題過程中,已經把原歸為第 I 題組之題目剔除(鑑別力均未達 .30 ,見衰四 、五、六) ,故在此分組之基準調整如下:凡 A值在 .90...10.9者歸入第 I 組,在 11.0...12.9者列入 第 E 組, 13.0以上者歸入第 E 組,詳細分組資料見衰十五。語文理解第 I 、 E 、血題組之平均要在度分別為10.03 、 1 1. 59和 14.27 ;方塊計算三組試題之平均難度依次為 10.38 、 11.82 與13.56 。上述平均
難度將在繪製受試特徵曲線時作為試題組難度水準之依接。 表十五與表六比較發現,表十五第 I 、 E 、 E 組之平均難度指數與表六之 I 、 E 、 E 組之平均難 度指數相近。 因語文理解與15塊計算鐘到力指數 .30 以上團組受當特徵曲線兩類試題經保留優良題目之後,其受試特徵曲線如圖十三典圓十四。-mqH-βJ
己也 ι1 ← uhp 少,←曲 ZI 目,一茲-、‘ 夫、
、 ‘ 、 、 、 、 .、 ‘ ‘ 、 』. 、 \、、(國 、. 、‘
、 、 、 、 、 、 、 、.6
、
.
\ -﹒-一﹒、5
也 、、 、 、.
、•
.
、 、A
.
.
‘
‘. .
.團已‘J
、.
擠過.
‘ ,2
.
、.
、一‘唱.1
10.03
•-c&
題組別 I11.59
且14.27
•---'
15
11
rr
12
題組平均難度 (A)
13
14
m
圖+E 全體受iil:Z語文理解畫冊力指數 .30 以上題組曼扭轉徵曲線 雖然語文理解試題第二能力組在第 E 試題組比第三能力組答對比率要高些,但整體而言,語文理 解與方塊計算兩類試題之受試特徵與試題難度水草呈現相當有系統的關係'若將國十三與國三之後三 組,圖十四與國入之後三組相比較,可發現函數關係極為一致。六、芳坊1t.1it8攤賣水鐘之因寮
分析造成試題困難之因素,對能力界說、測驗是否測量單一能力、試題編號與實施等皆極寫重要 。將 429 位受試方塊計算試題之難度指數依序揖列。由於試題過多,故僅選出逢 5 的倍數順序之擅自 共 10題進行試題之邏輯分析,題號及難度指數如表十六。 分析表中 10個試題內容,發現前兩個極易的題目係層對稱題型,而其他 8 個皆層不對稽的題型。1ρ 答
.9
對lt
.8
率 J
,
6
,
5
,
4
,
3
i一盤遇
.2
,1
、、 、九 、.、(二)、、
、、 、.
、 ‘ \ 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 、 耐刊、(1
.
.
d ‘ 、 、.
\
、
-A 、、 、、.
、、.
、、 、 .,..、、、“‘‘'‘
,
10.38
10
題組別I
1
1.82
13.56
m
14
II
12
題組平均難度(.~) 圖+四 全體曼誼之育場計算鐘別力指數 .30 以土層組曼誼特徵曲線11
...
-13
不對稱題型中的最難三個試題共同的特徵是題目圖形不夠清楚;與其他幾個不對稱圖形相較,方塊之 形股也較小。 聖賢+六 雖度因黨分析之芳塊計算iit周圍攏輿難度指數串 題號 4458
86
56
72
73
102
116
118
120
A 值 I7.6
8.0
9.4
10.1
10.8
11.4
12.1
13.2
14.0
16.0
〉拉由於測驗內容係屬機密,故不附表中 10個題目之內容,若æ、氛參考時,請向師大教心系洽倍。 討論 一、曼說特徵曲線在能力測量適用之可能性 能力測驗的教度與其施測的策略是目前測驗學者們重視的兩個問題。測驗編製者所宜稱擬測量之 能力與能力測驗的構念妓度有密切的關係。若按照前面 Walker 對學一能力的說法及受試特徵曲線之 性質,受試特徵曲線應可適用於勘定能力之存在與否;只要對某一受試,或某一能力相近之受試,正 確作業之饑率和→系列難度不同之工作間呈現一種有系統的、單調的密切關係,而且高能力組較低 能力組在這些不同工作難度上之答對比率為高時,這個工作所欲測量能力就可撞得證賞 (Mosier , 1941)。本研究中,是使用被學者們(如 Carroll1982
,
1985) 認為層單一能力的語文理解與方塊計 算試題為材料,使用受試特徵曲線加以驗證,結果誼實了兩類測驗題係測量單一能力的。另外,受試 特單曲讓不且用在采;民剝拘全瞳受其具有運用夠真值,就是有隨主制~受識(男女或前後段受試)亦可• 126 •
教育心理學報 使用。 從上面結果各個受試特徵曲線知道:語丈理解所要測量的字彙知識;方塊計算所欲測量的空間視 覺能力的確是存在的;因為從國三到圖十四皆是現常態肩形系統關係。各個特徵曲線也有極相蝕的斜 率,此斜率應可各別視為字彙知識或空間視覺能力之特徵 (Carroll , 1985) 。從受試特徵曲線斜率 之高低能說明這個測驗信度受限制情形,斜率愈大表示測驗的信度受到限制愈小;斜率愈低則表示這 個能力測驗之信度受到限制愈大。按照傳統的測驗理論,適度增加良好晶質之試題,測驗信度將會提 高,測驗編製者若能了解某類能力測驗,其特徵曲線之斜率,將有助於了解提高信度之限制。 二、輛觀測驗慮重說晶質優良的幫團 從圖十三、十四知道:語文理解與方塊計算兩頭淘汰約一半的試題之後,受試特徵曲線與原來未汰除鑑別力指數在 .30 以下題目之受試特徵曲線幾乎完全一致。這說明了少數優良試題-樣能證實欲
沒.tl 量的能力之存在。同時,從汰除不良試題後,受試特徵曲線斜率看來,仍可表現出與未淘汰前能力 特徵及信度受限的特性 Q 因此,置放鑑別力指數低的題目於測驗中,非但對能力測量無助益更耗費人 力與物力。 三、當圖通輯分析,當圖解混過程的7蟬,在鋪盟與改進能力測驗土之重要性 測驗很少是純粹某一心理特質之測量,因此一教育工作者如欲適當解釋受試測驗分數,則必須先 找出影響作業之因素 (Cronbach , 1984) 0Sternberg
(1 981) 也認為試題解決過程之清晰的了 解有助於能力特質與其評估 (assessment) 新的領悟。同樣地,語文理解或方塊計算測驗有構念教度則須先證實語文理解或方塊計算概念具有科學讀概念的意羲 (Green , 1981) 。試題的邏輯分拼,
試題解決過程的訊息皆有助於了解造成試題難度差異的因素。能力也應該從這個角度來界說,如果能 力的界定是根攘造成試題難易之因素,則這種能力測驗之構念放度將獲得保障。 Vernon(1962)
曾對閱讀理解測驗作過邏輯分析,就發現跌了閱讀理解之外,還有許多解釋受試測驗結果之因素。就 以方塊計算類試題為例,如果仔細分析這類試題內容,會發現這類試題表面上有兩個影響試題難度差 異之因素一一看不見的方塊個數之多少和方塊的排列是否對稱。看不見的方塊個數愈多試題愈難,但 這個因素與對稱因索有安互的作用 CCarro l1,1985)
,換言之,對稱與不能立見的方塊數是造成方塊 計算試題之難度水葷的因素。但根據筆者對10個各種難度題目的分析結果,對稱性和不能立見之方塊 的個數並不是決定題目困難的因素,因為大部分對稱性題目儘管不能立見的方塊數很多,其難度仍不 高,題目之清晰佐與方塊之排列方式才是最重要的 o 方塊計算試題理論上應該是測量空間視覺的能力(Spatial visualization
ability) 而這種能力與空間關係 (Spatial relations) 不同,前者屬於較為復雜,且難度較高的空間能力,後者屬於較簡單、偏於速度性的能力 CPellegrino ,
1982)
由試題分析結果,提醒吾人將來編製方塊計算試題以測量空間視覺能力時,應盡可能將題目印刷清楚 ,以兔影響受試者親不能立見方塊的能力。 至於語文理解試題型態極為單純,試題難度因素不易從試題分析或訪問受試者來了解。就筆者所 知,國內尚無對字彙使用次數之研究報告,因此無法像方塊計算試題容易找出試題難度之具體因素。 在日常生活中或課本中次數出現愈多的字彙,受試較易了解它的意思,因而能找出其意思相近之字彙 。字彙在日常生活中出現的頻率之多寡,以為此類試題難度之一個向度當無問題。是否有其他之參 考準攘尚待學者們的研究。 四、ii\:M難度分析與受當特徵曲線有助於能力測驗之,實施 如何使用最題時間、最少題目找出學生的能力是傳統測驗學者與項目反應理論學者同感興趣的問 題。透過試題內容之邏輯分析或是經由與受試者陪談而了解受試對試題之解題過程皆有可能找出造成 試題難度差別的因案。有些試題或工作較易找出客觀的因素,有些較為復雜的工作則不易分析。不易 分析的工作本身自P 可能潛藏著測量不同能力的線索,同時也不易對所要測量之能力給予蚵確的名稱,測驗的舖製者應注意這個問題。 根撥一系列之難易題目所繪製之受試特徵曲線的另一個運用是:對於今後能力測驗之實施方式: 供了訊息,如果能找到試題難易的客觀標準'將來可以從那一種難度水電車的題目推測受試可能正確a 答之聲聲率,進→步運用在測驗之實施時將可節省人力物力。 結論與被討 利用各種方法進行試題分析,以找出造成試題難易之客觀擦著畫,是能力界說所不可缺的。同時 是鑑定試題是否測量單一能力之受試特徵曲線基線之根據。單→能力之證實又有助於測驗分數正確1 釋,因此→個良好的能力測驗應該考慮進行試題分析,驗證試題是否測量單一能力。本研究以被學: 們認為較單純的語文理解與方塊計算兩類試題進行試題分析與使用受試特徵曲線驗證其是否測量單『 能力。-輯果發現此兩類試題的確測量單一能力;而且單一能力之驗證不因受試段別及性別的影響。| 時也發現汰除鑑別力指數在 .30 以下之題目,並不影響到受試特徵曲線之斜率,也就是不影響到測! 所要測量的能力特徵'這也說明了汰除不良題目,不但不會影響到能力的測量,同時還可節省人力 i 物力。 由於本研究係鷹初步探究,選取之材料是以學者們認為較可能測量單一能力的兩類試題,試題f 析也是以較具客觀標準之方塊計算為例,以說明受試者特徵曲線在能力測量方面之用途。今後如能{ 助認知心理學的知識從事試題或工作分析,找出受試作答之工作差異特質,以作為能力界說的基礎 則對個人能力能作更正確而合理的測量。 吾吾考書目 黃堅厚、路君約(民 68) 普通分麵瀾鷗實施芋姆。見師大教育心理熹 心理測驗實施手加(第﹒ 冊) 路君約、黃堅厚(民65) 普通分麵測酸。 師大教育心理系印製
Aiken
,
L. R.
(1
985).
Psychological testing and measurement
(5th ed.). Boston: Allyn
and Bacon.
Allen
,
M. J.
,
&
Yen
,
W. M.
(1
979).
Introduction to measurement theory.
Monterey
,
Ca: Brooks/Cole.
Anasta訟,
A.
(1
982).
Psychological testing
(5th ed.). New York: Macmillan.
Bejar.
1. 1.
(1
985). Speculations on the future of the test design. In S. E. Embretson
(Ed.)
,
Test design
(pp. 279-294). Orlando: Academic press.
Carroll
,
J. B.
(1
983). The difficulty of a test and its factor composition revisited.
Jn H. Wainer
&
S. Messick (Eds.)
,
princiρals0/
modern
ρsychologicalmeasurement
(pp. 257-282). Hillsdale
,
NJ: Lawrence Erlbaum Associates.
Carroll
,
J. B.
(1
985
,
April).
N ew perspectives in the anal ys;s
0/
abilities.
Paper
presented at the Buros-Nebraska symposium on Measurement and Testing
,
University of Nebraska
,
Lincon
,
Nebr.
Cattell
,
R. B.
(1
971).
Abilties: Their structure
,
grouth and action.
Boston: Houghton
Mifflin.
Cronbach
,
L. J.
(1
984).
Essentials
0/
Psychological testing
(4th ed.). New York:
Harper
&
Row.
• 128 •
教育心理學鮮Ebel
,
R. L.
(1
979).
Essentiasls 01 educational measurement
(3rd ed.) .Englewood Cliffs
,
NJ: Prentice-H
all,
1979.
Egan
,
D. E.
(1
979). Testing based on understanding: Implication from studies & spati
a1
ability.
lntelligence
,
3
,
1-15.
Green
,
B. F.
(1
98
1).
A primer of Testing.
American Psychologist
,
36
,
1001-1011.
Lohman
,
D. F.
(1
979).
Spatial ability: lndividual dijlerences in speed and level.
Stanford
,
Ca: Aptitude Research Project
,
School of Education
,
Stanford
Uni-versity.
Mosier
,
C.
I.
(1
941). Psychophysics and mental test theory
,
11
,
The constant process.
Psychological Review
,
48
,
235-249點Pellegrino J. W.
(1
982). Process an
a1
ysis of spati
a1
aptitude. In R. J. Sternberg (Ed.)
,
Advances on the
ρ sychology01 human intelligence
(vol 1). Hillsd
a1
e
,
NJ:
Lawrence E
r1
baum Associates.
Sternberg
,
R. S.
(1
98
1).
Testing and cognitive psychology.
American Psychologist
,
36
,
1181-1189.
Thurstone
,
L.. L.
(1
938).
Primary mental abilities.
Chicago: University of Chicago
Press.
Vernon
,
P. E.
(1
962). The determinants of reading comprehension.
Educational and
Psychological Measurement
,
22
,
269-286.
Vernon
,
P. E.
(1
965). Ability factors and environment
a1
in
f1
uences.
American
Psy-chologist
,
20
,
723-733.
W
a1
ker
,
D. A.
(1
931
,
1936
,
1940). Answer pattern and score scatter in tests and
exa-minations.
British Journal 01 Psychology
,
22
,
73-86; 26
,
301-308; 30
,
248-260.
Wilson,缸,