受試特徵曲線在能力測量之應用研究

(1)

國立臺灣師範大學教育心理學系教育心理學報，民 76 ， 20 期， 107一130 頁

受試特徵曲線在能力測量之應用研究

花結鑫

本研究旨在探討試題還輯分析與安試特徵曲線 (person

characteristic

curve)在能

力測量上可能之應用情形。受試者取自國中一、三年級男、女生前、後段班回三九人，以實施普通分類測驗語文理解與方塊計算兩類試題的結果作為分析與研究的資料。具體研究項目包括:(1)利用試題邏輯分析方法，找出造成方塊計算試眉之難度差異的因索。的探究妥試特徵曲線在鑑定試題測量:單一能力上運用之適當性 d3)男、女限制軍體 (restricted

group)

是否影響到安說特徵曲線之運用。(釗前後段限制軍績是否影響到受試特徵曲線之運用。 (5)試題鑑別力指數是否影響妥試特徵曲線之功能﹒ 研究結果發現: (1)試題圓形之是否清楚，和芳塊之韓列芳式影響芳塊計算試題的心理計量的難度。 (2)妥試特徵曲線具有鑑定測驗是杏測量單一能力之功能。 (3)限制草種不影響妥試特徵曲線立運用。凶刪除鑑別度 .30 以下之試題後，所第j優良試題仍能維持該能力測驗之特徵。筆者的建議: (1) 重視使用各種方法搜出造成試題困難差異之因素，以作為能力界定之基援。 (2)使用受試特徵曲線以鑑定試題是否測量單一能力，以保障測驗之構念效度 (con

struct validity)

0 (3)測驗緝製者應進一步利用受試特徵曲線之功能以改進測驗之實施。

能力 (abHi ty) 就是個人的學習潛能與經由敘育~訓練而撞得的知識，通常包括性向

(apti-tude) 和成就 (achievement) 二者。所謂性向是個人進一步訓練灑益之潛能，而成就係指個人已撞得能力的程度 (Aiken ， 1985) 。用來測量個人能力的測驗就是能力測驗，它包括性向測驗和成就測驗，其中性向測驗主要是用於預測將來的成就;成說測驗則在評量現有之知識與了解。就測驗題目本身，責難以判斷它到底是屬於性向測驗或成說測驗;以區分性向測驗組合中之機械性向測驗槓桿的擅自為例，吾人實難以判定它是測量使向還是成就的。因此，從受試作業結果觀察界定能力，性向與成就的差別實無意畫畫 (Carroll ， 1985) 。欲對個人的能力進行測量，應從「能力」的界說開始探究。依據美國傳統字典 (American

Heritage Dictionary)

，能力是「能做某事的才能;包括生理的、心理的、財務的或法律的作業能力 J

(the quality of being able to do something: physica

l,

mental

,

financia

l,

or legal power to

perform) 。這本字典先是把能力界定成「能做某事 J '然後又把「能J

(able) 界說成有足繭的能力 (having

sufficient

ability) 。這種麓圈子的定義方式對能力一詞

的界定並無直接的幫助。在日常生活中，對能力的解釋大多採事後方式 (posterìor

manner)

,

間先知道一個人在某件事的作業情形，萬?以概括性的界說。倒如某人鋪琴彈得好，就說這個人有音樂芳面的能力。這種事後方式的說法人人習以為常，言者、聽者皆能順利溝通。 Carroll 09.部)認為從心理與測量的觀點言，美國傳統字典對能力雖未于以明確的界定，但界說中所提及的「某事」二字均提供心理測驗緝製者對能力測量研究之重要訊息。在心理與教育的情攬冀，定羲中的「某事」不必一定是某類的工作 (task) 因為有運動讀音樂的能力的人未必運動~音樂上各種工作都能做得很好。當心理學家與教育學者提到心理能力 (mental

ability)

，也不應指各種心理工作上的作業(

(2)

• 108 •

教育心理學報

performance)

;因為一個具有音樂欣賞素養的人不一定是能擅於演奏樂器，一個擅於彈琴的λ 也

未必是一個優秀的作曲家，而彈琴、作曲、欣賞翊都是音樂能力之表現方式 (Da

vies

,

1975) 。由此

可見，人類能力是具有相當分化特徵的 CCarroll ， 1985) 。

過去學者們(如 Thurstone ，

1938; Vernon 1965; Cattell

‘

1971)

曾使用相關與因素分析

的方法研究人類的心理能力。他們發現心理能力包含一些彼此不相關或相關甚低的能力，這種研究方法已被學者們證實能提供能力的鑑定和分類資料;指出那些工作或試題可以測量某一因素所代表的能力，那一些測量另一種能力;那些能力可以合併，那些應該分閉，也就是能提供需要不同能力的工作分類的訊息。在心理與教育情境中，需要某一特定能力的工作不計其數，而難度是造成這些工作不同的原因之一。到底工作難在那里，一般說來應該是可以用一些方法找出來的，例如:距離的遠近就是造成足球員射門的困難度的原因之一，音調高低之相差量即是形成受試者辨別音調之困難的因素。但在心理與教育測量中，通常是以能通過試題人數與總人數之比例來代表這個題目的難度。測驗的試題就是工作受試者做對的工作愈多，分數愈高;分數愈高，則能力愈強。試題是否測量單一能力與一個測驗的構念放度有密切的關係。所謂構盒放度就是能夠測量到理論上的構念或特質的程度 (Anastasi 1982) 。過去初步評鑑測驗構盒放度的方法都是只從測驗中的工作是否屬於同一種類來考慮 CCarro Il， 1985) 。例如，如果所有題目與語文推理有關，這個測驗就認為語文推理能力的測驗。所有題目若與視覺表徵空間關係操弄有關就視為是空間能力的測驗。由於工作的性質關係'這種直覺的工作分類常無法保證只是測量唯一語文推理能力:elG空間關係的能力，這種情形已被學者們所證實 (Lohman ， 1979) 。若有這種情形發生，不但影響能力測驗之構念投度，測驗結果也無法作正確的解釋。 Allen 和 Yen (1979) 認為了解受試者對試題的處理過程能提供測驗分數的構念教度之訊息。處理過程則可經由檢查試題的內容、試題間的相關研究、分析與學生之唔談等方法達成。毫無提悶的， A Il en 和 Yen 的看法己指出了改進測驗需從受試者對試題處理的過程開始。 Bejar (1 985) 認為，近年來對認知心理學的強調，影響心理計量學至少有兩方面:一是從認知構念了解測驗作業之可能性;另一是利用認知心理學改進現有的測驗或騙製新的測驗。 Allen 和 Yen 認為要改進測驗必須了解受試者在試題的反應過程;和 Bejar 強調認知心理學之構念在改進心理測量方面實相→致，都是強調在測驗設計時，構念教度需要進行試題間差異的研究。測驗編製者一旦能夠解釋試題間特徵差異，就能掌捏住綜合利用試題特徵的知識 (Egan ， 1979) 。若能統整心理計量模式與認知科學兩者不但有助於提升心理計量工具之科學地位，而且能夠將進步的科技使用在施測過程上。測驗試題是否測量單一能力 (single ability) 對測驗的編製與測驗結果分數的解釋兩方面皆極

其重要。近年來單一能力之研究一直是傳統測驗理論與項目反應理論(i tem

response theory)

學者所重視，因為測驗試題是否測量單一能力不但影響到測驗結果分數的解釋，亦影響施測過程的運用。僅從試題的相關研究結果難以判定試題是否具有單一能力的性質，原因是試題反應之雙變量分配

Cbivariate

distribution) 解釋非常困難 (Carro Il， 1985) 。過去有很多有關於能力區分的知識，係來自於因素分析的研究;但由於傳統因素分析方法抽取因素無絕對的標準，命名亦相當主觀，

以及試題本身的缺陷，很難保證試題是否測量單一能力。近年來，有學者 (Wilson ，

W ood

,

&

Gibbsons

,

1982) 曾設計→套有別於傳統因素分析的電腦程式，極有可能解決這個問題。英國教育理心學家 Walker

(1931

,

1936

,

.1940) 會於一九三0年代提出「單一J (unig) 和「零亂 J (hig ，聞 higgledy-piggledy) 兩個名詞，以鍍述測驗試題是否測量單→能力萬多種能力。如果工作的難度水準和受試者之特徵晏現系統關係的測驗， Walker 稱它為單一能力測驗。所謂系統關係，簡單的說，就是能夠做答較難試題的受試者比無法做答者，有一致較高通過較易題目之可能性;受試者不會做答容易試題，也就無法通過較難的題目。相反地，沒有這種特性的師稱為非單一能

(3)

力測驗。

根據 Walker 單一能力的說法，受試特徵函數 (person

characteristic

function) 應可

用作檢驗試題是否測量單一能力之用。受試特徵函數所呈現之間形稱之為受試特徵曲線，它是表示個人或軍體成功饑率與工作難度間潛在關係的關形。成功機率與工作難度的關係，通常有 Walker

Guttman 函數，常態肩形函數 (normal

ogive

function) 和量的模式函數 (quantal

model .

function) 三種。其函數所形成之曲線如圖一(a) 、 (b)和(c) 。圖形中 p值表示成功之機率， ß 表示工 •",.--.1

,I'

J

p

_p

o 一~

J A 3 3 ; i

Walker-Guttman 函數常態肩形函數量的模式函數圖一成功機率與工作難度曼首特徵函數之三種可能形式(改畫自 Carroll，

1983)

3 。

-3 β. G -3 3 作的難度， α 表斜率。在心理與教育測驗情攬中，此三種函數，以常態肩形函數之出現率最高。這種函數顯現成功撥率隨著工作難度之增加而變小。 Carroll (1985) 曾把受試者的能力(特徵)區分成

高低不同的十組，繪製受試特徵曲線檢驗西沙音調感覺測驗 (Seashore

Sense of Pitch Test)

試題。各種能力組受試特徵曲線如圖二。 .6 .5 機遇 ' , ' ,

-e 可 ' ,

.

、、、、 30 23 17 IZ 8 5 3 2 音調是異 1HZ. LOG SCALE' 個二西沙音詞感覺測驗+組總兮不同曼試特徵函數(改畫自 Carroll.

1985)

(4)

• 110 •

教育心理學報從圈中看出受試特徵與工作難度之函數顯現系統關舔，證實了此類測驗試題所要測量的音調辦別能力的確是存在的。本研究主要是以普通分類測驗中的語文理解與方塊計算兩類試題為研究材料，以探求試題邏輯分析在能力測量上的重要性和受試特徵曲線在個人能力測量上之應用。具體研究項目包括: (1) 利用試題邏輯分析方法，蛇出造成方塊計算試題之難度差異因素; (2) 探究受試特徵曲線在鑑定試題測量單→能力運用之適當性; (3) 男女限制畫體是否影響到受試特徵曲線之運用; (4) 前後段限制畫體是否影響到受試特徵曲線之運用; (5) 試題鑑別度是否影響受試特徵曲線之鑑定功能。

芳法

一、曼首者: 本研究受試者取自臺北市立和平國民中學-、二年級學生，該校為配合數學資侵麗的成立，男、女生各取三~三盟較好的學生編為前段班，其餘的學生常態編宜。在本研究中稱之為前、後段宜。放在取樣時考慮段別，由於前段直級較少，所以前段盟各年級只取二盟(男、女各一班) ，後段盟則各年級取四盟(男、女各兩車) ，總共十二宜， 465 人。不合作或太多未完成之受試試卷先行剔除，最後僅根摟 429 人之資料加以分析研究。至於受試者之年級、段別、性別等統計如衰→。要- 1fi轍曼幫人數

年

級一

-

_一 l日L _計班級類別前 _段前 _段男 37 76 42 67 222 女 39 63 43 62 207 男

₊

女 76 139

85

129 429

""---二、研究材料: 本研究所使用的材料係取自於普通分類測驗中之語文理解與方塊計算兩類試題。普通分類測驗係

由路君約、黃堅厚(民65) 依據美國民間出版之陸軍普通分類測驗 (Army

General Classification

Test) 修訂而戚，全測驗包括語文理解、算術推理、方塊計算等三類試題，每類試題各有五十題，測驗材料採循環式排列，適合於園中一年級到高中三年級學生。本研究係厲探索性研究 (explora

tive study)

，故僅使用其中語文理解與方塊計算兩類試題。語文理解類題目主要測量受試者對兩個字彙之理解能力，如「繼續」的意養和什麼最相近? (1)連綿(2) 間歇(3)始終 (4)動靜。而方塊計算類的題目則在測量受試者某一種空間關係能力，此類題目也是選擇式試題，自受試者就每題的一堆方塊之透祖晝去選答案方塊的個數。三、研究程序: 本研究對象選出之後，以班級為單位賞施上述測驗，為使學生對測驗題能作最大表現，筆者商請該校的導師或輔導老師擔任施測工作。施讀tl 時，主試者對受試者作指導說明，使其了解作答方法後，

(5)

正式做此兩類試題，測驗時間約為25分鐘，但罵使學~能有充分時間作答，俟學生答完後再收卷。施測時筆者要求主試者注意觀察那些學生不認真作答，俾便於收岡試卷後剔除之。受試者之答案係用 2 B 鉛筆塗寫在師大教心系印製之多種用途答案紙上，以便於電腦閱卷。四、資料處理: 測驗之計分及資料統計工作係經由師大教育心理系光學閱讀棧及小型電腦處理。很據全體受試之測驗結果，計算出每個試題的難度指數及鑑別力指數。難度指數包括 P 值(即從最高分部份向下取總人數的27%與從最低分部份向上取27% '答對人數之比率的平均數)和公值(美國教育測驗服務社創周之以平均數為13 '標車差為 4 之等距量尺分數)。用分數最高的27%與最低的27%答對人數比率之差值當做鑑別力指數。其他的統計工作則由人工處理。結果一、語文理解與方城計算試圖之難度指數根攘全部研究對象 429人在普通分類測驗語文理解與方塊計算兩類試題之結果，算得之各題難度指數如表二、表三。表中難度指數A 值愈大表示題目愈難，反之，則愈簡單。又為便於讀者了解試題內容，表中使用之題號與原測驗題本之題號相同。聖賢三語文理解五+眉之難度指數題號

1

2

3

4

5

6

7

8

9

10 A

值

_5.9

_15.3

_9.9

_10.1

_12.1

_12.8

_13.6

_16.8

_9.5

_11.5

題 _號

₃₁

₃₂

₃₃

₃₄

₃₅

₄₆

₄₇

₄₈

₄₉

₅₀

A

值

8.1

8.8

11.0

9.5

12.9

14.9

1

1.

2

10.0

7.3

1

1.

0

題 _號

61

62

63

64

65

76

77

78

79

80 A

值

1

1.

1

11.5

9.8

18.2

12.6

14.0

9.9

9.0

12.5

9.5

題 _號

91

92

93

94

95

106

107

108

109

110 A

值

8.6

1

1.

4

13.8

14.5

10.2

8.2

10.9

1

1.

3

1

1.

0

9.8

題 _號

121

122

123

124

125

136

137

138

139

140

公值

9.0

9.9

10.3

10.5

15.0

9.5

10.7

9.8

8.5

8.7

由表二資料顯示，普通分類五十個語文理解題目之難度指數(~)介於 5.9 至 18.2 之間，難度指數在 14.5 以上者計有 2 、 8 、鈞、 64 、 94 、 125 等六個題目。

(6)

• 112 •

教育心理學報

費Z 芳現計算五+眉之難度指數

21

22

23

24

25

26

27

28

29

30

題 _號值

6.8

6.5

7.8

7.3

8.2

11.8

7.9

8.0

8.6 A

題號

41

42

43

44

45

56

57

58

59

60 A

值

8.6

7.5

8.7

7.6

13.6

10.1

9.6

8.0

10.1

9.7

題 _號

71

72

73

74

75

86

87

88

89

90 A

值

10.9

10.8

11 .4

9.9

10.5

9 .4

10.9

11.1

10.9

12.1

題 _號

₁₀₁

₁₀₂

₁₀₃

₁₀₄

₁₀₅

₁₁₆

₁₁₇

₁₁₈

₁₁₉

₁₂₀

A

值

9.5

12.1

10.7

13.0

12.0

13.2

13.0

14.0

13.5

16

題 _號

131

132

133

134

135

146

147

148

149

150 A

值

14.8

14.0

10.5

14.5

12.0

13.6

12.2

13.3

13.1

14.8

出表三資料得知，方塊計算試眉之難度指數 C，ð.)介於 6.5 至 16.0 之間。難度指數在 14.5 以上計有 120 一、 131 、 134 、 150 等四個題目。如果將兩類試題按其難度指數(，ð.)由小到大之順序排列，結果如表四、表五: 要回語文理解易難頤序要題 _號

1

49

31

106

139

91

140

32

78

121 A

值

5.9

7.3

8.1

8.2

8.5

8.6

8.7

8.8

9.0

題 _號

₉

34

80

136

110

63

138

3

77

122 .

A

值

9.5

9.8

9.9

題 _號

48

4

95

123

124

137

107

33

50

109 A

值

10.0

10.1

10.2

10.3

10.5

10.7

10.9

11.0

1

1.

0

11.0

題 _號

₆₁

47

108

92

10

62

5

79

65

6 A

值

11.1

11.2

11.3

11.4

11.5

1

1.

5

12.1

12.5

12.6

12.8

題 _號

35

7

93

76

94

46

125

2

8

64 A

值

12.9

13.6

13.8

14.0

14.5

14.9

15.0

15.3

16.8

18.2

(7)

表四資料指出，五十個語文速解眉目乏易難順序與原測驗之排列順序並不完全吻合，這或許是巨本研究之受試者與原修訂者之預試樣本不同所致。但為本研究分析上的需要，後面的統計分析均以土述難度指數及其順序為依擾。要五方塊計算五+周身難順序要題 _號

22

21

24

42

44

23

27

28

29

58 A

值

6.5

6.8

7.4

7.5

7.6

7.8

7.9

8.0

題 _號

₂₅

₃₀

₄₁

₄₃

₈₆

₁₀₁

₅₇

₆₀

₇₄

₅₆

A

值

8.2

8.6

8.7

9.4

9.5

9.6

9.7

9.9

10.1

題 _號

₅₉

₇₅

工33

103

72

71

87

89

88

73

A 值

10.1

10.5

10.7

10.8

10.9

11.1

11

.4 題 _號

₂₆

105

135

90

102

147

104

117

149

116 A

值

11.8

12.0

12.1

12.2

13.0

13.1

13.2

題 _號

₁₄₈

119

45

146

118

132

134

131

150

120 A

值

13.3

13.5

13.6

14.0

14.5

14.8

16

表五指出，此五十個方塊計算試題之易難順序與原測驗之排列順序雖較語文推理部分相符合，但仍有部分不一致。如第 26 、 45 題竟位在易難順序表之後面，而 101 、 103 、 133 等題甜壘現在易難順序表之前面，其可能的理由同前述語丈理解題目者。 =、語文理輝與方塊計算爾頓當眉之易難分組由於這兩類試題各有五十題之多，若以五十題之難度指數作為試題難度水車，將有兩個缺點:第 →，因為題數多，難度水準多，將造成受試特徵曲線不易閱讀之現象。第二，這兩類試題不若前述之西沙音調感覺測驗有造成試題難度之具體因素(音調之差別) ，相近之難度實難以表示其難度水車有別，這是筆者進行試題分組之理由。按試題的難度指數，將語文理解、芳塊計算兩類試題各分成四組 a 分類之基車如下:凡&值在 8.9 以下的試題列為第 I 組，在9.0-10.9歸為第 E 組，在 11.0-12.9 者列為第 E 組，在 13.0 以上則列入第 N 組。至於題號，實際難度範圈，題數及平均難度等詳見衰六。語文理解第 I 、 E 、 E 、 N 組試題之平均難度分別為 8.01'

9.88 '

11.70 和 15.12 ;方塊計算四組試題之平均難度依次為 7.

83 ' 10.25'

11.83 和 13.89 ，上述各組試題之平均難度將作為以下繪製受試特徵曲線試題難度水車之依接。

(8)

• 114 •

教育心理學報要大語文理輝與育場計算試圖易躍分組賀科圭"目亞 _文理解 _方塊計算題號

|臨陣|的

題就

i 輯同|吉思

l

31

32

49

5.9

21

22

23

24 25 27

6.5

工

8

8.01

28

29

30

41 42 43

14

7.83 91-

-

--1

06 - - 139

140 8-.8

44

58

8.7

一一」生 4-

g

34

48

9.0

56

57

59

60

71

9.4

63

77

78

80

95 E

--一-一一 --一

19

9.88

72

74

75

86

87

14

10.25 107 110 121

122

123

10.9

89

101

103

133

10.9 124 136 137

138

一

5

6

10

33

35

11

1

1.

1

26

73

88

90

102 E

47

50

61

62

65

14

11.7

8

11.83

105

135

147

79

92

108

109

12.9

12~2 一

2

7

8

46

64

13.6

45

104

116

117

118

13.0 N

9 15.12 119

120

131

132

134

14

13.89

76

93

94

125

18.2

146

1是8

149

150

16.0

三、普通分攝濁融語文理解部分單-能力之研究: 繪製受試特徵曲線，了解試題所測量之能力是否存在，除了必須有試題難度水車外，尚2頁將受苦員按其分數高低分成若干組來表示受試者的特徵。測驗分數的高低可視為受試在此測驗所測量之能力做高低。 H 語文理揖額全體曼試高幢幢力分組及其曼鼠特徵曲線根攘全體受試者 429人之語文理解分數將學生區分成五組。第-組是代表語丈理解分數較低的一組，而第五組表示分數最高的→組。由於很多受試者之分數一樣，如等分發組，將造成各組之能力無差別之現象，因此，本研究把相同分數之受試者歸入同→能力組，但遵照每組約佔百分之廿左右之受試為原則?詳細資料如表七: 要七語文理解顯高但能力分組資料 (N=429j

組

別分數範團 i 人

平|累積百分比

五

41 ~

47

84

100

四

39 ~

40

71

80.4

35 ~

38

103

63.9

一

30 ~

34

79

39.9

一

10 ~

29

92

2

1.

4

(9)

而各紐曼試特徵曲線如圍三: H: .9~ 、-_、、、、 .8 、、、、、弓事監司草、

、\

對

7 、 \ 、、、、、、_、、 h、 .lt 五、、 (二)

.

_、

\

等 .5

、、、、、 \

.

本、、、、、、

‘

.

、_{、、} 、、、、、、

A

• 、、_、‘(-) 、、、、、. 、、、、、"-‘ 、、、 .3•

‘

、、、機遇、、、、_、

_-

、、、 .2•

_-

--“百院 801' F于題組5}1)

-1

9 4

‘

8. 晶。

"-riE

A 13 a 14 MH5N IT7 包 12 題組平均純度 (A) 團三全體曼誼之語文理解團組曼輯椅徵且總由於筆者目前尚未找到造成語文理解試題困難之客觀標車，本研究暫使用美國教育服務社所創用之試題難度指數作為基線之量尺，縱軸則為答對比率(通過比率) ，由於語文理解試眉之選項有四，就理論上說其猜對之機率為四分之一，因此在縱轍。.25 處有一條與基線平行之蟻遇線，基線上之四

個標點:

8.01 ,

9. 駒，

11.70'

15.20 分別是第 I 、 E 、 E 、 N 題組之平均難度值。

由圖三可知，資料曇現極有系統的關係。在四個題組中，高分組答對比率始終高於低分組，最高能力的受試者在較簡單的題目(第 1 組、第 E 組試題)答對比率幾近於百分之百，稍難的第 E 組試題答對比率仍高達百分之八十七左右，到最難的-組題目才有困難;而最低能力的受試者在第 E 題組與

第 E 題組試題開贈感到困難，至最難之第 N 組試題就更加感覺困難了，答對比率降至機遇之下。

口語文理解研究受試男生、女生商但能力分組及其特徵曲線要八語文理解男、女生能力分組資科男生 (N

=222)

女生 (N

=207)

組別|分數範團|人數|累積百

組剝|分數範圍|人數|累積百分比

主的 46

38

100

五

_{42 -}

₄₇

30

100

四

_{38 -}

₄₀

55

82.9

四

_{39 -}

₄₁

₄₉

'85

一

35 "-' 37

40

58.1

一

35 -

38

46

6

1.

8

一

30 "-' 34

41

40.1

一

30 -

34

38

39

一一一

10 "-' 29

48

2

1.

6

一

17 -

29

44

21.3

(10)

~

116.

教育心理學報依攘男生 222 人，女生 207 人語文理解測驗上的分數，各分成五個能力不開之組別.:各組分數範園、累積百分比、人數等資料如表入。兩性高低能力分組之方式與全體相同，其各組分數範團與表七全體受試分組之範圈極相近蝕。男性、女性受試者特徵曲級分別見國四與國五: 10 ‘ 口, →、

計九\E

主J 9 ~、

-

þ --.-司、

、.\

一失\ 、\、 (包

11:

8 、、 \ 奇 4斗

\、〉夫、

.7 俗、、

-.6~

、、矢志已

。5~ (一) .4~ 、、、、... 、、、. 、

.

、、心 .3 ←機遇、 -.、、、.、、

-

、、 _、. .2~

---‘

L-Bι 01

....

988

.

11 7 152

• .

•

• ...

題組別 81 9

_n

10 11 回 12 13 14 15

N

題組萍的難度(.è:.) 圓圓男生之語文理輝團組覺自特徵曲線 1自咚

!的，:9t

比 .8~' .比

率 7

‘、、蠱、

個\同

‘

.

、、

' ..

、 A 、、 _、、

_.

、、

.

_、

.

_‘.

.5 、、、 \\ \ik 、、\ 、

11 、\

dh 、、_、 .6 .3~ _機遇 .2

一-

、、、、、 .1

.‘

8.01 - , 品--題組別 I 988

'

9

_rr

。10 11

.

117 ~

III

12 13

-

14

.

竿而

屆總乎j勻難度(.è:.) 國五女生之語文理解團組受當特徵曲線

(11)

由國四、圖五觀之，雖然使用限制的 (restricted) 受試，資料仍皆星現相當的系統性，高分組的受試，大部分容易的題目都能答對，少數困難的題目(如第 N 類題組)才會有困難。低分組的受試，即使很簡單的問題(如第 I 類題組)作答也感困難，對困難的問題就更少有鐵會通過了。男、女生能力最差的一組在第 N 題組之答對比率都落在機遇線以下。進一步的比較第四、五兩圖不難發現:女生部分之受試特徵曲線斜率幾近相同，呈現有系統的排列，只有第二、第三能力組在第一試題組上答對比率有經傲的紊亂現象，男生組中第二與第三能力組在第一試題組上答對比率有顛倒現象，在第三、第四能力組在第 N 題組亦有反常之現象，這些顛倒現象之發生有兩個共同點: (1)發生於相鄰三組， (2)答對比率相差很小;因此，這種現象做可忽略，換言之，系統性的趨勢仍然存在的。目語文理解前後段受當能力分組及其特徵曲輯要丸語文理解前發段曼當能力~組資料前段 (N

=161)

後段 (N=268)

組 ~IJ I 分數範圓|人數|累積百分比

組則|分數範團|人數|累積百分比

五的 47

28

100

五

_{38 -}

₄₄

54

100

四

41 -

42

43

82.6

四

_{35 -}

₃₇

56

79.9

一

39 -

40

41

55.9 31 -

34

56

59.0

•

37 -

38

25

30.4

一

_{27 -}

₃₀

51

38.1

一一一

28

~

36

24

14.9

一

10 -

26

51

19.0

10 A \

-\\一

、、\

\\

.、.\、

\\

\\、

\、、 \\ \

\\、

ι\kkt

EHL

九一、

2\-fr

、

~JIN\((

之\又~

h1 、-\.

‘、巴\~

刊.、

」丸

,9 8.7.rJ5 答對比率 3 ，__機遇 .2

_"‘

.1 B01 988 11 7 8 q 10 11

=

12 .1 可

題組到 i 一-1--AL 一一

___II1三一一之一一

超級干1句盼皮(

.6.)

圖六前聽班之語文理解圓租費扭轉徵曲線

-14

叫一切

(12)

• 118 •

教育心理學報按照前後段生之語丈理解上的分數，將其分成不同的五個能力組，各組分數範園、累積百分比、人數分配等資料如表九。前後段生各組分數範圈相差較大，前後段受試特徵曲線如國六、圍七。 1.0 3 '、

.

_、、 ‘ 、、

.

、_、、、

\\、\央

...

、

.

、

.

、 ‘

、

。 PJE 祠，也答對比率

.4

日、、、. 』‘-'. (-l、'、.

-"'-".-..‘-

_.

‘..

' . 品，機遇

'.

.

_...

_、、‘ ~

...

-...

...

.2

,1

8.01

•-m組別 I 9.88 15.2

-9

-.-

m

12 周總平均難度 (L~) 後段班定語文理解圍租費誼特徵曲線

n

10 13 14

-FN

團七

從閏六、國七得知，大體上高分組的受試者在各題組上答對比率皆比低分組為高，除了最低分紅以外，其他四組之斜率十分相近，前設班受試特徵曲線第三、第四能力組在第 N 題組客對比率高低羊顛倒現象;而圍七之第三能力組在第 I 題組上的答對比率亦高於第四能力組。不過，整個圓形仍星相當的系統性。四、普通苦苦麵測廳育場計算麵試團軍-能力測量之研究方塊計算類試題受試高低能力分組原則與語文理解類相同。 H 方境計算全體曼誼商幢幢力 5t租車其曼前特徵曲轉依攘 429 位受試方塊計算試題之總分分成五個不同的能力組，分數愈高融為能力愈強，分數愈但則視為能力愈弱。各組之分數範園、累積百分比及人數資料如表十。要+ 全體曼誼芳塊計算高低能力分組資科

組

別|分數範園|人

數|累積百分比

主 41 - 49 82 100 四 _{38 -} ₄₀ 84 80.9 一 35 - 37 79 6

1.

3 一 31 - 34 90 42.9 一一 6 - 30 94 2

1.

9

(13)

全體受試在方塊計算類試題之特徵曲線則如圖八，圍中顯示各能力組曲線之科率除最高能力組稍有不同外，其他大致相同。各能力組受試之平均答對比率隨工作難度之增加而減少。較高能力組在各種工作難度水準之審對比率始終比低能力組高。能力最高一組之曲線，在前三種工作難度水準呈現逐漸下降之趨勢，這與其他四組極為一致。但在難度為13.89 之工作難度時，其曲線走向與其他四組稍有不同，比預期答對之比率稍微高些。大體來說，受試審對機率與系列難度工作間仍墨現相當單調的 (monotonic) 密切關係。 USB

容對比率

.7 IL_. 、、、、.、、、、、、. 、、、 ‘ ‘ _{、、} 、 .6

.

、

.

、、

.

.5 wh 、、_'0、

\\\'.、

、、_、、、、、_、

.

、、

.4

.

、、可麗、、、 ‘ ‘

.

‘ 、、

、、

.3 _機遇

. .

、、 .2 _、.，‘ .1

門別

組題

7.83

10.25

1

1.

83

13.89

• .

• ...

a

...

1

8

9

lO

n

11

_E

2

13 N

題組平均難度 (6) 圖八全體旻誼之7雪場計算圖紐曼富貴特徵曲線尚方塊計算男、女曼~.佳能力分組混其特徵曲線男、女受試在方塊計算類試題之能力分組詳細資料如表十一，資料顯示除第一組分數範園差異較大外，其他各組之分數範圈，男、女受試十分相近。男、女受試在這類試題之特徵曲線如國丸、圍十。實+一方塊計算男、女曼當高低能力分組資料男生 (N

=222)

女生 (N=207)

組別|分數範團|人數|累積百分比組則|分數範圈|人數|累積百分比

五

41

~

47

39

100

五

41

~

49

45

100

四

37

~

40

50

82.4

四

38

~

40

44

79.2

一一]

34

~

36

48

59.9

35

~

37

38

58.0

一

29

~

33

42

38.3

一

31

~

34

45

39.6

一一一

6

~

28

43

19.4

一

13

~

30

37

17.9

(14)

• 120 • 教育心理學報 1ρ

-k

答 ζ之之三三了了一『、、 .9~ 、、、---之三、、、對

.ltβ

司、、、、、4 、寺河

、

主事 .7~、

\、

\ \ \ \ 、‘、\、

M

、、、

、、、、

\ \ \ \

.5 ~、\\'" 、

•

、恥、k 、 .H ‘(~)、 .2 、4 .1 783 10.25 11.83 13.89 ，且 ι ﹒ 7

1

8 9 10

II

11

m

12 日 t4

題組別

I

題組平J~J 如!空 (b.) 國九男生之芳塊計算團組曼質特徵曲線

方塊計算類試題，男、女受試特徵曲線皆曇現明顯系統之關係。兩性特徵曲線除了第四能力組以

外，其他三個能力組之曲線走勢雖乎一致。高能力組在簡單的題目之答對比率聽近於百分之百，郎使

10 。 J8.7

答對比率

。、'_、、

_.

、‘

.

、、

.

、、"_、、

.

、、

.

、、、

.

其、'-、、 _、、 .6 、、、

.

_、‘ 、、 ‘ 、

.

、 .5 、、、鴨、、、 .4 -m 、、

.

、、 ‘ 、 ‘ 、

.

、、 ‘ ‘ 機遇 “、‘革、

.

.3 .2

.

_‘_、、.

_{. .}

-

.、.Jt

J

9寸題組別

mHSI

10.25 11.83 司， 9 -1-1

'

~a ι.呵， 12

E

'

-}3 34

抽」

lN

唔，‘ 10

II

題組平均難度 (À) 團十女生之方讀計算團組受自特徵曲線

(15)

是難的題目組平均答對比率在 .70 左右。能力差的組就是極簡單的題目答對比率也不高，到了第 E 或第四難度題組就更感困難，而到第四題組時更是困難重重了。另外，女生第一能力組在各個試題難度水準之客對比率皆顯著高於男生同一能力組，其他三個能力組則無太大之差別。自芳塊計算前後段頂高低能力分組及其特徵曲線童安+二前後段曼試方塊計算能力分組資科前段 (N

=161)

後段 (N

=268)

組別 i 分數範園|人數 i 累積百分比

組別 i 分數範團|人數|累積百

五

44

~

49

26

100

主的 45

39

100

四

40

~

43

37

83.9

四

36

~

39

60

85.4

一

38

~

39

31

60.9

一

32

~

35

49

63.1

一

35

~

37

38

4

1.

6 -

27

~

31

71

44.8

一一一

13

~

34

29

18.0

一

6

~

26

49

18.3

根據前後段旺方塊計算類試題總分分成不闊的五個能力組，詳細資料如表十二。由表中得知前段受試各組之分數範團均顯著大於後段對應組之受試分數範圈。其特徵曲線如間十→、圍十二。 ω 答對 9 比.8 1_

率、7

f, .5 .4

.3 同空

.2 戶4 7 題組別 4、、、

.

、、_、、、_‘ \ 、、文、

.

川、\(-)、.、

.、色、、、\趴、\ 、_、、可•

•

、、 \ \ 、、_、' 、、

""

7 83

_...

10.25 .

1183

13 89

a

.

‘

...

8

9

10

11

12

13

14 I

E

N

題組平均難度(.ð.) 回+- 前段曼誼之有塊計算團組曼扭轉徵曲線

(16)

• 122 •

to

答對 .9

比 .8

率

.7

.6

.5

.4

3 口里

.2

教育心理學報、、

.

瓜、、 _、‘、、

.

_(司、

‘

、 \

、

‘ ‘

(三ì'.、田、

、、、、、、、

“‘

、、、、 (-)‘﹒‘鴨、 ‘ 、、

‘

、 ‘

.

‘

、、、、、、、、、、、、、‘﹒ 、、

.

、、

.

、、、、、、、

_‘'

、.、、、、

.

、‘.

.

. .

.

‘ "J( .1

1

1-+ 題組別 7

7.83 1025

11.83

13.89 .

s s a "-0

•

• '

B

N

14

1

8

9

10 II

11 E

12

題組平均難度 (A) 圖+二後段曼誼之方塊計算團組受自特徵曲線從圖十→、十二可以看出，前段各能力組受試在各個題組難度水準之答對比率顯著高於後段組，前後陸各能力組受試，除了第一能力組外，其他四組在較易的題組答對比率相差甚微。在圖十一中，第四與第五能力組及第二、第三能力組在第 I 題組之答對比率有交錯現象。在國十二中，第三、第四能力組亦在第 I 題組有顛倒現象。整體來說，前後段各能力組受試特徵曲線具有相當系統闢係的。五、當圖鐘別度與曼說特徵曲線之闢係 (→普通分類測驗語文推理與方塊計算兩類試題之鑑別力指數 (D 值〉分別見表十三、表十四。聖賢+三語文理解自固定撞到指數題號

1

2

3

4

5

6

7

8

9

10 D

值

.04

.24

.33

.36

.10

一 .11

.14

.07

.18

.21

題 _號

31

32

33

34

35

46

47

48

49

50 D

值

.21

.16

.55

.30

.50

.26

.56

.45

.10

.59

題 _號

61

62

63

64

65

76

77

78

79

80 D

值

.41

.4

3 .35

.09

.57

.45

.36

.28

.53

.36

題號

91

92

93

94

95

106

107

108

109

110 D

值

.22

.57

.38

.29

.4

2 .23

.57

.50

.49

.28

題 _號

121

122

123

124

125

136

137

138

139

140 D

值

.27

.39

.38

.4

3 .32

.38

.47

.39

.26

.28

(17)

從表十三知道，語丈理解試題鑑別方指數辜負值的僅有第六題-題。根據 Ebel (1 979) 試題鑑別力評鑑標準，鑑別指數在 .30 以上者可視為優良題目。在這種標車下，語文理解五十個試題中，屬優良題目的共有29題。自表十四知，在五十個方塊計算試題中，有28個試題厲優良試題。安+四方現計算誼眉之鐘別指數題 _號

₂₁

₂₂

₂₃

₂₄

₂₅

₂₆

₂₇

₂₈

₂₉

₃₀

D

值 .的

.10

.16

.14

.13

.07

.20

.16

.17

.25

題 _號

₄₁

₄₂

₄₃

₄₄

₄₅

₅₆

₅₇

₅₈

₅₉

₆₀

D

值

.27

.12

.27

.18

.4

9 .30

.33

.22

.34

題號

71

72

73

74

75

86

87

88

89

90 D

值

_.45

.36

.4

0 .38

.4

8 .26

.50

.49

.48

.42

題 _號

₁₀₁

₁₀₂

₁₀₃

₁₀₄

₁₀₅

₁₁₆

₁₁₇

₁₁₈

₁₁₉

₁₂₀

D

值

.22

.58

.4

9 .50

.53

.26

.43

.31

.56

.19

題號

131

132

133

134

135

146

147

148

149

150 D

值

.26

.4

5

.4

7 .40

.27

.30

.48

.4

8 .39

.23

口語文理解與方塊計算錯別力指數達 .30 以上立話題易難分組從語文理解與方塊計算兩類試題中選出鑑別力指數 .30 以上之優良試題，再依其難度指數大小分量要+五語文理解與方塊計算鐘別指數 .30 以土 ZIitB屬難分組賀科組語 _文 _理 _解 _方 _塊 _計 _算車。題號

|蓋自悶|揖

題號

悟到題數|直想

3

4

34

48

63

9.0

56

57

59

60

71

9.0

主

77

80

95

107

122

15

10.03

72

74

75

87

89

12

10.38 123 124

136

137

138

10.9

103

133

10.9

33

35

47

50

61

11.0

芷

62

65

79

92

108

11

11.59

73

88

90

102

6

11.82

109

12.9

105

147

12.9

一一

13.6

45

104

117

118 119 13.6

E

76

93

125

18.2

3

14.27

18.2

10

13.56

132

134

146

148

149

(18)

• 124 •

教育心理學報組。在改除晶質不良的試題過程中，已經把原歸為第 I 題組之題目剔除(鑑別力均未達 .30 ，見衰四、五、六) ，故在此分組之基準調整如下:凡 A值在 .90...10.9者歸入第 I 組，在 11.0...12.9者列入第 E 組， 13.0以上者歸入第 E 組，詳細分組資料見衰十五。語文理解第 I 、 E 、血題組之平均要在度分

別為10.03 、 1 1. 59和 14.27 ;方塊計算三組試題之平均難度依次為 10.38 、 11.82 與13.56 。上述平均

難度將在繪製受試特徵曲線時作為試題組難度水準之依接。表十五與表六比較發現，表十五第 I 、 E 、 E 組之平均難度指數與表六之 I 、 E 、 E 組之平均難度指數相近。因語文理解與15塊計算鐘到力指數 .30 以上團組受當特徵曲線

兩類試題經保留優良題目之後，其受試特徵曲線如圖十三典圓十四。-mqH-βJ

己也 ι1 ← uhp 少，←曲 ZI 目，一茲-、_‘ 夫

、

、 ‘ 、、、、 .、 ‘ ‘ 、』. 、 \、、(國、. 、

‘

、、、、、、、、

.6

、

.

\ -﹒-一_﹒、

5

也、、、、

.

、

• .

、、

A

.

_‘

. .

.團已‘

J

、

.

擠過

.

‘ ,

2 .

、

.

、一_‘唱

.1

10.03 •-c&

題組別 I

11.59

且

14.27 •---'

15

11 rr

₁₂

題組平均難度 (A)

13

14 m

圖+E 全體受iil:Z語文理解畫冊力指數 .30 以上題組曼扭轉徵曲線雖然語文理解試題第二能力組在第 E 試題組比第三能力組答對比率要高些，但整體而言，語文理解與方塊計算兩類試題之受試特徵與試題難度水草呈現相當有系統的關係'若將國十三與國三之後三組，圖十四與國入之後三組相比較，可發現函數關係極為一致。

六、芳坊1t.1it8攤賣水鐘之因寮

分析造成試題困難之因素，對能力界說、測驗是否測量單一能力、試題編號與實施等皆極寫重要。將 429 位受試方塊計算試題之難度指數依序揖列。由於試題過多，故僅選出逢 5 的倍數順序之擅自共 10題進行試題之邏輯分析，題號及難度指數如表十六。分析表中 10個試題內容，發現前兩個極易的題目係層對稱題型，而其他 8 個皆層不對稽的題型。

(19)

1ρ 答

.9

對

lt

.8

率 J

,

6 ,

5 ,

4 ,

3 i一盤遇

.2

,1

、、、九、.、(二)

、、

、、、

.

、 ‘ \ 、、、、、、、、、、、、、、、、耐刊、

(1

.

d ‘ 、、

.

\

、

-A 、、、、

.

、、

.

、、、 .，..、、、“‘

‘'‘

,

10.38

10

題組別

I

1

1.

82

13.56 m

14 II

12

題組平均難度(.~) 圖+四全體曼誼之育場計算鐘別力指數 .30 以土層組曼誼特徵曲線

11 ...

-13

不對稱題型中的最難三個試題共同的特徵是題目圖形不夠清楚;與其他幾個不對稱圖形相較，方塊之形股也較小。聖賢+六雖度因黨分析之芳塊計算iit周圍攏輿難度指數串題號 44

58

86

56

72

73

102

116

118

120

A 值 I

7.6

8.0

9.4

10.1

10.8

11.4

12.1

13.2

14.0

16.0

〉拉由於測驗內容係屬機密，故不附表中 10個題目之內容，若æ、氛參考時，請向師大教心系洽倍。討論一、曼說特徵曲線在能力測量適用之可能性能力測驗的教度與其施測的策略是目前測驗學者們重視的兩個問題。測驗編製者所宜稱擬測量之能力與能力測驗的構念妓度有密切的關係。若按照前面 Walker 對學一能力的說法及受試特徵曲線之性質，受試特徵曲線應可適用於勘定能力之存在與否;只要對某一受試，或某一能力相近之受試，正確作業之饑率和→系列難度不同之工作間呈現一種有系統的、單調的密切關係，而且高能力組較低能力組在這些不同工作難度上之答對比率為高時，這個工作所欲測量能力就可撞得證賞 (Mosier ， 1941)。本研究中，是使用被學者們(如 Carroll

1982

,

1985) 認為層單一能力的語文理解與方塊計算試題為材料，使用受試特徵曲線加以驗證，結果誼實了兩類測驗題係測量單一能力的。另外，受試特單曲讓不且用在采;民剝拘全瞳受其具有運用夠真值，就是有隨主制~受識(男女或前後段受試)亦可

(20)

• 126 •

教育心理學報使用。從上面結果各個受試特徵曲線知道:語丈理解所要測量的字彙知識;方塊計算所欲測量的空間視覺能力的確是存在的;因為從國三到圖十四皆是現常態肩形系統關係。各個特徵曲線也有極相蝕的斜率，此斜率應可各別視為字彙知識或空間視覺能力之特徵 (Carroll ， 1985) 。從受試特徵曲線斜率之高低能說明這個測驗信度受限制情形，斜率愈大表示測驗的信度受到限制愈小;斜率愈低則表示這個能力測驗之信度受到限制愈大。按照傳統的測驗理論，適度增加良好晶質之試題，測驗信度將會提高，測驗編製者若能了解某類能力測驗，其特徵曲線之斜率，將有助於了解提高信度之限制。二、輛觀測驗慮重說晶質優良的幫團從圖十三、十四知道:語文理解與方塊計算兩頭淘汰約一半的試題之後，受試特徵曲線與原來未

汰除鑑別力指數在 .30 以下題目之受試特徵曲線幾乎完全一致。這說明了少數優良試題-樣能證實欲

沒.tl 量的能力之存在。同時，從汰除不良試題後，受試特徵曲線斜率看來，仍可表現出與未淘汰前能力特徵及信度受限的特性 Q 因此，置放鑑別力指數低的題目於測驗中，非但對能力測量無助益更耗費人力與物力。三、當圖通輯分析，當圖解混過程的7蟬，在鋪盟與改進能力測驗土之重要性測驗很少是純粹某一心理特質之測量，因此一教育工作者如欲適當解釋受試測驗分數，則必須先找出影響作業之因素 (Cronbach ， 1984) 0

Sternberg

(1 981) 也認為試題解決過程之清晰的了解有助於能力特質與其評估 (assessment) 新的領悟。同樣地，語文理解或方塊計算測驗有構念教

度則須先證實語文理解或方塊計算概念具有科學讀概念的意羲 (Green ， 1981) 。試題的邏輯分拼，

試題解決過程的訊息皆有助於了解造成試題難度差異的因素。能力也應該從這個角度來界說，如果能力的界定是根攘造成試題難易之因素，則這種能力測驗之構念放度將獲得保障。 Vernon

(1962)

曾對閱讀理解測驗作過邏輯分析，就發現跌了閱讀理解之外，還有許多解釋受試測驗結果之因素。就以方塊計算類試題為例，如果仔細分析這類試題內容，會發現這類試題表面上有兩個影響試題難度差異之因素一一看不見的方塊個數之多少和方塊的排列是否對稱。看不見的方塊個數愈多試題愈難，但這個因素與對稱因索有安互的作用 CCarro l1，

1985)

，換言之，對稱與不能立見的方塊數是造成方塊計算試題之難度水葷的因素。但根據筆者對10個各種難度題目的分析結果，對稱性和不能立見之方塊的個數並不是決定題目困難的因素，因為大部分對稱性題目儘管不能立見的方塊數很多，其難度仍不高，題目之清晰佐與方塊之排列方式才是最重要的 o 方塊計算試題理論上應該是測量空間視覺的能力

(Spatial visualization

ability) 而這種能力與空間關係 (Spatial relations) 不同，前者屬

於較為復雜，且難度較高的空間能力，後者屬於較簡單、偏於速度性的能力 CPellegrino ，

1982)

由試題分析結果，提醒吾人將來編製方塊計算試題以測量空間視覺能力時，應盡可能將題目印刷清楚，以兔影響受試者親不能立見方塊的能力。至於語文理解試題型態極為單純，試題難度因素不易從試題分析或訪問受試者來了解。就筆者所知，國內尚無對字彙使用次數之研究報告，因此無法像方塊計算試題容易找出試題難度之具體因素。在日常生活中或課本中次數出現愈多的字彙，受試較易了解它的意思，因而能找出其意思相近之字彙。字彙在日常生活中出現的頻率之多寡，以為此類試題難度之一個向度當無問題。是否有其他之參考準攘尚待學者們的研究。四、ii\:M難度分析與受當特徵曲線有助於能力測驗之，實施如何使用最題時間、最少題目找出學生的能力是傳統測驗學者與項目反應理論學者同感興趣的問題。透過試題內容之邏輯分析或是經由與受試者陪談而了解受試對試題之解題過程皆有可能找出造成試題難度差別的因案。有些試題或工作較易找出客觀的因素，有些較為復雜的工作則不易分析。不易分析的工作本身自P 可能潛藏著測量不同能力的線索，同時也不易對所要測量之能力給予蚵確的名稱，

(21)

測驗的舖製者應注意這個問題。根撥一系列之難易題目所繪製之受試特徵曲線的另一個運用是:對於今後能力測驗之實施方式: 供了訊息，如果能找到試題難易的客觀標準'將來可以從那一種難度水電車的題目推測受試可能正確a 答之聲聲率，進→步運用在測驗之實施時將可節省人力物力。結論與被討利用各種方法進行試題分析，以找出造成試題難易之客觀擦著畫，是能力界說所不可缺的。同時是鑑定試題是否測量單一能力之受試特徵曲線基線之根據。單→能力之證實又有助於測驗分數正確1 釋，因此→個良好的能力測驗應該考慮進行試題分析，驗證試題是否測量單一能力。本研究以被學: 們認為較單純的語文理解與方塊計算兩類試題進行試題分析與使用受試特徵曲線驗證其是否測量單『能力。-輯果發現此兩類試題的確測量單一能力;而且單一能力之驗證不因受試段別及性別的影響。| 時也發現汰除鑑別力指數在 .30 以下之題目，並不影響到受試特徵曲線之斜率，也就是不影響到測! 所要測量的能力特徵'這也說明了汰除不良題目，不但不會影響到能力的測量，同時還可節省人力 i 物力。由於本研究係鷹初步探究，選取之材料是以學者們認為較可能測量單一能力的兩類試題，試題f 析也是以較具客觀標準之方塊計算為例，以說明受試者特徵曲線在能力測量方面之用途。今後如能{ 助認知心理學的知識從事試題或工作分析，找出受試作答之工作差異特質，以作為能力界說的基礎則對個人能力能作更正確而合理的測量。吾吾考書目黃堅厚、路君約(民 68) 普通分麵瀾鷗實施芋姆。見師大教育心理熹心理測驗實施手加(第﹒ 冊) 路君約、黃堅厚(民65) 普通分麵測酸。師大教育心理系印製

Aiken

,

L. R.

(1

985).

Psychological testing and measurement

(5th ed.). Boston: Allyn

and Bacon.

Allen

,

M. J.

,

&

Yen

,

W. M.

(1

979).

Introduction to measurement theory.

Monterey

,

Ca: Brooks/Cole.

Anasta訟，

A. (1

982).

Psychological testing

(5th ed.). New York: Macmillan.

Bejar.

1. 1.

(1

985). Speculations on the future of the test design. In S. E. Embretson

(Ed.)

,

Test design

(pp. 279-294). Orlando: Academic press.

Carroll

,

J. B.

(1

983). The difficulty of a test and its factor composition revisited.

Jn H. Wainer

&

S. Messick (Eds.)

,

princiρals

0/

modern

ρsychological

measurement

(pp. 257-282). Hillsdale

,

NJ: Lawrence Erlbaum Associates.

Carroll

,

J. B.

(1

985 ,

April).

N ew perspectives in the anal ys;s

0/

abilities.

Paper

presented at the Buros-Nebraska symposium on Measurement and Testing

,

University of Nebraska

,

Lincon

,

Nebr.

Cattell

,

R. B.

(1

971).

Abilties: Their structure

,

grouth and action.

Boston: Houghton

Mifflin.

Cronbach

,

L. J.

(1

984).

Essentials

0/

Psychological testing

(4th ed.). New York:

Harper

&

Row.

(22)

• 128 •

教育心理學鮮

Ebel

,

R. L.

(1

979).

Essentiasls 01 educational measurement

(3rd ed.) .Englewood Cliffs

,

NJ: Prentice-H

all,

1979.

Egan

,

D. E.

(1

979). Testing based on understanding: Implication from studies & spati

a1

ability.

lntelligence

,

3 ,

1-15.

Green

,

B. F.

(1

98 1).

A primer of Testing.

American Psychologist

,

36 ,

1001-1011.

Lohman

,

D. F.

(1

979).

Spatial ability: lndividual dijlerences in speed and level.

Stanford

,

Ca: Aptitude Research Project

,

School of Education

,

Stanford

Uni-versity.

Mosier

,

C.

I. (1

941). Psychophysics and mental test theory

,

11 ,

The constant process.

Psychological Review

,

48 ,

235-249點

Pellegrino J. W.

(1

982). Process an

a1

ysis of spati

a1

aptitude. In R. J. Sternberg (Ed.)

,

Advances on the

ρ sychology

01 human intelligence

(vol 1). Hillsd

a1

e

,

NJ:

Lawrence E

r1

baum Associates.

Sternberg

,

R. S.

(1

98 1).

Testing and cognitive psychology.

American Psychologist

,

36 ,

1181-1189.

Thurstone

,

L.. L.

(1

938).

Primary mental abilities.

Chicago: University of Chicago

Press.

Vernon

,

P. E.

(1

962). The determinants of reading comprehension.

Educational and

Psychological Measurement

,

22 ,

269-286.

Vernon

,

P. E.

(1

965). Ability factors and environment

a1

in

f1

uences.

American

Psy-chologist

,

20 ,

723-733.

W

a1

ker

,

D. A.

(1

931 ,

1936

,

1940). Answer pattern and score scatter in tests and

exa-minations.

British Journal 01 Psychology

,

22 ,

73-86; 26

,

301-308; 30

,

248-260.

Wilson，缸，

Wood

,

R. ,

&

Giddons

,

R.

D. (1

984).

TESTFACT

(computer program) .

Mooresville

,

IN: Scientific Software.

(23)

Bulletin of Educational Psychology

,

1987

,

20 ,

107-130

Taiwan Normal University

,

Taipei

,

Taiwan

,

China.

ASTUDY ON THE APPLICATION OF THE PERSON

CHARACTERISTIC CURVE TO ABILITY MEASUREMENTS

DER-HSIN FAN

ABSTRACT

The present study was conducted to investigate the capacity of the application

of the item content logic analysis and the person characteristic curve to ability

measurements. A total of

429 seventh and eighth graders served as examinees. The

verbal comprehension test and the block counting test

,

two subtests of the Army

General Classification Test in the Chinese revision

,

were administered to

all

subjects.

The major findings are as follows:

(1)

The degree of difficulty in the block counting test item depends upon the

way in which the figures of blocks are arranged or printed.

(2) The person characteristic curve gives information whether a test measures

a single ability.

(3) The restricted group has no in

f1

uences on the application of the person

characteristic curve.

(4) A few items with high indices of discrimination

(1

arger than .30)

st沮 main

tain the characteristics of a test.

The author suggests that test users and writers should:

(1)

Adopt a variety of methods to find those factors that cause difficulty in test

items with a view to defining exactly the ability which a test is

c1

aimed to

measure.

(2) Make use of the person

characterl到ic