• 沒有找到結果。

本節是介紹試題難度因素的探討,大考中心的指考試題是由闈外命題小組所 完成,再經由顧問審題、闈內高中教師協助審題與試考生試考而定稿。除了闈外 命題小組的命題之外,大考中心的試題來源也從題庫而來,從1994 年開始建置,

1996 年開始使用題庫試題,大考中心逐年增加題庫試題使用的比例。本節將介 紹大考中心穩定試題品質的方式,題庫試題的建置與使用,以及文獻中有關影響 試題難度的因素,並從中尋找符合作為預估指考化學試題難度預估的變項,從而 作為建立試題難度預估模式的基礎。

一、大考中心穩定試題品質的方式

整份試卷的品質,大約可從兩方面來說:一是試題的內容,二是試卷考後相 關數據的結果。試題的內容的向度相當廣泛,包括符合課程綱要、符合測驗目標、

不偏向某一版本教科書、沒有與過去雷同的考古題等質性的資料;試卷考後的相 關數據,則包括試卷的難度(difficulty level,簡稱 P)、鑑別度(discrimination index,

簡稱D)以及各標的成績等量化統計資料。試題的內容與考後相關數據這兩項指 標,是維繫試題品質的重要因素。就大考中心維持整份試卷的穩定與鑑別度的機 制,介紹如下:

試卷的穩定有助於每年篩選成績相近的學生進入大學,鑑別度則有助於區分 高低成就的考生,這兩項數值關係到招收學生素質的良窳,故全世界的考試機構 莫不費盡心思來維持數值的恆定。以全世界比較有名的測驗機構而言,如美國的 ETS、ACT、英國的 AQA、香港的考試局等,維持試題穩定度的方式,不外乎 有兩種:一是正式考試施測的試題須經過預試(pre-test)過程,預試所得的數據 分析結果,可作為修改試題難度與組成整份試卷的參考。這項維持試題難度與鑑 別度的主要機制,因台灣社會對大學入學考試的高度重視,且基於保密之考量,

從未於大考中心的正式考試中實施。另一種方式,則是原始分數經標準化的轉換。

42 

原始分數是考生實得分數,大部分的測驗機構是採標準化的分數,如:國內的國 中基測所採的量尺分數。經由以上的說明,可以知道若要維持每年試題難度相同,

預試與標準化分數轉換是主要的方式,但是目前大考中心皆未能採行。

就大考中心維持試卷穩定與鑑別度的機制,則是藉由下列三個方法來進行:

1.研究用試題測試。大考中心每年都進行題庫計畫或是相關科目的研究計畫。

計畫所研發的試題,有些科目會找全國性的樣本進行測試,測試的試題與 結果,並未用於正式考試中,而是將相關的資訊,提供給計畫成員以及未 來的命題小組作參考。這種做法就掌控試題的穩定度與鑑別度而言,屬於 間接而非直接的作用。

2. 命題小組的命題、修題與組卷過程。大考中心在任一正式的考試命題時,

均提供給命題小組相關資料,明確要求整份試卷中各種難易度、鑑別度試 題的題數以及試卷五標的成績。這些期望的數字,是大考中心根據過去正 式考試結果的分析以及多年研究所得的成果,讓命題小組在命題、修題與 組卷過程中,有所遵循。以 99 指考化學考科來說,簡易題( P 70% ) 希望有3 2 題,中等難度( 70% P 30%  )有20 5 題,難題(P<30%)

有3 2 題。考試的結果不論就難易度或鑑別度的分布,都是相當符合(表 2-4-1)。大考中心係藉由這些人為預估的方式,希望達到控制試題穩定與 鑑別度的效果。不過,命題小組有時並不一定能夠掌握試題的難度,而與 實際考試的結果有所出入。就過去文獻研究指出,這種藉由專家預測控制 難度的方式,仍可能會與考後實際分析所得的難度有些差距,其主要的原 因在於一般試題難度的預估,都是由教授(專家)進行,而實際的測試的 對象則是學生。這種專家與學生的差異,是造成對試題難易掌控上,最難 以預測的變因。

表2-4-1 99 學年度指考化學考科各項指標符合程度

難易度 P 70% 70% P 30%  P<30%

期望題數 3 2 20 5 3 2

實際題數 2 18 4

鑑別度 D 0.5 0.5 D 0.3  D<0.3 期望題數 15 5 10 3 3 1

實際題數 14 6 4

 

3. 入闈協助審題的高中教師與試考生的預估。高中教師是位於第一線的教學 現場,本中心入闈的高中教師皆由各學科中心的校長推薦,具有一定的教 學年資與經驗,對試題難易度的掌握,應有一定的水準。優秀的試考生雖 不一定能掌握試題的難度,但可提供試題正確與否的具體意見。同樣地,

這種方式亦屬於對試題難易主觀判斷,並未有客觀的數據作支持,要對試 題(卷)難度作精準的預測,有相當大不確定因素存在。

以上是大考中心對試題穩定與鑑別度機制的說明,由此機制中可知,大考中 心對於試題難易的控制是由幾乎是由人為所控制,要維持年度之間試卷難度的恆 定具有相當大的挑戰。

二、大考中心題庫的建置與使用

本中心自93 年開始建置題庫,從 93 年到 99 年以「ABO 計畫」為命題流程,

以下介紹ABO 計畫與題庫試題的使用情況。

大考中心在93 年開始發展題庫計畫,當初的政策是維持原有闈外命題流程 外,讓部分試題取自題庫。ABO 命題流程與闈外命題流程的關係如圖 2-4-1,ABO 計畫包括A 計畫命題、B 計畫修題與 O 庫抽題。A 計畫成員包括具有命題經驗 的資深教授與新參與的學科教授,計畫任務是全新命題,結束時完成相當題量,

44  A 計畫

命題

圖2-4-1 題庫與闈外命題流程關係圖:ABO 計畫 闈外命題

題庫命題 O 庫 

組卷

命題小組  命題總幹事 正式 

考試 

其它  測驗  B 計畫 

修題 

並培養新手學科教授的命題經驗;B 計畫則全部以有經驗的學科教授為主,計畫 任務是審修A 計畫的試題,並定題存入 O 庫。每年在學測與指考正式考試半年 前,會由 O 庫抽取適當的題量,提供給闈外命題小組使用(區雅倫等,2007;

區雅倫,2009)。

大考中心建置題庫的目的是為提升試題品質、穩定試題難易度、擴充命題人 才與減輕命題小組負擔,以化學科為例,由表2-4-2 可見,化學科從 95 年到 100 年使用題庫題的題數與占分比例,由95 年的 3 題 12 分,到 100 年的 19 題 70 分,

可謂穩定地成長。從題庫的53 題選擇題試題來看,較難的試題( P 30% )5 題、

中等偏難的試題(30% P 50%  )21 題、中等偏易試題( 50% P 70%  )21 題、簡單的試題(P 70% )6 題。從考後的統計值來看,題庫試題以中等偏難 與中等偏易的試題比例最高,兩者的題數相同;難題與簡單題的題數亦相近。就 使用於正式考試中的題庫試題,其難易分布比例是適當。另外,在這53 題的選 擇題中,鑑別度小於0.30 以下者只有 3 題,可見題庫試題確有不錯的鑑別度(吳 國良,2011)。

表2-4-2 95-100 學年度指考化學考科使用題庫題的題型題數與占分

學年度  題型題數與占分 

總占分* 

題型題數  占分 

95 多選3 題 12 分 12 分 96 單選3 題 9 分 25 分

多選2 題 10 分 非選一大題 6 分

97 單選6 題 18 分 42 分 多選4 題 16 分

非選一大題 8 分

98 單選3 題 9 分 30 分 多選3 題 12 分

非選一大題 9 分

99 單選9 題 27 分 35 分 多選2 題 8 分

100 單選10 題 30 分 70 分 多選8 題 32 分

非選一大題  8 分

滿分為100 分 

 

再以100 年指考各科五標成績來看,各科的均標,除公民與社會的 64 分外,

都在50 分左右,各科前三標的成績均相差不多,就考生成績分布而言,各科差 異不至於太大。所以,就提升試題品質、穩定試題難易度與減輕命題小組負擔三 方面,ABO 計畫已有具體成效。此外,就擴充命題人才而言,以化學科為例,

近幾年參與ABO 計畫的教授共計有 32 人,分別來自 11 所不同的公私立大學,

這些教授藉由參與計畫,逐步累積命題經驗,成為命題人才庫中的一員。

46 

表2-4-3 100 學年度指考各考科成績一覽表

考科  頂標  前標  均標  後標  底標 

國文 71 66 59 50 42

英文 79 69 51 33 23

數學甲 82 71 51 32 20

數學乙 86 75 55 34 22

歷史 77 70 59 48 39

地理 71 66 58 48 40

公民與社會 77 72 64 55 48

物理 83 73 53 34 25

化學 75 66 51 37 29

生物 77 69 58 40 32

 

綜合來說,大考中心從93 年開始建立題庫,95 年開始使用題庫試題。題庫 試題的使用逐年增加,也具有良好的統計數值。

三、影響試題難度的認知因素

影響試題難度的變項有兩大類,一是答題者,另外則是試題本身。就古典測 驗理論而言,同樣一道試題,對不同的答題者,會呈現不同的難度。其中,最明 顯的例子就是專家與生手的區別(Chi, Feltovich, & Glaser, 1981;Chi, Glaser, &

Farr, 1988)。專家有較豐富的知識,而且,其知識是以較有組織的方式建構而成,

在解題過程時,專家不僅會注意到試題表面的特徵,而且也會了解試題的深層意 涵。同一道試題,對專家可能是簡單,但對剛學習的生手而言,可能就是難題。

本中心所舉辦的學測與指考,參與的考生相當多,試題或整卷的難度,是全體考 生的答對比率而言,考生中有屬於專家等級,亦可能包含生手級的考生,如何預 知考生在試題的表現,通常是藉由預試的方式。預試可取得樣本考生對某一試題 的表現情況,並推論母群的表現,藉由預試蒐集考生資料的作法,是較常見而可

行。但本中心的考試涉及較敏感的入學分發,故未採預試的方式蒐集資料。本研 究所著重討論的是試題本身的屬性,如何影響試題的難度。

(一)試題屬性與解題過程

根據Enright, Allen, & King(1993),對試題屬性(item attributes)的定義是 包括題幹屬性(text attributes)、選項屬性(option set attributes)與操作屬性

(processing attributes)。題幹與選項的屬性是指題幹陳述(item text)與選項特 徵的分類,操作的屬性則是指試題的認知要求(cognitive demand)以及試題所 要求的知識層次(level of knowledge)。有關試題解題過程與影響試題難度因素 間的關係如圖一所示。在解題的過程中,首先是要了解題意,接著再進行解題,

(processing attributes)。題幹與選項的屬性是指題幹陳述(item text)與選項特 徵的分類,操作的屬性則是指試題的認知要求(cognitive demand)以及試題所 要求的知識層次(level of knowledge)。有關試題解題過程與影響試題難度因素 間的關係如圖一所示。在解題的過程中,首先是要了解題意,接著再進行解題,