• 沒有找到結果。

測驗的意涵、功能與編輯

第二章 文獻探討

第二節 測驗的意涵、功能與編輯

一、 測驗的意涵

王佩玲(1998)認為透過測驗及觀察等方式,能有系統地收集幼兒身心發展 資料,瞭解幼兒的認知發展情形,並將收集到的資料加以判斷、解釋,以為瞭解 幼兒發展的依據,並作為改善教學、課程的參考。盧美貴(2003)曾在我國 5 歲 幼兒數學基本能力指標建構研究案中提出:未來學者應積極發展評量幼兒能力的 測驗工具,以期透過具體、遊戲及生活化的評量方式,評估幼兒能力現況。這樣 的理念同樣也反映在各國的教育政策中,如美國教育部(U.S Department Of Education)在 2000 年施政計畫中闡釋:幫助所有學生達到挑戰性的學業標準,使 成為負責任的公民,並在此原則下要求各州訂定具有挑戰性的標準與評量;英國 在 1997 年「教育白皮書」、「追求卓越的學校教育」(Excellence in School)以及教 育與就業(Department for Education and Emplooment,DFEE)的 2000 年業務計劃 中均提到全國 4 到 5 歲的幼兒在進入小學一年級時就得進行語言、算數、個人及 社會發展三方面的基本測驗,協助教師瞭解幼兒的學習,讓教師能夠發展符合幼 兒個別需求與能力的教學內容;法國教育改革措施中,也提到自 2001 年起幼稚園 大班及小一進行學習能力測驗,以便及早發現學習障礙兒童。綜合以上可以發現,

以優良的測驗工具來評量幼兒學習成效,訂立學習指標,是當前諸多國家幼兒教 育發展中的新趨勢,也是本研究所要進行的動機之一。

學者普遍將測驗分為廣義及狹義兩種見解,以廣義來說,測驗被視為一種測 量的程序或歷程;就狹義而言,視測驗為測量的工具。Cronbach(1951)認為「測 驗是指經由數字量尺(numerical scales)或固定分類法(fixed categories),以觀 察及描述個人行為的系統化程序」;Walsh 和 Betz(1990)認為「測驗是一種在 控制的情境下,獲得行為樣本(a sample of behavior )」;Mehrens and Lehmann

(1975)指出「測驗是測量的工具」。國內多位學者也提出看法,郭生玉(1990)

認為「測驗是指採用一套標準化刺激,對個人的特質做客觀測量的有系統程式」;

周文欽等人(1995)將測驗定義為「在標準化的情境下,測量個人心理特質的工 具或歷程」,張春興(1999)指出測驗是評量某方面行為的科學工具,如智力測 驗等,此工具多是由問題所組成,且經過標準化而建立其常模、信度和效度(引 自賴保禎,周文欽,林世華,1997,頁 11),綜合上述各家學者的說法,可以發 現測驗的主要特徵與必要條件為標準化的情境。

測驗的標準化(standardization)主要分為兩個層面,第一個層面是測驗編製 程序的標準化,另一個層面則是測驗實施程序標準化,以測驗編製程序的標準化 來說,從確定預測量的特質、編擬試題、分析試題、選擇試題,到分析整份測驗 的信度、效度、及常模的建立都需經過一定的步驟程序;第二個層面需顧及測驗 實施程序的標準化,在施測步驟上,舉凡指導語、時間限制、物理條件和受試者 的身心特質都應力求標準化,測驗計分的方法及測驗結果的解釋原則和方式,都 要遵循一定的方法(賴保禎等,1997)。

也就是說,研究者在編擬幼兒數能力操作測驗之前,須先確定所欲測量的特 質,依據其特質,找尋相關範疇來擬訂、修改題目,完成後選取適當樣本完成預 試,依預試結果再進行「試題分析」,選擇鑑別度佳及難度適中的題目,組合成 一份完整的測驗後,再分析其信度、效度,最後,為瞭解釋測驗結果,還必須建 立常模,才算完成一份客觀的標準化測驗工具。

二、測驗的功能

測驗有許多種不同的功能,諸如可以瞭解各別差異、提供諮商與輔導效能、

提供教學決定、行政決定、或促進研究與發展等多面向的用途(郭玉生,1995;

余民寧,1996;賴保禎、周文欽、林世華,1997;周文欽、歐滄和、許擇基、盧 欽銘、金樹人、範德鑫,1995),綜合上述學者的看法,將測驗的主要功能整理 如下:

(一)瞭解學生個別差異性,發揮評估功能

瞭解人際間的個別差異,將有助於處理有關人的任何事務,尤其在教育輔導 上,更能顯示其價值。教師對學生施以各種測驗,其目的即在評估學生的學習能 力,瞭解學生之間的個別差異現象,以給予最適切的教育或輔導,俾使每個人都 能發揮最大的潛能,並朝自己的理想目標去充分實現。

(二)建立可行教學目標,時時檢核並改進課程

在教育歷程中,新的課程、新的教學方法或教育計畫等,是否值得考慮採行 而付諸實施,常常需要經過教育實驗,收集有關的資料後,才能做決定。在實驗 過程中,常採用測驗做為收集資料的客觀工具,由測驗所得的資料,可提供回饋 作用給教師,據以建立切實可行的教學目標,作為教學活動的方向。教師也能在 教學活動中知道學生學會哪些?哪些尚未學會?是否需要調整或改變教學策略?

教師可詳細分析標準化測驗的結果,獲知自己的教學目標、教學方式的優缺點。

(三)促進研究與發展

當前,各行各業均重視「研究與發展」的研究工作,尤其以人類行為的發展 歷程為甚,從事研究,除了需要嚴謹的理論基礎,也需要有量化的原始資料加以 分析,作為佐證資料,而測驗就是搜集人類行為發展歷程之原始資料的最佳工具。

三、 測驗的編輯

經由一份優良的測驗,能幫助老師蒐集、統整、解釋訊息,藉此診斷學生的 問題、評斷學生的表現,提供回饋予學生、計畫與執行等(余民寧,1995),所 以,在編擬好測驗試題後,經過初步的試題形式審查和客觀審查後,即可以將適 合的優良試題收錄編輯成一份完整的測驗,編輯一份合適且優良的測驗時,學者 普遍提出要能注意以下幾項原則,以發揮測驗最大功效(張明侃,2007;余民寧,

1995)。

(一)測驗要能切合教學目標

測驗的目的在於評估學童是否達成教學目標?是否完成有效的學習?所

以,命題時必須要符合並兼顧各層面的教學目標。

(二)測驗要能符合學童的程度

在評量時,所有的用語、類題、答題方式,須符合兒童的程度,不要讓兒童 因看不懂題目而不會作答。

(三)測驗要能統整學童的學習經驗

除了能切合教學目標、符合學童程度外,最好能讓其運用心智活動,統整過 去經驗及所學。

(四)測驗要具鑑別力

測驗具分辨、篩選、診斷、評鑑的功能,所以應依學童年齡及實際程度,由 易到難規劃各層次試題,使試題難易適中,否則太難或太易都不具意義。此外,

每一類題前要能給予適當的答題說明,避免學生誤解題意,或不知所問,產生了 誤解。

(五)測驗試題要依試題難度排列

整份測驗要將簡單的試題排列在前,困難的試題排列在後,以符合作答的心 理原則,此能吸引受試者的注意力、增進作答的信心和維繫繼續作答的動機,也 能避免浪費時間於前面較困難的試題,而錯失了後面較容易的試題,是目前較常 使用的試題編寫模式。

值得注意的是,幼兒的發展及學習特質與學齡兒童相比,有相當大的不同,

所以在進行測驗時,要優先考慮孩子的發展特質。讓幼兒能在具直接經驗、可促 進概念學習的環境、具統整內容的意義情境中進行測驗,將更有效且可靠(張世 宗,1999)。也就是說,為增進幼兒的理解,所有的用語、類題及答題方式須符 合幼兒的程度,抽象的符號與概念也必須伴隨具體的經驗與活動,最好能以操作 性教具作為仲介將之連結。同時,也要注重試題的趣味性,積極創造一個正向解 決問題的氛圍,讓幼兒在一個有趣輕鬆、溫暖、無焦慮、有充分時間的環境中,

自信、願意嘗試地回答問題,統整過去經驗,發展出解決問題的策略。

四、優良測驗的特徵

測驗學者認為透過一些比較客觀的量化指標,才能做為研究者判定所編擬的 試題是否優良、合宜且具代表性(郭生玉,1990;陳英豪、吳裕益,1991;李金 泉,2007),余民寧(1995)也提出成為一份優良的標準化測驗前,必須先透過 試題分析及測驗的信、效度分析才能使用,茲將詳細步驟分析,整理如下:

(一)試題分析

1、難度指標的分析

難度分析主要是要確定每一個試題的難度為何?最便捷的難度分析公式即是 計算某一試題全體受試者答對的比例,是指測驗試題答對人數佔總人數之百分 比,,其公式如下:

P =

×100%

R

N

(P為試題的答對百分比,R為試題答對人數,N為總人數)

試題的難度與測驗的效率有關,所以選擇難度適當的試題,是構成優良測驗 的必要條件。測驗中通常以 P 代表試題難度,P 值介於 0 到 1 之間,P 值越大,表 示答對的人越多,試題越容易。一般測驗專家建議 P 值為 0.5,也就是難易適中的 試題,能讓試題的鑑別度達到最大。不過實際上,要使每一題難度都接近 0.5 是有 困難的,因此有學者便主張以 0.4 到 0.8 為挑選試題的標準(Chase,1978),Fbel 與 Frisbie(1991)也提出試題的難度的 5 個判別等級,如表 2-2-1。

表 2-2-1 試題難度等級表

難易度(P) 難度等級

P≧0.80 極容易

0.80>P≧0.60 容易

0.60>P≧0.40 難易適中

0.40>P≧0.20 困難

0.20>P 極困難

2、鑑別度指標的分析

鑑別度分析及在計算試題鑑別度指數,此分析乃是將受試者的評量總分,分 成高分組 及低分組 ,高分組是指全體受試者當中分數最高的 27 至 33%,低 分組是指全體受試者當中分數最低的 27 至 33%,依照高低分組通過測驗試題百分 比的差,即為試題鑑別度 D,公式如下:

D= -

試題的鑑別度高低與測驗的信、效度有密切關係,要增進測驗的診斷及預測 效果,就必須要仔細的分析試題鑑別度鑑別度指數是指試題能夠區分答對和答錯 人數的百分比之差異值,差異值越大表示試題鑑別度越佳;差異值越小表示試題 的鑑別度越差。鑑別度 D 值介於-1 到 1 之間,當試題太困難,高分組與低分組 受試者全部答錯,鑑別度可能為 0;相對的,當試題太容易,高分組與低分組受試 者全部答對,鑑別度也可能為 0,因而極端容易或極端困難的題項,其鑑別度指數

試題的鑑別度高低與測驗的信、效度有密切關係,要增進測驗的診斷及預測 效果,就必須要仔細的分析試題鑑別度鑑別度指數是指試題能夠區分答對和答錯 人數的百分比之差異值,差異值越大表示試題鑑別度越佳;差異值越小表示試題 的鑑別度越差。鑑別度 D 值介於-1 到 1 之間,當試題太困難,高分組與低分組 受試者全部答錯,鑑別度可能為 0;相對的,當試題太容易,高分組與低分組受試 者全部答對,鑑別度也可能為 0,因而極端容易或極端困難的題項,其鑑別度指數

相關文件