• 沒有找到結果。

傳統教學之教學評量

第五章 傳統教學與網路教學之教學評量

第二節 傳統教學之教學評量

傳統的講述教學法乃是由教學者將教學內容以教材及口述法講述,學生依自 己的程度及專注程度自行吸收,在學習階段結束後,由教學者進行評量,並依學 生程度決定是否修改教學方式及是否進入下一階段。這一個步驟便是教學者所能 接受到的回饋。一般而言,回饋可以來自於兩個方向:一是教學評量的結果,另 一個是教學---學習過程中的觀察反應。例如說:學習者於學習某單元時所花費的 時間、學習的興趣與專注程度。

自從 1940 年 E. L. Thorndike 出版了「心理及社會測量理論」一書,及在 1918

年於其著作中主張「凡存在的東西,必有數量;具有數量的東西,必可測量」後,

評量有關的理論與工具迅速發展(林昭賢,民 80)。事實上,評量有關理論源自 傳統心理測量,其發展脈絡可說是與傳統心理測量理論相通的,「傳統評量理論」

一詞幾乎等於「傳統心理測量理論」。

而傳統的評量(測驗)方式,大都以紙筆測驗為主,挾著其施測的方便性與 較簡明易懂的理論依據等優勢,至今仍是主要的測驗施測方式之一(余民寧,民 86,民 84)。

壹、傳統測驗理論的基本概念

傳統測驗理論(classical test theory,簡稱 CTT)的理論基礎主要是建立在真 實分數模式(true score model)的七個基本假設之下(Allen & Yen,1997;

Gulliksen,1987;Crooker & Algina,1986;Nunnally,1978;Lord & Novick,1968﹚。 分別說明如下:

1. 在傳統測驗理論中,觀察分數與真實分數的函數關係為X=T+E。

其中X代表觀察分數,是受試者在某個測驗上的一個觀察值;T代表真實分數,

是對受試者能力取樣無數次,其結果的平均數或期望值;E代表誤差分數,是觀 察分數與真實分數之間的差距。因此,X=T+E意指任一次,我們所觀察到的 分數,是受試者真實分數與誤差分數的總和。因為傳統測驗理論的主要工作是去 估計測驗中觀察分數與真實分數關聯的強度,所以它有時又稱作「真實分數理論」

(true score theory)。

2. 觀察分數的期望值《亦即母群平均數》等於真實分數,即ε(X) = T。

也就是說,重複對同一受試者實施同一測驗,所得測驗分數分配之平均數等於真 實分數。

3. 誤差分數與真實分數之間的相關為零,即ρET=0。

也就是說,真實分數較高的受試者,其測量誤差沒有比真實分數較低的受試者為 高或低的傾向。

4. 兩個不同測驗的誤差分數是無關的,即ρE1E2=0。

也就是說,如果受試者再測驗一的誤差分數是正的,那麼他在測驗二的誤差分數 並不會因此而有正或負的傾向。

5. 某一測驗的誤差分數與另一測驗的真實分數無關,即ρE1T2=0。

6. 若兩個測驗的T1=T2,σ2E1 =σ2E2,則這兩個測驗稱為「複本測驗」

(parallel tests)。

7. 若兩個測驗具有T1=T2+C12(C12為一常數)的關係,則這兩個測驗稱 為「本質上τ相等測驗」(essentially τ-equivalent tests),τ表示真實分數T。

傳統測驗理論的內涵,便是依據上述七個基本假設而來,傳統測驗理論的主 要目的,便是希望從受試者的觀察分數去推估受試者的真實分數。事實上,每一 種不同的量化考慮層面都有其不同的評量假設,但不論是哪一種假設,基本上,

傳統評量學者都同意下列假設:(1)只要是存在的事物,就可以加以量化;(2)量 化後的訊息較其他的訊息易於溝通且不涉主觀;(3)要提高量化訊息的說服力,

其過程必須加以標準化、一致化(鄭日昌等譯;民 83;洪碧霞,民 81)。

貳、傳統的教學評量

一、傳統教學評量的角色與功能

1. 多元評量的對照基準

首先從傳統評量的定位來看,多元評量、另類評量、或變通評量,基本上都 是現在評量中相當重要的趨勢。有時甚至為了對照的需要,經常把傳統評量定位 在紙筆式的測驗,甚至更窄化到可以電腦化閱卷的選擇題,也就是說大部分是以 選擇題作為多元評量的一個對照基準,所以傳統評量在這角色上扮演得相當不錯

(林世華,民 89)。

2. 錯誤引導教學活動,甚至教學目標

教學基本模式順序是,教學目標先發生,起點行為的測量再發生,再來是教 學活動的發生,最後才是教學評量,所以是目標先發生,評量是根據目標來決定,

所以應是教學目標引導且決定評量,這是學理(林世華,民 89)。不幸的事實是 教學評量卻嚴重影響了教學活動,甚至教學目標,尤其在國內各級學校教學者經 常提出一個問題:「如果你不告訴我要考什麼,我怎麼知道要教什麼?」。

3. 與多元評量之比較

在 Gitomer(1993)的評量模式中,把評量從三個面向來看,這三個面向分 別從評量期間、明確程度及教育目標層次,如圖 5.2-1 所示。