• 沒有找到結果。

02-總結性評量與形成性評量

N/A
N/A
Protected

Academic year: 2021

Share "02-總結性評量與形成性評量"

Copied!
35
0
0

加載中.... (立即查看全文)

全文

(1)

Chapter 02

形成性評量與總結

性評量

(2)

前言

教師與學生是教育過程中進行互動的主

體,課程、教材是互動的內容

教學與評量則是主要的互動形式(歐滄

和,民91)

評量扮演回饋的功能,用來瞭解學生學

習成果及調整或擬訂教師的教學策略,

以達到最佳的教學效果 (歐滄和,民91)

(3)

前言(cont.)

教學評量想要瞭解學生:

學習前的起點行為在哪裡?

學習中應採取什麼教學策略?

學習時有什麼障礙亟待克服?

學習後是否達成預期的教學目標?

(4)

前言(cont.)

評量為教學的一項後續(follow-up)活動

學生及家長通常不瞭解評量的真正目的

及評量結果所代表的意義,而僅強調其

中所呈現的片面資料,例如成績、排名

錯誤的評量角色可能易客為主,對教學

產生導引作用(washback),亦即所謂

的「考試領導教學」(施玉惠等,民88)

(5)

概念分析

測驗(Testing)

測量(Measurement)

評量(Assessment)

測驗 測量 評量

(6)

測驗(Testing)

 測驗(Testing)的範圍最小、也最明確,其試題皆 有「正確」或「最恰當」的答案,如段考、隨堂 考等。  本質上是一種觀察的工具(歐滄和,民91),用以 衡量受測者的某些行為樣本,進而推論其具有的 心理特質或能力」。  例如:期中考、期末考。  通常測驗的

成績

會被用來當作學生的學習 成就。而實際上對學生而言,成績除了反映學生 的學習成就之外,並無法協助瞭解個人的學習困 難及改善的方向(黃國禎,民93)

(7)

測量(Measurement)

 所謂測量,就是指根據量尺,用數字來描述個 人特質的歷程。  測量在本質上只是一種將事務的特徵加以數量 化的過程,它並不包含質的描述,而且對於獲 得的結果也不做任何的價值判斷。 (歐滄和, 民91)

(8)

評量(Assessment)的定義

 評量(Assessment)的範圍較廣,以測驗、 面談(interview)、專案實作 (project)、檔案 評量(portfolio assessment)等方式,以診斷 學生的能力。  是指從多種角度以多種方法去評估一個人的 知識或能力,以作為教學或輔導效果的証明 及依據。  在使用「評量」這個詞時,除了評估學生的 能力之外,還包括協助學生解決問題。

(9)

評量的目的

 瞭解學生的潛能與學習成就,作為判斷學生 努力的程度。  診斷學生的學習困難與障礙,作為補救教學 及個別輔導的依據。  估量教師教學的效率,提供教師改進教材教 法的參考。  瞭解學生學習進步的情形,觸發學生的學習 興趣。

(10)

Bloom et al. (1981) 對評量的看法

 評量是一種用以確定學生學習水準和教學有效性的 證據的方法。  評量包括了比一般期末考試更多種類的證據。  評量是澄清(clarify)教育的重要目的與教學目標的一 種輔助手段,以及確定學生按這些理想的方式發展 到何種程度的一種過程。  評量作為一種回饋-校正系統,在教學過程的每一步 驟判斷該過程是否有效;如果無效,必須及時採取 什麼變革,以確保過程的有效性。  評量是教育研究與實踐的一種工具,用於查明在達 成某一教育目的時,不同的歷程是否同樣有效。

(11)

其他學者對評量的看法

 評量是運用科學方法和技術,蒐集有關學生 學習行為及其成就的正確資料,再根據教學 目標,就學生學習表現的情形,予以分析、 研究和評斷的一系列工作(簡茂發,民88)  評量係指教師蒐集、綜合、解釋有關學生的 各種資料,以協助教師進行各種「教」與 「學」決定的歷程(李坤崇,1999)

(12)

評量時機

依照教學前、教學中、教學後不同實施

的時間點,可分為:

 安置性評量  形成性評量  診斷性評量  總結性評量

(13)

安置性評量

 決定班級教學的起點  決定是否先行複習舊教材內容  決定選擇何種適當的教材和教法  決定如何將學生分組或安排在特殊班級中學 習。  依據學生的學習表現與需求,評估特殊性向與能 力,提供適切安置。  資賦優異甄選、未足齡兒童提早入學甄選、縮短修 業年限、單科或全科跳級、身心障礙鑑定及教育安 置。

(14)

形成性評量

 不斷提供回饋給學生和教師,使他們得知教學 和學習的成功與失敗。  有助於教師了解學生在哪些方面的學習尚未達 到教學目標所要求的程度。  評量的範圍較小,內容僅限於教學的特定內 容,可能只是一個概念或原則。

(15)

診斷性評量

 目的在診斷學生的困難所在,並針對其困 難,予以必要的補救教學。  診斷性評量是一種更綜合性和精密性的評 量。  學習困難特別嚴重者,需要進一步的去探討 其真正的原因,有時需要使用不同的診斷工 具,或轉嫁尋求專業人員的協助。

(16)

總結性評量

主要在評估本教學單元所列教學目標達

成的程度,以及檢討所用的教學方法是

否適當有效,並且評定學生的學習成

果。

評量的測驗試題所涵蓋的難度範圍較

廣,通常是抽取能代表學習內容的樣本

作為試題,且多為常模參照。

(17)
(18)

評量的方式

 紙筆測驗  學生經由教師依照教學目標、教材內容所編定 的測驗。  實作評量  實作評量是從做中學概念引申出來,藉由直接 的現場觀察與評斷,或間接的從學生的作品去 評量學習成效。  例如:科學實驗、教學解題、寫作、口頭報 告、戲劇、演出、闖關、小書製作

(19)

評量的方式(cont.)

 動態評量  動態評量是師生交互作用的過程,其目的在協助 學生學習。  教師以「測驗-介入-再測驗」的形式,對兒童 的一般認知能力或特定學科領域進行持續性學習 歷程的評量。  卷宗評量 (portfolio assessment)  檔案評量源自於學生自傳文本的概念,其功能透 過檔案歷程的記錄,了解並協助學生的成長。 在有目的的蒐集學生的作品,依作品的品質與進

(20)

網路學習評量系統

 應用於e-Learning 環境中,讓電腦協助教師與學

生進行回饋互動的一個工具。

國內外學者依形成性評量策略所發展出來之e-Learning 輔助教學之工具有:

PsyCAL (Psycology of Computer Assisted Learning)

Self-Assessment自我評量模組

WATA (Web-based Assessment and Test Analysis System)網路評量與試後分析系統

(21)

PsyCAL (Psycology of Computer

Assisted Learning)

 國外學者Buchanan於1998年針對大學心理學 課程所發展。  主要特徵是「重複作答」與「不提供答案」。  Buchanan 指出「重複作答」與「不提供答案」兩 功能結合在一起,能激發學習者反覆的記憶。  當學生作答錯誤時,會有提示性的即時回饋,導引 學生找出正確答案;該策略可讓學生在練習與主動 發覺答案的過程中,獲得更為精熟的學習,進而提

(22)

Self-Assessment

 Gardner, Sheridan & White 在2002 年設計

的網路形成性評量工具。

 具有「重複作答」、「作答完後提供說明資

料」、「發問」與「查詢他人成績」等功能

 透過獲得即時的回饋,以提升學生的學習效

(23)

WATA (Web-based Assessment

and Test Analysis System)

 彰師大生物學系研發,包含總結性評量模組 與形成性評量模組。  總結性評量模組主要用以瞭解網路學習的效 益。  形成性評量具有「三次作答」、「發問功 能」、「過關後查詢成績」、「過關後可查 詢個人學習歷程」與「過關動畫」等設計。

(24)

網路形成性評量在效益上的研究

 PsyCAL 於大學心理學課程研究發現,使用PsyCAL 在

學習效益上明顯高於未使用的學生(Buchanan, 1998)。

 CECIL 的「Self-Assessment」設計對網路學習效益有

顯著的幫助,學生喜歡以此功能輔助自己在網路上進行 學習。( Gardner,Sheridan & White (2002) )

 WATA 系統已實際應用於大學普通生物學的教學及推廣 國中自然生活與科技教學上,發現使用WATA 形成性評 量模組輔助學習,其學習效益越高。  WATA 的「三次作答」、「過關後查詢成績」、「過關 後可查詢個人學習歷程」與「Flash 過關動畫」等設 計,在引發學習者的學習動機上也佔有相當重要的角 色。

(25)

網路形成性評量策略

 重複做答  指定的題庫範圍中亂數隨機選取五題,題序與 選項順序都採亂數排列。  同一試題連續答對三次後,該試題即不再出現 於往後的測驗中。  同一試題無法連續三次答對,而在重複作答期 間發生答錯現象,則該題答對次數的累積將會 歸零重新計算。

(26)

網路形成性評量策略(cont.)

 不提供答案:  學習者送出試卷後,立即給予得分與呈現各個 試題所作答的情況,但不給予正確答案。  即時回饋的功能,由系統主動提供學習者「作 答參考資料」,協助學習者自行找出答案。  發問功能:  提供與教師非同步互動的機會,讓學生可以線 上發問,與教師進行非同步互動。

(27)

網路形成性評量策略(cont.)

(28)

網路形成性評量策略(cont.)

 過關動畫

 藉由此新奇的視覺效果來引發其學習動機,並

(29)

網路形成性評量策略(cont.)

(30)

研究結論

重複做答策略:

 可以使學習者對學習內容更加熟悉,使學 生可以在作題的過程中獲得成就感與警覺 到自己的學習狀況。 

不提供答案策略:

 可以提供機會使學習者更願意去把不了解 的觀念加以澄清,而其中提供「作答參考 說明資料」的設計,學習者表示可以因此 獲得更多的學習機會。

(31)

研究結論(cont.)

查詢成績策略:

 可以讓學習者瞭解他人的學習狀況,促進 同儕間相互觀摩與良性競爭。 

發問功能策略:

 可以提供學習者解決問題的機會外,更可 以讓學習者在發問的過程中,瞭解自己不 懂之處,以及對於與問題相關的觀念更加 熟悉。

(32)

研究結論(cont.)

過關後可查詢個人答題歷程策略:

 可以提供學習者了解其學習狀況外,亦可 使其警覺學習的缺失。 

過關動畫:

 可以使測驗更加生動有趣,也可以激起挑 戰過關與作題的意願。

(33)

結語

 評量不是只看學生的缺點或弱處,而是要找出其學習 優勢。  評量情境的設計應使各種不同能力的學習者都有成功 的機會(應用多元智慧的理念)。  仔細觀察學習者細微的進步,並給予回饋與肯定。  不急著期待每位學生在同一個時間達到相同的學習目 標,也不必期待所有學生在一次的教學中都完成所有 的學習。  評量不一定需要採取個人間的競爭,合作學習的能力

(34)

參考文獻

William & Black(1996)。closing the gap between actual and desired levels of performance, p.543

 邱淵等譯(民78) 教學評量。台北:五南。第一章。【譯自Bloom, B.S., Madaus, G. F. & Hastings, J. T. (1981) Evaluation to improve learning.】  歐滄和(民91)。教育測驗與評量。台北:心理出版社。7-9  李坤崇(民87):人性化、多元化教育評量—從開放教育談起。高雄市政府 公教人力資源發展中心編印,多元教學評量, 91-133。程俊博 (民93)。以多元觀點評量生活科技。生活科技教育月刊,二○○四年 三十七卷 第七期。  李坤崇(1999)。多元化教學評量。台北市:心理出版社。  簡茂發(1999)。多元化評量之理念與方法。教師天地,99 期,11~17 頁。  黃國禎(2004)。線上學習與評量系統的發展趨勢與挑戰。資策會數位學習 技術中心,取自 http://www.elearn.org.tw/eLearn/eNews/eL_Insight_016.htm  王秀玲(2006)。課程理論的先驅:R.W.Tyler《課程與教學的基本原

(35)

林宜臻(2002)。形成性評量在數學學習領域課程設計之應用。台中市政府 教育局國民教育輔導團電子報。No.0003,2002/12/10林宜臻(2002)。讓促成思考過程之形成性評量在數學課堂生根。研習資訊, 19(1),8—16。  徐崇溫(民77)。結構主義與後結構主義。台北:谷風。  張明侃。教學評量與紙筆測驗命題技術探討。2007/05/30 取自 http://www.kuhes.tyc.edu.tw/~head/_private/study/18_test.doc  施玉惠、周中天、陳淑嬌、朱惠美、陳純音、葉錫南 (1999) 《九年一貫英語 科教學與評量模式》第三章,教育部計畫編號881A153  教育部(民90)。國民中小學學生成績評量準則。  王子華、王國華、王瑋龍、黃世傑。不同形成性評量模式對國中生網路學習 之效益評估。科學教育學刊。12 卷,4 期。(出版中)

Buchanan, T. (1998). Using the World Wide Web for formative assessment. Journal of

Educational Technology Systems, 27, 71-79.

 Buchanan, T. (2000). The efficacy of a World-Wide Web mediated formative assessment.

Journal of Computer Assisted Learning, 16, 193-200.

參考文獻

相關文件

複選通過標準:國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外 語文性向測驗成績達平均數正 1.5 個標準差或 PR93

(二) 依【管道一】複選鑑定,數學及自然性向測驗成績兩科均達平均數正 2 個標準 差或 PR97

 為了更進一步的提升與改善本校資訊管理系 的服務品質,我們以統計量化的方式,建立

行為評估:收集護理病歷、身 體檢查、糞便性、實驗室檢查 (大便標本收集)、診斷性檢查 等資料.

一 寫作評講(詩歌) 運用三至五個評講重點賞析同儕創作的詩歌 二 寫作評講(短文) 運用寫作評量表評鑑同儕創作的文章. 三

通過是次觀課與 評課活動,明白 到有需要擬定清 晰、可量度的評 估準則,才能幫 助學生了解是否

The study samples are students’ quiz grades , homework assignments (paper homework and English homework) and six comprehensive examinations.. It’s our hope that these conclusions

Assessment for learning for Enhancing Critical Thinking Skills and