• 沒有找到結果。

注重並增進學童心理歷程能力的生活課程多元評量

N/A
N/A
Protected

Academic year: 2021

Share "注重並增進學童心理歷程能力的生活課程多元評量"

Copied!
30
0
0

加載中.... (立即查看全文)

全文

(1)

注重並增進學童心理歷程能力 的生活課程多元評量

摘 要

近年來許多學者在課堂評量的研究工作上,提出「為了學習而評量」

以及「學習的評量」兩個概念以區分課堂評量的目的。「為了學習而評量」

的觀念關心評量如何協助學生學習;相對地,「學習的評量」重視考核學生 的學習結果或是判斷其能力等級。生活課程的評量包括前述兩類的評量,但 是大部分時候是以「為了學習而評量」為主。但這兩種評量觀念的實施都需 要用到多元的評量工具,這正是國民中小學九年一貫課程所呼籲重視的。

國民中小學九年一貫課程中的生活課程,強調多元評量的實施,然而 在教學現場卻有許多教師,無法掌握多元評量的精神,無法適切地實施多元 評量,甚至抗拒多元評量。本文嘗試以97生活課程綱要為藍本,指出生活課 程以培養學童心理歷程能力為主;並且以教學與評量的系統關係,論述生活 課程多元評量應有的面貌,舉例分析與比較評量題的優劣,且進一步討論生 活課程評量的設計原則,提供教師實施生活課程多元評量的參考,以達成生 活課程的目標。

關鍵詞:為了學習而評量、學習的評量、歷程評量、多元評量、生活課程 吳璧純

國立臺北大㈻師㈾培育㆗心教授

(2)

Abstract

Many researchers proposed the concepts of "assessment for learning" instead of that of "assessment of learning" while conducting classroom assessments. "Assessment for learning" concerns the role of assessment with the improvement of students’ learning; On the contrary, "assessment of learning" emphasizes on the judgment of students’ ability or learning results. Classroom assessments of Life Curriculum include these two kinds of assessments, but most of time, the purpose of assessments is "assessment for learning."

However, both assessments can be carried out in a variety of ways based on students’

explorations and actual performance in order to avoid relying only on pencil-and-paper tests. To use various ways of assessment in classroom of Life Curriculum is accord with the rationale of the "Grades 1-9 Curriculum Guidelines for Elementary and Junior High School Education."

"Grades 1-9 Curriculum Guidelines for Elementary and Junior High School Education" claims that alternative assessments instead of the paper-and-pencil tests should be implemented in the classrooms of the junior high school and of the elementary school. Nevertheless, this task is quite tough for most school teachers. For Life Curriculum teachers, they cannot adopt adequately those alternative assessments because of the following reasons: 1) not fully understanding the themes of Life Curriculum, 2) not knowing the techniques regarding alternative assessments, and 3) the extra teaching-loading owing to the implementation of the alternative assessments. It results in many teachers resist implementing the alternative assessments.

The purposes of present article are analyzing the relationships between instruction and assessment from a systematic perspective based on "2008 Grades 1-9 Curriculum Guidelines for Elementary and Junior High School Education (Life Curriculum)." The aim is to facilitate teachers’ ability to implement alternative assessments and to achieve the goals of Life Curriculum.

Keywords: assessment for learning, assessment of learning, process-based assessment, Life Curriculum, alternative assessment

Assessment for Learning? Assessment of Learning?: Process- based Assessments of Life Curriculum

Pichun Wu

Professor, Center for Teacher Education, National Taipei University

(3)

「傳統上,教師通常使用評量工具來評斷學生的學習成就,這些評量 工具就像磅秤一樣,即使不是同一個,但是只要品質夠好,任一個磅秤或是 評量工具都能量測出一個人的體重或是估測出學生的真實能力。然而,許多 生活課程的課堂評量工具,在於協助學生的學習並發展其能力,是為了增進 學生的學習而評量,它們不像磅秤,因為磅秤只能秤出重量卻無法增加東西 的重量,就像傳統的許多課堂評量一樣,是對學生學習結果所做的評量。評 量的實施如何能量測出學生的心智能力,卻又可以增進學生的心智能力呢?

教師又該如何使用它們?」

壹、前言

「生活課程」是基礎性的、幼小銜接的、非學科知識導向的課程(教 育部,2003a、2008;陳文典與黃茂在,2006),是九年一貫課程中最強調 課程統整的一個區塊(吳璧純,2008)。生活課程強調學童生活能力的培 養,這些能力大多是心理歷程能力而非行為目標能力,是學童透過活動探索 或事物探究的歷程發展來的,不是由老師直接傳輸給學生,也大多不是透過 紙筆書寫所獲得的知識。這些能力獲得之後會表現於真實的生活情境中,而 非記誦知識後於考卷中的作答。

幼兒或是兒童早期階段(3-8歲左右)的學習或是知識建構的特性,是 經驗的、互動的、與具體物操作的(Bredekamp & Rosegrant, 1993),透過 各種媒材與故事來進行想像、遊戲、創作、與角色扮演,透過語言、音 律、數字、圖像與肢體動作等表徵來認識這個世界。兒童在這個時期的發 展是快速的、起伏不定的、週期性的,很容易受到環境的影響(Shepard et al., 1998),而且,每一個孩子的發展速率也不相同(Guddemi, 2003)。

這個時期的兒童,其學習特性與較大的孩子是如此的不同,所以,美國幼 兒教育協會(the National Association for the Education of Young Children, NAEYC)在1987年的立場聲明中就曾提出《0-8歲幼兒教育課程的發展合 宜實務》(Developmentally Appropriate Practice in Early Childhood Programs Serving Children from Birth through Age 8),其中也指出,標準化評量(

(4)

standardized assessment)對3-8歲的孩子是不適宜的,並建議最好是在四年級 之後才開始實施(Bredekamp, 1987、1997);NAEYC的立場聲明進一步主 張:有品質的評量與測量工具是重要的,而有品質的評量必須要吻合兒童的 年齡與階段發展的特性,這些測驗或是評量工具必須是高度重視學生知識或 是技能的真實展現,而非在紙筆測驗上的表現(Guddemi, 2003, 頁275)。

除了兒童發展特性的考量外,生活課程的學習內涵重視能力的培養,

並且關注其養成心理能力的歷程,所以需採用合宜且多樣的評量方式與工具,

即九年一貫課程總綱所強調的多元評量的精神(教育部,2003b)。然而,

採用各種型式的評量方式與工具,並將學生在所有評量上的表現分數,加權 加總後,得到一個學期總成績(黃玉芬,2003),這樣就是在進行多元評量 嗎?事實上,許多教師對於多元評量的實施覺得心虛,覺得不客觀,好像打 的全是印象分數或是鼓勵分數;而有些教師又因為過度重視結果行為或是能 力分數,而讓評量的實施失之偏頗;另外也有教師因為多元評量的技術繁雜,

例如規準的設立以及信效度的問題難以掌握(魏玉姵,2005),而不願採用 多元評量。

許多教師並不知道—評量與教學的關係是什麼?評量與學習的關係又 如何?評量是不是一定要給分數?題目出得好不好?分數打得對不對?哪些 分數要計入,哪些分數不計入學期分數?該不該打進步分數?該不該打能力 以外的分數?分數客不客觀?—最後,大部分的生活課程教師只好方便行事,

仍然以習作、學習單、坊間測驗卷與紙筆定期測驗的實施為主來進行評量工 作(黃玉芬,2003),而失去多元評量或甚至是整體課程進行的意義。本文 的主要目的,在於嘗試以教學與評量關係的系統觀點,以及97生活課程綱要 的精神,整理並探討生活課程多元評量的基本觀念、實施方式以及實施步驟,

以供教師實踐生活課程教學時的參考。

貳、教學評量的目的與類型

一、評量的類型與目的

(5)

評量是教學系統中的重要成分,透過教學與評量結果的相互作用,教 師可以了解自己教學的得失、學生學習的狀況與成效,進而改善教學並提 升學生的學習。評量除了具有這種「回饋」的功用或是目的,另一方面,

也往往被教師當作評斷學生知識或是能力高下的工具,而具有「篩選人才」

的意義。當評量發揮「回饋」的功用時,多半是形成性的評量(formative assessment);而當評量的目的是在評斷學生能力的高下時,教師通常採用 總結性的評量(summative assessment)。課堂內的總結性評量,是在課程 告一段落或是成果完成時,對學生表現做總結式的評量,目的在於確認學 生的學習成就、正式評定學生的成績、評斷教學目標是否達成,是一種回顧 式的評量,關注點是對學生能力與成就提出總結性的憑證(張麗麗,2003,

頁10)。形成性的評量則是指教師所進行的一組技能與活動,在於提供學 生回饋以提升其學習與動機,也讓教師能因此設計符合學生需求的教學(

McMillan, 2007, 頁1)。

此外,受到晚近學習心理學的影響,在「學生是主動組織知識的個 體」以及「教師是學生建構知識的協助者」的觀念架構下,歷程評量(

process-based assessment)因應而生。它強調評量學生的心智建構歷程,

以了解學生如何學習,並促進其心理能力的發展。所以,「教學」是教師嘗 試去「了解」學生建構意義的一項工作,而「學習」是學生不斷建構意義、

調整「理解」的過程。歷程評量常與實作評量(表現評量,performance assessment)結合,用於總結性評量,也可是形成性評量。它若屬於形成 性評量,主要目的都是為了幫助學生學習得更好,而不在評量學生的學習 結果,也就是評量學者最近所主張的「為了學習而評量」(assessment for learning)而不是「學習的評量」(assessment of learning)(Black, et al., 2004)。在「為了學習而評量」的觀點下,「教學」與「評量」這兩個原本 分離的成分合而為一,教學與評量的界線變得模糊了(Leahy, et al., 2005),老 師在課程中所進行的教學活動大都含有評量的成分;而如果是歷程評量,除 了是教師在對學生的心理歷程進行了解,學生對於本身的學習歷程也進行省 思(Torrance & Pryor, 1998)。

(6)

二、教學活動中如何有評量?

教學中有評量、教學與評量的界線模糊了,這樣的說詞很容易讓教師 產生以下的錯誤推理:「因為,教學等於評量;評量等於打分數;所以,老 師一邊教學要一邊打分數;以致於無法做好教學工作。」這樣的推理不但把 教學等同於評量,也隱含著評量一定要給個分數或是能力表現等級。

在形成性評量中,教學與評量雖然大多是在一個教學活動中完成,但 是教學主要是老師依據對學生的了解,引導其學習;而評量則是在引發學生 表現後,觀察其表現水準。所以在一個教學活動中,如果是老師在進行引 導,則是屬於教學,但若是老師檢視學生做觀察、找資料、發表或是表現的 情形,則是在進行評量。例如,在校園植物的探索活動中,老師引導學生對 不同棵樹進行五官的觀察,或是心情的想像,這是在進行教學,但是老師對 學生的觀察與探索的表現、記錄或是口說表現進行觀察或是評閱,這是在進 行評量。老師在教學前,若對學生有較準確的了解,就可能做到較好的引導 教學;透過當場觀察或事後評閱學生的表現,並給予回饋,就有助於學生的 學習。而當場觀察或事後評閱學生的表現,目的不在打分數,是在「看到」

學生好的表現或是有待加強的表現,所以老師也就不必害怕分數打的不準 確、不公平而忙得不可開交。

三、總結性評量與教學

許多當代的評量學者將「為了學習的評量」(assessment for learning),

等同於形成性評量,而將「學習的評量」(assessment of learning)等同於總 結性評量(Arter, 2003; Black, et al., 2004)。總結性的評量其實施程序通常 是在學生某項學習告一段落之後,所以沒有前述教學與評量合為一體的疑 惑,而其分數也都列入學生的學期成績,沒有該不該打分數的問題。面對總 結性評量,比較關鍵的問題是:總結性評量所量測到的學生能力,真的能有 效代表學生的能力嗎?就生活課程而言,如果生活課程的總結性評量沒有測 量到學生的生活能力,那麼這份測驗是沒有效度的,評量的意義就不大了。

這正是目前大多數教師在進行生活課程總結性評量時所遭遇到的問題。

(7)

參、生活課程的特性、教學與評量

一、生活課程教學與評量的特性

生活課程以學生為主體,教師的教學在於拓展學生生活中多面向的意 義(教育部,2008),其典型教學活動的形成與內容可能如下:

「學生下課時間在校園花圃的植物上發現了毛毛蟲,來向老師報 告」,這件事,可以是「春天來了」、「認識校園」、「校園小 動物」、「我的昆蟲朋友」等生活課程的主題內容;而當老師獲 得這個訊息之後,可以順著學生的經驗、好奇和疑惑去探索有關 毛毛蟲的身世、特性,或是以各種音樂或肢體動作形式感受毛毛 蟲與蝴蝶的生活與運動,或者認識何以有這些毛毛蟲的校園故事;

而學生則透過整個探索與探究的過程,學會觀察、紀錄、發表與 溝通等做事情的方法。

一個事件、一個主題,老師圍繞著孩子的經驗與階段發展的特性,來 啟發學童的問題意識、進行事物意義的探究、在生活中自然地學習;不論這 些學習,大人們要把它們劃入「自然與生活科技」、「藝術與人文」、或是

「社會」學習領域,對孩子而言,它們就是「生活」的一部份。這是教師觀 看生活課程的一個重要角度。

另外,對學童而言,生活經驗的意義若不加以拓展,「生活經驗」可 能曇花一現;例如每天上學經過的街道,許多學童走了好幾年,對它「視而 不見」,認為不過也就是街道;或是對它充滿吵雜車多的負面印象。但是,

同樣的經驗,如果教師可以進一步引導學童整理其經驗、探索更多的意義,

例如引導學童觀察社區早餐店都賣些什麼?哪一家生意最好?為什麼?用什 麼方法可以知道?透過孩子有興趣或有關連的生活經驗做進一步的拓展,學 童就可能看到、感受並學習到社區生活的豐富性以及探究事物的方法。

生活課程以學童為主體、以學童生活中經驗到的人、事、物為學習的 對象,老師以特定的主題進行教學,引發學生各種探索、探究與表現的活動。

(8)

在活動表現中,老師引導的部分是「教學」,觀察學生自主地調適歷程並做 表現時,老師就在進行「評量」。例如在毛毛蟲的探究中,老師發現這種毛 毛蟲是「樺斑蝶」的幼蟲,於是,可能會引導學生查資料(在馬利筋這種植 物上的毛毛蟲,會是什麼蝴蝶的幼蟲)、使用相關的繪本,引發學童對蝴蝶 的想像,這些引導是在進行教學,但是學生找完資料的發表或是想像之後使 用畫圖或是肢體動作來表達、描繪感受與進行創作,老師檢視學生的表現,

就是在進行評量。很明顯地,生活課程就是透過教學與評量的活動來協助學 童形成生活能力,而這一連串活動中的評量,多為形成性評量;但是,若要 檢測其生活能力是否達成或達到什麼程度時,就要使用總結性評量。生活能 力的形成需要時間,學生經歷一連串的教學活動、經過一段時間的學習 調適,教師才能以總結性評量去評斷學生生活能力是否達成,老師要判斷 經過哪些活動之後,可以以總結性評量來檢核學生目標能力達成的程度,必 須先知道什麼是生活課程中所指稱的生活能力。

二、生活能力、生活課程能力指標、教學與評量

生活能力指的是什麼?97生活課程綱要中的能力指標有五大生活能力 主軸,分別是「探索與體驗」、「理解與欣賞」、「表現與運用」、「溝通 與合作」、以及「態度與情操」;在各能力主軸下,列有三或五條的能力指 標(教育部,2008,見附錄一)。從能力主軸與指標的內容得知,生活能力 有的是心理歷程能力,例如使用到「探索」、「體驗」、「體會」、「覺 知」、「察覺」、「感受」、「欣賞」、「相信」、「關懷」、「喜歡」等 能力指標所指稱的;有些是知識結果的表徵,如「理解」;有些是行為歷程,

如「練習」、「嘗試」、「養成」;有些則是結果行為的表現,如「運 用」、「表現」、「表達」等。總的來說,它們包括:(1)學習歷程中以 及學習後學生所表現的做事方法、做事的習慣、和做事的態度(包括對自己 與對團體);(2)探究事物後所獲得的知識;(3)能依據道理進行判斷與 做決定。從17條能力指標中可以發現,大多數條目所使用的動詞都是心理或 是行為歷程動詞,例如「探索」、「體驗」、「體會」、「覺知」、「察

(9)

覺」、「相信」、「喜歡」、「練習」、「嘗試」、「養成」,而少有心 理結果能力或結果行為表現的動詞,如「理解」、「說出」、「做好」…

等。教師在教學與評量的規劃上,必須了解這個年紀孩子的學習是從探索、

體驗、感受、察覺後才慢慢形成對事物的理解,並且去區分不同教學活動中 學生生活能力的心理層次,才能協助學生漸進學習與發展生活能力。

事實上,除了生活能力有心理歷程的層次性,每個孩子形成能力的歷 程組型也有個別差異,這是為什麼教師需要更關注個別學童能力如何形成的 情形再給予輔導,以及何以形成性評量通常不宜作為打學期成績的依據。有 些原本在目標能力上就發展的很好的孩子,一個教學活動就展現優秀的目標 能力,而一個該能力原本沒有任何經驗的孩子,經過兩個活動能力後雖然進 步不多,但是卻在下兩個活動結束後,發展出目標能力,另外;有些孩子其 行為的調整是比較內隱的,看不太到其行為調整的軌跡,但是其內在的認知 與調適作用,卻能讓他在一段時間後,有很好的目標能力表現,McTighe &

O’Conner(2005)所提及的不同學生的學習曲線類型,正是以上主張的良好 例證。

通常,一個生活課程的教學活動,可能對應到好幾條能力指標,也可 能同時涵蓋好幾個心理歷程的能力。舉例而言,若以「校園老樹的探訪」為 主題進行教學活動,要達成的能力指標可能有「1-1 以五官知覺探索生活,

察覺事物及環境的特性變化」、「2-1接觸生活中的人、事、物,理解文化、

藝術與自然現象的豐富性」、「1-2透過各種媒材進行探索活動,喚起豐富 的想像力,並體驗學習的樂趣。」、「4-1使用合適的語彙或方式,表達對 人事物的觀察與意見」…。這些能力指標就包括「探索」、「體驗」、「察 覺」、「喜歡」…等心理歷程能力,在這些能力指標下的教學活動,可能會 如下:

教師引導兒童到校園去觀察這(幾)棵老樹,抱一抱、摸一摸、

體會在樹下的感覺、玩一下「一二三木頭人」的遊戲;回教室後,

要學生把觀察到的樹畫下來,而有的小朋友把高高的樹幹塗成紅 色、畫得很矮,於是老師要學生下課時拿著圖去比較自己的圖和

(10)

真的大樹有何不同,樹幹與樹葉長得如何。當孩子完成畫作,老 師說出這(幾)棵校園老樹的故事,它(們)的年紀、是誰種下 了它(們)?它(們)曾經是社區人們乘涼聊天的地方、是小朋 友躲貓貓的地方、建學校的時候,社區的人們與校長如何為了保 留它(們)而規劃校園、它(們)如何看著小朋友進校門到畢業。

在經歷不同事情時,想像老樹會有什麼心情?什麼樣的音樂代表 不同的心情?分組合作以肢體表達老樹的外型。最後,以給老樹 的話與圖來總結對老樹的探索學習。

在這些活動中,教師要達成的教學目標可能包括:「能以五官觀察樹 的外形,並作正確的描述」、「能仔細聆聽校園老樹的故事,並發表自己的 想法」、「能描述圍繞著老樹的人、事、物變化,並想像老樹的心情」、「

能感受不同律動所代表的心情,並在音樂中以肢體律動表現老樹的心情」、

「能以肢體模擬老樹的姿態」、「能發表感謝老樹的心情」。以上所敘述的 教學目標與能力指標的關係如表1所示。

表1 能力指標、教學目標、教學與評量活動示例對照表

能力指標 教學目標 教學 評量

1-1 以五官知覺 探 索 生 活 , 察 覺 事 物 及 環 境 的特性變化

*能以五官觀察樹的外形,

並作正確的描述

◎五官觀察老樹 ◎學生畫樹老師給回饋

1-2透過各種媒 材 進 行 探 索 活 動 , 喚 起 豐 富 的 想 像 力 , 並 體 驗 學 習 的 樂 趣

*能描述圍繞著老樹的人、

事、物變化,並想像老 樹的心情

*能感受不同律動所代表 的心情,並能在音樂節 奏中以肢體律動表現老 樹的心情

*能以肢體模擬老樹的姿 態

◎樹下感受

◎在樹下玩遊戲

◎音樂欣賞 肢體律動

◎學生說出對樹的感覺

◎學生隨著音樂律動

◎學生以肢體表現老樹姿態

2-1接觸生活中 的人、事、物,

理 解 文 化 、 藝 術 與 自 然 現 象 的豐富性

*能描述圍繞著老樹的人、

事、物變化,並想像老 樹的心情

◎老樹的故事

◎老樹與學生的生 活

◎學生說出想像的老樹心情

(11)

能力指標 教學目標 教學 評量 2-2 觀察生活中

人 、 事 、 物 的 變 化 , 覺 知 變 化的可能因素

*能描述圍繞著老樹的人、

事、物變化,並想像老 樹的心情

◎老樹的故事 ◎學生說出生社區老樹從以 前到現在的變化

4-1使用合適的 語 彙 或 方 式 , 表 達 對 人 事 物 的觀察與意見

*能以五官觀察樹的外形,

並作正確的描述

*能仔細聆聽校園老樹的 故事,並發表自己的想 法

*能在音樂節奏中以肢體 律動表現老樹的心情

*能以肢體模擬老樹的姿 態

◎五官觀察老樹

◎玩遊戲

◎聽故事

◎音樂欣賞

◎肢體律動

◎學生畫樹

◎學生說出對樹的感覺

◎學生說出想像的老樹心情

◎學生說出社區老樹從以前 到現在的變化

◎學生隨著音樂律動

◎學生以肢體表現老樹姿態

5-1相信自己只 要 能 真 切 的 觀 察 、 細 心 的 體 會 , 常 可 有 新 奇的發現

*能以五官觀察樹的外形,

並作正確的描述

*能仔細聆聽校園老樹的 故事,並發表自己的想 法

◎五官觀察老樹

◎聽故事

◎學生表達喜歡上課

◎對樹的描述與想像踴躍發 言

5-5 產生愛護生 活 環 境 、 尊 重 他 人 與 關 懷 生 命的情懷

*能發表感謝老樹的心情」 ◎感恩老樹的活動 ◎學生畫對老樹的心情、製 作感恩卡片、認養照顧)

從表1可知,一條能力指標,可以透過好幾個教學目標來達成,而一個 教學目標也可以對應到好幾條能力指標,所以,生活課程的能力指標幾乎不 斷地重複在各個教學活動中;而且特定的教學目標也可能要透過一段時間不 同的教學活動才能達成,例如「能感受不同律動所代表的心情,並能在音樂 節奏中以肢體律動表現老樹的心情」這個教學目標若要達成,首先,學童要 能辨識不同節拍的音樂律動聽起來是怎樣,並以不同的律動組型表達想像的 老樹心情,這件事情對一、二年級的學童而言,是無法透過一次的教學活動 就學會,教師在設計教學時,需要透過不同的主題與素材的探索,重複讓孩 子學習這個目標能力;例如在進行「校園老樹的探訪」的主題之前,老師曾 經以「春天來了」進行節拍律動遊戲,在「校園小昆蟲」的主題教學活動,

讓學童以蝴蝶羽化過程的體會,學習音樂節奏與律動類型的辨識。當學童經 表1 能力指標、教學目標、教學與評量活動示例對照表(續)

(12)

歷幾次教學目標相關的不同活動而逐漸發展出目標能力後,教師才能對學生 進行該教學目標或是能力指標的總結性評量;而在各次的教學活動中,都只 能進行形成性的評量。例如,在前述教學活動中,學童對樹的五官觀察能 力,在學童第一次畫樹時,是一個教師觀察他們五官觀察能力形成的評量點,

老師透過給予回饋並請小朋友拿畫去對照真實的樹,是讓孩子有機會繼續調 整這個能力;接下來,教師評閱學生對自己的畫進行修改與調整,則是第二 個形成性評量的活動。教師若認為透過教學與這兩個形成性評量,學生已經 養成了觀察樹外型特徵的能力,則可以各種型式的表達方式,讓孩子表現對 樹的觀察能力,例如到校園去介紹自己所認識的樹給同學知道;或者也可於 定期考試中出一題考核此項能力的題目,作為評斷其是項能力優劣的依據。

三、生活課程的多元評量

很明顯地,生活課程評量的目的,包括回饋與評斷學生的能力,所以 必然有形成性評量與總結性評量,無論是形成性評量或是總結性評量,評量 的內容應該都是學生的生活能力,可能是內在心理歷程的表達,也可能是某 些行為能力的展現。在生活課程中,大多數的評量活動是形成性評量;形成 性評量與教學活動合而為一,在教學活動中,隨著學童所探討的主題與素材 不同,而有各種類型的評量方式,這些評量方式可以評量學生的課堂表現、

課後表現或是省思。比較常用在課堂表現的評量方式包括小組討論、口頭報 告、操作、觀察記錄、學習單、概念圖、肢體模擬表現、律動表現、繪畫表 現、表演…等等;而課後的評量方式則有札記、檢核表、軼事記錄、習作、

作業單…等等,所以形成性評量的方式是多元的,並不只有紙筆的紀錄或是 測驗,但大部分紙筆測驗的形成性評量,可以用在課堂上,也可用於課後,

例如吹泡泡活動的評量,「用什麼吸管可以吹出較大的泡泡」,習作中的紀 錄表,可以做為課堂實作的提醒重點,也可以作為課後實作操作的檢核。

總結性評量的實施可以在課堂中實施,例如經過數週的美勞創作活動 後,讓學生分組自行製作成品,在課堂中進行成果發表與講評; 但也可以 在特定的時間執行,例如學校的定期考查時段。總結性評量的形式也可以是

(13)

多元的,通常包括展演、口頭報告、書面報告、評定量表、實作評量、檔案 評量、作品…等等,依據學習的目標與素材,而有所選擇。很多時候,紙筆 測驗的形式無法達成總結性評量的目的,例如,聽節奏模擬昆蟲動作的能 力,就無法用紙筆測驗來進行。生活課程的總結性評量也必須允許是多元形 式的。但是,目前,許多學校的生活課程教師,最常使用的還是紙筆測驗(

黃玉芬,2003),不但可能評量形式不適切,也經常沒做好試題編製工作,

於是無法符應生活課程的精神與目標。

四、紙筆測驗形式的評量

(一)評量題目怎麼出?

翻開生活課程的習作、檢視教師上課用的學習單或是定期評量卷,可 以知道,一般生活課程的評量題目,其形式多為勾選題、配合題與畫作 表達。例如,以「春天的樹朋友」做為學童觀察的對象,某版本教科書曾 經用過的習作的題目如下:

春天來了,到校園觀察樹朋友。請選一棵樹把觀察的結果寫下來。

1.觀察的樹朋友名字是:

2.它在校園的哪裡?

3.它的外形:□ 高高的 □ 矮矮的 □ 胖胖的 □ 瘦瘦的

4. 它的身體摸起來:□ 粗粗的 □ 滑滑的

教師之所以採用這樣的評量題作答形式,通常是考量一、二年級學童 使用文字表達想法的能力有限,所以讓他們在有限的答案中選答或是使用繪 圖的方式表達想法。如果這些題目是為了協助學生學習的形成性評量題目,

將這些勾選的選項當作是觀察重點的引導是說的通的,但是,這個觀察重點 的引導卻只著重「知識」,而非「生活能力」;這一點使得這個評量題需要 做某些修正。

(14)

教育學界對於能力與知識的關係有許多的辯證(單文經,2006),這 個問題涉及什麼是「知識」以及「知識的本質」,是知識論與認知心理學所 探討的問題範疇(Goldman, 1986; Toulmin, 1976)。本文的作者認為,個體 是一個認知的有機體,是一個適應生存的功能運作主體,所以「生活能力」

是個體適應生活、解決問題後所發展出來的,其內涵包括「知識」以及「運 作的能力」(Bickhard, 1980)。在生活課程中,知識(即一般所謂的「事 實性知識」或是「訊息」)是透過某項主題的探索或探究,在養成不同層次 能力的過程中伴隨而學來的,這些知識是生活能力的一部份,而非全部的結 果;所以,生活課程如果為了讓學童獲得這些知識,而去進行特定的學習活 動,不但違反生活能力發展的基本歷程,也可能讓生活能力的其他面向,如 做事的方法、態度、思考的方法與價值觀等無法形成,或甚至因為知識的強 力灌輸而破壞了學生的學習胃口。

在上述的題目中,學生觀察校園內的樹木,要學到的「生活能力」如 果是「五官觀察」的能力與「愛護樹木」的情懷,那麼形成性評量的題目,

不但在於觀察對象(校園中的樹)的特性,也在於會不會觀察,用什麼態度 觀察。如果這個題目是形成性評量的一部份,為了協助學生觀察樹木的特徵,

也培養學童觀察與愛護樹木能力的養成,其評量題目應該包括以下的內涵:

(1)用怎樣的方法觀察,可以觀察到什麼?(2)觀察可以怎麼做?(3)

需要注意哪些事項?(4)孩子對所觀察到的樹的感受。前述的題目在這樣 的考量下,或許可以修改如:

春天來了,校園裡有許多樹朋友,讓我們來認識它們。

1.找一棵你喜歡的樹,想一想,你要怎麼認識它?□ 用看的 □ 用聽的 □ 用摸的 □ 其他方法 2. 仔細看看—

(1)這棵樹的外形是 □ 高高的 □ 矮矮的 □ 胖胖的 □ 瘦瘦的 □ 其它

(15)

(2)這棵樹的身體 □ 直直的 □ 彎彎的 □ 凹凸不平的 □ 其他

3. 摸摸看,

(1)它的身體是:□ 粗粗的 □ 滑滑的 □ 刺刺的 □ 其它

(2)摸樹時要注意哪些事?

4.你還知道哪些有關這棵樹的事?

你是用什麼方式知道的?

5.(1)你知道別人都怎麼稱呼這棵樹的?

□ 知道 樹名是:

□ 不知道 調查到的樹名是:

(2)你如何稱呼這棵樹朋友?給他取的名字是:

為什麼取這個名字?

6.根據你的觀察,畫一畫你的樹朋友。

很顯然地,要評量學生的生活能力,通常需要評量學生探究事物、解 決問題的方法,或是其思考的歷程、想法及理由。像五官觀察能力的養成,

在形成性評量中,引導學童如何觀察以及觀察什麼都可以是評量題目的 內容,而題目需要留有空間讓學生寫出其自己的經驗與理由。例如以上的 題目選項中都加了「其他」一項,因為某些孩子觀察到的樹與大人的角度不 同,如果他觀察到的並非選項中的答案可以描述,例如有關樹的外形,他觀 察的樹可能是平面或是立體的角度,是三角形或是圓柱形的,所以要有「其 他的」這個選項讓學生填寫,讓老師了解學生的想法。

至於總結性評量,因為代表某個生活能力的養成,其評量題目需要給 學童更多組織知識與表現解決問題能力的空間,但是許多學校卻也還是以封 閉性的題型考學生記誦能力以及零碎事實性知識的理解力或是記憶力。

例如,某校某次生活課程定期評量的幾個題目:

(16)

單選題—

( )哪一種米的顏色最黃?

(1)糙米(2)胚芽米(3)白米(4)糯米。

( )門後面的門擋是利用什麼原理做成的?

(1)磁力(2)風力(3)水力(4)彈力

( )看到同學有好的表現,應該怎麼做?

(1)羨慕他(2)討厭他(3)向他學習(4)忌妒他。

這些題目,有的純粹考知識結果,不知道學生是靠機械記憶而會作答,還 是真正理解了才作答;而有些題目考了學生做事的方法與程序,但是這樣的 考題,還是有可能只考學生的記誦能力而非生活能力,而且每個答案都可能 有選的理由,也都有不能選的理由,要看事情發生的情境脈絡與所存在的條 件。例如,「看到同學有好的表現,應該怎麼做?(1)羨慕他(2)討厭他

(3)向他學習(4)忌妒他。」這一題的答案,可以是羨慕他,因為覺得他 能力很好;可以是討厭他,因為他很自大;可以是向他學習,因為會得到稱 讚;可以是忌妒他,因為想要贏過他,自己會更努力。老師所假定很簡單的 一個現象,因為學生的經驗與所設定的情境條件不同,可以有各種理由選擇 不同的答案。真實生活是各種因素交錯的,所以生活課程是要讓孩子練習在 生活情境的不同條件限制中,考慮該事情如何做的道理,而不是「強迫」他 選擇一個「四平八穩」的「有道德」的答案。如果使用強迫選擇的方式,最 後學童學到的是「應付」考試的作答,而非解決問題、過好生活的能力。總 結性的紙筆測驗應該避免只考事實性知識的題目,而是要讓學生在模擬的或 是真實情境中做決定、表現其生活能力,它們應該是實作評量。

(二)實作評量的題目怎麼出?

什麼是「實作評量」?二十世紀後期的實作評量,其基本訴求在於重 視學生是否能將他們的知識、技能與對事物的理解應用在重要的、真實生 活世界的情境中。雖然學者對實作評量所下的定義與所勾勒出的特質或用 詞不盡相同,但至少都具備三個重要內涵:(1)讓學生進行建構式反應(

(17)

constructed-response)的非選擇題反應評量,(2)透過「真實情境」的模擬 或提供,直接測量學生的能力表現,(3)評量學生的複雜心智能力,即所 謂的高層認知能力,包括思考歷程、思考推理能力、情意、技能以及後設認 知。

生活課程的實作評量在出題時,也需要考量以上的基本內涵,只是一、二 年級的學童因為對許多事情的經驗仍然有限,要妥善處理評量高層次思考能 力的份量。在教育實務界,已經有許多教師嘗試以實作評量題來取代傳統考 事實性知識或純粹靠記誦的題目;其評量題的特徵是以真實生活情境為問題 背景,以下是某縣市輔導團所發展過的評量試題:

◎小華家在元旦之前搬了新家,他們從鄉下搬到了大都市,全家人都非 常開心…

◎小朋友,想一想,小華的新家可能是…5%

1.石板屋 2.透天厝 3.三合院 4.茅草屋 5.高樓大廈 答:【 】(寫號碼)

◎這天一早醒來,小華在新家聽到了好多的聲音,覺得有點吵,小朋 友你幫小華做一下聲音的分類吧!

1.垃圾車 2.狗叫聲 3.打雷聲 4.鬧鐘 5.電視聲 6.水龍頭流水聲 答:(寫號碼)6%

動物發出的【 】大自然現象的【 】人為所製造的【 】

◎小華和家人要好好的打掃新家,他們需要哪些好幫手呢?幫小華選一選. 5%

1.冰箱 2.抹布 3.吸塵器 4.拖把 5.吹風機 答:【 】(寫號碼)

在這份評量卷中,任課教師將試題情境生活化,已比純粹描述事實性 知識的測驗試題優良;然而,這樣是否是實作評量的試題,則還有些差距。

實作評量的題目必須是讓學生有自己建構知識的空間,不能只讓學生從有限 的答案中選取,而且需要考到推理或是思考歷程,所以不宜採用封閉的選擇

(18)

式試題。老師要考慮的是,這個評量題目要的目標能力是什麼,在這個基礎 上加入情境與開放組織知識的空間,例如以上三題的題目都可以加入「其他 的」選項,並問學生選擇該選項的理由。實作評量,並非只是將生活情境搭 上老師要考的知識內容,而是要將學生如何解決問題的脈絡引發出來,讓學 生在其脈絡下思考與行動,所以,前述有關打掃的第三個問題,如果孩子不 知道要做哪些打掃工作,又怎麼能知道要選擇哪些工具?因此,這個題目不 但開放性不足,題目的情境界定也不夠清楚。建議修改成:

1.小華和家人要好好的打掃新家,要做些什麼事,才能把家裡整理乾淨?

(想兩樣你會做的事)

2.要做這兩樣事,需要用到哪些工具?

1.除濕機 2.抹布 3.吸塵器 4.拖把 5.吹風機

6.掃把 7.畚箕 8.水桶 9.其他

實作評量並不是不能考事實性的知識,如果試題是題組,其中有些題 目純考知識,也就有它的道理,因為知識是能力的一部分,但是題組中應該 有題目讓學生展現能力。以第一題都市房子類型的評量題而言,評量目標若 是「學生能否察覺都市與鄉下房子的不同」的生活能力,除了勾選都市房屋 的類型外(事實知識性的題目),應該有題目是讓孩子說出在都市的房子與 在鄉下的房子可以從事的活動有哪些?有什麼不同?各有什麼好處?例如,

題目可能如下:

小華家在兩年前從鄉下搬到了大都市,全家人都非常開心;鄉下的房 子還住著阿公與阿嬤,小華家寒暑假都會回去看阿公與阿嬤。

◎小朋友,想一想,小華在都市的家可能是:

1.石板屋 2.透天厝 3.三合院 4.茅草屋 5.高樓大廈 6.其他 答:【 】(寫號碼)為什麼?

2.小華若想玩跳房子的遊戲,他會在什麼時候玩呢?

你這樣想的理由是?

(19)

當然,開放學生建構組織知識的情形是程度性,而非絕對性的;對一 年級的學童來說,其作答的題目,答題線索應該較多,而文字書寫的負擔應 該較小,對二年級學童的總結性定期評量的題目,則讓學童填答自己想法的 空間應該更大。

能力是多面向交織的,是在特定目的下的表現,所以生活課程的評量 無論是形成性或是總結性的評量,應該採用注重心理歷程與學生能力表現的 實作評量或是真實評量。除了紙筆式的評量,其它形式的評量也應該就學生 的能力表現做回饋。對一、二年級的學童來說,日記與學習札記特別能給予 學童組織知識的空間,並常能看出兒童的特性、觀察學習與自我反省的歷程。

例如:海洋探索的肢體律動教學活動進行的期間(吳璧純等人,2009),讓 學生每一週寫一次學習札記,學童可能寫到觀察與省思的意見(如圖1與 圖2);或是在孩子分組討論時,讓孩子事後記錄其討論情形,書寫的內容 就可能包括衝突點與解決事情的過程與方法(如表2)。

圖1 學生學習札記例一

圖2 學生學習札記例二

(20)

表2 教師整理過的小組上課心情記錄

組別 喜 怒 哀 樂

海參 (4)我們有分工合 作 還 開 開 心 心 的 寫 心智圖。

(6)上心智圖很好 玩。

(7)我覺得畫心智 圖 很 開 心 又 好 玩 又 煩惱。

(13)我看到我們海 參組都很分工合作。

我 很 開 心 , 因 為 這 樣動作比較快。

(15)我們都互相幫 忙 , 不 會 有 人 沒 做 事 情 , 不 會 只 有 我 做。

(31)我 的 心 情 開 朗。結果就爭吵了,

我 們 海 參 組 的 事 情 是 這 樣 的 , 有 人 不 參 加 討 論 , 結 果 不 參加的人就參加。

(4)寫心智圖時,

子 洋 的 腳 一 直 用 我 多次,我就換位子。

(7)我不喜歡我們 在畫心智圖的時候,

有 人 來 打 ㄇ ㄠˇ ( 擾)我們的討論。

(13)有些人不加入 討 論 , 因 為 他 們 在 玩,我很生氣。

(15)完全沒有。

(31)XX不參加,

然後呢就參加了呢。

(4)X X 他 不 能 參 加 , 我很傷心,我 就讓他參加。

(7)我不喜歡別組 有 人 來 偷 看 我 的 答 案,就等於抄。

(13)我們這組有些 人 在 玩 , 沒 有 分 工 合 作 , 因 為 會 趕 不 上進度。

(15)有人都不幫忙 我們想看看

(31)XX一直用我 啦 ! 他 用 我 的 事 情 是 這 樣 的 , 他 一 直 拉呀拉。

(4)我們在寫心智 圖 , 老 師 要 我 們 安 靜 , 不 然 會 吵 到 別 班同學,我有做到。

(7)我喜歡跟海參 組一起討論

(13)我們這組有些 人 在 玩 , 可 是 海 參 組 還 是 很 努 力 喔 ! 雖 然 有 些 人 在 玩 , 可 是 其 他 人 還 是 好 努力喔!

(15)我們一起把海 參 的 故 事 寫 完 了 , 讓我很快樂。

(31)我們海參組很 開心,因為一直笑

*(號碼)是學生座號

圖1與圖2是學生一週的上課心得札記,在札記中,孩子不但寫出觀察 到別人的學習,也反思了自己的學習;表二則是上課的喜怒哀樂心情記錄,

孩子能察覺自己的進步,也發現自己的問題,這些反應與表現記錄,讓老師 能進一步去輔助學生的成長與學習。

(三)誰來評量?

許 多 評 量 學 者 提 倡 在 形 成 性 評 量 中 , 讓 學 生 自 評 或 是 同 儕 互 評 ( Wiggins, 1997)。生活課程的多元評量如果是形成性評量,評量者可以是老 師、家長,也可以是學生。

為了協助學生學習,教師給予的評量回饋,必須做到以下四點:(1)

(21)

及時性,(2)特定的,(3)對學生而言是可理解的,以及(4)造成並允 許學生自我調整(Wiggins, 1998)。在教學現場,教師常以分數等第給予學 生回饋,例如使用「甲乙丙丁」或是「100級分」的評分系統,學生透過老 師打的等第知道自己表現的好不好。然而,研究顯示:教師使用分數等第給 予學生學習的回饋,對其學習的協助並不大(Black, et al., 2004),學生會 變成拿到作業或是評量卷只看老師給的分數等第,而不在乎學得如何,如錯 誤是什麼?要改進什麼?即使是分數等第加上評語的回饋,學生都可能只看 等第不讀評語(Black, et al., 2004)。學者建議,教師所給的有品質的評量 回饋,應該做到以下三點:(1)無論是書寫的或是口頭的提問,都要鼓勵 學生發展並顯現出對所學的重點有所瞭解,(2)給的評語要能指認出學生 表現好的地方或是有待改進的地方,並且給予改進的引導,(3)規劃教學 活動時,讓學生在學習過程中對你的評語有回應的機會(Black, et al., 2004,頁 14)。在生活課程中,如果是形成性評量,對大多數同學的書寫作業,教師 不必給分數或是打等第,可以以某個記號(如打大勾)註記評閱,而針對寫 得很好的同學給予具體讚美,需要改進的同學,指出其應該改進的地方。如 果形成性評量是非紙筆形式的,教師則透過教學活動給予口頭回饋即可。

至於家長參與評量的部分,在目前國民小學的文化氛圍中,老師會邀 請家長透過作業督導來協助學生學習。在生活課程中,各種形成性的評量,

若當作回家作業,家長就可以透過訂正、評定或是檢核,來幫助學生了解他 的學習狀況。例如,在學生生活習慣的養成上,如果學習目標是希望學生養 成每天做一件家事的習慣,那麼可以用檢核表以及評定量表評量學生每天是 否做到,是經過提醒做到還是主動做到?做的程度是佳還是尚可,還是還要 加油?等執行一段時間後,還可以設計一些題目讓學生反思自己進步的情形,

而家長可以幫助督導。

另外,有關學生自評的部分,理論上,當學生進行自評工作時,他可 以有機會更清楚知道學習的目標是什麼、更能自主學習、能喚起學生對學習 進行更多的思考(Black, et al., 2004; Leahy, et al., 2005)。對於一、二年級 的學生而言,老師除了以學童可以了解的語言說明評量的規準(rubrics),也

(22)

可以使用學童可以明瞭或是有興趣的符號,來表示對自己學習情形的評量,

例如使用紅、黃、綠燈表示理解的程度,以笑臉或哭臉表示學得好不好的程 度。然而,對於一、二年級的學生而言,即使老師提供了評量規準,學生往 往無法聚焦在學習目標並使用這些評量規準,例如:在發表對春天的感受時,

「能清楚地表達自己的意見」這個規準,許多學童無法掌握其意義,他們可 能不會使用合宜的語彙,也可能不瞭解「清楚地表達」的意思,這項自評的 工作對他們來說太難了。根據認知心理學的研究,人類認知的特性是:要找 出別人的錯處,比找出自己的錯處容易;而寫作或是閱讀心理學的文獻也指 出:在閱讀別人的文章時比閱讀自己的文章更能正確地找出錯字或是語詞不 適當的地方(Bartlett, 1982)。所以,同儕互評通常比學生自評更能有效幫 助學生學習。在評量別人時,學生更能理解評量基準;也因為同儕之間認知 發展的程度差距較少,容易把所想的與同儕溝通,也就較能產生Vygotsky所 謂的鷹架作用(scaffolding)的效果。

當然,無論是自評或是互評都是要一段時間的學習,才能發揮評量的 效用。在互評中,學生給的評語一開始可能是不貼切的,例如在前述二年級 的海洋探索課程中,老師讓學生互評學習單,並引導學童寫一個讚美、一個 建議來評量別人的作業(吳璧純等人,2009)。有一位學生在稱讚的點上寫:

「他的畫很好笑」,在建議的點上寫:「畫的有一點怪怪的」;另一位小朋 友在稱讚的點上寫:「你好厲害喔」,在建議的點上寫:「我好喜歡鯊魚」

(圖3)。這兩位小朋友對於如何給同學的作品稱讚與建議,還沒有很清楚 的概念,老師可以在公開觀摩的回饋場合中(圖4),針對尚待改進的互評 說詞,進一步加以指導。

圖3 學生互評的表現

(23)

無論誰來評量學生的表現,學生若能事先明瞭學習目標、表現標準或 是評量規準(rubrics),就有助於其學習。理論上,教師所進行的每一個教 學與評量活動,都應該先設立表現標準或評量規準,若這些目標與規準的內 容是學生可以理解的,則應該在學習活動之前讓學生了解,這樣學生可以透 過學習監控的歷程,更知道自己現在學得怎麼樣,該往哪裡調整自己的學習。

肆、評量規準與教學及評量的關係

所謂評量規準是一種教學與學習表現的導引,評估學生在某種能力 範圍的表現等級,是由教師或是評量者所發展出來的描述性的評分依據(

scheme),做為指標來對學生努力的成品或過程做分析(Brookhart, 1999)。

教師在進行實作評量時,常以評量規準來進行對學生工作表現的評分。評量 規準所採用的品質等級可以是3、4、或5等,例如五等級的評量規準「很有 道理、有道理、稍有道理、沒有道理、答非所問」或是三等級的「優良、滿 意、待改進」。

評量規準可以分成分析型的(analytic)與整體型(holistic)的規準,

也可以分成一般型(general)與作業特定型(task specific)(Moskal, 2000)的規 準。所謂分析型的規準是一次可以評兩個以上的個別向度,例如表3所示三 等級的分析型評量規準,可以用在教學目標是學生能夠以肢體表達一種海洋 生物的特性;分析型的規準類似檢核表,允許對每一個向度做分別的評分)

Moskal, 2000)。

圖4 學生互相觀摩作品並觀摩如何互評

(24)

表3 分析型規準羅列表格

評語

向度 優良 滿意 待改進

表達態度 內容清楚性 合理性

若評量規準只是針對一個總體的表現作評等,就稱做是整體型的評量 規準。在整體型評量規準的系統中,雖然某項能力或許可以分成不同的表現 成分,但是卻以學生的整體能力表現來評為:「優秀、精熟、尚可、不滿意」

(Perlman, 2003),或是「很有道理、有道理、稍有道理、沒有道理、答非 所問」,但教師可能在每個等級下羅列一些表現特徵,供評等參考。

評量基準也可以依應用到特定作業或是應用到許多不同作業,而分成 特定作業規準與一般性規準。通常可以應用到許多不同作業的一般性評量規 準是比較受到教師歡迎的,例如針對不同的學習表現項目,老師都使用「優 越、良好、尚可、… 」,這種一般性的規準,老師不用經常修訂基準內容,

只要掌握住或是告知學生教學目標後,便能採用此評量基準,進行教學。

總的來說,評量規準的設立,不僅與總結性評量的評分有關,也與教 學及形成性評量有關。如果老師在教學活動進行之前,心目中就有這些規 準,較能準確地觀察學生學習與能力發展的情形,而能協助學生往教學目標 發展。當然,評量規準也是可以隨著學生的學習狀況而調整與改變,如果事 先訂定的評量規準,學生很難達成,老師不但要更改評量規準的設立,也要 進一步改變教學活動的內容。過去大部分教師並沒有評量規準設立的概念,

即便是使用實作評量或是真實評量,也是在批閱學生的評量題時才逐步發展 評量規準,然而,任何教學活動之前都可以先訂定評量規準,而在真正進行 評量時,可以隨著全班的表現水準再去調動評量基準。Goodrich(1997)曾 指出,評量規準的使用有以下的好處:(1)是教學與評量的有效工具,幫 助學生改進並監控學習表現;(2)能幫助學生較深入判斷自己與其他同學 工作表現的品質;(3)減少老師花在評閱學生作業的時間;(4)可以適用

(25)

在學生歧異性很高的班級;(5)很容易使用以及解釋(頁14-15)。

老師們或許會覺得制訂評量規準很麻煩,特別是初任教師可能因為很 難掌握學生的表現水準而不知如何制訂,建議老師們可以採漸進的方式,例 如在一個單元中,先針對比較能掌握的活動建立規準、進行教學、評量、調 整規準,之後上到相同的單元時,再一一建立尚未建立的規準;先練習並採 用一般性的規準,比較容易有成就感。然而,老師跟學生互動經驗多了,評 量基準的建立不會是一件困難的事;但是,要留意的是:在形成性評量的教 學活動中,評量規準主要是協助教師檢視學生的學習狀況,或是更敏感於影 響學生表現的原因,並不是依此去判定學生的能力高下。

伍、學期成績的評定

學生的學期成績代表他這一學期的學習結果與成就;學習分數的高低,

可以代表其能力的高下或是優劣,所以,學期分數應該來自總結性評量的結 果(這裡的總結性評量不是只指定期成績考察),而非來自形成性評量的紀 錄,但是總結性評量是評絕對能力還是相對能力,在生活課程中是很重要的 關注點。換句話說,學生的能力是跟某個標準比、跟自己相比、還是跟別人 比呢?生活課程是屬於國民小學的基礎性課程,是在協助學童能力的養成,

而所謂的能力大部分時候都是跟某個教學目標能力相比或是跟自己原本的能 力比,其評量的類型是屬於效標標參照測驗,或是進步分數。換句話說,生 活課程學期成績並不在評定學生之間能力的相對高下。如果在基礎能力的學 習上,一開始即採用常模參照測驗的精神,會增加學生之間相互競爭的氣氛,

也可能破壞學生學習的胃口。評量學者Stiggins(2005,頁199)曾說:「只 有幫助學生自己想要學習,老師才算成功。」;相同地,Marzano(1992,

頁17)曾提出以下三個條件存在時,學生更可能努力用功:(1)清楚的作 業要求—包括清楚地了解學習目標以及知道老師要如何評量他;(2)相關 性—評量與目標是有意義的,且值得學習;(3)有潛力成功—當他們相信 自己可以學習成功並且達成評量的期望。因此,在生活課程中,教師除了評 量學生獲得的生活能力,也可以評量非學業的因素(nonacademic factors),

(26)

以激勵學生的學習動機,例如學生的責任感或是學習態度對於學生的學習來 說,與能力的養成一樣重要,老師可以將學生努力的程度或是責任心當作學 期成績的部分內涵,例如以作業繳交的情形、投入上課學習的態度與認真做 作業的程度,佔10%的學期總分數的比例;或是,因為在生活課程中,生活 的態度與習慣都是生活能力的一部份,所以教學目標與評量規準中也可以加 入這些向度,做為學生成績的一部份。總之,在評定學生的學期成績時,「

為了增進學習而評量」這個評量功能,不能因為「學習結果的評量」而被犧 牲掉。

陸、生活課程多元評量教學設計的步驟

從生活課程的精神與特色、從教學與評量的系統觀點可知,生活課程 的評量設計無法單獨於課程活動設計之外,教師最好在一開始規劃課程時,

就一併考慮教學與評量的活動。建議的規劃步驟如下:(1)發展教學方案,

(2)掌握教學目標,(3)教學與評量活動一起思考,(4)建構評量項目 與規準草案,(5)建構評量工具,(6)實施教學與評量,(7)評閱,(

8)修改教學活動與評量,(9)設計總結性實作評量卷,(10)採用其他總 結性評量形式,如作品、報告、演戲、檔案評量等。即使教師使用現成的教 科書來進行教學,都應該根據生活課程中學生經驗與發展特性的考量,修改 或轉化教科書中的活動,更要常常為了教學目標的順利達成,而去增刪或是 修改教科書出版社所提供的評量工具。

柒、結語

多元評量的原意在於鼓勵教師掌握評量在教學上所發揮的功能與意 義,若只是因為政策要求而使用多元評量,很可能增加教師的工作負擔,

卻沒有達到其功效,且進一步讓教師產生排斥的心理。要順利實施生活課程 的多元評量工作,必須要掌握課程的精神與特性、做好教學規劃,明瞭評量

(27)

的重要特性。生活課程的評量,是為了增進學生的學習而評量,也是要評量 學生的學習成果;但是,相對於其他課程,生活課程的評量更重視幫助學生 學習,教師若能時時思考以下的事項,將有助於生活課程多元評量的實施:

(1)生活課程的評量大多是心理歷程評量;(2)區分形成性評量與總結性 評量的意義;(3)生活課程的評量大多時候是形成性評量;(4)生活課程 的評量與教學,大多相互依存;(5)讓評量有助於自己的教學;(6)讓評 量有助於學生的學習,不管是能力的增長或是學習動機的提升;(7)評量 學生的生活能力不需要將學生各次的形成性評量表現加入學期成績;(8)

善用評量規準,增進教師的教學與學生的學習;(9)讓學校與家長了解生 活課程應該如何評量;(10)儘量做到好的評量工具應有的性質,如目標清 楚、學生事先已知道學習目標、題目與目標能相符應、評量題目能被學生理 解、以及公平地對待每位被評量的學生等。

參考文獻

吳璧純,2008。找回統整的生活課程:九年一貫生活課程研修及97生活課綱的特

色。教育研究月刊,175,22-34。

吳璧純、王玉程、鄧婷尹與董蕙萍(2009)。以海洋探索為主題的生活課程行動研

究。教育部生活課程教學輔導團委託研究,未發表。

教育部,2003a。92年國民中小學九年一貫課程綱要總綱。

教育部,2003b。92年國民中小學九年一貫課程綱要。

教育部,2008。生活課程綱要,97年國民中小學九年一貫課程綱要。

陳文典與黃茂在,2006。國民小學一、二年級課程推行現況之調查及調適策略之研

究。國家教育研究院研究報告,計畫編號:NAER-94-06-A-2-01-00-2-06。

單文經,2006。國民中小學應兼重能力培養與知識或訊息習得的教學。教育研究與

發展期刊,2, 43-66。

黃玉芬,2003。國小低年級教師對生活課程實施教學評量之現況調查研究。未出版

之碩士論文,國立屏東教育大學數理教育研究所。

張麗麗,2003。藝術與人文學習領域的教學評量,載於黃壬來主編,藝術與人文教

育。臺北:桂冠。

(28)

魏玉姵,2005。國小生活課程實施實作評量之行動研究:以二年級為例。未出版之 碩士論文,國立屏東教育大學數理教育研究所。

Arter, J. A.(2003). Assessment for learning: Classroom assessment to improve student achievement and well-being. In J. E. Wall, & G. R. Walz (Eds.) Measuring up:

Assessment issues for teachers, counselors, and administrators, chapter 33, 463-484.

ERIC: ED480379.

Bartlett, E. J. (1982).Learning to revise: Some component processes. In M. Nystrand (Ed.), What writers know. NY: Academic Press.

Bickhard, M.H.(1980).A model of developmental and psychological processes. Genetic Psychological Monograph, 102, 61-116.

Black, P. Harrison, C., Lee, C., Marshall, B. & Wiliam, D. (2004). Working inside the black box: Assessment for learning in the classroom. Phi Delta Kappan, 86, 9-21.

Bredekamp, S. (Ed.) (1987). Developmentally appropriate practice in early childhood programs serving children from birth through age 8. Washington, DC: NAEYC.

Bredekamp, S., & Rosegrant, T. (Eds.) (1993). Reaching potentials: Appropriate curriculum and assessment for young children, volume 1. Washington, DC: NAEYC.

Bredekamp, S., & Copple, C. (Eds.) (1997). Developmentally appropriate practice in early childhood programs. Washington, DC: NAEYC.

Brookhart, S. M. (1999). The art and science of classroom assessment: The missing part of Pedagogy. ASHE-ERIC Higher Education Report (Vol. 27, No.1).

Goldman, A. I. (1986). Epistemology and cognition. Cambridge, Mass.: Harvard University Press.

Goodrich, H. (1997). Understanding rubrics. Educational Leadership, 54 (4), 6-12.

Guddemi, M. P. (2003).Assessment for children ages 3 to 8 years: Age-appropriate systems. In J. E. Wall, & G. R. Walz (Eds.) Measuring up: Assessment issues for teachers, counselors, and administrators, chapter 19, 273-281. ERIC: ED480379.

Leahy, S., Lyon, C., Thompson, M., & Wiliam, D. (2005). Assessment minute, day by day. Educational Leadership, 63 (3), 19-24.

Marzano, R. (1992). A different kind of classroom: Teaching with dimensions of learning.

Alexandria, VA: ASCD.

McTighe, J., & O’Connor, K. (2005). Seven practices for effective learning. Educational Leadership, 63 (3), 10-17.

McMillan, J. H. (2007). Formative classroom assessment: The key to improving student achievement. In J. H. McMillan (Ed.) Formative classroom assessment: Theory into practice. NY: Teachers College, Columbia University.

Moskal, B. M. (2000). Scoring rubrics: What, when and how? Practical Assessment, Research & Evaluation, 7(3), 1-8.

(29)

Perlman, C. C. (2003). Performance assessment: Designing appropriate performance tasks and scoring rubrics. In J. E. Wall, & G. R. Walz (Eds.) Measuring up: Assessment issues for teachers, counselors, and administrators, chapter35, 497-506. ERIC:

ED480379.

Shepard, L., Kagan, S., & Wurtz, E. (Eds.)(1998).Principles and recommendations for early childhood assessments. Washington, DC: National Education Goals Panel.

Stiggins, R. (2005). Student-involved assessment for learning. Upper Saddle River, NJ:

Pearson/Prentice-Hall.

Torrance, H., & Pryor, J. (1998). Investigating formative assessment: Teaching, learning and assessment in the classroom. Buckingham, Philadelphia: Open University Press.

Toulman, S. (1976). Knowing and acting: An invitation to philosophy. NY: Macmillan Publishing Co..

Wiggins, G. (1997). Practicing what we preach in: Designing authentic assessments.

Educational leadership, 54, 6-12.

Wiggins, G. (1998). Educative assessment: Designing assessment to inform and improve student performance. San Francisco: Jossey-Bass.

(30)

數據

表 2  教師整理過的小組上課心情記錄 組別 喜 怒 哀 樂 海參 ( 4)我們有分工合 作 還 開 開 心 心 的 寫 心智圖。 ( 6)上心智圖很好 玩。 ( 7)我覺得畫心智 圖 很 開 心 又 好 玩 又 煩惱。 ( 13)我看到我們海 參組都很分工合作。 我 很 開 心 , 因 為 這 樣動作比較快。 ( 15)我們都互相幫 忙 , 不 會 有 人 沒 做 事 情 , 不 會 只 有 我 做。 ( 31)我 的 心 情 開 朗。結果就爭吵了, 我 們 海 參 組 的 事 情 是 這 樣 的 , 有
表 3 分析型規準羅列表格             評語 向度 優良 滿意 待改進 表達態度 內容清楚性 合理性 若評量規準只是針對一個總體的表現作評等,就稱做是整體型的評量 規準。在整體型評量規準的系統中,雖然某項能力或許可以分成不同的表現 成分,但是卻以學生的整體能力表現來評為:「優秀、精熟、尚可、不滿意」 ( Perlman, 2003),或是「很有道理、有道理、稍有道理、沒有道理、答非 所問」,但教師可能在每個等級下羅列一些表現特徵,供評等參考。 評量基準也可以依應用到特定作業或是應用到許多不同作業

參考文獻

相關文件

Most of teachers agree with positive effects of the 99 curriculum on practical instruction in school, however, they seem to concern inequalities of content between volumes and

Based on the author's empirical evidence and experience in He Hua Temple from 2008 to 2010, the paper aims at investigating the acculturation and effect of Fo Guang Shan

Based on the Qing gong dang’an 清宮檔案 held at the Zhongguo diyi lishi dang’an guan 中國第一歷史檔案館, the present article refutes theories that the translation of

The research purposes of this paper are discussing the special connotation of the śūraṃgama-samādhi, and based on the Buddhist scriptures and treatises discussing the

古今並重 全面均衡 研習能力 學生興趣. 配合

Boston: Graduate School of Business Administration, Harvard University.. The Nature of

Senior Secondary Enriching Knowledge for the Geography Curriculum: (5) Dynamic Earth Series – Geology of Hong Kong and Slope Safety System..

It is based on the goals of senior secondary education and on other official documents related to the curriculum and assessment reform since 2000, including