• 沒有找到結果。

教學與評量

N/A
N/A
Protected

Academic year: 2021

Share "教學與評量"

Copied!
12
0
0

加載中.... (立即查看全文)

全文

(1)

一、前言

國內長久以來的評量方式,不管是平時 或升學考試,大多以概念的理解為主,以紙 筆測驗方式進行;而紙筆測驗形式大多又以 是非題、選擇題及計算題等方式為主,受限 於這些評量形式,無法評量學生解決問題能 力及情意方面技能。影響所及,學生的學習 逐 漸 捨 去 由 操 作 中 學 習 , 而 改 由 聽 教 師 講 解、習題演練方式去學習,以迎合考試的要 求。實際上,科學教育的目標除了讓學生獲 得知識方面的理解外,更重要的是要培養一 個獨立思考與解決問題能力的人。因此,在 現今考試領導教學的狀況下,評量的策略、 內容及方法應該要多元化才能與教學目標對 應 。 教 學 與 評 量 , 猶 如 一 種 互 為 鏡 像 的 關 係;在評量的鏡像中可以反映出教學目標是 否達成,而評量這面鏡子是否可以確實反應 教 學 目 標 , 則 涉 及 評 量 的 有 效 性 問 題 。 因

一種互為鏡像(mirror image)關係

謝祥宏 段曉林

國立彰化師範大學 科學教育研究所

摘要

科學教育的目標除了讓學生獲得知識方面理解外,更重要的是要培養獨立思考與解決問題 能力的人。在現今考試領導教學的狀況下,評量的策略、內容及方法應該要多元化才能與教學 目標對應。教學與評量,猶如一種互為鏡像的關係;在評量的鏡像中可以反映出教學目標是否 達成,在教學實況中則反映出評量的目標;而評量這面鏡子是否可以確實反應教學目標,則涉 及評量的有效性問題。因此,本文就評量本質的演變、評量與教學關係及評量策略的探討等議 題,探討評量的重要性與影響力。 關鍵詞:教學、評量、公平、科學教育 此,本文擬就評量改變的本質、評量與教學 關係及評量策略的探討等議題,探討評量的 重要性與影響力(圖 1)。 圖 1 、評量相關議題。

二、評量本質的演變

根據 Duschl 和 Gitomer(1991)回顧概念 改變的模型發展時,指出科學理論的發展是 整體性的觀點,亦即一旦科學理論有所改變 時,對應的研究方法和研究目的也自然而然 地 隨 著 改 變 。 評 量 的 改 變 , 也 是 同 樣 的 情

(2)

形;當評量的理論改變時,它所伴隨而來的 目標、方法亦隨著改變。以下從兩方面論述 評量改變的本質(圖 1),一是當代科學哲學的 觀點對教學、學習本質的改變,進而影響評 量的本質(張文華和郭重吉,1995)。二是基於 時代變遷,修改以往不符社會需求的教育目 標,而在評量方法、內容、策略也必須改變 並與之相配才能達成評量的有效性。有關這 兩方面的論述,本文將分述於後:

(一)科學哲學觀點改變

D e n z i n 和 L i n c o l n ( 1 9 9 4 ) 認為「派典 (paradigms)」代表個人對世界觀、世界本質 是單一的,而且知識是客觀獨立存在於觀察 者之外。因此,在方法論上主張研究者能藉 由客觀觀察,發現事件的真相及事件如何運 作。 相對地,以目前頗受教育界肯定的建構 主義取向觀點,則認為實體是多元、是由社 會建構而成的;知識並非獨立於認知主體之 外,知識是研究者與被研究者在互動中創造 出來的。觀察者所觀察到的現象,是觀察者 帶者某種理論所表達出來的,並非客觀獨立 存在於觀察者之外。因此,在方法論上主張 的觀點,可以被當作是一種基本信念系統, 並用它來處理哲學上有關本體論(ontology)、 知識論(epistemology)和方法論(methodology) 上的問題。本體論(ontology)所討論的是實體 (reality)的形式與本質是什麼;知識論(episte-mology)所討論的是知識與認知主體間關係、 知識的本質是什麼;方法論(methodology), 探討如何找出認知主體認為可相信的事物。 然而,不同派典對於本體論、知識論與 方法論看法不同(Guba & Lincoln ,1989) (如表 1),這種不同造成對教學、學習和評量這三 者的看法不同。傳統派典,主張實體(reality) 詮釋的 / 辯證的方法論,由研究者與被研究者 重新建構事件真相。 上述這兩種不同派典,對教學、學習和 評量這三者的看法有所不同,以下分別以傳 統取向、建構主義取向來探討這三者之差異 與轉變。 1.傳統派典取向 Guba 和 Lincoln (1989)認為傳統的評量 幾乎是獨遵科學的方法(exclusive scientific), 所持的本體論立場是實證主義的假設 -- 認為 具有客觀的實體(reality)存在,而觀察者可以 表 1 、傳統派典與建構主義派典比較(Guba & Lincoln ,1989,p.84)

傳統的信念 本體論(ontology) •存在唯一的實體,且獨立於觀察者。 •真理被視為與實體同義。 知識論(epistemology) •二元,客觀的知識論 方法論(methodology) •干擾者的方法論(interventionist) 建構主義信念 本體論(ontology) •實體是多元、相對,是社會建構而來 •真理被定義為多數人共同建構。 知識論(epistemology)) •單一,主觀的知識論 方法論(methodology) •詮釋(hermeneutic)方法論

(3)

客觀獨立毫無偏見的對被觀察者進行觀察。 由於認為知識是客觀獨立於學習者之外,觀 察到的結果與學習者本身經驗無關。因此, 「學習」被認為是刺激與反應的連結,「教學」 就被認為是不斷透過反覆練習而讓學習者精 熟,而「知識」就被當作是不斷的累積事實與 基本技能( D o r a n , C h a n & T a m i r , 1 9 9 8 ; Birenbaum & Cochy,1996,p.5)。對於評量的 結果,被認為就是事實如何運作及事件的真 相。

Guba 和 Lincoln (1989)所著第四代評量 (Fourth generation evaluation)之前三個世代, 都是基於傳統派典,強調以客觀和量化來證 實理論及命題時的線性、邏輯化過程,並將 洞察力、直覺、創造思考等非理性因素排除 於探究過程外。因此,傳統派典下強調評量 結 果 之 權 威 性 與 客 觀 性 ( 張 文 華 和 郭 重 吉 , 1995)。 在 上 述 傳 統 派 典 之 學 習 情 境 下 , 是 非 題、選擇題、配合題等客觀性的評量方法, 就成為最常用的評量方式。然而,這樣的評 量方式卻衍生出一些問題,如:無法評量學 生解決問題能力及情意方面技能、扭曲教學 本質及考試領導教學等缺失( B i r e n b a u m & Cochy,1996)。因此,改變評量方式以導正教 學成為很重要課題。 2.建構主義取向 基於上述取向評量缺失,新派典取代由 此產生。從建構主義的觀點來看, Guba 和 Lincoln (1989)主張實體並非客觀的存在於學 習者之外(reality are not objectively out there), 實體是人們建構的結果。而新的學習觀著重 提升解決問題及高層次思考的評量。在教學 策略上要求能幫助學生發展學習的能力,並 在真實的情境中解決問題( D o r a n , C h a n & Tamir,1998)。 根據 Guba 和 Lincoln (1989)的想法,第 四代評量特點如下:就評量的結果而言,並 非針對真相如何或事實如何運作所進行之描 述,而是評量者與被評量者在情境中意義化 後共同建構出來的。所發現的並非事實(fact) 而是彼此互動建構的結果,而建構的結果與 特 定 的 情 境 、 心 理 、 社 會 、 文 化 、 情 境 相 關;就評量過程而言,評量是被委託者、評 量 者 、 被 評 量 者 等 相 關 人 員 共 同 參 與 的 過 程,而不是評量者因其專業性主導,忽略其 他參與者,造成被評量者漠視評量結果或不 滿意;就被評量者而言,強調對被評量者人 格、尊嚴、過程、結果及隱私的尊重。雖然 傳統評量也注意到這樣的問題。但第四代評 量已達到全面參與(full participate)的層次 --被 評 量 者 --被 視 為 共 同 參 與 評 量 的 設 計 、 實 施、及結果的解釋等。被評量者被視為人而 非物化成研究的對象。

(二)教育目標的改變

不 同 時 代 背 景 下 所 強 調 的 教 育 目 標 不 同,因而所要評量的標準、方法亦不同。十 九世紀中期,教育的目標是為工業社會培育 具 有 基 本 技 能 的 人 ; 而 在 進 入 資 訊 化 、 多 元、持續變動的廿一世紀,教育的目標是讓 人能獨立獲取知識,並利用它來解決問題(Bi-renbaum & Cochy, 1996,p.4)。在美國國家科 學教育標準中(National Research Council, [NR-C],1996)揭示了科學素養的重要性,而一位具

(4)

有科學素養的廿一世紀公民,必須能夠不斷 學習、進行推理、創造思考、做決定及具有 解決問題的能力。因此,評量目標將改變以 往 著 重 調 零 碎 片 段 知 識 , 而 較 強 調 知 識 結 構、解決問題能力,並強調教師、學生及同 儕參與的評量(如表 2)。 討論。

(一)評量所扮演的角色

根據 Jorgensen 和 Shymansky (1996)主張 評量具有執行目標、監控達成目標的過程、 明確的改變教師的角色(由知識的傳輸者轉變 成思考的促進者)的功能。 White 和 Gunstone (1996)認為如果用狹隘的方式來評量學生的理 解狀況,則學校所能提昇的理解能力將受到 限制,而且是侷限於某個方向。 Gipps 和 Mu-rphy (1994) 認為評量具有確認學生學會什 麼、未學會什麼及學習困難所在的角色。這 種角色的評量,稱為形成性評量(formative as-sessment)。若把評量當作是提供評鑑的訊息 給老師,則它扮演的角色是一種選擇與證明 的角色,經常在學習告一段落之後實施,稱 為總結性評量(summative assessment)。 換言之,如果希望評量能促進教學,則 評量不應放在學期末。評量如果放在教學之 後,那麼評量並不能幫助教師作任何教學判 斷。評量應是連續的過程,讓教學者經由學 習者對評量的回應中獲得一些訊息,以作為 教學上修正的依據。因此,評量可改變教與 學,評量是教育改革的中心(Jorgensen & Shy-mansky, 1996)。此時評量將超脫「我們教所 要考的內容(we teach what we test)」爭論。

(二) 評量方式對教與學的影響

Carter 和 Berenson (1996)認為評量方式 的改革,對學生的學習與教師的教學有決定 性的影響。如果教師仍停留在使用選擇題、 是非題、填充題的評量方式,則教學將停留 於呈現教科書內容,學習也將局限在評量所 能達到的範圍。因此,如何改變學生的學習 表 2:評量標準的改變(NRC,1996,p.100) 較不強調 評量所有易測量的 評量零碎的知識 評量科學知識 評量學生不知道的知識 評量著重成就 教師做最後的評量 評量出測驗專家發展 較強調 評量最有價值的 評量好的結構知識 評量科學性瞭解與推理 評量學生已經知道的知識 評量成就及學習機會 學生參與自我的評量 教師參與發展外在的評量 基於上述教育目標的改變與科學哲學觀 點的改變,對於評量本質的看法有所不同。 在進入廿一世紀之際,教育的目標,轉變為 提升學習者自我思考以解決問題;所要培養 的 學 習 者 , 不 是 以 記 憶 為 主 的 獲 得 知 識 方 法 , 而 是 強 調 學 生 主 動 建 構 知 識 , 應 用 知 識;而對評量的觀點,不再是記憶、量化之 單一取向,而是以符合情境、學科和學生個 別差異的多元化取向評量。

三、評量與教學的關係

教 學 與 評 量 , 猶 如 一 種 互 為 鏡 像 的 關 係。在評量的鏡像中可以反映出教學目標是 否 達 成 , 在 教 學 實 況 中 則 反 映 出 評 量 的 目 標。評量在教學中扮演怎樣的角色,對教學 的影響又是怎樣呢?以下針對這些問題加以

(5)

方式及教師的教學型態,評量扮演很重要的 角色。 在 Project 2061 改革藍圖中,回顧課室評 量(classroom assessment)、州的評量及國家評 量等三個層次的評量實況發現,教室的評量 對學生的學習影響最大(American Association for the Advancement of Science,AAAS,1998)。 而一般教室中教師所設計的評量,大多偏向 紙筆測驗,著重學生記憶。雖然,要用不同 的評量方式才能測出學生在實作表現、成就 表現,但證據顯示教師由於未受過有效的評 量 方 法 訓 練 , 大 部 分 教 師 不 願 改 變 評 量 方 法。此外,由於時間考量,教師大都侷限於 採用簡答、是非題等評量方式。因此,評量 策略的研發,也成為科學教育的研究者所重 視的課題。 連瑞琦(1998)探討數學科採用實作評量方 式對學生數學成就與態度的影響,採用單因 子獨立樣本實驗設計進行研究。實驗一組採 用實作評量與討論教學;實驗二組採用實作 評量與講述教學;實驗三組採用傳統評量與 講述教學。並將研究樣本 102 人隨機分派為 三組,各組經八次實驗處理。結果顯示實作 評 量 對 學 生 數 學 的 成 就 提 昇 , 並 無 顯 著 幫 助。 而宋文菊(1998)則針對國小學童閱讀理解 實作評量上的表現進行研究,結果顯示:實 作評量對閱讀瞭解能力評量,是一個適切的 工具。實作評量可區辨不同國語成就學童之 閱讀理解類型。實作評量能測量到學生的閱 讀理解思考歷程。曾嘉琪(1995)針對「教學及 評量改進班」進行研究,結果顯示:教學及 評量改進班學生比普通班學生更喜愛學習、 更主動學習。在教師方面,不同性別、教育 背景的教師,其教學的生動活潑及評量多元 程度,並沒有顯著差異。但教師的教學歷程 因素與教學相關因素,對學生的表現具有影 響。 桂怡芬(1996)針對自然科實作評量的效度 進行研究,結果顯示:實作評量影響學生學 習 態 度 的 改 變 , 在 實 驗 時 態 度 趨 於 積 極 主 動;同時在準備考試的方式與學習焦點上會 特別注意有關實驗教學的內容,並有助於學 生實驗操作能力的提昇。對教師的影響上, 實作評量有助於診斷學生學習困難,提供教 師教學上的反省。 林純年(1998)以研究概念圖建構對學習的 影響,採用準實驗研究法的不相等組前後測 設 計 , 以 國 小 四 年 級 學 生 四 個 班 為 研 究 樣 本,其中兩個班分派為實驗組,另兩個班為 控 制 組 。 實 驗 組 接 受 六 個 單 元 概 念 構 圖 訓 練,並在閱讀資料後,實際構圖;控制組則 自行閱讀資料,不須構圖,但兩組都接受閱 讀測驗。結果顯示:當評量題目類型是較偏 重訊息記憶或答案較封閉時,概念構圖學習 方法與一般學習方法並無顯著不同。但是, 當評量的類型較著重知識整體和關聯時,概 念構圖學習方法優於一般學習方法。 Shieh 和 Tuan(2000)研究有關教師教學型 態與評量方式關係,採用問卷方式調查學生 對 於 評 量 、 學 習 進 步 及 評 量 與 教 學 型 態 關 係,並以卡方考驗分析。結果顯示教師上課 方式主要以講解為主時,其評量方式以採用 習作、傳統考試為主;以學生操作為主的教

(6)

學活動,則其評量方式是以實驗操作為主。 由此顯示評量方式與教學型態有著密不可分 的關係。 從連瑞琦(1998)研究顯示實作評量對於數 學成就提昇、態度的改善並無顯著提昇。但 在宋文菊( 1 9 9 8 ) 、曾嘉琪( 1 9 9 5 ) 、桂怡芬 (1996)研究卻顯示實作評量對於瞭解學生閱讀 能力、閱讀理解類型、提昇學生興趣、教學 歷程等項目上有顯著的幫助;Shieh 和 Tuan (2000)研究亦顯示評量方式與教學型態具顯著 關係;林純年(1998)的研究亦顯示評量類型若 著重知識整體和關聯時,採用概念圖學習較 為有效。因此,有關評量對於教學與學習的 影響,甚為分歧有待進一步瞭解。

(三)評量取向之教學

Foster 和 Heiting(1994)提出教學與評量 是互為鏡像(mirror image)的觀點,認為評量 指引教學,教學引導評量;事實上,如果以 學生的行為、行動及想法為評量,則教學活 動將被評量所引導;並認為即使現今強調的 動手做評量(hands-on assessment),依舊是基 於教學與評量是各分開的基本假設。 Gallagher(2000)提出融入式評量(embedd-ed assessment)的想法,企圖將評量融入教學 過程中,而不是把評量放在教學後所進行的 傳統評量。因此,融入式評量與教學、學習 之間的界線是模糊的。根據 Gallagher, Parker 和 Ngwenya (1999)所定義的融入式評量,是 指教師利用獲得學生理解的知識,引導教學 順序的評量。教師由蒐集學生理解之資料作 為教學之用,並藉由這樣的評量方式,教師 改善自己的教學。

Gallagher, Parker 和 Ngwenya (1999)提出 融入式評量的三大步驟,以說明教師教學時 的行動。第一、蒐集有關學生在學習時的想 法;第二、深入分析所蒐集到訊息,以瞭解 學 生 困 難 所 在 ; 第 三 決 定 下 一 個 的 教 學 步 驟。 研究顯示融入式評量,對於提升教師之 學習環境有顯著幫助;再者,融入式評量促 進學生的理解與應用科學知識上的成功,進 而增強了學生學習動機(Gallagher,2000)。就 研究結果而言,融入式評量達成當代教育改 革的目標 -- 加深學生的理解、應用科學知識 能力,是值得一試的評量方法。

四、評量策略的探討

McMillan(2000)認為好的教學可藉由評 量激發學生學習動機,並與教學和學習的理 論一致。而好的評量是有效的(valid)、公平的 及道德的(fair and ethical)。公平包括無偏見 (absence of bias)、公平的處理(equitable trea-tment)、公平的學習結果(equality in outcome-s)。針對評量的有效性及公平性問題,分述於 後:

(一)評量的有效性

評量的目的在於瞭解實況,但在不同情 境下該採用何種評量模式和內容來評量最為 有效,是一個值得探討的問題。由於傳統以 紙筆測驗方式進行評量,無法反映出教學目 標,因而要求改變評量方式呼聲日起。要怎 樣才能達到到真確的評量(authentic assessme-nt),簡單的說,評量應包括學生做功課時最 有價值、有意義的事項。 Carter 和 Berenson

(7)

(1996)認為真確的評量(authentic assessment) 包括晤談(interview)、小組解題(group prob-lem solving)、歷程檔案(portfolio)、概念圖、 實作評量、開放性問題(open-ended)。 以實作評量(Performance assessment)為 例,這種評量是用來測驗學生應用知識和技 能於真實情境中的能力,與傳統著重於事實 和零碎的技能有所不同。實作評量企圖藉由 學生處於真實情境中主動解決問題,以呈現 學生的真實能力。以科學教育的目標來看, 藉由實作評量能瞭解學生高層次思考能力, 這種評量才是不偏廢的全方位評量(陳文典、 陳義勳、李虎雄, 1 9 9 5 ) 。根據陳文典等人 (1995)進行實作評量的研究結果顯示我國學生 傳達與獨立作業能力不足;在察覺問題、規 畫工作、及獨立判斷上亦不足;凡涉及敘述 方式問題,回答顯得簡略不全;在涉及實驗 時,大都忽略其他變因的影響。在採用實作 評量可行性上,李虎雄和黃長司(1995)的研究 指出實作評量題目的設計不成問題,但評分 卻 是 一 大 負 擔 , 因 此 , 在 採 用 實 作 評 量 時 「評分」問題必須加以考慮。 陳華傑(1998)研究發現,採用實作評量, 對於解決問題之過程技能和思考智能有很好 的評量效果;紙筆評量,對於科學概念的認 知及應用有很好的評量效果;媒體評量,利 用 影 帶 呈 現 的 現 象 為 題 目 , 由 其 中 獲 得 資 訊,此種方式很容易得知受測者應用所學以 解決問題的能力;而心得論述的評量可以得 知學生對於綜合性概念及情意方面體會;至 於成果發表,則能夠表現學生對於整體事件 的評鑑。 黃智信(1998)認為一個真確的評量(authe-ntic assessment)應該是提供一個實際問題,然 後觀察學生如何解決它,但實施上考量,受 測人數、教師教學負荷下並不可能。該研究 構想能否能設計一個具實作評量特性,卻又 能大量施測的評量方式。並以「密度壓力浮 力的測量」、「人體呼出氣體」為主題,分別 設計「實驗設計測驗」、「實作測驗」、「填 充題」、「選擇題」等四種不同評量工具。結 果顯示:「實驗設計測驗」、「實作測驗」在 能力的判別上比「填充題」「選擇題」為高, 可用來評量學生在處理問題過程中的缺失。 在可行性上發現,實作評量所需時間是「填 充題」、「選擇題」的三十倍。 從上述陳文典等人(1995)、李虎雄和黃長 司(1995)、陳華傑(1998)及黃智信(1998)等研 究顯示,各類評量方式各有其適用性範圍。 若 評 量 的 目 的 是 在 瞭 解 學 生 高 層 次 思 考 能 力,則可採用實作評量,但在評分卻是一大 負擔;若目的是評量學生在處理問題過程中 的缺失,則可採用「實驗設計測驗」、「實作 測驗」,但所需時間是一大負擔;若目的是 評量學生對於科學概念的認知及應用,可採 用紙筆評量;若目的是評量學生應用所學以 解決問題的能力,則採用媒體評量;若目的 是評量學生綜合性概念及情意方面體會,則 採用心得論述;若目的是評量學生對於整體 事件的評鑑,則可採用成果發表方式。

(二)公平的評量

科學教育研究者一直致力於研究如何將 評量達到公平,但是,近幾年的研究證明要 達到這樣的目標,並不是簡單的事情(Parker

(8)

& Rennie,1998)。在英國、美國及澳洲的研究 顯示,影響公平的評量的重要向度是:學生 的背景及世界觀。 Popham(1995)認為評量工 具的設計,除了以信度、效度作為判準外, 另外提出第三個判準 -- 評量的偏見(assessme-nt bias)。評量的偏見涉及有關評量工具是否 因受測者的性別、種族、宗教、社經地位的 不同,造成對受測者傷害或不公平。 美國國家科學教育標準中(NRC,1996)提 出全民的科學素養目標,要達到這樣的目標 唯有讓所有的學生都有均等的機會(equal opp-ortunities)學習科學(Gipps & Murphy,1994)。 而要達到均等的學習機會,則評量必須是多 面向的(multifaceted),以讓學生能利用個人 的學習風格及能力,表現在不同的評量類型 上(Doran, Chan & Tamir,1998)。因此,就教 師的教學而言,要瞭解不同學生的學習風格 與能力以做為改進教學,則評量方法必須因 學生而有所變化,如此才能普遍瞭解學生不 致造成不公平。 1.不公平評量的來源 評量工具的公平性,可以從兩方面來討 論:評量內容的設計與評分標準。首先在評 量內容方面, Popham(1995)認為評量內容如 果發生評量的偏見(assessment bias),將扭曲 學生的表現而引發不公平。這種評量的偏見 包括:攻擊(offensiveness)和不公平的待遇(u-nfair penalization)兩種形式。如果評量的內容 攻擊某個族群學生,則這項評量的過程是有 偏見的,而這種偏見常常出現於將某個族群 負面的刻板印象呈現在評量中。例如將男性 描繪成高收入與較有聲望的一群( 如:太空 人、物理學家),而將女性描繪成低所得和低 聲望的角色(如:家庭主婦、店員)。不公平的 待遇,是指評量內容雖不至於有攻擊性,但 卻不利於某類學生。例如:讓女性進行不熟 悉的競爭性運動。 在評分標準方面的不公平現象,大多發 生於開放性問題評分上的不一致。依 Popham (1995)所提出的評分者上評量偏見有:慷慨誤 差(generosity error),是指高估學生表現實際 上學生並沒有表現很好;嚴厲性誤差(severity e r r o r ) 指 低 估 學 生 表 現 ; 中 心 傾 向 誤 差 (central-tendency error),認為學生不可能太 好或太差;光環效應(halo effect),認為學生 平常表現很好(或很差),在這項測驗上也是很 好(差)。 綜合上述,有關不公平現象的產生,是 由於評量設計者,在評量內容的設計與評分 的標準所造成。評量除了考量信度、效度之 外,評量者的偏見是不可忽視的重要向度。 2 公平的評量策略 為了要使評量變得公平,Parker 和 Renn-i e ( 1 9 9 8 ) 提出要達到公平評量的三個先決條 件: ( 1 ) 課程的真實度( C u r r i c u l u m f i d e l i t y ) 。 這項條件是呼應 Lawrenz (1991)所提課 程、教學過程和評量,三者必須達到一致。 Parker 和 Rennie(1998)認為從 1960 年以來, 課程的改革者並未考慮到公平的評量(equit-able assessment);在 1990 年代,科學教育的 教學進入了哲學改變的時期,期望科學能被 廣泛的學生瞭解。建構主義的知識論改變了 科學教學與學習的策略,更加強調採用小組

(9)

合作學習及持續發展語言與溝通技巧。這樣 的改變,反映出學生族群的多樣化學習風格 (multiplicity of learning style);如果這些議 題能被注意,透過多樣性的評量風格(assess-ment style),學習風格的多樣性(diversity of le-arning style)將與課程改革的目標達成一致(G-affney,1992)。 ( 2 ) 多樣性和機會( d i v e r s i t y a n d o p p o r t u n -i t y ) 評量的目的如果在於讓學生真實地展現 學習成果,以作為教學改進參考。評量方法 必須能讓所有的學生與小組,擁有最大的機 會去呈現所有已經知道的、理解的、能做的 學習成果(Parker & Rennie,1998)。因此,所 有 阻 礙 學 生 展 現 學 習 表 現 的 評 量 應 被 以 避 免;所有能讓學生展現學生學習成果的方法 應予鼓勵,才能達到公平的評量。 ( 3 ) 價值和倫理( v a l u e a n d e t h i c s ) 要達公正和公平評量的第三項先決條件 是:對於評量結果之解釋,在不同群學生不 同型式評量和相等的表現(equivalent perform-ance)應持等值態度(Parker & Rennie1998,p. 899)。 從上述探討有關公平的評量議題中,首 先,從教育的目標而言,必須使學生達到學 習機會的均等。但這樣的學習機會均等,必 須基於學習者學習風格所做的考量,而並不 是齊頭式的機會均等。再者,既然強調學生 學習時的學習風格以達到學習機會的均等, 那麼評量也必須是多面向的,以使學習者在 最有利情況下展現出學習成果,如此才是達 到所謂公平的評量。最後,就學習的本質而 言,影響學生學習的因素除了學習者學習風 格外,學生的背景、種族、宗教、社經地位 等都將影響學習成果。因此,在評量時必須 考量這些不公平的因素是否產生,才能達到 所謂的公平。

五、結語

綜合以上文獻中有關評量議題之探討, 對於評量提出以下見解。分別敘述於後:

(一)評量的本質

「評量」是利用各種不同的方式獲得關於 學生學習狀況的訊息,回饋教師,做明智教 學決定,以培養學生各種能力健全地發展, 達成最大教學效果。因此就提供教師教學改 進而言,評量的本質應該是以提升學習者的 學習(Davis, 2000)為第一要務。 早在多年前在德國 Dr. Bambach 對於「評 量」就有所謂「激勵,非評分」的評量觀點。 德國歌汀根基礎小學:H a i n b u n d s c h u l e 小 學, Weiland 女士提倡「沒有分數評量的小 學」方案。這些評量改革計畫著眼於認為能 力表現評量,造成能力階層、惡性競爭、助 長社會不公平現象(引自陳惠邦,民 89)。然 而國內,教師與學生尚且停留於「分數取向」 觀點(Shieh & Tuan,2000;謝祥宏和段曉林, 2000),此現象亦亟待進一步探討與改善。

(二)評量與教學的關係

教學與評量,本是一體的。但是,大多 數老師將教學與評量分開。 Gallagher(2000) 所提出的融入式評量的觀點,可以說是教學 與評量關係的最佳寫照 -- 評量與教學、學習 之間的界線是模糊的。在研究中發現教師教

(10)

學方式、評量方式、學習者學習方式,三者 彼此互相影響( 連瑞琦, 1 9 9 8 ; 宋文菊, 1 9 9 8 ; Carter & Berenson,1996; Parker & Rennie,1998; S h i e h & T u a n , 2 0 0 0 ) 。然而,正如 P h i l i p Gammage 所說「沒有人會因為一再被測量而 長高」一樣(引自吳麗君,2000)。學習方式的 改變,不全然是評量方式所造成。評量方式 所引發的各種變化,可能帶動教學品質的改 進或產生不同班級氣氛、….等,這些才是影 響教學、學習成效之因素。因此,在評量的 改革運動中找出這些中介因素,才是企圖以 評量改進教學的研究者最重要的課題。

(三)公平的評量 -- 多元評量觀點

承上所述,教師的評量方式對於學生學 習方式產生影響。如果用狹隘評量觀點,則 窄化了學生的學習。再者,學生之學習風格 各有不同,執著於某類型評量方式,對於另 類學生亦產生不公平(Parker & Rennie,1998), 因此,唯有多元評量,才能與學生多種學習 風格匹配(Gaffney,1992)。而多元評量不僅是 指評量方式的多樣性,而更重要的是在評量 目標、評量對象、評量時機、評量標準的多 樣性。

(四)對未來研究之啟示

研究指出教師與學生對「評量之看法」、 「對教學與評量關係的看法」不盡相同,學生 深受評量方式之影響(謝祥宏和段曉林,1999; Shieh & Tuan,2000)。教師對於評量之看法, 本 質 上 是 對 於 知 識 論 、 本 體 論 上 觀 點 之 不 同。因此,要探討教師與學生對評量知覺之 交互影響,未來的研究可從教師所持的知識 論、本體論之觀點,探討教師評量信念對學 生學習之影響。

參考文獻:

吳麗君(2000):交互損益見真章 -- 談英國 國課程評量的來時路。課 程 與 教 學 季 刊 , 3(1), 78-94 。 宋文菊(1998):國 小 學 童 在 閱 讀 理 解 實 作 評 量 上 的 表 現 分 析 。國立臺南師範學院國 民教育研究所碩士論文(未出版)。 李虎雄、黃長司(1995):美國馬里蘭州實作 評量工具在台灣施測的可行性。科 學 教 育 月刊, 179 , 41-49 。 林純年(1998):概 念 圖 對 國 小 學 童 自 我 學 習 科 學 說 明 資 料 之 影 響。國立台南師範學 院國民教育研究所碩士論文(未出版)。 桂怡芬(1996):自 然 科 實 作 評 量 的 效 度 探 討 。國立臺北師範學院國民教育研究所碩 士論文(未出版)。 張文華、郭重吉(1995):科教革新中評量理 念的重建。教 育 研 究 雙 月 刊 , 4 5 , 2 3 -30 。 連瑞琦(1998):實 作 評 量 對 國 小 學 生 數 學 成 就 與 態 度 的 影 響 。南華管理學院教育社 會學研究所碩士論文(未出版)。 陳文典、陳義勳、李虎雄和簡茂發(1995): 由馬里蘭州的學習成就評量與其在台灣試 測的結果看 -- 實作評量的功能與運用。科 學教育月刊, 12 月, 2-11 。 陳惠邦(2000):在保守的傳統中謹慎前進: 德國小學教師評量信念與實踐研究。新 竹 師院學報, 13 , 245-264 。 陳華傑(1998):不 同 評 量 模 式 的 評 量 效 果

(11)

分 析 。國立台灣師範學大學物理研究所碩 士論文(未出版)。 曾嘉琪(1996):臺 北 市 國 民 小 學 試 辦 教 學 及 評 量 改 進 班 之 評 鑑 研 究。國立政治大學 教育學類研究所碩士論文(未出版)。 黃智信(1998):情 境 真 實 程 度 對 評 量 功 能 的 影 響 。國立台灣師範學大學物理研究所 碩士論文(未出版)。 謝祥宏、段曉林(1999):國 小 自 然 科 教 師 教 學 與 評 量 相 關 變 項 之 研 究。第三屆數理 教學及師資培育研討會。彰化:國立彰化 師範大學主辦。 謝祥宏、段曉林(2000):國 中 學 生 對 於 理 化 科 評 量 看 法 之 研 究 ,中華民國第十六屆 科學教育學術討會論文彙編。台北:國立 台灣師範大學主辦。

American Association for the Advancement of Science.(1998). Blueprints for reform

-S c i e n c e , M a t h e m a t i c s , a n d T e c h n o l o g y e d u c a t i o n . New York: Oxford University

Press.

Birenbaum, M. & Cochy, F. J.R.C.(1996).

Alternatives in assessment of achievements, l e a r n i n g p r o c e s s , a n d p r i o r k n o w l e d g e.

Boston: Kluwer academic publishers. Carter, G. & Berenson, S. B.(1996). Aut-hentic assessment: vehicle for reform. In Rohton, J. & Bowwers, P. (Eds), Issue in

S c i e n c e E d u c a t i o n (pp.96-106). Virginia:

NSTA.

Davis, N.(2000). Using assessment as a to

ol for educational reform , Paper presented

at the annual meeting of the Southeastern Association of Educators of Teachers of Science, Auburn, Alabama, October, 2000. Denzin, N. K. &Lincoln, Y. S. (1994).

Ha-ndbook of qualitative research . Thousand

Oaks, London: SAGE.

Doran, R., Chan, F. & Tamir, P.(1998)

Sc-i e n c e E d u c a t o r ' s g u Sc-i d e t o a s s e s s m e n t .

Virginia: NSTA.

Duschl, R. A. & Gitomer, D. H. (1991). Epistemological perspectives on conceptual c h a n g e : i m p l i c a t i o n s f o r e d u c a t i o n a l practice. J o u r n a l o f R e s e a r c h i n S c i e n c e

Teaching , 28(9), 839-858.

Foster, W. G. & Heiting, A.W. (1994). Em-bedded assessment. Science and Children , October, 30-33.

Gaffney, K. E.(1992).Multiple assessment for multiple learning style. Science Scope, March, 54-59.

Gallagher, J.(2000). Implementing needed

reforms in science education: research and development to enhance understanding and application of knowledge. Paper present in

Second International Conference on Science, Mathematics and Technology Education Gallagher, J., Parker, J., & Ngwenya, L. (1999). Embedded assessment and reform

o f s c i e n c e t e a c h i n g a n d l e a r n i n g . I n

preparation.

Gipps, C. & Murphy, P.(1994). A fair test?

(12)

University Press.

Guba, E. G. & Lincoln, Y. S. (1989).Fourth

generation evaluation. Sage publication: The

i n t e r n a t i o n a l p r o f e s s i o n a l p u b l i s h e r Newbury Park London New Delhi.

Jorgensen, M. A. & Shymansky, J. A. (1996). Assessment in science: A tool to transform teaching and learning. In Rohton, J. & Bowers, P.(1996,eds) I s s u e i n S c i e n c e

Education, NSTA.

Lawrenz, F. (1991). Research matters--to the science teacher, authentic assessment,

NARST News, 33,15-17.

McMillan, J. H.(2000).Fundamental assess-ment principles for teachers and school administrators. P r a c t i c a l a s s e s s m e n t , r e

-search & Evaluation, 7(8). Http://ericae. net/

pare/getvn.asp?v=7&n=8

National Research Council (1996). N a

-tional science education standards. Na-tional

Academic Press, Washington, D. C.

Parker, L. H. & Rennie, L. (1998). Equitable assessment strategies. In B. J. Frase & K.G. Tobin (eds), International Handbook of

Sci-e n c Sci-e E d u c a t i o n, P a r t T w o (pp. 897-910).

Virginia: Kluwer academic Publishers. Popham, W. J.(1995).Classroom

assessm-ent What teachers need to know . Boston :

Allyn and Nacon.

Shieh, S. H. & Tuan, H. L.(2000).

Elemen-tary students' perceptions of assessment of the science class. Paper present in Second

International Conference on Science, Math-ematics and Technology Education, Taiwan. Torrance, H. (1995).The role of assessment in educational reform. In Torrance, H.(1995).

Evaluating authentic assessment: problems a n d p o s s i b i l i t i e s i n n e w a p p r o a c h e s t o assessment. Open University Press.

White,R. & Gunstone. R. (1996). P r o b i n g

U n d e r s t a n d i n g . New York: The Falmer

參考文獻

相關文件

Allan (Eds.), Proceedings of the 38th Conference of the International Group for the Psychology of Mathematics Education and the 36th Conference of the North American Chapter

2 Department of Educational Psychology and Counseling / Institute for Research Excellence in Learning Science, National Taiwan Normal University. Research on embodied cognition

Department of Physics and Institute of nanoscience, NCHU, Taiwan School of Physics and Engineering, Zhengzhou University, Henan.. International Laboratory for Quantum

Shih, “On Demand QoS Multicast Routing Protocol for Mobile Ad Hoc Networks”, Special Session on Graph Theory and Applications, The 9th International Conference on Computer Science

International comparisons of science, technology, engineering and mathematics (STEM) education. Australian Council of Learned

ix If more than one computer room is opened, please add up the opening hours for each room per week. duties may include planning of IT infrastructure, procurement of

in Proceedings of the 20th International Conference on Very Large Data

Marar (2000), “On the Value of Optimal Myopic Solutions for Dynamic Routing and Scheduling Problems in The Presence of User Noncompliance,” Transportation Science, Vol..