一、前言
國內長久以來的評量方式,不管是平時 或升學考試,大多以概念的理解為主,以紙 筆測驗方式進行;而紙筆測驗形式大多又以 是非題、選擇題及計算題等方式為主,受限 於這些評量形式,無法評量學生解決問題能 力及情意方面技能。影響所及,學生的學習 逐 漸 捨 去 由 操 作 中 學 習 , 而 改 由 聽 教 師 講 解、習題演練方式去學習,以迎合考試的要 求。實際上,科學教育的目標除了讓學生獲 得知識方面的理解外,更重要的是要培養一 個獨立思考與解決問題能力的人。因此,在 現今考試領導教學的狀況下,評量的策略、 內容及方法應該要多元化才能與教學目標對 應 。 教 學 與 評 量 , 猶 如 一 種 互 為 鏡 像 的 關 係;在評量的鏡像中可以反映出教學目標是 否達成,而評量這面鏡子是否可以確實反應 教 學 目 標 , 則 涉 及 評 量 的 有 效 性 問 題 。 因一種互為鏡像(mirror image)關係
謝祥宏 段曉林
國立彰化師範大學 科學教育研究所
摘要
科學教育的目標除了讓學生獲得知識方面理解外,更重要的是要培養獨立思考與解決問題 能力的人。在現今考試領導教學的狀況下,評量的策略、內容及方法應該要多元化才能與教學 目標對應。教學與評量,猶如一種互為鏡像的關係;在評量的鏡像中可以反映出教學目標是否 達成,在教學實況中則反映出評量的目標;而評量這面鏡子是否可以確實反應教學目標,則涉 及評量的有效性問題。因此,本文就評量本質的演變、評量與教學關係及評量策略的探討等議 題,探討評量的重要性與影響力。 關鍵詞:教學、評量、公平、科學教育 此,本文擬就評量改變的本質、評量與教學 關係及評量策略的探討等議題,探討評量的 重要性與影響力(圖 1)。 圖 1 、評量相關議題。二、評量本質的演變
根據 Duschl 和 Gitomer(1991)回顧概念 改變的模型發展時,指出科學理論的發展是 整體性的觀點,亦即一旦科學理論有所改變 時,對應的研究方法和研究目的也自然而然 地 隨 著 改 變 。 評 量 的 改 變 , 也 是 同 樣 的 情形;當評量的理論改變時,它所伴隨而來的 目標、方法亦隨著改變。以下從兩方面論述 評量改變的本質(圖 1),一是當代科學哲學的 觀點對教學、學習本質的改變,進而影響評 量的本質(張文華和郭重吉,1995)。二是基於 時代變遷,修改以往不符社會需求的教育目 標,而在評量方法、內容、策略也必須改變 並與之相配才能達成評量的有效性。有關這 兩方面的論述,本文將分述於後:
(一)科學哲學觀點改變
D e n z i n 和 L i n c o l n ( 1 9 9 4 ) 認為「派典 (paradigms)」代表個人對世界觀、世界本質 是單一的,而且知識是客觀獨立存在於觀察 者之外。因此,在方法論上主張研究者能藉 由客觀觀察,發現事件的真相及事件如何運 作。 相對地,以目前頗受教育界肯定的建構 主義取向觀點,則認為實體是多元、是由社 會建構而成的;知識並非獨立於認知主體之 外,知識是研究者與被研究者在互動中創造 出來的。觀察者所觀察到的現象,是觀察者 帶者某種理論所表達出來的,並非客觀獨立 存在於觀察者之外。因此,在方法論上主張 的觀點,可以被當作是一種基本信念系統, 並用它來處理哲學上有關本體論(ontology)、 知識論(epistemology)和方法論(methodology) 上的問題。本體論(ontology)所討論的是實體 (reality)的形式與本質是什麼;知識論(episte-mology)所討論的是知識與認知主體間關係、 知識的本質是什麼;方法論(methodology), 探討如何找出認知主體認為可相信的事物。 然而,不同派典對於本體論、知識論與 方法論看法不同(Guba & Lincoln ,1989) (如表 1),這種不同造成對教學、學習和評量這三 者的看法不同。傳統派典,主張實體(reality) 詮釋的 / 辯證的方法論,由研究者與被研究者 重新建構事件真相。 上述這兩種不同派典,對教學、學習和 評量這三者的看法有所不同,以下分別以傳 統取向、建構主義取向來探討這三者之差異 與轉變。 1.傳統派典取向 Guba 和 Lincoln (1989)認為傳統的評量 幾乎是獨遵科學的方法(exclusive scientific), 所持的本體論立場是實證主義的假設 -- 認為 具有客觀的實體(reality)存在,而觀察者可以 表 1 、傳統派典與建構主義派典比較(Guba & Lincoln ,1989,p.84)傳統的信念 本體論(ontology) •存在唯一的實體,且獨立於觀察者。 •真理被視為與實體同義。 知識論(epistemology) •二元,客觀的知識論 方法論(methodology) •干擾者的方法論(interventionist) 建構主義信念 本體論(ontology) •實體是多元、相對,是社會建構而來 •真理被定義為多數人共同建構。 知識論(epistemology)) •單一,主觀的知識論 方法論(methodology) •詮釋(hermeneutic)方法論
客觀獨立毫無偏見的對被觀察者進行觀察。 由於認為知識是客觀獨立於學習者之外,觀 察到的結果與學習者本身經驗無關。因此, 「學習」被認為是刺激與反應的連結,「教學」 就被認為是不斷透過反覆練習而讓學習者精 熟,而「知識」就被當作是不斷的累積事實與 基本技能( D o r a n , C h a n & T a m i r , 1 9 9 8 ; Birenbaum & Cochy,1996,p.5)。對於評量的 結果,被認為就是事實如何運作及事件的真 相。
Guba 和 Lincoln (1989)所著第四代評量 (Fourth generation evaluation)之前三個世代, 都是基於傳統派典,強調以客觀和量化來證 實理論及命題時的線性、邏輯化過程,並將 洞察力、直覺、創造思考等非理性因素排除 於探究過程外。因此,傳統派典下強調評量 結 果 之 權 威 性 與 客 觀 性 ( 張 文 華 和 郭 重 吉 , 1995)。 在 上 述 傳 統 派 典 之 學 習 情 境 下 , 是 非 題、選擇題、配合題等客觀性的評量方法, 就成為最常用的評量方式。然而,這樣的評 量方式卻衍生出一些問題,如:無法評量學 生解決問題能力及情意方面技能、扭曲教學 本質及考試領導教學等缺失( B i r e n b a u m & Cochy,1996)。因此,改變評量方式以導正教 學成為很重要課題。 2.建構主義取向 基於上述取向評量缺失,新派典取代由 此產生。從建構主義的觀點來看, Guba 和 Lincoln (1989)主張實體並非客觀的存在於學 習者之外(reality are not objectively out there), 實體是人們建構的結果。而新的學習觀著重 提升解決問題及高層次思考的評量。在教學 策略上要求能幫助學生發展學習的能力,並 在真實的情境中解決問題( D o r a n , C h a n & Tamir,1998)。 根據 Guba 和 Lincoln (1989)的想法,第 四代評量特點如下:就評量的結果而言,並 非針對真相如何或事實如何運作所進行之描 述,而是評量者與被評量者在情境中意義化 後共同建構出來的。所發現的並非事實(fact) 而是彼此互動建構的結果,而建構的結果與 特 定 的 情 境 、 心 理 、 社 會 、 文 化 、 情 境 相 關;就評量過程而言,評量是被委託者、評 量 者 、 被 評 量 者 等 相 關 人 員 共 同 參 與 的 過 程,而不是評量者因其專業性主導,忽略其 他參與者,造成被評量者漠視評量結果或不 滿意;就被評量者而言,強調對被評量者人 格、尊嚴、過程、結果及隱私的尊重。雖然 傳統評量也注意到這樣的問題。但第四代評 量已達到全面參與(full participate)的層次 --被 評 量 者 --被 視 為 共 同 參 與 評 量 的 設 計 、 實 施、及結果的解釋等。被評量者被視為人而 非物化成研究的對象。
(二)教育目標的改變
不 同 時 代 背 景 下 所 強 調 的 教 育 目 標 不 同,因而所要評量的標準、方法亦不同。十 九世紀中期,教育的目標是為工業社會培育 具 有 基 本 技 能 的 人 ; 而 在 進 入 資 訊 化 、 多 元、持續變動的廿一世紀,教育的目標是讓 人能獨立獲取知識,並利用它來解決問題(Bi-renbaum & Cochy, 1996,p.4)。在美國國家科 學教育標準中(National Research Council, [NR-C],1996)揭示了科學素養的重要性,而一位具有科學素養的廿一世紀公民,必須能夠不斷 學習、進行推理、創造思考、做決定及具有 解決問題的能力。因此,評量目標將改變以 往 著 重 調 零 碎 片 段 知 識 , 而 較 強 調 知 識 結 構、解決問題能力,並強調教師、學生及同 儕參與的評量(如表 2)。 討論。
(一)評量所扮演的角色
根據 Jorgensen 和 Shymansky (1996)主張 評量具有執行目標、監控達成目標的過程、 明確的改變教師的角色(由知識的傳輸者轉變 成思考的促進者)的功能。 White 和 Gunstone (1996)認為如果用狹隘的方式來評量學生的理 解狀況,則學校所能提昇的理解能力將受到 限制,而且是侷限於某個方向。 Gipps 和 Mu-rphy (1994) 認為評量具有確認學生學會什 麼、未學會什麼及學習困難所在的角色。這 種角色的評量,稱為形成性評量(formative as-sessment)。若把評量當作是提供評鑑的訊息 給老師,則它扮演的角色是一種選擇與證明 的角色,經常在學習告一段落之後實施,稱 為總結性評量(summative assessment)。 換言之,如果希望評量能促進教學,則 評量不應放在學期末。評量如果放在教學之 後,那麼評量並不能幫助教師作任何教學判 斷。評量應是連續的過程,讓教學者經由學 習者對評量的回應中獲得一些訊息,以作為 教學上修正的依據。因此,評量可改變教與 學,評量是教育改革的中心(Jorgensen & Shy-mansky, 1996)。此時評量將超脫「我們教所 要考的內容(we teach what we test)」爭論。(二) 評量方式對教與學的影響
Carter 和 Berenson (1996)認為評量方式 的改革,對學生的學習與教師的教學有決定 性的影響。如果教師仍停留在使用選擇題、 是非題、填充題的評量方式,則教學將停留 於呈現教科書內容,學習也將局限在評量所 能達到的範圍。因此,如何改變學生的學習 表 2:評量標準的改變(NRC,1996,p.100) 較不強調 評量所有易測量的 評量零碎的知識 評量科學知識 評量學生不知道的知識 評量著重成就 教師做最後的評量 評量出測驗專家發展 較強調 評量最有價值的 評量好的結構知識 評量科學性瞭解與推理 評量學生已經知道的知識 評量成就及學習機會 學生參與自我的評量 教師參與發展外在的評量 基於上述教育目標的改變與科學哲學觀 點的改變,對於評量本質的看法有所不同。 在進入廿一世紀之際,教育的目標,轉變為 提升學習者自我思考以解決問題;所要培養 的 學 習 者 , 不 是 以 記 憶 為 主 的 獲 得 知 識 方 法 , 而 是 強 調 學 生 主 動 建 構 知 識 , 應 用 知 識;而對評量的觀點,不再是記憶、量化之 單一取向,而是以符合情境、學科和學生個 別差異的多元化取向評量。三、評量與教學的關係
教 學 與 評 量 , 猶 如 一 種 互 為 鏡 像 的 關 係。在評量的鏡像中可以反映出教學目標是 否 達 成 , 在 教 學 實 況 中 則 反 映 出 評 量 的 目 標。評量在教學中扮演怎樣的角色,對教學 的影響又是怎樣呢?以下針對這些問題加以方式及教師的教學型態,評量扮演很重要的 角色。 在 Project 2061 改革藍圖中,回顧課室評 量(classroom assessment)、州的評量及國家評 量等三個層次的評量實況發現,教室的評量 對學生的學習影響最大(American Association for the Advancement of Science,AAAS,1998)。 而一般教室中教師所設計的評量,大多偏向 紙筆測驗,著重學生記憶。雖然,要用不同 的評量方式才能測出學生在實作表現、成就 表現,但證據顯示教師由於未受過有效的評 量 方 法 訓 練 , 大 部 分 教 師 不 願 改 變 評 量 方 法。此外,由於時間考量,教師大都侷限於 採用簡答、是非題等評量方式。因此,評量 策略的研發,也成為科學教育的研究者所重 視的課題。 連瑞琦(1998)探討數學科採用實作評量方 式對學生數學成就與態度的影響,採用單因 子獨立樣本實驗設計進行研究。實驗一組採 用實作評量與討論教學;實驗二組採用實作 評量與講述教學;實驗三組採用傳統評量與 講述教學。並將研究樣本 102 人隨機分派為 三組,各組經八次實驗處理。結果顯示實作 評 量 對 學 生 數 學 的 成 就 提 昇 , 並 無 顯 著 幫 助。 而宋文菊(1998)則針對國小學童閱讀理解 實作評量上的表現進行研究,結果顯示:實 作評量對閱讀瞭解能力評量,是一個適切的 工具。實作評量可區辨不同國語成就學童之 閱讀理解類型。實作評量能測量到學生的閱 讀理解思考歷程。曾嘉琪(1995)針對「教學及 評量改進班」進行研究,結果顯示:教學及 評量改進班學生比普通班學生更喜愛學習、 更主動學習。在教師方面,不同性別、教育 背景的教師,其教學的生動活潑及評量多元 程度,並沒有顯著差異。但教師的教學歷程 因素與教學相關因素,對學生的表現具有影 響。 桂怡芬(1996)針對自然科實作評量的效度 進行研究,結果顯示:實作評量影響學生學 習 態 度 的 改 變 , 在 實 驗 時 態 度 趨 於 積 極 主 動;同時在準備考試的方式與學習焦點上會 特別注意有關實驗教學的內容,並有助於學 生實驗操作能力的提昇。對教師的影響上, 實作評量有助於診斷學生學習困難,提供教 師教學上的反省。 林純年(1998)以研究概念圖建構對學習的 影響,採用準實驗研究法的不相等組前後測 設 計 , 以 國 小 四 年 級 學 生 四 個 班 為 研 究 樣 本,其中兩個班分派為實驗組,另兩個班為 控 制 組 。 實 驗 組 接 受 六 個 單 元 概 念 構 圖 訓 練,並在閱讀資料後,實際構圖;控制組則 自行閱讀資料,不須構圖,但兩組都接受閱 讀測驗。結果顯示:當評量題目類型是較偏 重訊息記憶或答案較封閉時,概念構圖學習 方法與一般學習方法並無顯著不同。但是, 當評量的類型較著重知識整體和關聯時,概 念構圖學習方法優於一般學習方法。 Shieh 和 Tuan(2000)研究有關教師教學型 態與評量方式關係,採用問卷方式調查學生 對 於 評 量 、 學 習 進 步 及 評 量 與 教 學 型 態 關 係,並以卡方考驗分析。結果顯示教師上課 方式主要以講解為主時,其評量方式以採用 習作、傳統考試為主;以學生操作為主的教
學活動,則其評量方式是以實驗操作為主。 由此顯示評量方式與教學型態有著密不可分 的關係。 從連瑞琦(1998)研究顯示實作評量對於數 學成就提昇、態度的改善並無顯著提昇。但 在宋文菊( 1 9 9 8 ) 、曾嘉琪( 1 9 9 5 ) 、桂怡芬 (1996)研究卻顯示實作評量對於瞭解學生閱讀 能力、閱讀理解類型、提昇學生興趣、教學 歷程等項目上有顯著的幫助;Shieh 和 Tuan (2000)研究亦顯示評量方式與教學型態具顯著 關係;林純年(1998)的研究亦顯示評量類型若 著重知識整體和關聯時,採用概念圖學習較 為有效。因此,有關評量對於教學與學習的 影響,甚為分歧有待進一步瞭解。
(三)評量取向之教學
Foster 和 Heiting(1994)提出教學與評量 是互為鏡像(mirror image)的觀點,認為評量 指引教學,教學引導評量;事實上,如果以 學生的行為、行動及想法為評量,則教學活 動將被評量所引導;並認為即使現今強調的 動手做評量(hands-on assessment),依舊是基 於教學與評量是各分開的基本假設。 Gallagher(2000)提出融入式評量(embedd-ed assessment)的想法,企圖將評量融入教學 過程中,而不是把評量放在教學後所進行的 傳統評量。因此,融入式評量與教學、學習 之間的界線是模糊的。根據 Gallagher, Parker 和 Ngwenya (1999)所定義的融入式評量,是 指教師利用獲得學生理解的知識,引導教學 順序的評量。教師由蒐集學生理解之資料作 為教學之用,並藉由這樣的評量方式,教師 改善自己的教學。Gallagher, Parker 和 Ngwenya (1999)提出 融入式評量的三大步驟,以說明教師教學時 的行動。第一、蒐集有關學生在學習時的想 法;第二、深入分析所蒐集到訊息,以瞭解 學 生 困 難 所 在 ; 第 三 決 定 下 一 個 的 教 學 步 驟。 研究顯示融入式評量,對於提升教師之 學習環境有顯著幫助;再者,融入式評量促 進學生的理解與應用科學知識上的成功,進 而增強了學生學習動機(Gallagher,2000)。就 研究結果而言,融入式評量達成當代教育改 革的目標 -- 加深學生的理解、應用科學知識 能力,是值得一試的評量方法。
四、評量策略的探討
McMillan(2000)認為好的教學可藉由評 量激發學生學習動機,並與教學和學習的理 論一致。而好的評量是有效的(valid)、公平的 及道德的(fair and ethical)。公平包括無偏見 (absence of bias)、公平的處理(equitable trea-tment)、公平的學習結果(equality in outcome-s)。針對評量的有效性及公平性問題,分述於 後:(一)評量的有效性
評量的目的在於瞭解實況,但在不同情 境下該採用何種評量模式和內容來評量最為 有效,是一個值得探討的問題。由於傳統以 紙筆測驗方式進行評量,無法反映出教學目 標,因而要求改變評量方式呼聲日起。要怎 樣才能達到到真確的評量(authentic assessme-nt),簡單的說,評量應包括學生做功課時最 有價值、有意義的事項。 Carter 和 Berenson(1996)認為真確的評量(authentic assessment) 包括晤談(interview)、小組解題(group prob-lem solving)、歷程檔案(portfolio)、概念圖、 實作評量、開放性問題(open-ended)。 以實作評量(Performance assessment)為 例,這種評量是用來測驗學生應用知識和技 能於真實情境中的能力,與傳統著重於事實 和零碎的技能有所不同。實作評量企圖藉由 學生處於真實情境中主動解決問題,以呈現 學生的真實能力。以科學教育的目標來看, 藉由實作評量能瞭解學生高層次思考能力, 這種評量才是不偏廢的全方位評量(陳文典、 陳義勳、李虎雄, 1 9 9 5 ) 。根據陳文典等人 (1995)進行實作評量的研究結果顯示我國學生 傳達與獨立作業能力不足;在察覺問題、規 畫工作、及獨立判斷上亦不足;凡涉及敘述 方式問題,回答顯得簡略不全;在涉及實驗 時,大都忽略其他變因的影響。在採用實作 評量可行性上,李虎雄和黃長司(1995)的研究 指出實作評量題目的設計不成問題,但評分 卻 是 一 大 負 擔 , 因 此 , 在 採 用 實 作 評 量 時 「評分」問題必須加以考慮。 陳華傑(1998)研究發現,採用實作評量, 對於解決問題之過程技能和思考智能有很好 的評量效果;紙筆評量,對於科學概念的認 知及應用有很好的評量效果;媒體評量,利 用 影 帶 呈 現 的 現 象 為 題 目 , 由 其 中 獲 得 資 訊,此種方式很容易得知受測者應用所學以 解決問題的能力;而心得論述的評量可以得 知學生對於綜合性概念及情意方面體會;至 於成果發表,則能夠表現學生對於整體事件 的評鑑。 黃智信(1998)認為一個真確的評量(authe-ntic assessment)應該是提供一個實際問題,然 後觀察學生如何解決它,但實施上考量,受 測人數、教師教學負荷下並不可能。該研究 構想能否能設計一個具實作評量特性,卻又 能大量施測的評量方式。並以「密度壓力浮 力的測量」、「人體呼出氣體」為主題,分別 設計「實驗設計測驗」、「實作測驗」、「填 充題」、「選擇題」等四種不同評量工具。結 果顯示:「實驗設計測驗」、「實作測驗」在 能力的判別上比「填充題」「選擇題」為高, 可用來評量學生在處理問題過程中的缺失。 在可行性上發現,實作評量所需時間是「填 充題」、「選擇題」的三十倍。 從上述陳文典等人(1995)、李虎雄和黃長 司(1995)、陳華傑(1998)及黃智信(1998)等研 究顯示,各類評量方式各有其適用性範圍。 若 評 量 的 目 的 是 在 瞭 解 學 生 高 層 次 思 考 能 力,則可採用實作評量,但在評分卻是一大 負擔;若目的是評量學生在處理問題過程中 的缺失,則可採用「實驗設計測驗」、「實作 測驗」,但所需時間是一大負擔;若目的是 評量學生對於科學概念的認知及應用,可採 用紙筆評量;若目的是評量學生應用所學以 解決問題的能力,則採用媒體評量;若目的 是評量學生綜合性概念及情意方面體會,則 採用心得論述;若目的是評量學生對於整體 事件的評鑑,則可採用成果發表方式。
(二)公平的評量
科學教育研究者一直致力於研究如何將 評量達到公平,但是,近幾年的研究證明要 達到這樣的目標,並不是簡單的事情(Parker& Rennie,1998)。在英國、美國及澳洲的研究 顯示,影響公平的評量的重要向度是:學生 的背景及世界觀。 Popham(1995)認為評量工 具的設計,除了以信度、效度作為判準外, 另外提出第三個判準 -- 評量的偏見(assessme-nt bias)。評量的偏見涉及有關評量工具是否 因受測者的性別、種族、宗教、社經地位的 不同,造成對受測者傷害或不公平。 美國國家科學教育標準中(NRC,1996)提 出全民的科學素養目標,要達到這樣的目標 唯有讓所有的學生都有均等的機會(equal opp-ortunities)學習科學(Gipps & Murphy,1994)。 而要達到均等的學習機會,則評量必須是多 面向的(multifaceted),以讓學生能利用個人 的學習風格及能力,表現在不同的評量類型 上(Doran, Chan & Tamir,1998)。因此,就教 師的教學而言,要瞭解不同學生的學習風格 與能力以做為改進教學,則評量方法必須因 學生而有所變化,如此才能普遍瞭解學生不 致造成不公平。 1.不公平評量的來源 評量工具的公平性,可以從兩方面來討 論:評量內容的設計與評分標準。首先在評 量內容方面, Popham(1995)認為評量內容如 果發生評量的偏見(assessment bias),將扭曲 學生的表現而引發不公平。這種評量的偏見 包括:攻擊(offensiveness)和不公平的待遇(u-nfair penalization)兩種形式。如果評量的內容 攻擊某個族群學生,則這項評量的過程是有 偏見的,而這種偏見常常出現於將某個族群 負面的刻板印象呈現在評量中。例如將男性 描繪成高收入與較有聲望的一群( 如:太空 人、物理學家),而將女性描繪成低所得和低 聲望的角色(如:家庭主婦、店員)。不公平的 待遇,是指評量內容雖不至於有攻擊性,但 卻不利於某類學生。例如:讓女性進行不熟 悉的競爭性運動。 在評分標準方面的不公平現象,大多發 生於開放性問題評分上的不一致。依 Popham (1995)所提出的評分者上評量偏見有:慷慨誤 差(generosity error),是指高估學生表現實際 上學生並沒有表現很好;嚴厲性誤差(severity e r r o r ) 指 低 估 學 生 表 現 ; 中 心 傾 向 誤 差 (central-tendency error),認為學生不可能太 好或太差;光環效應(halo effect),認為學生 平常表現很好(或很差),在這項測驗上也是很 好(差)。 綜合上述,有關不公平現象的產生,是 由於評量設計者,在評量內容的設計與評分 的標準所造成。評量除了考量信度、效度之 外,評量者的偏見是不可忽視的重要向度。 2 公平的評量策略 為了要使評量變得公平,Parker 和 Renn-i e ( 1 9 9 8 ) 提出要達到公平評量的三個先決條 件: ( 1 ) 課程的真實度( C u r r i c u l u m f i d e l i t y ) 。 這項條件是呼應 Lawrenz (1991)所提課 程、教學過程和評量,三者必須達到一致。 Parker 和 Rennie(1998)認為從 1960 年以來, 課程的改革者並未考慮到公平的評量(equit-able assessment);在 1990 年代,科學教育的 教學進入了哲學改變的時期,期望科學能被 廣泛的學生瞭解。建構主義的知識論改變了 科學教學與學習的策略,更加強調採用小組
合作學習及持續發展語言與溝通技巧。這樣 的改變,反映出學生族群的多樣化學習風格 (multiplicity of learning style);如果這些議 題能被注意,透過多樣性的評量風格(assess-ment style),學習風格的多樣性(diversity of le-arning style)將與課程改革的目標達成一致(G-affney,1992)。 ( 2 ) 多樣性和機會( d i v e r s i t y a n d o p p o r t u n -i t y ) 評量的目的如果在於讓學生真實地展現 學習成果,以作為教學改進參考。評量方法 必須能讓所有的學生與小組,擁有最大的機 會去呈現所有已經知道的、理解的、能做的 學習成果(Parker & Rennie,1998)。因此,所 有 阻 礙 學 生 展 現 學 習 表 現 的 評 量 應 被 以 避 免;所有能讓學生展現學生學習成果的方法 應予鼓勵,才能達到公平的評量。 ( 3 ) 價值和倫理( v a l u e a n d e t h i c s ) 要達公正和公平評量的第三項先決條件 是:對於評量結果之解釋,在不同群學生不 同型式評量和相等的表現(equivalent perform-ance)應持等值態度(Parker & Rennie1998,p. 899)。 從上述探討有關公平的評量議題中,首 先,從教育的目標而言,必須使學生達到學 習機會的均等。但這樣的學習機會均等,必 須基於學習者學習風格所做的考量,而並不 是齊頭式的機會均等。再者,既然強調學生 學習時的學習風格以達到學習機會的均等, 那麼評量也必須是多面向的,以使學習者在 最有利情況下展現出學習成果,如此才是達 到所謂公平的評量。最後,就學習的本質而 言,影響學生學習的因素除了學習者學習風 格外,學生的背景、種族、宗教、社經地位 等都將影響學習成果。因此,在評量時必須 考量這些不公平的因素是否產生,才能達到 所謂的公平。
五、結語
綜合以上文獻中有關評量議題之探討, 對於評量提出以下見解。分別敘述於後:(一)評量的本質
「評量」是利用各種不同的方式獲得關於 學生學習狀況的訊息,回饋教師,做明智教 學決定,以培養學生各種能力健全地發展, 達成最大教學效果。因此就提供教師教學改 進而言,評量的本質應該是以提升學習者的 學習(Davis, 2000)為第一要務。 早在多年前在德國 Dr. Bambach 對於「評 量」就有所謂「激勵,非評分」的評量觀點。 德國歌汀根基礎小學:H a i n b u n d s c h u l e 小 學, Weiland 女士提倡「沒有分數評量的小 學」方案。這些評量改革計畫著眼於認為能 力表現評量,造成能力階層、惡性競爭、助 長社會不公平現象(引自陳惠邦,民 89)。然 而國內,教師與學生尚且停留於「分數取向」 觀點(Shieh & Tuan,2000;謝祥宏和段曉林, 2000),此現象亦亟待進一步探討與改善。(二)評量與教學的關係
教學與評量,本是一體的。但是,大多 數老師將教學與評量分開。 Gallagher(2000) 所提出的融入式評量的觀點,可以說是教學 與評量關係的最佳寫照 -- 評量與教學、學習 之間的界線是模糊的。在研究中發現教師教學方式、評量方式、學習者學習方式,三者 彼此互相影響( 連瑞琦, 1 9 9 8 ; 宋文菊, 1 9 9 8 ; Carter & Berenson,1996; Parker & Rennie,1998; S h i e h & T u a n , 2 0 0 0 ) 。然而,正如 P h i l i p Gammage 所說「沒有人會因為一再被測量而 長高」一樣(引自吳麗君,2000)。學習方式的 改變,不全然是評量方式所造成。評量方式 所引發的各種變化,可能帶動教學品質的改 進或產生不同班級氣氛、….等,這些才是影 響教學、學習成效之因素。因此,在評量的 改革運動中找出這些中介因素,才是企圖以 評量改進教學的研究者最重要的課題。
(三)公平的評量 -- 多元評量觀點
承上所述,教師的評量方式對於學生學 習方式產生影響。如果用狹隘評量觀點,則 窄化了學生的學習。再者,學生之學習風格 各有不同,執著於某類型評量方式,對於另 類學生亦產生不公平(Parker & Rennie,1998), 因此,唯有多元評量,才能與學生多種學習 風格匹配(Gaffney,1992)。而多元評量不僅是 指評量方式的多樣性,而更重要的是在評量 目標、評量對象、評量時機、評量標準的多 樣性。(四)對未來研究之啟示
研究指出教師與學生對「評量之看法」、 「對教學與評量關係的看法」不盡相同,學生 深受評量方式之影響(謝祥宏和段曉林,1999; Shieh & Tuan,2000)。教師對於評量之看法, 本 質 上 是 對 於 知 識 論 、 本 體 論 上 觀 點 之 不 同。因此,要探討教師與學生對評量知覺之 交互影響,未來的研究可從教師所持的知識 論、本體論之觀點,探討教師評量信念對學 生學習之影響。參考文獻:
吳麗君(2000):交互損益見真章 -- 談英國 國課程評量的來時路。課 程 與 教 學 季 刊 , 3(1), 78-94 。 宋文菊(1998):國 小 學 童 在 閱 讀 理 解 實 作 評 量 上 的 表 現 分 析 。國立臺南師範學院國 民教育研究所碩士論文(未出版)。 李虎雄、黃長司(1995):美國馬里蘭州實作 評量工具在台灣施測的可行性。科 學 教 育 月刊, 179 , 41-49 。 林純年(1998):概 念 圖 對 國 小 學 童 自 我 學 習 科 學 說 明 資 料 之 影 響。國立台南師範學 院國民教育研究所碩士論文(未出版)。 桂怡芬(1996):自 然 科 實 作 評 量 的 效 度 探 討 。國立臺北師範學院國民教育研究所碩 士論文(未出版)。 張文華、郭重吉(1995):科教革新中評量理 念的重建。教 育 研 究 雙 月 刊 , 4 5 , 2 3 -30 。 連瑞琦(1998):實 作 評 量 對 國 小 學 生 數 學 成 就 與 態 度 的 影 響 。南華管理學院教育社 會學研究所碩士論文(未出版)。 陳文典、陳義勳、李虎雄和簡茂發(1995): 由馬里蘭州的學習成就評量與其在台灣試 測的結果看 -- 實作評量的功能與運用。科 學教育月刊, 12 月, 2-11 。 陳惠邦(2000):在保守的傳統中謹慎前進: 德國小學教師評量信念與實踐研究。新 竹 師院學報, 13 , 245-264 。 陳華傑(1998):不 同 評 量 模 式 的 評 量 效 果分 析 。國立台灣師範學大學物理研究所碩 士論文(未出版)。 曾嘉琪(1996):臺 北 市 國 民 小 學 試 辦 教 學 及 評 量 改 進 班 之 評 鑑 研 究。國立政治大學 教育學類研究所碩士論文(未出版)。 黃智信(1998):情 境 真 實 程 度 對 評 量 功 能 的 影 響 。國立台灣師範學大學物理研究所 碩士論文(未出版)。 謝祥宏、段曉林(1999):國 小 自 然 科 教 師 教 學 與 評 量 相 關 變 項 之 研 究。第三屆數理 教學及師資培育研討會。彰化:國立彰化 師範大學主辦。 謝祥宏、段曉林(2000):國 中 學 生 對 於 理 化 科 評 量 看 法 之 研 究 ,中華民國第十六屆 科學教育學術討會論文彙編。台北:國立 台灣師範大學主辦。
American Association for the Advancement of Science.(1998). Blueprints for reform
-S c i e n c e , M a t h e m a t i c s , a n d T e c h n o l o g y e d u c a t i o n . New York: Oxford University
Press.
Birenbaum, M. & Cochy, F. J.R.C.(1996).
Alternatives in assessment of achievements, l e a r n i n g p r o c e s s , a n d p r i o r k n o w l e d g e.
Boston: Kluwer academic publishers. Carter, G. & Berenson, S. B.(1996). Aut-hentic assessment: vehicle for reform. In Rohton, J. & Bowwers, P. (Eds), Issue in
S c i e n c e E d u c a t i o n (pp.96-106). Virginia:
NSTA.
Davis, N.(2000). Using assessment as a to
ol for educational reform , Paper presented
at the annual meeting of the Southeastern Association of Educators of Teachers of Science, Auburn, Alabama, October, 2000. Denzin, N. K. &Lincoln, Y. S. (1994).
Ha-ndbook of qualitative research . Thousand
Oaks, London: SAGE.
Doran, R., Chan, F. & Tamir, P.(1998)
Sc-i e n c e E d u c a t o r ' s g u Sc-i d e t o a s s e s s m e n t .
Virginia: NSTA.
Duschl, R. A. & Gitomer, D. H. (1991). Epistemological perspectives on conceptual c h a n g e : i m p l i c a t i o n s f o r e d u c a t i o n a l practice. J o u r n a l o f R e s e a r c h i n S c i e n c e
Teaching , 28(9), 839-858.
Foster, W. G. & Heiting, A.W. (1994). Em-bedded assessment. Science and Children , October, 30-33.
Gaffney, K. E.(1992).Multiple assessment for multiple learning style. Science Scope, March, 54-59.
Gallagher, J.(2000). Implementing needed
reforms in science education: research and development to enhance understanding and application of knowledge. Paper present in
Second International Conference on Science, Mathematics and Technology Education Gallagher, J., Parker, J., & Ngwenya, L. (1999). Embedded assessment and reform
o f s c i e n c e t e a c h i n g a n d l e a r n i n g . I n
preparation.
Gipps, C. & Murphy, P.(1994). A fair test?
University Press.
Guba, E. G. & Lincoln, Y. S. (1989).Fourth
generation evaluation. Sage publication: The
i n t e r n a t i o n a l p r o f e s s i o n a l p u b l i s h e r Newbury Park London New Delhi.
Jorgensen, M. A. & Shymansky, J. A. (1996). Assessment in science: A tool to transform teaching and learning. In Rohton, J. & Bowers, P.(1996,eds) I s s u e i n S c i e n c e
Education, NSTA.
Lawrenz, F. (1991). Research matters--to the science teacher, authentic assessment,
NARST News, 33,15-17.
McMillan, J. H.(2000).Fundamental assess-ment principles for teachers and school administrators. P r a c t i c a l a s s e s s m e n t , r e
-search & Evaluation, 7(8). Http://ericae. net/
pare/getvn.asp?v=7&n=8
National Research Council (1996). N a
-tional science education standards. Na-tional
Academic Press, Washington, D. C.
Parker, L. H. & Rennie, L. (1998). Equitable assessment strategies. In B. J. Frase & K.G. Tobin (eds), International Handbook of
Sci-e n c Sci-e E d u c a t i o n, P a r t T w o (pp. 897-910).
Virginia: Kluwer academic Publishers. Popham, W. J.(1995).Classroom
assessm-ent What teachers need to know . Boston :
Allyn and Nacon.
Shieh, S. H. & Tuan, H. L.(2000).
Elemen-tary students' perceptions of assessment of the science class. Paper present in Second
International Conference on Science, Math-ematics and Technology Education, Taiwan. Torrance, H. (1995).The role of assessment in educational reform. In Torrance, H.(1995).
Evaluating authentic assessment: problems a n d p o s s i b i l i t i e s i n n e w a p p r o a c h e s t o assessment. Open University Press.
White,R. & Gunstone. R. (1996). P r o b i n g
U n d e r s t a n d i n g . New York: The Falmer