研究動機

第一章緒論

第一節研究動機

有鑑於國內教育與升學體制的改革風潮，諸如十二年國民基本教育正式上路，

為達到學生學習監控、教師教學與評量專業的提升，暨服膺學生學習成果的目標，

所啟動入學考試暨班級評量的變革，因而引領與過去傳統測驗迥異之創新教育評量技術發展的趨勢，諸如多元題型暨標準本位評量 (standards-based assessment, SBA) 的發展，均朝向評量目的不僅止於評估學生的能力，更要瞭解其學習上的困難，以協助孩子的學習。基此，標準本位評量立意有四，一則教師可藉由清楚界定表現標準與評分等級之評分規準 (scoring criteria)，瞭解所要評估的特點或範疇，

藉以釐清教學目標；二則促進學生瞭解學習目標，據以進行修改和評估學習狀況；

三則提高評分結果的客觀性與公平性；四則可使家長瞭解孩子的學習內容與學習目標，裨益積極有效協助孩子的學習。

過去傳統測驗係為常模參照測驗 (norm-referenced test)，主要依據應考生之測驗分數對照其在團體中的相對位置所衍生的測驗解釋，目的在區別學生之間的成就水準，不僅無法指出學生學習到什麼暨還未學到什麼，更致強化群體間競爭、

排序的壓力（郭生玉， 2004 ）。然相對於常模參照測驗，標準參照測驗 (criterion-referenced test) 則強調個體本質能力的解釋，專家會針對每個表現等級提出表現標準的描述，藉以了解學生在某個界定清楚的行為領域的成就水平，係為植基事先訂定的標準所衍生的測驗解釋，並非如同常模參照測驗只注重個人與團體其他考生的比較，而能明確指出學生學習到什麼暨會做什麼。

為協助教師教學暨評定學生學習成果的目的，提供學習能力指標架構之適性

回饋機制 (adaptive feedback mechanism, AFM)，以達到概念釐清與理解之形成性目的，傳統標準測驗實難以滿足現行兼具科學論證表達、科學實驗設計和儀器操作技術，以及應用科學理論解決問題等重要科學能力與素養之教育目標。郭生玉 (2004) 指出試題類型大致可分為兩類，其一為選擇反應型 (selecting response type)，

受試者需從所提供答案中選出較適當的選項，諸如：是非題、選擇題或配合題，

其二則是提供反應型 (supplying response type)，受試者必須根據題幹敘述作答，如填充題 (completion item)、簡答題或申論題 (essay)。其中，申論題係要求受試者依據題幹說明，組織、建構暨闡釋想法，反應有文字敘述的答案，不僅能夠測量敘述與程序知識，還能評測記憶、組織與想法啟發等高階認知能力(Valenti, Neri, &

Cucchiarelli, 2003)。另Toranj 與 Ansari (2012) 指出回饋 (feedback) 能夠促使學生瞭解別人對其申論寫作的反應，並能從中學習。

Valenti、Cucchiarelli 與Panti (2002) 指出，現行多數評量工具均植基於客觀性的題型 (objective-type questions)，諸如選擇題 (multiple choice)、複選題 (multiple answer)、簡答題 (short answer)、配合題 (selection/association) 等，然而有些複雜的學習成就實難以用客觀型態 (objective-type) 的問題來測量。Gronlund (1985) 進一步指出某些複雜成就層次的能力 (complex achievement)，諸如回憶、組織與整合想法的能力、以文字表達自我的能力，暨提供相對於客觀性試題，較不具結構性反應之資料詮釋 (interpretation) 與應用 (application) 的能力，即 Bloom (1956) 6 種思考模式中的綜合 (synthesis) 與評鑑 (evaluation) 之高層次能力，並無法透過客觀性的題型 (objective-type questions) 測量，其必須仰賴建構反應題型方能有效檢測。

Bennett 與 Ward (1993) 則指出建構反應評量 (constructed-response assessments) 檢具很多優勢，但若施行於大規模評量 (large-scale assessment) 則將耗費大量成本及人力。Toranj 與 Ansari (2012) 亦指涉教師常受限於時間及大班教學的限制，因而無法提供即時和準確的回饋給學生。是以，科學建構反應評量是

教育歷程的重要活動，但卻礙於評量工作耗時費力，而難以將其納入正式課程 (Calkins, 1994; Foltz, Laham, & Landauer, 1999)。再者，Kintsch、Steinhart、Stahl、

Matthews 與Lamb (2000) 研究指出科學開放性問答有利於學生概念的理解，然而評分者對於評分規準的詮釋及嚴苛度的變異，令人疑慮評分的客觀性，加上評閱工作耗時費力，是以科學建構反應評量的發展並未受到教師的青睞。然而，科學論證 (argumentation) 暨闡釋 (interpretation) 表達能力係為重要的科學能力與素養，為了檢視學生在科學概念理解的學習發展狀況，開放申論測驗題型可謂一個有效評量工具，既可深度反應學生的知識層次與應用，亦可評量學生的闡釋表達能力，但卻受限該評量方式之客觀與耗時疑慮暨無充分足夠的評量題庫可供使用。

基此，研究者及教育者開始聚焦在建構反應評量暨評量規準的研發與應用 (Toranj

& Ansari, 2012)。

綜整上述，科學建構反應評量 (scientific constructed-response assessments) 暨科學建構反應評量規準 (scientific constructed-response assessment rubrics) 的發展，

係為教師專業教學與學生學習監控的有效利器。科學建構反應評量不僅可以協助

在文檔中科學建構反應評量之發展與研究 (頁 12-15)

第一章 緒論

第一節 研究動機

第一節 研究動機

第一章緒論

第一節研究動機

第一節研究動機