國小綜合活動領域評量活動發展之行動研究-以四年級自編單元為例
全文
(2)
(3) 謝 誌 打開「謝誌」這個檔案,百感交集,最後這一刻,心中承載著滿滿的感激, 多麼幸運在這條學習之路上遇到許多貴人,讓我得以完成這份研究。感謝居澤老 師一路的引領,從體驗教育課程的引導,到鼓勵我報考研究所,不論是課堂上諄 諄教誨,或是研究時的適時提點,都是我得以成長的重要養分;感謝口試委員耐 青老師、妙桂老師撥冗提供寶貴建議,悉心指正,讓這份研究更臻完善;感謝許 多前輩的辛苦研究,並無私地提供經驗分享,讓我得以站在巨人的肩膀上。 感謝在童軍活動這條路上給予我許多指引的夥伴,因為參與了童軍活動,讓 我得以看見人生的另一個可能,並有這個機緣踏入師大公領所;謝謝如一盞明燈 指引我前進的建華團長,不管在童軍活動或學習進修上,始終不遺餘力的提攜; 謝謝聯合社區團所有夥伴,在我進行論文寫作這段時間,對於我活動的缺席的包 容;謝謝多位團長在得知我在進修時,對我學業及論文寫作的鼓勵。 感謝第四屆活動領導班的承修、培榮、乃若、凱欣、宗岳、姿樺、心怡、英 瑞、雅嵐、榕妤、小恬、婉婷、姿伶、伯豪、佳幸,在工作與學業蠟燭兩頭燒的 周末課堂中,總能創造出許多歡樂,為這段研究生活留下美好的足跡。 感謝學年的老師們,在我論文寫作遇到瓶頸時,無私地給予意見,並在研究 過程中提供我許多寶貴的想法;謝謝小侯學長、璟芳姐一路加油打氣,在我抓頭 吶喊時,猛力推我前進,為我的口試提供許多協助;謝謝家榆對英文摘要寫作的 建議;謝謝淑惠、姿婷、衍慶、文傑、志瑋、淑芬,在我寫作壓力爆炸時聽我胡 言亂語;謝謝我親愛的學生們,看著你們成長,你們的貼心與懂事,是我期望透 過研究讓自己教學更進步的動力。 最後,更要感謝我的家人在這段時間的耐心陪伴,給我許多祝福與肯定;謝 謝誌良學長的體諒與包容。想要感謝的人太多了!那就謝天吧!謝謝老天爺給我一 個這麼好的成長機會,給我這麼棒的親朋好友,謝謝你們!讓我得以完成一個階 段任務。.
(4)
(5) 摘 要 本研究旨在透過行動研究探討國小四年級綜合活動領域單元課程依據課綱 能力指標轉化為學生學習成就評量標準之內容與發展流程,並了解評量活動內容 與方式、分析評量活動實施情形、實施困境及其因應策略。 本研究研究結果如下: 一、國小四年級綜合活動領域學生成就評量標準之發展流程可分為: (一)規劃教學單元計畫。 (二)解讀能力指標。 (三)將能力指標轉化為學生學習表現標準。 (四)依據表現標準修正教學目標、教學內容。 (五)依據表現標準轉化為單元評分規準。 (六)依據單元評分規準設計評量方式與評量活動。 (七)同儕教師討論與審核。 (八)實施評量活動。 (九)依據單元評分規準區分學生學習表現,分析評量結果,提出評量示例。 (十)修正評量方式與評量活動內容。 二、分析國小四年級綜合活動領域評量活動的實施內容與實施方式,得知依據學 生學習成就評量標準發展流程規劃單元評分規準、學習評量內容,並依此分 析學生 A-E 五等級表現,此一評量方式確實可行。 三、評量活動實施遭遇時間、表現標準解讀、等級分析耗時、遊戲評量、成績單 系統、學生答題意外等六項困境。提出增加專業對話,評量資料留存、提供 範本,教師評量專業知能再精進、多元評量結果整合、保留彈性評量空間、 補救方式等因應策略。 依據研究結論,分別針對教學場域及後續研究提出相關建議,做為未來研究 之參考。 關鍵字:綜合活動領域、能力指標、評量標準、單元評分規準 i.
(6) ii.
(7) An Action Research on Develop Assessment Activities for Integrative Activities in the Elementary School - A Case of the Self-Designed Curriculum for Fourth Graders Abstract The purpose of this study is to explore the contents and the development process of competence indicators transfering to standard assessment in integrative activities in the fourth grades. This study also attempts to understand the content and methods of assessment activities, analysis of the implementation, and implementing dilemmas and coping strategies. The conclusions were listed as follow: 1.The development process of standard assessment of student achievement assessment in integrative activities in the fourth grades could be divided into the following steps: (1) Planning teaching unit plan. (2) Interpret competence indicators. (3) Transfer the competence indicators to performance standard. (4) Correct teaching goal and teaching content. (5) Transfer performance standard to unit assessment criteria. (6) Design the assessment method and activities based on unit assessment criteria. (7) Examine the questions with peer colleagues. (8) Implement assessment. (9) Distinguish students’ learning performance based on unit assessment criteria, analized results, and provide assessment examples. (10) Revise the content and methods of assessment activities. 2. Analyze the implementation of the assessment activities, received positive result: teachers can plan unit assessment criteria and learning assessment content based on the development process of standard assessment of student achievement assessment, and analyze performance from A to E rank. 3. Implementing assessment have met the difficulties, such as the lack of time, the interpretation of performance standard, analyzing performance from A to E rank is time-consuming, game-based assessment, achievement system, student’s answers was unforeseen. The researcher provides some suggestions: increase professional discussion, retained assessment data, provide for assessment examples, enhance iii.
(8) teacher assessment professional competence, integrate results with multiple assessment, maintain the flexibility in assessment and remedial method. According to the research results, the researcher advised some suggestions for education field and for further studies. Key Words:Integrative activities、Competence indicators、Standard assessment、 Unit assessment criteria. iv.
(9) 目. 次. 中文摘要 ……………………………………………………………… i 英文摘要 ……………………………………………………………. iii. 目次 …………………………………………………………………. v. 表次 ………………………………………………………………… viii 圖次 …………………………………………………………………. x. 第一章 緒論 ………………………………………………………… 1 第一節 研究背景與動機 ……………………………………… 1 第二節 研究目的與問題 ……………………………………… 7 第三節 名詞釋義 ……………………………………………… 8 第四節 研究範圍與限制 ……………………………………… 10 第二章 文獻探討 …………………………………………………… 13 第一節 教學評量的意涵與相關理論………………………… 13 第二節 綜合活動學習領域能力指標與評量內涵…………… 31 第三節 綜合活動教學評量相關研究………………………… 47 第三章 研究方法 …………………………………………………… 51 第一節 研究設計與方法 ………………………………………51 第二節 研究架構與研究流程 …………………………………53 v.
(10) 第三節 研究場域與對象 ………………………………………59 第四節 資料蒐集與處理 ………………………………………62 第四章 研究結果與討論 ………………………………………… 第一節. 67. 國小四年級綜合活動領域學生學習成就評量標準發展 流程………………………………………………… 67. 第二節 評量活動內容與方式 …………………………………83 第三節 評量活動實施過程與實施結果 ………………………92 第四節 評量活動實施困境與因應策略 …………………… 120 第五章 研究結論與建議 ………………………………………… 131 第一節 研究結論 …………………………………………… 131 第二節 研究建議 …………………………………………… 136 參考文獻 …………………………………………………………… 141 附錄 ………………………………………………………………… 147 附錄一 國民中學學生學習成就表現標準(試行)-綜合活動學習 領域表現標準 ……………………………………… 147 附錄二 修正前之綜合活動領域教學計劃簡案 …………… 151 附錄三 訪談大綱 …………………………………………… 156 附錄四 國小四年級綜合活動領域教學計劃 ……………… 157 附錄五 同儕教師討論後修正之學習評量單 ……………… 168 vi.
(11) 附錄六 評量活動實施後修正之學習評量單 ……………… 170 附錄七 單元評分規準與百分比分數對照表 ……………… 171. vii.
(12) 表. 次. 表 2-1 實施要點之變革……………………………………………38 表 2-2 評量原則之變革……………………………………………39 表 2-3 評量方式之變革……………………………………………41 表 3-1 邀請之專家名冊……………………………………………55 表 3-2 預計實施之能力指標………………………………………57 表 3-3 資料編碼規劃………………………………………………64 表 4-1 能力指標 4-2-2、4-2-3 參考細目與補充說明 …………71 表 4-2 能力指標 4-2-2 之表現標準 ……………………………73 表 4-3 能力指標 4-2-3 之表現標準 …………………………… 74 表 4-4 能力指標 4-2-2 之單元評分規準 ……………………… 76 表 4-5 能力指標 4-2-3 之單元評分規準 ……………………… 77 表 4-6 能力指標 4-2-2 之學生學習表現標準及單元評分規準-修 正 ……………………………………………………… 77 表 4-7 能力指標 4-2-3 之學生學習表現標準及單元評分規準-修 正 ……………………………………………………… 78 表 4-8 教學與評量對照表 ……………………………………… 83 表 4-9 主題一評量方式、內容、對應的單元評分規準 ……… 84 表 4-10 主題二評量方式、內容、對應的單元評分規準……… 87 viii.
(13) 表 4-11 主題三評量方式、內容、對應的單元評分規準……… 88 表 4-12 主題四評量方式、內容、對應的單元評分規準……… 90 表 4-13 節能大考驗評量實施分析……………………………… 92 表 4-14 能力指標 4-2-2 之 A 等級表現示例分析……………… 99 表 4-15 能力指標 4-2-2 之 B 等級表現示例分析 …………… 100 表 4-16 能力指標 4-2-2 之 C 等級表現示例分析 …………… 102 表 4-17 能力指標 4-2-2 之 D 等級表現示例分析 …………… 103 表 4-18 能力指標 4-2-3 之 A 等級表現示例分析 …………… 105 表 4-19 能力指標 4-2-3 之 B 等級表現示例分析 …………… 108 表 4-20 能力指標 4-2-3 之 C 等級表現示例分析 …………… 110 表 4-21 能力指標 4-2-3 之 D 等級表現示例分析 …………… 112 表 4-22 能力指標 4-2-3 之 E 等級表現示例分析 …………… 114 表 4-23 本研究評量活動發展與活動實施困境與因應策略……120 表 4-24 學生評量漏寫之示例……………………………………125. ix.
(14) 圖. 次. 圖 2-1 能力指標解讀、轉化整合歷程圖…………………………36 圖 2-2 綜合活動學習領域評量標準事例…………………………42 圖 2-3 國中各領域發展評量活動之架構…………………………43 圖 2-4 參考國中學生成就評量標準發展架構所擬定之評量活動設 計流程 …………………………………………………… 46 圖 3-1 研究架構圖…………………………………………………53 圖 3-2 研究流程圖…………………………………………………56 圖 4-1 評量活動設計流程圖 ……………………………………68 圖 4-2 能力指標 4-2-2 解析圖 ………………………………… 70 圖 4-3 能力指標 4-2-3 解析圖 ………………………………… 71. x.
(15) 第一章 緒論 課程發展的核心在教室,教室的核心在教學與評量(李坤崇,2011b)。過往 的評量方式多以升學為目標的知識性測驗為主,綜合活動領域著重於培養學生具 備生活實踐能力,教學著重引領學生實踐其體驗感知,評量強調多元化的方式, 是綜合活動領域課程特質,然而,顧及學生個別化的差異,以及多元化評量所產 生的分數公平性質疑,也成為「評量標準」需求催生劑。 本研究旨在探討依據課綱能力指標轉化為學生學習成就評量標準內容,並了 解依此所設計之國小四年級綜合活動領域評量活動實施情形。本章共分四小節, 首先敘述進行研究之背景及動機,以此說明本研究之重要性,接著敘述研究目的 與研究問題,並界定相關名詞,說明研究範圍與限制。. 第一節 研究背景與動機 壹、研究背景 日新月異的二十一世紀,教育改革宛如一輛疾行列車,在全球化的競爭壓 力下,為提升國家競爭力,世界各國都十分關注教育問題。自1980年代以來, 為了提升國民素質,歐美等國家展開一連串的教育改革活動,分別從課程、教 學、教師、校長以及行政人力培育,提出一系列的具體改革方案(吳清山,2011)。 新世紀的教育目標已從認知性學習轉為應習得能力之研究,例如1992年澳洲提 出學以致用的七項關鍵能力;1996年聯合國教科文組織提出適應社會快速變遷 的五大關鍵能力構面與21項具體能力;2005年歐盟提出終身學習的八項關鍵能 力;美國於2009年修訂21世紀所有工作者必須具備的四大關鍵能力(張鈿富, 2009)。各國的內涵雖不盡相同,但多強調以學習者為主體,落實學習與生活 的結合。 近年我國亦進行了許多教育政策的改革,其中,中小學九年一貫課程的實施 可謂教育發展的重要里程碑,自2000年公布《國民中小學九年一貫課程暫行綱要》 1.
(16) (簡稱2000年暫綱),到2003年正式完成九年一貫課程綱要(簡稱2003年課綱),教 育部於2008年修正公布之《國民中小學九年一貫課程綱要》(簡稱2008年課綱), 打破了傳統重知識性的學習與課程標準,改以培養具備人本情懷、統整能力、民 主素養、本土與國際意識,以及能進行終身學習之健全國民作為其基本理念。課 程目標在訂定時則從過去的知識學科本位學習中心,改為培養「帶得走的能力」, 強調以生活為中心,配合學生身心能力發展歷程,以適應現代生活。為達此目標, 課程設計轉變為以學生為主體,以生活經驗為重心,明訂十大基本能力,並設定 分段能力指標,學校訂定課程計畫時也要求需包含學年/學期學習目標、能力指 標、對應能力指標之單元名稱、節數、評量方式等(教育部,2008a)。從中可得 知,我國的教育發展強調應以學生為主體,培養學生習得成為健全公民之基本能 力,而為此所訂定之能力指標不僅是課程目標,亦是單元活動設計的依循,此外, 在評量方式上也提出國民中學基本學力測驗之編製、施測應參照國民中小學課程 綱要之能力指標及相關法令之規定辦理,強化能力指標與評量之連結,呼應培養 學生基本能力之理念。 教育是國家發展的基礎,在2014年即將全面實施十二年國民基本教育(簡稱 十二年國教),涵蓋國民中、小學與高中、職及五專前三年,透過國民基本教育 年限的延長,提升國民素質與國家實力,強化國民基本能力,以厚植國家經濟競 爭力(教育部,2012b)。而十二年國教實施後,多數學生可免試入學,升學考試 不再是入學的主要方式,教育部規劃七大項超額比序項目,免試入學制度解開了 為升學而讀書的枷鎖,跳脫單一紙筆測驗,期盼以多元方式了解學生學習狀況。 這一個歷史性的改革,代表著教育要擺脫「升學考試」緊箍咒,國中生可以不再 受「分數」的控制,然而,失去了「考試」的指引,也引發了許多擔憂,教育品 質是否會大幅滑落?如何得知學生學習成效?學生是否會失去了學習動力?教 師又該如何指引學生走出為自己學習的路? 教育不應只是知識的製造廠,從九年一貫到十二年國教,以學生為主體、培 養學生生活基本能力,始終是課程重要目標。因此,課程與教學設計需以能力指. 2.
(17) 標為依據,將能力指標解讀、轉化教學目標,培養學生帶得走的能力,並依此設 計學生學習評量,教師就評量結果了解學生學習狀況,藉此修正教學內容,確保 教師教學成效與學生學習品質。然而,如何能得知學生是否已達到須具備的能力 了呢?能依據能力指標設計適宜的評量方式與評量內容,就是老師的重要課題 了!. 貳、研究動機 一、學生學習成就評量標準的發展 過去受到升學主義的影響,當學生完成某階段的學習時,教師常以考試等總 結性評量方式評定學生的學習成果,評量大多偏向認知性的考試測驗,學生經過 升學考試後,依據測驗成績進行學校選擇,這種強調學生互相競爭、與他人分數 做比較的常模參照評量模式,使得考試成為定生死的關卡。十二年國教實施後, 教育期盼能教學正常化,評量方式改為規劃每年 4 月統一舉辦國中會考,將評量 結果將分為「精熟」、「基礎」及「待加強」等 3 個標準,「精熟」表示學生精通 並熟習該學科能力; 「基礎」表示學生具備該學科之基本學力; 「待加強」表示學 生尚未具備該學科之基本學力。其目的不是為了區別學生優劣,而是讓國三學生、 教師、學校、家長及主管機關了解學生學習品質,並為下一學習階段 (高中、高 職或五專) 作好必要的準備。同時也擬定修正「國民中小學學生成績評量準則」, 規劃合適的分級方式,落實教師專長授課及照表上課之正常化教學,以達成五育 均衡發展之全人化教育(教育部,2012b)。以能力導向取代分數導向的評量目的, 當學生不再需要分分計較,學習就不必為了多增取一分而鑽牛角尖,期盼能扭轉 為了考試而學習的態度。 然而,雖然教育期盼跳脫為升學而讀書考試的固有觀念,但學校老師的評量 標準並不因此而得以鬆懈,十二年國教多元的入學方式讓成績評分是否公平等問 題再度成為關注焦點,雖然評量成績不是教育的最終目的,但缺乏明確規範的評 分制度卻容易產生疑慮與誤解。因應十二年國教在學生學習評量的變革,為確保. 3.
(18) 學生學習品質,教育部委請國立臺灣師範大學心理與教育測驗研究發展中心研發 「國中學生學習成就評量標準」,並展開試辦計畫,將以九年一貫課程綱要為依 據,根據各學科之能力指標發展,明訂不同表現等級中之標準描述,將學生表現 區分為不同等級,提供學校教師了解學生學習成效,並以之作為補救教學之依據 (教育部,2012b)。 「國中學生學習成就評量標準」將以往依據成績評量的分數制, 改為根據各學習領域學科內容發展相對應的五個等級表現描述(A、B、C、D、E), 且嚴謹的訂定統一評量標準。期盼評量回歸本質,讓學生藉由評量了解自身學習 狀況,學生學習目標並非與其他學生做比較,而是自我努力呈現的表現水準,透 過標準參照的評量模式,培養學生為自己能力表現而努力的學習態度,而老師能 藉由評量了解教學成效、修正教學目標,以此作為進行補教教學的依據。 由於綜合活動領域特有的活動性質,許多學習結果無法靠紙筆測驗評定,而 須採用多元的評量方式,非標準化的評分結果有時讓人質疑其公平性。國中綜合 活動領域已著手規劃學生學習成就評量標準,並展開試辦計畫,而國小綜合活動 領域雖然尚未發展統一的評量標準,但對於能力指標的解讀與轉化,並依此設計 教學與評量,是每位綜合活動領域授課教師應習得之基本能力,若能建置合適之 評量標準,讓即便是不同的教師,亦能有明確可供檢覈的評量結果,如此將可提 升評量品質,並且發揮支持教學和學習的功效,因此,探討國小綜合活動領域能 力指標轉化為學生學習成就評量標準之內容為本研究動機之一。. 二、教學現場的綜合活動領域評量困境 研究者進入教育職場已逾十年,其中擔任綜合活動領域授課教師、參與綜合 活動課程設計也達八年。教育改革的腳步快速,剛開始踏入職場,正是九年一貫 實施的開始,處於傳統與創新的交替中,跟著有經驗的老師一起學習設計綜合活 動教材,是挑戰,也是成長,每年都會有不同議題需要學習,品德教育、環境教 育、金融理財……從前重視的是學生學力,現在重視的是培養學生帶得走的能力。 老師們剛參加完100年綜合活動領域教師關鍵能力研習,緊接著即將面臨的是十. 4.
(19) 二年國教的衝擊,現代教育思維期盼教學活潑、多元化,綜合活動領域課程綱要 明白指出希望能引領學生從活動中獲得直接體驗,並應用所知來增進對自己的了 解,以及生活實踐的能力。研究者任教的學校綜合活動領域課程採自編教材,每 個新年段的開始前,各學年老師們會花上一段時間討論這學期的課程內容,參考 教育趨勢、配合學校重大行事及議題融入等,細心設計適合本校學生的綜合活動 課程。我們試圖在課程設計上有更創新、更適合學生的教學內容,迴避紙筆測驗、 知識灌輸,並費心設計圖文並茂的學習單,希望從中了解學生省思歷程及學習成 效,然而,綜合活動領域不以標準化紙筆測驗為評量方式的課程性質,使得同樣 的課程內容,A老師的評分標準可能與B老師的不同,同樣的成就表現,在A老師 班上的甲同學可能得到八十五分,而在B老師班上的乙同學可能得到九十分,學 年雖有統一的教材,但沒有一定的評量標準時,綜合活動領域的分數評定容易成 為各班老師的自由心證。 回想這十年來的綜合活動領域評量方式,精彩的綜合活動課後多採用高層次 紙筆測驗作為評量方式,然而,學生填寫完學習單後,教師可能仍然不確定學生 是否具備了應有的能力,僅以分數的方式來評定學生學習表現,分數卻無法告訴 我們學生的學習程度。從如山般堆積的學習單上抬起頭,重新思考教學與評量的 關係、評量設計的用意,評量是用以了解學生學習狀況的工具,而高層次紙筆測 驗僅是評量方式的其中之一,在九年一貫課程推動下,「基本能力」成為學習目 標,該如何評量學生是否已達到基本能力了呢?能力指標的敘述涵蓋認知、情意、 技能等面向,教師對能力指標的解讀及達成標準有不同程度的認定,如何讓綜合 活動領域評量是有效且公平的?因此,探討依據學生成就表現標準及單元評分規 準而設計的評量活動內容,規劃能讓授課教師覺得清楚易行,讓學生、家長覺得 公平易懂、有效傳達學生學習情形,並達到教師預期的教學目標之評量方式,是 本研究的動機之二。. 5.
(20) 三、評量活動在國小綜合活動領域之研究 從九年一貫試辦開始,有關綜合活動領域相關研究多偏重在議題、活動融入 課程設計及教師教學認知層面,其中有多篇調查課程實施情形、教師對課程的認 知及實施困難,或是以行動研究、個案研究方式探討體驗教育在綜合活動領域的 實施情形。然而,老師教得再辛苦,學生沒有吸收,就不是有效教學。教師專業 發展評鑑中課程設計與教學層面A-2「研擬適切的教學計畫」中, 「規劃適切的學 習評量方式」是評鑑檢核重點之一,而從A-8「善於運用學習評量」這個指標中, 亦可看出學習評量與教師教學設計的密切關係。教學成效的評估有一部分需要教 師透過省思學生評量,解讀學生學習表現,藉此調整課程內容與教學方式,因此, 設計適宜的評量活動,亦是教師在規劃課程的重要內容。在綜合活動領域的相關 研究中,以評量為主題的研究,有劉欣怡(2011)透過自編問卷了解國民中學綜合 領域教師實施多元評量情形;覺筱瑩(2013)、馬雅琪(2013)分析國中綜合活動領 域學生學習成就評量標準的發展;而在國小綜合活動領域相關研究中,方嘉薇 (2008)、朱秀華(2010)、郭玫音(2010)針對創意教學、品德教育融入等課程設計 面向進行相關研究;蔡婉妤(2010)透過敘事教學了解學生學習狀況;曾惠蘭(2004) 利用質性研究,透過觀察、訪談、問卷等方式了解一個班級實施綜合活動領域的 成效。然而國小部分以評量為研究主題者較為缺乏,因此,透過評量活動的規劃 及在教學現場的實際操作,探討評量活動在國小綜合活動領域的實施情形,並了 解實施困境,為本研究動機之三。. 6.
(21) 第二節 研究目的與問題 根據研究動機,研究者欲依據課綱能力指標轉化為學生學習成就評量標準, 並依此設計一份適合國小四年級綜合活動領域教學使用之評量活動,以行動研究 的模式,透過計畫、改變教學行動、省思、再計畫,據以改進評量方式、提升教 學成效。. 壹、研究目的 一、探討國小四年級綜合活動領域單元課程依據課綱能力指標轉化為 學生學習成就評量標準之內容與發展流程。 二、探討依據學生學習表現標準及單元評分規準所設計之國小四年級 綜合活動領域評量活動內容與方式。 三、分析評量活動實施情形與實施困境及其因應策略。. 貳、研究問題 一、如何依據課程綱要選定之能力指標轉化為國小四年級綜合活動領 域學生學習成就評量標準內容? 二、依據學生學習表現標準及單元評分規準設計國小四年級綜合活動 領域評量活動其內容與方式為何? 三、國小四年級綜合活動領域評量活動的實施情形與實施困境,及其 因應策略為何?. 7.
(22) 第三節 名詞釋義 壹、能力指標 能力指標是將學生所需學習、具備的各項能力,以可觀察與評量的文句呈現。 2008年公布之九年一貫課程綱要中明訂課程設計應以學生為主體,以生活經驗為 重心,培養現代國民所需的基本能力,綜合活動領域有四大主題軸與十二項核心 素養,再從十二項核心素養內涵之下發展出能力指標,並依知識結構及學習心理 之連續發展原則而劃分為四個階段(教育部,2008a),是教師進行教材編輯、教 學評量的依據。本研究所指的能力指標係指綜合活動領域課程綱要中第二學習階 段之能力指標,選取4-2-2、4-2-3做為研究範圍。. 貳、評量標準 能力指標是對學生能力的描述,若要對學生表現進行成就判斷,則需透過規 準(criteria)或標準(standards)做參照。教育部國語辭典簡編本對於標準的解 釋是指衡量事物的準則、可成為準則的。評量標準是指以客觀的方式所建立的評 量參照模式,可以依此協助學生、教師、家長了解學習內容、怎樣的表現程度是 屬於學生應具備的能力。評量標準的架構應包括內容標準(以課綱中的四大主題 軸為主題、十二項核心素養為次主題之學習內容)和表現標準(敘述做到怎樣才算 「好」的程度) (杜秉叡,2012)。本研究所指的評量標準是依據九年一貫課程綱 要綜合活動學習領域第二階段能力指標,參考國中已完成之學生學習成就評量標 準,規畫不同表現等級之學習表現標準描述,表現等級訂為A-E五級,其中,A 代表「優秀」,B代表「良好」,C代表「基礎」,D代表「不足」,E代表「落後」, 並以此做為教學評量依據。. 參、單元評分規準 單元評分規準是教師在區分學生表現等級時評分的準則依據(曾芬蘭,2012), 而根據評量標準設計之單元評量活動中會包含內容標準和表現標準,並將學生成. 8.
(23) 就依表現區分五個等級,各級分別有不同程度的表現描述,再藉由單元評分規準 與評分說明,協助教師與學生分辨、了解學生學習成就表現是屬於哪一個等級。 本研究所指的單元評分規準是依據研究者所選取之綜合活動學習第二學習階段 能力指標4-2-2、4-2-3所規劃之表現標準,將其轉化為單元教學評量內容,具體 的描述學生學習表現程度,為研究者進行教學評量及學生表現等級區分的依據。. 9.
(24) 第四節 研究範圍與限制 壹、研究範圍 一、研究內容 本研究意欲探究依據課綱能力指標轉化為學生學習成就評量標準內容,並了 解依此設計的國小四年級綜合活動領域評量活動實施狀況,因此,以國民小學中 年級綜合活動領域第二學習階段為研究範圍,並依據課綱及實施學校之課程計畫, 擬定欲進行之能力指標為4-2-2運用簡易的知能參與戶外活動,體驗自然;4-2-3 辨別各種環境保護及改善的活動方式,選擇適合的項目落實於生活中。其他階段 之能力指標不在本研究範圍中。. 二、研究對象 本研究以研究者所任教學校之陽光國小(化名)四年級班級學生共21名為研 究對象,研究計畫中之評量活動亦在研究者所任教的班級內實施,以此了解評量 活動實施現況與困境,其他年段學生之學習情況及教學評量設計,皆不在本研究 範圍中。. 貳、研究限制 一、研究方法之限制 本研究主要是研究者在綜合活動領域評量實務上,針對所遭遇的問題,提出 改進策略之行動研究,受限於研究者個人時間、能力,是以研究者所任教的班級 為研究對象,研究範圍有其限制。研究者同時擔任單元評量活動規劃設計及在教 學現場實施評量活動者,為避免資料蒐集與分析上流於過於主觀的缺點,研究過 程中藉由與協同研究者、學年夥伴教師對話討論,得到旁觀者的建議與回饋,學 生作業等級等文件分析亦尋求協同研究者建議,力求減低個人主觀意識之干擾, 但研究結果仍需考量教師教學經驗、學生生活經驗及程度等問題,不宜過度推 論。. 10.
(25) 二、研究結果之限制 本研究局限於時間、人力之考量,係以綜合活動領域課綱能力指標4-2-2、 4-2-3為依據規畫行動研究,了解其轉化為學生學習成就評量標準之發展流程, 並依此進行評量,分析評量活動實施情形,教學及評量活動實施時間為七週的教 學課程(包含一天的校外教學),未能擴及全學期綜合活動領域課程之評量規畫, 所進行之評量方式亦扣緊4-2-2、4-2-3能力指標,當其他教學環境使用不同教學 與評量內容,或課程綱要有所變動時,不宜依此進行過度推論。. 11.
(26) 12.
(27) 第二章 文獻探討 詳實的文獻是研究之基石,透過文獻探討,以期為本研究奠定良好的理論基 礎及背景知識。本章共分三小節,首先探究教學評量的意涵及相關理論,了解評 量的概念、教學評量設計步驟、多元化教學評量的方式及標準參照評量解釋模式, 以作為本研究單元評量活動設計與規劃之依據;再針對綜合活動領域的能力指標 及評量內涵進行探討,了解能力指標解讀及轉化模式,並從課綱的沿革中分析綜 合活動領域評量實施的原則、了解國中學生成就評量標準的內涵,以作為本研究 在能力指標解讀、轉化為單元評分規準之參考;最後整理綜合活動領域教學評量 近年來相關研究,以了解研究現況,做為本研究實施情形與困境之參照。. 第一節 教學評量的意涵與相關理論 一個理念再優良的教學計畫,如果少了有效的評量,就像騎匹千里馬, 一路狂馳,卻不知道方向在哪裡。(王文中,2000:14). 壹、教學評量的意涵 教學,包含了教與學,是教師和學生共同參與的歷程,教師依據教學目標, 運用各種方法,期望學生有所改變,而要知道學生的改變是否達到預期目標,就 需要透過客觀的測驗或評量活動。. 一、教學評量概念 關於測驗或評量,學者歸納解釋出四個相似但易混淆的概念(余民寧,2011; 凃金堂,2009): (一)測驗(test): 意指一種蒐集資料的「工具」或「程序」,用以獲得學習者的學習表現。例 如:教師編制的段考考卷,其中可能包含是非題、選擇題、問答題……等,教師. 13.
(28) 可以透過學生答題結果了解學生學習表現。 (二)測量(measurement): 意指一種「歷程」,根據明確的程序或規則,用數字量化研究者感興趣之行 為、特質等。例如:教師對全班同學進行某科目的成就施測,全班同學每人都獲 得一個分數,此一歷程即為測量。 (三)評量(assessment): 意指教師蒐集學生學習表現的各種「方法」。例如:教師想知道學生某科目 成就表現,除了採用標準化測驗外,也透過觀察、實作等多元方法,了解學生學 習成果,涵蓋量化表現及質性描述,其目的在蒐集訊息以幫助教師了解學生表現、 診斷學習問題、提供學習回饋。 (四)評鑑(evaluation): 意指透過系統化的評估方法,對欲評估之對象進行價值判斷、或績效了解, 常用在對機構或計畫的評判。例如:針對某一教育政策,透過價值判斷了解其實 施成效,常用在教育行政方面。 分析以上說明,「評量」的概念包含測驗工具、測量所獲得的資料,及其他 質性判斷成果,除了標準化測驗,也會透過多元的方法了解學生學習成果,其範 圍描述較為符合本研究意涵。然而,一提到評量(assessment),許多人就會聯想 到考試、寫測驗卷,這是傳統考試領導教學模式下產生的誤解,讓人談到評量就 陷入考試陰影中。評量是教學中不可切割的一部分,在教育改革的浪潮中,評量 的概念也有不同的詮釋,國內外有許多學者對教學評量定義有著不同的描述,簡 茂發(1987)認為教學評量是依據教學目標,運用科學的方法,對學生學習成果, 從事研究和分析的系列活動,包括對教師教學效率的評量、學生學習成果的評量、 課程設計與實施的評量三個面向;張春興(1996)認為教學評量是指有系統蒐集學 生行為資料,加以分析處理後,再根據預定之教學目標做價值判斷的歷程; Airasian(1996)把教學評量定義為教師將所得知訊息資料加以選擇、組織、並解 釋,以幫助學生做決定或價值判斷的過程;李坤崇(1999)則認為教學評量是指教. 14.
(29) 師將課堂上收集到的質或量的資訊,加以選擇及組織,並做解釋,幫助學生做決 定或價值判斷的過程。 歸納以上學者的定義,研究者認為教學評量是教師依據教學目標,利用多元 化的科學方法,針對學生學習成果進行系統性的資料蒐集,其內容應包含質與量 的資料,經由判斷、分析後,讓學生了解學習成果的過程。由此可知,好的教學 評量應具有幾個重要面向: (一)教學評量應依循教學目標而來。 (二)評量方式多元,資料內容同時兼具質與量的資訊。 (三)可以幫助學生了解己身學習狀況、協助教師改進教學內容。. 二、教學評量目的與功能 教學評量的目的除了測驗學生學習成果,更重要的是能幫助學生學習,協助 教師教學。綜合學者(余民寧,2011;吳慧敏譯,2011;凃金堂,2009;郭生玉, 2004;張清濱,2009)對教學評量的敘述,教學評量應具有下列目的: (一)讓教師了解學生起點行為 教師在教學前先進行評量,有助於教師了解學生起點行為,以利於教學活動 之規劃,也可作為教學前、後的觀察比較參考,以了解學生的學習成效。 (二)據此規劃教學活動、調適教學步調 教學前需先有確立的教學目標,並依此規劃教學活動及教學評量,依據教學 目標而設計的教學評量方能準確檢測學生學習成果。進行一段時間的教學後,教 師可以依據教學評量了解學生學習是否達成預定目標,進而檢視教學方式是否有 缺失,適時調整教材、教學步調。 (三)診斷學生學習困難、提供學習回饋 教學評量除了讓學生從中得知自己的學習成果,也可以幫助教師了解學生學 習狀況,診斷學生學習困難之處,進而採取適當的補救教學。 (四)提供學生、家長了解學生學習表現 教學評量的成果除了可成為學生學習表現代表,讓學生知道自己學習情況,. 15.
(30) 藉此修正成長方向,也可依此向家長提出學業成績報告,讓家長了解子女學習成 就,家長亦可根據評量成果,與老師討論子女在校學習狀況。 (五)提供學生生涯輔導方向參考 透過評量資料,提供學生了解自己的學習優勢,挑選適合的生涯發展方向, 作為升學輔導依據。 依據國民小學及國民中學學生成績評量準則(教育部,2012a)第二條,國民 中小學學生成績評量以協助學生德智體群美五育均衡發展為目的,並具有下列功 能: (一)學生據以瞭解自我表現,並調整學習方法與態度。 (二)教師據以調整教學與評量方式,並輔導學生適性學習。 (三)學校據以調整課程計畫,並針對學生需求安排激勵方案或補救教學。 (四)家長據以瞭解學生學習表現,並與教師、學校共同督導學生有效學習。 (五)直轄市、縣(市)政府及教育部據以進行學習品質管控,並調整課程與教學 政策。 由以上目的可得知,教學評量在教學活動中佔有非常重要的地位,評量的目 的不是僅為了知道他們的成績,而是據此推論他們的學習表現是否已達到預估能 力。評量設計應依據教學目標,採用合適評量方法,方能準確得知學生學習成果, 並據此協助學生進行補教教學,方能達到教學評量最重要目的。. 貳、教學評量的類別與功能 教學評量的分類方法有許多種,若依教學歷程、評量目的來分,可分為安置 性評量(placement assessment)、形成性評量(formative assessment)、診斷性 評量(diagnostic assessment)、總結性評量(summative assessment);若依評 量結果解釋可分成常模參照評量(norm-reference assessment)、標準參照評量 (criterion-reference assessment) (余民寧,2011;李坤崇,1999;吳慧敏譯, 2006)。. 16.
(31) 一、依教學歷程、評量目的區分 (一)教學前: 1.安置性評量:在單元開始教學前測量,其目的在確認學生是否已具備本學 習單元應有的基本知識或技能,用以決定教學起點,確認學 生已達成之程度,若發現學生尚未具備基本技能,教師得先 提供預備性的學習。教學前若能先透過安置性評量了解學生 程度,安排適宜之教材,則學生學習成效會較為提升。 (二)教學中: 1.形成性評量:教學評量與教學歷程緊密結合,在教學中實施形成性評量, 蒐集學生學習進展,其目的在提供教師即時發現學生學習困 難,據以改進教學。形成性評量常用在講授某個重要概念後, 隨時採用非正式方式評量,及時發現問題,進行補救教學。 2.診斷性評量:當學生學習困難持續不能解決時,針對學生學習內容,診斷 學生學習困難原因,作為補救教學依據。 (三)教學後: 1.總結性評量:教學結束後,針對教學目標評定學生學習成效,可以發現學 生是否達到預期的教學目標。總結性評量是目前教學使用頻率 最高者,如學校舉行的月考、期中期末考等。 除了教學結束後實施總結性評量,以了解學生學習成效,教學過程中將評量 納入其中,採用形成性評量,亦能及時讓教師了解教學效度,做為改善教學依據, 因此形成性評量逐漸受到重視,但並非否定其他評量方式,李坤崇(2002)認為一 個完整的評量歷程應包含安置性評量、形成性評量、診斷性評量、總結性評量。. 二、依評量結果解釋的區分 (一)常模參照評量:評量後,以同年級或同班學生成績的分配情形,取其平均 數為標準,依其在團體中所佔的相對位置來解釋評量結果, 用以比較分析學生之間的相對優劣。例如:A同學的綜合成績. 17.
(32) 勝過90%的同班同學,或B同學的評量成績居於班上第三名。 其比較的範圍可能是班級內、學校、全國。常模參照評量的 目的主要在區分學生成就高低,作為教育決策之用(例如:分 班、擇優錄取等。) (二)標準參照評量:亦有人稱之為「效標參照評量」。解釋個別評量結果是以 事前已設定好之標準為衡量的依據,以其是否達到標準來判 定學習是否「精熟」 。標準參照評量旨在找出學生已學會和尚 未學會的困難所在,以幫助教師改進教學及協助學生改進學 習,而非比較學生學習成就高低。例如:教師自編的隨堂測驗, 其目的主要是確認學生學習是否已達精熟。 多年來,國中基測都被當作高中職及五專的入學依據,國中基測是以「量尺 分數」表示,量尺分數是透過統計方法,由答對題轉換而來,其目的是要呈現每 一位考生測驗學科在所有考生中的相對位置,並以百分等級呈現,屬於常模參照 評量。而國中教育會考目的在於對學生離校前學力進行評估,因此需要清楚描述 學生學習程到達哪一層級的標準,除寫作測驗外,每一科目的成績分為「精熟」、 「基礎」 、 「待加強」3個表現標準等級(教育部,2012c),這種藉由事先擬定的表 現描述,讓學生可以了解自己的學習狀況,不需要與他人比較的方式,正是標準 參照評量展現的精神。. 參、教學評量的設計 一、教學評量設計步驟 凃金堂(2009)、余民寧(2011)認為完整的評量設計歷程步驟為: (一)決定教學目標與評量編制目的 在評量設計過程中,首要工作即是確認教學目標與評量目的,有了明確的教 學目標,才能依此設計相呼應的評量內容。依據領域區分教學目標,一般分為認 知領域、情意領域、動作技能等三大領域,Bloom教育目標分類系統(Anderson et. 18.
(33) al, 2001;鄭蕙如、林世華,2004)將認知領域教學目標分為知識向度與認知歷 程向度,其中知識向度又分為事實知識(Factual Knowledge)、概念知識 (Conceptual Knowledge)、程序知識(Procedual Knowledge)、後設認知 (Metacognitive Knowledge),認知歷程向度則分為記憶( Remember)、了解 (Understand)、應用(Apply)、分析Analyze(Evaluate )、評鑑(Evaluate)、創 作(Create);Krathwohl,Bloom & Masia(1964)將情意領域教學目標分為接收 (receiving)、反應(responding)、價值判斷(valuing)、重組(organization)、 內化(characterization)等五個類別;Harrow(1972)將動作技能領域分為反射動 作(reflex movements)、基本基礎動作(basic-fundamental movements)、知覺 能力(perceptual abilities)、身體能力(physical abilities)、技巧動作 (skilled monement)、協調溝通(nondiscursive communivation)等六個類別。 而依據97年課綱,綜合活動學習領域則區分為四大主題軸及十二項核心素養,先 確認教學活動的目標領域,方能據以編制可測量出學習者是否達成該類目標之評 量內涵。 不同類型的評量有其欲達成之特定目的,依據教學活動進行歷程區分,可分 為教學前了解學習者程度的安置性評量;教學中想了解學習者學習狀況的安置性 評量;診斷學習者學習困難的診斷性評量;教學結束後,了解學習者學習成果的 總結性評量。不同的評量目的會影響評量的範圍、類型、難易度等。例如:安置 性評量是為了解學習者目前具備的能力,其範圍可能會涵蓋好幾個單元,而形成 性評量是為了瞭解學習者某個單元學習狀況,可能僅限於較小範圍內容或概念; 就類型而言,總結性評量相較於形成性與診斷型評量而言,通常會包含較多評量 類型,以更精確了解學習者整體學習成果。 由此可知,不同教學目標及目的會產出不同類型的評量內涵,因此,確認評 量目標及目的是設計評量方案首要之務。 (二)發展評量的雙向細目表 確認教學目標及評量目的後,接著要規劃評量內涵之藍圖,常會發展以教學. 19.
(34) 目標及教材內容為向度的雙向細目表,其目的是讓教師清楚了解評量設計內容是 否有所偏頗,是否過於集中評量某個教學目標,或忽略了哪個目標的評定。教師 應依據教學目標、實際教學內容、評量目的等,決定雙向細目表比重。 (三)選擇評量的題型 評量包含標準化測驗,及觀察、實作等多元方法,針對標準化測驗部分,余 民寧(2011)將評量類型分為選擇型試題(客觀測驗)、補充型試題(論文測驗)。選 擇型試題包含選擇題、是非題、填充題、配合題等,其評分較為客觀,且具一致 性,但也偏重於學習者低層次能力;而補充型試題則包含簡答題、限制反映題、 申論題等,其評分主觀性較強,但較能評量出學習者高層次問題解決能力,而教 師應依據需求,選擇最能測量教學所要達成目標之評量題型。 使用紙筆測驗可以評量出學生可能具備知識,但較難得知在真實情境下的實 際技能表現,因此,實作等多元評量方式亦是教師在選擇評量類型應考量的方式。 國民小學及國民中學學生成績評量準則(教育部,2012a)在評量部分認為應視學 生身心發展及個別差異,除了紙筆測驗外,還可透過實作評量(書面報告、口頭 報告、口語溝通、實際操作、作品製作、展演、行為觀察等方式)、檔案評量等 展現其學習歷程及成果。 (四)評量內容編擬及審查 確定評量類型後,依據雙向細目表作為規劃方向,開始進行評量的設計與編 擬,再經過審查修正,審查時應注意內容是否具有一致性與適當性?評量內容與 教學目標是否一致?才可成為完整評量內容。 (五)評量實施及評量結果評估. 綜合活動領域常使用口試、觀察與軼事紀錄、檔案紀錄、操作示範、作品展 示等其他形式來評定學生在情意或動作技能領域方面的學習,透過實際觀察與記 錄學生在真實情境中的表現來評定成就。實作評量是綜合活動領域重要的評量方 式,本研究在評量方式上除了高層次紙筆測驗外,亦採用實作評量,余民寧(2011)、. 20.
(35) 李坤崇(2012)認為實作評量實施程序應包含: (一)確認實作評量的目的 教學評量需依據教學目標來決定評量目的,再依據評量目的選取評量方式。 李坤崇(2012)建議可檢視能力指標動詞屬性判斷評量屬於認知、情意、技能等表 現,並依此選取最佳評量方式。 (二)確認實作評量的標準 學習表現過程及作品的評量成效,端視表現標準是否能夠被清楚的界定、觀 察和測量而定;一個明確界定和說明清楚的表現標準,是成功教學與評量的關鍵 因素(余民寧,2011)。評量內容應詳細說明教師期望學生達到的表現標準,為了 能明確界定表現標準,余民寧建議應以可觀察到的、測量到的、進行數字量化的 學生行為或成果特質等術語,來界定表現標準,避免使用含糊不清的語詞(如正 確的、適當的)來混淆表現標準的意義。 綜合余民寧、李坤崇等人對於實作評量標準設計原則: 1.以可被觀察到、測量到、以及進行數字量化的術語,明確說明預期的表現 標準。 2.擬定清楚、明確且適合學生程度的表現標準。 3.透過多次觀察來判斷學生表現,紀錄表現時應保持客觀、公正。 4.使用清楚且方便記錄的評量工具。 5.事先讓學生明白評量表現的方法和標準是什麼,並依據這些標準來進行教 學。 6.集思廣益優於個人擬定。 (三)提供適當的表現情境 有了清楚界定的表現標準後,教師應視所要進行的評量表現或特質來設計師 測情境,讓學生得以展現預期的學習成就表現。 (四)選擇計分和評定方法 實作評量可針對表現過程或最後的表現結果來進行評分,但兩者皆需要系統. 21.
(36) 性的評分方法,例如採用系統性觀察或軼事紀錄、具有可以評斷表現測量向度的 檢核表、可以顯示學生學習成長紀錄的學習檔案等,可以提供教師針對各種表現 標準給予評分。 雖然實作評量是提供教師了解學生學習成就表現的良好方式,但實作評量依 舊有限制及應注意之處(余民寧,2011;李坤崇,1999)。 (一)偏見(bias): 有些教師會有將學生表現評定在少數等級範圍內的習慣,有的會將學生表現 一律評定在較低等級的地方(如:不論表現,最高得分只能得80分),或較高等級 (如:不論等級,最低分不低於80分)。如此評量的結果並不具有學生實際表現行 為的代表性。 (二)月暈效應(halo effect): 教師與學生的朝夕相處,常會形成既定印象,並依此來評定學生表現。當教 師對學生印象好時,可能推論該生其他表現一定良好,反之,若教師對某生印象 差時,便推論該生其他表現一定也會不好,因此傾向給予較低成績,因而影響實 作評量效度,使得評量結果備受質疑。 (三)評量次數偏少: 若沒有針對整個過程擬定評分標準時,可能為了方便起見,而採取一次性的 評量結果,如此評量亦無法達到評量目標。. 二、評量效度與信度 當評量內容超過教學目標時,這樣的評量就無法真實測驗出學生狀況。張麗 麗(2002)認為達到目的的評量,它的分數才具有意義,根據有意義的分數所作的 解釋、回饋及決定才會正確且適當。目前常見多元評量由於教師未能對實施程序 做良好規劃,導致評量結果產生爭議,因此在評量設計上能依據教學目標,將欲 測量之能力編列學生成就表現標準,給予一致性的評分,顯得十分重要,最後, 依據規準提供明確的回饋,如此,多元評量方能發揮其真正效用,落實在學校教 育中。. 22.
(37) 肆、教學評量之相關理論 一、多元化教學評量 一九九0年代以來,美國在教學評量方面,由於對傳統選擇式標準化測驗的 不滿,逐漸尋求其他的評量方式來取代(吳毓瑩,2000:25)。評量不只是用來 評定學生成就,而被認為是鼓勵學生學習的方式,透過評量,可以引導學生有更 佳的表現、具備更多能力,因此,評量應包含:記錄成就表現的檔案、解決行為 問題的情境、動態測驗、紀錄學生活動的過程等(Glaser,1990)。這些新的評量 術語包括另類評量(alternative assessment )、真實評量(authentic assessment )、實作評量(performance assessment)、卷宗評量(portfolio assessment)、動態評量(dynamic assessment)......等,在臺灣則衍生出多 元評量一詞,影響多元評量發展的理論主要有多元智能論、建構主義學習論等。 (一)多元智能論 傳統教學評量大多重視紙筆測驗的單一評量,紙筆測驗的優點是可在同一時 間內,多人同時進行評量,不僅計分客觀,而且快速、方便,因此,紙筆測驗有 其教學評量實施上的重要性,但紙筆測驗在評量形式上有其限制,多偏重於認知 層次的評定,著重於記憶性學習,忽略了情意與技能面,因而產生「考試領導教 學」的偏誤現象,也窄化了學生能力、限制學生學習興趣。然而,知識性的記憶 僅是學習的一部分內容,1983 年Gardner提出多元智慧論,他認為人類的智能不 應以標準測驗的得分來看,而是許多智能的綜合運用,智慧並非固定的,而是可 以學習、可以教、可以提升的。每個個體都擁有語文、邏輯-數學、視覺-空間、 肢體-動覺、音樂、人際和內省智能,以及之後增加的自然觀察者智能,教師應 尊重學生不同的智能潛能,創造豐富的學習環境、採用適合學生的教學方法及多 元的評量方式(郭俊賢、陳淑慧譯,2000)。李坤崇(2011b:82)認為九年一貫課 程基本理念在於培養學生自主學習與終身學習的能力,學習單宜著重學習歷程的 引導,而Gardner的多元智能論可以廣泛用之於課程、教學與評量,教師實施評 量時可適切運用此理論。. 23.
(38) 從多元智能的觀點來看,每位學生都具備了不同的生活表現能力,而這些能 力很難只用單一的紙筆測驗評量出來,因此,多元評量的觀點可以應用在發展學 生的多元智能,包含評量方法上的多元及評量資料上的多元(張美玉,2001)。多 元智能論考慮個別差異的特性,不僅挑戰了傳統智力概念,也提供了評量新觀點, 評量並非只用單一方式評定語文、數學書寫能力,而是要因人而異,讓在某智慧 擅長的人,能在該領域的評量中有良好表現,教育目標不再只重視學生知識記憶, 而是注重多元化發展。 (二)建構主義學習論 評量是學習的一部分,學習理論的發展也會影響評量的內容與方式。學習理 論近年的變化,逐漸走向學習過程的建構觀點(吳毓瑩,1996:6;Shepard,2000), 建構論認為知識是個人與社會文化互動下的產物,建構觀點強調學習過程已從教 師中心移轉到學生中心,認為學生是學習過程中的主體,學生學到知識是因為他 主動賦予了學習的意義,而不是被動的由老師來決定。因此,老師的角色不再是 教授知識的權威,僅僅是學生與知識的「仲介者」,幫助學生對於流通在教室之 中的知識形成自己的意義(吳毓瑩,1996;張清濱,2009)。 張靜嚳(1996)認為建構主義應用在教學上的原理有:1.教學在引導學生建構 知識,不是傳授知識;2.建構教學的目的在促進學生思考和了解,不是記背知識 與技巧;3.建構學習是做中學、談中懂、寫中通等多元互動的社會建構,而非聆 聽、練習等單向的建構。在建構主義學習理論的影響下,教學評量目標在評估學 生建構了什麼和如何建構,以引導學生建構自己的知識,因此,評量應注意需融 入教學之中、評量方法多元化,教師應嘗試不同的評量方式,以掌握最佳描述學 生知識的方法。由於強調學習者個人意義化過程在學習中的重要性,所以在評量 上著重在一個人如何詮釋他自己的學習歷程,卷宗評量便是評量的方式之一(吳 毓瑩,1996)。 由此可知,受到建構主義理念的影響,教室中學習焦點移向學生,教師應透 過問題引導,協助學生建構自己的經驗與知識。強調學生建構知識歷程的特色,. 24.
(39) 不但提供了學生建構知識的另一面向,也影響了多元、真實評量的發展,學生學 習歷程重於學習成果,評量須以多元的方式來了解學生的學習狀況,方能評量學 生真實能力。. 對於教學評量多元化的看法,歸納多位學者(李坤崇,2011a,2011b;張清 濱,2009;鄧運林,1998)的觀點,多元化教學評量應展現的特質有: (一)評量方式多元 以往評量以紙筆測驗為尊,較忽略其他收集資料的方法,但多元評量並非廢 除紙筆測驗,而是應依據教學目標、學生能力,採取不同的評量方法,包含實作 評量、真實評量、檔案評量、口語評量、遊戲化評量、動態評量、軼事紀錄、高 層次紙筆測驗等。 1.實作評量: 傳統的評量偏重於學生習得知識的測驗,實作評量強調透過學生展現出的技 能、或呈現的作品,來評量學生是否靈活運用所學知識,用以解決生活問題(凃 金堂,2009),強調學生高層次認知思考歷程,是一個兼重學習歷程與學習成果 的評量。也因為實作評量無單一標準答案的評分特性,在進行實作評量評分前, 應先設計好評分規準,透過評分規準的參照,有助於提升評分結果的客觀與一致 性。 2.真實評量: Wiggins (1989)認為教育若要遠離背誦式學習,必須改變評量的方式,因此 倡導「真實評量」的做法。真實評量著重在真實的或模擬的情境下進行評量,強 調評量應配合學生生活經驗,使其覺得自然,而能充分反映真實行為的改變或成 長(簡茂發,2002) 。真實評量從情境的角度著眼,強調評量項目的情境若愈能符 合真實情況或教育目標,則學生愈能活用他所學的知識與能力(吳毓瑩,1996: 4),也因此,吳毓瑩認為評量設計的重點需符合教學目標。 3.檔案評量(卷宗評量):. 25.
(40) 檔案評量是以學生個人為單位,教師依據教學目標與計畫,讓學生持續一段 時間進行蒐集、組織、與省思學習成果的檔案,以評定其努力、進步、成長情形 (李坤崇,1999)。藉由系統化蒐集及統整呈現,從中可以看出學生學習歷程與成 果,是一個兼顧歷程與結果的評量方式,並增進學生自我反省、溝通表達與組織 能力。 進行檔案評量時,教師不是唯一的評分者,應納入學生自我評量,鼓勵家長、 同儕參與評量。在評量結果的評定上,可呈現整體檔案和分項檔案的結果,評量 內涵除了學生能力評量外,需輔以努力程度的描述,以鼓勵不同能力學生的用 心。 4.口語評量: 利用「口試」 、 「問問題」等方式,引導學生將學習成果以口語方式表達出來, 例如:演講、口頭報告、經驗分享、表演等,可以評估較高層次的學習成果,並 增進學生口語表達及組織能力。 5.遊戲化評量: 國小低年級學生較難實施專題報告、檔案評量等,可採活動化、遊戲化的評 量方式,從中評量學生達到學習目標的程度。適切的遊戲化評量可提高學生參與 興趣,將學習與生活作結合。 6.軼事紀錄: 軼事紀錄是教師觀察學生日常生活表現,詳細寫下重要而有意義的偶發事件 和行為的紀錄(李坤崇,2011b)。軼事紀錄可作為評量佐證資料,提高評量結果 的效度。 7.高層次紙筆測驗: 多元化評量並非廢除紙筆測驗,而是依據評量目標彈性運用各種評量方式適 切評量學生學習成果(李坤崇,2011b)。教師在評量時應避免低層次認知記憶、 理解評量,採用客觀式試題。 多元評量過程應兼顧安置性評量、形成性評量、診斷性評量、總結性評量,. 26.
(41) 強調評量不只是評定學習成果,教師應適時依學生學習狀況調整教學內容,協助 學生在教學歷程中獲得最好的學習。 (二)評量內涵多元 傳統教學著重於記憶性的認知層面內容,評量題目多偏向記憶層次題目,忽 略高層次思考,較少顧及情意、技能等面向。多元評量內涵除了應兼顧認知、情 意、技能表現外,也須兼顧學生學習歷程、生活世界、社會行為。評量時機不應 只有定期性的評量,應包含定期評量、平時評量,與教學做結合,隨時了解學生 狀況。 (三)評量人員、情境多元 以往的教學評量多是由任課教師來評定,多元評量主張學生、同儕、家長亦 能參與評量,透過不同評量人員的觀察,可更了解學生學習歷程與結果,發掘學 生學習問題。評量人員的增加,除了可提升評量的信度,效度也會提高,將評量 情境擴大至教室外,讓學生學習落實致生活中,更真實呈現學習成果。學生參與 評量,除了可以藉由自我評量達到自我省思成效,透過同儕分享、互動,從同儕 間得到的評語,能產生另一種學習回饋意義,相較於教師評分能給予學生不一樣 的鼓勵意涵,亦能增進同學互動,提升鑑賞能力。 (四)評量結果呈現多元 傳統教學評量的功能大多重視數量化結果,強調分辨學生彼此間成績高下, 呈現與他人相較之下的常模參照結果,並據以進行獎懲,忽略了自我比較的努力 表現。然而,評量結果應是教學的起點,而非終點,除了透過學生分數呈現讓老 師了解教學是否達到預期目標,評量結果應兼顧質化與量化,能力與努力,讓學 生了解自己的學習狀況,因此,在評量通知單上可以採用客觀的文字敘述,具體 顯示學習成果及可再努力方向,避免分數至上的個別競爭,肯定學生努力歷程。 吳裕益(2000)指出教學評量的新趨勢為:1.越來越強調使用測驗來提昇教 學水準;2.更強調使用標準參照評量;3.性向和成就測驗的性質有所轉變;4. 更重視多元評量;5.電腦在測驗之應用扮演更重要之角色;6.評量生活化與遊戲. 27.
(42) 化;7.適性測驗之應用更普遍;8.網路線上評量可能取代部份現有課堂評量或大 型測驗;9.可合作建立題庫。從中可得知,在評量上採用多元化、生活化的方式 正是目前評量設計原則。 在教育政策的規定上,教育部於2010年12月1日修正發布之《國民小學及國 民中學學生成績評量準則修正總說明》詳細規定評量範圍及內涵,明定國民中小 學學生成績評量內涵應包含能力指標、學生努力程度、進步情形,並應兼顧認知、 情意、技能及參與實踐等層面,且重視學習歷程與結果之分析,並將評量方式做 更明確規範,包含紙筆測驗及表單、實作評量、檔案評量等,亦是強調多元評量 的概念。江雅琪(2004)透過行動研究探討生活課程多元評量的實施,將能力指標 轉化到教學目標、設計教學活動及評量,認為多元評量與教學合而為一的方式, 可以增進教學效能,同時使學生學習意願增高,並受到家長肯定,親師生三方受 益。由此可知,多元化的評量方式不僅可以增進教師教學效能,對於學生學習興 趣亦能有效提升。 在多元的精神下,許多教師絞盡腦汁思考各種有趣、活潑的評量方式,例如 透過檔案評量呈現學生表現與成長,但常發現教師未能有明確的標準評定學生表 現。林怡呈(2002)以個案研究方式探討教師如何在教學歷程中運用多元評量策略, 探究教師對評量方式之選擇、意圖、規劃與實施歷程之整體圖像,認為熱鬧、花 俏、有趣、有變化,僅是多元評量的迷思。教師應考量欲達成的教學目標,思考 最適宜的評量方式,以期更能了解學生學習表現,避免為了多元而多元,過於花 俏且耗時的模式,不一定是最適宜的評量模式。. 二、標準參照及以標準為本的評量模式 依據評量結果解釋來區分,評量可分為常模參照評量與標準參照評量,如果 解釋個別學生分數是與全班(全校)同學分數做比較,採相對比較的觀點,這種解 釋評量分數的方式稱為常模參照評量;若是以描述他的表現已達到什麼程度,採 絕對比較的觀點來看評量結果,這種解釋方式被稱為標準參照評量(余民寧, 2011)。標準參照的定名來自於Glaser和Klaus於1962年所撰寫的文章,常模參照. 28.
(43) 評量與標準參照評量基本差異在於對於評量分數的解釋方式,而不是評量內容與 型態。過去以考試為導向的教學傾向於以常模參照方式來解釋評量結果,著重於 相對位置的排名,教師從中較難以了解學生達到教學目標的程度,且易因參照團 體不同而有所差異,例如A同學和B同學都是班上第一名,但A同學是市中心額滿 班級學生,B同學所處的偏遠地區班級人數極少,兩人實際上的成就表現未必相 同。而標準參照模式是依據事先預訂的標準來做比較,以判定學生通過或不通過, 評量重點在於了解學生學習是否已具備應有之能力,或達到預期的精熟程度,教 師從中較能掌握學生學習狀況。評量標準是事先訂定的教學目標,不需與他人分 數做比較,此評量解釋方式較不會引起學生間的競爭。這樣的評量理念亦有其他 學者提出不同的名稱,美國各州、以澳洲、英國為主的大英國協系統已開始實施 以「標準為本」的評量(standards-based assessment) (杜秉叡,2012),標 準為本的特色,就是強調以評量促進學習(assessment for learning),而非考 試領導教學。指在學生學習評量過程中,透過一套學習內容標準進行評估,以確 保每個學生能夠學到必須學到的內容,進而提升學生學習成效(吳清山、林天佑, 2012)。其特色為: (一)教師所教的課程內容和評量必須緊密結合在一起。 (二)評量學生達成事先設定成就目標的情形,學生自我比較,不是跟其他同學 比較。 (三)採用多元的評量方式。 其解釋評量結果的特色即為標準參照,名稱雖然不盡相同,但基本觀點是一 致的,評量活動的設計應依據教學目標,解釋評量結果都是著眼於學生本身學習 的進步,而非與他人做比較。 國民中小學學生成績評量準則中的評量原則說明在結果解釋應標準參照為 主,常模參照為輔(教育部,2012a)。我國十二年國教實施後,民國103年後將有 75%的國民中學畢業生透過免試入學進入高中、高職及五專就讀。免試入學政策 期盼去除入學考試影響而無法正常化教學的困境,讓教師更能針對學生學習的個. 29.
(44) 別化差異設計課程,以增加學生學習的成就及動力。為確保學生學生學力品質, 以國中教育會考取代基測,即是採用標準參照,透過測驗的標準設定,將國文、 英語、數學、社會及自然等科目評量結果分為精熟、基礎及待加強等3個標準, 「精 熟」表示學生精通熟習該科目國中階段所學習的知識與能力;「基礎」表示學生 具備該科目國中階段之基本學力;「待加強」表示學生尚未具備該科目國中教育 階段之基本學力。余民寧(2011)認為標準參照的評量通常只挑選具學習內容領域 的代表性試題,而不考量試題的難度值和鑑別度值,其目的是在確認學生學習是 否已達到精熟,而不是評定學生學習成就高低。過去基測考生要全對才能得到滿 分80分,會考只需答對約八成的試題,就能得到「精熟」,試題評量重點為「基 本、核心、重要」的知識與能力(教育部,2012c),著重自我能力的達成,了解 學習品質,並為下一學習階段作好必要的準備。. 伍、小結 從教學評量的意涵和目的中可得知,教學評量是教師了解教學成效、學習者 學習成果的重要依據,依據教學目標而訂定的教學評量可以得知學生學習成果, 並能依此幫助學生學習、協助教師調整授課步調與教學方法,是教學設計中重要 的一環。因此,本研究在進行單元評量設計與規劃時,須依據教學目標,根據評 量設計步驟設計適宜的評量活動,並作適當的分數解釋,據此給予學生適時的回 饋,讓評量發揮其真實效用。 從多元智能論、建構主義學習論中可得知,近年來的教學評量趨向多元化發 展,尊重學生個別差異,因此,本研究在設計單元評量活動時,應納入多元評量 概念,包含評量方式的多元、評量內涵的多元,並納入學生、同儕、家長的觀察 評量,以提高評量信度,讓評量結果呈現多元,並參考標準參照模式概念,讓學 生從事先訂好的教學目標中得知自己學習的進步,了解自我能力是否有達成,而 非僅是分數上與他人做比較。. 30.
相關文件
understanding of what students know, understand, and can do with their knowledge as a result of their educational experiences; the process culminates when assessment results are
(provides student activities, parent education and support, assessment and counselling services) Youth Assessment and Development Centre, The Hong Kong Federation of Youth Groups
Schools may strategically enhance the professional capacity of teachers in curriculum leadership, learning and teaching strategies and assessment practices through participating
Internal assessment refers to the assessment practices that teachers and schools employ as part of the ongoing learning and teaching process during the three years
The Senior Secondary Business, Accounting and Financial Studies Curriculum and Assessment Guide incorporates the key recommendations in the Curriculum Development
(b) Pedagogical and Assessment Practices (e.g. Transforming the Learning and Teaching Culture, Promotion of Self-directed Learning, Skills Development for e-Learning) ... Use
Basing on the observation and assessment results, this study analyzes and discusses the effects and problems of learning the polynomial derivatives on different level students
New: Overall correct % for each dimension in Maths and presented in a bar