曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 119 教育科學研究期刊 第六十三卷第四期 2018 年,63(4),119-155 doi:10.6209/JORIES.201812_63(4).0005
國中課室素養導向標準本位評量的
設計與應用:以英語科閱讀為例
曾芬蘭
鍾長宏
國立臺灣師範大學 心理與教育測驗研究發展中心 學習科學跨國頂尖研究中心 花蓮縣立宜昌國民中學陳世玉
張銘秋
* 花蓮縣立三民國民中學 國立臺灣師範大學 心理與教育測驗研究發展中心 學習科學跨國頂尖研究中心摘要
近年來愈來愈多先進國家持續推動以標準為本位的教育評量改革,我國自 2014 年起推動 十二年國民基本教育,並同時實施以標準參照計分的國中教育會考作為國中畢業生學力監控 機制。在高風險考試之外,本研究以英語科為例,聚焦於探討如何在國中課室設計素養導向 標準本位評量工具,並透過實際參與標準本位評量試辦的學生與教師的經驗及意見,分析情 境式素養導向的標準本位課室評量如何提振學生興趣,促進英語學習。研究結果如下:一、 依據學生作答感受問卷調查結果,在使用經多次命修審與預試的評量作業的情境之下,近七 成的學生認為較傳統選擇題或填充題更容易發揮、更具有挑戰性、也較活潑有趣;六成左右 學生的作答意願較高、心情比較愉快,也認為比較容易得分;二、依據試辦教師的回饋可知, 多樣化題型搭配標準參照評等及彈性的作答方式,可激發學生多元能力表現,並從評量的過 程與結果,讓學生明瞭自身學習狀況,也可促進教師專業知能的成長;三、情境式試題設計 可引導學生從評量中學習將所理解的訊息,應用於仿真的新情境以解決問題,藉此幫助學生 體會英語閱讀的實用性與實質意義。若能在國中英語科的課室中,實施類似本研究所提出之 素養導向標準本位課室的多元評量,可「善誘學生學習動機與熱情」,促進自發學習,增進 英語學習成效,有利培養學生成為十二年國教核心素養所強調的「終身學習者」。 關鍵詞: 素養導向、標準本位評量、學生學習成就評量標準 通訊作者:張銘秋,E-mail: [email protected] 收稿日期:2018/02/07;修正日期:2018/05/15、2018/08/09;接受日期:2018/08/28。120 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋
壹、研究動機與目的
近年來愈來愈多先進國家持續推動以標準為本位的教育評量改革(standards-based assessment,以下簡稱標準本位評量),這些國家一方面將標準本位評量應用在外部考試以監控 學力,一方面也將其應用於班級評量,透過加強課程綱要、教學與評量三者的緊密對應,促 進教師評量專業發展及學生學習成效(宋曜廷、周業太、曾芬蘭,2014)。我國自 2014 年起 推動十二年國民基本教育(以下簡稱十二年國教),為了在免試入學機制下對國中畢業生進行 學力監控,2014 年起正式實施採標準參照(standards-based)計分的國中教育會考(以下簡稱 教育會考)。然而,教育會考作為國中畢業生 3 年學習成效的總結性評量,其成績並無法即時 提供學生國中 3 年學習期間的診斷回饋。為了彌補教育會考的不足,教育部自 2011 年起即委 託國立臺灣師範大學心理與教育測驗研究發展中心(以下簡稱心測中心),依據課綱發展各領 域教師在平時課室可採用的評量標準,期望透過全國一致性的評量標準檢視學生學習成效, 除可適時地提供教師教學與學生學習狀況的回饋,更有助於教師瞭解學生學習成果的定位 點,並可作為教學計畫與教學實務改善的參考依據(宋曜廷等,2014;國立臺灣師範大學心 理與教育測驗研究發展中心,2017a)。 教育會考測驗結果除提供教育部、各縣市教育局處、全國各國中、高中及五專進行學力 監控外,亦可作為十二年國教實施初期免試超額比序之參考,因此,大部分國中教師課堂英 語評量都配合教育會考考試題型,多採封閉式的選擇題,試題也多缺乏與生活情境的連結, 導致許多英語程度較落後學生的學習興趣及意願低落。從學生在國中教育會考英語能力(含 閱讀及聆聽)表現來看,2015~2017 年被評定為「待加強」的國三學生都超過 30%(國立臺 灣師範大學心理與教育測驗研究發展中心,2017b),代表國中英語教學還有相當大的改善空 間。基本學力測驗(以下簡稱基測)時期,國中課堂英語評量多以選擇題為主(傅秋英,2007; Lin, 2009),即使目前教育會考英語科加考聽力測驗,國中英語教師在學校評量的類型仍偏向 選擇題型。由先前教育會考加考聽力測驗在教學現場產生的回沖效應研究可知,從 2015~ 2017 年英語聽力待加強人數百分比下降最多的幾所國中調查顯示,這些學校多採用「精熟學 習」的教學策略,利用不斷地複習課內教材,讓學生熟習課程內容,課外教材的使用也多配 合課內教材內容做複習和延伸(曾芬蘭、游羽萱、蔡逸凡、陳柏熹,付梓中),這些「類會考」 題型操練的主要目標是提升學生考試成績,期望降低學校整體待加強學生人數。這類「精熟 學習」的教學策略雖可有效提升學生學習成就,但若操作過度,可能會導致教學僵化、呆板, 教學方法了無新意(Alderson & Wall, 1993; Spratt, 2005),無法提起學生學習興趣,產生負向 的測驗回沖效應。曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 121
含各種內容與類型的試題,造成評量目標發散模糊,配分輕重無所依據,以致無法精確評定 或描述學生能力。綜上因素都很可能讓低成就學生對英語學習失去興趣,進而影響其最終在 英語學習成效或教育會考表現,要改善此情形,英語課間不能只採用傳統評量方式,而是要 透過「多元題型」,加入與生活情境結合(scenario-based)(Organisation for Economic Co- operation and Development [OECD], 2016)的「素養導向」試題,讓學生有機會從評量中學習 (assessment for learning)(Western and Northern Canadian, 2006),並嘗試多元能力表現及感受 有意義的學習(meaningful learning)(Anderson & Krathwohl, 2001);同時應在課間使用「標 準參照」的評等方式(standards-based grading),明確呈現學生學習狀況(Clear Creek, 2016), 以利後續適性教學與增進學生自信心。McMillan(2008)從大型測驗與課室評量兩個主要方 面,討論評量在標準本位教育的定位時,強調大型高風險考試的規劃設計都是委由專責測驗 機構依照測驗發展的標準作業程序來實施,主要功能為學生學力監控與問責(accountability), 因此,題型除了寫作測驗外,常以選擇題為主。然而,課室評量是每一位教師在課堂上為其 學生所規劃的學習檢測工具,為了提升學生學習成效與動機,課室評量除考試形式外,應盡 量多元化,並貼近學生真實生活情境、評量學生整合能力、提供足夠的具體回饋等發展趨勢 (McMillan, 2007),和本研究建議的方向一致。 有效教學的根本植基於教師在教學過程中所做的每一項關鍵決定,包含要教什麼、如何 教、花多長時間教等問題,回答這些問題最重要的依據就是要知道學生程度與學習狀況如何, 而要回答學生程度與學習狀況,無論是透過大型測驗或課室評量,在在都與評量有關 (McMillan, 2008)。評量在教學過程中提供不可取代的地位,本研究試圖從素養導向標準本 位多元評量在國中端的應用,探討如何能引導教師設計適切、有效的課室評量工具,除了能 具體呈現學生的能力表現外,特別是英語能力較低落的學生,透過標準本位的評量,可以重 新燃起對學習英語的興趣與熱忱。
貳、文獻回顧
一、十二年國教英語科課綱:注重培養學生學習興趣與激發學習動機
《國民中小學九年一貫課程綱要語文學習領域(英語)》(以下簡稱九貫英語科課綱)、 《十二年國民基本教育課程綱要國民中小學暨普通型高級中等學校語文領域─英語文(草 案)》(以下簡稱十二年國教英語科課綱草案),以及 2018 年 4 月 16 日最新公布之《十二年國 民基本教育課程綱要國民中小學暨普通型高級中等學校語文領域─英語文》(以下簡稱十二年 國教英語科課綱)均載明「學生的學習興趣與吸收能力應勝於教學進度的考量」(教育部, 2012,2015,2018)。可知「學習興趣的培養」與「學習動機的激發」一直是課綱所強調之項 目。無論是最新公布的十二年國教英語科課綱或其前身的草案版本,均清楚指出「在發展上122 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 述諸多認知能力之餘,切勿忘記學習興趣的培養、學習動機的激發」(教育部,2015,2018)。 十二年國教英語科課綱雖已公布但尚未實施,因此,以下將以十二年國教英語科課綱草案為 標的,從課程目標、學習內容、教學要點與評量要點四方面,分析其如何強調「學習興趣的 培養」與「學習動機的激發」。
(一)課程目標
在九貫英語科課綱中,將學習英語的「興趣」與「方法」列為其中一項課程目標,即「培 養學生學習英語的興趣與方法,俾能自發有效地學習」;而在十二年國教英語科課綱草案則把 學習英語的「興趣」與「方法」各自獨立,成為其中兩項課程目標,分別為「提升學習英語 文的興趣並涵育積極的學習態度,主動涉獵各領域知識」與「建構有效的英語文學習方法, 強化自學能力,奠定終身學習之基礎」。由此可知,十二年國教英語科課綱草案更強調培養學 生成為自發主動的學習者(教育部,2014)。(二)學習內容
為呼應課程目標,十二年國教英語科課綱草案將原九貫英語科課綱「興趣與方法」中的 「興趣」與「方法」各自獨立,成為其中兩個學習表現類別。其中「學習興趣與態度」是與 本研究相關的學習表現。國小、國中、高級中學各學習階段,皆有列出「樂於參與課堂中各 類練習活動,不畏犯錯」之學習表現,且在國中(第四)階段及高級中學(第五)階段都列 為第一項(IV-1、V-1),顯見十二年國教英語科課綱草案在各學習階段,都強調讓學生有容錯 的空間,學生才會願意嘗試表現,持續學習,再次可知十二年國教英語科課綱草案相當強調 激發學生英語學習興趣與動機。(三)教學要點
呼應前述「樂於參與課堂中各類練習活動,不畏犯錯」之重要學習表現,十二年國教英 語科課綱草案詳實地提醒教師,在學生初學階段,應鼓勵勇於嘗試,讓學生隨著學習成長進 步,不需處處要求精確無誤,希望藉此培養學生進一步繼續學習的意願;並強調教學應結合 實際生活情境與經驗,以提高學習興趣,以上在在顯示十二年國教英語科課綱草案相當重視 應鼓勵學生在生活中運用英語,期使學生對英語學習更感興趣。(四)評量要點
十二年國教英語科課綱草案的課堂評量原則,更是強調鼓勵學生、給予學生更大的作答 表現空間,以利激發學習興趣。在評量依據部分應盡可能事先告知學生學習評量的相關內容 與方式;評量形式應採多元評量方式,且學習成果不一定全採用分數,亦可以質性敘述方式 呈現,教師可建立個人試題檔案,於每次評量後進行簡易分析,以評估試題品質及學生學習 成效,並診斷學習困難之處,以提供加深、加廣或補救教學的適性學習輔導(教育部,2018)。曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 123 平時課堂低風險(low-stakes)的形成性評量(formative assessment),正是落實讓學生在英語 學習活動中「樂於參與」及「不畏犯錯」的絕佳時機。換言之,英語課室評量將不再只是學 生最後得到的分數或等第,也不能僅採用讓學生幾乎無表現轉圜空間的封閉式題型;應盡量 採多元評量方式,盡可能讓學生事先知道要評量的內容與方式,並隨時以各種形式幫助學生 瞭解自我學習狀況。十二年國教英語科課綱草案課室評量的目的,不只是藉由評量總結得知 學習成效,還蘊含引發學生的學習興趣與動機,強調學生是主動學習者,鼓勵學生自發學習 的積極教育意涵(Shepard, 2005)。也唯有如此,才能藉由課室評量,真正提升學生的英語能 力,改善教育會考成績。 從上述「課程目標」、「學習內容」、「教學要點」及「評量要點」四個面向的分析可知, 十二年國教英語科課綱草案為了涵養學生「終身學習」的核心素養,極為重視激發學生的學 習興趣。
二、評量促進學生自發學習
研究顯示,課室評量對於學生的學習,除了短期可見的影響之外,也會有長期無形的影 響,如影響學習動機及其對於學習策略、學習型態的選擇等(Crooks, 1988; Earl, 2013)。英國 教育評量學者 Black 與 Wiliam(1998)分析彙整超過 250 篇的相關研究結果,提出「課室評 量可提升學生學習成效的結論,從此奠定評量可促進自發學習(assessment for learning)的理 論基礎:課室評量應友善地幫助學生「主動」學習;學生不再「被迫」為求得高分而準備考 試,反而可以主動利用評量,增進自己的學習動機與成效;甚至評量活動本身,就是一個讓 學生學習的過程(assessment as learning)。這樣的評量觀念,在於強調評量更重要的目的是針 對所評量的內容與能力,經由評量過程及評量結果,進行學習與改善,而不是比較學生能力 高低。換言之,應避免把評量目的侷限於只在意取得學生最後成績,才不會造成學生被迫或 消極的只想得到好成績,忽略評量可助其更積極有效地學習(Black & Wiliam, 1998; Earl, 2013; Open Learn, 2018; Popham, 2011; Western and Northern Canadian, 2006)。十二年國教英語科課綱草案的評量目的與意涵,即是促進自發學習。要達到此評量目的, 英語課室評量的取材應趣味化、實用化及生活化(教育部,2015);試題設計也應考量以素養 為導向(literacy-based),盡量和生活情境結合(scenario-based),引導學生在評量中練習將所 學知識活用於新情境以解決問題(Carroll, 2017; OECD, 2016);題型也要多元,並允許學生彈 性、多元的作答方式,同時搭配標準參照的評等方式,以利明確呈現學生的學習狀況(Clear Creek, 2016; Marzano, 2018; Work, 2014)。評量若能符合上述原則,即可促進學生自發學習, 一方面讓學生感受英語學習的實用性,同時降低作答壓力;不僅能鼓勵學生嘗試多元表現, 學生也不需要和他人比較,只需在意自己的學習狀況是否達到標準;且有利教師後續的適性 引導,有效幫助學生增進學習興趣與自信心及其自發學習的意願與成效(林素卿、葉順宜,
124 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 2014)。
三、標準本位課室(班級)評量
課堂中的各類評量,在鼓勵學生多元表現的前提下,若要有效評定學生的能力等級,並 瞭解個別學習的進展狀況,需要參照事先制定的一致性標準,以利引導學生學習方向與增進 學習動機。近年來,標準參照(標準本位)課室評量已是國際間的教育評量趨勢。(一)他山之石
標準本位評量是指在評量前根據國家或地方政府公布的課程標準,制定系統化明確的評 量標準,將學生學習表現劃分成數個表現等級,並據此發展評量工具及其評分指引(scoring rubrics),再將評量施測後的學生表現,對應至評量標準,進而提供學生「會什麼」與「不會 什麼」的學習成果訊息。標準本位評量除了用於學習階段結束後的總結性評量或大型測驗(如 教育會考),亦可用於班級中的形成性評量(用以輔助說明標準本位評量試題在課室運用的成 效,如隨堂小考)(宋曜廷等,2014)。 將標準本位評量應用於班級中,稱為標準本位課室(班級)評量(standards-based classroom assessment)(Llosa, 2011)。標準本位課室評量可在教學活動結束後進行多次施測,因而可評 量到更多學習面向,也可透過不同形式評量學生的各類能力,更能多元呈現及蒐集學生表現。 許多先進國家早已開始採用標準本位課室評量,如美國(California Department of Education, 2002)、加拿大(Province of British Columbia, 2017)、澳洲(Queensland Government, 2018)與英國(Department for Education, the National Archives, 2011)。美國加州教育當局於 1999 年 公 布 英 語 能 力 發 展 標 準 ( English-Language Development Standards )( California Department of Education, 2002),將英語能力表現區分為五個不同表現等級;依此標準作為教 學及設計評量工具的依據,如加州英語能力發展測驗(California English Language Development Test)與一系列的班級評量工具(Llosa, 2007, 2008)。加拿大卑詩省則針對閱讀素養、寫作素 養、數學素養及社會責任(social responsibility)等面向,根據不同年級,制定了表現標準, 並區分出未達預期水準、達到部分預期水準、完全達到預期水準及超越預期水準等四個表現 等級,並以其中「達到部分預期水準」為通過門檻;教育當局為了協助教師在班級中應用表 現標準,也針對特定學科內容製作了與表現標準對應的評量工具及評分指引,並蒐集提供各 等級學生的真實表現範例,加深教師、家長與學生對評量標準內涵之瞭解,藉由課室評量幫 助學生發展自發學習(Province of British Columbia, 2017)。正式實施標準本位課室評量的首要之務,在於建置評量標準。實務上將評量標準植基於 官方頒布的課綱,有利串連評量與教學,確實瞭解學生是否具備課綱所期望的學習表現,除 可降低對各等級學生典型表現或最低門檻表現的認知差異(宋曜廷,2012),評量結果也更適 用於學生學力監控,以利促進學習成效。以美國為例,2010 年頒布全國一致的「共同核心課
曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 125
程標準」(Common Core State Standards),統一從幼稚園到十二年級的課程標準,以利全美各 州在共同核心課程標準的架構下,於班級中實施標準本位評量,藉此瞭解全國學生學力狀況, 協助學生做好升學及就業準備,從而提升國際競爭力(宋曜廷等,2014;Common Core State Standards Initiative, 2011)。
(二)臺灣國中學習階段學生英語學習成就評量標準的制定
配合我國十二年國教免試入學,要有效地進行全面學力監控,促進學生自發學習,可參 考上述各國各地的經驗與作法,在平時「透過低風險考試評量以帶領學校教學方式的變革, 落實培養學生高層次與多元學習能力」(宋曜廷等,2014),落實十二年國教結合核心素養所 發展的課程理念。 自 2011 年起,教育部國民及學前教育署(以下簡稱國教署)委託心測中心依據課綱研發 平常課室中所使用的評量標準,以利教師和教育主管單位在評量學生的表現時,能有全國一 致的比較基準,此即我國「學生學習成就評量標準」(Standards-Based Assessment of Student Achievement,以下簡稱評量標準),評量標準研發工作內容流程如圖 1 所示。其中內容標準 (content standard)的制定,係將課綱各學習領域的能力指標或學習表現,加以歸納整併,分 為不同「主題」,並根據學科屬性與教學內容,在各主題下再分成若干「次主題」。在表現標 準(performance standard)部分,共分五個表現等級,分別是 A(優秀)、B(良好)、C(基 礎)、D(不足)與 E(落後),其中 A、B、C 屬「通過」的等級;D、E 則屬「尚未通過」的 等級。在表現等級描述(performance level descriptors)部分,由於各內容(次)主題皆對應課 綱中多個能力指標或學習表現,在研發過程中即根據次主題與能力指標或學習表現的對應關 係,分別描述各等級應具備的最低(門檻)能力表現。1 圖1. 評量標準研發工作內容流程 1 有關評量標準英語科之說明,詳見 https://www.sbasa.ntnu.edu.tw/SBASA/Subject/Subject English_1.aspx。 修改評量標準 研發評 量標準 研發實 作示例 ‧設定評量標準架構 ‧確認重點學習內容 ‧擬訂評量標準 ‧設計評量作業及評分指引 ‧國中、小預試 ‧挑選典型學生樣卷並撰寫樣卷說明 ‧完成評量作業示例126 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 語文學習領域英語文第四(國中)學習階段的課室評量標準,從 2011 年 5 月起,由學科 教授、教學現場教師及心測中心學科研究員依據九年一貫課綱共同研發,為了因應十二年國 教英語科課綱草案,目前仍持續對課室評量標準進行必要性調整。目前公告之語言認知能力 國中各年級的聽、說、讀、寫課室評量標準,內容標準乃依課綱「語言能力─聽、說、讀、 寫」的學習表現,分成聆聽、口說、閱讀、寫作四大主題;各主題之下依課綱所提及的「語 言知識」與「語言溝通技能」兩大面向(教育部,2015),再各分成兩個次主題,各主題之下 的次主題分別是:1.聆聽能力之語音聽辨、音訊理解;2.口說能力之發音朗讀、口語表達;3. 閱讀能力之字詞句構、文意理解;4.寫作能力之字句書寫、文意表達。 次主題名稱並未採照課綱學習內容「字母、語音、字詞、句構及篇章」(教育部,2015), 乃因聽、說、讀、寫若再各依字母、語音、字詞、句構、篇章分為五個次主題,總共有 20 個 次主題,過於繁瑣,無法有效於課堂中落實操作;且字母、語音、字詞、句構、篇章等學習 內容,若要分別再依聽、說、讀、寫四項技能,各分成五個等級加以描述學生表現差異,既 困難亦不切實際。 各次主題下的各項次能力(subskills),乃是將課綱中相對應的「語言能力」學習表現, 化繁為簡、重新整理歸類而得。以九年級「閱讀」之下的「文意理解」次主題為例,共包含 六項次能力,分別為:1.能指出適切時態;2.能指出適切語態;3.能指出連貫標記及其意義或 功能;4.能指出客觀事實與個人意見;5.能指出明確敘述的訊息;6.能指出主旨大意與隱含文 意。 至於表現標準,採「分年級」撰寫,各年級差異在於學習內容取材逐年加深加廣。以閱 讀為例,七年級的取材建議是生活化、與個人相關、訊息或情境單純、語句簡短的內容,如 對話、短篇故事或敘述、韻文、簡易圖表等;八年級是主題熟悉、訊息或情境略為複雜、語 句略長的內容,如對話、記敘文、說明文、韻文、圖表等;九年級則是一般議題、訊息或情 境多元、語句略為複雜的內容,如對話、記敘文、說明文、議論文、韻文、圖表等。 各等級表現的描述方式及區分等級的原則包含:1. A、B、C 等級各「通過」等級盡量以 「質性」描述為主,等級差異可能是同一學習內容表現出認知歷程的不同能力層次(如理解 /整合 vs. 辨識/擷取)(Anderson & Krathwohl, 2001)或是學習內容多寡、深(廣)淺(如 隱含語境 vs. 明顯語境;跨句群 vs. 跨句),有時亦以「量化」方式(如偶有錯誤)加以區別; 2.針對有些較基本的技能及學習內容,最高表現等級無法達 A(或 B)等級,則該項技能的 A (或 B)等級表現描述會註明「同 B(或 C)等級」(如「能指出明確敘述的訊息」的 A 等級 描述同 B 等級);3. D 等級與 C 等級之間主要以「程度」副詞「僅能有限地……」做區別;4. E等級以「未達 D 級」描述。國中英語科課室評量七年級閱讀文意理解之各項次能力的各等 級表現描述,如表 1 所示。
曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 127 表 1 國中英語科課室評量七年級閱讀文意理解之各項次能力的各等級表現描述 表現等級 次能力 A 能從隱含或整體上下文語境指出適切時態 能指出篇章中跨句群的連貫標記及其意義或功能 能力表現同 B 等級 能整合隱晦、繁複或整體訊息,指出主旨大意與隱含文意 B 能從局部上下文明顯語境指出適切時態 能指出篇章中跨句群的連貫標記及其意義或功能,偶有錯誤 能指出明確敘述的訊息 能整合明顯、簡易或局部訊息,指出主旨大意與隱含文意 C 能從句中明顯語境指出適切時態 能指出篇章中跨句的連貫標記及其意義或功能 能指出明確敘述的訊息,偶有錯誤 能擷取明顯、簡易或局部訊息,指出主旨大意或隱含文意 D 僅能有限地從句中明顯語境指出適切時態 僅能有限地指出篇章中跨句的連貫標記或其意義 僅能有限地指出明確敘述的訊息 僅能有限地擷取明顯、簡易或局部訊息,指出主旨大意或隱含文意 表現描述 E 未達 D 級 為瞭解國中教育現場使用標準本位評量可能遭遇的困難與問題,心測中心自 2012 年(101 學年度)開始輔導各縣市學校進行試辦作業,以一學年為一個試辦期程。至 2017 年 7 月止已 完成五個期程,目前全國已累積試辦 220 國中校次、375 類別(根據九年一貫課綱七大領域, 每一領域為一類別,語文領域則分國語文與英語文兩個類別,因此七大領域共分為八個類 別),全國共計近兩千人次教師、近千班次班級及破四萬人次學生參與試辦。期能透過試辦協 助教師瞭解標準本位評量的理念,依據評量標準設計評量工具並施測與批改,提升教師評量 知能與增進教師對學生學習情形的瞭解。 本研究期望透過分析參與試辦學校學生及教師的意見回饋,並呈現學生在標準本位評量 示例的實作樣卷,和更多教育人員分享另一種課室評量模式,此標準本位評量模式有利於課 程綱要、教學與評量三者的緊密對應(宋曜廷等,2014),避免課室教學與評量過度受到外部 考試影響而窄化(McMillan, 2008)。另外,面對未來十二年國教課綱強調的核心素養養成教 育目標,在英語文學習方面,本研究所提供之多元評量範例,企盼能協助現場英語教師落實 核心素養的課程理念,使學生不再對英語望而卻步,進而成為十二年國教所欲培養的主動學
128 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 習者,積極提升自我英語能力,至少達「基礎」之通過門檻等級。
參、研究方法
本研究以質性研究為主,佐以小部分定量研究。質性研究是指分析欲研究的評量示例; 定量研究是指該示例受測學生之作答感受的問卷調查分析。另外,本研究亦彙整參與標準本 位評量試辦教師所提供之相關回饋意見。一、研究工具
(一)標準本位評量作業
參與試辦的學校/教師原則上需設計聽、說、讀、寫各一份(共四份)標準本位評量作 業,但為減輕學校教師試辦壓力,教師可選擇在聽、說、讀、寫評量作業中,自行研發兩份 評量,另外兩份則採用心測中心題庫中之作業。本研究以七年級英語閱讀能力的評量作業為 例,說明其設計理念。2本研究提供之示例為題組題,共兩題,均為非選擇題(如附錄一)。此 作業欲評量學生是否能理解文意,並進一步擷取、過濾、歸類、整合文中訊息,應用於新情 境中;本示例所評量的次能力整理如表 2 所示。 表 2 國中英語科課室評量七年級閱讀文意理解和本研究相關的次能力之表現描述 表現等級 次能力 對應題目 A 能指出明確敘述的訊息(同 B 等級) 能整合隱晦、繁複或整體訊息,指出主旨大意與隱含文意 Q1 B 能指出明確敘述的訊息 能整合明顯、簡易或局部訊息,指出主旨大意與隱含文意 Q1、Q2 C 能指出明確敘述的訊息,偶有錯誤 能擷取明顯、簡易或局部訊息,指出主旨大意或隱含文意 Q1、Q2 D 僅能有限地指出明確敘述的訊息 僅能有限地擷取明顯、簡易或局部訊息,指出主旨大意或隱含文意 Q1、Q2 表現描述 E 未達 D 級 Q1、Q2 2 英語文科聆聽、口說、閱讀、寫作之七至九年級評量示例,詳見 https://www.sbasa.ntnu.edu.tw/SBASA/Subject/ SubjectEnglish_4.aspx。曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 129 本閱讀評量示例的文本主題為「養寵物」,內容淺顯,試題設計有趣實用,貼近國中學生 的日常生活情境,符合十二年國教以學生的興趣及需要為依歸的取材原則。兩道題目分別以 「引導式填充」及「開放」題型,評量學生是否能理解文中不同寵物的各式訊息,並能於「尋 找走失寵物」的延伸新情境中,進一步擷取、歸類、過濾、整合文中關鍵訊息,將之應用於 「填寫報案單」及「製作協尋海報」,以利完成「協尋寵物」的任務。此項「延伸、應用所學 知識於真實情境以解決問題」的能力,正是十二年國教英語科課綱草案亟欲培養的核心素養 (英-J-A2、英-J-B1)(教育部,2015)。 本示例係由心測中心學科研究員提供命題初稿,命題初稿經由多次研發、修題、審題過 程後,先請數位國中英語教師帶回學校試測(pilot test),透過試測學生的作答反應進一步修正 命題初稿,經過幾次的試測確定其效度。本示例已在多次培訓研習中當作評量範例,且作為 因應十二年課綱實施素養導向評量之閱讀課室評量參考範例(國民中小學課程與教學資源整 合平臺,2018)。
(二)考後問卷
本研究針對參與試辦學校學生在做完標準本位評量作業後,以問卷調查蒐集相關意見。 問卷調查方式係將所要調查的問題,附於閱讀與聽力評量學生作答卷中,請學生答畢試題後, 直接繼續填答問卷。問卷共分為六道問題,主要是詢問學生「跟一般選擇題、填充題相比, 回答這類型的題目時,你覺得……」:1.是否比較願意作答;2.是否心情比較愉快;3.是否比較 容易發揮;4.是否比較容易得分;5.是否比較有挑戰性;6.是否比較活潑有趣。二、研究對象
本研究的研究對象來自 2017 年(106 學年度)第六期程標準本位評量試辦國中英語科課 室評量標準的八所國中。此八所學校分布於北、中、南、東各區的八個縣市,其中編號 4 的 南區學校七、八、九三個年級皆參加試辦;另外,編號 3 之中部與編號 8 之東部偏遠學校, 則是七、八兩個年級參與;其餘五所學校僅八年級參與試辦(如表 3 所示)。由於考後問卷僅 附於閱讀、聽力的評量作業後,因此以有作答考後問卷的學生作為本研究之研究對象。各學 校參與研究的年級與接受的評量作業均不同,從表 3 可知,編號 1、5、6、7 之學校參與研究 的學生為八年級,評量作業是閱讀;編號 3 與編號 8 是七、八年級的閱讀作業;編號 2 是八 年級學生同時參與閱讀與聽力作業;編號 4 則是三個年級均參與,七年級施測閱讀作業,八 年級與九年級同時施測閱讀與聽力作業。由於部分學生同時接受閱讀與聽力作業施測,因此 在研究對象部分以人次取代人數,共計 3,565 人次。 除了學生的意見外,本研究亦針對參與 2017 年(106 學年度)第六期程試辦國中英語科 課室評量標準的八所國中的教師,蒐集其試辦感想,以提供後續政策規劃參考。八所試辦學 校共計 50 位英語科教師參與,回饋意見由負責承辦試辦業務之教師彙整提供,由於非為單一130 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 表 3 本研究問卷調查參與學生就讀學校基本資料分布 學校編號 區域 偏遠與否 參與年級 評量作業類別 參與人次 總人次 1 北區 非偏遠 八 閱讀 257 2 中區 非偏遠 八 閱讀、聽力 549 3 中區 偏遠 七、八 閱讀 29 4 南區 非偏遠 七、八、九 七年級閱讀 八、九年級閱讀與聽力 1,854 5 南區 非偏遠 八 閱讀 143 6 南區 非偏遠 八 閱讀 129 7 南區 非偏遠 八 閱讀 533 8 東區 偏遠 七、八 閱讀 71 3,565 教師之意見,故本研究引述各校教師意見時,將以 S1、S2、S3、S4、S5、S6、S7、S8 為八所 國中的代號。
肆、研究結果與討論
一、素養導向試題,引導學生體會英語學習的意義
作答本研究之閱讀題組,學生除了要理解文本中的訊息,也要將文中相關訊息用於填寫 寵物走失報案單及寵物協尋海報,希望從平時低風險的課間評量,適時引導學生學習 (assessment for learning; assessment as learning)將所讀訊息或所學知識,進一步遷移、應用 於日常熟悉的仿真情境(scenario),以培養「問題解決」的能力,達到「有意義的學習」 (meaningful learning)之目的(Anderson & Krathwohl, 2001)。這樣的試題設計,也呼應國際 學生能力評量計畫(Programme for International Student Assessment, PISA)閱讀素養的核心意 涵,強調一位具備閱讀素養的讀者,不會只是被動地對文本訊息不加思索或照單全收,而是 積極主動、具有目標(goal-directed)的理解文本內容,並能評估文本內容與自身目標的相關 性,進一步將文本運用於文本外的生活情境(孫劍秋、林孟君,2012;Carroll, 2017; OECD, 2016)。此項「延伸應用所學知識於真實情境」的能力,正是十二年國教英語科課綱草案亟欲 培養的核心素養,如表 4 所示。 本閱讀評量示例以素養導向的試題,在評量中引導學生體會學習英語的實用性,或許是 因結合熟悉親切的主題(寵物)與生活情境,所以有近七成的學生認為本閱讀評量示例活潑 有趣,也容易發揮;另一方面,可能也因答題需要進一步活用文中訊息方可完成任務,所以 也有近七成的學生認為本閱讀評量示例具有挑戰性。曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 131 表 4 與本研究相關的十二年國教英語科課綱草案核心素養內容 面向 項目 具體內涵(國民中學教育) A 自主 行動 A2 系統思考與 解決問題 英-J-A2 具備系統性理解與推演的能力,能釐清文本訊息間的關係進行推論…… B 溝通 互動 B1 符號運用與 溝通表達 英-J-B1 具備聽、說、讀、寫英語文的基礎素養,在日常生活常見情境中,能運用 所學字詞、句型及肢體語言進行適切合宜的溝通與互動
二、多元題型,搭配標準參照評等,鼓勵學生多元表現
基於課室評量著重引導學生從評量中學習,本閱讀評量示例以題組方式(如附錄一),逐 步引導學生:先透過 Q1 報案單的「引導式填充」題型,列出各訊息類別,引導學生將文中訊 息分類歸納;再利用 Q2 協尋海報的「開放式題型」,評量學生是否能進一步從各式訊息中過 濾、整合出協尋海報所需的關鍵訊息。藉由這樣的題型與題序,讓學生從評量中有效發展、 學習閱讀素養。 本題組的學生表現,對應的表現描述是國中英語科課室評量閱讀文意理解的「能指出明 確敘述的訊息」及「能指出主旨大意與隱含文意」兩項次能力(如表 2 所示)。其中「能指出 隱含文意」在 Q1 是指「推論文中未明說」的隱含訊息,包含「Tony 是狗」及「Nana 有藍眼 睛」;在 Q2 則是指透過較高層次的能力或素養,將閱讀所得訊息與生活常識做連結,「推論」 得知有助協尋寵物的有用訊息,「隱含的條件」就是「寵物的物種及外型特徵」等訊息。表 5 為本閱讀評量示例的參考答案及評分指引,由表 5 可知,Q1 最高只能評到 B 等級,此乃因「引 導式填充」無法得知學生是否具備 A 等級表現描述「能整合隱晦、繁複或整體訊息,指出主 旨大意與隱含文意」之能力。表 5 也顯示,Q1 評等原則是學生若能在報案單中提出愈多正確 訊息,表示學生具備「能指出明確敘述的訊息」之能力的機率愈高。值得注意的是,學生在 Q1要達所能評得的最高 B 等級,並不需要提出全部 13 個訊息,而是至少提出 10 個(八成) 正確訊息,並包含「Tony 是狗」及「Nana 有藍眼睛」兩項文中未明說的隱含訊息即可。符合 這兩個條件,學生表現即符合 B 等級表現描述「能指出明確敘述的訊息,並能整合明顯、簡 易或局部訊息,指出主旨大意與隱含文意」,藉此推斷其能力被歸類為 B 等級的機率較高。不 過,各等級所要求的答對數量或比例並非一定是八成,建議專業教師彼此討論達成共識後再 決定。132 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 表 5
國中英語科課室評量七年級英語閱讀評量示例參考答案及評分指引
參考答案
Nana: a cat / female / two-year-old / black and white hair / cow-like / one-eyed / blue eye Tony: a dog / male / eight-year-old / short and white hair / brown eyes / big
(各式訊息,用中、英文或圖畫等非文字的表徵方式作答亦可) 表現等級 Q1 Q2 A ─ 每張海報至少各有四項關鍵訊息(需含寵 物的物種),且兩張海報至多共出現兩項 無益於找到寵物的訊息,且不含錯誤訊息 B 共提出10~13個正確的訊息,且其中包含 “Tony is a dog”及“Nana has a blue eye”兩 個隱含訊息 每張海報各有三項關鍵訊息(需含寵物的 物種),且兩張海報至多共出現三項無益 於找到寵物的訊息,且不含錯誤訊息 C 共提出7~9個正確的訊息,且其中包含 “Tony is a dog”或“Nana has a blue eye”其 中一個隱含訊息 每張海報各有兩項關鍵訊息 D 共提出4~6個正確的訊息 每張海報各只有一項關鍵訊息 E 共提出0~3個正確的訊息或全寫相同答 案 都沒有提出文中關於寵物的內容或作答 內容無法辨識或空白 評分 指引 Q1+Q2綜合評等:Q1評等、Q2評等擇優作為綜合評等成績 Q2為開放題型,從表 5 可知,Q2 最高能評得 A 等級,且 Q2 並非訊息量愈多愈好,也不 是符合文中內容、訊息無誤就好;Q2 需要的訊息是「寵物的物種及外型特徵」等「有助於找 到」走失寵物的關鍵訊息。學生要能篩選訊息,刪除「雖無誤,但無益找到寵物」的訊息, 如“The two girls often play together.”或“He’s very kind to his little sisters and takes good care of them.”等,再整合出有用的訊息應用於海報中。表 5 顯示,協尋海報的首要關鍵,是提出要找 的寵物是什麼動物,並只需提出包含物種的四項關鍵訊息,不需要提出全部訊息,即可推知 學生已具備能將文中訊息合理轉移、應用於新情境以解決問題的較高層次的能力或素養,表 現符合 A 等級描述「能整合隱晦、繁複或整體訊息,指出主旨大意與隱含文意」,能力被歸 類為 A 等級的機率較高。 至於 Q1 及 Q2 兩題的綜合評等,基於課室評量鼓勵學生的理念,同時考量多元智能發展 (Gardner, 2011)因素,有些學生可能較習慣或擅長 Q1 這類「引導式」的填充題型;有些學 生則可能反而更習慣或擅長 Q2 這類情境導向(scenario-based)的開放式題型。所以本題組綜 合評等採兩題個別評等擇優作為綜合評等成績。 由於希望透過類似的低風險課間評量,幫助學生學習,所以作答方式及評量要點皆詳盡
曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 133
說明,甚至以粗體加雙底線的方式,一再提醒學生容易疏忽或誤解的部分,如「並非每項訊 息都適合填寫在海報告示中」、「請僅利用從文中得知的相關或適切訊息」、「提供的訊息,能 有效且盡快找到Nana和 Tony」、「提供的訊息,不含與尋找 Nana 和 Tony 無關的訊息」等。這 些提醒呼應十二年國教英語科課綱草案學習評量要點第一項:「教師……設計學習評量……盡 可能事先告知學生學習評量的相關內容與方法」(教育部,2015)。 此外,為盡量降低學生答題壓力,除了題目及作答說明皆使用學生熟悉的中文之外,在 不影響閱讀理解評量效度的前提下,學生可用任何表徵方式作答,不論是用文字或圖表,中 文或英文,都不影響閱讀理解能力的評等結果,且明確告知學生「訊息排列及呈現方式不拘」, 一再展現課室的形成性評量,不是要考倒學生或得到最後成績排序,而是要友善地提供學生 具體呈現學習成果的機會,給予學生信心,提高其嘗試作答的意願,藉此促進其自發學習。 此即呼應課綱基本理念「在發展……諸多認知能力之餘,切勿忘記學習興趣的培養、學習動 機的激發」(教育部,2015)。 值得注意的是,在英語閱讀或聆聽理解的評量中,學生可用中文(L1)回答問題的適切 性,臺灣目前許多英語教師仍多有疑慮,認為英語評量出現中文是不符合真實情境(not authentic)。然就閱讀能力評量而言,語言真實性(authenticity)是針對閱讀文本而言,不是用 來限定學生只能用尚在學習中的外語(L2)做回應。許多研究結果也顯示,外語學習過程中, 教師除了在教學、評量中可適度使用學生熟悉的語言(L1)幫助學生理解之外,如果也能讓 學生(尤其是初學者)使用其熟悉的語言(L1)表達自己的理解內容,將能避免因溝通障礙 而產生的學習焦慮感,影響評量效度(Carson & Kashihara, 2012; Meyer, 2008; Miles, 2004; Morahan, 2010; Schweers, 1999; Seng & Hashim, 2006)。以澳洲為例,中文(L2)閱讀考試, 應試學生乃是以英文(L1)作答(Queensland Studies Authority, 2010)。基於以上理念,本閱 讀理解評量示例,允許學生使用中文作答,是有利於學生充分呈現英語學習表現的彈性措施。
本課室英語閱讀評量示例以多樣題型,搭配標準參照評等方式,讓學生可透過評量結果 明瞭自身學習狀況(Clear Creek, 2016; Marzano, 2018; Work, 2014);且學生作答表現方式多元 有彈性,各等級評等亦採「區間」認定,而非單一固定數量,加上要達到所能評得的最高等 級,並不需要全部答對或提出所有訊息,總成績亦採擇優方式評等,一再顯示本評量示例「善 誘學生學習動機與熱情」(教育部,2014),希望藉由降低答題壓力以鼓勵其勇於表現,讓學 生「樂於參與課堂中各類練習活動,不畏犯錯」(教育部,2015)。從學生考後問卷關於作答 感受的調查結果亦印證上述所期待的學生正向反應:近六至七成的學生認為本閱讀評量示 例,比傳統評量更為活潑有趣、也更容易發揮及取得好成績,同時也讓他們覺得比較願意作 答及心情較愉快。
134 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋
三、學生實際樣卷
附錄二為本閱讀評量示例的各等級學生表現樣卷及說明。從 A 等級各樣卷看來,學生表 現多元豐富,令人驚喜。雖然作答說明並未明確提及可以繪圖作答,但「訊息呈現方式不拘」, 解放了學生的表現方式。有學生依據平時所見寵物協尋海報之生活經驗,在 Q2 中以圖像表徵 方式呈現寵物的相關訊息,甚至為求更似真精確,利用手邊文具上色,描繪出精巧的圖畫, 如附錄二之 A 等級學生表現樣卷一。 從附錄二可知,這些 A(優秀)等級學生表現樣卷,同樣是活用文中訊息於找寵物的新情 境,因學生理解與表達方式各有不同,所以展現了多元風貌的閱讀素養表現模式,包含文字 與圖像,連圖畫風格也有詳細寫實與精簡表意之別,讓本是多數學生望而卻步的英語閱讀評 量充滿童趣與創意。此外,A 等級學生表現樣卷三的 Q1 報案單,因沒有寫出 Nana 有藍眼睛, 導致 Q1 只有 C 等級;但此生在 Q2 海報中卻有列出 Nana 是藍眼睛,可見其並非不知道此一 隱含訊息。由此可知,素養導向標準本位的多元課室評量,除可提高整個評量的趣味性,也 可藉多元評量方式,更精準有效地評斷學生能力等級。 從 B 等級學生表現樣卷與說明,學生只需在 Q2 簡要的提出三項包含物種之關鍵訊息,該 協尋海報即能有效地找到寵物,顯示該生大致能將訊息應用於找寵物的新情境,Q2 表現符合 B(良好)等級描述「能整合明顯、簡易或局部訊息,指出主旨大意與隱含文意」。透過此一 簡潔的 B 等級學生表現樣卷可知,評等採「區間」認定,不用單一固定數量,應可鼓勵學生 「樂於參與課堂中各類練習活動,不畏犯錯」(教育部,2015),並藉由這類有轉圜空間卻又 明確合理的評等方式,提升學生學習英語的興趣與自信心。 從 C 等級學生表現樣卷與說明可知,學生只部分理解文本內容,但參照表現標準及評分 指引,成績為 C(基礎)等級,可知本閱讀評量示例希望鼓勵學生不畏犯錯、樂於作答。值得 注意的是,本樣卷雖比 B 等級學生提出更多訊息,但此生的能力等級反而較低,乃因學生在 Q1有寫出 Nana 是貓,但在 Q2 兩張協尋海報中,均未提出要找什麼動物,顯示其尚未具備將 所讀得訊息,適切應用於新情境(找寵物)的閱讀素養。透過此 C 等級學生表現樣卷可知, 本閱讀評量示例鼓勵學生盡量作答之餘,也參照表現標準,可以合理有效地評定學生能力等 級;更重要的是,可藉此提供學生學習改善方向,有利於促進英語學習興趣與成效。 本研究所探討的七年級英語閱讀評量示例,不同於傳統英語科評量方式。以同樣的文本 為例,現行評量試題多為封閉式題型,如附錄三所示。類似附錄三的傳統英語科評量,多為 封閉式題型,不符合課綱所載明「應採多元評量方式」;試題亦多缺乏情境,配分輕重也無所 依據,導致學生表現與評分方式毫無轉圜空間,不僅不易引起學生興趣,且即使全部答對, 以附錄三為例,也僅能測得學生是否具備「指出明確敘述的訊息」之類的基礎能力,無法得 知是否具備將訊息整合或延伸應用於新情境等較高層次的閱讀能力或素養。曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 135
四、 問卷調查顯示,學生認為本研究閱讀評量示例容易發揮、具挑戰性及活
潑有趣
針對第六期程標準本位評量試辦國中英語科課室評量標準的八所國中學生,在作答不同 閱讀及聽力標準本位評量試題後蒐集考後意見,意見分析結果如表 6 所示。從表 6 可知,約 有 67%的學生認為標準本位評量試題比傳統選擇題或填充題更具挑戰性,51.19%認為比較活 潑有趣。其他關於作答意願、心情愉快、容易發揮與容易得分等問題,持正面意見的學生比 例均在五成以下。研究者推論,可能是參與研究的教師研發評量的經驗較為不足,且所發展 的作業未經多次的修審與預試,試題品質與素養導向標準本位評量的要求或精神尚未完全契 合與貼近,導致在課室中的運用成效不如預期。 表 6 八所試辦學校針對英語閱讀及聽力標準本位評量作業作答感受之問卷調查結果 人次(百分比) 問卷題目 是 否 未答 1. 是否比較願意作答 1,681(47.15) 1,853(51.98) 31(0.87) 2. 是否心情比較愉快 1,494(41.91) 2,038(57.17) 33(0.93) 3. 是否比較容易發揮 1,695(47.55) 1,844(51.73) 26(0.73) 4. 是否比較容易得分 1,325(37.17) 2,194(61.54) 46(1.29) 5. 是否比較有挑戰性 2,393(67.12) 1,149(32.23) 23(0.65) 6. 是否比較活潑有趣 1,825(51.19) 1,715(48.11) 25(0.70) 本研究另單獨檢視心測中心研發的評量作業(如附錄一)在課室中的運用成效,由於此 閱讀評量示例乃是心測中心命題,歷經多次修審題與多次預試分析的成果,根據研究者的觀 察,此示例的試題品質明顯優於試辦學校教師自行命製的試題。因此,本研究另單獨呈現接 受前述七年級閱讀評量示例學生之問卷調查結果,用以說明標準本位評量試題在課室運用的 成效。附錄一「七年級閱讀評量示例」與問卷調查施測當時為上學期,考量當下七年級學生 尚未習得完整的七年級課程,因此,由八年級學生接受測驗。實際接受此閱讀評量示例與問 卷調查的學校為表 3 中學校編號為 1、3、8 之八年級學生,其問卷結果呈現於表 7。由表 7 可 知,近七成的學生認為此標準本位評量試題比傳統選擇題或填充題更容易發揮、更具有挑戰 性、也較活潑有趣;六成左右學生的作答意願較高、心情比較愉快,也認為比較容易得分。 相較於全體學生的作答感受(如表 6 所示),使用本研究英語閱讀評量示例的學生,除了在「比 較具有挑戰性」上選答比例相近之外,在其他問題的作答結果,持正面意見的比例均高於全 體學生,顯見本示例符合課綱強調激發學生學習動機與熱情的基本理念。136 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 表 7 本研究英語閱讀評量示例作答感受之問卷調查結果 人數(百分比) 問卷題目 是 否 未答 1. 是否比較願意作答 190(63.55) 107(35.79) 2(0.67) 2. 是否心情比較愉快 171(57.19) 126(42.14) 2(0.67) 3. 是否比較容易發揮 208(69.57) 90(30.10) 1(0.33) 4. 是否比較容易得分 173(57.86) 124(41.47) 2(0.67) 5. 是否比較有挑戰性 206(68.90) 91(30.43) 2(0.67) 6. 是否比較活潑有趣 206(68.90) 92(30.77) 1(0.33)
五、試辦教師回饋意見
教育部國教署自 2012 年開始辦理各縣市國中標準本位評量試辦計畫,以一學年為一個期 程,參與試辦的學校中,部分是學校自行向縣市教育局提出試辦計畫,也有部分學校是由教 育主管機關推薦。學校申請參與試辦之文件中必須附上參與試辦科目教師的同意書,以利後 續計畫能順利執行。針對非教育會考考科之領域,如健康與體育或藝術與人文,參與試辦的 教師壓力相對較小,因為這些非教育會考考科原本課室評量的方式就不受限於紙筆測驗,比 較多元,採用標準本位評量方式之後,其評量的架構與標準能有所依循,更能貼近課綱。英 語科是教育會考的考科之一,由於教育會考目前僅評量閱讀與聽力測驗,因此國中端英語課 程教學多少會受到影響。願意參與試辦的教師,針對自身評量專業發展的企圖心都相當高。 每年試辦結束前,針對該年度試辦程序與經驗所彙整的訊息,對未來在國中端實施標準本位 評量政策有重要參考價值。 本研究統整參與 2017 年(106 學年度)第六期程標準本位評量試辦國中英語科教師的回 饋意見,整理出下列幾項重點:(一) 素養導向的標準本位評量可提升學生的學習興趣,並發揮其潛力與多元語文
能力
語言本來就是聽、說、讀、寫四個面向都需顧及,然而,國中端在傳統測驗的框架及教 育會考成績壓力之下,平時將教學重點置於聽、讀兩項技能的培養,導致學生在口說與寫作 的領域難以發揮。素養導向的標準本位評量方式雖與多數學生考試的經驗不同,多數學生都 還在適應階段,但透過素養導向的評量方式,學生展現更主動、積極的學習態度。有兩位試 辦學校教師表示:曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 137 在口說方面,這學期比較要求學生每篇課文都要朗讀給老師聽,即便是低成就的學 生一個字不會唸的也要,老師就花時間一句一句帶著唸,至少有開口練習。唸了一 段時間發現,學生進步許多,雖然發音總是很臺式,但唸得很好,也發現學生從不 太敢英語朗讀,進步到對自己有自信許多,喜歡開口練習了!(S3) 此次口說測驗方式,讓學生當場看題目並搭配耳機麥克風錄製,學生比較能正視這 次的測驗並認真作答,有些在閱讀方面表現較弱的學生,反而有出乎意料的表現。 顯示在評量學生學習成就時,應在聽、說、讀、寫四個方面都要著重。測驗的內容 如能更貼近學生的生活經驗,較能引起他們作答的興趣。(S5) 另外,在寫作測驗中部分學生也展現了高度創意及作答能力,遠超過教師們的期待,但 也有受訪教師表示: 寫作部分,要寫出一整篇的英文作文,對他們而言也是很吃力的,因平常多是單句 練習,要以英文呈現出短文寫作,很多學生是選擇放棄的。(S1)
(二)素養導向的標準本位評量可促進教師專業知能的成長
部分學生在作答時表達出令教師們出乎意外的答案,如八年級聽力測驗作答時,因對中 文題目意義之誤解而寫出令人莞爾一笑之回答。此激發教師們「以學習者理解角度來設計評 量題目」、「學習者為主體」之思考,並在瞭解學生的學習困難後,進而幫助學生解決學習上 的問題,師生之間能教學相長,共同探索更多學習與測驗模式的可能性。在教師研習方面, 所有領域教師都覺得獲益良多,對評量有更進一步瞭解,出題時會將評量原則擺在心上,因 此會更謹慎,評量後的專業討論也讓教師對未來的評量有更清晰的圖像。 除上述兩大益處之外,部分教師也反應參與此類計畫需要付出許多額外時間,來設計課 程、評量測試與評閱學生的測驗表現,英語課程的節數有限,對於原有的課程進度造成不少 壓力,學生對新式評量的適應程度也是應考量的因素之一,誠如其中一位任教於偏鄉的教師 所說: 學生想要的是能帶著走的能力,英語教學的內容很多,可以很多元,四大技能的框 架很大,但是英語的節數有限,想要帶給孩子更多的練習之下,反思評量能帶給孩 子的是什麼?真正幫助到孩子嗎?我們都希望這階段的孩子能聽、能說、能讀、能 寫,但我們是否曾經想過孩子們吸收得了?我們是否在某些地區給得太快、太急、 太多?……但是現場的教學礙於時間,沒有辦法給予四大能力更多的練習時間,在 練習不足的情況下,孩子不會,接下來就是不懂,再來就是放棄了,那評量標準的138 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 角色為何?沒有一個孩子是相同的,那為何要用同樣的評量標準在每個孩子的身 上,而評量在這個環節扮演的是什麼?(S3) 針對這位教師的問題,研究者的觀察與回應是,當初國教署委託制定各領域課室評量的 共同標準,主要目標就是要改善城鄉差距,期望透過全國一致性的標準,讓各科教師平時在 設計課堂評量工具時有所依循參照,可以改善國中畢業時,各地區、各學校學生之間的學業 成就落差。研究者也認同要讓所有偏鄉地區學生達到課綱所期待的基礎水準尚需一段時間, 我們也鼓勵偏鄉教師在運用評量標準時,若班上學生程度落後同年級許多的話,可將學生程 度對應至前一學習階段,針對其待加強的能力進行補救,假以時日,當低成就學生重拾自信 心與對英語學習產生興趣時,自然就能跟上其他同學的腳步,而這正是推動標準本位評量的 創始理念。
伍、結論與建議
誠如 Popham(2011)在《教育周刊》(Education Week)中提及:「超過 4,000 份研究報告 皆顯示當形成性課室評量能適當運用的話,學生學習速度(或成效)能加倍」。研究者也認同 教學過程中及時和適當的評量回饋,提供教師與學生足夠訊息調整教學及學習方式,學生的 學習成就自能提升。要確保學生學習品質,有效教學與優質的課室評量缺一不可,評量從廣 義來看可視為是教學的一部分(McMillan, 2008)。此外,配合近年來國內持續推動以標準為 本位的教育評量改革,除高風險的教育會考外,課室評量也應透過加強課程綱要、教學與評 量三者的緊密對應,促進教師評量專業發展及學生學習成效(宋曜廷等,2014;盧雪梅,2017; McMillan, 2008)。 綜合本研究結果可知,在平時課室評量中,若能不再以成績掛帥,而改以類似本研究所 提出閱讀評量示例的方式,本著利用評量幫助學生學習的理念,透過素養導向的情境式試題、 多樣化的題型及標準參照的評等方式,同時不吝以友善詳盡的作答說明提醒學生容易忽略的 重點,加上給予彈性可轉圜的表現空間,應可激發其多元活潑的表現,提高作答意願,正如 表 6 與表 7 學生問卷調查結果所示;加上標準參照評量不僅能合理有效地判定能力等級,也 能提供後續教學與學生學習改善方向,進而幫助學生自發學習英語,藉此達到十二年國教英 語科課綱評量的積極教育目的(教育部,2015)。 誠如兩位英國教育評量學者 Black 與 Wiliam(1998)所提倡當教師和學生都對他們所要 追求的目標有清楚的願景時,學習會比較容易(learning is easier when both the teacher and the student have a clear image of where they are headed),就是指當教師或是學生雙方都明確知道教 學與學習的目標時,學生學習就會比較容易(Earl, 2003)。而在教師教學與學生學習目標之間, 課室評量提供最佳的連結。本研究所提出的素養導向標準本位評量即是結合課程、教學與評曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 139 量的課室評量模式,其中內容標準讓教師清楚知道教學範疇,表現標準則讓教師更能預期與 掌握學生不同的學習層次。依據這套評量標準,並透過多元、生活情境化的評量工具,引導 學生瞭解自身學習的現狀,針對尚未掌握的學習內容與能力,立即進行後續補救。從試辦標 準本位評量的師生回饋分析顯示,此類評量模式即使不熟悉,但情境式試題設計,可引導學 生從評量中,學習將所理解的訊息應用於仿真的新情境以解決問題,藉此幫助學生體會英語 閱讀實用且有意義;多樣化題型,搭配標準參照評等方式及彈性作答方式,有助於降低學生 答題壓力,激發其多元表現,並從評量的過程與結果,讓學生明瞭自身的學習狀況。此種課 室評量模式讓學生更有機會從評量中學習,並嘗試多元表現及感受學習的意義;同時透過課 間使用「標準參照」的評等方式,明確呈現學生學習狀況,更有利後續適性教學與增進學生 自信心與自發學習。 要培養十二年國教期望學生終身學習的核心素養與態度,並非一蹴可及。以英語學習而 言,應盡早融入學生的生活情境需求,導入語言知識的運用及語言技能的培養(教育部, 2015),利用「素養導向」的英語學習與評量,讓學生覺得所學有其用途,同時透過「標準參 照」的評等方式,引導學生和自己的學習表現比較,找到自己的位點,並依據自己的學習地 圖,持續自我成長進步(教育部,2015;Jones, 2018)。如此一來,自然有助於提振學生的英 語學習興趣,尤其有助於英語學習低成就的學生。基於「興趣是心智發展之源」(Whitehead, 1929, p. 48),只要能設法讓學生對英語學習抱持興趣,相信在英語學習的路上,即使再艱辛, 仍能以「興趣」支撐自己持續地自發學習,開啟「終身學習」的契機。本研究從「引起興趣」 的觀點,探討國中英語科標準本位課室評量,希望透過課室評量示例分析與相關問卷調查結 果,對於「評量」與「學習」之間的關係,提出另一種更積極、跳脫傳統的思維,以供教育 人員與相關專業人士參考。
陸、研究限制
本研究探討如何設計素養導向標準本位評量工具與其在國中端的應用,本研究以一個七 年級英語閱讀評量示例對於學生學習可能促成的正向影響,具有參考價值,然並未針對特定 能力等級的學生,且單一示例的研究結果,恐無法一體適用。此外,目前對於「素養導向」 評量的定義尚無定論,本研究僅依據文獻常識提出看法,並非唯一。至於本研究中的學生作 答感受問卷調查,礙於人力及經費,未能將學生作答評量示例的表現與其所填答的問卷結果 加以比對分析。最後,本研究並未探討教育會考各等級與課室評量標準之間的關聯,也未深 入探討「多元智能」或「興趣與學習動力」等相關理論。140 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋
誌謝
本研究由教育部補助國立臺灣師範大學高等教育深耕計畫「學習科學跨國頂尖研究中心」 經費支持,特此致謝。
曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 141
參考文獻
一、中文文獻
宋曜廷(2012)。以標準參照的入學考試和班級評量促進科教發展。科學月刊,43(9), 672-678。
【Sung, Y.-T. (2012). Standards-referenced entrance examinations and classroom assessment for the promotion of
science education. Science Monthly, 43(9), 672-678.】
宋曜廷、周業太、曾芬蘭(2014)。十二年國民基本教育的入學考試與評量變革。教育科學 研究期刊,59(1),1-32。doi:10.6209/JORIES.2014.59(1).01
【Sung, Y.-T., Chou, Y.-T., & Tseng, F.-L. (2014). Standards-based assessments for 12-year basic education in
Taiwan. Journal of Research in Education Sciences, 59(1), 1-32. doi:10.6209/JORIES.2014.59(1).01】
林素卿、葉順宜(2014)。檔案評量於國中英語教學應用之個案研究。教育科學研究期刊, 59(2),111-139。doi:10.6209/JORIES.2014.59(2).05
【Lin, S.-C., & Yeh, S.-I. (2014). Applying a portfolio assessment of English teaching in a junior high school: A case
study. Journal of Research in Education Sciences, 59(2), 111-139. doi:10.6209/JORIES.2014.59(2).05】
孫劍秋、林孟君(2012)。談 PISA 閱讀素養評量對十二年國教閱讀教學的意涵。北市大語文 學報,9,85-98。
【Hsun, C.-C., & Lin, M.-C. (2012). PISA reading literacy and its implication on the reading instruction in the
12-year compulsory education. TMUE Journal of Language and Literature, 9, 85-98.】
教育部(2012)。國民中小學九年一貫課程綱要語文學習領域(英語)。取自 https://www.k12ea. gov.tw/97_sid17/英語 970526 定稿單冊.pdf
【Ministry of Education. (2012). General guidelines of grades 1-9 curriculum for elementary and junior high school
education of language arts (English). Retrieved from https://www.k12ea.gov.tw/97_sid17/英語 970526 定稿單
冊.pdf】
教育部(2014)。十二年國民基本教育課程綱要總綱。取自https://www.naer.edu.tw/files/15- 1000-7944,c639-1.php?Lang=zh-tw
【Ministry of Education. (2014). General curriculum guidelines for the twelve-year basic education. Retrieved from
https://www.naer.edu.tw/files/15-1000-7944,c639-1.php?Lang=zh-tw】
教育部(2015)。十二年國民基本教育課程綱要國民中小學暨普通型高級中等學校語文領域─ 英語文(草案)。取自 https://www.naer.edu.tw/files/15-1000-10472,c1174-1.php?Lang=zh-tw 【Ministry of Education. (2015). Twelve-year basic education curriculum guidelines for elementary, junior and
senior high school education of English language (draft). Retrieved from https://www.naer.edu.tw/files/15-
1000-10472,c1174-1.php?Lang=zh-tw】
教育部(2018)。十二年國民基本教育課程綱要國民中小學暨普通型高級中等學校語文領域─ 英語文。取自 https://www.naer.edu.tw/ezfiles/0/1000/attach/23/pta_16364_462768_29173.pdf 【Ministry of Education. (2018). Twelve-year compulsory education curriculum outline of language area – English.
142 國中標準本位課室評量 曾芬蘭、鍾長宏、陳世玉、張銘秋 曾芬蘭、游羽萱、蔡逸凡、陳柏熹(付梓中)。國中教育會考英語科聽力測驗實施的回沖效應
初探。教育科學研究期刊。
【Tseng, F.-L., You, Y.-X., Tsai, I.-F., & Chen, P.-H. (in press). A pilot study of the washback effect of the incorporation of English listening test in the comprehensive assessment program for junior high school students.
Journal of Research in Education Sciences.】
傅秋英(2007)。學生、家長、國中教育人員對國中基本學力測驗態度及改進意見之研究(未 出版碩士論文)。國立中山大學,高雄市。
【Fu, C.-Y. (2007). The study of the attitude and improvements on the basic competency test for junior high school students for students, parents and educators (Unpublished master’s thesis). National Sun Yat-sen University,
Kaohsiung, Taiwan.】
國立臺灣師範大學心理與教育測驗研究發展中心(2017a)。國民中學學生學習成就標準本位評 量 ( 試 行 版 ): 語 文 學 習 領 域 ( 英 語 )。 取 自 https://www.sbasa.ntnu.edu.tw/SBASA/ Subject/SubjectEnglish_3.aspx
【 Research Center for Psychological and Education Testing, National Taiwan Normal University. (2017a). Standards-based assessment of student achievement for elementary and junior high school students: English
language (trial version). Retrieved from https://www.sbasa.ntnu.edu.tw/SBASA/Subject/SubjectEnglish_3.aspx】
國立臺灣師範大學心理與教育測驗研究發展中心(2017b)。國中教育會考。取自 https://cap. nace.edu.tw/examination.html
【Research Center for Psychological and Educational Testing, National Taiwan Normal University. (2017b). Comprehensive assessment program for junior high school students. Retrieved from https://cap.nace.edu.tw/
examination.html】 國民中小學課程與教學資源整合平臺(2018)。素養導向教學課程與評量:十二年國民基本教 育素養導向課室評量參考示例。取自 https://cirn.moe.edu.tw/Upload/ckfile/files/%E5%8D %81%E4%BA%8C%E5%B9%B4%E5%9C%8B%E6%95%99/107%E5%85%AC%E5%91%8 A%E8%AA%B2%E5%AE%A4%E8%A9%95%E9%87%8F%E7%B4%A0%E9%A4%8A%E 5%B0%8E%E5%90%91%E8%A9%95%E9%87%8F%E7%A4%BA%E4%BE%8B(107_04_1 9).pdf
【Curriculum & Instruction Resources Network. (2018). Literacy-based curriculum and assessment: Examples of literacy-based classroom assessment for the twelve-year basic education. Retrieved from https://cirn.moe. edu.tw/Upload/ckfile/files/%E5%8D%81%E4%BA%8C%E5%B9%B4%E5%9C%8B%E6%95%99/107%E5% 85%AC%E5%91%8A%E8%AA%B2%E5%AE%A4%E8%A9%95%E9%87%8F%E7%B4%A0%E9%A4%8
A%E5%B0%8E%E5%90%91%E8%A9%95%E9%87%8F%E7%A4%BA%E4%BE%8B(107_04_19).pdf】
盧雪梅(2017)。英國國定課程評量的沿革與其對十二年國民基本教育課程評量的啟示。教 育實踐與研究,30(2),105-142。
【Lu, S.-M. (2017). Evolutions of the national curriculum assessment in England and its implications for the assessment of the 12-year basic education curriculum in Taiwan. Journal of Educational Practice and Research,
30(2), 105-142.】
二、外文文獻
曾芬蘭、鍾長宏、陳世玉、張銘秋 國中標準本位課室評量 143
doi:10.1093/applin/14.2.115
Anderson, L. W., & Krathwohl, D. R. (Eds.). (2001). A taxonomy for learning, teaching, and assessing: A revision of Bloom’s taxonomy of educational objectives (Abr. ed.). New York, NY: Longman.
Black, P., & Wiliam, D. (1998). Inside the black box: Raising standards through classroom assessment. Phi Delta Kappan, 80 (2), 139-148.
California Department of Education. (2002). English-language development standards for California public schools, kindergarten through grade twelve. Retrieved from https://www.cde.ca.gov/ be/st/ss/documents/englangdevstnd.pdf
Carroll, B. A. (2017). A learning-oriented assessment perspective on scenario-based assessment. Working Papers in Applied Linguistics & TESOL, 17(2), 28-35. doi:10.7916/D8TX4S9V Carson, E., & Kashihara, H. (2012). Using the L1 in the L2 classroom: The students speak. The
Language Teacher, 36(4), 41-48.
Clear Creek. (2016). Standards-based grading: A clearer picture of your child’s academic progress. Retrieved from https://www.tasanet.org/cms/lib/TX01923126/Centricity/Domain/361/SB_ Brochure_Oct2016_ENGLISH.pdf
Common Core State Standards Initiative. (2011). Frequently asked questions. Retrieved from http://www.corestandards.org/frequently-asked-questions
Crooks, T. J. (1988). The impact of classroom evaluation practices on students. Review of Educational Research, 58(4), 438-481. doi:10.2307/1170281
Department for Education, the National Archives. (2011). Assessing Pupils’ Progress (APP): Assessment guidelines. Retrieved from http://webarchive.nationalarchives.gov.uk/201108120 92626/http://nsonline.org.uk/node/20683
Earl, L. M. (2003). Assessment as learning: Using classroom assessment to maximize student learning. Thousand Oaks, CA: Corwin Press.
Earl, L. M. (2013). Assessment for learning; assessment as learning: Changing practices means changing beliefs. Assessment and Learning, 2, 1-5.
Gardner, H. (2011). Frames of mind: The theory of multiple intelligences. New York, NY: Basic Books.
Jones, D. (2018, January 12). Don’t prove yourself – Improve yourself [Video file]. Retrieved from https://www.youtube.com/watch?v=lY9hdpSA1S0
Lin, Y.-T. (2009). A study on the washback of the basic competence English test on junior high school students in northern Taiwan (Unpublished master’s thesis). National Chengchi