• 沒有找到結果。

參、成績考查標準的選擇與設定

臺灣教育評論月刊,2014,3(9),頁 133-144

專論文章

有別於學理上對於評分工作的要求與討論,對體育教師這類教育實踐者來 說,公平與否、方便操作及具解釋能力才是實務工作中考量的關鍵要素,所以他 們常常提出的問題是,到底運動技能表現要佔學期分數的多少比例,而且對於那 些先天運動表現較弱勢者,但相對地卻在課堂上表現較佳者,應該如何決定評分 基準;或是評分的焦點是要著重在學習成就上(achievement),抑或進步幅度上

(improvement);又或是在參照特定標準後(不論是常模參照標準,還是效標參 照標準)的評分,是否能確切反映出學習者的能力,同時這個最終得分是否會太 過依據教師的主觀看法。

對於前述各個問題的回應,我們的觀點是,凡是涉及評分或打分數的過程,

勢必涉及價值選擇與評判的問題,這樣的事實是無法避免的,教師不必過度執著 於主觀或客觀的二元辯證邏輯中;相反地,教師應該思考的問題是,有哪些方法 能夠協助評分工作的執行,如讓學生或家長參與、釐清教學目標與預期表現,或 者仔細評估採取常模參照和效標參照評分所代表的意義與利弊,如此才能於學期 末送出成績後,負責任地表示這個成績是基於各項證據資料(evidence-based) 下 慎思後的結果,而且能與最初的教學計畫相呼應,禁得起外界的詢問和檢驗(施 登堯,付梓中)。

基於此,有關本文成績考查標準選擇與設定的問題,我們的想法不在預設哪 種標準參照系統對動作技能評分是較好的,所謂的「好」其實已然受到教學場域 或特定價值所指引,並不適用於所有的情境或教師身上,所以我們的討論重點將 不會是哪種測驗較適合用何種參照系統,反倒應該採取「觀念分析」的方式,對 兩種參照系統下可能的好處與困難進行綜合分析,並將最終選擇的權利與責任交 付於體育教師的專業判斷。

以國內極力推廣的游泳教學為例,有些老師可能會在期末測驗 50 公尺或 100 公尺自由式游泳前進的速度,接著按照速度快慢加以排序,隨後則依排序結果按 比例給分,或者直接參照校內既有常模進行給分,這樣的給分方式,因建立在真 實的技能表現上,所以給人相對「客觀」的意象,但如果進一步檢驗其中的操作 邏輯,我們可能對下列問題提出疑問,為什麼只有 12%的學生可以獲得優等,這 個比例是否代表了任何能力上的差異(亦即具有效標意義),或是那個沿用已久 的表現─常模對照表是在什麼母群基礎上建立的,因為這會影響教師對現有表現 的解釋與判斷。不過,最嚴重的是,此種評分方式經常是以所有學生皆能掌握的 測驗內容為主,所以每位學生都能取得一個或高或低的測驗成果,然後再依據這 個測驗成果與團體內其他人或常模比較,進而取得相應的成績,但這個成績(符 號)所表徵出的文化價值,或許不一定能象徵學習者的實質能力;而且,對學習 者來說,給分的依據如果等於學期一開始的動作能力排序,那麼久而久之,不就 等於告訴學習者:「你們的成績其實早就決定了」,因而消滅學習者的學習興趣與

臺灣教育評論月刊,2014,3(9),頁 133-144

專論文章

動機。

另外,相同的測驗,有些老師可能採取預先訂定評分標準的評分方式,要求 學習者須完成 50 公尺或 100 公尺自由式游泳前進測驗,然後針對完成速度或動 作過程(正確性與流暢性)給予成績。這種評分方式直接要求學習者達到某一動 作表現水準,如果落實於全校、全學區或全國的同級學校內,那麼該測驗即成為 該年齡階段學習者游泳能力的最低表現指標,具有一定的代表性。可是,從真實 的情況來說,學習者會提出的疑問是:「為什麼必須會游 50 公尺、100 公尺自由 式,如果學不會可不可以只打水就好?」,這類型的提問受到質疑的是測驗內容 與標準和學習目標間連結的效標意涵;學習者也會問道:「游多久就算及格?」,

這個問題背後的意思即是「我只要及格就好」,同時也挑戰著教師制定「及格標 準」的能力,要是訂得太低,等於不用「學習」就能輕鬆過關,而要是訂得太高,

沒人成功達標也沒意思。

再者,與常模參照標準一致,效標參照評分即使成功規劃了各等級的表現水 準,如就動作過程進行評分時,先前的給分標準也應值得仔細思量,像是考量關 鍵動作技術的加權值,因為最後的等級符號將完全地象徵學習者的動作技能水 準,而且是帶著我們這個文化的價值進行觀看,所以給分系統要能與真實表現及 文化價值相契合,否則不但無法因為一、兩分的成績落差,辨明鄰近兩兩表現水 準間之差別,亦難以與其他教師或家長進行溝通,以達共識。

綜前所述,不論是採取常模參照或效標參照的評分方式,皆具有各自的評價 優勢,或面臨相應的挑戰,考驗著評分者目標分析、測驗選擇、價值訂定及靈活 運用的能力。不過,也因為兩種評分標準系統各有其優缺點,加上測驗或教學的 內容、對象與條件限制等情境的多元差別,往往使得施測者或教師不知如何因 應,所以只能選擇制式或校內慣常使用的常模/效標參照標準,而不去考量另一 種標準系統的可能性。事實上,不管最終選擇的是何種標準參照系統,就其目的 而言,皆在建立一套得以解釋與評價測驗結果的合理工具,從而反映受測者/學 習者對某種價值體系或目標系統的把握程度。

因此,當我們思考如何選擇標準參照系統的問題之前,必須先澄清的問題 是,「為何要評分」(why)以及「評什麼」(what)的問題,因為是這兩個因素 逼使我們開始思考「如何評」(how)的問題。舉例來說,如果游泳被視為某國 中校本體育課程的特色之一,強調學生經過三年的教學,必能具備一定的游泳程 度,像是能夠連續游完 100 公尺,且在教學規劃上,授課教師協議從自由式泳姿 教起,那麼在國三體育課程中進行自由式 100 公尺測驗也就理所當然,而且給分 的標準必須設定在學生能完成 100 公尺自由式前進的基本門檻上(達到等級 B), 然後才依照動作的正確與否及流暢情形逐級加分(如 B+、A-、A 及 A+),當然

臺灣教育評論月刊,2014,3(9),頁 133-144

專論文章

要是無法順利完成測驗內容,那麼即須實施補救教學。

可是,對同一間學校來說,籃球也是體育課程的教材之一,而且因為校內活 動空間有限,相較於游泳來說,國中三年雖經常地作為體育課的選授項目,但卻 不是重點項目,所以在給分範圍上,即不像游泳課程所佔的比例那麼多,而且測 驗方式也設計全部學生皆能完成的內容(如罰球線 10 次投籃、1 分鐘運球上籃 等),在給分標準的部分則採取常模參照的方式,依照個別學生在團體中的相對 地位給定一個分數,且基準分數不會設定在及格分數之下,如 10z+70,表示每 位學生都能按照各自的表現,獲得高於 70 分以上的得分,此種作法除了不至於 降低學生的學習動機並提昇其成就感,同時也適切地反映出教學重點上的安排和 調配。

也就是說,有關成績考查標準系統的選擇與設定,所需考量的層面甚廣,前 例僅就課程目標規劃、教材內容及可用場地等層面切入,描述並分析某間學校的 特殊情形,藉以了解選擇某種測驗項目和標準系統之理由,對於不同學校的實際 狀況,尚須考量的面向可能加入教師專長、學生特質等,有待體育教師們進行審 慎的分析與擇宜,使得最終給定的成績不至於與學習者能力有所落差,或是與成 績所蘊含的文化意義未能相互對應。

此外,教育測驗與評量領域的知識和技術作為一種評價工具,意在協助了解 任何課程實施(curriculum implementations)或教學實踐(teaching practices)之 成效,隨後植基於不同課程內涵或教學目標,選定測驗內容、方法及標準系統,

如此才不致於反客為主,將討論的重點著重於評鑑過程的末端操作問題,從而忘 卻建立評鑑系統的真實目的,應是對課程與教學境況中的效能與價值進行實質檢 驗,並得益於這些評價經驗的積累,發展出更加符合實際需求且具效能的評鑑理 論與技術。

相關文件