數學教育第三十七期 (12/2014)
2
我看「香港中學文憑考試數學科分數計算的研究」
鄧曲遲 佛教大雄中學
拜讀上一期梁子傑老師所寫「香港中學文憑考試數學科分數計算的研 究」一文後,引起了本人對公開試分數計算方法的興趣。現在我亦想作出 一些回應,還望與各位同工分享及討論。
其實作為一位數學老師,無可否認,為了應付中學文憑試,我們會將 大部分時間用於教導學生與考試有關的知識,透過無間斷的操練讓學生熟 習試卷的題型、適當地分配作答時間,以及講述由各方面收集得來的評卷 要求,期望學生於文憑試中能取得佳績。然而梁老師卻不止於此,還對公 開試的分數計算作研究及分析,並為分數和等級對換作進一步的推算作大 膽假設,並提出建議,實在難得。
根據梁老師文章內所提供的網址,我仔細詳閱其網頁,發現其中一些 內容有不同的理解,在此希望對梁老師的文章作出一些補充。
首先,梁老師以為考評局因為「整體考生於同一科目各卷別的表現未 必相同,各卷的平均得分及分數分布範圍亦有差異,因此各卷的得分不能 直接比較」,所以「放棄了使用 65 : 35 的比重」。其實,在考評局的網頁1上 亦已經同時公告了因應的處理方法。
考評局網頁上明確指出當處理分數時,會「考慮到各卷的分數分布範 圍及公布的比重,各卷的得分需轉換至同一尺度,成為加權卷別得分後,
才相加成科目得分」。這已清楚指明考評局會「考慮到各卷…公布的比重」, 由此可見,考評局是會把 65 : 35 這個比重作為一個計算分數的核心,而非 放棄使用。從網頁中的描述可見,考生、老師及公眾應該預期考評局會因 應各卷不同的深淺程度(這種深淺程度由「平均分」及「標準差」所反映)
及各卷的比重而調整各卷的得分。
其次,是科目總分的計算方法。文中曾提及「從考生的角度看,他們
1 http://www.hkeaa.edu.hk/tc/HKDSE/assessment/marking/processing_of_marks/
EduMath 37 (12/2014)
3
從某卷考取的分數,就是那個分數,根本不會考慮甚麼的『標準差』。現在 硬說由於標準差太高或太低,因而要將他們所得的分數比重加減」。其實於 香港中學文憑常見問題2的網頁中,當中列明「若同一科有兩份或以上試 卷,各卷的積分必需首先進行標準化處理(即將分數轉換成同一標準以作 比較),然後才加入各卷於整科所佔的比重計算科目得分」。而在網頁的另 一連結3中,也有例子說明標準化的原因。當然,如梁老師所說「從某卷考 取的分數,就是那個分數」,再用已定的卷別比重計算科目得分,的確較簡 單直接,亦是許多學校所採用的方法。
但這樣是否更好?更能代表該科的表現嗎?以及更公平呢?我想事實 並非如此。若只考一份試卷,分數的計算及成績的排列相對較為簡單;但 一科內有兩個或以上的考卷,情況就截然不同。考生在兩個卷別所得的分 數只代表考生在某個卷別的表現,而整合後的總體表現,孰高孰低?確難 以解答。就讓我們看看考評局網頁上的例子:
卷 一 卷 二 科 目 總 分 比 重 (W) 50% 50%
平 均 分 (μ) 40 50 標 準 差 (σ) 15 10
考 生 甲 85 60 145 (μ + 3σ) (μ + σ)
考 生 乙 55 80 135 (μ + σ) (μ +3σ)
網頁裏提及「考生甲卷一的得分(85)是卷別平均分(40)以上 3 個 標準差,考生乙卷二的得分亦如是。考生甲卷二的表現亦與考生乙卷一的 表現相同。由於兩卷的比重相等,兩名考生的科目總成績理應相同,但若 將他們兩卷的得分直接根據比重相加,考生甲和考生乙的科目總分便分別 是 145 和 135 分。這樣計算便會對考生乙造成不公,而考生甲因在分數分
2 http://www.hkeaa.edu.hk/tc/HKDSE/faq/q3/#13
3 http://www.hkeaa.edu.hk/DocLibrary/HKALE/FAQ/Exam_result_FAQ_Q10_chi.pdf
數學教育第三十七期 (12/2014)
4
布較大的卷別取得較高分而得益。由此可見,在處理科目總成績前,將各 卷別的積分標準化,有助確保各卷水平的可比性,讓考生於各卷的表現能 公平地計算入其科目總分。」
若使用已定的卷別比重計算科目得分,就已能公平公正地比較考生的 表現,那麼在數學上,根本就不需要有「標準分」這門知識的存在。以數 學科為例,卷一及卷二的總分不一樣,比重不一樣,兩卷內題目的深淺度、
年與年之間數學卷內題目的深淺度亦難作比較。若每次均由已固定的卷別 比重計算科目得分,難免會變得墨守成規,從而有所忽略。能考慮以上各 點及每年學生在不同卷別的表現,以客觀、科學化的統計模型,將分數調 節至一個「較一致」的標準來計算科目得分,豈非更靈活、更公平嗎?這 個道理,作為數學人,應是十分理解,完全明白,絕對認同的。
另外,對於梁老師文章內表二所求得兩卷「加權得分與基本得分的比 例並非一致」的情況,我估計考評局為方便表達,已將學生於《評卷紀錄 報告》內所獲得的成績作出了四捨五入的處理,但並不一定代表在成績排 列前已作出了這個四捨五入的處理。
除上述幾點外,梁老師的文章亦令我想到,教育局在新高中數學課程 加入學習認識「標準分」的目的。加入這個課題,教育局是否期望讓學生 明白,自己在大型的考試,例如公開試,計算成績時其實是需要考慮到整 體成績分佈的。這個既生活化又切身的情境,的確可以成為教材,讓學生 於學習「標準分」時有較深入的體會,亦可使學生對統計的應用有進一步 的認識。另一方面,從梁老師文章內表一的數據,亦可作為教材,用來引 導學生運用變分中所學的知識去求得相關的因子(即各卷的加權得分與基 本得分的比),從而再進一步探究所求得的因子並不一樣的原因。
在我看來,無論用哪一個方法去計算成績,總可能有欠「完美」,亦難 得到絕對的公平。但回想老師的工作,還是引導學生學習,糾正他們的錯 誤概念,幫助他們面對考試。至於如何定出更公平的方法來比較學生的表 現,我相信考評專家是能夠勝任為我們代勞的。
其實,隨著時代的進步,考評局已不斷將公開試的透明度增加,讓考 生可以參閱自己所考試卷的評分。無疑,此舉可讓社會各階層人士對文憑 考試的運作及評核過程有更深的認識。我相信考評局應對整個文憑考試的
EduMath 37 (12/2014)
5
評核過程有很強的信心,敢於接受質詢和挑戰,才會如此開放和透明。雖 然用作評級及調整分數的統計模型未必人人能懂,但深信經歷多年的運作 所累積的經驗,以及外國大學、教育機構對香港文憑考試的認受,文憑考 試的公信力及公平性應該是不用置疑的。最後,感謝梁老師的文章,他確 實啟發了本人於教學中,應多深入探討一些與學生生活相關的例子,以幫 助學生理解和學習,使他們有所得益;同時亦使學生明白數學著實也是一 門很生活化的學科。
作者電郵:[email protected]