科學月刊【數‧生活與學習】專欄 101 年 7 月
五種英文檢定考試的實驗報告
單維彰‧101 年 6 月 18 日
由於過去十幾年聚集的因緣,本欄作者自從去年一月起接掌了中央大學「語言中 心」的行政工作。他面臨的問題之一,是中大的(大學部非英文主修學生)英文 能力畢業門檻,雖然已經宣告實施了六年,成效卻始終不彰:以「英檢」通過門 檻的學生比例相當低,大部分是由所謂的「後門」畢業的。他先用了基本的統計 方法,提出一批治標的修訂方案(獲得部門內外的支持)。但是根本的問題還有 待探究;而所謂探究,當然應該從研究對象的實然認識入手。
在這個問題上,該認識的對象包括中大的英文門檻所接納的五種英文檢定考 試:全民英檢中高級初試 (GEPT),多益 (TOEIC),托福 (TOEFL iBT),博思 (BULATS),雅思 (IELTS),其中 TOEIC 和 BULATS 僅含聽與讀的基本測驗,而 TOEFL 和 IELTS 則是包和聽說讀寫的全套測驗。為此,筆者遵循了一個非常古 老而基礎的科學典範:相傳古代有一位先生,為了明白各種植物的食性與藥性,
親自試吃了每一種;於是他也決定親自試考每一種英檢(感謝中央大學資助了報 名費)。
此一實驗相當於筆者將自己當作工具,去測量五種英檢。因此,我們該簡要 描述一下工具。他生長於台灣,就像當年絕大多數「正常」的學生一樣,從七年 級開始學習英文字母,在 23 歲赴美國留學之前不曾出國,也不曾置身於任何英 語環境。在大一英文課之後,他未曾接受任何正式英文教育,但是大學四年之間 的所有專業課程(數學),用的都是美式英文課本。據他的記憶所及,當年他在 高中聯考的英文成績是 92 分,大學聯考 60 幾分,托福考試 570 多分。留學期間,
他在美國賓州住了六年,其中四年在學校擔任上台講課的助教。自從返回中央大 學任教起,他就一直住在中壢,出國的旅行的日子,平均每年不超過 20 天。在 這廿年當中,他就像一般學者那樣,在其工作環境內使用英文。
至於實驗方法,主要就是他要親自報名參與考試,並且謹守兩項規則:絕不 做任何形式的考前準備,絕不在考試時猜答案。他甚至刻意避開報章雜誌上,談 學測、指考、GEPT、TOEIC 等英文考試的報導;他在應考前,連考試的格式與 題型都不知道。而且,因為五次考試都在一年內完成,只佔他生命中的 2%,讓 我們假設測量工具本身是穩定的。
這一批實驗有多重目的,其中最基本的是獲得了這些英檢成績之間的一份參 照數據。以前,我們只能接受各英檢自行提供的參照標準;通常是經由個別英檢 與「歐洲語言共同參考架構」(CEFR: Common European Framework of Reference for Languages) 的參照,再轉換成兩種英檢之間的對照。由入門到精通,CEFR 將語言能力規劃為 A1、A2、B1、B2、C1、C2 六個等級。在網路上稍微搜尋一 下,將發現各家英檢對應 CEFR 等級的分數設定相當「多元」,因為年份和研究 單位而有各種版本,況且那些文獻都不包含台灣的 GEPT。
圖一是作者綜合幾種成績對照報告製成的圖表。詳細的比對,應該要分聽、
說、讀、寫四種能力才對。可是在下圖中,我們僅根據總分作一個概括的認識。
首先,將五種考試依其滿分畫成等長的線段:GEPT 中高級初試 240 分,TOEIC 990 分,TOEFL iBT 120 分,BULATS 100 分,EILTS 9 分。然後,按照各考試自 述的等級對照,或者其他單位的研究結果,或者英國邊境管理局審查學生簽證的 官方標準,畫出各種考試可認定為 B2、C1、C2 的成績範圍:B2 是陰影部分,
C2 是黑色部分,它們之間是 C1。最後,以筆者親身試考的成績對齊這五種英檢 考試。
圖一
解讀圖一,看來多益是最容易拿高分的考試;但很奇怪的是,要憑多益成績 取得 B2 等級,似乎比托福和另兩種英國劍橋的考試還要難一點。如果我們只比 較多益和全民英檢(本篇僅指中高級初試):這是台灣考生最常選擇的兩種英檢,
則以它們的成績獲得 B2 等級的難度差不多,但是全民英檢的考題並不容易。更 令人費解的是,全民英檢中高級只對應 B2 等級,就算考得再高也不承認 C1 或 C2 等級。
在英檢考試被外國商品盤據的市場上,開發一個像 GEPT 這樣的「國貨」倒 也無可厚非。但是,英語本來就是別人的語文,台灣可以名正言順地舉辦華語考 試,至於舉辦英文考試,甚至動員大量公部門的資源,搞到幾乎每一所國中、高 中都有推動全民英檢的業務,甚至現在有些大學也全面地在校園內舉辦考試,則 實在有點不容易理解。
在這批試考之後,我感到雅思最困難最堅硬,但是全民英檢卻排名第二。考 試屬於教育的一環,所以全民英檢是廣義的教育工作。既然是教育,似乎不必以 賺錢為導向。全民英檢大可不必分那麼多級,讓國民一級一級地考上去(一遍一 遍地繳費),而設計一、兩份可以用成績來分級的考試。
全民英檢的問題不只在於分級的設計。其他四種考試的題目,都清楚地反應
該項考試的目標,也都察覺得到相當準確的考題統計效果。特別是採用電腦適性 測驗的托福和博思,作答時可以清楚地察覺考題難度的穩定提昇。全民英檢的考 題統計做得不夠精準,深淺不一的考題交錯,有些聽力測驗的答案選項有太多 字,模糊了到底是考聽力還是考閱讀的測驗目標。而最讓我難過的,是它既然名 為「台灣的」全民英檢,卻不曾關照台灣國民的英語文需求。在我遇到的那張考 卷裡,只有一道聽兩人對話提及颱風的問題與台灣有關,其他都是去情境的,或 者是美國社會情境的題目。這張考卷似乎是專門為打算去美國的人準備的。
我最欣賞托福考題,在考後盡力回想題目並記錄下來。雖然我不應公開那些 記錄,卻已經詳細地和語言中心同仁分享,希望我們能夠學習托福的命題方法,
並應用到我們的課程裡面。
現在,很多大學都順著教育部(或大學評鑑單位)的期望而訂定了英文畢業 門檻。筆者希望各級學校都有人能夠親身試考,讓我們蒐集足夠多的資料,並且 是適合本地環境的資料,才能讓大家根據證據來設計政策,讓畢業門檻成為合情 合理而且具有教育功能的工具。