• 沒有找到結果。

華語溝通能力適性測驗建置-以語言知識模式為基礎

N/A
N/A
Protected

Academic year: 2021

Share "華語溝通能力適性測驗建置-以語言知識模式為基礎"

Copied!
136
0
0

加載中.... (立即查看全文)

全文

(1)國立臺中教育大學教育資訊與測驗統計研究所 博士論文. 指導教授:郭伯臣. 博士. 吳慧珉. 博士. 華語溝通能力適性測驗建置-以語言 知識模式為基礎. 研究生:趙日彰. 中. 華. 民. 國. 一. ○. 三. 撰. 年. 十. 二. 月.

(2) 摘要 由於華語溝通能力與其文化知識息息相關。同時,在學習華語作為第 二語言的學習人數越來越多的情況下,如何能精準且有效地評量學習者的 華語溝通能力,實是有其急迫性與必要性。 本研究的創新與獨特性在於評量華語溝通能力時,將文化因素納入考 量。其研究的目有五:首先是編製以語言知識模式為基礎,融入文化和語 用知識之華語溝通能力測驗;第二是建構適合華語溝通能力測驗的最佳測 驗模式;第三是建置適用於測量華語溝通能力的高階層電腦化適性測驗 (HO-IRT CAT)系統;第四為運用實證資料,比較華裔學生之華語溝通能力 及其各領域能力之差異;最後,檢測 HO-IRT CAT 系統的能力估計和選題 策略之成效。 本研究的主要貢獻有四:首先,HO-IRT CAT 系統是第一個採語言知識 模式,可以評量受試者華語多面向溝通能力之電腦化適性測驗系統;其次 ,採一因子題內多項度高階層試題反應理論之測驗模式能同時估計受試者 的領域能力與總體能力;第三,HO-IRT CAT 系統採 MAP 法能夠準確地估 計受試者的能力;同時提供最有效率的選題策略;最後,HO-IRT CAT 系 統可以有效地縮短測驗時間並降低測驗成本。 關鍵字:電腦化適性測驗、高階層試題反應理論、語言知識模式、華 語溝通能力. I.

(3) Abstract There were five objectives of this empirical study. Firstly was to adopt the language knowledge approach to implement items for Chinese Proficiency Tests (CPTs), while second is to conduct a fitness comparison for reading comprehension in Chinese. Thirdly was to develop a higher-order computerized adaptive test (HO-IRT CAT) system bases on higher-order Item Response Theory (HO-IRT) for a CPT. Fourthly was to compare the differences of overall and domain abilities in Chinese communicative language proficiency among Chinese heritage learners. Last was to evaluate the effectiveness of ability estimation and item selection strategy of the HO-IRT CAT system. This study succeeds in making four major contributions, the first of which is the development of HO-IRT CAT system, which is an original CPTs system based on language knowledge approach, while the second is the application of one factor within-item HO-IRT structure which enables the simultaneous measurement of test-takers’ overall ability and their three domain abilities, thirdly is the application of the maximum a posteriori (MAP) estimator enables to accurately estimated test-takers’ communicative language ability. In addition, the MAP estimator is able to provide the HO-IRT CAT system with more efficiency item selection strategy. Last, but not least, the HO-IRT CAT system is able to directly reduce the administration costs associated with the test compared with either the current traditional paper-and-pencil or computer-based CPTs. Keywords: computerized adaptive test, higher-order item response theory, language knowledge approach, communicative language ability. II.

(4) 目錄 摘要 .................................................................................................................. I Abstract ......................................................................................................... II 目錄 .................................................................................................................. III 表目錄 .............................................................................................................. V 圖目錄 .............................................................................................................. VI 第一章 緒論 .............................................................................................. 1 第一節 研究背景 ............................................................................... 1 第二節 研究動機 ............................................................................... 3 第三節 研究目的 ............................................................................... 6 第四節 研究問題 ............................................................................. 10 第五節 名詞解釋 ............................................................................. 10 第二章 文獻探討 .................................................................................... 13 第一節 第二語言溝通能力模式 ..................................................... 13 第二節 華語溝通能力及其文化能力 ............................................. 16 第三節 華語能力測驗之現況 ......................................................... 20 第四節 試題反應理論模式 ............................................................. 34 第五節 電腦化適性測驗 ................................................................. 44 第三章 研究方法 .................................................................................... 59 第一節 試題研發 ............................................................................. 59 第二節 試題分類與測驗架構 ......................................................... 62 第三節 測驗模式適配度比較 ......................................................... 68 第四節 HO-IRT CAT 系統成效驗證 ............................................ 70 第四章 HO-IRT CAT 系統建置與介面 ................................................ 75 第一節 HO-IRT CAT 系統建置 .................................................... 75 第二節 HO-IRT CAT 系統介面 .................................................... 80 第五章 資料分析 .................................................................................... 85 第一節 試題分析 ............................................................................. 85 第二節 模式比較與能力估計 ......................................................... 88 第三節 能力比較 ............................................................................. 90 第四節 HO-IRT CAT 系統成效 ................................................... 94. III.

(5) 第六章. 結論 ............................................................................................ 99. 參考文獻 ......................................................................................................... 101 中文部分 .................................................................................................. 101 英文部分 .................................................................................................. 103 附錄 ..................................................................................................................111 附錄一 華語溝通能力測驗試題與試題分類 ........................................111 附錄二 系統實作成果 ........................................................................... 124. IV.

(6) 表目錄 表 2- 1 CEFR 能力分級 ................................................................................. 15 表 2- 2 TOCFL 閱讀各級測驗和 CEFR 各級能力對照表 .......................... 23 表 2- 3 新 HSK 和新 YCT 各等級能力對應關係表 ..................................... 29 表 5- 1 華語溝通能力測驗試題通過率 .......................................................... 85 表 5- 2 試題答對率累計表 ............................................................................. 86 表 5- 3 平均試題參數 ...................................................................................... 87 表 5- 4 三種模式適配度比較表 ..................................................................... 88 表 5- 5 華語溝通能力與各領域能力值及其相關係數 ................................. 89 表 5- 6 性別與僑居地華語總體溝通能力變異數分析表 ............................. 91 表 5- 7 華語總體溝通能力在性別上的差異比較 .......................................... 91 表 5- 8 性別與僑居地華語溝通領域能力多變數分析表(1) ......................... 92 表 5- 9 性別與僑居地華語溝通領域能力多變數分析表(2) ........................ 92 表 5- 10 性別與僑居地各領域能力之比較 .................................................... 93. V.

(7) 圖目錄 圖 2- 1 題間多向度測驗模式 .......................................................................... 39 圖 2- 2 題內多向度測驗模式 .......................................................................... 40 圖 2- 3 一因子題間 HO-IRT 模式 ................................................................... 43 圖 2- 4 一因子題內 HO-IRT 模式 ................................................................... 44 圖 3- 1 研究流程 .............................................................................................. 59 圖 3- 2 華語溝通能力測驗的能力架構 .......................................................... 60 圖 3- 3 試題 41 作答介面 ................................................................................ 63 圖 3- 4 試題 26 作答介面 ................................................................................ 64 圖 3- 5 試題 3 作答介面 .................................................................................. 65 圖 3- 6 試題 8 作答介面 .................................................................................. 66 圖 3- 7 華語溝通能力測驗的試題架構 .......................................................... 68 圖 3- 8 華語溝通能力測驗試題架構圖 .......................................................... 68 圖 3- 9 HO-IRT CAT 系統測驗流程 ............................................................... 71 圖 4- 1HO-IRT CAT 系統主從式架構 ........................................................... 75 圖 4- 2 HO-IRT CAT 系統模組 ....................................................................... 76 圖 4- 3 適性測驗模組 ...................................................................................... 77 圖 4- 4 成果查詢模組 ...................................................................................... 78 圖 4- 5 題庫維護模組 ...................................................................................... 78 圖 4- 6 測驗執行模組 ...................................................................................... 78 圖 4- 7 帳號管理模組 ...................................................................................... 79 圖 4- 8 題庫管理介面(1).................................................................................. 80 圖 4- 9 題庫管理介面(2).................................................................................. 81 圖 4- 10 試卷管理介面 .................................................................................... 81 圖 4- 11 適性測驗介面..................................................................................... 82 圖 4- 12 能力報告介面 .................................................................................... 83 圖 5- 1 各領域能力採 MLE 法的 RMSD ....................................................... 94 圖 5- 2 各領域能力採 MAP 法的 RMSD ....................................................... 95 圖 5- 3 總體能力採 MLE 法和 MAP 法在 RMSD 的差異 ............................ 96 圖 5- 4 MAP 法的選題成效分析(RMSD)....................................................... 96 圖 5- 5 MLE 法和 MAP 法的選題成效分析(SE) ........................................... 97. VI.

(8) 圖附錄二- 1 系統豋入介面 ........................................................................... 124 圖附錄二- 2 確認受試者資料 ....................................................................... 124 圖附錄二- 3 選擇測驗試題 ........................................................................... 125 圖附錄二- 4 參加測驗 ................................................................................... 125 圖附錄二- 5 測驗提示語介面 ....................................................................... 126 圖附錄二- 6 測驗開始 ................................................................................... 126 圖附錄二- 7 圈選作答 ................................................................................... 127 圖附錄二- 8 作答結束介面 ........................................................................... 127 圖附錄二- 9 作答查詢介面 ........................................................................... 128 圖附錄二- 10 結果統計查詢介面 ................................................................. 128. VII.

(9) 第一章緒論 華語是全世界使用人口最多的語言(Ethnologue, 2014; Paolillo, 2006), 也是聯合國六種工作語言之一(聯合國, 2014)。目前有許多國家都已經將華 語列入其外語教育政策之重要一環。而華語文的溝通能力,除了需評量華 語的詞彙和語法等語言知識外,在評量學習者的華語文溝通能力時,也應 涵蓋在日常生活中進行溝通時,所有可能會面臨的情境;舉凡衣食住行、 婚喪喜慶等情境皆是。因為,若學習者能熟悉華人的文化、歷史以及風俗 習慣,便能更精確的掌握並了解對話的內容,以達到溝通的目的。然而, 現階段的華語文能力測驗只評量學習者聽、讀、說、寫的語言技能,並沒 有評量他們的文化能力。再則,當學習者華語文的各向度能力間具有相關 性時,採用何種測驗模式將能更便利於溝通能力的評量,這都是本研究所 要探討的主要議題。 本研究的第一章緒論分為五節,分別介紹研究背景、研究動機、研究 目的、代答問題及名詞解釋,茲分述如下。. 第一節 研究背景 全球化的來臨加速了人與人之間的互動關係;造成這些互動的原因不 論是來自於貿易、工作或教育的需求等,都需依賴彼此之間可以相互溝通 才能達成目的。所以學習語言主要的目的就是為了協助與人溝通或互動時, 可以達到目的並解決問題(Brown, 2006);近年來由於亞洲經濟的崛起,加 上中國自八0年代以來的改革開放,帶動華人經濟的活絡,世界人士的眼 光一齊匯聚到亞洲華人地區。「中國熱」同時帶動起全球華語熱潮。因此, 評量第二語言學習者的華語能力在各國之間已經逐漸地受到重視,而評量 1.

(10) 學習者以華語作為第二語言的溝通能力則更有其必要性。 由於中國經濟的蓬勃發展,間接也使得學習華語作為第二語言的學習 人數急速上升。以華裔學生為例,他們在學習華語時,不但各有不同多元 文化背景、多元需要和學習動機,更有著在不同的華人社群溝通任務和目 的。因此,就華裔學生而言,學習華語不僅是構成個人認同定位的重要因 素,也是個人未來在經濟和學歷的投資(Kondo & Brown, 2007)。 國立臺灣師範大學僑生先修部 (以下簡稱「僑生先修部」) 成立至今 將近一甲子,所培育的華裔學生已超過五萬名,且為位居世界各僑居地之 菁英,僑生先修部可謂是培養華語溝通能力最具體優質的僑生專修課程班 別。僑生先修部為配合國家僑教政策,全力提高僑生教育素養,對於來自 全球各國家和地區的華裔學生,協助來臺修業,準備升讀大學院系之準備, 並以宏觀視野暨世界一家為其創辦之精神(僑生先修部, 2014a)。 僑生先修部目前開辦修業一年制之秋季班、修業兩年之特輔班以及修 業半年之春季班,課程設計採分組教學,並參照國內大學校系劃分,區分 為第一類組(文、法、商)、第二類組(理、工)、第三類組(農、醫), 以及特別輔導班(以加強華語文能力為主)等四大類別,實施分組教學。 各類組主要課程包含國文、英文、數學、歷史、地理、公民與憲政、台灣 社會與文化等(僑生先修部, 2014b)。僑生先修部的課程,藉由半年到兩年 不等的系統教學設計,提升海外華裔學生在臺接受學科教育與華語溝通能 力訓練,增進華裔學生對學科專業深度與多元文化能力之廣度,達到海內 外旅居世界各地的華裔學子進行跨文化交流學習,增強華裔學生對於多元 文化、族群認同與華人文化的全球理解。 研究者因為曾任教於僑生先修部數理學科,並協助僑生先修部教務處 學生能力評鑑等相關事宜,深知欲對於六十年之僑生先修課程進行改革精 進,首先必須掌握在校僑生的華語溝通能力,並建立完善的華裔學生華語 溝通能力評量系統。而華裔學生之華語溝通能力並非各學科的專業知識, 2.

(11) 華裔學生的華語溝通能力與其文化知識和背景因素息息相關。因此,將文 化能力納入作為評量華語文總體溝通能力之一,實具華語文研究領域的創 新性與獨特性,不僅能確實掌握華裔學生的華語溝通能力,又可作為其課 程改革最具體的實證研究。. 第二節 研究動機 壹、 文化能力與華語溝通能力測驗 研究指出以英文作為第二語言的學習者,在使用英文進行溝通時,社 會 文 化 能 力 較 低 者 比 較 容 易 誤 解 對 方 的 語 意 (Blum-Kulka, House, & Kasper, 1989; Kasper & Dahl, 1991)。同樣的情況也發生在以華語作為第二 語言的學習者身上;因為中華文化已有數千年的歷史,而中文又有其歷史 的延續性;中文的演化隨著年代,不斷的融入各地的文化、生活型態和方 言。就中國人而言,在進行語言溝通時,尚可能因為語言內包含較為深層 的文化涵義而誤解對方的原意,更何況是以華語作為第二語言的學習者。 因此,以華語作為第二語言的學習者在使用華語進行溝通時,除了需具備 良好的華語文詞彙和語法等語言知識和能力外,還需熟悉華人的文化,歷 史以及風俗習慣,才能確實掌握並瞭解溝通的內容,因為文化素養和語言 表達是密切不可分的。 Rymes (2008)認為在提升溝通能力時,學習目標語的語法和文化知識是 同樣重要的;就華裔學生而言,他們來自全球各地,在家裡或僑居地的日 常生活中多少都可以接觸華語的環境。因此他們自小即耳濡目染並習得來 自其父母、家庭以及華人社會的文化知識。雖然華裔學生在其僑居當地所 處的社會和接觸華語的機會並非相同;有部分華裔學生在僑居當地所處的 社會,接觸華語的機會比較高,例如來自香港和澳門的華裔學生。但是也 有部分華裔學生在其所處的僑居當地社會,接觸華語的機會並不高,例如 3.

(12) 來自韓國和印尼的華裔學生。然而不論他們是同時熟悉華語或者其他中國 的方言,或是對於華語文化知識的了解綜合了僑居當地的文化因素和知識 ,華裔學生學習華語作為第二語言和一般的外語學習者是不同。因此,在 評量華語溝通能力時,學習者對於華語文化知識的了解程度,也就是他們 的文化能力,都應納入作為評量學習者整體溝通能力之參考。 語 言 能 力 的 測 驗 架 構 一 般 都 是 採 用 語 言 技 能 模 式 (language skill approcah)或是語言知識模式(language knowledge approach)兩種。語言技能 模式以聽、讀、說、寫四種技能評量學習者語言能力。語言知識模式考量 學習者的文化知識,以語言、社會語言和文化能力來衡量學習者語言能力 ,並作為溝通時能力高低之參考依據。目前的華語文能力測驗都是採用語 言技能模式為測驗的評量架構,並沒有採用語言知識模式的評量架構。. 貳、. 試題反應理論與華語溝通能力測驗. 試題反應理論(Item Response Theory, IRT)能克服古典測驗理論的缺 點。以 IRT 為基礎的測驗,是近幾年國際語言測驗與評量發展主要的趨勢 。很多大型的測驗都採用 IRT 作為測量的基礎架構。例如:美國用來評量 學生成就的「國家教育發展評量」(NAEP,National Assessment of Educational Progress)(Lee, Grigg, & Dion, 2007; 張鈿富、吳慧子, 2006)或是「國際數學 與科學教育成就趨勢調查」( TIMSS,Trends in International Mathematics and Science Study)(Mullis, Martin, & Foy, 2007)或者是針對各國 7 年級以上的 15 歲學生 所做 的「 學 生能力 國際 評量 計 畫」 (PISA, The Programme for International Student Assessment) (OECD, 2005)等都是採用 IRT 模式而發展 的國際大型標準測驗。另外,在第二語言能力測驗方面,英文的托福考試 (TOEFL)也是採用 IRT 作為測量模式(McKinley & Way, 1992)。因此,在建 置華語溝通能力測驗時,採用 IRT 作為測量的發展模式才能符合未來的發 展趨勢。 4.

(13) 參、. 電腦化適性測驗與華語溝通能力測驗. 電腦測驗是近年來國際教育測驗領域的發展重點。以 IRT 為基礎的電 腦化適性測驗(高階層試題反應理論, CAT),能針對受試者提供試題的難度 接近他的能力給予作答,受試者無須作答所有測驗卷的試題,大幅縮短測 驗的時間。國際上如 TOEFL、GRE、GMAT 和 SAT 等都已經使用採用 CAT( 陳新豐, 2007)。 根據相關的研究指出,當學習者的能力包含多個向度,且各能力向度 間具有相關性時,以 CAT 系統為例,採用多向度的電腦化適性測驗 (multidimensional CAT, MCAT)明顯地將比採用單向度的電腦化適性測驗 (unidimensional CAT, UCAT)合適(Li & Schafer, 2005; Segall, 1996)。因為如 果使用 UCAT,而忽略了受試者在各能力之間的相關性,其結果必將會影 響測驗時的能力估計和選題上的誤差。例如,Li 與 Schafer(2005)以多向度 三參數模式(multidimensional three-parameters logistic model, M3PLM)的研 究發現,對於高能力與低能力受試者而言,採用 MCAT 系統所估計的能力 值比採用 UCAT 系統精準。 除此之外,MCAT 雖然可以考量各能力向度間具的相關性並分別估計 受試者在各個向度的能力值,然而對於受試者的總體能力卻無法由 MCAT 獲得。本研究除了要評量華裔學生的語言和文化等能力之外,同時也希望 能測量他們的總體溝通能力,因此,對於這一類需要同時評量學習者總體 能力及其多個領域能力時,相關的研究則是建議採高階層試題反應理論模 式(Higher-Order Item Response Theory, HO-IRT)(Song, 2007),以解決測驗實 際應用上的問題。. 5.

(14) 第三節 研究目的 研究華裔學生之華語溝通能力是目前國際語言教學之研究重點與新趨 勢。麥留芳(1985) 指出華裔學生定義分為三種情況,包括使用國籍分別的 法律政治屬性、文化認同的社會屬性及血統來源的生物屬性層面。華裔學 生對自我族裔的認同度中,其父母的態度、社會化行為與子女族群有非常 大的關連(陳毓齡, 2009)。Phinney 和 Nakayama (1991) 研究顯示,傳承語 學習者對其族裔認同度高者,其父母非常清楚該如何使他們的孩子處於多 元的社會環境中,且致力於對孩子的傳統文化教育,其中尤以華裔父母傾 向告訴孩子自己的文化。可見華裔學生或因父/母方之華人血統,在海外取 得居留國國籍,擁有公民權,生活在海外卻仍然對中華文化具備不同程度 的認同,而華裔學生的華語學習亦與華人父母態度息息相關。因此華裔學 生與一般外國人(foreigners)學習華語是不同的。 Campbell 和 Rosenthal (2000)從文化的觀點觀察發現,傳承語學習者 對於目標語(target language)文化知識的瞭解程度,比外國語學習者深;他 認為傳承語學習者的風俗習慣、價值觀可能混合了當地社會的文化,但是 他們已經習得並吸收了自身民族的文化,在生活上早已接觸及熟悉目標語 的文化知識和內涵。相對於傳承語學習者而言,外國語學習者只能粗略的 了解和感受目標語的文化知識,比較少有機會能夠和使用目標語的人或社 區進行互動和溝通。因此,傳承語學習者對目標語的文化知識了解的程度 較深,若是展現在日常的溝通能力上,更能促使他們在運用目標語進行人 際互動或溝通時,易於掌握語言中所需的社會規範,比外國語學習者更能 展現出較為得體的表達。由於傳承語學習者在其日常的生活中就能習得目 標語的文化知識。因此,Valdés (2001)認為傳承語學習者可視為是雙語的 學習者。 美國研究發現,教育制度內的外語教育不符合傳承語學生(heritage 6.

(15) students)的需求,他們受到了傳承語言和文化薰陶,具有不同於一般外語 學習者能力(孫懿芬, 2008)。Lynch (2003) 也認為傳承語學習者不可視為第 二語言學習者,他以美國為例,相對於傳承語學習者,對於以英語為母語 的學習者,在學習英語以外的語言時,他們(外國語學習者)需多花超過四 倍的時間才能達到相同等級的水準(Walton, 1995)。所以當華裔學生進入正 式的教育系統中學習華語,採用一般第二語言教學方式並不完全適合 (Gallagher, 1996)。 畢念平(2006) 將華裔學生區分為兩種類型,一是其母語是普通話。二 是其母語是中國某種方言,非普通話。He, A. W. (2006) 對於華裔學生的觀 點和 Valdés 相同,認為他們在說中文的家庭中長大,會說或至少會懂中文 ,是中文和英文的雙語者。所以對於華裔學生來說,學習華語可能是他們 的第一語言,也可能是他們的第二語言,這得要視他們在家庭中語言的使 用情形而定,但是若全部以第二語言或第一語言的方式來教導這些學生並 不恰當。 華裔學生因具備華語的文化背景知識,其華語溝通能力在聽、讀、說 、寫的語言技能上,比相同語言技能水準的外國語學習者高;如果採用一 般第二語言教學的速度,華裔學生會產生浪費時間的感覺,而得不到學習 上的助益。然而華裔學生的學習環境並非人人皆有機會大量地使用華語。 有的能說中國方言,卻不會說華語。一份根據訪談華語教師的研究報告指 出,華裔學生雖已具備華語的文化知識,但是不同僑居地的華裔學生對中 華文化知識的認知是有差異的,其華語溝通能力也會不同(Campbell & Rosenthal, 2000; 孫懿芬, 2008)。因此,仔細考量華裔學生對華語文化知識 了解的深淺程度,對於華裔學生學習華語而言是非常重要的。除此之外, 如果不能有效分辨華裔學生在華語溝通能力上的差異,並進行分班授課, 勢必無法達到理想的教學效果和目標,這將會使教師在教學上面臨困擾。 其次,對於評量華語溝通能力的測驗而言,目前並沒能同時也評量其 7.

(16) 華語語言和文化等能力;因此,對於同時考量學習者華語語言和文化等能 力的相關性,進而評量其整體華語文溝通能力的研究,更是未見論述。另 外,傳統紙筆測驗,不管受試者能力高或低皆需完整作答一份或數份考卷 的全部試題,往往會發生高能力者覺得試題太簡單,而低能力者覺得試題 太困難,而且如果需要求較高的測驗信度,讓受試者同時針對多個子測驗 (例如語言和文化兩個子測驗)的試題進行作答,則受試者需花費較長的測 驗時間才能完成,相對而言也增加了測試的成本。上述的測驗方式會顯得 較不切實際。除此之外,若是為了縮短測驗時間,進而刪除各子測驗的部 分試題,其結果則會降低測驗的信度,這種作法顯然更不值得;況且,華 裔學生受到其自身文化知識和背景之影響,其華語溝通能力可能參差不齊 ,在試題的編製上需要多個題本方能滿足實際測驗上的需求。 CAT 系統可依據受試者的作答反應估計受試者的能力,再進一步選擇 適合受試者目前能力作答的題目;若再結合 HO-IRT 的測量架構,不但可 減少施測題數、作答時間與測驗成本,更能符合測量華裔學生整體的華語 溝通能力之需求。然而,華語文能力測驗雖然已經開始使用電腦化進行施 測,但卻還未發展 CAT 系統。王暄博、蔡雅薰、郭伯臣和廖晨惠(2012)曾 以多向度試題反應理論(MIRT)為基礎,發展並建置作為評量學習者華語溝 通能力的電腦化適性測驗系統,其主要是測量學習者聽、讀、說、寫四種 語言技能。然而評量學習者華語語言和文化能力等知識和評量語言技能是 不同的,但是現存的華語溝通能力測驗並沒有發展評量學習者的語言知識 的測驗模式。例如臺灣的 TOCFL (SC-TOP, 2011a, 2011b)、中國大陸的「 新 HSK」(HSK, 2011)和美國的 AP 中文測驗(CollegeBoard, 2012b)。綜合上 述,本研究目的如下:. 壹、. 編製以語言知識模式為基礎之華語溝通能力測驗. CEFR(The Common European Framework of Reference)根據語言知識模 8.

(17) 式所定義的溝通能力包含語言、社會語言(社會文化)和語用三種領域能力 。因此,本研究擬參照 CEFR 對於語言知識模式之能力分級規準,作為華 語溝通能力測驗的試題分級與分類依據,編製華語溝通能力測驗。. 貳、 架構以 HO-IRT 為測量架構之華語溝通能力測驗 本研究將運用 HO-IRT 作為華語溝通能力的評量架構,其創新與重要研 究意義在於納入華語文的文化知識,不但可同時評量華裔學生三個華語的 領域能力,除此之外,還可以評量其整體的華語溝通能力。. 參、 建置以 HO-IRT 為測量架構之電腦化適性測驗系統 本研究擬建置基於 HO-IRT 測量架構和語言知識模式之華語溝通能力 的電腦化適性測驗系統(HO-IRT CAT 系統)。此為現階段華語測驗評量前瞻 創新之研究技術,亦是補足目前無法同時檢視華語溝通和文化能力的一嶄 新突破。. 肆、 比較華裔學生華語溝通能力及其各領域能力之差異 Alderson (2000) 認為運用語言測驗可驗證語言中的理論與方法,並可 提供規劃教學大綱的科學依據。Bachman (1990) 指出語言測驗與語言教學 、語言習得具有密不可分的關係,透過測驗訊息的反饋,「測驗」對於「 教」與「學」活動均有一定助益。本研究擬藉由華語溝通能力測驗之結果 ,比較不同背景的華裔學生,他們在華語溝通能力以及各個領域能力上之 異同。作為僑生先修課程改革精進之參考依據之一。. 9.

(18) 伍、 比較 MAP 法和 MLE 法在 HO-IRT CAT 系統之能力估計 成效 相關研究發現 MLE 法未能考量受試者的先備知識,其能力估計值的精 準度不高;另外,EAP 法受到分割點多寡的限制,並不適合使用在適性化 測驗系統。除此之外,目前並沒有相關研究針對一因子題內 HO-IRT 模式 之電腦化適性測驗的能力估計法進行評估。因此,本研究將會比較能力估 計在 MAP 法和 MLE 法使用在 HO-IRT 電腦化適性測驗系統之成效。. 第四節 研究問題 根據上述研究目的,本研究將討論下列問題:. 壹、 華語文溝通能力測驗之試題品質如何? 貳、 華語溝通能力測驗的電腦化適性測驗系統能力估計和 選題策略之成效為何?. 第五節 名詞解釋 針對本研究常見的名詞,釋義如下:. 壹、 第二語言學習者 以 學 習 華 語 作 為 第 二 語 言 的 學 習 者 , 包 含 外 國 語 學 習 者 (foreign language learners)和傳承語學習者(heritage language learners)。. 貳、 外國語學習者 外國語學習者指的是道地的外國人學習華語作為第二語言,他們只能 10.

(19) 粗略的了解和感受華語的文化知識,比較少有機會能夠和使用華語的人或 社區進行互動和溝通。. 參、 傳承語學習者 傳承語學習者和外國語學習者最大的區別在於前者學習目標語始於家 庭,而後者學習最初階段都是始於課室的環境。本研究中的傳承語學習者 指具有部分華人血統的華裔學習者,其風俗習慣、價值觀可能混合了海外 當地社會的文化,但是他們天生已經學過並吸收了自身民族的文化,在生 活上早已接觸及熟悉華語文化知識和內涵,例如學習華語的華裔學生。. 肆、 領域能力 領域能力又可稱為次級量尺,例如 PISA 閱讀學科中,對文本內容的理 解、應用與省思的能力為其所定義之領域能力。本研究中泛指華裔學生使 用華語進行溝通時所需使用的語言、社會語言和語用能力。. 伍、 總體能力 整合領域能力進而測量受試者的高階能力即為總體能力,又可稱為主 要量尺。如 PISA 閱讀學科中的閱讀素養。本研究所描述的總體能力則為 華語溝通能力。. 陸、 華語溝通能力 本研究所論述的華語溝通能力是根據 CEFR 採語言知識模式所定義敘 述的溝通能力(communicative language ability)。本研究第二章文獻探討中 將會詳細說明。. 11.

(20) 柒、 高階層的評量架構 本研究所論述的高階層的評量架構主要包含兩層能力;第一層為總體 能力,即華語溝通能力。第二層為領域能力,即包含華語的語言、社會語 言和語用能力。. 捌、 整合任務型與個別任務型試題 整合任務型試題是指使用任務型的試題同時測量學習者兩個面向以上 的語言知識;個別任務型試題則指試題只測量學習者個別或單一的語言知 識。. 12.

(21) 第二章 文獻探討 本研究所要建置的華語文電腦化適性測驗系統,不同於傳統用於測量 學習者語言技能的華語能力測驗,它主要的目的為評量華裔學生的語言、 社會語言和語用能力。因此,本章將從第二語言溝通能力模式的文獻分析 著手,再分別探討華語溝通能力及其文化能力、華語能力測驗之現況、試 題反應理論模式以及電腦化適性測驗。. 第一節 第二語言溝通能力模式 壹、 語言技能模式 第二語言的能力評量架構最初是由 Canale 和 Swain (Canale, 1983; Canale & Swain, 1980) 以及 Bachman 和 Palmer (Bachman & Palmer, 1982, 1984)根據海姆斯(Hymes)的第一語言能力評量架構所提出的。對於第二語 言溝通能力的描述通常可分為語言技能模式(language skill approach)和語 言知識模式(language knowledge approach)兩種。語言技能模式是依照溝通 時學習者使用的聽覺(audio)和視覺(visual)兩種管道(channel)以及他們對於 語言的接受(receptive)和產出(productive)兩種方式(mode),將學習者的第二 語言溝通能力分成聽、讀、說、寫四種語言技能(Carroll, 1968, 1972; Lado, 1961)。舉例來說,來自聽覺管道的語言產出模式就是說的技能,語言接受 模式就是聽的技能;同理而言,來自視覺管道的語言產出模式就是寫的技 能,語言接受模式就是讀的技能。語言技能模式是現今評量第二語言溝通 能力時主要採用的模式,例如以英文作為第二語言的托福考試(Test of English as a Foreign Language,TOEFL) (Jamieson, Jones, Kirsch, Mosenthal, & Taylor, 2000)。在華語能力的測驗中,不論是 HSK,還是美國的 AP 中文 考 試 (Advanced. Placement. Chinese 13. Language. and. Culture. Exam).

(22) (CollegeBoard, 2011, 2012b),或是臺灣 TOCFL 也都是採用語言技能模式, 以聽、讀、說、寫四種技能評量學習者的華語文溝通能力。 Bachman(1990)認為採語言技能模式所定義的第二語言溝通能力有其缺 陷之處:首先,以聽、讀、說、寫四種語言技能所定義的第二語言溝通能 力,在不同的語言使用的活動中,雖然使用相同語言技能,但是這種技能 卻無法有效區別兩種語言活動之間溝通能力的差異。例如使用在一般對話 過程中的聽力和收聽廣播節目的聽力,若是採用語言技能模式,兩者之間 溝通能力之差異是無法區辨的。其次他認為第二語言溝通能力應考量語言 使用時的情境。因為語言的使用並非無中生有,而是和學習者在使用第二 語言進行溝通時,所處的情境有密切的關係。但是語言技能模式在衡量學 習者的第二語言溝通能力時,完全不考量學習者在使用語言進行溝通時所 處的情境問題(Bachman & Palmer, 1997)。. 貳、 語言知識模式 採語言知識模式闡述學習者第二語言溝通能力主要為 Bachman 模式 (Bachman’s model)和 CEFR。Bachman 模式依照語言知識,將學習者的溝 通 能 力 分 成 組 織 知 識 (organizational knowledge) 和 語 用 知 識 (pragmatic knowledge);其中組織知識包含語法知識和語篇知識,語法知識包括詞彙 、詞法、句法和音系學或字系學等方面的知識。語篇知識則是用來決定句 子如何連接以形成語篇的 (Bachman & Palmer, 1997)。 在第二語言溝通能力的評量中,許多學者認為採用 Bachman 模式評量 受試者的語言溝通能力,在實務的執行上是不可行的。主要的原因認為 Bachman 模式所建構的語言溝通能力的範圍既廣又深,不但內容太過抽象 ,而且對於語言測驗目的的構成因素,優先順序不明確(Chalhoub-Deville & Deville, 2005; Kunnan, 1998; McNamara, 2003; O'Sullivan, 2011)。其次,在 第二語言溝通能力多面向的知識結構中,各個面向知識間彼此互動情形仍 14.

(23) 未釐清(Douglas, 2000; Shehan, 1988)。因此,McNamara 認為 Bachman 模 式所定義的第 二語 言溝通能力缺 乏互 動或社會面向 (interactional/social dimension)(Chalhoub-Deville, 1997; Chalhoub-Deville & Deville, 2005; Kramsch, 1986, 1998; McNamara, 2003; Young, 2000)。 CEFR 在建構第二語言溝通能力時,主要是基於語言學習者所需要知道 的知識以及他們能力所能夠做到的事,作為衡量各等級溝通能力的參考標 準。CEFR 所建構的第二語言溝通能力包含語言技能模式以及語言知識模 式(Council of Europe, 2001)。CEFR 採語言知識模式所建構的第二語言溝通 能力包含語言能力(linguistics)、社會語言能力(sociolinguistics)、和語用能 力(pragmatics)三種領域能力;語言能力包括詞彙、音韻、語法等的知識。 也就是 Bachman 模式中所提的語法知識;社會語言能力也就是社會文化能 力,具體來說是指語言溝通時,語言使用者顧及和掌握語言使用時社會層 面所需的知識;語用能力則著重語言使用者對於篇章的精熟程度,對於上 下文的連貫性,以及不同文體間的識別能力(Council of Europe, 2001)。這 種對於學習者溝通能力描述和 Bachman 模式是一致的。 表 2- 1 CEFR 能力分級 A 基礎使用者 A1 入門級. A2 基礎級. B 獨立使用者 B1 進階級. B2 高階級. C 精熟使用者 C1 流利級. C2 精通級. 不同的是 CEFR 針對各級語言能力進行全面描述,它將學習者的溝通 能力以明確地且層級分明的指標,依照學習者溝通能力的等級差異分成三 等(基礎、獨立、精熟)六級(入門和基礎、進階和高階、流利和精通),請參 照上表 2-1。最重要的是 CEFR 將學習者對於目標語的文化知識納入作為 考量的因素。這種第二語言溝通能力的分級模式很快地獲得了第二語言教 學、測驗等領域專家的一致認同,並廣泛地使用在歐盟及世界其他各國第 15.

(24) 二語言學習的課程綱要、課程指引、評量和教材編製等領域之中(O'Sullivan, 2011)。 方緒軍 (2006) 從 CEFR 對於華語測試研發的角度分析,認為 CEFR 這 樣劃分為語言能力等級的描述提供了全面的架構,也為劃分等級時力求量 化和有序化。除此之外,研究也發現採用語言知識模式所進行的測驗資料 分析,比採用語言技能模式更能闡明溝通能力多面向的語言知識特性 (Purpura, 2010)。. 第二節 華語溝通能力及其文化能力 壹、. 文化能力與華語能力測驗. 蔣宇紅(2006)曾舉例說明華裔學生學習英語作為第二語言時,其溝通能 力會受其自身文化因素影響。然而,同樣的現象也會發生在華裔學生的華 語學習。舉例來說,在中國的文化中,紅色都是代表吉祥、喜慶;但是在 西方文化中卻恰恰相反,紅色代表著血腥和暴力。唯有具備華語文化能力 才能掌握華語背後的文化內涵。又例如 HSK 模擬試題(HSK): 辦喜事時,他們的「新房」很簡陋。「新房」是指 A :新蓋的房子 B :新買的房子 C :剛刷過的房子 D :結婚用的房子 這裡以「新房」來表示「新婚臥室」或「結婚用房」是這個詞彙的文 16.

(25) 化涵義之所在,是不能按字面的意義來加以理解的(陳光磊, 1997)。其次, 華語的稱謂語,對於不同的場合可能有不同的使用方式,這也是最令第二 語言學習者最感到困惑之處。例如 HSK 閱讀模擬測驗的試題(HSK): 好幾次在電視節目中聽見節目主持人問對方「你叫什麼」,我很反感。 如果對方是一個小孩,回答說「我叫毛毛」 ,或者「我是珍珍」,那倒 也顯得有些親切。但對方是一位有名有姓的成年人,這種問法就顯得 太粗魯。我國祖傳的語彙是很豐富的,傳統的「請問尊姓大名?」 「臺 甫是?」或白話一些, 「請問您的姓名」 ,這不是迂腐而是應有的文明禮 貌。我們應把公安部門審問罪犯時的第一句話「你叫什麼?」和日常交 往的語句區別開來。 對於以華語作為第二語言的受試者而言,如果不知道「您」、「尊」、「 臺甫」 、 「你」這些稱謂語的文化涵義,一定會誤解內文的書面意義,以為 「你叫什麼?」是警察用來審問犯人時的用語。 華語溝通能力與文化素養是息息相關的。然而,目前的華語能力測驗 ,不論是台灣的 TOCFL、美國的 AP 中文測驗或是中國大陸的「新 HSK」 ,都只是測量受試者的聽、讀、說、寫四種語言技能;他們都沒有針對受 試者的文化能力進行有意義的實質測量。. 貳、. 多面向與高階層的知識結構. 一、 多面向的知識結構 透過實際測驗資料證明,第二語言的溝通能力是屬於一種多面向的知 識模式 (a multicomponential model of knowledge)(Oller 1979; Oller 1983; Oller & Jonz 1994)(Oller, 1979, 1983; Oller & Jonz, 1994)。然而,Sawaki、 Sticker 和 Oranje (2008)指出若採用驗證性因素分析法(confirmatory factor analysis,CFA)來探討第二語言溝通能力多向度的因素結構時,將會產生多 17.

(26) 種不同的形式的因素結構。而且,Stone 和 Yeh (2006)也指出 CFA 運用於 二元計分的資料中,進行分析所得之結果可能會有問題;原因如下:首先 ,由於組卷時不同測驗有不同的試題參數分佈情形,若再加上受試者低信 度的作答反應資料,將導致採 CFA 法時會出現不同的結果(例如 Ackerman, Gierl, & Walker, 2003; Green, 1983; Swygert, McLeod, & Thissen, 2001) (Ackerman, Gierl, & Walker, 2003; Green, 1983; Swygert, McLeod, & Thissen, 2001); 其中因素負荷量可能會被低估,而向度數則會被高估 ( 例如 Bock, Gibbons, & Muraki, 1988) (Bock, Gibbons, & Muraki, 1988)。最後 ,由於猜測度提高了受試者答對的機率,其結果便擴大了估計誤差(Carroll, 1945)。雖然相關的專家學者或是研究人員仍然無法很明確地闡述第二語言 溝通能力組成因素與結構以及這些因素之間的相互關係(Chalhoub-Deville, 1997; Douglas, 2000; Gu, 2013; O'Sullivan & Weir, 2011; Skehan, 1988; Wolf et al., 2008);但是即便如此,他們對於第二語言溝通能力是屬於一種多向 度的能力,仍是有一致性的共識(Purpura, 2010; Sawaki et al., 2008)。也就 是說第二語言溝通能力常被視為一種多面向的知識結構(multicomponential consturct)(Kunnan, 1998),包含數個不同的能力。 除此之外,語言測驗專家建議可同時採用個別任務型(separate task)試題 與整合任務型(integrate task)試題來評量第二語言的溝通能力(Harris & Palmer, 1970; Lado, 1961)。整合任務型試題是指使用任務型的試題同時測 量學習者兩個面向以上的語言知識;個別任務型試題則指試題只測量學習 者個別或單一的語言知識。Carroll (1968)指出,以任務型試題測量溝通能 力時,試題的題型應該同時涵蓋個別任務型的試題和整合任務型的試題。 Carroll 的觀點廣泛的影響後來的語言測驗的命題發展趨勢;托福考試的命 題,第一次的測驗就同時包含了個別任務型試題和整合任務型試題 (Purpura, 2010)。直到現在,托福網路測驗(TOEFL-iBT)也都是採用同時包 含個別任務型和整合任務型的試題來測量受試者第二語言英文的溝通能 力(ETS, 2012)。 18.

(27) 就目前的國際華語教學現況而言,自 1990 年代開始隨著歐美而逐漸興 起互動關係式的任務型語言教學;而且,華語教學已經由結構和功能轉為 重視文化的結構、功能和文化的教學模式(劉珣, 2006)。因此,華語溝通能 力測驗的試題也應該採用同時包含個別任務型和整合任務型的試題。 試題反應理論的基本假設為單向度的能力(unidimensionality)(Weiss & Yoes, 1991)。對於非單一向度能力的測驗除了採用多次測量的方式之外, 一般採用多向度(multidimensional)測驗模式亦可兼顧並考量各領域間能力 的相關性問題(Adams, Wilson, & Wang, 1997; de la Torre, 2008; de la Torre & Patz, 2005)。多向度測驗模式可以估計受試者在各個向度的能力值,同 時在估計能力的過程中,也會將各向度間的相關性納入估計的程序中。如 此的確可以提升各向度能力估計的精確性,同時每個向度也只要用少數的 試題估算即可。例如 PISA 以多向度模式測量學習者對於連續文本和非連 續文本兩個領域的閱讀能力,作為評量學習者閱讀素養之依據(OECD, 2005; 國立台南大學 PISA 國家研究中心, 2009)。 以華語文能力測驗為例,受試者如具備較高的華語文詞彙能力,他在 作答閱讀測驗的語法試題時,答對的機率應該就會比較高,反之則亦然。 如此可以假設華語文的詞彙和語法有相關性。因此,在評量多個能力向度 的能力時,若能同時考量受試者的各個能力之間的相關性,則更能協助精 確地評量受試者在各個能力向度的能力值。當多個能力向度之間具有其相 關性,不論這些能力的估計值是來自同一個測驗的測量結果或是由一組不 同測驗所個別測得的能力值,進行測驗分析時,皆能由其中測量某一種能 力向度的試題中,藉由受試者的作答反應,進而推論該受試者在作答對應 其他能力向度試題的一些可能的結果。 二、 高階層的知識結構 再則由實際測驗資料在檢驗語言知識的因素結構研究中也發現,語言 19.

(28) 知識包含著一個高階層的因素(a general higher order factor)和數個不同的 因 素 (several distinct factors) (Bachman & Palmer, 1982; Harley, Allen, Cummins, & Swain, 1990; Purpura, 2010; Sasaki, 1999; Vollmer & Sang, 1980)。也就是說在第二語言溝通能力多面向的知識特性中,涵蓋著一個高 階層知識因素的結構。如前例所敘述的 PISA 測驗,其測驗結果所呈現的 不再是一種單一的分數,而是包含了各領域能力和總體能力的表現;其中 在 PISA 閱讀學科中的閱讀素養即為總體能力,代表一高階層知識因素的 結構。另外,又以國際最著名的第二語言能力測驗之一的 TOEFL 考試的 研究發現,以英文作為第二語言的受試者,語言能力包含包含四個低階層 能 力 - 聽 、 讀 、 說 、 寫 , 以 及 一 個 高 階 層 能 力 - 語 言 能 力 (language proficiency)(Sawaki, Sticker, & Oranje, 2009)。因此,第二語言溝通能力測 驗的能力架構應視為一個高階層的能力架構。 多向度測驗模式並無法測量受試者的總體能力,因為多向度測驗模式 並不適合運用在包含更複雜高階層能力的第二語言溝通能力的測驗中。對 於評量受試者涵蓋高階層能力,研究專家建議 HO-IRT 的測驗架構以線性 關係的數學模式,可同時測量學習者總體能力及其數個領域能力(de la Torre, Song, & Hong, 2011; Sheng & Wikle, 2008; Song, 2007)。. 第三節 華語能力測驗之現況 本研究主要探討第二語言學習者的在華語閱讀方面的溝通能力。因此 ,本節主要針對台灣、中國大陸和美國三個國家目前在檢測華語閱讀能力 的測驗現況進行說明。. 20.

(29) 壹、. 台灣. 一、 華語能力測驗. 台 灣 的 華 語 測 驗 主 要 包 含 兩 種 : TOCFL 和 兒 童 華 語 能 力 測 驗 (Children’s Chinese Competency Certification, CCCC)。以下就台灣的這兩種 華語能力測驗分別說明: 由華測會委託國立臺灣師範大學協助建置和推動的 TOCFL 是專為母語 非華語者所研發,為一套國家級標準化的語言能力測驗,並同時在台灣和 台灣以外的國家施測(SC-TOP, 2011b)。主要為檢測華語學習者在日常生活 中的語言使用能力。TOCFL 主要分為 TOCFL「聽與讀」、TOCFL「寫作 」和 TOCFL「口語」三種華語能力測驗(SC-TOP, 2011a)。本研究僅針對 TOCFL「閱讀」測驗介紹如下(SC-TOP, 2011a): 目前 TOCFL「閱讀」共分為六個等級,TOCFL (一級)、TOCFL (二級) 、TOCFL (三級)、TOCFL (四級)、TOCFL (五級) 和 TOCFL (六級)。 1.. 入門基礎級 TOCFL(一級)和 TOCFL(二級)又稱入門基礎級(Brand A),主要為母語非. 華語之初學者而設,適合在台灣學習華語的時數達 120-360 小時,或是在 其他國家、地區學習 240-720 小時的華語學習者。通過入門基礎級的學習 者其華語文能力約具備 500-1000 個基礎詞彙量。入門基礎級的華語測驗量 尺分數達 42 分即能通過 TOCFL(一級);量尺分數達 60 分即能通過 TOCFL( 二級)。通過 TOCFL(一級)和 TOCFL(二級)其華語文能力可以達到: (1) TOCFL(一級):在有視覺協助及可重複閱讀的情況下,能掌握基本數 字、詞彙及簡單的短語並能大致理解句子內容。 (2) TOCFL(二級):能理解用日常生活詞彙或工作常用詞彙寫成的簡短文 21.

(30) 章。 2.. TOCFL(三級)和 TOCFL(四級): TOCFL(三級)和 TOCFL(四級)又稱為進階高階級(Brand B),主要為適合. 在台灣學習華語的時數達 360-960 小時,或是在其他國家、地區學習 720-1920 小時的華語學習者。通過入門基礎級的學習者其華語文能力約具 備 2500-5000 個基礎詞彙量。進階高階級的華語測驗量尺分數達 48 分即能 通過 TOCFL(三級);量尺分數達 64 分即能通過 TOCFL(四級)。通過 TOCFL( 三級)和 TOCFL(四級)其華語文能力可以達到: (1) TOCFL(三級):能讀懂個人感興趣的主題或與專攻領域相關的文章; 前提是文章以淺白、平鋪直敘的方式寫作而成。 (2) TOCFL(四級):在閱讀時具有相當大的自主性,能因應不同的文本及 目的,採用不同的閱讀策略和速度。具備廣泛且可隨時提取的閱讀詞 彙,但對於不常見的慣用語,可能有理解上的困難。 3.. TOCFL(五級)和 TOCFL(六級): TOCFL(五級)和 TOCFL(六級)又稱為流利精通級(Brand C),主要為適合. 在台灣學習華語的時數達 960 小時以上,或是在其他國家、地區學習 1920 小時以上的華語學習者。通過入門基礎級的學習者其華語文能力約具備 8000 個基礎詞彙量。流利精通級的華語測驗量尺分數達 52 分即能通過 TOCFL(五級);量尺分數達 69 分即能通過 TOCFL(六級)。通過 TOCFL(五 級)和 TOCFL(六級)其華語文能力可以達到: (1) TOCFL(五級):在有機會重新閱讀困難部分的情況下,不論主題是否 與個人專攻領域相關,都能讀懂長篇複雜文本的各項細節。 (2) TOCFL(六級):能理解幾乎所有書寫語言的形式,包括抽象、結構複 22.

(31) 雜或者相當口語化的文學或非文學作品等。 目前台灣的 TOCFL 已經對照 CEFR 的能力等級作為評量學生華語能力 的標準(SC-TOP, 2011a)。TOCFL「閱讀」測驗的各等級能力和 CEFR 各級 能力的對應關係如下表 2-2。 表 2- 2 TOCFL 閱讀各級測驗和 CEFR 各級能力對照表 測驗等級 能力等級 入門級 TOCFL(一級) 入門基礎級 基礎級 TOCFL(二級) (Brand A) 進階級 TOCFL(三級) 進階高階級 高階級 TOCFL(四級) (Brand B) 流利級 TOCFL(五級) 流利精通級 精通級 TOCFL(六級) (Brand C). 分數等級 42 60. CEFR A1 A2. 48 64 52 69. B1 B2 C1 C2. 目前台灣多所大專院校或系所均採用華語文能力測驗作為申請入學條 件或為鑑定華語能力之標準。另外,韓國 LG 企業在台分公司亦採用華語 文能力測驗作為韓籍職員派駐來台之中文能力參考依據。海外地區亦有許 多華商企業在選聘人才時,將華語文能力測驗證書列為參考標準。華語文 能力測驗主要的目的可以作為: (1) 「台灣獎學金」申請之參考標準 (2) 「海外聯招會」中文科目採計之參考標準 (3) 台灣大專院校招收外籍學生之華語能力參考標準 (4) 求職所需的華語能力證明 TOCFL 不以任何特定教材為命題依據,測驗內容針對各種日常生活情 境所設計,題材真實且多元化,內容涵蓋各種來源(曾文璇, 2008),例如: 廣告、廣播、公告、信件、便條、天氣預報等不同體裁;所選短文更是廣 泛涉獵文學、科學、藝術、天文、歷史等不同領域主題。TOCFL 閱讀測 23.

(32) 驗的各單元的試題主要為測驗受試者掌握華語詞彙與語法的能力及閱讀 華語短文的能力,其閱讀理解(Reading Comprehension)單元的試題內容包 括 50 題的選擇題,共分選詞填空及短文閱讀二部分。 由上述描述可知 TOCFL 主要是基於語言技能模式,評量學習者的聽、 說、讀、寫的華語文能力。TOCFL 的試題包含華語學習者日常生活所會面 臨的各類溝通活動和任務。 二、 兒童華語能力測驗 CCCC 是由華測會邀集華語文教學、語言學、兒童心理學與教育學等領 域的專家學者,研發的一套適合七至十二歲母語非華語兒童的華語能力檢 定考試。CCCC 的開發主要是因為因應現階段世界各地華語學習者層逐漸 下降的年齡,同時應付各國之中小學所陸續增設的華語課程的需要。CCCC 主要的目的為以幫助學習華語的外籍或華裔兒童了解自己的華語程度、激 勵他們學習華語的熱忱。 CCCC 主要分為 CCCC 萌芽級、CCCC 成長級和 CCCC 茁壯級三種不 同等級的測驗。自 2009 年於韓國舉辦第一次正式考試,並已於韓國、美 國、紐西蘭、阿根廷四個國家舉辦過正式考試(SC-TOP, 2011b)。 1.. 萌芽級 萌芽級為 CCCC 的最基礎能力等級。萌芽級的華語學習兒童約完成 150. 個華語學習時數。通過 CCCC 萌芽級的兒童其華語文能力約具備 400 個詞 彙量。其華語文能力可以達到:在溝通對方語速非常緩慢、用詞清晰,並 且有意的停頓或重複之情況下,學習者能簡單地就對方的問題進行交流。 並能從簡單表格或簡短文本中,讀出基本訊息,例如:姓名、日期、年齡 、時間、地點等等。 2.. 成長級 24.

(33) 成長級的華語學習兒童約完成 300 個華語學習時數。通過 CCCC 萌芽 級的兒童其華語文能力約具備 700 個詞彙量。其華語文能力可以達到:華 語學習兒童能夠針對日常生活所會接觸的範圍,能理解並使用熟悉的表達 方式以及非常基礎的短語來應付所需的溝通任務。同時能介紹自己和他人 ,並能針對學習者個人詳細資訊,例如:住的地方、認識的朋友以及擁有 的事物等清楚表達。也能在溝通對方語速緩慢、用詞清晰,並且願意提供 協助的前提下,進行簡單交流。 3.. 茁壯級 茁壯級為 CCCC 的最高階的能力等級。茁壯級的華語學習兒童適約完. 成 450 個華語學習時數。通過 CCCC 萌芽級的兒童其華語文能力約具備 1100 個詞彙量。其華語文能力可以達到:能理解大部分和華語學習兒童個 人經驗相關的話語和表達方式。針對單純、例行性、熟悉的任務,能夠簡 單、直接地與他人交換信息。同時能簡單地敘述出個人生長環境、家人狀 況、週遭環境及切身需求的事物。 CCCC 的測驗目的除了幫助華語學習者了解自己的華語程度,主要是希 望能力激勵他們學習華語的熱忱。測驗的目的主要包含下列四點: (1) 對兒童而言:瞭解自己的華語程度,進而激勵自己學習華語的熱忱與 自信,並挑戰自我能力。 (2) 對家長而言:瞭解孩子學習華語的狀況,進而規劃與調整孩子學習華 語的方法與步調。 (3) 對華語文教師而言:瞭解學生的華語程度,進而檢視自己的教學成效 ,以作為未來課程規劃的參考。 CCCC 試題設計主要考量兒童的認知與語言發展,以及不同語言文化知 識間可能出現的差異等因素,客觀地評量受試者的華語文能力。 CCCC 25.

(34) 的試題內容主要是以生活化且趣味活潑的內容為主。內容涵蓋所有與兒童 生活經驗相關之主題,如日常生活與休閒活動、交通運輸、人物特徵、身 體與健康、學校用語、時間與空間概念、氣候與季節等。題材取自真實的 生活情境,豐富有變化。試題的特色: (1) 以兒童為本位,從孩子的生活經驗出發。 (2) 試題設計符合兒童認知及語言發展歷程。 (3) 試題設計趣味、活潑且多元化。 (4) 題本彩色印刷,圖片生動可愛,提升兒童興趣。 由上述描述可知 CCCC 的試題都與華語學習者日常生活的情境有關。 CCCC 主要也是基於語言技能模式,評量學習者的聽、說、讀、寫的華語 文能力。. 貳、. 中國大陸. 一、 新 HSK 中國的漢語水平考試主要包含三種:新 HSK,新 YCT 和 BCT。以下就 中國的這三種測驗分別說明: 新 HSK 由中國國家對外漢語教學領導小組辦公室(國家漢辦)主導, 為國家級考試,並同時在中國和中國以外的國家施測。主要為檢測華語非 第一語言的考生在生活、學習和工作中運用華語進行溝通的能力(HSK, 2011)。 新 HSK 分筆試和口試兩部分,筆試和口試是相互獨立的。筆試包括 HSK(一級)、HSK(二級)、HSK(三級) 、HSK(四級) 、HSK(五級) 和 HSK(六級)。 26.

(35) 1.. HSK(一級) 通過 HSK(一級)的考生可以理解並使用一些非常簡單的華語詞語和. 句子,滿足具體的溝通需求,具備進一步學習華語的能力。 2.. HSK(二級) 通過 HSK(二級)的考生可以用華語就熟悉的日常話題進行簡單而直. 接的交流,達到初級華語優等水準。 3.. HSK(三級) 通過 HSK(三級)的考生可以用華語完成生活、學習、工作等方面的. 基本溝通任務,在中國旅遊時,可應對遇到的大部分溝通任務。 4.. HSK(四級) 通過 HSK(四級)的考生可以用華語就較廣泛領域的話題進行談論,. 比較流利地與華語為母語者進行交流。 5.. HSK(五級) 通過 HSK(五級)的考生可以閱讀華語報刊雜誌,欣賞華語影視節目. ,用華語進行較為完整的演講。 6.. HSK(六級) 通過 HSK(六級)的考生可以輕鬆地理解聽到或讀到的華語資訊,以. 口頭或書面的形式用華語流利地表達自己的見解。 新 HSH 的測驗目的包含: (1) 為各院校招生、分班授課、課程免修、學分授予提供參考依據。. 27.

(36) (2) 為各用人機構錄用、培訓、晉升工作人員提供參考依據。 (3) 為華語學習者瞭解、提高自己的華語應用能力提供參考依據。 (4) 為相關華語教學單位、培訓機構評價教學或培訓成效提供參考依據。 新 HSK 的測驗內容遵循“考教結合”的原則,試題設計與目前國際華語 教學現狀、使用教材緊密結合,目的是「以考促教」 「以考促學」 。新 HSK 主要是基於語言技能模式,評量學習者的聽、說、讀、寫的華語文能力( 倪傳斌、王志剛、王際平、汪臘萍, 2004; 張凱, 2006; 劉珣, 2006)。 二、 新 YCT 國家漢辦為鼓勵華語非第一語言的中小學生學習華語,培養、提高他 們的華語能力,自 2004 年以來,組織中外華語教學、語言學、心理學和 教育測量學等領域的專家,在充分調查、瞭解海外中小學實際華語教學情 況的基礎上,開發了新中小學生漢語考試(Youth Chinese Test, YCT)。新 YCT 又稱為中小學生漢語考試,是一項國際華語能力標準化考試,考查華 語非第一語言的中小學生在日常生活和學習中運用 華語的能力(HSK, 2011)。 新 YCT 的測驗結構分筆試和口試兩部分,筆試和口試是相互獨立的。 筆試包括 YCT(一級)、 YCT(二級) 、YCT(三級)和 YCT(四級)。 1.. YCT(一級) 通過 YCT(一級)的考生可以理解並使用最常用的華語詞語和句子,. 具備進一步學習華語的能力。 2.. YCT(二級) 通過 YCT(二級)的考生可以理解並使用一些非常簡單的華語詞語和 28.

(37) 句子,滿足具體的溝通需求。 3.. YCT(三級) 通過 YCT(三級)的考生可以用華語就熟悉的日常話題進行簡單而直. 接的交流,達到初級華語優等水準。 4.. YCT(四級) 通過 YCT(四級)的考生可以用華語完成生活、學習中的基本溝通任. 務,在中國旅遊時,可應對遇到的大部分溝通任務。 目前中國大陸的「新 HSK」以及中小學生漢語考試(Youth Chinese Test, YCT) (HSK, 2011)都已經對照 CEFR 的能力等級作為評量學生華語能力的 標準,其各等級能力和 CEFR 各級能力的對應關係如下表 2-3。 表 2- 3 新 HSK 和新 YCT 各等級能力對應關係表 新 HSK. 新 YCT. 詞彙量. 國際漢語能力標準. 5000 以上. HSK(六級). 五級. CEFR C2. HSK(五級). 2500. HSK(四級). 1200. 四級. B2. C1. HSK(三級). YCT(四級). 600. 三級. B1. HSK(二級). YCT(三級). 300. 二級. A2. HSK(一級). YCT(二級). 150. 一級. A1. YCT(一級). 80. 新 YCT 的測驗目的如下: (1) 可為考生瞭解、提高自己的華語能力提供參考依據。 (2) 可為各學校的華語教學提供參考依據。 29.

(38) (3) 可為各相關華語教學單位、培訓機構評價教學或培訓成效提供參考依 據。 (4) 可為考生參加 HSK 考試提供參考依據。 新 YCT 的測驗內容以增強考生學習華語的自信心和榮譽感為目標,遵 循“考教結合”的原則,試題設計與目前國際中小學生華語教學現狀、使用 教材緊密結合,「以考促教」 「以考促學」 。新 YCT 的試題包含華語學習者 日常生活所會面臨的各類溝通活動和任務,主要是基於語言技能模式,評 量學習者的聽、說、讀、寫的華語文能力。 三、 BCT 商務漢語考試(Business Chinese Test, BCT)的目的為檢測第一語言非華 語者從事商務活動所應具有的華語水準。BCT 考查受試者在與商務有關的 廣泛的職業場合、日常生活、社會交往中運用華語進行溝通的能力。實用 性、溝通性是 BCT 的主要特色(HSK, 2011)。 BCT 由 BCT(聽讀)和 BCT(說寫)兩種相對獨立的測驗組成。可以 單獨參加其中一種測驗,也可以同時參加兩種測驗。BCT 對受試者的年齡 、學歷或學習華語的時間沒有任何限制。測驗的形式目前有紙筆測驗( paper-based test)和電腦測驗(computer-based test)兩種形式。BCT 的測 驗共分為五種等級 1.. BCT 1 級 BCT 1 級尚未具備在商務活動中運用華語進行交流的能力。. 2.. BCT 2 級 BCT 2 級在商務活動中可以運用華語進行基本的交流。. 30.

(39) 3.. BCT 3 級 BCT 3 級在商務活動中可以比較有效地運用華語進行交流。. 4.. BCT 4 級 BCT 4 級在商務活動中可以比較熟練地運用華語進行交流。. 5.. BCT 5 級 BCT 5 級在商務活動中可以自如、得體地運用華語進行交流。 BCT 聽、讀、說、寫各單項成績的分數範圍是 0-500 分,每級 100 分. 。BCT(聽讀)總分為聽、讀單項分之和,總分範圍都是 0-1000 分,每 級 200 分。 BCT(聽讀)總分達到 201-400 分者可以獲得 2 級《商務漢語考試證 書(聽讀)》,3 級、4 級、5 級依此類推。 BCT 的測驗目的如下: (1) 可為各用人單位在人員招聘、選拔、安置、晉級等決策過程中評價相 關人員的商務華語水準提供參考依據。 (2) 幫助各相關教學、培訓機構在招生、入學分班等決策過程中認定學生 的商務華語水準。 (3) 評價各相關教學單位、培訓機構的教學、培訓的成效。 (4) 可為需求職、應聘、或希望提升職位的人士提供商務華語水準證明。 (5) 幫助華語學習者瞭解、發展自己的商務華語水準。 BCT 試題內容主要包括商務活動及與商務有關的日常生活及社會交往 31.

(40) 活動。有關溝通功能的項目可以參考《商務漢語考試大綱》商務漢語交際 功能項目(中國國家漢語國際推廣領導小組辦公室, 2006)。BCT 的試題包含 華語學習者日常生活所會面臨的各類溝通活動和任務,主要是基於語言技 能模式,評量學習者的聽、說、讀、寫的華語文能力。. 參、. 美國. 2007 年美國大學理事會(The College Board)將中文納入 AP(Advanced Placement)測驗。2009 年 AP 中文測驗的報考人數相對於前兩年,成長率 高達 32%,是該年度 AP 各科考試報名人數成長率的第二高科目(葉育婷, 2009)。這背後所隱藏的是意義是 AP 中文測驗已帶動了中文科目正式進入 美國主流教育體制內。 AP 中文測驗中語言能力的運用與文化知識的運用關系密切。測驗結構 主 要 分 為 互 動 溝 通 (interpersonal communicative mode) 、 理 解 詮 釋 (interpretive communicative mode) 和 表 達 演 示 模 式 (presentational communicative mode)(CollegeBoard, 2012a; 王若江, 2006)。說明日下: 1.. 互動溝通模式 互動溝通模式主要為互動性的雙向交流,包含面對面的或寫作式的交. 換意見和思想的交流。主要表現在展開話題和延續話題的溝通策略上。 2.. 理解詮釋模式 理解詮釋模式主要為考核閱讀理解和聽力能力。閱讀能力須達到通過. 高度語境化的書面材料,如廣告,招牌和海報,受試者能夠識別和總結要 點以及重要的細節,並作出適當的推論和預測。聽力能力須達到適應多種 正式的口說語言,如新聞、廣播等以及非正式的口說語言,如電影、電視 劇等。 32.

(41) 3.. 表達演示模式 表達演示模式主要為考核受試者的口語和寫作。口語能力需要達到能. 夠進行適當的演講和報告或是可以講述個人的經歷或是曾發生的事件。寫 作能力需要達到能力書寫各種不同的語體和篇章。 4.. 能力等級描述 AP 中文測驗包括聽、讀、寫、說四種語言能力的測試,四種能力所占. 分數比重各為 25%。AP 中文測驗試題所涵蓋的聽、讀、寫、說四種語言 技能都具同等比例,而且在每一種溝通模式比重是一樣(王若江, 2006)。AP 中文測驗的成績由高至低分成 5、4、3、2、1 五個等級。以閱讀能力為例 ,共分為 5 級: (1) 5 級分:通過 AP 中文測驗,成績非常好,受試者如同在大學完成四個 學期的中文課程,且大學中文課程的成績為 A (2) 4 級分:通過 AP 中文測驗,成績很好,受試者如同在大學完成四個學 期的中文課程,且大學中文課程的成績為 A-, B+和 B (3) 3 級分:通過 AP 中文測驗,受試者如同在大學完成四個學期的中文課 程,且大學中文課程的成績為 B-, C+和 C (4) 2 級分:可能會通過 AP 中文測驗 (5) 1 級分:不予推薦 現今美國各公立高中中文大學學分先修課,簡稱 AP 中文課程,AP 中 文課程是一門外語課程它允許中學生選修中文課程,而課程的設計為兩年 ,通過 AP 中文測驗的考生可以獲得大學學分,能選修中文高級課程,或 兩者兼得。也就是說,通過 AP 中文測驗成績合格者,相當于在美國大學 選修四個學期(約 250 小時)通過的中文程度,內容包括中文聽、說、讀 、寫及中國文化,未來在進入美國的大學後,可免去四個學期的中文課程 33.

(42) 學分,從第五個學期的中文課開選讀。90%左右的美國,加拿大大學,以 及 20 個左右其他國家的大學都承認它的學分(曾妙芬, 2007)。 AP 中文測驗聽、說、讀、寫四種能力所占分數比重分別為 25%。聽、 讀主要的試題類型為選擇題,共七十題;寫共分為四大題,說分為三大題 ,寫和聽屬於開放題。若以人際溝通、資訊接受和表達模式所占比例大小 而言,表達模式占 30%,口語和寫作各一半;資訊接受模式占 40%其中聽 力部分 15%;人際溝通模式占 30%,其中讀寫試題 1 成,聽說試題 2 成。 AP 中文測驗在考試時間上有嚴格要求。考試共分為兩部分,第一部分為 聽力和閱讀,第二部分為口語和寫作。每一部分都為 45 分鐘,整場考試 共 180 分鐘。 考試試題靈活多樣,結合了對中華文化、傳統的了解。例如透過演講 介紹中國的城市以及這個城市的特色等。由上述描述可知 AP 中文測驗主 要是基於語言技能模式,評量學習者的聽、說、讀、寫的華語文能力。測 驗的試題包含華語學習者日常生活所會面臨的各類溝通活動或任務。. 第四節 試題反應理論模式 試題反應理論又稱為現代測驗理論。當代的 IRT 模式已經有數十種之 多,分別應用在許多不同的測驗情境裡。若依測量受試者能力的向度來區 分可分為單向度(unidimensional)和多向度(multidimensional)兩類。以下分 別介紹單向度試題反應理論(UIRT)模式、多向度試題反應理論(MIRT)模式 和高階層試題反應理論(HO-IRT)模式三種模式。. 壹、 單向度試題反應理論 IRT 主要是用來描述測驗的試題特性(難度、鑑別度、猜測度)與受試 34.

(43) 者能力或潛在特質對於試題的答題反應的一種數學模式。UIRT 模式已經 被廣泛地運用在教育、心理、醫療等相關領域中。在國外比較著名的大型 標準測驗如 NAEP 和 TIMSS 就是採用 UIRT 的模式(Lee et al., 2007; Mullis et al., 2007)。又例如 TOEFL、GRE、GMAT 考試以及一些人格量表與醫學 相關量表的編製,以及國內的國中基本學力測驗也都是採用 UIRT 模式。 若以模式的參數來區分,常見的 UIRT 模式有三:單參數 UIRT 模式、二 參數 UIRT 模式和三參數 UIRT 模式。分別介紹如下: 一、. 單參數 UIRT 模式. IRT 單參數模式(one-parameter logistic model, U1PLM)如下列公式(1)所 示(Rasch, 1960): Pi (θj ) =. exp(θj −bi ) 1+exp(θj −bi ). (1). 其中𝜃𝑗 為受試者 j 的能力,𝑏𝑖 是試題 i 的難度,而𝑃𝑖 (𝜃𝑗 )是受試者答對 第 i 題的機率。在單參數 UIRT 的模式中,受試者在第 i 題上的答對 機率是同時受到受試者能力與該試題的難易度所影響。 二、. 二參數 UIRT 模式. 在 U1PLM 中,所有試題都被要求要具有相同的高鑑別度(1.0),而猜對 率為 0。不同於單參數 UIRT 模式,二參數 UIRT 模式最早由 Lord (1952) 提出,當時所提出來的是常態肩型模式,之後再經(Birnbaum, 1968)修改成 較簡單的對數模式(two-parameter logistic model, U2PLM),如公式(2)所示。 𝑃𝑖 (𝜃𝑗 ) =. 𝑒𝑥𝑝[𝑎𝑖 (𝜃𝑗 −𝑏𝑖 )] 1+𝑒𝑥𝑝[𝑎𝑖 (𝜃𝑗 −𝑏𝑖 )]. (2). 其中𝑎𝑖 是試題𝑖的鑑別度,其他的符號意義與公式(1)相同。在 U2PLM 中,與 Rasch 最大的不同點是題目可以被允許有不同的鑑別度。 35.

(44) U2PLM 將會與實際資料較為接近,因為每一道試題很難都具有相同 的鑑別度。 三、. 三參數 UIRT 模式. 上述 U1PLM 和 U2PLM 中,受試者猜對題目的機率已經被納入受試者 能力中,而不是試題特性。而這種現象顯然和真實的測驗情境不吻合。因 為就選擇性的試題而言,受試者對於不知道答案的試題,都會採取猜題的 策略來作答,因此,將猜測的參數納入試題的特性中才能比較準確的測量 出受試者的能力值。三參數 UIRT 模式(three-parameter logistic model, U3PLM)的概念源自於 Lord (1952) 與 Birnbaum (1968)。主要是針對那些可 以經由猜測來答對試題的測驗情況,例如選擇題、是非題……等。如公式 (3)所示。 Pi (θj ) = ci + (1 − ci ). exp[ai (θj −bi )] 1+exp[ai (θj −bi )]. (3). 其中𝑐𝑖 是試題𝑖的猜對率,其他的符號意義與公式(2)相同。 U3PLM 在估計受試者能力時也已經考慮了不同題目的猜對率對受試者 答對機率的影響,因此所得到的能力值應該會比較符合其實際能力水準。 受試者在測驗上的整體表現就是所有試題答對機率的聯合機率。藉由 這個數學模式與聯合機率的概念,就能根據受試者在各個題目上的答題反 應來估計他的能力以及題目的難易度。而這樣的數學模式將受試者的能力 和試題的難度放在相同的量尺下,因此可用高於或低於試題難度來衡量受 試者的能力,並且讓接受不同題目的受試者其能力可以互相比較 (Embretson & Reise, 2000; Hambleton & Swaminathan, 1985)。 UIRT 有一個重要的基本假設,就是單向度(unidimensionality)的假設。 受試者資料必須符合這些假設才能具備上節所述的各項特性,否則就不適 36.

參考文獻

相關文件

畫分語言範疇(language categories),分析學者由於對語言的研究,發現

複選通過標準:國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外 語文性向測驗成績達平均數正 1.5 個標準差或 PR93

(二) 依【管道一】複選鑑定,國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外語文性向測驗成績達平均數正 1.5 個標準差或 PR93

請聽到鈴(鐘)聲響後再翻頁作答.. Chomsky)將人類語言分成兩種層次,一是人類普遍存在的潛 力,一是在環境中學習的語言能力。他認為幼兒有語言獲得機制( Language Acquisition Device 簡稱

擔任職務資格 具有企業所需該職務特殊專長能力者 二十 華語語文能力 經華語文能力檢定達「流利」等級以上 三十 經華語文能力檢定達「高階」等級 二十五 經華語文能力檢定達「進階」等級

Assessing Fit of Unidimensional Item Response Theory Models The issue of evaluating practical consequences of model misfit has been given little attention in the model

Using a one-factor higher-order item response theory (HO-IRT) model formulation, it is pos- ited that an examinee’s performance in each domain is accounted for by a

Rebecca Oxford (1990) 將語言學習策略分為兩大類:直接性 學習策略 (directed language learning strategies) 及間接性學 習策略 (in-directed