第三章 研究方法與分析結果
3.1 語料庫研究方法
3.1.1 語料庫簡介
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第三章 研究方法與分析結果
3.1 語料庫研究方法
本研究採用語料庫研究方法,可觀察學習者產出的語言,而偏誤則是學習者 學習過程當中產生困難的證明,也是提出教學建議的重要依據。透過觀察學習者 的使用情況與偏誤,可以了解學習者掌握「會」的情況,包含偏誤率、偏誤類型 的比例等等。這一小節分為兩大部分,首先簡介我們所選用的TOCFL 學習者語 料庫,然後再說明語料分析的步驟與原則。
3.1.1 語料庫簡介
本研究以TOCFL 學習者語料庫為本(張莉萍 2013),其中約有 100 萬字的 語料,語料來源為參加台灣華語文能力測驗(TOCFL)的考生於電腦考試時,線 上輸入的作文。2015 年已經公開於網路上(http://tocfl.itc.ntnu.edu.tw/)的網站上,
供大眾免費檢索。
此語料庫中的學習者包含初級(A2)、中級(B1)、中高級(B2)、高級(C1)
等程度。學習者包含含英語、日語、韓語、法語、德語、西語、越南語等 39 種 不同母語背景。該語料庫的特色如下:
1. 真實性
(1) 由學習者直接以電腦寫作方式輸入語料,為第一手資料。
(2) 只對語料偏誤之處進行標記、並不改寫語料本身的內容。
(3) 主題式寫作引導學習者,與課堂中特定語法操練或作業不同。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
28
2. 多元性
(1) 可採取母語、CEFR7分級程度、或由寫作級分等不同的分類。
(2) 有說故事、書信、記敘文、論說文等題裁,主題多樣。
3. 可操作性
(1) 按照四大偏誤類型、詞類,句型等標記,方便使用者分類檢索。
(2) 內容多為完整段落,非單句或簡單對話,有完整上下文語境。
語料庫中已經有這些大量的語料初步的標記,方便讓我們搜索出使用助動詞 的「會」的語料,但是若要進一步分析這些偏誤的結果,仍然需要更細部的資料 處理。在標記的過程之中,也要確保標記的正確性,因為這些語料需要由人工一 筆筆去處理,以下說明我們的原則。
「會」在語料庫中主要的偏誤類型有四大類,分別為遺漏missing(M)、誤 代mis-selection(S)、誤加 redundancy(R)和錯序 wrong-order(W)。進入系統 之後,輸入我們要的標記,收集到的語料,可以看到都已經初步標記如下:
表4:「會」的四個主要偏誤類型標記 助動詞偏誤 Maux Saux Waux Raux 標記說明 遺漏偏誤 誤代偏誤 錯序偏誤 誤加偏誤
7 CEFR (Common European Framework of Reference for Languages: Learning, Teaching, Assessment) 是歐洲共同語文參考標準,是被國際認可的標準,可精準判斷測試者的語言程 度。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
語料中找到的助動詞的偏誤,因為只有經過這四類初步的標記。收集下來之 後,還得必須再由我們一筆一筆人工檢視遺漏的為哪一個助動詞。語料舉例如下:
1. 今天我要去看醫生。我想明天也許我不能上課。所以請你給[Srang]我請假。
我好了[Wasp]一點兒就[Mv]上課。在家裡我也 [Maux] 看書跟打電話給你問 你今天的功課。謝謝您!麻煩您!8
(此處的Maux 判定為遺漏了「會」。)
2. 所以如果你已經有身分證,你 會 [Saux]參加選舉,選總統。
(此處的Saux 判定為以「會」取代了「可以」。)
3. 要不是有他們的幫助,一定 會 [Raux]沒有現在的我,而且一定會[Raux]沒 有這麼輕鬆的生活。
(此處的Raux 代表「會」判定為誤加偏誤,表示不應該用而用。)
經語料庫中收集下來的語料,只有初步標記,該如何判定語料的分類,如 Maux 應屬於哪ㄧ個助動詞的遺漏,是由本人和一位同樣是華語文教學背景的碩 士生,先就同一份語料,各自進行偏誤的分類認定。
若是出現兩人不一致的部分,我們就提出各自的意見,互相討論後,再設法 找出一致的分類標準,若討論過後,意見仍有分歧,則再請一位學習者偏誤語料 庫領域的研究專家做最後判定。以下說明,本研究收集語料的步驟。
8 [Srang]、[Wasp]、[Mv]分別為「讓的選用偏誤」、「時貌標記錯序偏誤」、「動詞遺漏偏誤」。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
30