• 沒有找到結果。

本論文研究工具分別是「自製網頁版問卷」和「中文考試寫作中介語語 料庫」,前者對應至問卷調查法,而經由兩者所取得之語料皆能用篇章分析 法,茲詳述於後。

壹、自製網頁版問卷:谷歌(Google)表單

意見暨背景資訊調查

一、

中文教學者問卷、中文一般母語者、中文學習者之問卷皆有關於教學之 問題。

中文教學者問卷正文有八節:一、對於「顯性」教導中文閱讀與寫作/

作文之意見調查;二、認為需要者之相關問題;三、認為不必者之相關問題;

四、對於「顯性」教導中文(新式)標點符號及空格用法之意見調查;五、

認為需要者之相關問題;六、認為不必者之相關問題;七、課程規劃、綱要 與教材之相關問題;八、個人相關背景。因第二、三、五、六節為隨答案跳 題之相關題組,故實際填寫數為六節。由於中文教學者理應熟悉中文的兩套 文字系統,故不需分為兩版而是配合語境呈現兩套文字系統。標題、說明、

題幹等處為並列呈現,先傳統字、後簡化字;而選項文字則根據其語意,部

分為傳統字、部分為簡化字。網頁版問卷,參閱本論文附錄之空白問卷內容 原文。

中文一般母語者和中文學習者問卷正文有三節:診斷測驗(向參與者宣 稱是中文閱讀測驗以求客觀填寫)、施測後意見調查、個人相關背景資訊調 查。因應中文的兩套文字系統「繁體中文」(傳統字系統:臺灣的大部分「標 準字」以及香港與澳門的繁體字)和「簡體中文」(簡化字系統:中國大陸 的大部分「規範字」以及新加坡和馬來西亞的簡體字),此問卷一式二版,

分為傳統字和簡化字兩版。為確認語料可用程度及參與者背景是否符合調查 對象,本問卷對中文一般母語者和中文學習者皆設計檢驗項目,以便過濾、

篩選;為比較不同立場之觀點,本問卷對中文非教學者和教學者亦設計關聯 題目,以調查他們對於中文閱讀、中文寫作/作文、中文標點符號及空格系 統、中文輸入法之教學意見。

三者對應關係,見表 4.1 與表 4.2 所示。

表 4.1 問卷檢驗項目與關聯題目之題號對照表

表 4.2 問卷關聯題目之題號對照表

只要參與者用對評量項目之同位符,皆屬正用。由於括號在兩岸方案皆出現 者僅圓括弧 1 項,故不評量方括弧、六角括弧、方頭括弧此 3 項;若參與者 使用此 3 項才進一步分析是正用、誤用、異用。連接號有甲、乙兩式符形(乙 式有 2 項近形字元),參與者輸入任一式皆屬正用。間隔號有 6 項近形字元,

參與者輸入任一同位符皆屬正用。破折號有 3 項具備足夠長度之近形字元,

參與者輸入任一同位符皆屬正用;若選用此 3 項以外之近形字元,則因長度 過短故屬誤用。

符號用法方面,不評量其平列/並列用法而僅評量其音界分節用法。這 是因為間隔號的平列/並列用法較常用於標題或標示內的詞組/短語,往往不 成完整句子,無法提供足夠語境給參與者推測該用哪種標點符號。

除了「加上標點符號」,也將書面語篇所需之「留下間距」納入評量項 目,包含換行、挪擡(一個全形空格)、段落首行縮排(兩個全形空格)、對 齊(多個全形或半形空格)等 4 種。

操作技術方面,所評量之 14 種標點符號在網頁環境內皆能用中文輸入 法直接輸入。經測試,谷歌表單於填寫時能夠換行(enter 或 shift+enter), 其回應資料儲存格內也能夠記錄換行;而在網頁環境內雖無法如同文書處理 程式般直接設定縮排或對齊,但能夠改用空格達成相同效果;因此,所評量 之 4 種間距亦無技術性困難。

考量以上因素,診斷測驗需評量之中文新式標點符號及空格用法共 18 種,見下表所示。

表 4.3 診斷測驗所評量項目(包含同位符之符形)

1. 。 8. 「單引號」『雙引號』 15. 換行 2. ? 9. 《雙書名號》〈單書名號〉 16. 挪擡

3. ! 10. (圓括弧) 17. 縮排

4. 、 11. …… 18. 對齊

5. , 12. 破折號是兩格長劃——兩格橫槓――兩格方框橫線──

6. ; 13. 甲式連接號是單格 em 長劃/一字線— 乙式連接號是全形波浪號~

或波形長劃〜

7. : 14. 項目•符號 實心圓點.句號 日文全形・中點 中·點 日文半形・中點 連‧字‧點

診斷測驗命題及編製原則 三、

針對中文、英文、日文三種語文背景研究參與者施行之「診斷測驗」,

其題目文本用字或用詞範圍係參考「國家華語測驗推動工作委員會」(華測 會)《華語八千詞》,選用基礎級(A2)至進階級(B1)字詞,並涵蓋兩岸公 定方案當中能夠在網頁環境內輸入之標點符號。

雖已盡量控制字詞等級,但因需配合標點符號用法選用或擬定適合的題 目文本,仍有部分字詞超出 B1 等級。用字方面,人名「吐」是高階級(B2),

雖屬超等字/超綱字(超過考試等級/超出大綱範圍的漢字),但可從語境判 斷是人名;即使不認得該漢字也無礙理解。用詞方面,部分雖屬超等詞/超 綱詞(超過考試等級/超出大綱範圍的詞語),但詞內用字則皆學過,亦可從 語境判斷單詞意義。

除了控制文本內字詞等級,也控制其字數(篇幅)。由於自編一篇能用 到全 18 種的短文,對於診斷測驗參與者而言可能較長或較難,故改為先測 語段(句子) 再測語篇(段落)。測驗文本共 28 題,含 26 句語段、2 段語 篇。編完題目後,刪除文本內之標點符號及空格。參與者之任務是將每題文 本加上適當標點符號及空格。

題目來源多樣,包含自行編寫者,參考臺灣方案、大陸方案、標點符號 用法專門書籍而編寫者,引用對內或對外之中文教材句子,引用「華測會」

之入門基礎級閱讀測驗題目等。診斷測驗題目之出處代碼、參考文獻、原稿 文本等,詳見本論文附錄之診斷測驗題目相關資訊。

貳、中文考試寫作中介語語料庫:TOCFL 學習者語料庫

語料庫簡介

一、

本研究之考試寫作學習者中介語語料由「TOCFL 學習者語料庫49」所提 供。其語料出自非母語者所參加之「華語文能力測驗寫作測驗」(TOCFL Writing)的作文。時間範圍是 2006 年至 2012 年,共收集 4567 篇,約一百

49 TOCFL 學習者語料庫檢索系統 http://tocfl.itc.ntnu.edu.tw:8080/TOCFL/

五十萬字。其中 2837 篇(989045 字)經過人工偏誤標記處理,而自動斷詞 和詞類標記則採中央研究院「中文斷詞系統」(CKIP)。關於本語料庫建置詳 情,參閱其官網首頁50。欲使用此檢索系統需申請帳號和密碼。

此語料庫之體裁類別以作文題目和考試書寫要求為準,分別是記敘文、

議論文、信件、便條、圖表分析、看圖作文、應用文、論說文共八種。由此 可知,所有文本皆應使用書面語而非口語。關於寫作測驗說明與例題,參閱 華測會官網所提供下載之文宣51

檢索模式 二、

此語料庫提供三種檢索模式,分別是偏誤檢索、字串檢索、關鍵詞檢索。

三種檢索模式之共同可選項目為左右字數、考生分數、體裁、考生母語、考 試等級(A2=基礎級、B1=進階級、B2=高階級、C1=流利級),並能指定 左右字數內所包含或不包含之字串(見圖 4.2)。

50 張莉萍(2012)。TOCFL 作文語料庫的建置與應用。北京語言大學主辦第二屆漢語中介 語語料庫建設與應用國際學術討論會,北京市。

http://tocfl.itc.ntnu.edu.tw:8080/TOCFL/doc/lchang_TOCFL_Book_article.pdf

51 https://www.sc-top.org.tw/download/TOCFL_writing.pdf

圖 4.2 TOCFL 學習者語料庫檢索系統三種操作介面

# 字元(僅搜符號而不含文字) 英語母語考生 日語母語考生

'single quotation marks'

"double quotation marks""

quote"

(55×2=110)

共找到 0 筆紀錄

# 字元(僅搜符號而不含文字) 英語母語考生 日語母語考生 找到 0 筆紀錄 系統限制 13. em dash—

horizontal bar―

boxing drawings light horizontal─

全形連字號暨減號-

號數量中等,但討論空間較小,故亦於檢索其他標點符號時一併觀察即可;

其誤用主要在於使用者無法掌握問句句末或資訊不詳處才用問號,尤其是疑 問代名詞當作不定代名詞(不定指),以及 A-not-A 選擇形式的「陳述句」

用法,其句末句號常被誤用問號。第三,驚嘆號/感歎號討論空間亦較小,

且數量龐大,故亦於檢索其他標點符號時一併觀察即可;其誤用主要在於使 用者無法判斷「設問句」用法是偏向疑問或是感歎;再者,其濫用或迴避的 情形,因驚嘆號/感歎號是表達主觀感受而難以稱為是正用或誤用,只能稱 為功能或風格有別。

除此之外,還有三項系統限制。其一,如同其他語料庫,此語料庫僅能 查詢有限字數的片斷,而無法按照考試題目檢索完整語篇。若需確認標點符 號在篇章層次上使用是否正確,則需往前或往後檢索文本內字串,以窺全 貌。其二,此語料庫並未按照考生母語和報考梯次給予考生編號和語料代 碼,檢視語料時無法得知是否出自同一梯次之同一位考生,故無法比較同一 位作者在撰寫該次考試內不同體裁時有何出入。其三,此語料庫不標記符號 成分偏誤,故只能搜索「已存在的」字元有無錯誤或是否多餘;而逐筆瀏覽 語料時,必須察覺「隱形的」符號,否則容易遺漏少用/缺號之錯誤。

參、語料標記分類法

語言成分標記分類法 一、

雖然此語料庫僅標記語言成分而不標記符號成分偏誤,但是本論文選用 語段或語篇仍保留其語言成分之偏誤標記,以供參考(其標記分類法,參閱 此語料庫所提供下載之《偏誤標記更新版》52)。此語料庫之語言成分偏誤 標記是以半形方括弧夾注代碼,誤用類型代碼字母大寫、語言成分代碼字母 小寫,例如:[Madv]為「缺少副詞」之意。

倘若特定標點符號及空格用法因與某些未標記的偏誤語段高度關聯,而 需由研究者自行標記、補充,以便理解、分析,則標記方式簡化為以雙重方 括弧夾注誤用類型代碼,並直接插入所需語言成分或修改內容而不標記次

52 http://tocfl.itc.ntnu.edu.tw:8080/TOCFL/doc/ErrorTag_201412.pdf