第四章 分析結果與討論
第一節 語料庫中德語語料的分佈狀況
為了建立對 TOCFL 語料庫中全部德語語料的分析,本節將提供有關不同語 言程度等級、偏誤主類和偏誤次類出現的一般分佈情況。為了更好地表明德語 語料的比例及分佈,整個語料庫的語料分佈也在此顯示。請參考下列表格。
9 筆者決定使用「偏誤主要類型」及「偏誤次要類型」該陳述是為了將本研究中討論的不同偏誤與
一、TOCFL 語料庫德語語料與全部語料之對比
表四-1:TOCFL 語料庫全部語料語言水準及偏誤主類之分佈與比例 語言水準
偏誤主類
A2 B1 B2 C1 總計 比例(%)
M 類(遺漏錯誤) 2298 6178 3233 211 11920 36.03 R 類(冗贅錯誤) 1091 3104 1662 103 5960 18.01 S 類(選用錯誤) 2093 6936 3634 245 12908 39.01 W 類(語序錯誤) 483 1273 506 36 2298 6.95
總計 5965 17491 9035 595 33086
比例(%) 18.03 52.87 27.31 1.79 100%
表四-2:TOCFL 語料庫德語語料語言水準及偏誤主類之分佈與比例
語言水準
偏誤主類
A2 B1 B2 C1 總計 比例(%)
M 類(遺漏錯誤) 60 124 22 0 206 34.16
R 類(冗贅錯誤) 28 63 21 0 112 18.57
S 類(選用錯誤) 48 151 37 0 236 39.14
W 類(語序錯誤) 21 23 5 0 49 8.13
總計 157 361 85 0 603
比例(%) 26.04 59.87 14.09 0 100%
如表四-2 所示,德語語料之總筆數為 603 筆。而表四-1 中,整體語料庫總 筆數為 33,086,意味著德語部分的語料僅為全語料庫的 1.82%。
在對比德語語料與整體語料的分佈時可發現各種異同。在比較兩表程度比 例的情況時,可知 B1 程度在兩表中最多 —— B1 的資料佔據德語語料的 59.87%、
在整體語料佔 52.87%。不過,在全體語料庫中佔比第二高的類別為 B2、語料第 三最多為 A2 程度的語料。在德語語料中此現象相反,A2 類別佔比第二大
(26.04%)、B2 第三大(14.09%)。德語部分沒有 C1 程度的語料,同時整體 語料庫中 C1 的比例亦十分小,佔全語料的 1.79%。此外值得注意的是,在德語 語料中可見偏初級程度的趨勢 —— 絕大部分的語料屬於 A2 與 B1 程度,小部分 屬於 B2 程度。其中一個可能原因為沒有德國中文學生參加華語文能力測驗流利 精通級 (Band C) 的版本。華語文能力的 Band C 分為 C1(流利級)與 C2(精通 級)的二語程度10,但若沒有德國人參加測驗,就無法累積屬於 C1 程度的任何 語料。儘管整個語料庫中 C1 的語料百分比非常低(1.79%),不過,該語料庫 的德語部分沒有任何 C1 數據。
在比較德語語料與全部語料偏誤類別的比例時,筆者發現有許多共同點。
表四-2 及表四-1 皆顯示 M 類與 S 類佔比為三分之一以上(S 類:39.14% / 39.01%、
M 類:34.16% / 36.03%;前者為德語語料,後者為全部語料之比率),是語料 庫中偏誤主類最多及次多者。佔比次少的偏誤主類則為 R 類,兩者的比例亦相 似 —— 18.57%及 18.01%。佔比最少的類型為 W 主類(語序錯誤)。在兩個表 格中,該比率皆低於 10%,其中德語部分的比例較整體語料庫稍高,可能表明 語序對於德國中文學習者而言是較大的問題。雖然百分比略高於全部語料庫 W 類的比例,不過因為差異相當小,仍不能當作充分的證明。
另一個相似之處與每個熟練程度數量最多的偏誤類型有關。可參考表四-1 與表四-2 畫底線的格子。兩份表格顯示,A2 程度中最普遍的偏誤主類為 M 類
(遺漏錯誤),對其他程度中文學習者而言,最常發現的偏誤均為 S 類(選用 錯誤)。此狀況的可能原因為初學者(A2)經常因為目標語知識不足而缺少必 要的語言成分(劉曉穎和郭伏良,2010);中級以上的學生(B1 以上)或許因 為詞彙量更大,混用單詞出現的可能性更高(張博,2008)。
二、TOCFL 語料庫德語語料偏誤次類之分佈情況
以下將呈現語料庫中所包含的偏誤次類的分佈情況。因為類別眾多(總共 36 類),本研究未討論到之偏誤次類不予列出,亦不會與全部語料庫比較(詳
見附錄 3)。在此僅顯示德語語料中偏誤次類在三個不同程度的出現量,請參照 以下的表四-3。
表四-3:德語語料偏誤次類之分佈 L2 程度偏
誤次類
A2 B1 B2 總計
副詞 [adv] 22 41 9 72 時態助詞 [asp] 15 40 2 57 能願動詞 [aux] 16 25 6 47 量詞 [cl] 7 11 4 22 連接詞 [conj] 7 15 1 23 結構助詞 [de] 5 24 8 37 名詞 [n] 7 29 11 47 特殊句型:是 [shi] 2 5 1 10 動作動詞 [v] 23 64 18 105 狀態動詞 [vs] 4 14 4 22 特殊句型:有 [you] 6 7 3 16
據表四-3 所示,可看出出現頻率最高的偏誤次類為「動作動詞」([v]),
共 105 筆。其次依序為「副詞」([adv],共 72 筆)、「時態助詞」([asp],共 57 筆)、「名詞」([n],共 47 筆)、「能願動詞」([aux],共 47 筆)以及
「結構助詞」([de],共 37 筆),此六種偏誤次類將在本章的第二及第三節專 門討論,然而本文不僅要關注出現頻率最高的偏誤,還要考慮造成偏誤的語言 遷移因素。至於出現最少的偏誤次類,有一種從未發生(修飾語,[mod]),亦 有不少類型僅出現一次(例如:賓語、複數詞綴、複雜名詞子句、及物性等類 別)或兩次(例如:「把」字句、「被」字句等類別)。
表四-3 同時顯示,在 12 個類別(三種語言程度、四個偏誤主類)中,出現 次數最多的類別依序是:一、[B1/v];二、[B1/asp];三、[B1/n]。可參考表四-3 畫底線的格子。[B1/v] 代表程度 B1 中與動詞有關的偏誤,總共出現 64 次。
[B1/asp] 為時態助詞的錯誤,總計 40 次。[B1/n] 則是關於名詞的偏誤,出現 29 次。三個不同偏誤皆屬於 B1 的熟練程度,主要也可能是因為 B1 累積的語料最 豐富。