• 沒有找到結果。

名詞、動詞和名動比的計算

第四章 研究方法

第四節 名詞、動詞和名動比的計算

語料庫的詞性標注比較細緻,我們必須根據研究所需進行合併。名詞方面,

語料庫裡頭的一般名詞、專有名詞和代名詞和研究所需要的名詞範圍可以直接 匹配。動詞方面,不論是語料庫的標注或 Tardif (1993, 1996) 的語料分析,都是 以 Chao (1968) 為分類框架為雛型,我們將三者對於動詞的次類對應整理如表 11。華語的動詞指的是可以在前面冠上「不」或「沒」的謂語(Chao, 1968) 。此 外,區分華語動詞及物和不及物的依據,不只是該動詞需不需要「東西」

(object),還必須依據該動詞的「東西」的種類(Chao, 1968) 。於此,Chao (1968) 將動詞分為九類。Tardif (1993, 1996) 依據 Chao (1968) 的分類,將語料進 行標記,計有八類。本研究所使用的語料標記為中研院平衡語料庫的標記,該 系統根據格語法理論(Case theory)(Fillmore, 1968) 和動詞的語意(Chao, 1968) 進行標記,計有十八類。

我們以語料庫的標記和研究所需要詞類進行對應取得名詞和動詞的範圍。

本研究所需要的名詞的次類包括普通名詞(_Na)、專有名稱(_Nb)和代名詞

(_Nh),語料庫對名詞所標記的次類可以滿足研究需求。然而,語料庫裡對 動詞進行了兩個層級的標記(Huang, Hsieh & Chen, 2017) ,第一級先以格語法理 論(Fillmore, 1968) 對動詞必要的論元數,以及論元所扮演的色和語意限制進行 標記,次一級依照動詞的語意(動作、狀態或分類等(Chao, 1968) )進行標記,

因此我們必須將因為格語法而被分類的項目進行合併。

首先計算名詞和動詞在詞形和詞體佔整體語料庫的佔比,並根據名詞和動 詞的數量進行名動比的計算。名詞佔比的計算是將所有詞的數量當作分母,名 詞的數量當作分子;動詞的佔比則將動詞的數量當作分子。而名動比則將名詞 數量當作分子,動詞數量當作分母。計算後的數值於小數點後第四位四捨五入。

若名動比的數值大於 1 即可知名詞多於動詞,等於 1 則名詞和動詞相當,小於 1 則動詞多於名詞。

表 11:動詞次類與語料庫詞性標記的對應 動詞次類的中譯 Chao (1968) Tardif (1993,

1996) 語料庫標記 中文名稱

及物動作動詞、

不及物動作動詞

intransitive action verbs, transitive

action verbs

Main Verbs _VA、_ VB、_

VAC、_ VC、_

VCL、_ VD、_

VE、_ VF quality verbs

(adjectives)

Adjectives _ VH 狀態不及物動詞

狀態動詞 status verbs Stative Verbs _ VI 狀態類及物動詞 及物性質動詞 transitive quality

verbs Qualitative Verb _ VHC、_ VJ、_

VK、_ VL

狀態使動動詞、

狀態及物動詞、

狀態句賓動詞、

狀態謂賓動詞 分類動詞 classificatory

verbs Classificatory

Verbs _ VG 分類動詞

有 you you3 V_2 「有」

是 shi Copula SHI 「是」

助動詞 auxiliary verb Auxiliary Verbs D 副詞

第五章 結果與討論

所有語料庫及收集的語料,在分詞和標注詞性後,分別依詞形和詞體兩個 單位在四個名詞和動詞定義下進行名詞佔比、動詞佔比以及名動比的計算。自 行收集的語料可以先在個別文本計算名詞佔比、動詞佔比、名動比後,再計算 所有文本的平均數和標準差。此外,個別語料庫及語料都可以在不分文本的情 況下,進行整體名詞佔比、動詞佔比、名動比的計算。第一種計算方法將所收 集來的語料當作抽樣的樣本,目的在於推測母群的情況;而第二種計算方法則 將語料庫本身當作母群,母群即反應真實的情況。兩種計算方法的過程雖略有 差異,但就結果和目的來看相差不大。後文僅就第二種計算方法(母群作為整 體語料分布的情況)進行討論,並將所有文本的平均數和標準差以附件的方式 作為參考。下面分別討論詞形和詞體在四個定義下的結果。

第一節 詞形

此節以詞形作為單位檢視不同定義下的名詞佔比、動詞佔比和名動比。

一、定義一:(普通名詞)/(動作動詞)

將個別語料庫的詞形,按定義一計算得到的名詞佔比、動詞佔比和名動比 的呈現如圖 2 所示。

首先,比較母語和中介語的結果,從圖中可以看出母語(2.196)的名動比 高於中介語(2.094)。這樣子的差別可能是因為二語學習者使用的普通名詞和 動作動詞比較多(因為都是具體的詞彙),而母語者詞彙的選擇比較多,不受 限於具體的詞彙。同時,也可以看出,母語裡名詞和動詞所佔的比例的確比中 介語裡名詞和動詞所佔的比例來得低,也因此前者的名動比高於後者。換句話 說,這個結果顯示的是在學習的過程中(中介語),華語二語者所習得的華語 的樣貌與母語者的並不相同。

其次,從教科書的統計數據可以看到,教科書除了第一冊(1.495)和第六 冊(1.703)外,其餘各冊的名動比存在隨著冊數越高,名動比越高的趨勢。觀 察各冊名詞佔比的變化,則可以發現名詞佔比是逐冊攀升;而動詞佔比在第一 冊最低,從第二冊開始則是逐冊下降。此外,教科書第五冊(1.793)和第六冊 的名動比皆低於母語語料庫和中介語語料庫。母語語料庫和中介語料庫的名詞 佔比都高於教科書。

接著,從碩博士論文摘要來看,母語碩博士論文摘要(2.474)和二語碩博 士論文摘要(2.483)的名動比的差在 0.05 之內,沒有明顯的差異。母語者的名 詞佔比和動詞佔比略高於二語者,同樣不超過 0.05。同時,和母語語料庫和中 介語語料庫相比,碩博士論文摘要的名動比都比較高,主要來自較高的名詞佔 比。碩博士論文摘要的文章類型單一,且主要為學術論文可能是和母語語料庫 及中介語語料庫存在差異的原因。

二、定義二:(普通名詞、專有名稱)/(動作動詞、性質動詞、

分類動詞、是、有)

將個別語料庫的詞形,按定義二計算得到的名詞佔比、動詞佔比和名動比 的呈現如圖 3。

首先,在東西/關係定義下,母語(2.597)的名動比高於中介語

(1.928)。語料顯示,華語二語者所使用的名詞比華語母語者少,動詞則比華 語母語者略多。

其次,教科書除了第一冊(1.302)的名動比外,其餘各冊隨著冊數越高,

名動比越高的趨勢。觀察各冊名詞佔比的變化,則可以發現名詞佔比是逐冊攀 升;而動詞佔比除了第一冊最低,從第二冊開始都維持在 0.01 的範圍上下修正。

此外,教科書的名動比皆低於母語和中介語語料庫。母語語料庫和中介語語料 庫的名詞佔比高於教科書,且動詞佔比低於教科書。

接著,以 0.05 為標準的話,母語碩博士論文摘要(1.753)稍高於二語碩博 士論文摘要(1.698)的名動比,但不太明顯。同時,和母語語料庫相比,碩博 士論文摘要的名動比都比較低。碩博士論文摘要的文章類型單一,且主要為學 術論文可能是和母語語料庫存在差異的原因。

三、定義三:(普通名詞、專有名稱、代名詞)/(動作動詞、

性質動詞、分類動詞、是、有、狀態動詞、形容詞)

將個別語料庫的詞形,按定義三計算得到的名詞佔比、動詞佔比和名動比 的呈現如圖 2。

圖 3:定義二(母群)(詞形)的名詞佔比、動詞佔比和名動比

首先,在名詞/謂語定義(Tardif 版,含專有名詞)下,母語的名動比

(1.788)高於中介語(1.296)。同樣的,華語二語者所使用的名詞比華語母語 者少,使用的動詞(謂語)則比華語母語者略多。

其次,教科書除了第一冊(0.919)外,其餘各冊的名動比存在隨著冊數越 高,名動比越高的趨勢。觀察各冊名詞佔比的變化,則可以發現名詞佔比是逐 冊攀升,第二冊和第三冊之間有較大的差異;而動詞佔比除了第一冊(0.316)

最低,從第二冊到第五冊都有 0.38 的佔比,第六冊又下降至 0.36。此外,教科 書的名動比皆低於母語和中介語語料庫。母語語料庫和中介語語料庫的名詞佔 比高於教科書。而母語語料庫的動詞佔比都低於教科書各冊;中介語語料庫的 情況類似,除了教科書第一冊。

接著,母語碩博士論文摘要(1.342)和二語碩博士論文摘要(1.306)的名 動比則沒有明顯的差異。同時,和華語語料庫相比,碩博士論文摘要的名動比 都比較低。碩博士論文摘要的文章類型單一,且主要為學術論文可能是和母語 語料庫存在差異的原因。

圖 4:定義三(母群)(詞形)的名詞佔比、動詞佔比和名動比

四、定義四:(普通名詞)/(動作動詞、性質動詞、分類動詞、

狀態動詞、形容詞)

將個別語料庫的詞形,按定義四計算得到的名詞佔比、動詞佔比和名動比 的呈現如圖 5。

首先,在名詞/謂語定義(CDI 版,不含專有名詞)下,母語的名動比

(1.263)高於中介語(1.148)。語料顯示,華語二語者所使用的名詞和動詞都 比華語母語者多。

其次,教科書除了第一冊(0.774)外,其餘各冊的名動比存在隨著冊數越 高,名動比越高的趨勢。觀察各冊名詞佔比的變化,則可以發現名詞佔比是逐 冊攀升,第二冊和第三冊之間有較大的差異;而動詞佔比的情況約等同定義三。

此外,教科書的名動比皆低於母語和中介語語料庫。母語語料庫和中介語語料 庫的名詞佔比高於教科書。而母語語料庫的動詞佔比都低於教科書各冊;中介 語語料庫的情況類似,除了教科書第一冊。

接著,以 0.05 為標準的話,母語碩博士論文摘要(1.279)和二語碩博士論 文摘要(1.251)的名動比則沒有明顯的差異。同時,和華語語料庫相比,碩博 士論文摘要的名動比都比較低。碩博士論文摘要的文章類型單一,且主要為學 術論文可能是和母語語料庫和存在差異的原因。

圖 5:定義四(母群)(詞形)的名詞佔比、動詞佔比和名動比

五、四個定義間的比較

四個定義間的名詞佔比、動詞佔比和名動比有類似的趨勢,但也有個別的 差異。首先,不論在哪一個定義下,母語的名動比皆高於高於中介語。同時,

不同定義間,華語母語者和二語者的名詞佔比和動詞佔比也有類似的趨勢,即 華語母語者的名詞佔比高於或等於華語二語者,而動詞佔比則是低於或等於華 語二語者。

其次,不論哪一個定義下,教科書都呈現上升的趨勢。從第二冊到第五冊 的名動比都表現了逐冊上升的趨勢。其中,名詞佔比逐冊上升,而動詞佔比或 者上下波動或者下降,但兩者的升降幅度都不大。第一冊的名動比高於第二冊 的情況類似於幼兒詞彙發展初期的名詞優勢。而第六冊的名動比只有在定義二

其次,不論哪一個定義下,教科書都呈現上升的趨勢。從第二冊到第五冊 的名動比都表現了逐冊上升的趨勢。其中,名詞佔比逐冊上升,而動詞佔比或 者上下波動或者下降,但兩者的升降幅度都不大。第一冊的名動比高於第二冊 的情況類似於幼兒詞彙發展初期的名詞優勢。而第六冊的名動比只有在定義二