• 沒有找到結果。

實驗語料來源與蒐集

第三章 研究方法

第一節 實驗語料之蒐集與分析結果

一、 實驗語料來源與蒐集

本文的語料來源為中央研究院(Academia Sinica)所建置的現代漢語 平衡語料庫(Academic Sinica Balanced Corpus of Modern Chinese)與中文 十億詞語料庫(Chinese GigaWord Corpus)。本文選擇這兩個語料庫,是因 為此兩個語料庫為目前主要使用的語料庫,並包括口語和書面語,如此可 以盡可能的分析到各個層面的語料。此兩個語料方式的特色和字數如表 三-1 整理。另外,若有此兩個語料庫不足處,亦使用部分網路語料15作為 輔助搭配。

15若語料庫內的語料不足,本文將以關鍵詞(「做」字詞)到 google 上進行搜尋,並以 搜尋到的句子作為本文的例句。

表 三-1 語料庫比較表

首先,依據中文詞彙網路(Chinese wordnet)對於詞彙定義的研究,「做」

共有 20 個不同的語義。從以下的條列中可以看出,「做」的意義由與其後

第三章 研究方法

35

11. 判斷並陳述。例:做具體評論。

12. 拿定主意行動。例:做決定。

13. 睡眠時腦部活動產生記憶與知覺。例:做一個夢。

14. 對未實現的事物有期望。例:做「品牌」夢。

15. 對未實現的事物有不切實際的期望。例:做白日夢。

16. 進行性行為。例:做愛。

17. 使動物失去生命。例:做掉。

18. 用負面手段達特定目的。例:做手腳。

19. 裝出比實際狀況更好的狀態。例:做表面功夫。

20. 喻因做特定事件而造成特定結果。例:做孽。

從以上可看出,「做」的意義是由其所在的句子決定,依據句型的差 異和其後所搭配的詞語而有完全不同的意義。例如,「做周年慶」和「做 康乃馨」中,與「做」搭配的「周年慶」和「康乃馨」皆為名詞,然而,

前者為活動,而後者為物品,「做」的意義受兩者的影響,在兩個不同的 詞組中分別表「舉辦」和「製作」的意義。

本文將根據詞彙歧義和結構歧義兩種不同的類型,個別分析其語料,

尋找具有歧義的詞彙或詞組。

(二) 詞彙歧義

本文依據詞彙歧義的定義,即詞彙歧義是因多義詞的意義無法確定所 產生,並依據《教育部國語字典》與中文詞彙網路,逐一檢視所收集語料 中的詞彙或詞組是否為多義詞。找到具多義的「做」字詞以後,便於句中 檢視其導致歧義的情形,並與兩位母語者進行確認,依據頻率的高低挑選 具有代表性的詞彙。

首先,筆者找出台灣地區較常使用的「做」字詞,作為接下來實驗設 計的基礎。故從中央研究院平衡語料庫18中,以搜尋的方式找到所有具「做」

的句子,共 11604 筆。接著,從 11604 筆語料中,將所有的「做」字詞一 一列出,並進行初步分類與頻率統計。分類的原則為根據齊麗娟(2008)

中研究關於「做」的語法形式,除單獨使用外,依其後所搭配的詞,分為

「做+賓語」、「做+補語+賓語」、「做+補語」三種,其句法與例子見表 三-2。

表 三-2 「做」作為泛義動詞時的句法特徵,整理自齊麗娟(2008)

句法 分類 例子

帶賓語情況 名詞性賓語 做壞事、做未亡人、做皇帝 動詞性賓語 做檢討、做準備

代詞性賓語 做啥、做什麼 做+補語+賓語 結果補語 做完飯

趨向補語 做出什麼好活 可能補語 做得起

數量補語 做了一世的人,

做+補語 結果補語 做好了 趨向補語 做起來 數量補語 做好幾回

狀態補語 做得更好、做得對 可能補語 做不到

本文以此架構為基礎,初步將「做」字詞分為這三類,並逐筆分析。

其中,「做」單獨使用為 1496 筆,為 13%;「做+賓語」,共 9959 筆,佔 85%;「做+補語」與「做+補語+賓語」則共有 149 筆,佔 1%。整理如 下表 三-3。

18由於此處的目的僅是要分析出常用的「做」字詞,受限於時間,僅使用平衡語料庫,

未將中文十億詞語料庫納入。

第三章 研究方法

37

表 三-3「做」字詞的分類與筆數

類別 筆數 比例

單獨使用 1496 13%

「做+賓語」 9959 85%

「做+補語」 145 1%

「做+補語+賓語」 4 0.0003%

總數 11604 100%

中央研究院平衡語料庫中的 11604 筆語料中,有 9959 筆「做+賓語」

的語料。刪除掉重複的語料後,參考錢乃榮(2002)對於詞彙和詞組的區 別標準19,分析「做+賓語」的結構,共可分析出 3354 個「做+詞組」和 844 個「做+詞彙」。「做+詞組」例如「做類似服務」、「做簡單的結論」,「做

+詞彙」例如「做努力」、「做自己」。

接著,本文認為「做+詞組」由於其結構包含修飾的詞語,如量詞、

形容詞、副詞等,相對於「做+詞彙」而言,提供的語境較為充足,經初 步觀察與歸納後,形成歧義的機會較低。例如,「做翻譯工作」、「做學術 研究」等。而在「做+詞彙」的 844 個詞彙中,本文將此 844 個詞彙一一 輸入教育部國語詞典和中文詞彙網路(Wordnet)20,將有兩個意義以上的 詞彙挑出,共分析出 7 個多義詞,見表 三-4。接著,本文將初步分析的七 類「做」字詞結果進一步在十億詞語料庫搜尋後,發現「做人」的筆數最 高,為 2929 筆,其後依次為「做文章」、「做夢」、「做功課」、「做遊戲」、

「做大」、「做臉」等。

19詞彙的語言結構不能拆開、語音沒有停頓、意義有單一性者;詞組的能拆開、語音可 以停頓、意義是兩個詞意義的合成詞彙,即為詞組。舉例而言,詞彙如「黑板」,詞組 如「雨雪」。

20中文詞彙網路為黃居仁在詞彙語意學(lexical semantics)理論與知識本體(ontology)

架構基礎上構建的網站,網站內共處理 5600 個詞形(即詞語的書寫形式)和 13160 個 詞義。

表 三-4 七類「做」字詞於十億語料庫21中之分佈

詞彙 做人 做文章 做夢 做功課 做遊戲 做大 做臉 總數 筆數 2929 1181 880 306 97 66 63 5522 比例 53% 21% 16% 6% 2% 1% 1% 100%

筆者檢視此七個詞的句子發現較高比例的五個「做」字詞皆會導致歧 義,包括「做人」、「做文章」、「做夢」、「做功課」、「做遊戲」。舉例而言,

句(30)可解讀為說話者要求聽話者在行事為人上或生小孩方面多多努力;

句(31)可解釋為睡覺時大腦的活動或對於未來的期待;句(32)可解釋 為寫作業、準備某些事情;句(33)可解釋為寫文章或擴大事態。句(36)

則可解釋為一起玩遊戲或製作遊戲。另外,「做大」和「做臉」由於未發 現歧義句,故不加以討論實驗。

(30)兒子無法再做人。(為人處世/生小孩) (十億詞語料庫)

(31)請允許我繼續做夢。(睡覺時大腦的活動/期待)(十億詞語料庫)

(32)要多做功課。(寫作業/事前準備/宗教徒例行活動)(十億詞語料庫)

(33)曾經有香港媒體以此做文章。(寫文章/擴大事態)(十億詞語料庫)

(34)一起來做遊戲吧。(玩遊戲/製作遊戲) (網路語料)

綜上所述,本文從平衡語料庫中蒐集 11604 筆「做」字詞的語料,並 從其中篩出七個多義詞;接著,從此七個多義詞的語料(包括平衡語料庫 與十億詞語料庫)中,篩選出可形成歧義句的「做」字詞,包括「做人」、

「做夢」、「做功課」、「做文章」、「做遊戲」。

(三) 結構歧義

漢語中的結構歧義共可分為四種,經由語料庫整理歸納後發現,與動

21此處分析的語料庫包含現代漢語十億詞語料庫(gigaword all)和現代漢語平衡語料庫

(sinica)。

第三章 研究方法

可指涉「擔任編輯業的編輯人員」或「正在編輯某項事物」。句的兩個意 義分別為「撰寫書面報告」和「進行口頭報告」。

(35)他在做編輯。(V:編輯某物/N:擔任編輯行業)(網路語料)

(36)他跑到北京大學去做報告。(V :做口頭報告/N:寫書面報告)

(平衡語料庫)

本文將語料庫中具有相同現象的語料依照其意義的不同進行分類之 後,初步可將語料分為三類。三個種類的其中一個意義皆是虛化動詞的用 法,指進行某個動作,「做」本身無特定的意義。另一個意義則分別是擔 任職業或身分、當作、撰寫。其中,解釋為「擔任職業或身分」、「撰寫」

的「做」是動詞,「當作」亦為動詞,見表 三-6。

表 三-6「做」結構歧義之詞性轉變於語料庫中的分類

意義1 意義 2 詞彙 詞彙數量

進行動作 擔 任 職 業 或 身分

做領導、做編輯、做評審、做裁縫、

做廣播、做翻譯、做直銷、做外銷

8 進行動作 當作 做證明、做號召、做補貼、做儲備、

做報復、做示範、做擔保、做賠償、

做考核、做註解、做記錄

11

進行動作 撰寫 做報告 1

總數 20

在虛化動詞與「擔任職業或身分」的意義時,後面的詞彙通常某種職 業或身份。例如,句(37)、(38)、(39)由於詞彙詞性改變,句法結構也 不相同,皆有兩種不同的解釋意義。句(37)的動詞詞組「做裁縫」可解 釋為動作「進行裁縫(V)」,其二為「擔任裁縫師(N)」;例句(38)的「做 領導」有兩種語義:「擔任領導者」或動詞「領導」(V);例句(39)則可 以解釋為「進行評審(V)」和「擔任評審員(N)」。

(37)誰說爸爸不能做裁縫?(裁縫/當裁縫師) (網路語料)

第三章 研究方法

41

(38)廖永來勉放開胸懷做領導。(領導/當領導者)(十億詞語料庫)

(39)邀請學者、專家來做評審。(評審/當評審員)(十億詞語料庫)

動詞「做」其後賓語詞性改變形成的歧義為「進行某動作(V)」或「作 為某物(N)」。例如,句(40)可解釋為「以 A 做 B」,「做」為介詞「當 作」之義,而 A(專家、消費者的名義)和 B(證明)在這個句式中為同 位語;第二個意義為「透過 A(專家、消費者的名義)證明某些事情」,「做」

為虛化動詞,而「補貼」為動詞。句(41)中的「補貼」一詞作為動詞和 名詞的語義略有差別,若「補貼」作為動詞,那麼補貼之物不一定為「大 量資金」,若「補貼」作為名詞,那麼「補貼的內容」與「大量資金」相 當於同位語。

(40)使用專家、消費者的名義和形象做號召。 (十億詞語料庫)

(41)不但要拿出大量資金做補貼。 (十億詞語料庫)

另外一個種類為「虛化動詞」與「寫作」的意義轉變。如句(42)有 兩個意義,可能為「寫書面報告」和「進行口頭報告」。口頭報告的意義,

其語言形式為「虛化動詞+V」,而「寫書面報告」的意義,其語言形式則 為「V+書面報告」。

(42)老師應先教導同學如何做報告。 (十億詞語料庫)

句(43)、句(44)、句(45)這兩種意義可透過搭配詞「當場」、「國 大」或句法「向…報告」等詞彙而產生歧義消解。這必須視聽話者的背景 而定在母語者的認知裡,一般在「國大」裡的行為是官員向立法委員做口

頭報告,而非撰寫書面報告的場所。句(43)的「當場」具有即時性,口 頭報告的語義較為接近。「撰寫書面報告」可由地點判斷其語義。例如句

(46)和句(47),「回家」和「圖書館」在認知上較不可能是做口頭報告,

(46)和句(47),「回家」和「圖書館」在認知上較不可能是做口頭報告,

相關文件