• 沒有找到結果。

第三章 研究方法

3.1 研究工具

3.1.2 資料庫

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

59

善的詞彙語意學(lexical semantics)理論與知識本體(ontology)架構基礎上,作 為可資語言學研究的基本參考資料。

3.1.2 資料庫

語料庫的蒐集以電子語料庫為主,並非為書面紙本或口語語料,但仍建立於 真實語料上,而本研究蒐集兩種語料庫作為語料來源:

(3-1) 古漢語語料蒐集:《中央研究院漢籍電子文獻》10中的古漢語語料庫,並 涵蓋三個語料庫:

(a)《中央研究院上古漢語標記語料庫》11(後稱為《上古語料庫》) 語料涵蓋時間範圍:先秦至西漢

(b)《中央研究院中古漢語標記語料庫》12(後稱為《中古語料庫》) 語料涵蓋時間範圍:東漢魏晉南北朝

(c)《中央研究院近代漢語標記語料庫》13(後稱為《近代語料庫》) 語料涵蓋時間範圍:唐、五代之後

(3-2)現代漢語語料蒐集:《聯合知識庫》14

本研究依據古漢語語料與現代漢語語料之劃分,分別取自不同語料庫。首先,

古漢語語料取自《中央研究院漢籍電子文獻》中的古漢語語料庫,涵蓋《上古語 料庫》、《中古語料庫》與《近代語料庫》,此一古漢語語料庫是迄今最具規模的 古籍資料庫之一,包含整部二十五史、整部阮刻十三經、一千萬字的大正藏,以

10 《中央研究院漢籍電子文獻》:https://hanji.sinica.edu.tw/

11 《中央研究院上古漢語標記語料庫》:http://lingcorpus.iis.sinica.edu.tw/ancient/

12 《中央研究院中古漢語標記語料庫》:http://lingcorpus.iis.sinica.edu.tw/middle/

13 《中央研究院近代漢語標記語料庫》:http://lingcorpus.iis.sinica.edu.tw/early/

14 《聯合知識庫》:https://udndata.com/ndapp/Index

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

60

及超過兩千萬字的臺灣史料和,甚涵蓋其他典籍,合計字數一億三千四百萬字,

為具學術專業的語料庫。

現代漢語語料則是採用《聯合知識庫》作為語料庫的來源,其網路資源是於 2001 年創立,已有近十年的歷史,新聞種類包含美日頭條、政治、社會、區域

(地方、兩岸、國際)、體育、娛樂、生活、健康、財經、旅遊等各類的時事新 聞。本研究選自聯合知識庫是由於其為台灣排名第三大媒體新聞,僅次於自由時 報與蘋果日報,且該報的新聞選詞用字較為其他新聞中立,以防影響本研究分析,

因而本研究選自此語料庫作為研究來源。

根據以上的語料作為本研究的根據,再進行分析,可從實際語料情形觀察詞 義與該詞彙用法,並彙整、歸納與分析「奪」的多義性,故語料蒐集方面無任何 文體或主題的限定。

本節介紹完研究工具後,將於3.2 節歸納彙整「奪」於古漢語與現代漢語字 詞典的語意,並於3.3 節說明「奪」的語料蒐集及其分類方式。

3.2 詞義於字詞典中之整理與歸納

本小節將彙整字詞典中「奪」之語意,3.2.1 節參考三本字詞典以整理古漢語 中「奪」的語意,3.2.2 節參考五本現代漢語字詞典,整理「奪」的語意。

3.2.1 古漢語「奪」之詞義整理

本研究採用三本實體字詞典,《古漢語常用字字典》、《王力古漢語字典》與

《康熙字典》,首先,本研究欲將各古漢語辭典中的釋義加以歸納,放置表格最 後一欄,作為統整辭典之最後語意,各字詞典的義項數目將以括弧符號標註,置 於各辭典的第一列,如下表3-1。

DOI:10.6814/NCCU201900039

DOI:10.6814/NCCU201900039

Chinese Wordnet

(6)

DOI:10.6814/NCCU201900039

DOI:10.6814/NCCU201900039

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

65

典》的第二個義項,以及《中文詞彙網路》與《漢語大字典》的第三個義項,合 併於各詞典中的義項一,並定義為「強取」義,此外,將《漢語大字典》中第四 個義項與的五個義項,以及《教育部重編國語辭典修訂本》的第四個義項和《中 華語文大辭典》第四個義項合併為「削除」義,因此歸納了8 個詞義。經由古漢 語歸納義項與現代漢語歸納義項統整後,羅列出14 種義項於表 3-3。

表 3-3 辭典中「奪」之義項總歸類

古漢語歸納義項 現代漢語歸納義項 總統整義項欄 1. 強取 1. 強取 1. 強取 2. 削除 2. 削除 2. 削除 3. 爭取 3. 爭取 3. 爭取 4. 改變 4. 改變 4. 改變 5. 決定 5. 決定 5. 決定 6. 耀 6. 吸引 6. 吸引 7. 占據 7. 占據 8. 贏得 8. 贏得

古漢語歸納義項與現代漢語歸納義項相論而言,古漢語歸納義項統整6 種義項,

而現代漢語則可統整出8 種義項,故總共統整出 8 個義項。以上字詞典部分為研 究工具之一,以助語料標記時的詞義參考,故或語料中出現上述字詞典未出現之 詞義或未出現之詞義,再斟酌增刪。

3.3 語料蒐集與分類

本節將說明語料的蒐集與分類的步驟,3.3.1 節介紹蒐集語料的過程,3.3.2 說明語料的詞義分析準則。

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

66

3.3.1「奪」的語料蒐集

本研究將從《中央研究院漢籍電子文獻》中的古漢語語料庫,涵蓋《上古漢 語語料庫》、《中古語料庫》與《近代語料庫》,另外現代漢語語料則是採自《聯 合知識庫》中2018年一月至二月的所有新聞。各語料庫中,上古漢語語料共取得 419筆、中古漢語語料共677筆、近代漢語語料共876筆,及現代漢語語料共856筆,

並將蒐集好的語料放置於Excel表格中,再依據「奪」年代、篇名、內容與語意進 行分類,將蒐集到的語料進行分類後,再進一步將詞典義對應至句子中的語意。

圖 3-1「奪」於 Excel 紀錄截圖畫面

3.3.2 「奪」的語料分析

步驟一: 將單純詞與複合詞加以劃分,並統計「奪」內部結構分布情形

首先,研究「奪」於《中央研究院漢籍電子文獻》中的古漢語語料庫與《聯 合知識庫》的現代語料中單純詞與複合詞內部結構的分布情形,複合詞分為雙字 詞、三字詞與四字詞,而由於單純詞與雙字詞的劃分往往會有爭議性,故藉由《中 研院斷詞系統》中的中文剖析器,來分析該詞是否為雙字詞(如圖 3-2與圖 3-3), 如以下分別以「日本人風田奪冠」與「夢想力讓他奪金」的例句進行剖析,「奪 冠」與「奪金」一詞雖然看似都為雙字詞,但經過中文剖析器的分析後,明顯可 辨別「奪冠」的確為複合詞,而「奪金」的「奪」為單純詞。

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

67

圖3-2「奪冠」例句剖析

圖3-3「奪金」例句剖析

經由《中研院斷詞系統》中的中文剖析器辨識完複合詞後,再將各雙字詞中動補 結構的詞進行劃分,如「奪回」、「奪走」、「奪得」與「奪取」代表不同意涵,「走」

與「回」為具有方向性,故「奪回」與「奪走」屬於「趨向補語」,而「得」和

「取」則屬於「奪」後得到的結果,故「奪得」與「奪取」屬於「結果補語」,故 將此構詞語法細分後,以利雙字詞的分辨。

統計完整單純詞與複合詞的構詞後,將深入介紹研究動詞「奪」的詞義意象 圖式與語意網絡圖的分析。

步驟二: 統計詞義的分布情形

統計「奪」各辭典中所統整出義項的分布情形,劃分為四個時期,上古、中 古、近代與現代,古漢語語料取自《中央研究院漢籍電子文獻》中的古漢語語料 庫,涵蓋《上古語料庫》、《中古語料庫》與《近代語料庫》,而現代漢語語料 以《聯合知識庫》中2018年一月至二月的所有新聞中採取語料,各義項將分為單 純詞與複合詞,以得知各義項於各語料庫的分布情形,若在分析意象圖式時發現 該詞義的分布有歧異,則會再回頭修改詞義的分布。

此外,再觀察完詞義分布情形後,再觀察各詞義所承接的賓語性質的分布,

將統計單純詞與雙字詞的各詞義中「奪」所承接的賓語為具象或抽象,但雙字詞 的統計不涵蓋名詞的部分,而以動詞為主,如下例句:

(3-3) 肯卓克拉瑪奪‧

獎時表現一樣「謙遜」

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

68

(3-4) 狄希陳道:「這也有理。奪‧

他銀子的時候,胥感上與畢騰雲兩個在 那裏?」

(3-5) 王發現後一度攻擊小姨子,並奪走‧‧

她的手機砸爛。

(3-6) 三大網站為了爭奪‧‧

用戶流量和吸納付費會員。

單純詞方面,例句(3-3)「奪」為「贏得」義,後接的主體為抽象「獎項」,而

( 3-4)則為「強取」義,後接的賓語為具象的實體「銀子」,雙字詞方面,(3-5)「奪走」為「強取」義,而該奪之物的主體屬具體「手機」,而抽象方面如例 句(3-6),「爭奪」為雙字詞,而該爭奪的主體為抽象「用戶流量」。在分析主 體為具體或抽象的前提為,透過詞義分布情形所劃分的單純詞與雙字詞中,觀察 該承接的主體為具體或抽象,並統計出筆數後,再利用Excel中內建的統計系統 算出該所占的比例,並了解各詞義所承接的主體性質。

圖 3-4 「奪」承接的賓語性質

統計完整單純詞與複合詞的構詞後,以及區分各詞義與各該詞義所承接的主 體性質為具體或抽象後,將深入介紹研究動詞「奪」的詞義意象圖式與語意網絡 圖。

DOI:10.6814/NCCU201900039

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

69

步驟三: 判斷動詞「奪」的相關詞義與歸納

由於辭典的詞義的會受到不同年代學者的彙整,以致將詞義的定義上會有所 差異,為了解決詞義的會有相近意義的問題,從上表 3-1中「奪」的古漢語辭典 中的詞義與上表 3-2「奪」於現代漢語辭典中的釋義中,本研究將部分詞義歸納 於「強取」義與「削除」義中。古漢語辭典所定義的「耽誤、失去」義與「錯過」

義中的例句都指涉「奪民時」或「奪農時」,可判定為指涉同一意義,僅由於不 同年代,學者編撰的詞義時,將其賦予不同定義,但實則為相同意思,本研究欲 將「耽誤、失去」義(即「錯過」義)以及古漢語與現代漢語辭典中所提及的「勝 過」歸於「強取」義中,從例句(3-7)至(3-9)中可得知其為相同意思。

(3-7)王發現後一度攻擊小姨子,並奪‧

走她的手機砸爛。

(3-8)宋君奪‧

民時以為臺

(3-9)文在寅在開場問候便先聲奪‧ 人。

例句(3-7)明顯可得知為「強取」義,意為強取手機,而例句(3-8)與(3-9)

雖然分別意指「耽誤、失去」義(即「錯過」義)與「勝過」義,但實際上同指

「強取」義的意思,(3-8)宋平公侵占百姓耕作時間來建築樓台,此「奪」雖然 可解釋為宋平公耽誤百姓耕作時間來建築樓台或可指使百姓錯過農耕時間,但實 際上從例句可解釋由於宋平公強取百姓耕作時間,來建築樓台,才會導致耽誤或 錯過的結果,實則以「強取」義解釋較為恰當,此外,例句(3-9)中的「勝過」

義亦具「強取」義的意義,「先聲奪人」意為先張揚自己的聲勢以勝過對方的氣

義亦具「強取」義的意義,「先聲奪人」意為先張揚自己的聲勢以勝過對方的氣