• 沒有找到結果。

近義詞語及詞群之範圍訂定及語料來源

第三章 研究方法

第二節 近義詞語及詞群之範圍訂定及語料來源

本節說明近義詞群選取的範圍、語料來源及簡介相關語料庫之內容及特 色。選取的範圍主要參照《詞林》,並以「同義詞詞林檢索軟體」為近義詞 群類別之查詢工具,語料來源取自於中央研究院的「平衡語料庫」;除此,

有關詞素及賓語的類別判定,及各詞語相關語境,主要參酌「一詞泛讀語料 庫」的簡繁例句,另因上述「平衡語料庫」的語料僅止於 2007 年,部分詞 語呈現不同的搭配語料時,則參考聯合報「全文報紙資料庫」。

一、近義詞群選取:「同義詞詞林檢索軟體」

鄭錦全(2007b) 進一步參照《同義詞詞林》的語義分類系統,建立「同 義詞詞林檢索軟體」(以下稱「詞林檢索軟體」),「詞林檢索軟體」同列 於「一詞泛讀語料庫」功能,不僅能迅速查詢單一詞語的所有用法的語義分 類,還搭配「針對一詞,廣泛閱讀」數位學習網站(鄭錦全等,2005)(以 下簡稱「一詞泛讀語料庫」,請參考本節第二部分語料來源),供漢語學習 者不同於以往的書籍學習方式。

「詞林檢索軟體」開發時刪減古語,增加台灣常用詞語,同時具有詞類、

詞頻、簡繁例句的教學參考,兼具近義詞語及詞群的分類功能,在「愛」字 詞群研究的分類上即以此為主要查詢工具,相關近義詞語的選取方式,同時 對照《詞林》及「詞林檢索軟體」,設定範圍,篩選主要分析的近義詞群。

原《詞林》中所列出小類「愛、喜歡」的分段近義詞群如下,第一個字 為標題詞,屬於頻率較高的用詞:

表 三-12《詞林》小類「愛、喜歡」的近義詞群

標題詞 詞 群

喜歡 喜愛、喜好、歡喜、愛慕、愛好、欣賞、稀罕、好、愛、喜、

嗜、好尚、愛不釋手

愛 喜愛、憐愛、心愛、鍾愛、友愛、熱愛、惠愛、疼愛、酷愛、

疼、慈、愛慕、嚮慕、老牛舐犢、惺惺惜惺惺 戀 愛戀、戀愛、熱戀

溺愛 偏愛、寵愛、寵倖、近倖、寵、倖、嬌、嬌慣、慣 傾心 動情、鍾情、懷春、一往情深、一見鍾情、墜入情網

進一步查詢「詞林檢索軟體」「愛」字義項類別的群聚,共分為四個義項,

分屬三個【心理活動】下的小類及【關聯】類,如下:

圖 三-5「詞林檢索軟體」「愛」字義項分類表

本文強調漢語的構詞特性分析,並著眼於心理動詞「愛」字相關詞語,

主要以含有「愛」字的雙字複合詞為主,因此先刪除《詞林》中非動詞之詞 語,為「心愛、友愛」、古詞、四字詞以上詞語及不含「愛」字的詞語,暫 得出下列 13 個近義詞語:「喜愛、愛慕、愛好、憐愛、鍾愛、熱愛、疼愛、

酷愛、愛戀、戀愛、溺愛、偏愛、寵愛」。除上述的「愛」字詞群,另有「愛」

字詞素的「愛惜」一詞,屬於「可惜、捨得」一類,多本一語者辭典的「愛」

字語義(請見第四章多義詞分析),都將「愛惜」、「愛護」一詞列入「愛」

字義項,因此將「愛惜」、「愛護」納入討論。而第四個「愛」字義項【關 聯】類不屬於【心理活動】類別,同一類的詞群中也無「愛」字詞素的詞語,

因此只出現於第四章「愛」字多義詞內容分析,至此「愛」字的前三個義項 所包括的近義詞群共 15 個詞語,主要為「愛慕、愛好、喜愛、憐愛、鍾愛、

熱愛、疼愛、酷愛、愛戀、戀愛、溺愛、偏愛、寵愛、愛惜、愛護」作為第

五章的討論詞群。

二、語料來源

本論文所使用的語料有三,主要論證的語料來源為(一)中央研究院「現 代漢語平衡語料庫」。(二)「針對一詞,廣泛閱讀」數位學習網站(簡稱

「一詞泛讀語料庫」),共有三個主要功能,(1)各詞語的詞頻、詞類對 照,此功能可同時做為第六章教學應用之排序參考。(2)由簡單至繁複的 句子功能,做為相關詞語之語境判別基礎;(三)近義詞功能一欄做為本研 究構詞詞素的線上類別依據。為求補充語料不足處,同時搭配聯合報之「全 文報紙資料庫」作為輔助材料,相關介紹與比較如下表:

(一) 中央研究院「現代漢語平衡語料庫」

根據《中央研究院漢語料庫的內容與說明》,中央研究院詞庫小組

(1998)建立「現代漢語平衡語料庫」,又稱「研究院語料庫」(Sinica Coropus)

(本文通稱「平衡語料庫」),作為語料依據,該語料庫收集 1981 年至 2007 年間共 1000 萬詞的語料,內含書面語和口語語料總計超過兩千萬字,書面 語部分如評論、廣告或圖文、信函等來自各大報紙、出版社及雜誌社出版物,

主題涵蓋哲學、文學、生活、社會、科學及藝術等六大類,口語部分如劇本、

會話、演講、會議記錄約占十五萬字。該語料庫分前期與後期,前期所收文 本多數出現於 1990-1997 年,共約五百萬詞,後期文本多數出現於 2001 年 - 2007 年,是一個具完整詞類標記的漢語平衡語料庫。

本文主要以「平衡語料庫」前期語料為本,獲得「愛」字語料共計 11,796 筆具有「愛」字的句子,同時以《詞林》的近義詞群為主,分析「愛」字共 現構詞的類別、語義及相關句法結構,試圖以範疇概念進行近義詞間的特徵 分析與歸納,建構「愛」字近義詞群架構,分類方式請見第三節。

(二) 「針對一詞,廣泛閱讀」數位學習網站

「針對一詞,廣泛閱讀」數位學習網站(簡稱「一詞泛讀語料庫」)(鄭 錦全等,2005,http://elearning.ling.sinica.edu.tw),主要有兩個特色:首 先是建立以學習者為主的習得捷徑,第二是結合《詞林》的分類概念,建立 了「同義詞詞林檢索軟體」(鄭錦全,2007b),轉化了《詞林》的功能,

得以線上快速檢索特定詞語的詞頻、詞類、例句及相關的近義詞群。語料庫 是基於學習者能夠自動習得詞彙用法的理念(鄭錦全,1998a;1998b;2007b;

Cheng, 2004;Cheng et al., 2004),同時希望藉由電腦創造語言環境,讓學 習者針對某個詞語,利用上下文的語境及大量閱讀後,以「形成綜合性的語 感」,後者「詞林檢索軟體」的應用則是提供線上查詢近義詞群參考,作為 該詞練習時可替換或觀察的相似語詞,鄭錦全以「溺愛」一詞為例,提供「一 詞泛讀語料庫」相關特色與功能。

一是輸入關鍵詞,可查詢該詞的詞頻、詞類、解釋和近義詞類別(見下 圖 三-6)。圖中的上半部可以檢索詞語的詞頻和詞類,讀者可以找到「溺 愛」有兩個詞類,做為動詞時,詞頻為 8,做為名詞時,詞頻為 1。按入右 方「近義詞」欄會出現圖中下半部的近義詞群,此模式即為前述提到的《詞 林》大、中、小類、組詞、詞群歸屬。該詞語的分類格式以五個語義層次區 分,從個別的近義詞語列舉,再依次進入最大涵蓋的範圍,每個層次間以「/」

區分,五個語義排列方式則由最小的單位至最大的範圍分別代表「近義詞群 / 標題詞 / 小類 / 中類 / 大類」,如此可以同時讓讀者觀察該類詞語和一 般人對於該詞的歸屬類別,還能夠選擇相似的近義詞語替換。從下圖「溺愛」

的範例觀察,讀者根據其分類及相關詞群可以推論「偏愛、寵愛、溺愛」等 詞屬於近義詞群,「愛」字屬於標題詞,「喜歡、愛」字屬於小類,此類詞 群在中類和大類上都屬於【心理活動】類別。

圖 三-6 「溺愛」一詞的詞頻、詞類、及近義詞類別

接著於第二欄按下「閱讀--由簡入繁」按鍵,可以看到例句由短句轉為 長句的排列,目的是為了提供學習者按自身的程度深淺,控制自己的學習進

度,除了同時間學習與該詞語相關的難易句子,還可以觀察語境及共現詞,

此模式對於母語者而言差異不大,卻間接地建立了數位學習或教學的閱讀策 略,即學習者能夠利用同時閱讀大量和關鍵詞相關的材料,才能綜合出詞語 的特性,此所謂「綜合性的語感」,進而學到該詞的用法,主要強調的便是 以學習者為主的習得理念,即藉由同樣的詞語主題大量、反覆練習,在短時 間內增加熟練度,建立二語學習的捷徑。

鄭錦全以「溺愛」一詞為例(如圖 三-7),提出例句中常有「祖父母、

父母、子女、孫子(女)」等相關詞彙重複出現,換言之「溺愛」一詞不僅 隱含著家庭成員的關係,還只能使用在家庭的語境,其他師生或職務上下的 關係不適用於此,也同時顯示共現詞和語境的概念隱含於詞語之間,對於母 語人士來說,這些詞語的隱含義早已成了直覺,不會發生搭配上或語境錯用 的問題,但對於漢語學習者而言,因為缺乏語感,很難對於所使用的詞語在 搭配或語境上明確地認定對錯,如果在學習時也針對各詞語提供一套較為清 楚的使用規則,也許能夠減少猜測或彌補學習時的不確定因素。

圖 三-7「溺愛」一詞由簡入繁語句查詢

另一方面,根據上述的共現詞語現象,母語者的聯想測試也作為檢測的 觀察,主要是查詢與一般母語者的想法是否吻合,結果顯示「溺愛」一詞不 僅和上述的家庭成員相關,還與「寵物」的詞語搭配,比照原來「一詞泛讀 語料庫」「溺愛」的家庭屬性,但「寵物」一詞當時並未出現,可推論「溺 愛」詞語近幾年來已經產生了社會意義的動態關係,為觀察此類的現象,也

同時將持續新增、具動態性質的「全文報紙資料庫」(http://udndata.com/)

做為輔助,觀察愛類下的詞語改變。

本研究主要基於上述大類的歸屬類別,以提供特定的參考架構,做為各 詞素及詞語類別的考察。除了第四章「愛」字屬於《詞林》【心理活動】的 類別外,第五章的近義詞群分析主要以「詞林檢索軟體」為線上查詢工具,

無論是討論各單詞詞素或賓語類別,皆以《詞林》的類別為主,請見第五章 分析。

(三) 聯合報之「全文報紙資料庫」

第三類則為聯合報的「全文報紙資料庫」,該資料庫收錄了聯合報系的 所有報紙數位化資料,同時可依據時間、報紙型態進行線上關鍵字查詢,可 利用搜尋引擎查詢不同的報導,藉以找出報紙版面及全文內容,見圖 三-8。

圖 三-8 聯合報之「全文報紙資料庫」介面

由於語言經常處於動態的變化,新聞報導時時可見到新潮或外來語,甚 至出現了不同的共現詞,本語料庫藉以補充「平衡語料庫」未涵蓋之內容,

由於語言經常處於動態的變化,新聞報導時時可見到新潮或外來語,甚 至出現了不同的共現詞,本語料庫藉以補充「平衡語料庫」未涵蓋之內容,