• 沒有找到結果。

第一章 導論

第五節 應用語料庫語言學於漢語語言學

應用共現詞於語義分析與詞語學習是本文研究句末助詞的重要方向,因 此本節將回顧語料庫語言學應用於漢語的相關搭配研究,針對漢語的搭配研 究與句末助詞分析兩方面作相關文獻探討,再回顧三篇分析漢語句末助詞與 其共現成份的文獻,試圖由前人的相關研究中汲取經驗並加以評論,作為本 文的研究起點。

語言的數位典藏是將語料庫的文本數位化並建置為電子資料庫。許多語 言相關的研究得以利用這類可檢索文字檔形式的語言數位典藏資源,從事計 量與歸納分析,從而獲得研究所需的數據與例證。例如「詞涯八千」(鄭錦 全,1998a)的結論,即是來自於應用中央研究院的數位化二十五史文本於 語言認知的研究。「詞涯八千」是指以中文為母語者,其語言符號(或字種)

數目的上限是八千。因為縱觀漢語歷代作品,各書所用字種至多只有八千個 左右,不會隨著歷代字書的字種數目遞增至數萬而按比例提高。「詞涯八千」

的理論不僅適用於中文,也適用於英文(Cheng, 2002)。因為統計兩百本 英文作品後,即便各書總詞數高達十幾萬,基本詞形的詞種也不超過八千。

上述研究即是應用語言數位典藏於語言計量研究的實例。可見數位化的語料 庫對於語言研究能提供極大方便性與重要性。

中文因為詞的界線不明顯,不同的詞類之間又無形式之別,因此分詞與 詞類標記,對中文的語言數位典藏尤為重要。若無正確的詞界劃分,檢索得 到很有可能不是想查詢的字串(鄭錦全,2007)。例如,想檢索「口服心服」

的「心服」,如果語料庫的文本沒有經過分詞處理,則可能誤將「熱心服務」

的第二、三字當作「心服」而加入檢索結果。此外,中文的詞類標記於數位 語料庫也很重要,例如作介詞的「把」與作量詞的「把」,如不能妥善作詞 類的區分,檢索時將無法分開處理以下兩句中意義完全不同的兩個「把」:

「把故事告訴他們」、「花大把鈔票」(鄭錦全,2007)。

由以上分析可知分詞與詞類標記於中文語料庫的重要性。此外,中文的 同音詞眾多,一詞多義現象很常見。例如,以「光」為關鍵詞,檢索「北京 大學現代漢語語料庫」網路版(網址:http://ccl.pku.edu.cn:8080/ccl_corpus/),

可以得到許多含有「光」字的句子。但是索引得到的結果卻把以下四種詞類 與詞義皆不同的用法並列於「光」的例句中。

(13) 吳瓊打扮得很時髦,酒吧光線幽暗,適合於談心,也適合談情說愛。

(14) 一般人都只看到我們風光的那一刻,並沒看到我們受苦的時候。

(15) 空氣乾燥,畫家村的地面一直積著厚厚的冰,樹枝光禿禿的。

(16) 那些學表演的,學唱歌的,光是專業學院的,每年就有一大批。

包含這幾個句子的語料庫,因為沒有提供詞類區分來查詢,所以無法根 據詞類作分類檢索,讀者必須以人工方式逐一判讀詞義,處理語料費時費 力。具備足夠語言知識的母語者固然能區別,以華語為外語的學習者則可能 不易分辨其差異。然而,如果先將各詞語加以標記詞類,則可以依標記的詞 類作過濾檢索。

以「全球華語文數位教與學資源中心」(鄭錦全等,2005)網站為例,

(網址:http://elearning.ling.sinica.edu.tw/)由於以具有詞類標記的「中研院 平衡語料庫」(黃居仁和陳克健,1995)為檢索來源,因而可以用關鍵詞附 加詞類標記作為索引詞串,以此篩選包含特定詞類關鍵詞的句子。例如,檢 索時鍵入「光(Da)」,以此字串查詢語料庫所有包含「光」作「數量副詞」

的句子,即可濾去內含名詞或形容詞的「光」,得到如下摘錄的句子:

(17) 可是 事實 上,光 有 理念 卻 是 不行 的, 因為 我們 常 看到 或 做 出與 我們 的 正面 價值 相反 的 行為。

(18) 誤會 的 反應 的確 令 小趙 難堪,光 是 抬頭紋 就 加深 了 兩 條。

(19) 辛辛苦苦 抓 幼蟲,不 光 是 為 了 計算 密度 指數,同時 還 指望 養 成 成蚊 後,再 做 病毒 分離。

因此,使用具有準確分詞及正確詞類標記的數位語料庫,對於應用語料 的相關研究殊為重要。有了具備分詞與詞類標記的語料,再配合適當的搜索 引擎,不僅可以提供語言學研究之應用,更可以作為語言教學或自學的資源。

本文先使用「全球華語文數位教與學資源中心」網站(鄭錦全等,2005)

的檢索功能,從「中研院現代漢語平衡語料庫」的語料中以句末助詞「吧、

呢」為關鍵詞檢索例句,得出分類的理念。然後由台灣師範大學向中央研究 院取得使用授權,以「現代漢語平衡語料庫」中的語料為文本,檢索出所有 句末帶有「吧、呢」的句子,然後以鄭錦全(2011)的電腦程式分別計算不 同種類句子的共現詞親疏引得以得出共現詞排序表。然後依排序表中共現詞 間的共同語義關聯歸納分析其與句末助詞的共同語義特徵,再以其各別不同 的語義特徵證明句末「吧、呢」為多義助詞,各具有三種不同的意義或功能。

第六節 應用語言數位典藏於對外華語教學

應用數位語料庫於語言學習或語言教學是一個新趨勢。「針對一詞,廣 泛閱讀」(鄭錦全,1998b;Cheng, 2004;Cheng et al., 2004;鄭錦全,2007)

的理念即是應用數位語料庫於語言學習的範例。鄭錦全(1998b)認為,習 得詞語的方式,「除了語言交際之外,需要廣泛閱讀」。因此,利用語料庫 文本的關鍵詞檢索句子並閱讀這些來源廣泛的真實語言用例,可以「針對個 別詞,大量閱讀該詞在文章裡出現的語境和跟其他詞與搭配的情形」,以此

「形成綜合性的語感」(鄭錦全,1998b)。此方式尤其適用於以漢語為第 二語言的成人學習者,因為在其詞語學習過程中,難以短時間內累積大量足 夠的語言交際經驗以獲知詞語的典型用法,也經常發生無法區別相似詞語的 困擾。如果學習者能利用數位語料庫,以所欲學習的詞語為關鍵詞檢索語料 庫,即可從中便捷地獲得學習標的詞語的大量用例。經由廣泛閱讀這些具有 上下文語境的語言實例,學習者即可不需經過耗費時日的浸淫語言情境,即 能有效率地從文本句子中歸納詞語的意義與用法。此方式不僅可用於以華語 為外語的學習者自學,也適合語言教師利用,作為教學資源(鄭錦全,2007)。

例如,在區別「豐富」與「豐盛」兩詞的差別時,檢索含有兩詞的句子,

即可大量閱讀兩個近義詞的例句,便於歸納與比較,以此得知「豐富」修飾 的名詞類別與意義範圍比「豐盛」廣。以下先後列出包含「豐富」與「豐盛」

的例句:

檢索「豐富」所得的句子:

(20) 溫和 的 氣候 使 他們 舒適,美麗 的 景色 使 他們 快樂,豐富 的 物 產 使 他們 滿足 。

(21) 所以 他 應該 是 一 個 感情 很 豐富 的 人,因為 情歌 好聽 不 好 唱,更 不 好寫。

(22) 你 絕對 不會 做出 和 現實 生活 脫節 的 想法,儘管 你 的 感性很 豐富,卻 不會 淪於 空泛 的 理想 主義。

(23) 不知不覺 間 她 會 把 她 的 音樂 知識、處世 態度 和 自助 旅行的 豐富 經驗 都 掏出來 跟 你 分享。

(24) 北投 豐富 的 硫磺 和 觀光 資源 全 遭 市府 和 相關 單位 漠視,連 建商 都 鮮少 到 當地 來 大興土木。

(25) 每 個 人 都 有 口頭禪,它 就 像 生活 中 的 潤滑劑,使 語言 世界 增加 豐富 的 色彩 。

(26) 最後,預祝 本 次 研討會 順利 成功,各位 來賓、女士、先生 都 有 豐 富 的 收獲。

(27) 人力 的 潛在 的 開發,往往 需要 用 我們 豐富 的 想像 來 挖鋤。

檢索「豐盛」所得的句子:

(28) 此時 我 倒 對於 我們 桌 上 的 豐盛 佳餚 有些 難為情。

(29) 除了 豪邁 的 飲食 習慣 外,大量、豐盛 的 食物,也 是 德國 美食 的 特色 之 一 。

(30) 這 段 話 的 意思 是:「不要 追求 吃 得 太 豐盛、住 得 太 舒服」

(31) 如果 佐 茶 的 糕點 餅 派,豐盛 繁多,足以 替代 正餐 的 功能,就 是「高 茶」。

(32) 見到 您 很 高興,張 經理 今天 專門 為 我們 準備 了 這麼 豐盛 的 宴席,十分 感謝。

(33) 晚間,如果 是 豐盛 晚宴 之後,他 喜歡 中國 茉莉 花茶,可以 清 淨 腸胃。

(34) 可是 想到 中午 有 豐盛 的 午餐,就 加緊 腳步 向 前 走。

(35) 小明 點 得 還 真 豐盛,有 漢堡、雞塊、炸雞、可樂、奶昔,小明 光 看 就 已經 流 口水 了。

「豐富」與「豐盛」雖然句法功能相似,都是狀態動詞,可以作述語也 以修飾名詞。但仔細觀察例句中,與「豐盛」搭配的詞語大都與食物有關。

其中動詞有「吃、點(菜)」,名詞則有「佳餚、糕點、餅派、宴席、午餐」

等。另一方面,與「豐富」共現的被修飾名詞則語義種類多樣,包含抽象與 實體名詞,如「物產、感情、感性、經驗、硫磺和觀光資源、色彩、收獲、

想像」。因此,以「豐富」與「豐盛」為關鍵詞搜索語料庫,再由所得句中 的共現詞分析其共同語義,即可歸納出兩者在搭配使用上的差異:「豐盛」

用於指食物;「豐富」則少用於描述食物。以上為適用大多句子的一般準則,

文本中偶而也會出現以「豐富」描述食物的例子,但因為只是少數,並不影 響通則。

(36) 解析 威基基 海灘 之所以 盛名 不 墜 的 原因,想來 除了 和煦 的 陽光、蔚藍 的 海水、潔淨 的 空氣 及 豐富 的 美食 外, 這裡 的 氣 氛 充滿 了 未婚 者 對 浪漫 的 憧憬;新婚 者 對 盟約 的 信守;已 婚 者 對 舊愛 的 再續,才 是 主因 吧!

即使有以上例外,「豐富」與「豐盛」仍然有前述描述差異的規則:後 者修飾的名詞語義限於食物類,前者修飾的名詞語義種類較不受限。對比「豐

富」與「豐盛」兩個近義詞各別共現詞的共同語義傾向,即可得出兩者在搭 配上的差異。這種觀察句共現詞以歸納比較語義異同的方法,也適於語言學 習。只要有妥善建置的數位語料庫以及有效的搜索引擎等條件配合,即能應 用於大多數詞語學習。因此,建置完善的數位語料庫與搜索工具,將可提供

富」與「豐盛」兩個近義詞各別共現詞的共同語義傾向,即可得出兩者在搭 配上的差異。這種觀察句共現詞以歸納比較語義異同的方法,也適於語言學 習。只要有妥善建置的數位語料庫以及有效的搜索引擎等條件配合,即能應 用於大多數詞語學習。因此,建置完善的數位語料庫與搜索工具,將可提供