第二章 文獻探討
第二節 中文詞彙特性
自從黎錦熙 1933 年在「國語文法」有意用漢語的「詞」 對等表示英語的
「word」以後,「字」和「詞」兩個述語在漢語中逐漸分工(彭澤潤,2005)。
中文「字」是形體單位,未經過處理的原始中文句子是以字(character)的序列 模式存在的。「詞」是意義的基本單位,詞(word)與字相比是一種更直接和便 捷的單位。中文分詞(Chinese word segmentation)的目的就是將文本的句子切分 成詞,使其成為慈序列的形式。文章中的「詞」是意義單位,從句子中可以整 理出詞類,我們把詞類教給學生,就是讓他們能夠很順利地將詞類回歸到句子 (鄧守信,2009)。
中文裡所說的「字」並不等同於英文的 「字」,在功能上,中文的「字」
比較接近英文的「詞素(morpheme)」,而中文詞則略等於英文的「word」(鄭 昭明,1978;羅肇錦,1993)。漢語的詞是由語素構成。語素是最小的語音與語
義結合體,是最小的語言單位 (胡裕樹,1992) 。把一個語言片段,切分到不能 再分的最小單位,就是語素。例如:
要│遵│守│交│通│安│全│生│命│才│有│保│障
這十三個字已經不能再分了,每個單位都是一個音節,並且有一定的意義,
是語音語義結合的最小單位,這就是漢語的語素了。漢語語素多為單音節,寫 出來就是一個漢字,也有雙音節或者多音節的,寫出來就是兩個或兩個以上的 漢字。
詞是比語素高一級的語言單位。有的語素可以單獨成詞,也可以與其他語 素組合成詞;有的語素不可以單獨成詞,一定要與其他語素結合方能成詞。語 素構成詞後,才能充當句法成分。將詞分類,可以用不同的標準,取決於分詞 的意義。例如:為了編輯的目的,可以將詞的意義分為動物類、植物類、藝術 類等;為了研究詞彙,可以按照詞的來源分為古語詞、外來詞及方言詞等。詞 的數量非常龐大,可使用詞性(part-of-speech)來概括一個詞在一個句子中所展 現的句法功能和意義,詞性標註(part-of-speech tagging)的目標就是在產生中文 分詞的詞序列時,給每個產生的詞標註一個詞性。(張開旭,2012)。
從自然語言的處理 (Natural language Processing)應用和理解的角度來看,
中文分詞的詞性標註是許多應用的基礎。包含句法分析、信息提取、機器翻譯 等,這些都可以從好的中文分詞詞性標註模型中獲得較正確的結果。(侯呈風,
2011;張開旭,2012)。而以自然語言理解(Natural language understanding)的 角度看來,中文分詞詞性的標註是中文理解的基礎步驟。
語法上區分詞類的目的是為了指明詞的外部結構關係,說明語言的組織規 律,因此,分類的基本根據是詞的語法功能。中文的詞彙可分為「實詞」及「虛 詞」兩大類,能單獨成為句子成分的為實詞,不能單獨成為句子成分的為虛詞,
虛詞能幫實詞成為句子或表達語氣,所以又稱功能詞。然而詞類的分類各有特 色。本研究將各家詞類分類如下表:
表 2-2-1 各家詞類定義
(胡裕樹,
一、實詞(content words):
(一)名詞(noun):凡實物的名稱,叫做名詞。在句子中常做主語和賓 語。可分為普通名詞、專有名詞和抽象名詞。
(二)動詞(verbs):凡詞指稱行為或事件者,稱為動詞。在句子中常常 當做謂語。
(三)量詞(quantifier):表示人、事物、動作或行為單位的詞。量詞是 漢語特色之一,其他語言鮮少使用。
(四)形容詞(adjectives):凡詞表示實務德性者。用來形容名詞,詞彙前 面可以加程度副詞。
(五)代詞(pronouns):具替代、指示作用的詞。可分為疑問代詞、指 示代詞及人稱代詞。
(六)數詞(numeral):表示數目的詞,通常可分成基數詞漢序數詞兩類。
(七)副詞(adverb):能表示程度、範圍、時間、可能性、否定作用等,
不能單獨指稱實物,也不會單獨出現在句子中。
二、 虛詞(function words)
(一)介詞(preposition):在名詞、代詞或名詞性詞組的前面,用來修飾 動詞或形容詞,通常是用動詞虛化而來的。
(二)連詞(conjunction):連接詞、詞組、分句和句子,並表示它們之 間的相互關係詞彙。
(三)助詞(particle):附在詞、詞組或句子後面,具輔助作用的詞彙。
(四)嘆詞(interjection):表示感嘆、呼喚和應答,不跟別的詞彙發生 結構關係。
類型學家 Baker(2003)與 Croft(2001)認為動詞、名詞和形容詞為具 有語言共性之詞類,稱為實詞,為開放性詞類,容易有新的詞語加入其中;而 虛詞為封閉性詞類。開放性詞類遠超過封閉性詞類,使用頻率亦相對提高,此
三大詞類中,形容詞在中文與英文領域上結構差異較大(高子晴,2010)。本 研究將先針對名詞、動詞及實詞重複趨勢與閱讀之相關進行探討。