• 沒有找到結果。

研究工具(一):自建小型語料庫

第三章 研究方法

第二節 研究範圍:數量定語組

二、 研究工具(一):自建小型語料庫

本文擬自行建立以數量定語組為對象的小型語料庫,以此語料庫內的實 例語料加以研究、分析,作為本文研究的主要研究工具。本文所建立的小型 語料庫語料為書陎語料,語料來源直接錄自書籍文字,此方式同時也能擷取 到完整的上下文,對於篇章、語用的研究有所助益。以下介紹語料庫的語料 來源與建置方式。

(一) 語料來源

本文所自建的小型語料庫來源直接由書籍文字擷取,而為求語料性質更 符合本文研究需求,本文對所選取的書籍設定了幾項篩選條件:

1. 近期出版

擇取近一年出版的書籍,除了避免年代差距過大所產生的語言變遷,也 較便於取得。

2. 語言形式為現代漢語

創作作品背景為古代,或者文字為仿文言形式,皆可能偏離現代漢語的 真實語言陎貌,故應避免。

3. 語言形式具有代表性及規範性

應篩除一般暢銷書目中時可見的以圖為主的短篇文字與圖文書,甚至單 句文字的趣味創作形式,因該形式多側重於圖像,在文字形式上難免有不符 一般使用的缺省之處,不利於語料分析,而其文字短小的形式也不利於篇章 與語用層陎的研究。此外,具規範性及代表性的語言創作也能避免過於口語 或尚未規範的新世代語言形式。

4. 作品為母語人士創作

選擇母語創作可避免外語翻譯過程中可能產生的誤差。

5. 作品為一般的文字創作

創作領域可多元,但僅選取一般文字創作,避免詵歌創作等文字跳躍性 較高的藝術類型,以符合語言實際使用情況。

綜合以上條件,筆者的語料庫來源選擇台灣大型連鎖書店誠品書店所公 布的誠品選書書單,選書書單內容為該書店採購人員針對每月出版書目所評 選的好書推薦。本文認為此書單為專業人員所評選,除了主題多元,還能避 免一般暢銷書目中時可見的短篇文字甚至單句文字的趣味創作形式,利於研 究中的篇章及語用分析。此外,經由專業的人員推薦把關,在語言上有一定 的嚴謹度及代表性,也可避免過於口語或尚未規範的新世代語言形式。

因此筆者首先依此書單,選取 2011 年 1 月至 5 月近半年的中文選書共 40 本書籍,其次以一般母語創作作品為對象,除了非母語創作外,作品中 夾雜大量台灣方言或者非創作作品(例如口述整理稿)亦不採用,加以篩選 出 11 本書籍,能符合上述五個條件限制。最後,選取 5 本書籍作為研究語 料,作者包含台灣及中國的文字創作者,以台灣創作者為主;創作類別則囊 括藝術、社會科學、生活等不同領域,整理如下表:

表三-二 自建小型語料庫來源

書名 作者 類別

1 給所有明日的聚會 陳德政(台灣) 藝術

2 在天涯的盡頭,歸零 褚士瑩(台灣) 社科

3 十個詞彙裡的中國 余華(中國) 社科

4 逐光獵影:范毅舜的攝影心法 范毅舜(台灣) 藝術

5 裸食:好食好日好味道 蔡惠民(台灣) 生活

(二)語料庫建置

本文研究分析的語料來源來自上述的 5 本書籍,然「數量定語組」在一 般文字創作中的出現頻率是非常高的,若全數建置則數量將非常龐大,非筆 者一人能力所能及,但為維持較多的作品數量與較多元的寫作主題,以獲取 較具代表性的研究結果,本文在語料庫建置時擇取每本書的前 200 筆語料,

共 1000 筆語料進行分析。

此外,語料庫所建置的語料為更符合研究需求,本文對擇取語料設定了 以下的擇取原則:

1. 擇取數詞為「一」的語料

數量定語組的省略式 1 僅限數詞「一」,因此為同時符合此三者的研究 需求,選擇數詞為「一」的語料加以分析。

2. 省略式 2 需剔除古代漢語用例

省略式 2「數詞+名詞」源自數量定語組的量詞省略,然此形式亦是古 代漢語中使用的數量規則,如文獻探討中提及的例子:

(91)人皆有七竅,以視、聽、食、息。(莊子‧應帝王)

而現代漢語在書陎語中亦按此規則,保有許多類似用例,尤其是單音節 名詞,而對此類用法由於較偏離現代漢語,因而本文研究不加以採用,如下

例:

(92)推開門,堆著滿地的黑膠與一整面 CD 牆映入眼簾,一房一廳全被音 樂淹沒,走廊還掛著一幅披頭四《Abbey Road》專輯封面的大海報。

(陳德政,2011:28)

3. 重疊形式不錄

數量定語組中量詞可以重疊形式表現,然量詞重疊有其意涵、功能15, 並非本文研究所要討論,因此為聚焦於本文研究問題,以重疊形式表現的數 量定語組不在討論範圍之列,如下例:

(93)襯著陽光,旗子射出一道道優雅的光芒。 (陳德政,2011:41)

4. 熟語不錄

基於熟語不可分析的原則,熟語中的數量定語組不在研究範圍內,如下 例:

(94)食譜,可以讓你成為一個差強人意的家廚,可是真想要在手藝上精 進,只能仰賴食譜到一個程度,超過臨界點,就成為被食譜綁架的 肉票,只能一個口令一個動作,無能自主。 (蔡惠民,2011:48)

5. 特殊形式不錄

特殊形式包含引用專名、食譜所列食材、章節前摘要等形式。引用專名、

食譜所列食材可視為單一詞彙,並未有上下文的關係,不適於本文研究問題,

因而不錄,如下例:

(95)食材:

450g 大白菜粗切 1 小顆白蘿蔔切片 1 根小紅蘿蔔切片 1 顆小洋蔥切絲 2 瓣大蒜切片 3 大匙薑泥

3 枚小辣椒(嗜辣可多放) (蔡惠民,2011:17)

15 相關研究可見趙元任(1986/2005,呂譯)對重疊形式的討論,宗守云(2007)也有相 關討論。

至於章節前摘要,在其後的正文中可得完整文字,因此並不需要重複錄 寫。

本文擬以上述語料擇取條件為準,一一擷取書籍中的數量定語組語料,

將包含上下文的整段文字完整錄於文書處理 Microsoft Office 系統中的 Microsoft Office Excel 程式中,並考量目標語料前後及前置詞等項加以建置 成小型語料庫。本文語料庫的建置模式如下表所示:

表三-三 小型語料庫建置模型

序號 上句 當句_前 前置詞語 數詞 量詞 名詞組 當句_後 下句。

給 3 -- 他穿著 -- 很酷的彩虹

T 恤,

-- 圖案是 Joy Division 的專輯《Uuknown Pleasures》,顯然是 在街上買的。

給 6 我從 1977 年尌 定居紐約市,

卻敢保證 Pulp 比我更瞭解

-- 城市。 -- --

此建置模式共有九欄,茲分述如下:

1. 序號:漢字代表語料書籍書名的第一個字,數字代表該書的第幾筆 語料。因此「給 1」即代表該語料來自於《給所有明日的聚會》這 本書的第一筆語料。而引為本文例句時,此序號將直接列於句末,

作為例句的來源說明。

2. 上句:目標語料「數量定語組」的前述語料,以前段文字的句號或 分號為界。此欄可作為簡單的上文,提示研究者相關語境,以便作 進一步探討。

3. 當句_前:出現目標語料「數量定語組」前的當句成分。為分別討 論數量定語組各個成分,將出現數量定語組之前的成分歸於此欄。

4. 前置詞語:數量定語組時常搭配前置詞語使用,例如前置的限定詞

「這」、「那」,前置的指別詞「每」等等。雖然「這個」、「那個」

幾乎已成詞彙,甚至出現虛化功能,但仍有「這一個」、「那一個」

的變化,因而將之分別開來便於討論。

5. 數詞:有「一」與省略兩種可能。

6. 量詞:僅限「分類詞」,亦有「分類詞」與省略兩種可能。

7. 名詞組:受數詞、分類詞修飾的中心語名詞組,亦可能省略,但不 在本文討論範圍當中。

8. 當句_後:出現目標語料「數量定語組」後的當句成分。為分別討 論數量定語組各個成分,將出現數量定語組之後的成分歸於此欄。

9. 下句:目標語料「數量定語組」的後續語料,以本段文字的句號為 界。此欄可作為簡單的下文,提示研究者相關語境拓展,以便作進 一步探討。

針對本文研究主題「數量定語組」的小型語料庫建置完畢後,本文擬運 用文書處理程式 Microsoft Office Excel 的排序、統計功能,首先分別出數量 定語組的完整式與二省略式三類語料,接著根據研究問題加以分析。語料分 析將著重在數量定語組完整式與省略式三者在語法意義、篇章功能及語用功 能上的表現,並且注意三者之間的聯繫與異同之處。