• 沒有找到結果。

第一章   緒論

1.3   研究資料

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4

現往往會包含著不同的屬性,例如:可能性、或然性、能力、義務、認知……等。

而本文所討論的情態動詞即是指用來傳達具有情態意涵的詞語。

此外,動詞為漢語中表示動作、行為、變化、存在或意願的詞。在大多數的漢 語文句中,主謂句通常以主語加述語的型態出現為主,而述語的主軸又尤以動詞為 重,故若我們想要更深入的探究文本內涵,使用動詞作為分析文本的元素,相信對 文本的結構解析會有一定程度的進展。

在不同的文本資料中,相同的主題都有可能會因為作者寫作的風格相異或是聚 焦的人、事、物不同造成用字遣詞、語氣以及立場上的差別,更遑論討論不相同的 主題或焦點。然而是否能夠有一個較為通用性的方法能夠粗略地將文本與文本之間 稍微區隔開以便接續下去的研究工作是本研究想要探討的議題。

1.3   研究資料

在實驗資料的部分本研究採用中央研究院漢語平衡語料庫、自由中國雜誌、台 灣新生報為實驗資料,其中台灣新生報涵蓋日期為1947 年 2 月 28 日至 1947 年 5 月15 日,中間不包含 1947 年 3 月 10 日(以下研究實驗提及台灣新生報時同此,

不另贅述),中央研究院漢語平衡語料庫全數作為一個文本之外也可以依照屬性分 類過後的部分文本作為實驗用的資料,用這些文本來檢視本研究實驗之單詞指標、

雙詞指標、三詞指標是否可行。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5

1.3.1   台灣新生報

本研究所使用的資料之一為來自國立政治大學新聞系林元輝教授率同從事新聞 研究之博士生共同籌劃、蒐集、整理事件發生前後官方及民營報紙的相關報導,彙 編成專書的《二二八事件臺灣本地新聞史料彙編》,其真實呈現台灣戰後政治、經 濟、社會、文化等背景與官民媒體對屠殺事件不同面向之報導與觀點。

在實驗資料的部分,彙集了1947 年二二八事件發生後台灣本地的相關新聞報 導,網羅《台灣新生報》、《和平日報》、《重建日報》、《民報》、《人民導 報》、《大明報》、《興臺日報》、《中外日報》、《中華日報》及《警備總部公 報或佈告》,收錄時間為事件引爆點翌日之1947 年 2 月 28 日起,至 1947 年 5 月 15 日統治者清鄉結束止,全篇約 88 萬字。

除了《警備總部公報或佈告》是屬於政府公告外其他都是新聞報刊,其中可以 根據發報單位大致上將報刊分為官營報刊或者是民營報刊,像《中華日報》、《台 灣新生報》、《和平日報》就是屬於官營報刊,其餘都為民營報刊,各個報刊每天 刊登的新聞少則一兩則,多則數十則,收錄時間範圍內全程出報者只有中國國民黨 臺灣省黨部機關報的《中華日報》,《警備總部公報或佈告》、《台灣新生報》則 是於3 月 10 日停刊一日,至於民間各報都於 3 月 8、9 兩日遭毀,故所收錄的民報 均為三月八日前民營報紙之報導,總計收《台灣新生報》報導約43 萬字、《中華 日報》約24 萬字、《和平日報》三月間新聞報導約 10 萬 5,000 字、當時《警備總

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6

部公報或佈告》為42 則大約 12,207 字,而民營報紙合計不及十萬字,若嚴謹不計 國民黨的外圍刊物《重建日報》,則名符其實的民間報紙新聞僅有82,113 字。

在二二八事件臺灣本地新聞史料彙編中,由於許多報刊並無完整紀錄整個事件 的始末,因此有資料量過少的因素,故本研究將使用從1947 年 2 月 28 日至 1947 年5 月 15 日有完整報導二二八事件的台灣新生報史料文本作為其中一個比較的研 究資料。台灣新生報在1947 年 3 月 10 日停刊一日,而台灣新生報在停刊前後的報 導角度迥然不同,在停刊前較為真實的呈現事件發生當下,人民與政府所採取的行 動與反應,包含指責查緝私煙的人員攜帶槍械並開槍傷人;然而在停刊一日之後,

台灣新生報在報導的態度轉而批判民眾滋事、指責人民的行為是無理的抗爭行為。

1.3.2   自由中國雜誌

本研究所使用的資料之二為胡適、雷震等人於1949 年 11 月創辦的自由中國雜 誌,自由中國雜誌以新聞自由、言論自由的基本人權為基礎,經由政治的論述,宣 揚民主憲政之相關理念,在當時國民黨戒嚴體制之下給予後起的台灣黨外民主運動 相當大的思想啟發,雜誌原本旨在希望藉由任用自由派人物以改善政府在人民心中 較為刻板的印象;此外在國民黨實施黨改造後,強人威權政治體制逐漸成形、鞏 固。黨內相較之下較為自由派的政治人物也對於蔣中正的政策有些微詞,逐漸離開 握有權力核心的國民黨。於此,自由中國雜誌的編輯風格也在無形中改變,以往對

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

7

於共產主義的批評愈來愈少,反之在檢討台灣內部政治民生問題之聲逐漸壯大,自 由中國雜誌同時也批評國民黨政府,因此和執政當局的關係逐漸惡化。

實驗資料的部分,自由中國雜誌由國立政治大學雷震研究中心提供,共彙集了 自由中國雜誌自1949 年 11 月至 1960 年 9 月,共 23 卷又 5 期,共計 260 本,3628 篇。其中,自由中國雜誌除了主要為新聞自由、言論自由等較為政治性議題的論述 外,亦有一欄專為刊登文藝類文章的文藝欄,文藝類別之文章共有478 篇,佔總文 章篇數的13%,因本研究主要將重點放在政治性議題的文章,若不將文藝類別文章 排除可能會模糊政治性文章的焦點,故以下提及之自由中國雜誌皆為已排除文藝類 之文本,實驗資料也是使用已排除文藝類之自由中國雜誌,不另行註解。

1.3.3   中央研究院漢語平衡語料庫

本研究所使用的資料之三為中央研究院漢語平衡語料庫(簡稱為Sinica

Corpus)為一包含一千多萬目詞的帶標記平衡語料庫。語料庫中每個文句都依詞為 單位斷開,並標示每個詞彙的詞類標記。語料的蒐集也盡量做到平均分配在不同的 主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為 1981 年到 2007 年之間的文章。語料庫共有 19,247 篇文章;1,396,133 句數;

11,245,330 個詞數 (word token) ;239,598 個詞形 (word type);17,554,089 個字數 (character token)。其中,平衡語料庫又依照六大不同的屬性階層將整個平衡語料庫

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

8

的文章做更細的分類,本實驗取其中“主題”、“媒體”,兩個屬性內的分類作為 比較的文本。如下表1.3.1。

文本 詞數 篇數 比例

中央研究院 平衡語料庫

全文

11,196,602 19,247 N/A

文學 2,244,552 2,525 20%

生活 2,253,090 5,461 20%

社會 3,628,532 7,466 32%

科學 1,132,369 1,482 10%

哲學 1,129,539 1,378 10%

藝術 849,182 935 8%

報紙 4,452,290 12,335 40%

一般雜誌 2,542,289 1,978 23%

表 1.3.1、中央研究院漢語平衡語料庫文本

文本 詞數 篇數

台灣新生報 327,403 自由中國雜誌

排除文藝篇 8,246,147 3,150

表 1.3.2、台灣新生報與自由中國雜誌排除文藝篇文本

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

9