第四章 實驗結果與分析
4.3 自由中國雜誌與漢語平衡語料庫全文之文本比較
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
55
4.3 自由中國雜誌與漢語平衡語料庫全文之文本比較
4.3 章節要比較的兩個文本為中央研究院漢語平衡語料庫全文以及自由中國雜 誌。其中,自由中國雜誌發行時間為1949 年至 1960 年,當時的時代背景為國民政 府播遷來台初期,自由中國雜誌的內容主要著重在政治、社會議題、自由…等,較 為嚴肅的議題,在此章節的比較中可以看到針對特定議題的文本與廣泛收集各種文 章之文本的差別。
為比較自由中國雜誌中的詞彙,此章節所使用的詞彙基準量之平均值與標準差 為以「漢語平衡語料庫全文」作為採樣文本所計算而得。
4.3.1 單詞指標結果探討
圖4.3.1 可以看到以人稱代詞為單詞指標的統計情況,若以漢語平衡語料庫全 文為一個平均的狀態來看,自由中國雜誌在“我們(Nh)”、“他們(Nh)”此兩個人 稱代詞用的次數較多於平均,從表4.3.1 也可以看到自由中國雜誌內“我們
(Nh)”、“他們(Nh)”的標準差數皆大於平衡語料庫相同詞彙的 0.5 以上;因此我 們可能可以進一步解釋這樣的狀況為自由中國雜誌內的文章對於立場的界線表達是 以一個群體的概念來宣示,此時受眾泛指接收到訊息的民眾將會因為自由中國雜誌 使用“我們(Nh)”而有歸屬感。
自由中國雜誌例句:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
56
1. 五月才開始發行我們中華民國的臺幣 2. 我們所謂的直接民主
3. 廣大僑眾已識破他們的奸計 4. 俄國革命以後,他們的經濟政策
另外在看到第一人稱的部分,在自由中國雜誌中“我(Nh)”相對於“我們 (Nh)”在次數上為較低,但在平衡語料庫全文的文本中,“我(Nh)”的次數 6166
(次/百萬詞)卻是高於“我們(Nh)”的 2480(次/百萬詞)2 倍之多,可能代表著 漢語平均的語言表現中,通常會基於本身、自我的角度作為出發,而“我(Nh)”的 確占很高的使用比例。
漢語平衡語料庫例句:
1. 使我們不得不檢討目前制度
2. 很熱情地邀請我們到鎮上最好的特產小吃 3. 你們都知道我要理什麼頭髮
4. 你竟然還斤斤計較我出去幾分鐘了
‧
表 4.3.1、“我(Nh)”、“我們(Nh)”、“他們(Nh)”在自由中國雜誌與平衡語料 庫全文比較中的次數(次/百萬詞)與標準差數(個)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
58
圖4.3.2 中,橫軸為子集合出現該詞彙的次數,以此圖來說,2171(次/百萬 詞)指的是“會(D)”在採樣文本內所有子集合中出現次數的平均值,以及右側距 平均值正1 個標準差值為 3184(次/百萬詞)、距平均值正 2 個標準差值為 4197
(次/百萬詞)、距平均值正 3 個標準差值為 5210(次/百萬詞),左側為距平均值 負1 個標準差,以此類推;縱軸為統計達該區間之子集合個數(個)。
因此可以看到漢語平衡語料庫中“會(D)”的分佈為接近標準常態分佈
(Normal distribution)即圖中橘線,而負 1.3 個標準差大約落在區間標籤 145 與區 間標籤1158 中間附近。
圖 4.3.2、會(D)的平均值與標準差分佈及標準常態分佈圖
0 10 20 30 40 50 60
-‐868 145 1158 2171 3184 4197 5210
子集合個數(個)
單一子集合中詞彙次數(次/百萬詞)
會(D)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
59
圖 4.3.3、情態動詞之單詞指標統計結果(次/百萬詞)
圖4.3.4 為對應自由中國雜誌的動詞 TOP25 取出漢語平衡語料庫中的動詞,圖 4.3.7 為對應漢語平衡語料庫中的動詞 TOP25 取出自由中國雜誌的動詞,在圖 4.3.4 中排名第一的“說(VE)”及第二的“為(VG)”較難看出在各自文本中想表達的詞 意,然而在排名第三的“自由(VH)”在次數上來說,為平衡語料庫全文文本中次數 的十倍之上,而“自由”本身也已具有特殊的意義,從表4.3.2 中也可看出標準差 的差距達13 個標準差。
0 500 1000 1500 2000 2500 3000
情態動詞
自由中國雜誌 平衡語料庫(全文)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
60
自由中國雜誌例句:
1. 使整個中華民國成為自由的中國 2. 我是期望民主自由達到至善的 3. 鐵幕之下剝奪一切自由的極權政治
4. 言論完全失去自由,其他的人民基本自由更無法存在
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
62
再看到動詞經過二字以上的條件篩選過後,上圖4.3.5 為對應自由中國雜誌的 動詞TOP25 取出漢語平衡語料庫中的動詞,下圖 4.3.8 為對應漢語平衡語料庫中的 動詞TOP25 取出自由中國雜誌的動詞,在上圖 4.3.5 中,可以看到實驗的結果將許 多具有一定程度意義的詞彙呈現出來,例如:“自由(VH)”、“反共(VH)”、“革 命(VA)”、“民主(VH)”、“和平(VH)”、“獨立(VH)”,此外再看到表 4.3.2 中,在自由中國雜誌內的詞彙對比平衡語料庫全文內的詞彙皆有非常高的標準差,
因此從動詞的部分可以說明自由中國雜誌本身主題的風格確實較為偏向政治用語。
單詞 自由中國雜誌 漢語平衡語料庫全文 詞彙平均值/標準差
自由中國雜誌詞彙標 準差數 自由(VH) 1690 145/118 13
反共(VH) 627 16/17 36
革命(VA) 547 71/87 5
民主(VH) 534 71/186 2
和平(VH) 416 81/162 2
獨立(VH) 398 111/89 3
表 4.3.2、“自由(VH)”、“反共(VH)”、“革命(VA)”、“民主(VH)”、“和 平(VH)”、“獨立(VH)”在自由中國雜誌與平衡語料庫全文比較中的次數(次/百萬
詞)與標準差數(個)
自由中國雜誌例句:
1. 他們終於到達了自由的樂土
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
63
2. 讓海內外千千萬萬反共人民在赤魔的殺氣騰騰中獲得一股真實 的反共的力量。
3. 民主黨的反共方法強調政治經濟重於軍事 4. 發動宣傳戰,煽動革命推翻共黨政府。
5. 國民宣傳自由與民主的真實價值 6. 建立一個自由民主的社會
7. 不過我覺得民族獨立應該特別著重一點 8. 亞洲人要求民族獨立,生活改善
圖 4.3.6、“自由(VH)”的平均值與標準差分佈及標準常態分佈圖
0 10 20 30 40 50 60 70 80
-‐866 -‐482 -‐98 286 670 1054 1438
子集合個數(個)
單一子集合中詞彙次數(次/百萬詞)
自由(VH)
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
65
4.3.2 雙詞指標結果探討
圖4.3.9 為對應於自由中國雜誌的人稱代詞與情態動詞組合之雙詞 TOP25 取出 漢語平衡語料庫中的雙詞,圖4.3.10 為對應漢語平衡語料庫的人稱代詞與情態動詞 組合之雙詞TOP25 取出自由中國雜誌中的雙詞。在圖 4.3.9 中可以看到排名前五名 的雙詞組合皆以第一人稱代詞開頭,而圖4.3.10 中則才有第二人稱及第三人稱的出 現,另外就是複數第一人稱“我們”在自由中國雜誌的雙詞指標中,也與漢語平衡 與料庫有明顯數量上的差異,因此可以推測第一人稱代詞“我們”在涉及社會議 題、政治的言論上會有較高的使用頻率。
自由中國雜誌例句:
1. 因之我們要打垮匪幫極權
2. 其次,我們要爭取言論自由
3. 我們可以約略窺見極權統治
4. 我們可以大家一同向前
5. 我們必須不斷的努力掃除錯誤
6. 我們必須和多數美國人接觸
‧
‧
我們(Nh)要(D) 我們(Nh)可以(D) 我們(Nh)必須(D) 我(Nh)要(D) 我們(Nh)應該(D) 我們(Nh)應(D) 他(Nh)要(D) 他們(Nh)要(D) 我們(Nh)能(D) 我(Nh)可以(D) 我們(Nh)可(D) 他(Nh)可以(D) 他(Nh)能(D) 要(D)他們(Nh) 要(D)我(Nh) 要(D)他(Nh) 你(Nh)要(D) 他們(Nh)可以(D) 他們(Nh)會(D) 他(Nh)會(D) 要(D)我們(Nh) 我們(Nh)應當(D) 他(Nh)必須(D) 他們(Nh)能(D) 他們(Nh)必須(D)
以自由中國雜誌的雙詞TOP25比對平衡語料庫(全文)
我(Nh)要(D) 我們(Nh)可以(D) 我(Nh)會(D) 你(Nh)要(D) 我們(Nh)要(D) 他(Nh)會(D) 你(Nh)會(D) 你(Nh)可以(D) 我(Nh)可以(D) 他(Nh)要(D) 我們(Nh)必須(D) 我們(Nh)會(D) 我們(Nh)應該(D) 要(D)我(Nh) 你(Nh)能(D) 他們(Nh)會(D) 他(Nh)可以(D) 我(Nh)必須(D) 她(Nh)要(D) 我(Nh)能(D) 他(Nh)能(D) 她(Nh)會(D) 我(Nh)應該(D) 我們(Nh)能(D) 他們(Nh)要(D)
以平衡語料庫(全文)的雙詞TOP25比對自由中國雜誌
自由中國雜誌 平衡語料庫(全文)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
68
圖4.3.11 為對應於自由中國雜誌的人稱代詞與動詞組合之雙詞 TOP25 取出漢 語平衡語料庫中的雙詞,圖4.3.11 為對應於漢語平衡語料庫中的人稱代詞與動詞組 合之雙詞TOP25 取出自由中國雜誌的雙詞。從這兩張圖來看,可以看到某些雙詞 組合在特其中一個文本中較為突出,例如:雙詞組合“我(Nh)覺得(VK)”在自由中 國雜誌中與在漢語平衡語料庫中的排名與次數是平衡語料庫高於自由中國雜誌許 多,可以推測的是“我(Nh)覺得(VK)”是一種不確定、保守的語氣,而自由中國雜 誌的內容為政治取向的文章居多,較不會用到這類的詞彙;相對之下,平衡語料庫 內的文章取自各種領域,且文章在語句的表達上較為直觀,即為作者本身的想法及 思維的直接呈現,故“我(Nh)覺得(VK)”在漢語平衡語料庫中的次數相對較高。
自由中國雜誌例句:
1. 不過我覺得民族獨立應該特別著重一點
2. 我覺得此點是政府應該更進一步做到
3. 我覺得應該說是為經濟自由而戰
漢語平衡語料庫例句:
1. 很多同志朋友,我覺得他們跟我們沒什麼
2. 我覺得我們東方人
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
69
3. 卻不約而同地讓我覺得:民主不一定等於文明
圖4.3.11 為對應於自由中國雜誌的人稱代詞與二字以上動詞組合之雙詞 TOP25 取出漢語平衡語料庫中的雙詞,圖4.3.13 為對應於漢語平衡語料庫中的人稱代詞與 二字以上動詞組合之雙詞TOP25 取出自由中國雜誌的雙詞。從此兩張圖及可以明 顯看出“我(Nh)覺得(VK)”在這兩個文本之間的差異為在平衡語料庫全文中較常使 用,但在自由中國雜誌卻較少使用此類帶有不確定性詞彙的詞;而“我們(Nh)自由 (VH)”在圖 4.3.12 中排名較後面,但從表 4.3.4 中,“我們(Nh)自由(VH)”卻達到 3.5 個標準差,說明了“我們(Nh)自由(VH)”在自由中國雜誌中的所具有的特殊意 義遠高於平衡語料庫;同樣地看到圖4.3.12 中的意義含量非常高的雙詞“我們(Nh) 反共(VH)”也排名較後,然而卻在表 4.3.4 中無標準差數值,我推斷是因為取樣的 漢語平衡語料庫中並未有使用“我們(Nh)反共(VH)”這一個詞彙的緣故,而確實在 圖4.3.12 中“我們(Nh)反共(VH)”的次數為 0。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
71
圖 4.3.11、人稱代詞與動詞組合的雙詞指標統計結果 TOP25(次/百萬詞)
圖 4.3.12、人稱代詞、二字以上動詞組合的雙詞指標統計結果 TOP25(次/百萬 詞)
0 50 100 150 200 250
他(Nh)說(VE) 我(Nh)想(VE) 使(VL)我們(Nh) 使(VL)他們(Nh) 說(VE)他(Nh) 我(Nh)說(VE) 我們(Nh)知道(VK) 我們(Nh)認為(VE) 使(VL)他(Nh) 我們(Nh)希望(VK) 使(VL)我(Nh) 我(Nh)認為(VE) 他(Nh)認為(VE) 他們(Nh)認為(VE) 我們(Nh)有(V_2) 我(Nh)覺得(VK) 他(Nh)有(V_2) 我(Nh)以為(VE) 值得(VH)我們(Nh) 告訴(VE)我們(Nh) 我(Nh)相信(VK) 給(VD)我們(Nh) 我們(Nh)相信(VK) 我們(Nh)以為(VE) 我(Nh)有(V_2)
以自由中國雜誌的雙詞TOP25比對平衡語料庫(全文)
自由中國雜誌 平衡語料庫(全文)
200 4060 10080 120140 160180
我們(Nh)知道(VK) 我們(Nh)認為(VE) 我們(Nh)希望(VK) 我(Nh)認為(VE) 他(Nh)認為(VE) 他們(Nh)認為(VE) 我(Nh)覺得(VK) 我(Nh)以為(VE) 值得(VH)我們(Nh) 告訴(VE)我們(Nh) 我(Nh)相信(VK) 我們(Nh)相信(VK) 我們(Nh)以為(VE) 告訴(VE)我(Nh) 我(Nh)希望(VK) 知道(VK)他(Nh) 我(Nh)知道(VK) 我們(Nh)覺得(VK) 我們(Nh)自由(VH) 他們(Nh)以為(VE) 我們(Nh)反共(VH) 認為(VE)他(Nh) 他(Nh)以為(VE) 我們(Nh)主張(VE) 知道(VK)他們(Nh)
(filtered)以自由中國雜誌的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫全文
‧
他(Nh)說(VE) 我(Nh)覺得(VK) 我(Nh)想(VE) 我(Nh)說(VE) 讓(VL)我(Nh) 她(Nh)說(VE) 讓(VL)他(Nh) 讓(VL)我們(Nh) 他(Nh)認為(VE) 我(Nh)有(V_2) 我(Nh)知道(VK) 告訴(VE)我(Nh) 說(VE)他(Nh) 我(Nh)認為(VE) 你(Nh)說(VE) 他(Nh)有(V_2) 給(VD)我(Nh) 讓(VL)她(Nh) 他(Nh)表示(VE) 使(VL)我(Nh) 說(VE)我(Nh) 讓(VL)他們(Nh) 讓(VL)你(Nh) 使(VL)他(Nh) 問(VE)我(Nh)
以平衡語料庫(全文)的雙詞TOP25比對自由中國雜誌
我(Nh)覺得(VK) 他(Nh)認為(VE) 我(Nh)知道(VK) 告訴(VE)我(Nh) 我(Nh)認為(VE) 他(Nh)表示(VE) 你(Nh)知道(VK) 告訴(VE)他(Nh) 我(Nh)希望(VK) 知道(VK)我(Nh) 我(Nh)相信(VK) 知道(VK)他(Nh) 他(Nh)覺得(VK) 他(Nh)指出(VE) 告訴(VE)你(Nh) 告訴(VE)我們(Nh) 我(Nh)喜歡(VK) 覺得(VK)我(Nh) 他(Nh)希望(VK) 你(Nh)覺得(VK) 我(Nh)看到(VE) 覺得(VK)他(Nh) 他(Nh)強調(VE) 我(Nh)發現(VE) 知道(VK)你(Nh)
(filtered)以平衡語料庫全文的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫全文
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
73
圖4.3.15 為對應於自由中國雜誌的情態動詞與動詞組合之雙詞 TOP25 取出漢 語平衡語料庫中的雙詞,圖4.3.17 為對應於漢語平衡語料庫中的情態動詞與動詞組 合之雙詞TOP25 取出自由中國雜誌的雙詞。從圖 4.3.15 與圖 4.3.17 中可以發現確 實有些情態動詞與動詞的組合在某個文本中的數量多於另一文本,例如自由中國雜 誌裡的“可以(D)說(VE)”、“可(D)說(VE)”以及漢語平衡語料庫裡的“會(D)有 (V_2)”。
圖4.3.16 為對應於自由中國雜誌的情態動詞與二字以上動詞組合之雙詞 TOP25 取出漢語平衡語料庫中的雙詞,圖4.3.18 為對應於漢語平衡語料庫中的情態動詞與 二字以上動詞組合之雙詞TOP25 取出自由中國雜誌的雙詞。相較於未經過二字以 上動詞的條件篩選前,雙詞組合“希望(VK)能(D)”不論是在以自由中國雜誌 TOP25 或者是平衡語料庫 TOP25 中都由原先不在前 25 名內經過動詞條件篩選後前
圖4.3.16 為對應於自由中國雜誌的情態動詞與二字以上動詞組合之雙詞 TOP25 取出漢語平衡語料庫中的雙詞,圖4.3.18 為對應於漢語平衡語料庫中的情態動詞與 二字以上動詞組合之雙詞TOP25 取出自由中國雜誌的雙詞。相較於未經過二字以 上動詞的條件篩選前,雙詞組合“希望(VK)能(D)”不論是在以自由中國雜誌 TOP25 或者是平衡語料庫 TOP25 中都由原先不在前 25 名內經過動詞條件篩選後前