第四章 實驗結果與分析
4.4 自由中國雜誌與平衡語料庫屬性為一般雜誌之文本比較
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
81
4.4 自由中國雜誌與平衡語料庫屬性為一般雜誌之文本比較
4.4 章節將取自由中國雜誌與中央研究院漢語平衡語料庫內屬性為一般雜誌的 文章,兩者最主要的差別在於自由中國雜誌的時代背景為1949 年至 1960 年,當時 台灣的社會及政治背景處於較為敏感且嚴肅的氛圍;中央研究院漢語平衡語料庫收 錄自1981 年至 2007 年間各行各業不同屬性的文章,為現代漢語最具代表性的樣 本。此章節試著用單詞、雙詞、三詞指標,試著區分處於兩個不同時代背景的雜誌 所使用的詞彙組合。
為比較自由中國雜誌中的詞彙,此章節所使用的詞彙基準量之平均值與標準差 為以「漢語平衡語料庫-一般雜誌」作為採樣文本所計算而得。
4.4.1 單詞指標結果探討
圖4.4.1 可以看到以人稱代詞為單詞指標的統計情況,人稱代詞“我們
(Nh)”、“他們(Nh)”在自由中國雜誌內的數量較平衡語料庫多約兩倍,其餘人稱 代詞為平衡語料庫-一般雜誌較自由中國雜誌多。從表 4.4.1 中也可以看到“我們 (Nh)”、“他們(Nh)”達到 1 以上的標準差數,與平衡語料庫-一般雜誌相比確實有 落差,而同4.3.1 章節有提過,自由中國雜誌內的文章對於立場的界線表達會常以 一個群體的概念來宣示,此時受眾泛指接收到訊息的民眾將會因為自由中國雜誌使
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
82
用“我們(Nh)”而有歸屬感,同時在使用“他們(Nh)”時,受眾也會有自己不在所 謂“他們”的群體中,因而達到與發話者共同立場的效果。而觀察平衡語料庫-一 般雜誌內人稱代詞的標準差數,可以發現對於第三人稱的使用明顯偏多,這點也是 與自由中國雜誌在使用人稱代詞非常不一樣的地方。
單詞 自由中國雜誌 漢語平衡語料庫-一般雜 誌詞彙平均值/標準差
自由中國雜誌詞彙標 準差數 我(NH) 2860 4890/4960 -0.4 我們(NH) 4462 2557/2133 0.9
你(NH) 687 1485/1300 -0.6 你們(NH) 147 217/345 -0.2 他(NH) 3821 5356/5347 -0.3 她(NH) 454 3065/3891 -0.7 他們(NH) 2424 2014/4244 0.1 她們(NH) 43 427/563 -0.7
表 4.4.1、(對應圖 4.4.1)人稱代詞在自由中國雜誌與平衡語料庫-一般雜誌比較 中的次數(次/百萬詞)與標準差數(個)
‧
-‐3841 -‐1709 424 2557 4689 6822 8955
子集合個數(個)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
84
圖4.4.2 則是兩個文本內情態動詞數量上的比較,然而除了“會(D)”、“應 (D)”較有數量上的區別之外,其餘情態動詞較無差異,“應(D)”雖然也有較顯著 的差異,但從標準差來看,自由中國雜誌只高於平衡語料庫-一般雜誌 0.4 個標準 差,從圖4.4.3 中,可以看到“應(D)”的分佈情況也集中在平均值上,故在 0.4 個 標準差內應屬於正常範圍內。
圖 4.4.3、“應(D)”的平均數與標準差分佈及標準常態分佈圖
0 10 20 30 40 50 60
-‐4136 -‐2445 -‐755 935 2625 4316 6006
子集合個數(個)
單一子集合中詞彙次數(次/百萬詞)
應(D)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
85
圖 4.4.4、情態動詞之單詞指標統計結果(次/百萬詞)
0 500 1000 1500 2000 2500
情態動詞
自由中國雜誌 平衡語料庫-‐一般雜誌
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
88
圖4.4.7 為對應於漢語平衡語料庫一般雜誌屬性的動詞單詞 TOP25 後取出自由 中國雜誌的動詞單詞,此張圖中出現的動詞都是較為普遍常見的動詞,對於區分兩 個文本的幫助有限,而圖4.4.8 為將動詞經過二字以上的條件篩選後的結果,除了 可以看到動詞本身的意義更為明顯之外,對於區分兩個文本較無太大幫助。從標準 差的角度來看,表4.4.3 內的所有動詞單詞在自由中國雜誌文本內都在 1 個標準差 內,但與平衡語料庫-一般雜誌相比,以“提供(VD)”為例,則可以從圖 4.4.7 看到
“提供(VD)”在平衡語料庫-一般雜誌中的分佈為集中在平均值的右半側,而自由 中國雜誌文本的“提供(VD)”雖與之無太高的標準差,然而卻是在平均值的左半 側,因此可以說在使用“提供(VD)”時,兩個文本之間確實有不一樣的地方。
圖 4.4.7、提供(VD)的平均與標準差分佈及標準常態分佈圖
0 10 20 30 40 50 60 70
-‐1821 -‐996 -‐170 656 1481 2307 3132
子集合個數(個)
單一子集合中詞彙次數(次/百萬詞)
提供(VD)
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
91
4.4.2 雙詞指標結果探討
圖4.4.7 為對應於自由中國雜誌的人稱代詞與情態動詞組合之雙詞 TOP25 後取 出漢語平衡語料庫一般雜誌屬性中的雙詞,圖4.4.8 為對應漢語平衡語料庫一般雜 誌屬性的人稱代詞與情態動詞組合之雙詞TOP25 後取出自由中國雜誌中的雙詞。
在圖4.4.7 中,自由中國雜誌內的“我們(Nh)要(D)”、“我們(Nh)可以(D)”、“我 們(Nh)必須(D)”在數量上約為兩倍多於平衡語料庫一般雜誌。而在圖 4.4.8 中,平 衡語料庫一般雜誌屬性文章中排名第一的“我(Nh)會(D)”的數量是高於自由中國 雜誌文本25 倍之多,而排名 2~4 名則為自由中國雜誌的詞彙數量較多於平衡語料 庫一般雜誌。綜合圖4.4.7 以及圖 4.4.8,自由中國雜誌與平衡語料庫-一般雜誌兩個 文本對於人稱代詞都是偏向使用第一人稱代詞,其中的小差別在於自由中國雜誌經 常使用的為複數的第一人稱,而平衡語料庫-一般雜誌則多使用單數的第一人稱,
考究同樣是雜誌類型的文本,會有這樣的不同可能是因為兩個文本的背景年代差異 以及文章內主題的差異,自由中國雜誌多使用包含群體的複數型態以拉近與受話者 或讀者的心理距離;平衡語料庫-一般雜誌相對的較沒有必須與讀者拉近心理距離 的必要性,故較無顧慮地使用單數型態人稱代詞。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
92
雙詞組合 自由中國雜 誌
漢語平衡語料庫-一般雜誌詞彙平均
值/標準差
自由中國雜誌詞 彙標準差數 我們(NH)要(D) 129 74/66 0.8 我們(NH)可以(D) 113 127/213 -0.1 我們(NH)必須(D) 74 43/39 0.8
表 4.4.4、“我們(Nh)要(D)”、“我們(Nh)可以(D)”、“我們(Nh)必須(D)”在自 由中國雜誌與平衡語料庫-一般雜誌比較的次數(次/百萬詞)與標準差數(個)
自由中國雜誌例句:
1. 我們可以明顯的看出近代民主文明中經濟情勢的特點
2. 我們可以針對這個錯誤,據理力爭
3. 我們要愛護和培養我們剛剛只有九年歷史的民主選舉制度
4. 我們要向全國國民宣傳自由與民主的真實價值,並且
‧
我們(Nh)要(D) 我們(Nh)可以(D) 我們(Nh)必須(D) 我(Nh)要(D) 我們(Nh)應該(D) 我們(Nh)應(D) 他(Nh)要(D) 他們(Nh)要(D) 我(Nh)可以(D) 我們(Nh)能(D) 我們(Nh)可(D) 他(Nh)可以(D) 他(Nh)能(D) 要(D)他們(Nh) 要(D)我(Nh) 要(D)他(Nh) 你(Nh)要(D) 他們(Nh)可以(D) 他們(Nh)會(D) 他(Nh)會(D) 要(D)我們(Nh) 我們(Nh)應當(D) 他(Nh)必須(D) 他們(Nh)能(D) 他們(Nh)必須(D)
以自由中國雜誌的雙詞TOP25比對其餘文本
我(Nh)會(D) 我(Nh)要(D) 我們(Nh)可以(D) 我們(Nh)要(D) 他(Nh)會(D) 你(Nh)可以(D) 我(Nh)可以(D) 你(Nh)會(D) 你(Nh)要(D) 我們(Nh)必須(D) 他(Nh)要(D) 要(D)我(Nh) 他們(Nh)會(D) 她(Nh)會(D) 我們(Nh)會(D) 他(Nh)可以(D) 你(Nh)能(D) 你(Nh)必須(D) 她(Nh)要(D) 他們(Nh)要(D) 我(Nh)必須(D) 我(Nh)能(D) 我們(Nh)應該(D) 他們(Nh)可以(D) 我(Nh)應該(D)
以平衡語料庫一般雜誌屬性的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
‧
表 4.4.5、“使(VL)我們(Nh)”、“使(VL)他們(Nh)”在自由中國雜誌與平衡語料 庫-一般雜誌比較的次數(次/百萬詞)與標準差數(個)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
95
2. 錢將不會使我們得到更多的快樂
3. 朋友的熱情支持使我們懷著更大的勇氣
4. 克勤克儉的民族性,使他們擁有較大的經濟實力 5. 不凡的審美觀,使他們喜愛一切美好的事物
圖4.4.10 為將圖 4.4.9 內的動詞部分加上二字以上的條件篩選過後的結果,排 名前三者人稱代詞加上動詞的組合為“我們(Nh)知道”、“我們(Nh)認為(VE)”、
“我們(Nh)希望(VK)”,此三者數量為四倍高於平衡語料庫一般雜誌更可以說明自 由中國雜誌在使用人稱代詞及動詞方面是更加希望接收訊息的受眾達到跟作者同層 次的思考方式或立場;然而有趣的是圖4.4.10 中同樣是以第三人稱角度與相同動詞 組合的 “他(Nh)認為(VE)”及 “他們(Nh)認為(VE)”之間僅為單複數人稱的區 別,其次數差距卻如此懸殊,也同樣能說明平衡語料庫-一般雜誌對於單數人稱代 詞的使用較為客觀也較無關於拉近與讀者的心理距離。
平衡語料庫-一般雜誌例句:
1. 他認為更值得關注的是,人權觀念 2. 他認為,不要把民營化當成魔術的字眼 3. 整體資訊化架設,他認為本系統恰為開端 4. 因為他們認為人是一種追求自然的生物 5. 他們認為香港教科書應該加強民族意識
‧
他(Nh)說(VE) 我(Nh)想(VE) 使(VL)我們(Nh) 使(VL)他們(Nh) 說(VE)他(Nh) 我(Nh)說(VE) 我們(Nh)知道(VK) 我們(Nh)認為(VE) 使(VL)他(Nh) 我們(Nh)希望(VK) 使(VL)我(Nh) 我(Nh)認為(VE) 他(Nh)認為(VE) 他們(Nh)認為(VE) 我們(Nh)有(V_2) 我(Nh)覺得(VK) 他(Nh)有(V_2) 我(Nh)以為(VE) 值得(VH)我們(Nh) 告訴(VE)我們(Nh) 我(Nh)相信(VK) 給(VD)我們(Nh) 我們(Nh)相信(VK) 我們(Nh)以為(VE) 我(Nh)有(V_2)
以自由中國雜誌的雙詞TOP25比對其餘文本
我們(Nh)知道(VK) 我們(Nh)認為(VE) 我們(Nh)希望(VK) 我(Nh)認為(VE) 他(Nh)認為(VE) 他們(Nh)認為(VE) 我(Nh)覺得(VK) 我(Nh)以為(VE) 值得(VH)我們(Nh) 告訴(VE)我們(Nh) 我(Nh)相信(VK) 我們(Nh)相信(VK) 我們(Nh)以為(VE) 告訴(VE)我(Nh) 我(Nh)希望(VK) 知道(VK)他(Nh) 我(Nh)知道(VK) 我們(Nh)覺得(VK) 我們(Nh)自由(VH) 他們(Nh)以為(VE) 我們(Nh)反共(VH) 認為(VE)他(Nh) 他(Nh)以為(VE) 我們(Nh)主張(VE) 知道(VK)他們(Nh)
(filtered)以自由中國雜誌的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
‧
他(Nh)說(VE) 我(Nh)想(VE) 讓(VL)我(Nh) 我(Nh)說(VE) 讓(VL)他(Nh) 她(Nh)說(VE) 他(Nh)認為(VE) 讓(VL)我們(Nh) 我(Nh)覺得(VK) 告訴(VE)我(Nh) 我(Nh)有(V_2) 問(VE)我(Nh) 我(Nh)認為(VE) 讓(VL)他們(Nh) 讓(VL)她(Nh) 給(VD)我(Nh) 讓(VL)你(Nh) 說(VE)他(Nh) 我(Nh)知道(VK) 使(VL)他(Nh) 你(Nh)說(VE) 令(VL)我(Nh) 使(VL)我(Nh) 我(Nh)看(VC) 他(Nh)表示(VE)
以平衡語料庫一般雜誌屬性的雙詞TOP25比對其餘文本
他(Nh)認為(VE) 我(Nh)覺得(VK) 告訴(VE)我(Nh) 我(Nh)認為(VE) 我(Nh)知道(VK) 他(Nh)表示(VE) 我(Nh)相信(VK) 告訴(VE)他(Nh) 知道(VK)我(Nh) 我(Nh)希望(VK) 他(Nh)指出(VE) 告訴(VE)我們(Nh) 你(Nh)知道(VK) 我(Nh)發現(VE) 知道(VK)他(Nh) 告訴(VE)你(Nh) 他(Nh)覺得(VK) 告訴(VE)她(Nh) 我(Nh)開始(VL) 我(Nh)想起(VE) 我(Nh)喜歡(VK) 我(Nh)看到(VE) 他(Nh)發現(VE) 他(Nh)強調(VE) 我們(Nh)希望(VK)
(filtered)以平衡語料庫-‐一般雜誌屬性的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
98
圖4.4.13 為對應於自由中國雜誌的情態動詞與動詞組合之雙詞 TOP25 後取出 漢語平衡語料庫一般雜誌屬性中的雙詞,在這張圖中可以看到有某些情態動詞與動 詞的組合:“會(D)有(V_2)”、“要(D)有(V_2)”,在平衡語料庫一般雜誌內的數 量上有特別高的情形,再從表4.4.6 中看到,此兩種雙詞組合在平衡語料庫-一般雜 誌中分別有-0.1 及-0.3 個標準差,但這樣組合的詞意較無法看出明確的意涵。
雙詞組合 自由中國雜誌 漢語平衡語料庫-一般雜 誌詞彙平均值/標準差
自由中國雜誌詞彙 標準差數 會(D)有(V_2) 51 162/84 -1.3 要(D)有(V_2) 49 234/456 -0.4
表 4.4.6、“會(D)有(V_2)”、“要(D)有(V_2)”在自由中國雜誌與平衡語料庫-一 般雜誌比較中的次數(次/百萬詞)與標準差數(個)
圖4.4.15 為對應漢語平衡語料庫一般雜誌屬性的情態動詞與動詞組合之雙詞 TOP25 後取出自由中國雜誌中的雙詞。圖 4.4.14 與圖 4.4.16 為加上動詞二字以上條 件篩選過後的結果。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
99
圖 4.4.16、情態動詞、動詞組合之雙詞指標統計結果 TOP25(次/百萬詞)
圖 4.4.17、情態動詞、二字以上動詞組合之雙詞指標統計結果 TOP25(次/百萬 詞)
200 4060 10080 120140 160180
可以(D)說(VE) 可(D)說(VE) 可(D)知(VK) 可(D)言(VE) 會(D)有(V_2) 要(D)有(V_2) 能(D)有(V_2) 要(D)想(VE) 能(D)使(VL) 要(D)使(VL) 可(D)使(VL) 必須(D)有(V_2) 能(D)說(VE) 可以(D)看出(VE) 可以(D)使(VL) 要(D)說(VE) 要(D)看(VC) 須(D)有(V_2) 會(D)使(VL) 能(D)獲得(VJ) 會(D)發生(VJ) 可以(D)知道(VK) 應該(D)有(V_2) 應(D)為(VG) 能(D)得到(VJ)
以自由中國雜誌的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
0 10 20 30 40 50 60
可以(D)看出(VE) 能(D)獲得(VJ) 會(D)發生(VJ) 可以(D)知道(VK) 能(D)得到(VJ) 要(D)知道(VK) 可以(D)得到(VJ) 能(D)達到(VJ) 希望(VK)能(D) 能(D)維持(VJ) 可以(D)看到(VE) 可以(D)證明(VE) 能(D)做到(VE) 要(D)特別(VH) 可(D)分為(VG) 可(D)獲得(VJ) 能(D)實現(VC) 可以(D)自由(VH) 能(D)發生(VJ) 要(D)做到(VE) 會(D)引起(VC) 能(D)解決(VC) 可(D)看出(VE) 可以(D)利用(VC) 要(D)實行(VC)
(filtered)以自由中國雜誌的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
100
圖 4.4.18、情態動詞、動詞組合之雙詞指標統計結果 TOP25(次/百萬詞)
圖 4.4.19、情態動詞、二字以上動詞組合之雙詞指標統計結果 TOP25(次/百萬 詞)
200 4060 10080 120140 160180
會(D)有(V_2) 要(D)有(V_2) 可以(D)說(VE) 可(D)說(VE) 希望(VK)能(D) 要(D)做(VC) 可(D)供(VF) 能(D)讓(VL) 應(D)有(V_2) 會(D)讓(VL) 能(D)有(V_2) 可(D)見(VE) 要(D)讓(VL) 能(D)提供(VD) 可以(D)看到(VE) 可以(D)讓(VL) 會(D)產生(VHC) 可(D)達(VJ) 能(D)做(VC) 會(D)發現(VE) 會(D)影響(VC) 會(D)使(VL) 會(D)出現(VH) 能(D)使(VL) 會(D)說(VE)
以平衡語料庫一般雜誌屬性的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
0 10 20 30 40 50 60
希望(VK)能(D) 能(D)提供(VD) 可以(D)看到(VE) 會(D)產生(VHC) 會(D)發現(VE) 會(D)影響(VC) 會(D)出現(VH) 會(D)發生(VJ) 能(D)得到(VJ) 可(D)提供(VD) 可以(D)看出(VE) 能(D)接受(VC) 會(D)覺得(VK) 可(D)分為(VG) 要(D)考慮(VE) 可(D)看到(VE) 能(D)維持(VJ) 會(D)造成(VG) 能(D)獲得(VJ) 知道(VK)該(D) 能(D)達到(VJ) 會(D)成為(VG) 能(D)掌握(VC) 可以(D)提供(VD) 要(D)注意(VK)
(filtered)以平衡語料庫-‐一般雜誌屬性的雙詞TOP25比對其餘文本
自由中國雜誌 平衡語料庫-‐一般雜誌
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
101
4.4.3 三詞指標結果探討
圖4.4.17 為對應於自由中國雜誌的人稱代詞、情態動詞、動詞組合之三詞 TOP25 後取出漢語平衡語料庫一般雜誌中的三詞,圖中可以看到自由中國雜誌文本 裡大多數的三詞組合的次數較平衡語料庫-一般雜誌高,可以說明此兩個文本使用 三詞的類別不同,除了“我們(Nh)可以(D)說(VE)”、“我們(Nh)可以(D)看出 (VE)”為排名前二名較有差異之外,另外“我們(Nh)可以(D)看到(VE)”則是在前 25 名中唯一在平衡語料庫-一般雜誌中大於在自由中國雜誌中的三詞組合次數。
自由中國雜誌例句:
1. 我們可以看到許多警察預備隊的隊員
2. 我們可以看到它對於大同主義的詳細解釋
2. 我們可以看到它對於大同主義的詳細解釋