第四章 結果分析
第一節 台華共通詞的使用差異分析
第四章 第四章
第四章 結果分析 結果分析 結果分析 結果分析
本研究採用語料庫語言學的研究方法,探討台語詞彙在學術和非學術書面語 的使用差異。建立學術類語料 101,349 音節,非學術類語料 102,335 音節,合
計 203,684 音節,經過電腦斷詞、人工校正、詞頻統計後,得到學術詞頻統計 表與非學術詞頻統計表各一份,做為分析台華共通詞、台語詞彙豐富度、台語羅 馬字詞彙、台語平均詞長等四項台語詞彙特性的使用差異。分析的結果分成四節 做說明:第一節台華共通詞的使用差異分析;第二節台語詞彙豐富度分析;第三 節台語羅馬字詞彙分析;第四節台語平均詞長分析。
第一節 第一節 第一節
第一節 台華共通詞的使用差異分析 台華共通詞的使用差異分析 台華共通詞的使用差異分析 台華共通詞的使用差異分析
本節分成詞型、詞次、詞型與詞次比較分析、小結四個部分討論台華共通詞 在學術與非學術書面語的使用差異,在詞型和詞次的部分再細分成覆蓋率 100
%、覆蓋率80%、不同覆蓋率的比較以及小結四個項目討論。
一一
一一、、、、詞型分析詞型分析詞型分析詞型分析
分成覆蓋率100%、覆蓋率 80%、覆蓋率比較分析、小結四個部分討論。
(一)覆蓋率100%
66.91%66.91%
66.91% 台華共通詞台華共通詞 台華共通詞台華共通詞
學術類比非學術類多出 11.82%;兩種文類所佔的比例都超過 50%,學術類達
從上表和上圖可知:台華共通詞在學術類佔82.40%,非學術佔 65.69%,
學術類比非學術類多出 16.71%。兩種文類所佔的比例都超過 65%,學術類達
到 80%以上的水準。統計的結果支持本研究第一項假設:台華共通詞的使用比 例,學術類多於非學術類。
(三)覆蓋率比較分析
本小節透過比較台華共通詞不同覆蓋率的比例,分析低頻詞對統計結果的影 響;並與鄭良偉(1987)、黃宣範(1998)的研究比較,探討台華共通詞實際的 使用情形。
表22 台華共通詞覆蓋率 100%VS覆蓋率80%比較表(詞型)
項目 覆蓋率100% 覆蓋率80%
學術類 66.91% 82.40%
非學術類 55.09% 65.69%
圖5 台華共通詞覆蓋率 100%VS覆蓋率80%比較圖(詞型)
從上表及上圖可知:排除低頻詞後(即覆蓋率100%調整至覆蓋率 80%),
台華共通詞在學術類的比例由(覆蓋率100%)66.91%提升至(覆蓋率 80%)
82.40%,增加 15.49%;在非學術類的比例由(覆蓋率 100%)55.09%提升至
(覆蓋率80%)65.69%,增加 10.60%。
由上述可知,計算台華共通詞在學術類與非學術類的比例時,低頻詞對於統 計結果會產生影響,影響的程度至少超過 10%。可能的原因是低頻詞中的電腦 雜訊是以台語特別詞計算,而且以詞型計算,低頻詞和高頻詞的比重是一樣的,
因此增加了低頻詞對統計結果的影響程度。
將兩個不同覆蓋率的台華共通詞使用比例與鄭良偉(1987)、黃宣範(1998)
的統計做比較,探討台華共通詞的使用情形。比較結果如下表:
表23 台華共通詞使用比較表(詞型)
覆蓋率100% 覆蓋率80%
項目 鄭良偉 黃宣範
學術 非學術 學術 非學術 台華共通詞 65.6% 73% 66.91% 55.09% 82.40% 65.69%
台語特別詞 34.4% 27% 33.09% 44.91% 17.60% 34.31%
圖6 台華共通詞使用比例比較圖
從上表及上圖可知:鄭、黃兩位學者台華共通詞的比例約介於66%~73%;
本研究台華共通詞覆蓋率 100%的比例介於 55.09%(非學術)~66.91%(學
術),台華共通詞覆蓋率80%的比例介於 65.69%(非學術)~82.40%(學術)。
鄭、黃兩位學者統計「現代閩南語辭典」台華共通詞是沒有分文類,普遍性 的調查。如果以鄭、黃兩位學者的統計為比較基準,學術類的文本對書面語標準 化的程度要求比較高,使用台華共通詞的比例應該會高於鄭、黃兩位學者的調查 結果;非學術性文本含蓋的文體種類較廣,使用台華共通詞的比例應該和鄭、黃
台華共通詞使用比例比較圖
73% 55.09% 65.69%
65.60% 66.91% 82.40%
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
學術 非學術 學術 非學術 鄭良偉 黃宣範 覆蓋率 100% 覆蓋率 80%
項目 百分比
台華共通詞
兩位學者的調查差不多。因此,我們可以歸納出一個簡單的比較方式,了解那一 個台華共通詞的覆蓋率比較接近實際的使用情形,為比較方便,以數學符號「>」
表示「大於、多於」,以「=」表示「等於」。敘述如下:
由上述的推論可知,學術類文本>鄭、黃≧非學術類文本是比較接近台華共
通詞實際的使用情形,因此以台華共通詞覆蓋率 100%與覆蓋率 80%與之比較 就可以很容易看出那一個覆蓋率是比較符合實際的使用情形。
根據上述方式比較台華共通詞覆蓋率100%、覆蓋率 80%,結果如下:
覆蓋率100%:鄭、黃(66%~73%)≧學術類文本(66.91%)>非學術 類文本(55.09%)。
覆蓋率80%:學術類文本(82.40%)>鄭、黃(66%~73%)≧非學術文 本(65.69%)。
由上述的比較可知,台華共通詞覆蓋率 80%的統計結果(65.69%~82.40
%)是比較符合實際的使用情形。
(四)小結
覆蓋率 100%和覆蓋率 80%的統計結果皆支持本研究的假設:台華共通詞 的使用比例,學術類多於非學術類。
低頻詞對統計結果支持本研究假設方面沒有造成影響;但是在計算台華共通 詞的比例時,對於學術類或非學術類大約有 10%以上的影響,排除低頻詞影響 後(覆蓋率80%)所得到的結果是比較接近實際的使用情形。
二二
二二、、、、詞次分析詞次分析詞次分析詞次分析
分成覆蓋率100%、覆蓋率 80%、覆蓋率比較分析以及小結四個部分:
從上表和上圖可知:台華共通詞在學術類佔74.58%,非學術佔 56.81%,
學術類比非學術類多出 17.77%;兩種文類所佔的比例都超過 55%,學術類達
到 70%以上的水準。統計的結果支持本研究第一項假設:台華共通詞的使用比 例,學術類多於非學術類。
(二)覆蓋率80%
表25 台華共通詞與台語特別詞使用差異統計表(詞次,覆蓋率 80%)
學術類 非學術類
項目
詞次 比例 詞次 比例
台華共通詞 35,469 75.98% 36,197 57.01%
台語特別詞 11,215 24.02% 27,298 42.99%
合計 46,684 100.00% 63,495 100.00%
圖8 台華共通詞與台語特別詞使用差異統計圖(詞次,覆蓋率 80%)
圖9 台華共通詞覆蓋率 100%VS覆蓋率80%比較圖(詞次)
從上表及上圖可知:排除低頻詞後(即覆蓋率100%調整至覆蓋率 80%),
台華共通詞在學術類的比例由(覆蓋率100%)74.58%提升至(覆蓋率 80%)
75.98%,增加 1.4%;在非學術類的比例由(覆蓋率 100%)56.81%提升至(覆
蓋率80%)57.01%,增加 0.2%。
表27 台華共通詞使用比較表(詞次)
合計 100.0% 100.0% 100.0% 100.0% 100.00% 100.00%
資料來源
(小說)67.5%、歌詩佔 67.4%、諺語及俗語佔 67.5%。新聞報告是屬於比較 正式的文體,其他三類屬於比較非正式的文體;共通語層的使用比例,新聞報告
(正式)多於小說、歌詩、諺語及俗語(非正式)。因此Sander 及 Hsieh 的調 查支持本研究的第一項假設:台華共通詞的使用比例,學術類多於非學術類。
再來比較各類文體台華共通詞的比例,新聞報告和學術類同屬於比較正式的 文體,因此兩類文體台華共通詞所佔的比例差不多(77%和 75.98%)。非學術 類和小說、歌詩、諺語及俗語同屬於非正式的文體,理論上台語特別詞的使用比 例應該也是差不多,但是 Sander 及 Hsieh 調查的三類文體皆比本研究少了約 10%。可能是 Sander 及 Hsieh 的調查樣本數較少,單一作者個人的用詞習慣 所造成的差異。
本研究非學術台語特別使用比例的統計結果(42.99%),和鄭良偉預估的使 用比例差不多:日常會話、詩歌、俗語有時佔文章的一半左右,散文大約佔百分 之二十到四十之間(轉引自張學謙 1998)。
(四)小結
覆蓋率 100%和覆蓋率 80%的統計結果皆支持本研究的假設:台華共通詞 的使用比例,學術類高於非學術類。低頻詞沒有影響統計結果支持本研究假設,
在計算台華共通詞的比例時也沒有太大的影響。
三三
三三、、、、詞型詞型詞型詞型VS 詞次比較分析詞次比較分析詞次比較分析 詞次比較分析
詞型是文本中詞彙的類型,詞次是文本中詞型的實際使用次數或頻率;本研 究透過比較兩者的差異探討台華共通詞詞型與詞次實際使用的情形。
以下分成覆蓋率100%、覆蓋率 80%兩部分討論。
(一) 覆蓋率 100%
表28 台華共通詞詞型VS詞次比較表(覆蓋率100%)
項目 詞型 詞次
學術類 66.91% 74.58%
非學術類 55.09% 56.81%
圖10 台華共通詞詞型 VS 詞次比較圖(覆蓋率 100%)
表29 台華共通詞詞型VS詞次比較表(覆蓋率100%)
鄭良偉(1987)、黃宣範(1998)以及 Sander 及 Hsieh(1981)的調查做比較,
結果皆支持本研究的第一項假設:台華共通詞的使用比例,學術類多於非學術 類。低頻詞並不會影響統計結果支持本研究假設,但是在計算台華共通詞詞型的 比例時會有影響的程度比較大,排除低頻詞後,以覆蓋率 80%的計算結果比較 符合實際的使用情形。台華共通詞詞型的比例高於詞次,也就是說台華共通詞有 一部分可能是屬於低頻詞。