• 沒有找到結果。

台語羅馬字詞彙分析

第四章 結果分析

第三節 台語羅馬字詞彙分析

第三節 第三節 台語羅馬字詞彙分析 台語羅馬字詞彙分析 台語羅馬字詞彙分析 台語羅馬字詞彙分析

36 見本研究第二章第三節台語詞彙豐富度部分。

本節分成詞型與詞次兩個部分探討台語羅馬字詞彙在學術類與非學術類的

20.72%20.72%

20.72%

彙的使用上多8.16%。兩種文類使用台語羅馬字詞彙的比例皆超過 10%以上,

30.43%30.43%

30.43%

從上表及上圖中可知:學術類台語羅馬字詞彙的使用比例佔15.63%,非學 術類台語羅馬字詞彙的使用比例佔30.43%,非學術類比學術類在台語羅馬字詞 彙的使用上多出 14.80%。兩種文類使用台語羅馬字詞彙皆超過 15%以上,非

學術類達到30%以上的水準。

上述的統計結果支持本研究的第四項假設:台語羅馬字詞彙使用比例非學術 類高於學術類。

三 三 三

三、、、、詞型詞型詞型詞型VS 詞次比較分析詞次比較分析詞次比較分析 詞次比較分析

本研究透過比較詞型與詞次的差異探討台語羅馬字詞彙實際使用的情形。

表33 台語羅馬字詞彙詞型 VS 詞次比較表

項目 詞型 詞次

學術類 12.56% 15.63%

非學術類 20.72% 30.43%

圖15 台語羅馬字詞彙詞型 VS 詞次比較圖

一一

一一、、、、覆蓋率覆蓋率覆蓋率覆蓋率100%%% %

表34 台語平均詞長統計表(覆蓋率 100%)

項目 學術類 非學術類 台語詞彙

音節數 101,349 102,335 203,684 詞次 58,057 77,955 136,012

平均詞長 1.75 1.31 1.50

從上表可知:學術類平均詞長為 1.75,非學術類平均詞長為 1.31,學術類

比非學術類多 0.44。統計結果支持本研究的第四項假設:台語平均詞長,學術 類多於非學術類。

二 二 二

二、、、、覆蓋率覆蓋率覆蓋率覆蓋率80%%%%

表35 台語平均詞長統計表(覆蓋率 80%)

項目 學術類 非學術類 台語詞彙

音節數 66,617 77,863 144,480 詞次 46,452 62,368 108,820

平均詞長 1.43 1.25 1.33

從上表可知:學術類平均詞長為1.43,非學術類平均詞長為 1.25,學術類

比非學術類多0.18。統計結果支持本研究的第四項假設:台語平均詞長,學術 類多於非學術類。

排除低頻詞後的平均詞長比較符合實際情況。

三三

三三、、、、覆蓋率覆蓋率覆蓋率覆蓋率100%%%VS 覆蓋率% 覆蓋率覆蓋率覆蓋率80%%%%

表36 台語平均詞長覆蓋率 100%VS覆蓋率80%比較表

項目 覆蓋率100% 覆蓋率80%

學術類 1.75 1.43

非學術類 1.31 1.25

台語詞彙 1.5 1.33

圖16 台語平均詞長覆蓋率 100%VS 覆蓋率 80%比較圖

表37 台語 VS 華語平均詞長比較表 項目 台語詞彙

覆蓋率80%

現代漢語詞語 頻率辭典

兩岸三地漢語語料庫

(台灣、中國、香港)

平均詞長 1.33 2.0928 2.2706

從上表可知:台語平均詞長:1.33;《現代漢語詞語頻率辭典》:2.0928;

《兩岸三地漢語語料庫》:2.2706。平均詞長《現代漢語詞語頻率辭典》多於《兩 岸三地漢語語料庫》多於台語詞彙。以上結果支持本研究以音節數多寡推論比較 平均詞長的論點。

第五章 第五章 第五章

第五章 結論與建議 結論與建議 結論與建議 結論與建議

第一節 第一節 第一節

第一節 結論 結論 結論 結論

本研究採用語料庫語言學的研究方法探討台語詞彙在學術與非學術類的使 用差異,研究的語料共有約20 萬音節左右,探討台華共通詞、台語詞彙豐富度、

台語羅馬字詞彙以及台語平均詞長在學術類與非學術類書面語的情形。研究結論 如以下幾點說明:

一 一 一

一、、、、台華共通詞台華共通詞台華共通詞台華共通詞

台華共通詞的統計結果支持本研究假設:台華共通詞的使用比例,學術類多 於非學術類。詞型、詞次、覆蓋率各項統計結果如下所述:

(一)詞型

1.覆蓋率 100%:學術類多於非學術類,多出 11.82%。

2.覆蓋率 80%:學術類多於學術類,多出 16.71%。

(二)詞次

1.覆蓋率 100%:學術類多於非學術類,多出 17.77%。

2.覆蓋率 80%:學術類多於非學術類,多出 19.30%。

二二

二二、、、、詞彙豐富度詞彙豐富度詞彙豐富度詞彙豐富度

台語詞彙豐富度的統計結果:非學術類多於學術類,研究假設並沒有得到支 持。可能是樣本的文體種類、內部差異、語料量等因素影響統計結果對於假設的 支持。

三 三 三

三、、、、台語羅馬字詞彙台語羅馬字詞彙台語羅馬字詞彙台語羅馬字詞彙

台語羅馬字詞彙的統計結果支持本研究假設:台語羅馬字詞彙的使用比例,

非學術類多於學術類。詞型、詞次的統計結果如下所述:

(一)詞型:非學術類多於學術類,多出8.16%。

(二)詞次:非學術類多於學術類,多出14.80%。

四 四 四

四、、、、台語台語台語台語平均詞長平均詞長平均詞長 平均詞長

台語平均詞長的統計結果支持本研究假設:台語平均詞長,學術類多於非學 術類。統計結果如下所述:

(一)覆蓋率100%台語平均詞長:學術類比非學術類多 0.44 個詞。

(二)覆蓋率80%台語平均詞長:學術類比非學術類多 0.18 個詞。

第二節 第二節 第二節

第二節 建議 建議 建議 建議

台語著作目前已累積有多種不同文體與豐富語料,基於台語語料庫的研究是 未來重要的發展,研究者以語料庫語言學的方法研究台語詞彙的使用差異,發現 台語借用華語詞彙已經是時代的趨勢與事實,不同文體有借用比例上的差異。研

究過程中,研究者將所遇到的困難與限制,以及新發現許多值得深入探討問題,

提出幾點建議做為爾後相關研究與單位之參考:

一、台語詞彙豐富度本研究結果未能支持假設,未來若能蒐集更多樣的文 體、建立充足樣本的語料量、排除樣本內部差異進行研究,相信會有完 整的了解。

二、高頻詞與低頻詞的使用差異是研究過程中發現但未探討的問題,例如

「去」在非學術語料中是屬於高頻詞(編號14),但是在學術語料中卻

不是(編號80),這也是值得討論的問題。

三、一個華語詞對應兩個以上(含兩個)台語詞彙,例如:「可愛」(華語)

與之對應的台語詞彙有「可愛(khó-ài)」、「古錐( kó͘ -chui)」、「巧 裝(khiáu-chng)」等同義詞,其使用情形亦是值得研究的問題。

四、研究者在做台華共通詞的比對時,發現中文詞庫(八萬目詞)重複出現一

次的詞有35 個之多,例如:邊、點、還、頭、調、數、種、當…等,

這也是值得進一步了解的問題。

五、研究者在做詞彙斷詞時發現台語缺乏一套完善的電腦斷詞系統以及分詞 規範,這是台語語料庫語言學研究的基本問題。

六、籲請政府積極投注資源建立一個公開的加工台語書面語語料庫,提供相 關領域使用,以提昇研究品質與擴展應用範籌,並且保存台語免於流失。

參考文獻 參考文獻 參考文獻 參考文獻

專書 專書 專書 專書

Anthony McEnery, Richard Xiao, Yukio Tono .2006. Corpus-based language studies : An advanced resource book .London : Routledge.

Douglas Biber, Susan Conrad, and Randi Reppen. 1998. Corpus Linguistics : Investigating language structure and use. London:Cambridge

University Press.

Kennedy, Graeme D . 1998. An introduction to corpus linguistics . London : Longman.

David Crystal 著,方晶譯。1995。《劍橋語言百科全書》。北京:中國社會科學。

David Crystal 著,周蔚譯。2001。《語言的死亡》。台北市:貓頭鷹出版社。

王育德。2000。《台語入門》台北市:前衛出版社。

王育德。2000。《台灣話講座》。台北市:前衛出版社。

王育德。2002。《台灣語常用語彙》。台北市:前衛出版社。

何大安。1996。《聲韻學中的觀念和方法》。台北市:大安出版社。

周長楫。1996。《閩南話的形成發展及臺灣的傳播 》。台北市:台笠出版社。

林慶勳。2001。《臺灣閩南語概論》。台北:心理出版社。

俞士汶。2003。《計算語言學概論》。北京:商務印書館。

施炳華。2001。《行入台語文學的花園》。台南市:真平企業有限公司。

張裕宏。2001。《白話字基本論:台語文對應&相關的議題淺說》。台北:文鶴 出版社。

張學謙。2003。《行向多文字 ê 台語文:文字態度 kap 政策論文集》。屏東:睿 煜出版社。

教育部國語推行委員會。1999。《常用語詞調查報告書》。台北市:教育部。

許極燉。1991。《台灣話流浪記》。臺北市:臺灣語文研究發展基金會。

許極燉。1994。《台語文字化的方向》。台北市:自立晚報社文化出版部。

許極燉。1998。《台灣語概論》。台北:前衛出版社。

湯志祥。2001。《當代漢語詞語的共時狀況及其嬗變》。上海:復旦大學出版社。

詞庫小組。1996。《「搜」文解字---中文詞界研究與資訊用分詞標準技術報告 NO.96-01》。中央研究院資訊科學研究所中文詞知識庫小組。

黃昌寧、李涓子著。2002。《語料庫語言學》。北京:北京商務印書館。

黃宣範。2004。《語言、社會與族群意識-台灣語言社會學的研究》。台北:文 鶴出版社。

楊允言、張學謙、呂美親。2008。《台語文運動訪談暨史料彙編》。台北:國史 館。

楊秀芳。1998。《閩南語字彙(一)》。教育部。

楊秀芳。1998。《閩南語字彙(二)》。教育部。

楊秀芳。2005。《台灣閩南語語法稿》。台北市:大安出版社。

楊惠中主編。2002。《語料庫語言學導論》。上海:上海外語教育出版社。

董忠司主編。1996。《臺灣閩南語概論講授資料彙編》。台北:臺灣語文學會。

董忠司編。2001。《福爾摩沙的烙印:臺灣閩南語概要》。台北市:行政院文建 會。

蔣為文。2005。《語言、認同與去殖民》。台南:國立成功大學。

蔣為文。2007。《語言、文學 kap 台灣國家再想像》。台南:國立成功大學。

鄭良偉。1989。《走向標準化的台灣話文》。台北:自立晚報文化出版部。

鄭良偉。1990。《演變中的台灣社會語言-多語社會及雙語教育》。台北:自立 晚報文化出版部。

研討會及期刊論文 研討會及期刊論文 研討會及期刊論文 研討會及期刊論文

Hung,Jia-Fei, Cherry Li, and Jane Tsay. 2004. The Child's utterance final particles in Taiwnaese: a case study. Taipei:National Taiwna University.

Proceedings of the IsCLL-9, 477-498.

李勤岸、洪惟仁。2007。〈沒有名字的語言?-「台灣話」、「閩南話」還是Hoh-lo 話〉。《臺灣文學館通訊》15:36- 41。

林香薇。2003。〈論宋澤萊台語詩《一枝煎匙》的用字與用詞〉。《師大學報》48,

2:95-118。

姚榮松。1990。〈當代台灣小說中的方言詞彙-兼談閩南語的書面語〉。《國文學

報》19:223-264。

姚榮松。1990。〈閩南語書面語的漢字規範〉。《教學與研究》12:77-94。

姚榮松。2000。〈臺灣閩南語歌仔冊的用字分析與詞彙解讀-以《最新落陰相褒 歌》為例〉。《國文學報》29:193-230。

姚榮松。2004。〈閩南語漢字書寫的檢討與文字化的方向〉。《國文天地》19,10:

81-86。

洪嘉馡、黃居仁。2008。〈語料庫為本的兩岸對應詞彙發掘〉。《語言暨語言學》

9,2:221-238。

高照明。2002。〈中英雙語近譯句翻譯檢索系統〉。《翻譯學研究集刊》。台北:

台灣翻譯學會。7:75-107。

張學謙、楊允言。2005。〈台語語體演變分析〉。行政院國家科學委員會補助專 題研究計畫成果報告,計畫編號:NSC 93-2411-H-143-005。

張學謙。1998。〈Ho-Lo 台語虛詞的語層及語用〉。載於《第二屆台灣語言國際 研討會論文選集》。451-463。

張學謙。2000。〈台語口語及書面語體的多面向分析〉。《語言暨語言學》1,1:

89-117。

張學謙。2004。〈弱勢語言的地位規劃與語言復振:從語言歧視主義到語言公 平〉。載於《語言人權與語言復振學術研討會》。台東:國立台東大學。61-76。

陳瑞清。2003。〈語料庫翻譯學:英漢翻譯的研究與應用初探〉。載於《第八屆