表 4- 13 超過 10 種以上不同寫法的詞彙一覽表
表 4- 13 超過 10 種以上不同寫法的詞彙一覽表
表 4- 13 超過 10 種以上不同寫法的詞彙一覽表
二、 和教育部台語推薦用字 700 字比較分析
我們將這 36 組詞彙的羅馬字和教育部閩南語推薦用字 700 字逐一比對,發 現在這 36 組詞彙中,有 27 組詞彙可在教育部閩南語推薦用字 700 字找到詞型 一樣的詞彙,所佔比例約為 75%,比例不低;有 5 組詞彙雖然沒有找到完全相 符的詞彙,但是仍可找到有部分相同或是意思相同且音近的推薦用字,所佔比 例約為 13.9%;有 4 組詞彙在教育部推薦用字中完全找不到,所占比例約為 11.1
%。
如果我們將找到有部分相同或是意思相同且音近的詞彙,也併入在教育部 推薦用字中有收錄的詞彙的話,比例會提高到 88.9%,比例接近九成,換句話 說,在這寫法較不一致的 36 組詞彙中,有將近九成的詞彙,教育部推薦用字
700 字已經提供其推薦的寫法做為大家的參考依據。
但是從上述表格中,我們可以發現「ah」這一組詞彙,其總詞頻高達 11,895 次,但在教育部推薦用字中並沒有找到,可能因為是表達語氣的原因,因為表 達語氣的詞彙不容易固定其音,所以在教育部的推薦用字 700 字中並沒有收錄 表達語氣的詞彙。但除了這一組詞彙外,「kuānn」出現的總詞頻數是 291 次,
這一組的總詞頻不算低,但是並沒有收錄在教育部推薦用字 700 字,相較之下 在教育部中推薦用字有出現的「khau」及「tshìn-tshái」在這 15 個文類中出現 的總詞頻數分別是 59 和 100,反而有收錄在教育部推薦用字的 700 字中。雖然 這 15 個文類中的詞彙並不能涵蓋所有的台語文語料,但是這一組詞彙「kuānn」
詞頻頻率較高,仍可提供教育部相關單位做為是否收錄至下一批教育部推薦用 字參考的依據。
接下來,我們再進一步研究這 32 組有收錄在教育部推薦用字 700 字的用字 問題,檢視 32 組詞彙中最高頻詞彙的用字(意即 32 組詞彙中最常用的寫法),
和教育部推薦用字 700 字的寫法是否一致。將結果整理如下表 4-14:
表 4- 14 和教育部台灣閩南語推薦用字 700 字寫法是否一致
表 4- 14 和教育部台灣閩南語推薦用字 700 字寫法是否一致
32
tsit-tsūntsit:這
三、 15 文類某種文類特殊用字比較分析
表 4- 15 詞頻超過 300 詞彙所屬最高文類比例統計表
約是 26.1%,寫法分別是「hōo 乎」、「kah 甲」、「tsiah 即」、「ê 兮」、「in 因」、「nā 那」,接下來是小說和其他教材都有 2 種,比例約為 8.7%,分別是
「kah kah」、「m̄-koh m̄-koh」,其他教材類的則是「tī 在」、「kap 及」,俗 諺類有一種是「bē 會勿」,比例各為 4.3%。
上述 23 種詞彙寫法較值得我們注意的是,民間故事這一文類的「tsit-má 今 也」、「án-ni 安呢」、「án-ni 安爾」、「a 啊」、「kap 合」這 5 種寫法,有 90
%以上的比例都屬於民間故事這一類,我們幾乎可以說這 5 種台語用字就是屬 於民間故事類的特殊用字,同樣的歌仔冊類的「nā 那」和俗諺類的「bē 會勿」,
這兩種詞彙寫法有 90%以上的比例分別屬於歌仔冊類及俗諺類,我們也可以說 這些寫法就是這兩個文類的特殊用字了。
第五章 結論與建議
第一節 研究結論
21 世紀是個講求科學實證的時代,過去關於語言學的研究,幾乎都屬於專
家學者對於語言內部的語法、句法等問題探討,但自從 1959 年 SEU 語料庫誕 生之後,語言的研究進入了另一里程碑,由電腦為人類語言服務的時代開始了,語料庫語言學就是藉由電腦大量語料的計算、實際的數據分析,探討語言的使 用規則,此外還可以將大量的真實語料保存下來。目前台灣台語的公開及非公 開語料庫也逐年增加,較早的像是台語文語料庫,或是近來成立的台灣民間說 唱文學歌仔冊資料庫、白話字數位典藏博物館等,就是利用這種方式將台灣幾 百年來珍貴的語料保存下來。
本研究即是採用語料庫語言學的研究方法,以教育部台灣閩南語字詞頻調 查工作計畫蒐集的 15 種文類詞彙為研究語料,運用台語字詞頻統計系統及
Microsoft Excel 函數計算功能等工具,探討台語文類關鍵詞、台華共通詞及台
語用字等問題。研究結論如下列各點說明:一、 台語文類關鍵詞
(一)在 15 文類關鍵詞出現文類數結果如下所述:
1.關鍵詞集中在一種文類的比例前 3 高是:
第 1 高是流行歌(30%),第二是民間故事(29.5%)和其他教材(29.5%),
第 3 是囡仔歌(28.5%)。顯示獨特性最高的是流行歌類,第二是民間故事和其 他教材,第三高是囡仔歌。
2.關鍵詞集中在一個文類比例最低的是教材類(0.5%)
,顯示教材類是 15文類獨特性最低的文類。
3.在 15 個文類中,文類相似度較高的前三組是:
「演講訪談類和論文類」、「散文類和小說類」、「戲劇類和歌仔冊類」。其他教材類這一類和所有文類的相 似度都偏低,相似度的比例僅介於 0%~0.5%之間
4.幾乎所有的文類關鍵詞都是以同時出現在三種文類的比例最高,只有歌
仔冊這一類的關鍵詞中,同時出現在兩種文類的比例高於同時出現在三種文類 的比例。(二)15 個文類的詞彙中,雖然有因為方音差異、文白異讀、台語用字或 其他因素而形成關鍵詞的詞彙,但仍因未保留期台語詞彙的獨特性而予以保留。
二、 台華共通詞和台語特別詞
(一)15 文類的台華共通詞比例前 3 高分別是:
戲劇(66.93%)、論文(66.14%)、流行歌(65.69%)。
戲劇類台華共通詞比例高的原因,是因為語料中有許多拱樂社的劇本,布 袋戲的劇本有許多句子都是華語詞彙直接音譯,是造成台華共通詞比例高的主 因;論文類台華共通詞比例較高的原因是因為它是較正式的文體,必須有較標 準的書面文字;流行歌則是因為填詞人習慣華語思考,造成台華共通詞比例較 高。
(二)15 文類的台語特別詞比例前 3 高分別是:
民間故事(52.1%)、小說(51.66%)、散文(48%)。
民間故事屬於民間文學是較非正式的文體,台華共通詞比例偏低,相對的 台語特別詞比例較高;而小說和散文較接近口語,標準化較低,台語特別詞的 比例就偏高。
三、 台語用字問題
(一)在 15 種文類中,台語用字寫法不同超過 10 種以上的有 36 組情形,
(二)比較 36 組詞彙的最常用字寫法,有 12 組用字全為羅馬字沒有漢字,
所佔比例為 33.3%,只有 1 組使用漢羅合用,所佔比例為 2.8%,有 23 組使用 漢字,所佔比例為 63.9%。
(三)上述 36 組詞彙中,有 32 組詞彙可在教育部閩南語推薦用字 700 字 裡頭有收錄,4 組沒有收錄。
(四)在 36 組詞彙中總詞頻超過 300 的台語詞彙中,寫法屬於某種文類的 比例超過 50%以上的情形共計 23 種,最多的是屬於民間故事,有 12 種,第二 多的是歌仔冊類,有 6 種,第三是小說和其他教材各有 2 種,俗諺有 1 種。
(五)寫法屬某種文類的比例超過 90%以上,屬於某一文類的特殊用字的 共計有 7 種,茲將結果整理如下表 5-1。
表 5- 1 屬於某一文類的特殊用字 編
號 羅馬字 漢字 所屬文類 所佔比例 1 tsit-má 今也 民間故事
99.8%
2 án-ni 安呢 民間故事
99.5%
3 a 啊 民間故事
97.8%
4 kap 合 民間故事
97.3%
5 bē 會勿 俗諺
96.4%
6 nā 那 歌仔冊
91.3%
7 án-ni 安爾 民間故事
90.2%
第二節 建議
一、 定期推行台語字頻、詞頻調查工作
語言是活的,隨著時空的改變會產生許多新的詞彙,同樣也會有詞彙消失,
政府機關有責任定期推行台語字頻、詞頻的調查工作,了解台語詞彙的演變情
形,並透過定期調查整理出各階段常用的詞彙、詞義、句法,作為編寫台語教 科書或是其他台語文字工作者的參考依據。
二、 台語用字應及早統一
語言需要文字才能廣為流傳,但現在台語的用字情形仍舊爭議不斷,目前 教育公佈的閩南語推薦用字已有 700 字,但台語詞彙中有音無字的問題還是沒 有徹底解決,台語羅馬字的貢獻是不可抹滅的,建議相關單位應該以漢字為主,
羅馬字為輔,及早全面統一台語的用字。
三、 建立更多台語文相關語料庫供專家學者研究
語料庫提供了學者們另一種方式對語言來進行分析研究,雖然目前大行公 開的台語語料庫有逐年增加的趨勢,但對於有心想要研究台語文的專家學者來 說,還有一大段努力的目標,政府宜在這一部分提供專款補助或是成立專門機 構來進行研究,並提供需要的協助。
參考文獻
Anthony McEnery, Richard Xiao, Yukio Tono(2006). Corpus-based language studies : An advanced resource book. London : Routledge.
David Crystal 著、任明等譯(1995)。劍橋語言百科全書。北京:中國社會科
學出版社。David Crystal 著、周蔚譯(2001)。語言的死亡。台北:貓頭鷹出版社。
Warren Wellek 著、王夢鷗等譯(1983)。文學論。志文出版社。
王育德(1957)。臺灣語常用詞彙。東京:永和語學社。
王育德著、黃國彥譯(2000)。台灣話講座。台北:前衛出版社。
王育德(2002)。台灣語常用語彙。台北:前衛出版社。
王淑眉(2010)。華語「究竟」和「到底」的言談語用功能探析-以語料庫為 本。高雄師範大學華語文教學研究所碩士論文。
王萸芳(1995)。漢語口語與書面語中副詞子句的訊息順序。國立臺灣師範大 學英語學系碩士班碩士論文。
朱國能(2003)。文學概論。台北:里仁出版社。
余明憲(2005)。漢語之框觸動詞──「玩」、「弄」和「搞」在「動賓」格 式中之研究。國立交通大學外國文學與語言研究所碩士論文。
李勤岸(2000)。Lexical Change and Variation in Taiwanese Literary Texts,
1916--1998 ─A Computer-Assisted Corpus Analysis。美國夏威夷大學語言學
研究所博士論文。李勤岸、洪惟仁(2007)。沒有名字的語言?-「台灣話」、「閩南話」還是
Hoh-lo 話。臺灣文學館通訊 15。頁 36- 41。
李珮甄(2007)。以口語語料庫為本探究台灣閩南語「是講」、「著是講」的 語用功能。高雄師範大學台灣文化及語言研究所碩士論文。
李翰嘉(2008)。漢語疑問詞「怎麼」與「如何」之分析及其教學啟示—以語 料庫為本。高雄師範大學文語文教學研究所碩士論文。
李欣珉(2008)。國民小學閩南語民間版教科書漢字選用之研究。國立台東大 學碩士論文。
宋澤萊(2001)。一隻煎匙。台北:聯合文學。
周長楫(1996)。閩南話的形成發展及臺灣的傳播。台北:台笠出版社。
林慶勳(2001)。臺灣閩南語概論。台北:心理出版社。
林香薇(2003)。論宋澤萊台語詩《一枝煎匙》的用字與用詞。師大學報 48:
2。頁 95-118。
姚榮松(1990)。當代台灣小說中的方言詞彙-兼談閩南語的書面語。國文學 報 19。頁 223-264。
姚榮松(1990)。閩南語書面語的漢字規範。教學與研究 12。頁 77-94。
姚榮松(2000)。臺灣閩南語歌仔冊的用字分析與詞彙解讀-以《最新落陰相 褒歌》為例。國文學報 29。頁 193-230。
姚榮松(2000)。論臺灣閩南方言詞進入國語詞彙的過程。華文世界 95。頁
34-46。
姚榮松(2004)。閩南語漢字書寫的檢討與文字化的方向。國文天地 19:10。
頁 81-86。
俞士汶(2003)。計算語言學概論。北京:商務出版社。
施炳華(2001)。行入台語文學的花園。台南:真平企業有限公司。
洪惟仁(1992)。台語文學與台語文字。台北:前衛出版社。
洪惟仁(1992)。台語方言之旅。台北:前衛出版社。
人工智慧與應用研討會。彰化:大葉大學。頁 160-166。
洪嘉馡、黃居仁(2008)。語料庫為本的兩岸對應詞彙發掘。語言暨語言學 9:
2。頁 221-238。
涂公遂(1978)。文學概論。台北:五洲出版社。
張學謙(1998)。HO-LO 台語虛詞的語層和語用。第二屆台灣語言國際研討會
張學謙(1998)。HO-LO 台語虛詞的語層和語用。第二屆台灣語言國際研討會