• 沒有找到結果。

客語語料庫建置 ke 思考

第二章 客語著漢衫

第一節 客語語料庫建置 ke 思考

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

37

第二章 客語著漢衫

第一節 客語語料庫建置 ke 思考

客話 ke 書面化文本,有字典、文學作品同客話教育書籍,文學作品同教科 書部分,有無共樣 ke 作者、寫書 ke 人來編寫,故所產生當多用當多無共樣 ke 文字來呈現 ke 問題,字典就係為了解決這種困難,愛來分這隻語言有一 ke 規 範。教科書部分,1993 年教育部 thò「國民小學課程標準」裡肚來制訂三到六年 生增加「鄉土教學活動」課程,用逐週一節課 ke 時間來做標準,逐隻學校做得 照地方特色來安排鄉土文化抑係母語相關 ke 學習;2000 年修訂「國民中小學九 年一貫課程綱要」裡肚,清楚規定鄉土語言為「本國語文領域」,變作一到六年 生 ke 必修課程,共樣也係每週一節時間來上課,位 90 學年度開始辦理。為著政 府 ke 明文規定,當多種客語教材 ke 編輯就開始成立,逐隻客家人口數 kha 多 ke 地方政府、逐隻教科書出版商抑係相關 ke 單位,就有自家來編寫課本 ke 規則 lâu 方法,ti 標音、用字 lâu 內容方面也出現無共樣 ke 問題。

鍾屏蘭講到:

客家語言文字長期未被整理研究,所以目前客語的書寫文字比起國語複雜很 多。尤其民國八十年初客語的研究如雨後春筍般地展開,各種教材紛紛編輯撰寫,

有些迫於時間,急就章之下不免借同音或同義字使用,或以各種方式造字,使得 客語用字紛亂不一。49F1

借音抑借義字,漢語裡肚 kha 少用著、m̀知愛來 ngióng é 寫 ke 漢字,就會發 展出借字,另外也有常見漢字發展出別 ke 意義,讀者無經過深厚 ke 考證,第一 pái 來看客語讀本 ke 時節就會認為客語用字艱澀、m̀ 好理解,這 teû 用字係非常

1 鍾屏蘭,〈從語料庫的開發探討課語教材的編輯語出版〉,國立屏東大學教育學院 編《屏東教 育大學學報 教育類》第 36 期(2011 年 3 月號),頁 350。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

38

m̀熟識 ke,可能 me 認為客語單淨有音但無字,kha 遽 ke 方式係用漢語說法直接 來轉客語 ke 發音。這對客語 ke 發展來講實在係 yi 無 chhái kûng,除 thet 政府有 厥對應 ke 方法,想辦法來穩定拼音方式 lâu 公告正式選用字彙以外,客語語料 庫 ke 建置也做得講非常重要,若係有 kha 完整 ke 語料庫,建立起客語字頻、詞 頻等資料 ke 話,做得來尋出客語 ke 常用詞彙,kha 好 ke 來解決客語課本編寫品 質無 án 穩定 ke 問題,同時節 me 做得來照學習者自家 ke 語言程度 lâu 客話分 級,分語言學習者同研究者就做得來多加運用。

ti 台灣,本土語言語料庫 ke 發展情形同漢語來相比係較毋 la ke,賴惠玲認 為:

在中文語料庫方興未艾、蓬勃發展之際,相形之下,不論是書面語或口語語 料,本土語言語料庫的缺乏更為明顯。以客語為例,客語在兩岸三地均有使用人 口,台灣客語的人口也不少,南北地區及各次方言間的異同也往往反應次文化的 差異,但比起中文的相關研究已具規模,客語的研究資源相當貧乏。因為缺乏充 足的語料,而增加客語研究的困難度,無法對客語進行更全面、更深入、更廣泛 的探討,導致促進客語研究的能量不足,是以客語語料庫的建立更是刻不容緩。

50F

2

客話語料庫裡肚來選擇 ke 文本,用字無共樣係第一 ke 愛來面對到 ke,因為 長透以來無發展出標準化、規範性 ke 文字化文本,有部分客話有音無字,創作 者大部分用自家來造字抑借字 ke 方式來處理,各自為政 ke 結果,就形成了同音 同義竟然無共字 ke 問題,對語料庫 ke 建置還有推廣來講,就相當無利便。有關 文字書寫 ke 異用情形,為著對研究軟體設計 lâu 詞頻統計 ke 精確度 kha 利便,

主張應該 lâu kì統合起來。

2 賴惠玲,〈客語語法研究議題的開發:以語料庫為本〉,客家委員會 編《96 年補助大學校院 暨獎助客家學術研究計畫成果發表會論文集》(台北:行政院客家委員會,2007 年),頁 4。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

39

統合 ke 原則有幾下隻方式來處理,同音同義但係無共字,譬如講「玩」ke 客話「liao」音,時常出現 ke 字有「聊」、「撩」、「尞」、「料」等寫法;「旁邊」ke 客話(sun11)有「唇」、「脣」、「滣」、「漘」等字;「不」的客語(m11)有「無」、

「毋」、「唔」、「不」、「莫」、「冇」等字,其中「無」、「莫」、「冇」也可能用來表 示「沒有」(mo11)ke 用法,thò ke 否定句句法裡背出現到融合利用 ke 狀況,假 使講這 teû 字又 lâu 別 ke 詞素結合,成為一 ke 新 e 詞彙,文字做得交錯選用,

又變加複雜。這種異用文字 ke 書寫對客語語料庫 ke 建立係一種煩愁,若係用字 不同,會影響字頻、詞頻 ke 計算,出現相差,本當係共樣一 ke 意義 ke 詞彙,

但係因為幾下種用字來 lâu 頻度分開,分高頻字詞變作非高頻字詞,這實在 m̀係 ên lí所樂見 ke 事情,故所 ti 電腦軟體打字 ke 時節就定著愛來規範固定用字。

第一,遵照教育部來公布 ke「臺灣客家語書寫推薦用字」作為標準,頂高講 ke「玩」就會全部變作「尞」字、「不」全部變作「毋」字。第二,無 thò ke 教育 部公布推薦用字裡背 ke 字,就會用客委會初、中高級檢定考試 ke 用字來做標 準,頂高講 ke「旁邊」變作「唇」。假使兩者就無,就用教育部國語會 ke「台灣 客家語常用詞典」查詢結果共樣,譬如講,表示完成語意 ke「已經~了」,客話 ôn to「thet2」,「食忒」、「做忒」,固定來使用「忒」字。cun ke 就用電腦打字做得 處理、用字普遍通用,請教學者專家等原則來選字。過來,堵著無共音無共字但 係同意義 ke 情形 ke 時節,譬如講「蘿蔔」(lo11 pet5)、「菜頭」(chhoi55 theu11), 菜頭係受到 ho-ló 話 ke 影響,但係既經係客話裡肚輒常來使用 ke 詞彙。這種為 著南北位所差別,對東西 ke 號名有無共樣 ke,為到保存文化特色 ke 考慮,基本 上就會保留。虛詞部分抑有許多無共樣 ke 字,語氣助詞裡背時常看著 ke「啊、

呀、咧、欸、哩、喔、哦、哪、喲、唷、囉、噢、阿哦」等等,因為 lâu 助詞頭 前 ke 詞語有連音關係,也分 kì保留為準。51F3

3 參考鍾屏蘭,〈從語料庫的開發探討客語教材的編輯與出版〉,屏東教育大學教育學院 編《屏 東教育大學學報─教育類》第 36 期(2011 年 3 月號),頁 360-361。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

40

賴惠玲共樣也提出解決方式:

客語在建構語料庫上有其不同於漢語語料或西方語料之符碼不足(缺字)以 及選字爭議之問題,對於缺字問題,我們暫以拼音取代漢字,並在拼音後加註類 似字形或語意,如客語的「㧯」字,在語料輸入時以 lau5(㧯;meaning:和、

同)來呈現,又如「𨃰」字,以 kiam1(𨃰;meaning:跨、越)表示。另一個用 字爭議問題來自各文本對某些爭議字選字不一,如表領屬標記之「个」字,有些 作者用「介」字,有些作者用「個」字,有些作者則以拼音 ge 或 ke 表示,為了 便於語料之搜尋與檢索,此語料庫的用字統一勢在必行,為了解決用字不一致之 現象,我們以徐兆泉所著《台灣客家話辭典》為本,在輸入語料時,同時進行語 料判讀,有用字爭議時,即查閱《台灣客家話辭典》,以達到用字之統一。52F4

本研究 ke 文本範圍係 80 年代本土文學運動開始以後,用客話來創作 ke 客 語新詩作品,也想愛利用這 teu 作品文本整理出一隻客語新詩語料庫,當多 sa 詩 人 ke 作品共下來比較,對共隻詞彙係用 mak kai 漢字去表現?比較以後做得來 看著,哪隻漢字係較輒常來分人使用 ke、哪位詩人也可能有自家較慣勢使用 ke 漢字,用這隻語料 ke 比較去分析這下客話漢字 ke 選擇情形。

愛做語料庫,就愛先來確定 ngióng 般正係客話 ke「詞」。參照鍾屏蘭 ke 整 理,「詞」ke 定義係一 ke 語句裡背,有完整概念、做得自家來自由運用 ke 基本 單位。一 ke 分詞單位做得用幾下種標準來 lâu kì分類:

(一) 詞意做 m̀得用組合 ke 詞素直接相加來得到,應該看作一 ke 新分 詞,因為組合以後,意思既經改變,無限制到 kì原本 ke 意義。譬如講

「食晝」係「吃午餐」之意,「食」本當係「吃」、「晝」本當係「白天、

中午」ke 意思,做 m̀得兩 ke 直接相加來理解。「做得」係漢語講「可

4 賴惠玲,〈客語語法研究議題的開發:以語料庫為本〉,客家委員會 編《96 年補助大學校院 暨獎助客家學術研究計畫成果發表會論文集》(台北:行政院客家委員會,2007 年),頁 7。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

41

以」,既經同原來「做」lâu「得」ke 意思無共樣。

(二) 詞類做m̀得對組合 ke 詞素直接得到,應該看作一 ke 新 e 分詞。譬 如講「好搞」係好玩 ke 意思,「好」係副詞、「搞」係動詞,兩者相加 會變作一 ke 新 e 形容詞,做得分副詞來修飾(當、盡、蓋)等等,譬 如講「車仔當好搞」(車子很好玩)。

(三) 附著詞素,就係 ên lí講 ke 前綴、後綴詞,應該 lâu 頭前、背尾 ke 詞素共下算做一 ke 分詞單位。譬如講「老虎」、「阿公」、「筷仔」、「蛇 哥」、「鑊頭」,「虎」、「阿」、「仔」、「哥」、「頭」這 teû 詞綴就做 m̀得考 慮厥本意,這隻詞正經 ke 意義會對厥 ke 前(後)詞來形成。

(四) 「偏正式結構」ke 雙音節詞彙看作一 ke 分詞單位。譬如講「甜粄」、

「舊曆」、「路項」,係複數字彙組成新 ke 最細詞彙。

(五) 「並列式結構」ke 雙音節詞彙看作一 ke 分詞單位。例如「鬧熱」、

「歡喜」、「東西」、「大小」等。

(六) 「主謂式結構」ke 雙音節詞彙看作一 ke 分詞單位。例如「肚飢」、

「天光」、「地動」等。

(七) 「動賓式結構」ke 雙音節詞彙看作一 ke 分詞單位。例如「食飯」、

「睡目」、「行路」等。

(八) 「動補式結構」ke 雙音節詞彙看作一 ke 分詞單位。例如「做忒」、

「看著」、「食飽」、「洗好」等。

(九) 專有名詞、固定語句抑係外來語看作一 ke 分詞單位。固定語包含 成語、慣用語。

(十) 有固定意義 ke 重疊詞彙看作一 ke 分詞單位。ti 客話 ke 語法結構 裡肚,重疊字係當重要的 ke 概念,做得分作詞素重疊、鑲嵌重疊 lâu 全

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

42

部重疊原則,像下背:

詞素重疊 AA 式:遽遽、綿綿、憨憨、定定 詞素重疊 AAB 式:夾夾滾、槓槓滾

詞素重疊 ABB 式:面臭臭、嘴擘擘、頭纍纍、白雪雪 詞素重疊 AABB 式:辛辛苦苦、鬧鬧熱熱、齷齷齪齪

詞素重疊 ABB 式:面臭臭、嘴擘擘、頭纍纍、白雪雪 詞素重疊 AABB 式:辛辛苦苦、鬧鬧熱熱、齷齷齪齪