第一章 緒論
第四節 名詞釋義
茲將本研究所涉及的重要名詞,分別界定如下:
一、閩南語
究竟閩南語的定義為何,許多學者持有不同的意見。吳守禮(1997)在〈一 百年來的閩南系台灣話研究回顧〉當中,進而為「台灣話」正名,他認為臺灣話 雖然淵源自福建閩南,然而歷經了交替的政權統治,除了參雜外來語言,隨環境 的變遷亦逐漸起了微妙的變化,加上原本閩南方言分裂現象展露端倪,而推陳出 新的產出了新的語言,所以應該稱做「台灣話」。此外,他亦提到七種有關於臺 灣話的「別名」,分別是福建話、福佬話、河洛話、鶴佬話、學佬話、貉貉、仡 佬(犵狫)。
「臺灣閩南語」有人習慣稱為:「臺語」、「臺灣話」、「閩南語(話)」、「河 洛話」、「福佬話」、「鶴佬話」,其實所指的對象都相同,也就是指在臺灣使 用的「閩南語」,有別於在福建、廣東甚至於南洋新加坡、菲律賓等地所使用的 閩南語(林慶勳,2001)。
梁烱輝在〈閩南語的淵源〉之教育理念中提及「閩南語」一詞,認為最早應 該是出現在吳守禮於1948 年 5 月《台灣公論報‧台灣風土》之〈閩南語之性格〉
一文。〈「河洛」乎?「福佬」乎?「貉獠」乎?──臺灣閩南語正名〉文中對 於社會上口語所稱的「ho11 lo53」語詞,整理出彭德修、洪惟仁、林再復、陳修、
許成章…等學者提出的幾個對應漢字現象,作者認為「河洛」一詞多屬八、九十 歲以上長輩所用,而「貉獠」、「鶴佬」、「福佬」等稱謂,五、六十歲以下人 多用之,以「鶴佬」、「福佬」較為普遍。作者從語音變化的學理追溯,認為閩 南語詞「ho11 lo53」一詞,對應漢字「河洛」二字,更具證據力。反對母語教學的 教科書上,冠以「福佬」二字,稱臺灣閩南語族,主張臺灣閩南語族在本土文化 的教育環境中,首要之務就在正名,「ho11 lo53」一詞所對應的漢字,就是「河洛」
二字(梁烱輝,2003)。
在〈沒有名字的語言?-「台灣話」、「閩南話」還是Hoh-lo 話〉文中指出,
這個語言總共有十七種不同稱呼,並可分做分做三種類:台語類、閩南語類與Holo 語類,一般而言閩南語族都自稱「台灣話」或是「台語」,為了避免在政治、學 術上不必要的紛爭,因此通常稱做閩南語(李勤岸,2007)。
綜合上述學者觀點,本研究所稱之閩南語,是指由大陸閩南的泉州及漳州一
帶所傳來的語言,在臺灣受到南島語、荷蘭語、日本語、華語的影響,並結合了 臺灣當地的風土文化,經過數百年的發展和變化,所產生的一種語言,且保存臺 灣特色的語言。本研究中所討論之閩南語,與教育部公告之「臺灣閩南語」、九 年一貫課程綱要中,鄉土語言所界定之閩南語或民間簡稱的「臺語」相同。
二、教科書
所謂的教科書,可以算是學生主要的學習資源,是教師教學的重要參考依據,
以及政府達成教育目標重要途徑之一。
教科書有狹義和廣義的兩種定義:從狹義方面視之,指專門為學校教學所出 版的書籍。從廣義方面而言,包括了原本並非為學校教學而出版,但是教師教學 時,採用了該本書的內容,來做為教學的資料,如此也可以稱作教科書(嚴翼長,
1989)。依照課程標準,將各科目教學內容做系統化編排,供學校教學使用且印 刷成冊的書籍(曾火城,1997)。
在本研究所稱的教科書,實指民間出版社出版,供學校教師教學及學生學習 所使用的書籍。
三、臺灣閩南語推薦用字詞
教育部為了推廣臺灣閩南語教學,整合臺灣閩語系混亂用字情形,經長時間 整理用字後,於2007 年 5 月 30 日頒布「臺灣閩南語推薦用字(第 1 批)」,共 有300 字詞;2008 年 5 月 1 日公佈第二批 100 字詞。第二次除了公佈「臺灣閩南 語推薦用字(第 2 批)」,同時也公佈「臺灣閩南語卡拉 OK 正字」字表,其目 的主要為瞭解決閩南語伴唱帶歌詞字幕,閩南語漢字與華語漢字混淆情形,更希 望生活中,大眾更加認識與瞭解臺灣閩南語漢字。
第 1 批與第 2 批之選用原則相同,所選漢字多為民間傳統習用之通俗字,惟 第2 批在字表中,增加了「屬性」一欄,讓民眾更瞭解該字之屬性;例如「透早」
(thàu-tsá)一詞,於屬性欄中即標示為「本字」。而主要選用標準有二,分別為 傳統習用原則、音字系統性原則。傳統習用原則又細分為本字、訓用字、借音字 之相關原則。
四 、 字 型 / 字 次 / 詞 型 / 詞 次 (character type/character token/word /word token)
type
綜合Roger Garside, George Leech & Tony McEnery (1997:33) & Ruslan Mitkov (2003:203)說法,在一種語言中的文章裡,會出現很多不同的詞,這些詞在辭典 中各有其代表的意思,這每一個詞就是一種「詞型」(word type);而某個詞型出現 的次數則稱為「詞次」(word token)。
舉「臺灣猶原堅定徛佇遮」為例,其詞型共有六種,分別為「臺灣」、「猶原」、
「堅定」、「徛」、「佇」、「遮」;而其詞次分別為「臺灣」1 次、「猶原」1 次、「堅 定」1 次、「徛」1 次、「佇」1 次、「遮」1 次。
以漢字書寫的文本,詞與詞間沒有分隔,雖然詞的定義有相關的標準,但是 仍有部分模糊地帶,因此對於漢字文本,我們也可用字(character)為單位計算。每 個字就是一種「字型」(character type),而詞在文章中出現的次數則稱為「字次」
(character token)。
舉「囡仔提了歡歡喜喜離開遐」為例,分析這句話,其字型共有九種,分別 為「囡」、「仔」、「提」、「了」、「歡」、「喜」「離」、「開」、「遐」;而其字次分別為
「囡」1 次、「仔」1 次、「提」1 次、「了」1 次、「歡」2 次、「喜」2 次、「離」1 次、「開」1 次、「遐」1 次。
五、高頻字/高頻詞(high frequency character /high frequency word)
(一)高頻字:將一份文本中所有的字型,依字次由高到低排列,前百分之十的字型,我 們視之為高頻字。
(二)高頻詞:
將一份文本中所有的詞型,依字次由高到低排列,前百分之十的詞型,我 們視之為高頻詞。
六、覆蓋率(coverage rate)
把詞語以出現頻率從高到低排比出來,除了各個詞的頻率之外,再計算累積 百分比。一個詞的累積百分比表示如果從最高頻的詞到這個詞都算上,這些詞在 語料裏就佔有所有詞語的這個百分比,也就是覆蓋率(鄭錦全,1998)。
七、整體高頻字/整體高頻詞
(一)整體高頻字:在五個版本的所有字型中,由字次最高的字型開始選取,直到選取的字型 其累積字次,能大於或等於全部字次的百分之五十,也就是這些字型的「覆 蓋率」(coverage rate)能大於或等於百分之五十,這些選出的字型,稱之為 整體高頻字。
(二)整體高頻詞:
在五個版本的所有詞型中,由詞次最高的詞型開始選取,直到選取的詞型 其累積詞次,能大於或等於全部詞次的百分之五十,也就是這些詞型的「覆 蓋率」(coverage rate)能大於或等於百分之五十,這些選出的詞型,稱之為 整體高頻詞。