• 沒有找到結果。

國民小學台語教科書詞彙比較

N/A
N/A
Protected

Academic year: 2022

Share "國民小學台語教科書詞彙比較 "

Copied!
100
0
0

加載中.... (立即查看全文)

全文

(1)

國立台東大學華語文學系 台灣語文教師碩士班碩士論文

指導教授:楊允言 先生

國民小學台語教科書詞彙比較

研究生:蔡佩娟 撰

中 華 民 國 99 年 9 月

(2)
(3)
(4)
(5)
(6)
(7)

謝 誌

論文的完成首要感謝的是指導教授楊允言老師的悉心指導,論 文寫作的過程中,不斷的鼓勵,給予我們信心,協助我們處理語料 庫資料中的各種問題。感謝張學謙老師創設台灣語文教師碩士研究 專班,讓我能從另一種嶄新的目光重新認識台語,老師常提及「語 言花園」,引領我們察覺語言的獨特與珍貴,老師們犧牲假期為台語 的存續努力,為了台語的語言復振馬不停蹄,每年暑假為我們帶來 學識上的豐富饗宴,感恩口試委員何信翰老師針對論文給予寶貴的 意見,於此對老師們獻上最深的敬意與謝意。

每年暑假能負笈台東求學,對於擔任教職十餘載的我而言彌足 珍貴,重拾上課、準備報告的學生生活,雖然辛苦卻令人回味無窮。

在台東的生活一切順利要感恩台東達人正擁、愛珍、蒼林、麗華、

歲玲、及班代秀卿的照顧,同窗好友明珊的陪伴與鼓勵。

求學期間感恩有家人的支持與關懷,讓我能心無旁騖上課及撰 寫論文,感謝我的公公林茂榮先生及婆婆蘇淑惠女士幫忙照顧女 兒,感謝先生奕翔的叮嚀與關懷,讓我的論文得以如期完成。

佩娟 謹誌 2010.09

I

(8)

國民小學台語教科書詞彙比較

(9)

國民小學台語教科書詞彙比較

蔡佩娟

國立台東大學 台灣語文教師碩士班

摘要

本研究以語料庫語言學的方法分析國民小學「台灣閩南語」教科書的詞彙,

探討詞型、詞次、台華共同詞、台語特別詞的比例,教育部閩南語推薦用字使 用情形,並分析台語教科書中句子的長度,進行學習階段間的比較,了解台語 教科書詞彙編輯概況,將此結果作為台語教科書的選用之參考。

台語教科書五個版本中,詞型最多的是安可版,其次是翰林版、康軒版、

巧兒版,詞型最少的是真平版;然而,詞彙豐富度最高的卻是真平版53.40%,

依次是安可版、康軒版、巧兒版,翰林版的詞彙豐富度最低。五個版本台語教 科書的學習總量差異相當大:翰林版總量最高3739 個詞次,安可版次之有 3471 個詞次,康軒版2380 個和巧兒版 2291 個較前兩個版本少 1000 個以上的詞次,

真平版學習總量最少,總詞次僅1731 個,不及翰林版總詞次的二分之一。

台語教科書五個版本中,巧兒版中的台語特別詞比例最高,依次是康軒 版、安可版、真平版,翰林版台語特別詞的比例最低。巧兒版平均句長最短僅 有5.007 個音節,平均句長較長的是翰林版 6.029 個音節及康軒版 5.961 個音節。

依照國民中小學九年一貫課程綱要的規定,教育部應著手規劃本土語教材 的審定工作,應建立本土語教科書的審定機制,由審查機關審定通過後,再由 學校選用,避免現行教材中用字歧義及羅馬拼音錯誤的問題;國民小學學生組 的語文競賽本土語字音字形比賽,可依據附錄中的台語教科書高頻詞詞彙作為 字音字形比賽的題庫。

關鍵詞:語料庫、詞彙、台語、教科書

III

(10)

國民小學台語教科書詞彙比較

(11)

The Comparison of Taiwanese Vocabulary in Different Elementary Textbooks

Tsai-Pei-Jen

National Taitung University Taiwan Language Teacher Department, MA Programs

Abstract

This research aims to analyze “Taiwanese” vocabulary in the elementary textbooks with the methodology of corpus linguistics, probing into word types, word tokens, the common words of Taiwanese and Mandarin, the percentage of the specific Taiwanese words, and using condition of the Ministry of Education

recommended Taiwanese words. Also, it analyzes sentences’ length in the textbooks, compares what’s going on in different learning stages, tries to understand the words’

editing profile of Taiwanese textbooks, and presents the results as reference to the selection of Taiwanese textbooks.

As for the amount of word patterns in the five Taiwanese textbook versions, the first one is Unco, then Han Lin, Kang Hsuan, Chao Er, and the last is Zhen Ping.

However, according to the priority of word richness standard, the highest is Zhen Ping, counting for 53.40%, following Unco, Kang Hsuan, Chao Er, and the lowest Han Lin. The amount of learning words varies greatly: Han Lin has the largest amount of 3,471 words, the next is Unco’s 3,471, then Kang Hsuan’s 2,380 and Chao Er’s 2,291, both less more than 1,000 words than the former two versions; the last one is Zhen Ping, with an amount of merely 1,731 words, not even reaching Han Lin’s 1/2.

In the five Taiwanese textbook versions, Chao Er has the highest percentage of specific Taiwanese words, what takes in turn is Kang Hsuan, Unco, Zhen Ping, and Han Lin gets the lowest. When it comes to the average sentence length, the shortest

V

(12)

國民小學台語教科書詞彙比較

is Chao Er’s 5.007 syllables, and the longer ones are Han Lin and Kang Hsuan, with 6.029 and 5.961 syllables respectively.

In compliance with General Guidelines of Grades 1-9 Curriculum for Elementary and Junior High School Education, the Ministry of Education is supposed to begin the examination of local language textbook scheme. The examination mechanism of local language textbook should be set up, and, after being passed by the authority, schools may select their own textbooks to avoid the problems of diverse word meanings and wrong Romanization script in the current textbooks. As for Local Language Pronunciation and Grapheme Contest of Elementary Students’ Language Competitions, high frequency words in Taiwanese textbook can act as the question database.

Key Words: corpus linguistics, vocabulary, Taiwanese, textbook

(13)

目 次

第一章 序 論 ... 1

第一節 研究動機...1

第二節 研究問題...1

第三節 研究目的...2

第四節 研究範圍...3

第五節 名詞解釋...4

第二章 文獻分析... 7

第一節 語料庫語言學 ...7

第二節 母語教育的發展 ...10

第三節 教科書編輯內容分析面向 ...12

第四節 國小本土語教科書的選用與評鑑 ...14

第三章 研究方法... 15

第一節 研究方法...15

第二節 研究架構...16

第三節 研究流程與步驟 ...17

第四章 結果分析與討論... 22

第一節 台語教科書詞彙豐富度比較結果 ...22

第二節 台語教科書台華共通詞分析 ...35 VII

(14)

第三節 台語教科書各語句音節長度數量、詞彙學習量分析 ...39

第四節 各版本詞彙使用之綜合評比 ...56

第五章 結論與建議 ... 59

第一節 台語教材的詞彙比較結果 ...59

第二節 台語教材的使用建議 ...61

參考文獻... 63

附錄 ... 73

(15)

表目錄

表3 - 1 台語教科書出版年份彙整表 18

表3 - 2 研究語料格式 19

表4 - 1 巧兒版各冊詞彙豐富度分析 ...22

表4 - 2 巧兒版高頻詞統計表 ...23

表4 - 3 安可版各冊詞彙豐富度分析 ...24

表4 - 4 安可版高頻詞統計表 ...25

表4 - 5 真平版各冊詞彙豐富度分析 ...26

表4 - 6 真平版高頻詞統計表 ...27

表4 - 7 康軒版各冊詞彙豐富度分析 ...28

表4 - 8 康軒版高頻詞統計表 ...29

表4 - 9 翰林版各冊詞彙豐富度分析 ...29

表4 - 10 翰林版高頻詞統計表 ...30

表4 - 11 台語教科書詞彙豐富度比較表 ...31

表4 - 12 康軒版國語教科書第 3、7、11 冊詞彙豐富度統計表 ...33

表4 - 13 台語教科書台共通詞及台語特別詞數量分析表 ...37

表4 - 14 巧兒版詞彙數量及總音節數 ...40

表4 - 15 安可版詞彙數量及總音節數 ...41

表4 - 16 真平版詞彙數量及總音節數 ...42

表4 - 17 康軒版詞彙數量及總音節數 ...43

表4 - 18 翰林版詞彙數量及總音節數 ...44

表4 - 19 以音節數統計巧兒版的平均句長 ...46

表4 - 20 以音節數統計安可版的平均句長 ...47

表4 - 21 以音節數統計真平版的平均句長 ...48

表4 - 22 以音節數統計康軒版的平均句長 ...49

表4 - 23 以音節數統計翰林版的平均句長 ...50

表4 - 24 以音節數統計五個版本台語教科書的平均句長 ...51

表4 - 25 以詞彙數量統計巧兒版的平均句長 ...52

表4 - 26 以詞彙數量統計安可版的平均句長 ...53

表4 - 27 以詞彙數量統計真平版的平均句長 ...53

表4 - 28 以詞彙數量統計康軒版的平均句長 ...54

表4 - 29 以詞彙數量統計翰林版的平均句長 ...54

表4 - 30 以詞彙數量統計五個版本台語教科書的平均句長 ...55

表4 - 31 台語教科書各冊詞型數量比較 ...56

表4 - 32 台語教科書詞型評分表 ...56

表4 - 33 台語教科書詞彙豐富度評分表 ...57

IX

(16)

表4 - 34 台語教科書台語特別詞比例評分表 ...57

表4 - 35 以音節數統計台語教科書五個版本的平均句長比較表 ...57

表4 - 36 以音節數統計台語教科書句長評分表 ...58

表4 - 37 以詞彙數統計台語教科書句長評分表 ...58

表4 - 38 評分統計表 ...58

(17)

圖目錄

圖4 - 1 巧兒版各冊詞彙豐富度分析 ...22

圖4 - 2 安可版各冊詞彙豐富度分析 ...24

圖4 - 3 真平版各冊詞彙豐富度分析 ...26

圖4 - 4 康軒版各冊詞彙豐富度分析 ...28

圖4 - 5 翰林版各冊詞彙豐富度分析 ...30

圖4 - 6 台語教科書五種版本詞型.詞次數量 ...31

圖4 - 7 台語教科書詞彙豐富度比較 ...32

圖4 - 8 康軒版國語教科書詞型及詞次 ...33

圖4 - 9 台語教科書台華共通詞及台語特別詞比例 ...38

圖4 - 10 巧兒版詞彙數量及總音節數 ...40

圖4 - 11 安可版詞彙數量及總音節數 ...41

圖4 - 12 真平版詞彙數量及總音節數 ...42

圖4 - 13 康軒版詞彙數量及總音節數 ...43

圖4 - 14 翰林版詞彙數量及總音節數 ...44

圖4 - 15 以音節數統計巧兒版的平均句長 ...46

圖4 - 16 以音節數統計安可版的平均句長 ...47

圖4 - 17 以音節數統計真平版的平均句長 ...48

圖4 - 18 以音節數統計康軒版的平均句長 ...49

圖4 - 19 以音節數統計翰林版的平均句長 ...50

圖4 - 20 以音節數統計五個版本的台語教科書平均句長折線圖 ...51

圖4 - 21 以詞彙數量統計台語教科書平均句長變化折線圖 ...55

XI

(18)
(19)

第一章 序 論

第一節 研究動機

教育部於98 年 7 月 15 日公布修正國民中小學九年一貫課程綱要語文學習 領域閩南語課程綱要1,自100 學年度由 1 年級、7 年級逐年向上實施,閩南語 課程綱要將學習階段劃分成國小低、中、高年段及國中4 個學習階段,能力指標 由原有的233 條刪減修正成 102 條。教育部說明 92 年公布的能力指標太難,因 此大幅修改閩南語課程綱要能力指標,刪除太難的指標,精簡合併相近的能力指 標。課程綱要與架構、教材編輯內容、教師教學的方法皆是教學中的重要因素,

目前應檢視現行的本土語教材的適切性,做為未來編修中台語教材的參考。

本研究想運用語料庫語言學的方法檢視現行國民小學台語教材,「詞彙」教 學是語文學習課堂中的基石,從國民小學選用的台語教材內容組織層面探究,現 行的台語教材詞彙選編的概況。以「台語教科書詞彙」為研究的主題。

第二節 研究問題

國民小學九年一貫課程綱要規定本土語每週僅有1 節的授課時間,因此台 語教材中文章體裁大多侷限於兒歌或詩歌等韻文體裁,因為這種韻文式的教材句 子短,學生可快速累積台語詞彙學習的經驗,因此可進一步探討本土語教材篇章 內詞彙的呈現詳細情形如何?詞彙的教學是否能做到逐年增加豐富度?是否富多 樣性?還是使用的詞彙單一不斷重複而沒有變化?未來台語教科書編輯需再大 幅簡化國民小學的台語教材嗎?

台語教科書的選編的篇章中,運用的詞彙屬於台華共同詞及台語特別詞比

1教育部98 年 7 月 15 日台國(二)字第 0980112647D 號函

1

(20)

例為何?如果台華共同詞的比例高,台語每週1 節及國語每週 5 至 7 節兩種語言 的教材,教學相輔相成,差可符合兒童學習語言的進程;但是,如果台語教科書 低中高3 個不同的學習階段的內容,一直充斥著諸多台華共通詞,這種著重教材 的易讀性的學習設計,無法提升學童使用本土語詞彙的能力,喪失本土語學習的 契機,因此有必要進一步檢視台語教科書中台語特別詞彙呈現的情況。

另外,統計分析台語教科書語句音節長度來探討教科書的句法安排是否能 逐年加深?學童台語的學習不應僅只停留於台語的聽說能力,應進一步有計畫性 的發展台語的讀寫能力。

台語教科書編輯除了考慮內容外是否兼顧國小學童的身心發展,詞彙安排由 淺入深,高頻詞是否安排在學習進程的初期即進行教學?教材中的詞彙量太多還 是太少,再考量台華共同詞後分析台語特有語彙的分布?語句音節的長度是否隨 兒童年齡的增長而逐冊增加?據此建立教科書詞彙組織的評鑑標準,審視各版本 教科書編輯的適切性。

第三節 研究目的

一、比較國民小學台語教科書各種版本的詞頻、詞型、詞次及計算各種版本的詞 彙豐富度。

二、分層抽樣舉例比較國民小學國語教科書的詞彙豐富度。

三、統計國民小學台語教科書中使用台華共通詞的比例。

四、檢核國民小學台語教科書中保留台語特有的詞彙的比例。

五、國民小學台語教科書各版本各個學習階段語句長度的研究。

六、檢核國民小學台語教科書依學習進程編排詞彙教學之情形。

(21)

第四節 研究範圍

自從2001 年九年一貫課程施行以來,民間出版的國民小學台灣閩南語教材 包含有仁林、階梯、明台、開拓、光復、台灣文藝、真平、安可、康軒、南一、

翰林、巧兒等版本,部份縣市政府亦依地區特性著手進行編輯本土語教材,但經 過9 年的淬鍊後,民間出版業者僅有真平、安可、康軒、翰林、巧兒等五種教材 持續編印,南一、仁林、階梯、明台、開拓、光復、台灣文藝版等已不再出版。

依國民中小學九年一貫課程綱要的規定,國民中小學教科書應依法由審查機關審 定通過後,由學校選用,但實際上九年一貫課程七個學習領域中,僅有語文學習 領域的本土語言教科書,教育部未進行教材的審定工作,未建立本土語教科書的 審定機制,未能對162 萬學子2所使用的本土語教材把關。以高雄市為例,97 學 年開始高雄市、高雄縣、屏東縣市三縣市聯合辦理未審定教科圖書的議價採購作 業,高雄市教育局要求各個學校不能隨意選用沒有參與議價作業的版本,目前可 供選用的版本是安可版、真平版、巧兒版、翰林版、康軒版等五個版本。

本研究即是以安可版、真平版、巧兒版、翰林版、康軒版等五個版本為研究 對象:安可版自2007 年出沿用迄今,預計 99 學年度再編印修訂版,故本研究採 2007 年發行的版本,真平版採 2007 年出版,2009 年修訂的第三版,巧兒版未標 註出版年,研究語料係2010 年取得,書籍已加註成書採用教育部公布之台灣羅 馬拼音用字等資訊,翰林版係2009 年修訂版、康軒版為 2007 年初版,2009 年 出版的第三版教材。

另詞彙豐富度研究以康軒版國語課本為例,低中高三個學習階段,各抽取一 冊教材,統計國語教科書的詞頻、詞彙豐富度,檢視台語國語教科書詞彙使用數 量頻率之差異,作為對照比較。

2 教育部統計處 http://www.edu.tw/statistics/index.aspx

3

(22)

第五節 名詞解釋

一、台語教科書

國民小學本土語言教材的命名為「台語課本」或「閩南語課本」,真平版稱 為台語,康軒版稱為閩南語。王育德(2000)的看法是台灣話和福建話在音韻方面 已有顯著的差異;許極燉(1992)亦認為台灣話又稱做台語,通常指的是從漳州、

泉州來的移民語言,三、四百年來獨自發展,時至今日他和大陸的閩南語已有顯 著差異。董忠司(2001)指出十七世紀末年,台灣通用的語言是「漳泉濫」的閩南 語,在日本人來台初期,將此種由閩南語加上其他語言成分的新融合語言稱為「台 灣語」。根據以上論述,本文中以「台語」稱之,不再進一步討論教科書名稱。

二、詞彙

「詞」是語言中最小的可以自由運用的獨立音義單位。一個語言裡所有語詞 和固定詞組的總稱。除一般語詞外,並包括古語、方言、外來語詞及各科術語等。

或作「詞匯」、「語匯」、「語彙」。

三、音節

王育德(2000)認為「音節」是指和語意結合的語言形態(linguistic form)的音 節而言。純粹屬於語音形式(phonetic form)者一律除外,例如 bia、nam,並非無 法發音,但對台語並無意義可言。

四、詞型與詞次

文本中出現的各種不同語義及不同語音的詞彙,「詞型」即詞彙類型,每一 種詞彙類型代表其特定的意義;「詞次」是詞型的計量,表示該詞型出現的次數。

以康軒版第8 冊第 2 課為例,「火車欲行行鐵枝」,詞型有「火車」「欲」「行」「鐵 枝」4 種,而詞次分別為「火車」1 次,「欲」1 次,「行」2 次,「鐵枝」1 次。

(23)

五、台華共通詞

台華共通詞係指台語和華語共有的詞彙,此種詞彙在台語和華語表徵的詞形 相同,華語的詞義至少有一種和台語共通,僅發音不相同之詞彙,稱之為台華共 通詞。

六、台語特別詞

台語特別詞是相對於台華共通詞,有別於漢語的記法,同一詞義台語特別詞 可能是用字不同,也可能是台語特有的用法,形、音、義皆不相同。

七、詞彙豐富度

相同詞次的文本中,使用的詞型越多,詞彙豐富度越高;詞彙豐富度係將文 本的詞型數除以總詞次。

八、覆蓋率

鄭錦全(1998)把詞已出現頻率從高到低排比出來,除了各個詞的頻率之外,

再計算累積百分比。一個詞的累積百分比表示如果從最高頻的詞到這個詞都算 上,這些詞在語料裡就佔所有的百分比,這就是覆蓋率。衛乃興(2001)亦解釋覆 蓋率指的是從詞頻表上按頻率次序選取的一定數量的單詞,確定它們在全部語料 中所佔的百分比。

5

(24)
(25)

第二章 文獻分析

第一節 語料庫語言學

一、語料庫的定義、應用與研究

語料庫是大量自然語言素材的有限集合,蘇新春(2010)強調語料庫應是「大 量」及「有序」的,而且語料庫的形式必須是電腦可以處理,而且要有處理這些 語言素材的軟體,是成為語料庫的基本要件。

衛乃興(2001)解釋語料庫語言學是以真實的語言為研究對象,對大數量的語 言進行分析,從中找出語言使用的規律;語言分析以實際使用語言現象的出現概 率為依據進行分析。何安平(2004)轉述 Graeme Kennedy 的看法指出語料庫研究 的四個層面:1.探討某個詞的出現頻率,出現語境以及鄰近的搭配的「詞彙層 面」。2.運用有語法標注的語料庫,研究各種詞性標記的組合模式以及對各類句 型做量化分析的「句法層面」。3.研究口語和書面語篇章的連貫和銜接的語言基 礎的「篇章結構」。4.研究各種篇章的語言特徵,進而構立語篇分類的語言標準 的「篇章類型」。

黃居仁(2006)「中文詞彙特性速描系統」Chinese Word Sketch (CWS)在 Sketch Engine 的平台上結合鉅量語料庫與詞彙語法等資源,產生語法與與語意關係的資 源,提供了詞彙特性描述(word sketches)、語法關係(grammatical relations)以及同 義詞分佈(distributional thesaurus) )的查詢,可以自動抽取相關共現詞彙、論元結 構、獨特搭配詞彙等等訊息。鄭錦全(2008)利用現代漢語語料庫,計算出 22 萬 個句子每句詞語及漢字的數目,得出最高頻次的長度是15 個詞語或 17 個漢字,

最高頻的50%的句長在 4 到 20 個詞語或 6 到 32 個漢字之間。

因語料庫語言學的發展使得語料庫得以應用在語言教學、語言研究以及語言 工程等。衛乃興(2001)說明語料庫的運用大致有以下五種:1.語言頻率統計︰以

7

(26)

定量分析為主,以定性分析為輔,在外語教學中,利用詞彙頻率統計訂定常用詞 彙表,成為語言教學的重點。2.辭典編纂:建立語料庫編纂辭典,每一個詞條都 有詞頻的統計結果,而且每個例句都是實際使用的真實例句,不是憑空杜撰的。

3.詞彙搭配研究:詞彙搭配受到詞義、用法、文化、習慣的影響,不再依賴語言 學家主觀語感,語料庫中大量的真實語料提供了一個客觀分析的依據。4.語言教 學:學習者在語料庫可查詢詞彙的用法、詞彙的搭配、詞義的細微差別等。5.自 然語言處理:將語料庫語言學的方法應用在語音辨識系統中,在機器翻譯的自然 語言處理系統中,可以大幅提高可靠性及效率。

二、 台語語料庫

早期有台語文語料庫語言學的研究,但語料庫多為研究者自行建構,並未公 開。國家台灣文學館從2001 年 5 月開始為期四年,執行「台灣白話字文學資料 蒐集整理」計畫,蒐集到一千多本的白話字書刊,並將部分有文學性的作品打字 建檔。高成炎、楊允言、江永進(2003-2004)執行「台語文文化推廣網站建構計畫」, 將全羅馬字的台語文資料建立聲音檔,可利用網路查詢與線上學習。 高成炎 (2004-2005)執行「台語文數位典藏資料庫(第一階段)──台語文全羅文字語音輸出 系統」。楊允言、張學謙執行「台語文數位典藏資料庫(第二階段)──台語文學線 上博物館」,網站上呈現258 萬音節的台語文學資料,亦開發台語文語料整理重 要且基礎的工具程式:計有漢羅/全羅對照台語文的線上校對系統,以及全羅台 語文的文本統計系統,可統計文本的段落、句、語詞、音節的數量,另有數字調 號轉圖形顯示系統及羅馬字拼字檢查系統。

楊允言、張學謙(2005)建立超過 900 萬音節以上的台語文文本,透過台語文 音節及語詞頻率統計,對台語文用字問題提出建議。

張學謙(2000)嘗試辨認影響台語語體變異的深層言談面向,刻畫語體的篇章 關係,辨認出五個深層言談面向:一、人際關係 vs.表達資訊;二、個人情感的 表達;三、說服面向:邏輯 vs.空間的連接;四、敘述面向;五、具親和力的說

(27)

明vs.詳細報導。

楊允言(2009)執行「教育部台語詞頻調查」計畫,提供教育部九年一貫課程 綱要中台語學習、教材編輯或辭典編輯的參考,建構至少有100萬台語語詞的基 礎語料庫,並統計台語的字詞頻,提供一個語詞檢索系統提供一般民眾使用。

9

(28)

第二節 母語教育的發展

一、 語言流失與語言復振

台灣因為特殊的政治環境,面臨數次外來政權的殖民宰制,影響台灣各族群 母語使用與母語傳承。先是日治時期第一次世界大戰1919 年後,日本政府實施 同化政策,加強推廣「國語」,第二次世界大戰日本侵華1937 年後,更是加強實 施「皇民化」政策,要求台灣居民使用日語、用日本姓名,採用日本風俗禮儀;

再者是1945 年國民政府遷臺後,制訂「獨尊國語」的語言政策,掌握政治權利 的族群往往認為自己的母語才夠格稱為『語言』,而被支配族群的母語只是『方 言』只適合在低下階層使用,無法登大雅之堂。」(施正鋒,2003),各個族群的 自尊心、自信心、自我認同感逐漸消彌,獨尊「國語」而將自己的母語視如敝屣,

「台灣人母語滅種的徵兆,表現在母語使用的人口減少、母語使用的場合縮減以 及使用母語的能力減退」(鄭良偉,1990),這種消滅其他族群文化的國語政策,

實為台灣各族群傳統語言流失的最大禍因。

台灣因為政治影響教育,政治介入教育,母語成了弱勢語言,學校成了完全 禁止母語交流的場域,隨著時間的長河的流逝,六十年來,華語成為我們接觸最 多、使用最頻繁的語言,年輕的父母只是會聽但不太會說、更不愛說母語,他們 已喪失說流利母語的能力,更遑論他們下一代說母語的能力。長久以來弱勢族群 的文化、弱勢族群的語言如同達爾文筆下『弱肉強食』中淪為俎上肉的祭品,強 勢的種族經由政治的拑制,經濟的宰制,將弱勢族群的文化逐步消滅,「語言爭 議而引起的族群衝突是二十世紀諸多民族國家的特徵之一。代表支配族群利益的 國語政策對國語地位的追求往往忽視弱勢族群之語言人權。爭議的原由一方面來 自語言多樣性的社會現實,另一方面則源自語言、政治與族群認同之間的複雜關 係,或語言政治。」(周澤南,2005)。獨尊華語,醜化母語的語言政策,致使族 群語言嚴重流失,台灣亦被聯合國教科文組織列為語言瀕危的地區。

(29)

雖然十幾年來透過國內外學者的呼籲,及國內語言意識的初步覺醒,對於台 灣本土語言政策有諸多評論與反省;弱勢語言的流失、傳統母語的傳承問題,在 在引發深入的討論與分析。經由教育政策的訂定,母語教育方能嶄露頭角,在公 共的教育場所進行,但一般大眾不能意識到語言流失的嚴重問題,第一線的教育 工作者、學校行政推動者,沒有基本的「語言多樣性」及「語言人權」意識,不 能了解母語復振的重要性,母語教育之路困難重重。Fishman(1991)的『挽救語言 流失』理論為「族語教學不能只在學校進行而已,族語的學習應從家庭和社區開 始並且透過學校再教育,呼籲家長在家庭和社區中盡量教導孩子說族語促使社區 部落之族人之重視,結合地方精英,教會人士和各階層的力量營造一個良好的族 語學習與使用環境。」各族群先提升族語保存意識,由社區家庭開始,ㄧ顆顆的 語言種子在每個家庭開始播種,才能期待語言活力復甦的花朵隨處綻放,成為一 個可以使傳統語言存活的溫馨花園。

二、 國民小學本土語教育的設置

楊智穎(2006)提到鄉土語言課程在學校教育中的歷史發展,依時間順序而論 從解嚴前的懸缺課程(null curriculum),至 82 年版「國民小學課程標準」以「鄉 土教學活動」的科目型態在學校「正式課程」中呈現,到了90 學年度所實施的

「國民中小學九年一貫課程暫行綱要」,則又轉變為「鄉土語言」納入課程中實 施。

教育部92 年 5 正式公布國民中小學九年一貫課程綱要,97 年修訂九年一貫 課程綱要,其中總綱及閩南語課程綱要暫緩公布,閩南語課程綱遲至98 年 7 月 才修訂完成。教育部指出:閩南語課綱研修小組,不調整課程名稱、中年級開始 教拼音為原則、拼音系統不統一,現行閩南語課綱分為三個階段,共233 條能力 指標,其中聆聽58 條、說話 85 條、標音 16 條、閱讀 48 條、寫作 28 條;修訂 後分成四個階段,刪除並整併能力指標,修正後共102 條,其中聆聽 27 條、說 話32、標音 13 條、閱讀 16 條、寫作 14 條;總綱修訂將「鄉土」改為「本土」,

鄉土語言課程改稱為本土語言課程。

11

(30)

第三節 教科書編輯內容分析面向

一、 本土語教科書編輯分析

李欣珉(2008)統計閩南語民間版教科書詞彙使用的詞次以康軒版(4132 個) 最多,真平版(2934 個)最少;詞型數以安可版(1684 個)最多,南一版(1301 個)最 少。評鑑教科書的標準是字詞型數、字詞型次是否依序增加數量、高頻字詞屬於 整體高頻字詞的比例、有利整體高頻詞學習、使用教育部推薦用字用詞比例以及 考慮用字歧異情形予以評比,分數由高到低依序是真平版、康軒版、翰林版、南 一版、安可版。

吳秀梅(2002)以高雄市客家語教材為樣本,分析常用詞及詞頻。關於國小本 土語教科書的詞彙研究有劉秀珍(2005)透過問卷調查高雄市客家語教材的語詞 是否按照常用詞、次常用詞依序安排在低年級、中高年級教材中。

林素琴(2009)調查台北縣一年級鄉土語教師使用臺北縣國民小學本土語言 教材的意見,依物理、內容、使用、發行等四個屬性分析,其中有內容與認讀的 詞語太少;課文不符學生學習階段之程度;教學CD 內容過於簡單等問題。

陳介裕(2006)的研究使用詞彙次數、詞性、事類、構詞等來分析本土語教材。

二、 詞彙研究

一篇文情並茂妙筆生花的文章是數個層次分明的段落組成,數個流暢的句 子串成段落,詞彙、字錯落有致的堆疊成句。葉德明(1997)認為「字」、「詞彙」

是學習的基礎,「字」具有獨立與重組兩種特性,大多數的「字」不是有意義的 單位,「詞彙」才能表情達意,只探討字的數量與頻率無法達到語言評量的目的。

教育部國語推行委員會(2000)為了解國民小學教科書各家版本收錄字詞情 形,針對國小學童常用字詞作一調查,與年度語詞調查、大陸小學教科書字詞調 查等成果比較,再與市面上各版本教科書做比較。

(31)

三、 本土語詞彙研究

曾國榕(2008)探討學術和非學術這兩種不同文體在語詞選用方面的差異,台 華共通詞、詞彙豐富度、台語詞彙平均長度三個向度上學術類使用比例高於非學 術類。

顏國仁(1995)利用計算機語言學的方法將蒐集的口語語料,分別建立字頻 率、詞頻率、雙字組頻率三種統計表格,強調詞頻調查有助於字典的編篡及教育 用字的決定,利用Zipf’s Law 探討頻率和排序的關係,以「字」的統計結果為例,

將兩者取對數,兩者的關係在 x-y 坐標平面上呈現為一斜直線,斜率為-0.967,

「詞」的斜率e 為-1.1761,雙字組直線並不明顯,斜率值為-0.747,最後,提出 建立台語口語語料庫、加註音標標記、文法功能標記的語料庫,助於電腦語音輸 入或翻譯等建議。

13

(32)

第四節 國小本土語教科書的選用與評鑑

一、 國小本土語教科書的選用

林惠貞(2008)以彰化縣和美鎮國民小學所使用的三年級閩南語教科書為研 究對象,依出版、物理、內容、教學四個特性作分析,其中出版特性再細分為編 者、發行人、編輯流程、費用、附屬服務五個項目,物理特性依版面設計、印製、

裝訂、紙質分析,內容特性則依學理依據,學習目標、教材內容、教材單元架構 四個項目,而教學特性亦有三個分析細項:教學設計、學習評量、教學資源,從 課文的字數和句子的長短來探討教材的難易度,得知康軒、真平、南一、全教會 四個版本三年級的教材難度並無顯著的差異,教材單元架構的延續性以字在各課 課文的重複出現的數量,或是同一冊重複出現的數量來探討教材的延續性,四個 版本皆能提高字詞出現的頻率,讓兒童反覆練習而臻於精熟。

二、 國小本土語教科書的評鑑

現行教材過於重視易讀性,過於簡化教材(陳麗華,2009)。國立編譯館於進 行教科書評鑑時以編印設計、課程目標、學習內容、結構組織、語文使用、教學 實施與評量、輔助措施為評鑑的面向。教育部委託黃嘉雄等著(2003)依學習領域 的個別特性分別建立教科書評鑑指標,分為出版特性、課程目標、學習內容、內 容組織、教學實施、輔助措施等六大項目。林于弘(2009)指出:教育部這個評鑑 表的內容雖然兼具量的統計與質的描述,但是,確實針對國語文教科書的科目特 色加以分析研討,才是更有意義的統計,生字數量、文體比例、能力指標等細節 內容,都必須有更精確的數字佐證,才能得到合理的推論或解釋;另外,不少問 題的觀察與考驗,無法僅以單一的冊別來評斷,也要衡量冊與冊,年級與年級,

乃至階段與階段之間的銜接。鄭良偉等(2004)亦受教育部委託進行鄉土語文教科 書評鑑,其中教科書結構組織分析則依體裁多樣化、單元結構完整、新詞、新句 型和內容由淺到深,漢字的安排則考量學生對漢字的熟悉度來分析。

(33)

第三章 研究方法

第一節 研究方法

本研究採用語料庫語言學及內容分析研究,下列分別說明之。

語料庫語言學

語料庫語言學是蒐集大量的真實語料,應用電腦進行龐大資料的數據分 析。衛乃興(2001)闡釋語料庫語言學是以真實的語言數據為研究對象,對大數量 的語言事實進行分析,從中尋找語言使用的規則。

內容分析研究法

歐用生(1991)描述內容分析(content analysis)發展於二十世紀初,研究我們生 活中,各種訊息傳遞的意義,早期的研究對象現於大眾傳播媒介,之後為社會學、

歷史學等研究逐漸採用。馬信行(1998)提及 Berelson 在他於 1952 年所著的 Content analysis in communication research 一書中,對內容分析定義為「對明顯的傳導播 內容作客觀而有系統的量化並加以描述的一種研究方法,歐用生(1991)認為內容 分析是「透過量化的技巧以及質的分析,以客觀及系統的態度,鑑內容進行研究 與分析,藉以推論產生該項文件內容的環境背景及其意義的一種研究方法。」張 紹勳(2000)引述「客觀性」是在研究過程中,釐訂明確的規則和秩序進行每一個 步驟;「系統性」是採用和捨棄內容或類別時,必須有前後一致的法則;「定量性」

則是分析內容可按規則對加以計量,用數字比較符號文字出現的次數,以達到準 確的要求。

早期國內的教育研究採用內容分析法探討教科書中的偏見、意識型態等,

本研究採內容分析研究法,檢視目前國內九年一貫課程綱要施行下,國民小學所 使用的台語教科書的詞彙教材,並輔以語料庫語言學的方法,進行台語教材的詞 彙分析。

15

(34)

第二節 研究架構

國民小學台語教科書的詞彙比較研究分成三個部分,研究架構如下:

國民小學 台語教科書

詞彙比較

一.

詞彙豐富度分析

二.

台華共通詞分析

三.

語句音節長度分析

圖3 - 1 國小台語教科書的詞彙比較研究架構

一.詞彙豐富度分析

教科書課文中的每一詞彙的詞頻分析,列出常用詞彙表,並比較五個版本台 語教科書的詞彙豐富度,同時以康軒版國語課本為例,低中高三個年段,各取一 冊教材,統計國語教科書的詞頻、詞彙豐富度,檢視台語國語教科書詞彙使用數 量頻率之差異。

二.台華共通詞分析

分析台語教科書中台華共通詞的比例,台語特別詞在台語教科書呈現的情 形,提出教科書編輯的建議。

三.語句音節長度及詞彙學習量分析。

針對台語教科書的句、詞的學習量做一比較分析,五個版本的台語教科書能 否依學生的年齡發展逐次增加文本句子的長度。

(35)

第三節 研究流程與步驟

一. 教科書詞彙豐富度分析

台語教科書詞彙 比較

教科書詞彙豐富度 分析 建立微型語料庫

五個版本 台語教科書

蒐集語料

以康軒版二.四六年級 國語教科書為例

人工校對詞型

統計詞次.詞型

國語斷詞分析

人工校對詞型

統計詞次.詞型

比較台語教科書 詞彙豐富度

比較國語教科書 詞彙豐富度 台語文斷詞分析

依漢字羅馬字分開建檔

圖3 - 2 教科書詞彙豐富度研究流程

17

(36)

以98 學年度的國民小學民間出版的台語教科書為研究標的,包含巧兒版、

安可版、真平版、康軒版、翰林版五種版本。本研究所使用的語料出版年份如下 表:

表3 - 1 台語教科書出版年份彙整表

冊別 巧兒 安可 真平 康軒 翰林

一 未標示 2007 2009 三版 2009 三版 2009 修訂六版 二 未標示 2007 2010 三版 2010 三版 2010 修訂六版 三 未標示 2007 2009 三版 2009 三版 2009 修訂四版 四 未標示 2007 2010 三版 2010 三版 2010 修訂五版 五 未標示 2007 2009 三版 2009 三版 2009 修訂四版 六 未標示 2007 2010 三版 2010 三版 2010 修訂五版 七 未標示 2007 2009 三版 2009 三版 2009 修訂五版 八 未標示 2007 2010 三版 2010 三版 2010 修訂五版 九 未標示 2007 2009 三版 2009 三版 2009 修訂三版 十 未標示 2007 2010 三版 2010 三版 2010 修訂五版 十一 未標示 2007 2009 三版 2009 三版 2009 修訂三版 十二 未標示 2007 2010 三版 2010 三版 2010 修訂三版

1. 將蒐集研究語料、建立微型語料庫:上述國民小學台語教材 60 冊建立教科 書課文的電子檔,但不包含教材中的句型練習、語詞練習、附錄中的歌謠、古 詩詞等,課文內容包含漢字及羅馬拼音,羅馬拼音統一以教育部「臺灣閩南語 羅馬字拼音方案」標註,聲調部分因電腦系統便於處理以阿拉伯數字表示。

2. 依下列格式將台語教科書課文內容建立電子檔案,匯入語料庫。

(37)

表3 - 2 研究語料格式 版本 真平 書名 台語讀本1

出版者 真平企業有限公司 書寫系統 漢字

年級別 一上 出版年 2009

篇名 第一課 歡喜學台語

段 囡仔兄,囡仔姊,咱來做伙學台 語,一句來,一句去,台語世界 真趣味。

Gin2-a2-hiann1,gin2-a2-tsi2,lan2 lai5 tso3-hue2 oh8 tai5-gi2,tsit8 ku3 lai5, tsit8 ku3 khi3,tai5-gi2 se3-kai3 tsin1 tshu3-bi7.

篇名 第二課 真好禮

段 阿安阿安真好禮,看著人會問食 飽未,對人失禮會講真歹勢。

A1 an1 a1 an1 tsin1

ho2-le2,khuann3-tioh8 lang5 e7 mng7 tsiah8-pa2-be7,tui3 lang5 sit4-le2 e7 kong2 tsin1 phainn2-se3.

… ... ...

3. 將台語教科書的課文內容等研究語料使用楊允言漢羅台語文斷詞系統3(最大 逆向對比方法)進行斷詞,並將斷詞結果加註於羅馬拼音系統檔案中,如「世 界se3-kai3」。

4. 分析各個詞的詞頻,並作詞型及詞次分析,計算詞彙豐富度。

5. 進行國語教科書的詞彙豐富度分析,五種台語教科書版本中:真平版、安可 版、巧兒版沒有出版國語課本,98 學年度國語課本市場占有率康軒版較翰林 版高,故選擇康軒版國語課本進行詞彙豐富度的對照比較。

6. 康軒版國語教科書依低、中、高三個學習階段分層抽樣,因一年級上學期進 行注音符號教學,第12 冊因學生學習週次較少,課文內容較少,因此擇定康 軒版第3、7、11 冊建立文本語料。

7. 先將國語教材利用「中央研究院資訊科學所詞庫小組」研發之『中文斷詞系 統』4進行斷詞,人工校對整理,再計算詞頻。

8. 分析國語教科書中詞彙的詞頻,並作詞型及詞次分析,計算詞彙豐富度。

3漢羅台語文斷詞系統http://poj.likulaw.info/hanlo_hunsu.php

4中文斷詞系統http://ckipsvr.iis.sinica.edu.tw/

19

(38)

二. 台語教科書台華共通詞分析

台語教科書詞彙比較

台語教科書台華共通詞分析

利用中文詞庫 將教科書詞彙分類

統計台語教科書的台華共通 詞及非台華共通詞

重新統計台語特別詞比例

重新統計台華詞比例 人工校對

圖3 - 3 台語教科書台華共通詞分析研究流程

1. 以中華民國計算語言學學會「中文詞庫(八萬目詞)」5為對照標準,利用EXCEL 中的VLOOKUP函數,比對台語教科書的詞彙,找出台華共通詞及非台華共 通詞。

2. 人工校對詞彙類別,找出漢語台語詞形相同但詞義不同的共通詞。

3. 利用教育部國語推行委員會編纂之「重編國語辭典修訂本」檢核 8 萬目詞「中 文詞庫」所未羅列的台華共通詞。

4. 分別統計各版本台華共通詞及台語別詞的數量,並計算台華共通詞及台語別 詞的數量的比例。

5中華民國計算語言學學會中文詞庫http://www.aclclp.org.tw/use_ced_c.php

(39)

三. 台語教科書句子音節長度數量、詞彙學習量分析

台語教科書 詞彙比較

台語教科書各語句 音節長度分析

台語教科書 各冊音節數統計

台語教科書 詞彙學習量分析

以詞彙數計算 台語教科書平均句長

以音節數計算 台語教科書平均句長

圖3 - 4 台語教科書句長分析研究流程

1. 使用國家台灣文學館台語文數位典藏資料庫(第二階段)計畫中全羅台語文文 本統計(Word Count)程式6來統計台語教科書內容。

2. 文本統計程式是使用羅馬字進行統計,需將 60 冊台語教科書的課文以羅馬字 進行運算,因全羅台語文文本統計程式系統設定辨識『.』、『?』、『!』『:』等 符號做為斷句的標準,因此文章中的『,』、『;』符號,需另外校對修正後,再 進行音節統計。

3. 統計台語教科書每冊音節數及詞彙數。

4. 以音節統計台語教科書每冊每一個句子的平均長度。

5. 以詞彙統計台語教科書每冊每一個句子的平均長度。

6 全羅台語文文本統計程式http://203.64.42.21/nmtl/dadwt/pbk.asp

21

(40)

國民小學台語教科書詞彙比較

第四章 結果分析與討論

本研究以語料庫語言學的研究方法,將現行的民間出版的台語教科書教材 內容,建立一個微型資料庫,並運用教育部台灣閩南語字詞頻統計、國家台灣文 學館台語文數位典藏資料庫(第二階段)計畫中全羅台語文文本統計程式等資 源,分析比較台語教科書的詞彙,比較結果分述如下。

第一節 台語教科書詞彙豐富度比較結果

一.台語教科書詞彙豐富度分析

1.巧兒版:巧兒版詞彙豐富度維持 60%至 75%,可再增加高年級教材的的內容,

豐富詞彙。

表4 - 1 巧兒版各冊詞彙豐富度分析

冊別 1 2 3 4 5 6 7 8 9 10 11 12 詞型 136 103 130 130 116 135 141 181 182 183 148 167 詞次 192 155 185 173 182 187 231 239 248 303 198 247 詞彙豐富度 70.83% 66.45% 70.27% 75.14% 63.74% 72.19% 61.04% 75.73% 73.39% 60.40% 74.75% 67.61%

巧兒版詞彙豐富度

0 60 120 180 240 300 360 420 480 540

1 2 3 4 5 6 7 8 9 10 11 12

冊 別

數量

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00% 百分比

詞型 詞次 詞彙豐富度

圖4 - 1 巧兒版各冊詞彙豐富度分析

(41)

巧兒版共使用了1101 個詞型,總詞次為 2540,詞彙豐富度為 43.35%,常 用詞593 個可以覆蓋 12 冊課文的 80%,覆蓋率 20%的高頻詞羅列如下:

表4 - 2 巧兒版高頻詞統計表

編號 詞型 (臺羅拼音)

詞型

(漢字) 詞次 百分比 覆蓋率

1 tsı̍t 一 52 2.14% 2.14%

2 lâi 來 46 1.70% 3.84%

3 ê 的 41 1.66% 5.50%

4 tsia̍h 食 40 1.57% 7.07%

5 tsin 真 32 1.27% 8.34%

6 lí 你 27 1.18% 9.52%

7 guá 我 25 0.92% 10.43%

8 khì 去 23 0.87% 11.31%

9 tio̍h 著 22 0.83% 12.13%

10 ū 有 22 0.83% 12.96%

11 ài 愛 21 0.83% 13.79%

12 bô 無 19 0.83% 14.62%

13 tsiah 隻 19 0.79% 15.41%

14 lâng 人 17 0.70% 16.11%

15 kóng 講 16 0.70% 16.80%

16 sann 三 16 0.65% 17.46%

17 hōo 予 15 0.61% 18.07%

18 kah 到 14 0.57% 18.64%

19 khuànn 看 14 0.57% 19.21%

20 lia̍h 掠 14 0.57% 19.77%

21 beh 欲 13 0.57% 20.34%

巧兒版7有部分用字歧異的問題:「gâu」用字歧義,第 1 冊第 8 課、第 6 冊 第5 課、第 7 冊第 7 課用「敖」;第 9 冊第 2、4、7 課用字為 ,「徛khiā」第 9 冊第5 課,但第 8 冊第 8 課、第 2 冊第 9 課用「踦」,用字應統一,「讀書」音「tha̍k-tsu」

但第10 冊第 8 課為了要押韻將「讀書」標音為「tha̍k-si」,有塗跤、土跤兩種用 法應予以統一,「台灣人得咧講話」其中「得」音tī,根據教育部台灣閩南語推

7 第 1 冊第 5 課咧音 leh 誤植為 le̍h

23

(42)

國民小學台語教科書詞彙比較

薦用字為「佇」;「佮」的標音有冊kah及ka,建議修正為kah4;第 3 冊第 8 課、

第9 冊第 3 課tiàm用字為「踮」,但第 2 冊第 5 課、第 9 課、第 6 冊第 2 課用字 卻是「惦」,教育部推薦用字是「踮」,bih推薦用字為「覕」,但巧兒版教材中皆 使用「避」;第2 冊第 4 課「軟軟昧相觸」及第 4 冊第 2 課「三暝三日行昧到」

其中「昧」可和第11 冊一樣修正成推薦用字『袂』;第 9 冊第 4 課蠓仔文中「出 手tshut-tshiú 給kā 予i 搧一下siàn--tsı̍t-ē」,kā教育部推薦用字為「共」,「i」漢字 為「予」,形音義皆不相符,建議修正;另外文章中亦出現了「來賽跑」「掃掃地」

「小胖哥」等華語用詞。

2.安可版:

第1、2、4 冊詞彙豐富度低,在第一個學習階段詞彙豐富度低,符應兒童 學習的需求,安可版詞彙豐富度最高的是第3 冊 88%,第 12 冊詞彙豐富度偏低,

建議再修改。

表4 - 3 安可版各冊詞彙豐富度分析

冊別 1 2 3 4 5 6 7 8 9 10 11 12 詞型 119 108 110 138 156 152 239 219 320 283 364 229 詞次 177 171 125 205 224 201 289 330 480 408 511 350 詞彙豐富度 67.23% 63.16% 88.00% 67.32% 69.64% 75.62% 82.70% 66.36% 66.67% 69.36% 71.23% 65.43%

安可版詞彙豐富度

0 60 120 180 240 300 360 420 480 540

1 2 3 4 5 6 7 8 9 10 11 12

冊 別

數量

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00% 百分比

詞型 詞次 詞彙豐富度

圖4 - 2 安可版各冊詞彙豐富度分析

(43)

安可版共使用了1724 個詞型,總詞次為 3470,詞彙豐富度為 49.68%,常 用詞593 個可覆蓋 12 冊課文的 80%,覆蓋率 20%的前 22 個高頻詞羅列如下:

表4 - 4 安可版高頻詞統計表

編號 詞型 (臺羅拼音)

詞型

(漢字) 詞次 百分比 覆蓋率

1 ê 的 87 2.42% 2.42%

2 tsı̍t 一 59 1.67% 4.09%

3 sī 是 55 1.59% 5.68%

4 guá 我 49 1.41% 7.09%

5 ū 有 46 1.24% 8.33%

6 lâi 來 41 1.18% 9.51%

7 tī 佇 36 1.04% 10.55%

8 lí 你 29 0.81% 11.35%

9 tio̍h 著 28 0.81% 12.16%

10 ài 愛 27 0.78% 12.94%

11 lán 咱 27 0.78% 13.72%

12 ē 會 25 0.72% 14.44%

13 tsin 真 25 0.69% 15.13%

14 a-bú 阿母 22 0.63% 15.76%

15 beh 欲 20 0.58% 16.34%

16 lóng 攏 19 0.55% 16.89%

17 tsia̍h 食 19 0.55% 17.44%

18 hōo 予 18 0.52% 17.95%

19 kah 佮 18 0.52% 18.47%

20 khì 去 18 0.52% 18.99%

21 khoo 箍 15 0.43% 19.42%

22 siōng 上 15 0.43% 19.86%

安可版中「抑著」音ia̍h-tio̍h,第 11 冊第 6 課音標卻標示為 īa- tio̍h 建議修 正;安可版有三種詞彙出現異用字的問題,「iáu-koh」用字有「猶擱」及「猶閣」,

推薦用字為「閣」,應將第11 冊第 5 課修正為「猶閣」;「mı̍h-kiānn」出現兩種 寫法「乜件」和「物件」;「m̄-thang」有「無通」及「毋通」兩種寫法,詞頻統 計時仍分開計算,詞型不予以合併;另外,「做夥」一詞可修正為教育部推薦用 字「做伙」。

25

(44)

國民小學台語教科書詞彙比較

3.真平版:

真平版各冊的詞彙豐富度介於73.33%至 86.67%之間。

表4 - 5 真平版各冊詞彙豐富度分析

冊別 1 2 3 4 5 6 7 8 9 10 11 12 詞型 75 71 90 95 91 110 99 117 103 153 155 183 詞次 99 83 114 125 105 150 115 143 137 185 208 266 詞彙豐富度 75.76% 85.54% 78.95% 76.00% 86.67% 73.33% 86.09% 81.82% 75.18% 82.70% 74.52% 68.80%

真平版詞彙豐富度

0 60 120 180 240 300 360 420 480 540

1 2 3 4 5 6 7 8 9 10 11 12 冊 別

數量

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00%

百分比

詞型 詞次 詞彙豐富度

圖4 - 3 真平版各冊詞彙豐富度分析

真平版共使用了905 個詞型,總詞次為 1730,詞彙豐富度為 52.311%; 558 個詞彙可以覆蓋12 冊課文的 80%,前 20 個詞覆蓋率為 18.27%,但第 21 個至第 32 個詞型詞次皆為 7,故條列至覆蓋率 23.11%的高頻詞:

(45)

表4 - 6 真平版高頻詞統計表

編號 詞型 (臺羅拼音)

詞型

(漢字) 詞次 百分比 覆蓋率

1 ê 的 41 2.37% 2.37%

2 lí 你 33 1.91% 4.28%

3 khì 去 28 1.62% 5.90%

4 lâi 來 20 1.16% 7.05%

5 tsin 真 20 1.16% 8.21%

6 ū 有 17 0.98% 9.19%

7 guán 阮 15 0.87% 10.06%

8 guá 我 13 0.75% 10.81%

9 tsia̍h 食 13 0.75% 11.56%

10 tsı̍t 一 13 0.75% 12.31%

11 hó 好 12 0.69% 13.01%

12 sī 是 12 0.69% 13.70%

13 tuā 大 12 0.69% 14.39%

14 lán 咱 11 0.64% 15.03%

15 lóng 攏 11 0.64% 15.66%

16 ài 愛 10 0.58% 16.24%

17 beh 欲 9 0.52% 16.76%

18 hōo 予 9 0.52% 17.28%

19 leh 咧 9 0.52% 17.80%

20 tsò 做 8 0.46% 18.27%

21 kah 甲 8 0.46% 18.73%

22 bē 袂 7 0.40% 19.13%

23 gún 阮 7 0.40% 19.54%

24 i 伊 7 0.40% 19.94%

25 in 7 0.40% 20.35%

26 kiânn 行 7 0.40% 20.75%

27 khuànn 看 7 0.40% 21.16%

28 lâng 人 7 0.40% 21.56%

29 pue 飛 7 0.40% 21.97%

30 ta̍k-ke 逐家 7 0.40% 22.37%

31 tau 兜 7 0.40% 22.77%

32 tī 佇 7 0.40% 23.18%

27

(46)

國民小學台語教科書詞彙比較

4.康軒版:

第1 冊、第 8 冊的詞彙豐富度最高,但考量剛入學一年級新生的學習情況,

應選編詞彙豐富度較低的教材來進行教學,低年級的教材詞彙豐富度高,高年級 的教材詞彙豐富度反而偏低,可再修正教材,調整教材內容及順序。

表4 - 7 康軒版各冊詞彙豐富度分析

冊別 1 2 3 4 5 6 7 8 9 10 11 12 詞型 88 91 108 90 123 117 157 132 209 179 210 216 詞次 108 119 136 121 170 175 204 161 301 260 300 314 詞彙豐富度 81.48% 76.47% 79.41% 74.38% 72.35% 66.86% 76.96% 81.99% 69.44% 68.85% 70.00% 68.79%

康軒版詞彙豐富度

0 60 120 180 240 300 360 420 480 540

1 2 3 4 5 6 7 8 9 10 11 12 冊 別

數量

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00%

百分比

詞型 詞次 詞彙豐富度

圖4 - 4 康軒版各冊詞彙豐富度分析

康軒版98 學年度國民小學「閩南語」課本,第 1 冊至第 12 冊課文中,共使 用了1078 個詞型,總詞次為 2366;詞彙豐富度為 45.56%,覆蓋率 20%的高頻 詞羅列如下:

(47)

表4 - 8 康軒版高頻詞統計表

編號 詞型 (臺羅拼音)

詞型

(漢字) 詞次 百分比 覆蓋率

1 ê 的 59 2.49% 2.49%

2 guá 我 40 1.69% 4.18%

3 beh 欲 34 1.44% 5.62%

4 khì 去 31 1.31% 6.93%

5 kóng 講 31 1.31% 8.24%

6 lâi 來 29 1.23% 9.47%

7 sī 是 28 1.18% 10.65%

8 tsin 真 27 1.14% 11.79%

9 tsı̍t 一 27 1.14% 12.93%

10 ū 有 27 1.14% 14.07%

11 gún 阮 18 0.76% 14.84%

12 khuànn 看 18 0.76% 15.60%

13 koh 閣 18 0.76% 16.36%

14 lí 你 18 0.76% 17.12%

15 i 伊 16 0.68% 17.79%

16 kah 甲 16 0.68% 18.47%

17 tō 就 15 0.63% 19.10%

18 kah 佮 14 0.59% 19.70%

19 tuā 大 14 0.59% 20.29%

20 ài 愛 12 0.51% 20.79%

康軒版中第11 冊第 3 課「抑若 ah-nā」,而第12 冊第 3 課使用 á-nā「啊若」,

建議修正為一致的詞彙。

5.翰林版:

翰林版詞彙豐富度最高的是第3 冊 75%,第 1 冊 71.59%,從第 8 冊開始詞 彙豐富度反而降低了,僅有58.73%至 51.88%,與學生的學習需求不同,可再提 高高年級教材的多樣性,選編詞彙較豐富的文本。

表4 - 9 翰林版各冊詞彙豐富度分析

冊別 1 2 3 4 5 6 7 8 9 10 11 12 詞型 63 102 123 131 174 189 199 208 269 261 249 278 詞次 88 162 164 201 265 307 281 363 458 468 480 502 詞彙豐富度 71.59% 62.96% 75.00% 65.17% 65.66% 61.56% 70.82% 57.30% 58.73% 55.77% 51.88% 55.38%

29

(48)

國民小學台語教科書詞彙比較

翰林版詞彙豐富度

0 60 120 180 240 300 360 420 480 540

1 2 3 4 5 6 7 8 9 10 11 12

冊 別

數量

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00%

90.00% 百分比

詞型 詞次 詞彙豐富度

圖4 - 5 翰林版各冊詞彙豐富度分析

翰林版98 學年度國民小學「臺語」課本,第 1 冊至第 12 冊課文中,共使用 了1358 個詞型,總詞次為 3736 個,詞彙豐富度為 36.35%;613 個詞彙可以覆 蓋12 冊課文的 80%,覆蓋率 20%的高頻詞羅列如下:

表4 - 10 翰林版高頻詞統計表

編號 詞型 (臺羅拼音)

詞型

(漢字) 詞次 百分比 覆蓋率

1 ê 的 181 4.84% 4.84%

2 guá 我 113 3.02% 7.86%

3 tsı̍t 一 70 1.87% 9.74%

4 lí 你 47 1.26% 10.99%

5 ū 有 46 1.23% 12.22%

6 sī 是 41 1.10% 13.32%

7 tī 佇 41 1.10% 14.42%

8 i 伊 38 1.02% 15.43%

9 lóng 攏 33 0.88% 16.31%

10 kah 佮 31 0.83% 17.14%

11 lâng 人 31 0.83% 17.97%

12 kóng 講 30 0.80% 18.78%

13 khì 去 29 0.78% 19.55%

14 kiânn 行 29 0.78% 20.33%

(49)

第2 冊第 1 課「飛龍機」標音為 hui-lîng-ki,可與第 6 冊第 4 課同樣標音為 hue-lîng-ki,翰林版用字已依據教育部推薦用字修改,「佇」改為「咧」,「合」改 為「佮」,「每」改為「逐」,「到」改為「 」,惟有第7 冊第 2 課仍用「到」,因 此,計算詞頻時予以修正;「干但」一詞教育部推薦用字為「干焦」音讀kan-na,

課本中標音為kan-ta 及 kan-tann,歸併為同一詞型,同理,「落」標音有 lo̍h 但 第12 冊第 3 課為古詩,因此標註讀音為 lo̍k,詞頻合併計算,「啥乜」音 siá-mı̍h 或作siánn-mı̍h 詞頻合併計算,依教育部台灣閩南語推薦用字可修正為「啥物」,

若音ná 又音 nā,詞頻合併計算,第 6 冊第 4 課「踮」音 tiàm,第 11 冊第 3 課

「 」音tiàm 兩處用字不同;「做伙」tsò-hué 第 7 冊第 3 課用字為「做夥」;「拍 phah」有拍球、拍噗仔等詞彙,但第 10 冊第 4 課用字為「扑拳」宜修正統一用 字,「倒踢正踢」其中倒表方位方向音to3、「風颱吹 倒其中「倒」為動詞音 tó,詞頻分開計算,「 詞次9,教育部推薦用字則是「袂」。

將巧兒、安可、真平、康軒、翰林五個版本的詞型及詞次總數做一比較,並 統計五個版本的詞彙豐富度,如下表。

表4 - 11 台語教科書詞彙豐富度比較表

版本 巧兒 安可 真平 康軒 翰林

詞型 1101 1725 907 1078 1358 詞次 2540 3471 1731 2366 3736 詞彙豐富度 43.35% 49.70% 53.40% 45.56% 36.35%

台語教科書詞型詞次數量

0 500 1000 1500 2000 2500 3000 3500 4000

巧兒 安可 真平 康軒 翰林

版本

數量

詞型 詞次

圖4 - 6 台語教科書五種版本詞型.詞次數量

31

(50)

國民小學台語教科書詞彙比較

台語教科書詞彙豐富度

0.00%

5.00%

10.00%

15.00%

20.00%

25.00%

30.00%

35.00%

40.00%

45.00%

50.00%

55.00%

60.00%

巧兒 安可 真平 康軒 翰林 版本

百分比

詞彙豐富度

圖4 - 7 台語教科書詞彙豐富度比較

詞彙豐富度最高的是真平版,豐富度高達53.40%,接下來依序是安可版 49.70%,康軒版和巧兒版相近分別是 45.56%和 43.35%,而翰林版詞彙豐富度較 低,僅達36.37%。

二.康軒版國語教科書的詞彙豐富度

比較台語教科書和國語教科書的詞彙豐富度,因康軒版、翰林版目前仍持 續出版台語及國語教材,98 學年度國語課本市場占有率康軒版較翰林版高,故 選擇康軒版國語課本第3、7、11 冊進行詞彙豐富度的對照比較。

先將康軒版國語教科書第3、7、11 冊課文內容,利用「中央研究院資訊科 學所詞庫小組」研發之『中文斷詞系統』進行斷詞,人工校對整理,分析康軒版 國語教材中的詞彙,統計此三冊的詞型及詞次,並計算詞彙豐富度。

康軒版第3 冊國語課本共使用 556 個詞彙,即詞型數為 556 個,總詞次 1767,

詞彙豐富度為31.47%;康軒版第 7 冊國語課本共使用 1851 個詞彙,詞型數為 1851 個,總詞次 4613,詞彙豐富度為 40.13%;康軒版第 11 冊國語課本共使用 2388 個詞彙,詞型數為 2388 個,總詞次 6718,詞彙豐富度為 35.55%。

(51)

康軒版第3 冊、第 7 冊、第 11 冊國語課本中,這 3 冊比較的結果第 3 冊詞 彙豐富度最低,能依學習者的語言發展的歷程,在低年級的學習階段安排詞型較 少,詞彙豐富度31.47%的篇章作為學習教材;詞型數、詞次數居次的是中年級 第七冊的教材,詞彙豐富度是這3 冊中最高的達 40.13%,但高年級教材的詞次 雖達6718,但詞型數偏低卻只有 2388,詞彙豐富度反而較中年級第 7 冊低。康 軒版98 學年國語教材第 3 冊、第 7 冊、第 11 冊的詞彙豐富度平均為 35.71%。

表4 - 12 康軒版國語教科書第 3、7、11 冊詞彙豐富度統計表

冊別 詞型數 總詞次 詞彙豐富度

第3 冊 556 1767 31.47%

第7 冊 1851 4613 40.13%

第11 冊 2388 6718 35.55%

康軒版國語教材詞彙豐富度

0 1000 2000 3000 4000 5000 6000 7000 8000

第3冊 第7冊 第11冊

册 別

詞型

/

總詞次

0.00%

10.00%

20.00%

30.00%

40.00%

50.00%

60.00%

70.00%

80.00% 詞彙

度百分比

詞型數 總詞次 詞彙豐富度

圖4 - 8 康軒版國語教科書詞型及詞次

33

(52)

國民小學台語教科書詞彙比較

同時比較康軒版第3 冊、第 7 冊、第 11 冊的台語教科書及國語教科書的詞 型數及詞彙豐富度,結果如下:

國語教科書

冊別 詞型數 總詞次 詞彙豐富度

第3 冊 556 1767 31.47%

第7 冊 1851 4613 40.13%

第11 冊 2388 6718 35.55%

台語教科書

冊別 詞型數 總詞次 詞彙豐富度

第3 冊 108 136 79.41%

第7 冊 157 204 76.96%

第11 冊 210 300 70.00%

(53)

第二節 台語教科書台華共通詞分析

要提高台語教學的成效,須從學生的舊經驗出發,配合學生的語言發展,對 學生而言,由於國語學習領域的學習時數為本土語的5 至 7 倍,因此台語課本中 的「台華共通詞」,學生能掌握詞義及詞形,只需針對詞彙的讀音加強練習,以 一部漢語辭典為對照工具,將5 種版本各 12 冊的課文,逐一核對,找出各種版 本中的台華共通詞的詞型,詳列比較台華共通詞在本土語教科書的比例,從高比 例台華共通詞的課文入門,可降低學生學習的負擔,減少本土語學習的阻力,適 應兒童學習的進程。

另一方面一套闡釋本土特色文化,合乎本土語言文學表現的台語教科書,

亦是我們對台語教科書的深厚寄望,希冀學生能透過本土語教科書的學習對本土 語言有更深一層的認識。國民中小學九年一貫課程綱要的課程目標論及文化的意 涵,現行的本土語教材是否具備這樣的功能與特色,分析本土語教材中的詞彙使 用情形,統計教材中的台語特別詞的比例,藉此檢視台語教科書是否充斥高比例 的台華共通詞,僅重視教材的易讀性而忽略台語特別詞的教材。

台華共通詞以中華民國計算語言學學會「中文詞庫」為對照的基準,「中文 詞庫」係由中央研究院中文詞知識庫小組執行、研究,並授權中華民國計算語言 學學會發行。此詞庫為一包含8 萬目詞的電子辭典,收錄的詞包含一般用詞、常 用專有名詞、成語、慣用語、合併詞以及少數特殊領域用語和古漢語詞語等。

初步的得到的結果,再輔以教育部國語推行委員會編纂之「重編國語辭典 修訂本」檢核8 萬目詞「中文詞庫」所未羅列的台華共通詞,並將非台華共通詞 中的專有名詞及表示數量的數字等扣除,統計台語別詞的數量。

一.巧兒版

「受氣」台語課本中的詞義是「生氣」,但華語中「受氣」是遭人折磨、凌 虐或承受天地自然之氣之意,詞型相同但意義不同,不能列為台華共通詞,將這 一類的詞型揀選出來,歸類為台語特別詞。第8 冊第 4 課:「檨仔青酸濫甜」其

35

(54)

國民小學台語教科書詞彙比較

中「濫」漢語的意義有水漫溢、輕率、過度等與台語課文中詞義不同,亦不能列 為台華共通詞。

初步統計巧兒版台華共通詞有630 個,非台華共通詞有 470 個,但台華共 通詞中「叨、昧、袂、遐、乎、予、甲、蓋、跤、劊、濫、閣、跋、銑、咧、惦、

揣、兜、行、蕊、走、阮、受氣」等23 個詞彙,華語字典雖出現相同字樣,但 其語意用法與台語課本不同,故歸併為台語特別詞。非台華共通詞中有1 個專有 名詞「打狗」;8 個量詞;而「歡歡喜喜」、「快快樂樂」、「粿」、「路口」、

「麵線」、「門口」、「平平安安」、「三合院」、「第一」、「一下」等18 個詞歸併為台華共通詞。因此巧兒版1 至 12 冊中台華共通詞有 634 個,台語特 別詞有466 個。

二.安可版

「批」在漢語中是「上級回覆下級且有所評論的公文」,但台語文中係指「一 般書信」,因此將「批」改列為台語特別詞;又如「細膩sè-jī」台語課文中係指

「小心謹慎」,漢語卻是「細緻光滑、精細周密」之意,故將「細膩」改列台語 特別詞,安可版初步統計得1085 個台華共通詞,扣除「佇、箍、上、行、阮、

袂、兜、擱、共、咧、挨、走、即、阮、閣、規、擺、批、傷、轉去、細膩、軀、

拄、大漢、捌、幌、吼、工、跤、行、葩、哺、通」等33 個詞,非台華共通詞 中,有19 個人名,5 個地名,10 個數詞,另有 25 個詞應屬台華共通詞,經計算 台華共通詞有1106 個,台語特別詞有 596 個。

三.真平版

經比對台華共通詞有595 個,非台華共通詞有 310 個,台華共通詞中「阮、袂、

阮、甲、行、閣、走、規、揣、上、煞、逐、掠、滇、工、跤、爾、挨、遐」等 19 個詞歸為台語特別詞,非台華共通詞中有「嘉年華」1 個專有名詞,1 個量詞,

「台語」、「看著」、「美夢成真」、「海邊」……等 10 個詞歸併為台華共通

數據

表 3 - 2 研究語料格式  版本  真平  書名  台語讀本 1  出版者  真平企業有限公司  書寫系統  漢字  年級別  一上  出版年  2009  篇名  第一課    歡喜學台語  段  囡仔兄,囡仔姊,咱來做伙學台 語,一句來,一句去,台語世界 真趣味。  Gin2-a2-hiann1,gin2-a2-tsi2,lan2  lai5 tso3-hue2 oh8 tai5-gi2,tsit8 ku3 lai5, tsit8 ku3 khi3,tai5-gi2 se3-kai3  tsin1
表 4 - 6 真平版高頻詞統計表  編號  詞型  (臺羅拼音)  詞型  (漢字)  詞次  百分比  覆蓋率  1 ê  的  41 2.37% 2.37%  2 lí  你  33 1.91% 4.28%  3 khì  去  28 1.62% 5.90%  4 lâi  來  20 1.16% 7.05%  5 tsin  真  20 1.16% 8.21%  6  ū  有  17 0.98% 9.19%  7 guán  阮  15 0.87%  10.06%  8 guá  我  13 0.
表 4 - 8 康軒版高頻詞統計表  編號  詞型  (臺羅拼音)  詞型  (漢字)  詞次  百分比  覆蓋率  1 ê  的  59 2.49% 2.49%  2 guá  我  40 1.69% 4.18%  3 beh  欲  34 1.44% 5.62%  4 khì  去  31 1.31% 6.93%  5 kóng  講  31 1.31% 8.24%  6 lâi  來  29 1.23% 9.47%  7 sī  是  28 1.18% 10.65%  8 tsin  真  27 1.
表 4 - 30 以詞彙數量統計五個版本台語教科書的平均句長  冊數  巧兒版  安可版  真平版  康軒版  翰林版  1  3.429   2.908   3.414   3.273   2.839   2  3.100   3.264   2.897   3.353   4.263   3  3.491   2.667   3.677   3.971   2.689   4  3.283   3.015   3.906   4.321   3.526   5  3.434   3.786   4.15

參考文獻

相關文件

 To write to the screen (or read the screen), use the next 8K words of the memory To read which key is currently pressed, use the next word of the

6 《中論·觀因緣品》,《佛藏要籍選刊》第 9 冊,上海古籍出版社 1994 年版,第 1

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

Corpus-based information ― The grammar presentations are based on a careful analysis of the billion-word Cambridge English Corpus, so students and teachers can be

The difference resulted from the co- existence of two kinds of words in Buddhist scriptures a foreign words in which di- syllabic words are dominant, and most of them are the

–  Students can type the words from the word list into Voki and listen to them. •  Any

• One of the main problems of using pre-trained word embeddings is that they are unable to deal with out-of- vocabulary (OOV) words, i.e.. words that have not been seen

In this study, we took some elementary schools located in Taichung city as samples to analyze the quality properties of academic administration services from the perspective