• 沒有找到結果。

研究流程與步驟

第三章 研究方法

第三節 研究流程與步驟

一. 教科書詞彙豐富度分析

台語教科書詞彙 比較

教科書詞彙豐富度 分析 建立微型語料庫

五個版本 台語教科書

蒐集語料

以康軒版二.四六年級 國語教科書為例

人工校對詞型

統計詞次.詞型

國語斷詞分析

人工校對詞型

統計詞次.詞型

比較台語教科書 詞彙豐富度

比較國語教科書 詞彙豐富度 台語文斷詞分析

依漢字羅馬字分開建檔

圖3 - 2 教科書詞彙豐富度研究流程

17

以98 學年度的國民小學民間出版的台語教科書為研究標的,包含巧兒版、

安可版、真平版、康軒版、翰林版五種版本。本研究所使用的語料出版年份如下 表:

表3 - 1 台語教科書出版年份彙整表

冊別 巧兒 安可 真平 康軒 翰林

一 未標示 2007 2009 三版 2009 三版 2009 修訂六版 二 未標示 2007 2010 三版 2010 三版 2010 修訂六版 三 未標示 2007 2009 三版 2009 三版 2009 修訂四版 四 未標示 2007 2010 三版 2010 三版 2010 修訂五版 五 未標示 2007 2009 三版 2009 三版 2009 修訂四版 六 未標示 2007 2010 三版 2010 三版 2010 修訂五版 七 未標示 2007 2009 三版 2009 三版 2009 修訂五版 八 未標示 2007 2010 三版 2010 三版 2010 修訂五版 九 未標示 2007 2009 三版 2009 三版 2009 修訂三版 十 未標示 2007 2010 三版 2010 三版 2010 修訂五版 十一 未標示 2007 2009 三版 2009 三版 2009 修訂三版 十二 未標示 2007 2010 三版 2010 三版 2010 修訂三版

1. 將蒐集研究語料、建立微型語料庫:上述國民小學台語教材 60 冊建立教科 書課文的電子檔,但不包含教材中的句型練習、語詞練習、附錄中的歌謠、古 詩詞等,課文內容包含漢字及羅馬拼音,羅馬拼音統一以教育部「臺灣閩南語 羅馬字拼音方案」標註,聲調部分因電腦系統便於處理以阿拉伯數字表示。

2. 依下列格式將台語教科書課文內容建立電子檔案,匯入語料庫。

表3 - 2 研究語料格式 lai5 tso3-hue2 oh8 tai5-gi2,tsit8 ku3 lai5, tsit8 ku3 khi3,tai5-gi2 se3-kai3 tsin1 tshu3-bi7.

篇名 第二課 真好禮

段 阿安阿安真好禮,看著人會問食 飽未,對人失禮會講真歹勢。

A1 an1 a1 an1 tsin1

ho2-le2,khuann3-tioh8 lang5 e7 mng7 tsiah8-pa2-be7,tui3 lang5 sit4-le2 e7 kong2 tsin1 phainn2-se3.

… ... ...

3漢羅台語文斷詞系統http://poj.likulaw.info/hanlo_hunsu.php

4中文斷詞系統http://ckipsvr.iis.sinica.edu.tw/

19

二. 台語教科書台華共通詞分析

台語教科書詞彙比較

台語教科書台華共通詞分析

利用中文詞庫 將教科書詞彙分類

統計台語教科書的台華共通 詞及非台華共通詞

重新統計台語特別詞比例

重新統計台華詞比例 人工校對

圖3 - 3 台語教科書台華共通詞分析研究流程

1. 以中華民國計算語言學學會「中文詞庫(八萬目詞)」5為對照標準,利用EXCEL 中的VLOOKUP函數,比對台語教科書的詞彙,找出台華共通詞及非台華共 通詞。

2. 人工校對詞彙類別,找出漢語台語詞形相同但詞義不同的共通詞。

3. 利用教育部國語推行委員會編纂之「重編國語辭典修訂本」檢核 8 萬目詞「中 文詞庫」所未羅列的台華共通詞。

4. 分別統計各版本台華共通詞及台語別詞的數量,並計算台華共通詞及台語別 詞的數量的比例。

5中華民國計算語言學學會中文詞庫http://www.aclclp.org.tw/use_ced_c.php

三. 台語教科書句子音節長度數量、詞彙學習量分析

台語教科書 詞彙比較

台語教科書各語句 音節長度分析

台語教科書 各冊音節數統計

台語教科書 詞彙學習量分析

以詞彙數計算 台語教科書平均句長

以音節數計算 台語教科書平均句長

圖3 - 4 台語教科書句長分析研究流程

1. 使用國家台灣文學館台語文數位典藏資料庫(第二階段)計畫中全羅台語文文 本統計(Word Count)程式6來統計台語教科書內容。

2. 文本統計程式是使用羅馬字進行統計,需將 60 冊台語教科書的課文以羅馬字 進行運算,因全羅台語文文本統計程式系統設定辨識『.』、『?』、『!』『:』等 符號做為斷句的標準,因此文章中的『,』、『;』符號,需另外校對修正後,再 進行音節統計。

3. 統計台語教科書每冊音節數及詞彙數。

4. 以音節統計台語教科書每冊每一個句子的平均長度。

5. 以詞彙統計台語教科書每冊每一個句子的平均長度。

6 全羅台語文文本統計程式http://203.64.42.21/nmtl/dadwt/pbk.asp

21

國民小學台語教科書詞彙比較 詞彙豐富度 70.83% 66.45% 70.27% 75.14% 63.74% 72.19% 61.04% 75.73% 73.39% 60.40% 74.75% 67.61%

巧兒版詞彙豐富度

相關文件