• 沒有找到結果。

第三章 研究方法與步驟

第二節 研究步驟

(三) 也比較各版本使用之字型、詞型與臺灣閩南語推薦用 400 字詞的用字歧 異之處,並列表加以討論。

(四) 將翰林、康軒、南一版本(此三家出版社同時出版閩南語課本與國語課 本)閩南語課本與國語課本出現的字次對照比較。

五、歸納法

在各版閩南語教科書的課文中,除了漢字之外,還有其他非漢字的使用,本 研究將各版本非漢字使用之情況加以列表整理,並進行非漢字使用之類型歸納。

第二節 研究步驟

一、步驟

本研究的步驟按照下列步驟進行;

步驟一:研究資料之蒐集。(蒐集各家出版商為96 學年度學校教學使用,而編纂之 閩南語教材)。

步驟二:將教材中課文內容的漢字打字輸入、校對與造字。

步驟三:輸入台語漢字的書面資料,依不同版本分冊進行網路台語文斷詞。

步驟四:檢查台語文斷詞系統呈現的語料,根據斷詞原則,進行人工校對後,再 進行網路台語文斷詞,直至詞型符合。

步驟五:將台語文斷詞結果做分類資料整理。

步驟六:將整理後的漢字資料,進行各版本間字型、詞型與字次、詞次數量及百 分比的比較。

步驟七:將整理後的漢字資料,與教育部建議用字詞第1 批、第 2 批共 400 字詞 進行比較。找出各版本使用臺灣閩南語推薦用400 字詞的數量。

步驟八:蒐集同時出版閩南語課本與國語課本之三個版本(翰林、康軒、南一);

輸入課文漢字,再放入網路斷詞,進行字次比較。

步驟九:研究結果分析。

蒐集各家出版商為 96 年學校教學使用,

而編纂之閩南語教材。

步驟一

將教材中課文內容的漢字打字輸入、校對 與造字。

步驟二

輸入台語漢字的書面資料,依不同版本分 冊進行網路台語文斷詞。

步驟三

檢查台語文斷詞系統呈現的語料,根據斷 詞原則,進行人工校對後,再進行網路台 語文斷詞,直至詞型符合。

步驟四

將台語文斷詞結果做分類資料整理。

步驟五

將整理後的漢字資料,進行各版本間字 型、詞型與字次、詞次數量及百分比的比 較。

步驟六

將整理後的漢字資料,與教育部建議用字詞第 1 批、第 2 批共 400 字詞進行比較。找出各版 本使用台灣閩南語推薦用 400 字詞的數量。

步驟七

蒐集同時出版閩南語課本與國語課本之 三個(翰林、康軒、南一)版本;輸入課文 漢字,再放入網路斷詞,進行字次比較。

步驟八

步驟九

圖3-6- 1 研究步驟流程圖

二、限制

研究者在進行研究時,首先遇到的限制,便是蒐集各家出版商為96 學年度學 校教學使用而編纂之閩南語教材時調書的困難。研究者進行時先以電話聯繫台東 縣各出版社代理商,確認是否能提供相關教材,台東縣教科書市場,主要以康軒、

南一、翰林出版社為主,得請代理商協助代訂諸如安可、金安出版之教材,兩地 寄送往返時間花費許多,教材購得後面臨出版非研究計畫的年份,如出版商提供 的是 94 學年度或非 96 學年度之其他教材,為了克服此限制,研究者曾至台東大 學圖書館確認有無96 年度教科書,當時教材也非當年度,等圖書館陸陸續續添加 新版教材後,研究者才據此又修訂已經打好漢字的內容。

進而面臨資料輸入的限制,各版本選用的漢字,有些字國語字典上沒有羅列,

也無法用電腦輸入,試圖以圖檔替代,但輸入電腦斷詞,在斷詞系統中呈現出空 白而非漢字,影響了斷詞結果,為了克服此限制,先以代碼表示,如「」,則 先以「tshuā」輸入,之後再造字替換。

研究者還面臨斷詞限制,先前提及這個線上斷詞系統的特點是在網頁內有一 欄「使用者詞庫」,方便使用者自己增加原本詞庫所欠缺的詞,使用者所得到的 斷詞結果會更加正確,台語文斷詞系統雖然是根據斷詞原則而建製,然而電腦一 個指令一個動作,斷詞後其結果或有不符合文章內容所傳達的意思,此時便需要 人工方式校對來克服,校對完後將電腦沒有事先建立的詞型,輸入使用者詞庫,

或用鍵盤space 鍵將語詞隔開,經過多次的人工檢查與斷詞,方得到一個出現次數 統計表格,再將出現次數複製後貼到Excel 工作表中。研究者為了斷詞結果的正確 性,前後將五個版一至十二冊,做了三次斷詞處理,時間耗費甚久。

之後更面臨資料整理的限制,斷詞後所有的數據均為一冊一冊的字型、詞型 及字次、詞次,研究過程中需做各版本第一冊至第十二冊的整合,若用人工合併 資料,則耗費許多時間,並且極易出錯,最後在楊允言的協助下,利用Excel 中提 供的if,sum,vlookup,average 等函數,克服了此限制。