第三章 研究方法與步驟
第二節 研究步驟
(三) 也比較各版本使用之字型、詞型與臺灣閩南語推薦用 400 字詞的用字歧 異之處,並列表加以討論。
(四) 將翰林、康軒、南一版本(此三家出版社同時出版閩南語課本與國語課 本)閩南語課本與國語課本出現的字次對照比較。
五、歸納法
在各版閩南語教科書的課文中,除了漢字之外,還有其他非漢字的使用,本 研究將各版本非漢字使用之情況加以列表整理,並進行非漢字使用之類型歸納。
第二節 研究步驟
一、步驟
本研究的步驟按照下列步驟進行;
步驟一:研究資料之蒐集。(蒐集各家出版商為96 學年度學校教學使用,而編纂之 閩南語教材)。
步驟二:將教材中課文內容的漢字打字輸入、校對與造字。
步驟三:輸入台語漢字的書面資料,依不同版本分冊進行網路台語文斷詞。
步驟四:檢查台語文斷詞系統呈現的語料,根據斷詞原則,進行人工校對後,再 進行網路台語文斷詞,直至詞型符合。
步驟五:將台語文斷詞結果做分類資料整理。
步驟六:將整理後的漢字資料,進行各版本間字型、詞型與字次、詞次數量及百 分比的比較。
步驟七:將整理後的漢字資料,與教育部建議用字詞第1 批、第 2 批共 400 字詞 進行比較。找出各版本使用臺灣閩南語推薦用400 字詞的數量。
步驟八:蒐集同時出版閩南語課本與國語課本之三個版本(翰林、康軒、南一);
輸入課文漢字,再放入網路斷詞,進行字次比較。
步驟九:研究結果分析。
蒐集各家出版商為 96 年學校教學使用,
而編纂之閩南語教材。
步驟一
將教材中課文內容的漢字打字輸入、校對 與造字。
步驟二
輸入台語漢字的書面資料,依不同版本分 冊進行網路台語文斷詞。
步驟三
檢查台語文斷詞系統呈現的語料,根據斷 詞原則,進行人工校對後,再進行網路台 語文斷詞,直至詞型符合。
步驟四
將台語文斷詞結果做分類資料整理。
步驟五
將整理後的漢字資料,進行各版本間字 型、詞型與字次、詞次數量及百分比的比 較。
步驟六
將整理後的漢字資料,與教育部建議用字詞第 1 批、第 2 批共 400 字詞進行比較。找出各版 本使用台灣閩南語推薦用 400 字詞的數量。
步驟七
蒐集同時出版閩南語課本與國語課本之 三個(翰林、康軒、南一)版本;輸入課文 漢字,再放入網路斷詞,進行字次比較。
步驟八
步驟九
圖3-6- 1 研究步驟流程圖
二、限制
研究者在進行研究時,首先遇到的限制,便是蒐集各家出版商為96 學年度學 校教學使用而編纂之閩南語教材時調書的困難。研究者進行時先以電話聯繫台東 縣各出版社代理商,確認是否能提供相關教材,台東縣教科書市場,主要以康軒、
南一、翰林出版社為主,得請代理商協助代訂諸如安可、金安出版之教材,兩地 寄送往返時間花費許多,教材購得後面臨出版非研究計畫的年份,如出版商提供 的是 94 學年度或非 96 學年度之其他教材,為了克服此限制,研究者曾至台東大 學圖書館確認有無96 年度教科書,當時教材也非當年度,等圖書館陸陸續續添加 新版教材後,研究者才據此又修訂已經打好漢字的內容。
進而面臨資料輸入的限制,各版本選用的漢字,有些字國語字典上沒有羅列,
也無法用電腦輸入,試圖以圖檔替代,但輸入電腦斷詞,在斷詞系統中呈現出空 白而非漢字,影響了斷詞結果,為了克服此限制,先以代碼表示,如「」,則 先以「tshuā」輸入,之後再造字替換。
研究者還面臨斷詞限制,先前提及這個線上斷詞系統的特點是在網頁內有一 欄「使用者詞庫」,方便使用者自己增加原本詞庫所欠缺的詞,使用者所得到的 斷詞結果會更加正確,台語文斷詞系統雖然是根據斷詞原則而建製,然而電腦一 個指令一個動作,斷詞後其結果或有不符合文章內容所傳達的意思,此時便需要 人工方式校對來克服,校對完後將電腦沒有事先建立的詞型,輸入使用者詞庫,
或用鍵盤space 鍵將語詞隔開,經過多次的人工檢查與斷詞,方得到一個出現次數 統計表格,再將出現次數複製後貼到Excel 工作表中。研究者為了斷詞結果的正確 性,前後將五個版一至十二冊,做了三次斷詞處理,時間耗費甚久。
之後更面臨資料整理的限制,斷詞後所有的數據均為一冊一冊的字型、詞型 及字次、詞次,研究過程中需做各版本第一冊至第十二冊的整合,若用人工合併 資料,則耗費許多時間,並且極易出錯,最後在楊允言的協助下,利用Excel 中提 供的if,sum,vlookup,average 等函數,克服了此限制。