研究資料的處理

第三章研究的步數

第三節研究資料的處理

一、研究資料處理程序

本研究需要處理的程序分做三階段，第一階段欲將三个語料的詞分做「共通詞」佮「非共通詞」，「共通詞」就是「繼續使用的語詞」；第二階段欲將「非共通詞」閣分做「停用的語詞」佮「新選用的語詞」；上尾一个階段就是共第二階段的結果做一个分析佮解說。

（一）第一階段需要處理的步數：

（步數 1）建立包含這三 phō 聖經的語料庫。

（步數 2）用台語字詞頻統計系統進行詞頻統計。

28 台華線頂辭典網址http://iug.csie.dahan.edu.tw/iug/Ungian/soannteng/chil/Taihoa.asp

（步數 3）人工校對，修改錯誤的部分³⁰。

（步數 4）產生詞頻統計資料。

（步數 5）利用 Excel 軟體進行共通詞佮非共通詞的計算。

（步數 6）排除用詞差異的部分，產生「繼續使用的語詞」。

佇這个階段需要特別處理的步數是步數 6；因為這三个語料分別是：《巴克禮譯本》使用廈門話（偏泉州腔）、《高陳譯本》台中腔（偏漳州腔）、《現代譯本》

用台北腔（偏泉州腔）做書寫，所以使用的語詞會有無仝款的選擇。楊允言等

（2004:242）的研究³¹：

PKLSK 以廈門話為主，APSK 以台中腔為主，廈門話是泉州腔 ê 成分

加足kôan，台中腔顛倒 péng，漳州腔佔優勢。所以，咱 tih 探討語詞變化ê 時陣，腔口 ê 因素應該考慮入來。

另外，文白（文言音/讀冊音 kah 白話音）差異 kah 腔口差異 ê 問題類似，雖然kâng 意思，soah 因為寫法無 kâng，致使算 tī P iah 是 A ê 部分（非共通詞）。Chiâ ê 語詞，算做共通詞 chiah 合理。

本研究的處理方式是利用台華線頂辭典的詞條來進行計算，揣出遮的無仝寫法的語詞。比對的方法是：

30 這部分需要校對、修改的是語料內面的錯誤，親像：聲調錯誤、用字差異以及拍字錯誤。

31 楊允言等（2004）的研究中，PKLSK 代表《巴克禮譯本》、APSK 代表紅皮聖經《高陳譯本》；

1.建立一个用 VLOOKUP 函數³²進行運算的Excel 檔案。見圖 3-4。

圖3-4 文白差異佮腔口差異計算公式

2.用《高陳譯本》的 7056 个語詞，比對台華線頂辭典的 8,922 个詞條，揣看

是毋是有另外的寫法。

3.揣著了後，將另外遮的寫法囥入去《巴克禮譯本》的 5234 个語詞查詢；若

有揣著的，閣用人工檢查確認。

4.仝款方式重做（三），共查詢對象換做《現代譯本》。

（二）第二階段需要處理的步數：

（步數 7）用《現代譯本》做比較見本，揣出非共通詞當中干焦《現代譯本》有的語詞，叫做「新選用的語詞」。

（步數 8）對毋是「新選用的語詞」的其他語詞當中，閣揣出其中一个語料有毋過《現代譯本》無的語詞，共叫做「停用的語詞」。

（三）第三階段需要處理的步數：

（步數 9）分析佮解說。

二、第一階段研究程序流程圖

圖3-5 第一階段處理程序建立語料庫

初步詞頻統計

人工校對修改

產生詞頻資料

毋是三个語料攏有

準非共通詞共通詞

（繼續使用的語詞）

Yes No

步數 1

步數 2

步數 3

步數 4

步數 5

是用詞差異步數 6 的語詞

非共通詞 No Yes

三、第二階段研究程序流程圖

圖3-6 第二階段處理程序開始

干焦《現代譯本》有比較非共通詞

新選用的語詞

停用的語詞

其中一部有

《現代譯本》無

其他語詞

結束 Yes

Yes No

步數 8 步數 7

在文檔中對三 phō 台語新約聖經看台語語詞的變化 (頁 53-60)

第三章 研究的步數

第三節 研究資料的處理

一、研究資料處理程序

二、第一階段研究程序流程圖

三、第二階段研究程序流程圖

第三章研究的步數

第三節研究資料的處理