• 沒有找到結果。

第三章 研究方法

第二節 語料庫之功能

本論文中所使用的語料庫軟體有Wordsmith Tools 及 Concordance 兩種,以 下分別就筆者會運用到的功能加以說明。

Wordsmith Tools 為英國利物浦大學 Mike Scott 教授所開發的軟體7,主要功 能有生成詞表、提取關鍵詞、提供詞匯詞語型式等等,而且查詢的結果也能直接 以表格的格式複製貼至Excel,相當方便。在本論文裡,筆者利用的是詞表

(WordList)功能,如下圖所示:

3.4 Wordsmith Tools 主視窗

選取WordList 之後,可依照研究者需求開啟一至數個純文字檔,接著就會

7 http://www.lexically.net/wordsmith/

看到下方的畫面:

3.5 WordList 視窗(詞頻功能)

在上圖裡,Wordsmith Tools 已直接將語料裡的單詞按照出現頻率排序。其 中,最左側的N 欄代表詞頻的名次,Word 指的是單詞,Freq.是單詞出現的次數,

接著則是單詞頻率在整個語料裡所佔的百分比。要注意的是,如果一次開啟多個 檔案,此軟體會將所有檔案裡的資料合併計算。在上圖的示範裡,筆者總共開啟 了兩個檔案,因此在Texts 欄才會顯示有 2 個文本。

而筆者在研究兩岸譯文的常用字覆蓋率時,使用的即是此項功能。開啟語料 文字檔之後,只要將排序好的單詞及數據複製至Excel,再利用其加總與圖表功 能,便可製作出相關表格與圖示。

另外,若點選視窗左下方的statistics 標籤,還能看到許多統計數值,如下圖 所示:

3.6 WordList 視窗(統計功能)

在圖3.6 裡,N 欄顯示了各項數值所表示的意義,第 1 跟第 2 欄分別代表筆 者所選擇的兩個文本,第0 欄則是兩個文本合併之後的整體數據。N 欄中的 tokens 是指語料的總詞數,types 為文本裡所使用相異的詞,而相異詞比率(TTR)即 是將types 除以 tokens 所得,數值愈高,表示譯者使用的詞彙愈多樣化,重複愈 少,反之則顯示譯文用詞變化愈少。在standarised TTR 這一列裡,Wordsmith Tools 還提供了標準化後的相異詞比率,依序計算語料中每1000 字的 TTR 之後,再加 以平均,所得的數值更具比較意義。這些概念,筆者在隨後的章節裡都會再進一 步討論。

除了Wordsmith Tools 之外,本論文裡還使用了由 R. J. C. Watt 所開發的 Concordance 軟體8,是相當便捷的索引工具。筆者在研究時運用的主要有排序、

檢索及顯示搭配功能,以下將分別敘述。

從圖3.7 中可以看到,Concordance 的排序有許多方式,包括以單詞頻率、

8 http://www.concordancesoftware.co.uk/

單詞長度、字母順序,也可將中文單詞以筆劃數分類。而筆者在討論句長時,是 利用Length ascending 功能,將排序好的結果複製至 Excel,最後計算出譯文平均 每頓長度。

3.7 Concordance 視窗(排序功能)

至於Concordance 的檢索方式,跟一般文書軟體或瀏覽器的尋找功能類似,

只要按Ctrl+F 就能立刻開啟搜尋視窗,接著輸入欲檢索的字詞,就會馬上跳至 這個字詞的欄位。以圖3.8 為例,鍵入「可是」以後,Concordance 便移到該欄 位,右側的No.代表「可是」一詞在語料中總共出現了 18 次,而右半部視窗則 會將此詞置中,顯示其前後出現的內文,以及所在的行數。筆者在第五章中需要 統計一些特定字詞的出現頻率,即是利用此項功能。

3.8 Concordance 視窗(檢索功能)

Concordance 還有一項重要的功能,就是可以顯示詞語的搭配。只要先用檢 索方式找到所要的詞,再從選單裡點選Collocations 這一項(圖 3.9),就會跳出 搭配視窗,展現此詞左右兩側所搭配的字詞及頻率(圖3.10)。利用這種方式,

可以看出一個詞最常與其它哪些字詞搭配使用,也可發掘譯者在翻譯時的習慣用 法,亦能從另一個方向切入,找出在大量語料中只出現過一次的搭配,探討此種 搭配之所以不常出現,是因為譯者的「創譯」或者其它因素導致。圖3.10 的範 例中,顯示了「被」字的搭配,在其右側所接第一個詞的詞類大多是動詞,包括

「抓」、「抓住」、「抓到」、「抓起」、「逮捕」、「橇」、「火燒」等,顯示此譯者在使 用「被」字時,傾向於以較具負面意義的動詞來搭配。筆者在本論文中即是從此 角度出發,希望能從特定字詞的搭配,看出兩岸譯者在用字上的一些差異。

3.9 Concordance 視窗(Collocations 功能)

3.10 Concordance 顯示搭配視窗

第三節 小結

語料庫的建立,從一開始收集文本,到掃瞄、辨識、斷詞、數次校對,過程 可謂漫長,不過語料一旦整理完成,就是非常可貴的研究依據。藉由語料庫的多 項功能,研究者可以針對自己的需求,進一步探索各種翻譯現象。本論文的目標,

即是希望能從語料庫翻譯學的角度描述大陸及臺灣小說類譯文語言差異,因此在 接下來兩章中,筆者將針對兩岸譯本的語料做出量化及質性分析,比較兩岸譯者 的語言習慣。

相關文件