語料庫翻譯研究：兩岸小說譯文語言分析

全文

(1)國立臺灣師範大學翻譯研究所碩士論文 A THESIS PRESENTED TO THE GRADUATE INSTITUTE OF TRANSLATION AND INTERPRETATION NATIONAL TAIWAN NORMAL UNIVERSITY. 指導教授：賴慈芸博士 Thesis Advisor: Dr. Tzu-yun Lai. 語料庫翻譯研究：兩岸小說譯文語言分析 Translated Fiction in Chinese: A Corpus-based Study. 研究生：彭臨桂 Advisee: Lin-quei Peng 中華民國九十八年六月 June, 2009.

(2) 摘要本研究以兩岸同本異譯的小說為對象，利用語料庫軟體進行量化及質性兩個層面的分析，期望能藉由各項統計數值與檢索結果來描述大陸和台灣譯文語言上的異同之處。論文架構共分為六章，第一章闡明筆者研究動機，並簡介研究時所使用的語料。第二章分成兩個部分，先討論曾經比較兩岸譯本的研究，再回顧與本論文研究目標相關的語料庫翻譯學文獻，接著歸納出適用於本論文的研究主題。第三章則是敘述本研究所使用語料庫的建立過程，以及說明筆者運用的軟體相關功能。第四章與第五章為本論文之研究主體，分別是量化及質性分析。量化分析有句長、相異詞比率、常用詞覆蓋率三項，主要以統計數值比較兩岸譯文在架構上的差異。質性分析包含語氣詞、關聯連接詞、西化現象三個類別，除了計算數據之外，也會從詞語的搭配來看兩岸譯者的文字習慣。對於在研究中觀察到的繁簡體譯文差異，筆者儘量避免從主觀的角度出發，而是希望以客觀的方式描述，在最後一章做出總結歸納，並且提供筆者研究心得與未來建議的研究方向。. 關鍵字：語料庫、兩岸譯文. * 本研究收錄之語料純為學術用途，已製成電子檔之小說全文不會公開散佈。. i.

(3) Abstract This study provides both quantitative and qualitative investigations into the style of Taiwan and Mainland Chinese fiction translations. By analyzing statistics and retrieving results from the corpus tools and other related software, it is hoped that the similarity and difference between traditional and simplified Chinese translations could be described objectively. The thesis is divided into six chapters. In the first chapter, the author explains the motive of this research and introduces the materials that are used. The literature in relation to this research would be reviewed in the second chapter. In the next chapter, the process of building up the corpus and the major functions of the corpus tools would be illustrated. The main body of this study consists of two sections: quantitative and qualitative analysis. In Chapter Four, the average sentence length, type / token ratio, and the coverage rate of common words would be discussed from a quantitative point of view, namely comparing both sets of Chinese translations by statistics. While, in Chapter Five, in addition to compiled numbers, collocations of the sentence-final particles, conjunctions, and some westernized grammar would also be examined so as to probe into translators’ usage of words. In this research, the author expects to describe the difference between Taiwan and Mainland Chinese translation objectively instead of judging the results from a critical perspective. The summary and conclusion of this investigation, along with some suggestions for further studies, would be discussed in the last chapter.. Keywords: corpus, Taiwan and Mainland Chinese translations * The texts collected in this thesis are for academic purpose only and the entire content will not be made public in any form. ii.

(4) 目次. 第一章. 緒論. 1. 第一節研究動機與目的. 1. 第二節研究範圍與對象. 2. 第三節本論文章節架構. 3. 第二章. 文獻探討. 5. 第一節. 兩岸翻譯策略. 5. 第二節. 語料庫翻譯研究. 7. 第三節. 小結. 9. 第三章. 研究方法. 10. 第一節. 建立語料庫. 10. 第二節. 語料庫之功能. 13. 第三節. 小結. 19. 量化分析. 20. 第一節. 句長. 20. 第二節. 相異詞比率. 26. 第三節. 常用詞覆蓋率. 28. 質性分析. 34. 第一節. 語氣詞與感嘆詞. 34. 第二節. 關聯連接詞. 39. 第三節. 西化現象. 42. 結論. 55. 第一節. 研究結果之歸納分析. 55. 第二節. 心得與未來研究建議. 56. 第四章. 第五章. 第六章. 參考文獻. 58 iii.

(5) 第一章. 緒論. 第一節研究動機與目的語料庫翻譯學（Corpus-based Translation Studies, CTS）自 Baker（1993, 1995）開始提倡以來，已在西方翻譯學界蓬勃發展，成為翻譯研究中重要的一環。透過大規模的機讀語料及語料庫檢索軟體，研究者得以採用較科學的方式來檢視並驗證前人所提出之翻譯普遍特徵（universals of translation）1，亦即簡易化（simplification）、明朗化（explicitation）、正規化（normalisation）等。 Laviosa（2002）指出，利用語料庫研究譯文的普遍特徵，至少有四個優點：一、使翻譯普遍特徵的概念更加明確詳實；二、讓研究者不再侷限於以人工方式比對小規模語料，探討的範圍也不必受文類限制，而是以更有系統的方式來比照大規模語料，並將研究重心轉移至以目標語為主（target-oriented）；三、能夠發掘更多實證，呼應或補強前人之研究成果；四、促使研究者更加注意作用於翻譯之上的社會與文化因素，比如目標語和來源語的相對地位，或是某項文類在整個多元系統中的位置。筆者認為，這些優點也可視為 CTS 對翻譯研究學科產生的影響。事實上，語料庫有許多特質，包括能夠輕易迅速抽取語例、提供各項字詞或標點符號之出現頻率、顯示詞語搭配、計算字詞相關比率數據等等，使得 CTS 的研究方法極富彈性與潛力。換句話說，語料庫並非只能拿來驗證理論（陳瑞清， 2003）。除了探討翻譯文字的普遍特徵之外，不少研究者也利用語料庫探索其它翻譯現象，例如分析翻譯的移轉（shifts）（Munday, 1998），從「創譯」角度研究譯文裡只出現過一次的特殊單詞（Kenny, 2001），討論譯文中的「關鍵字」（Laviosa, 2002: 85），比較譯者風格（Baker, 2000; Yu, 2007），或者藉由語料庫輔助翻譯教 1. Baker 對此下的定義：“…features which typically occur in translated text rather than original utterances and which are not the result of interference from specific linguistic systems.”（Baker, 1993: 243） 1.

(6) 學（陳瑞清，2003：22-23），可見不管是在理論或實務方面，CTS 能夠運用的範圍十分廣泛。有鑒於此，筆者擬運用 CTS 的研究方法，比較兩岸小說譯文的異同之處。本論文選擇小說做為語料，原因之一是筆者閱讀時偏好此文類，另外是因為小說文本普遍，且在資料收集上也較為方便。兩岸使用的語言雖均以中文為主，不過迄今各自發展了將近六十年，在諸多層面皆有差異，「同一外文著作的兩地中文譯本，因而成為描述翻譯學的極佳研究題材」（賴慈芸，2007），而且，這種兩地於同時代出現同本異譯的現象，在西方也較為少見，故本研究將從此角度出發，建立語料庫，試圖藉由所得的統計數值與檢索結果來描述兩岸小說譯文語言差異。. 第二節研究範圍與對象本論文研究的對象，為兩岸譯自同一原作且均已出版的翻譯中文小說，選擇的標準是翻譯時間相近，並且在近年內出版為主，筆者收集了大陸及台灣各八本譯作，總共十六冊，茲列表如下：. 表 1-1 本研究之語料書目原作 CN TW 《達．芬奇密碼》。朱振《達文西密碼》。尤傳莉 Da Vinci Code by Dan 1 武等譯。（上海人民，譯。（時報，2004） Brown ( 2003 ) 2004）《哈利．波特與混血王《哈利波特：混血王子的 Harry Potter and the 2 子》。馬愛農等譯。（人背叛》。皇冠編譯組譯。Half-Blood Prince by J. 民文學，2005）（皇冠，2005） K. Rowling ( 2005 ) 3. 《道德劇》。孫英春譯。《道德劇》。李永平譯。Morality Play by Barry （中國友誼，2002）（先覺，2000） Unsworth ( 1996 ). 2.

(7) 《邁克爾．K 的生活和時《麥可．K 的生命與時 Life and Times of Michael 4 代》。鄒海侖譯。（浙江代》。程振家譯。（天下 K by J. M. Coetzee 文藝，2004）文化，2000） ( 1993 ) 5. 《到燈塔去》。瞿世鏡《燈塔行》。宋德明譯。To the Lighthouse by 譯。（上海譯文，2000）（聯經，1999） Virginia Woolf ( 1927). 6. 《洛麗塔》。主萬譯。（上《羅麗泰》。黃秀慧譯。Lolita by Vladimir 海譯文，2006）（先覺，2000） Nabokov ( 1955 ). 《耶穌裹屍布之謎》。何《沉默同盟─耶穌裹屍布 The Brotherhood of the 7 玉潔譯。（遼寧教育，之謎》。彭臨桂譯。（皇 Holy Shroud by Julia 2006）冠，2008） Navarro ( 2006 ) 8. 《追風箏的人》。李繼宏《追風箏的孩子》。李靜 The Kite Runner by 譯。（上海人民，2006）宜譯。（木馬文化，2006）Khaled Hosseini ( 2003 ). 上表所列出之中文書目，出版最早的是 1999 年，最晚則是 2008 年，皆為近十年內之著作，故本論文屬共時性研究。礙於心力有限，筆者在建立語料庫時，並未納入所有譯作的全文，而是從各本自開頭收錄約兩萬五千字至三萬字左右，每組語料擷取的範圍，均是譯自原文裡相同的篇章段落。加總之後，以 Microsoft Word 軟體的字數統計功能計算全形字數，包含逗點、句點等標點符號，得到簡體字共約二十四萬餘字，繁體字共約二十三萬餘字，這些語料即為本論文之研究依據。由於本研究是將兩岸的翻譯中文各當成一個整體，著重於描述小說類譯文的語言差異，在討論或比較時也會儘量將重點擺在中文語料上，因此並未建立包含原著的平行語料庫，僅在必要時列出英文原文參考。. 第三節本論文章節架構本論文試圖從語料庫翻譯學的角度出發，探討兩岸同本異譯小說在語言上的差別，而研究架構共分為六章。第一章為緒論，描述本研究之動機及目的，並且簡介研究的語料對象及範圍。第二章為文獻探討，分成兩個部分，首先回顧曾經比較兩岸同本異譯策略的文章，接著分析相關的語料庫翻譯學研究，最後歸納出 3.

(8) 適用於本論文的研究主題。在第三章中，筆者將敘述語料庫的建立過程，介紹本論文中使用的語料庫或其它相關軟體，同時解說研究的方式。第四、五兩章是本論文的主體，分別為量化及質性研究。第四章討論的是句長、相異詞比率、常用詞覆蓋率三個部分，主要藉由統計數值來分析大陸及台灣譯文架構上的差異。第五章主要是利用語料庫軟體的抽取檢索功能，探究兩岸譯本使用語氣詞、連接詞的情況，以及西化中文的現象。最後一章則為結論，除了歸納先前章節的研究成果，筆者亦將提出個人研究心得，並且建議此領域未來可行之研究方向。. 4.

(9) 第二章. 文獻探討. 本章主要分成三個部分，首先回顧前人比較兩岸翻譯文本的研究，接著探討與筆者研究領域相關的語料庫翻譯學文獻，最後再歸納統整出適用於本論文的研究主題。. 第一節. 兩岸翻譯策略. 國內最早以專文研究兩岸翻譯策略差別的應為林佩蓉（2004），其在《台灣與大陸『哈利波特』系列譯本翻譯策略之比較》碩士論文中，收集了兩岸《哈利波特》一至四冊中譯本，透過原著比較兩種譯文在專有名詞及語言趣味等方面的處理技巧。隨後，陸續有研究者開始針對類似方向來分析兩岸之同本異譯，例如林宜瑄（2005）以台灣跟大陸均有出版的《活出歷史：希拉蕊回憶錄》為文本，從詩學觀、意識型態、贊助人三種角度切入，探討翻譯過程中的權力運作，林靜宜（2006）也在《達文西密碼》（陸譯：《達．芬奇密碼》）一書中研究了兩岸於「萬能動詞」與專有名詞上的處理方式。謝儀霏（2008）則是從作品銷量的觀點出發，探究兩岸譯者在史蒂芬．金小說《Bag of Bones》繁簡中譯本裡所運用的翻譯策略。雖然眾研究者各自的研究動機或研究方法不盡相同，但在其文章裡大致可以歸納出一項明顯的兩岸翻譯策略差異，即簡體字版的譯文傾向「異化」（foreignization）手法，繁體字版以採取「歸化」（domestication）居多。不過，有些研究者在比對原文與譯本時，並未考量兩岸在出版策略或讀者要求等因素的差別，提出了批評簡體版譯文的字眼。這是由於台灣研究者所受的中文教育及翻譯訓練有別於大陸，在譯評時難免會受到侷限（謝儀霏，2008）。有鑒於此，筆者在後面章節分析兩岸譯文時，將避免從主觀的論點來看待文本，期望能以較為客觀的方式描述繁簡譯本之語言差異。 5.

(10) 而賴慈芸（2007）的〈兩岸翻譯規範差異的初步描述〉一文，則是跳脫出上述研究模式的框架，收集了兩岸十組同本異譯，包含學術、文學、非小說讀物等類別，採用 José Lambert 與 Hendrik van Gorp 的描述步驟2，探討由 Andrew Chesterman 所提出的「期待規範」（Expectancy norms）。經由段落、分章、形象詞 / 成語、語法特徵等一連串比較之後，賴慈芸對兩岸翻譯規範做了這些描述：以微觀層次來看，語彙差異算是兩岸固定的習慣用法，可以利用軟體轉換，但簡體字譯本常連續使用「的」字、頻繁出現「它」字的西化現象，或許是兩岸短期內仍會維持的差異；除了學術書籍之外，繁簡譯本的平均句長相差不大；大致而言，兩岸譯者均有常用成語的現象，而台灣讀者較偏好多用成語的譯本；在文學類或以娛樂性質為主的書籍方面，為了符合兩岸讀者習慣的風格，可能仍會各自翻譯。此種研究方法跟以往譯評式的研究比較起來，有幾個不同之處：第一，研究的對象與範圍，從單一文本或單一系列作品擴大為涵蓋數個領域的多本著作，比較能夠呈現出兩岸在各類別翻譯的整體風格；第二，採用了一些科學化的分析方式，譬如統計平均句長、計算「的」字或「它」字出現頻率，讓數字來說話，避免以研究者本身的侷限或主觀印象來批判譯本；第三，從描術翻譯學的角度出發，不去評論哪個譯本「背離」原文意義或是何者翻得「貼切」，也就是說，未強調原文的至高地位，而是側重於譯文，對兩岸翻譯風格做出整體的描述。另外，香港中文大學副教授何元建（2007）在《生成語言學背景下的漢語語法及翻譯研究》一書中，同樣以描述翻譯學為依據，比較了《源氏物語》兩種中譯本的風格。此研究將台灣譯者林文月與大陸譯者豐子愷各自翻譯的《源氏物語》當成語料，節錄前 12 帖（回）3，詳細統計出兩位譯者的語氣詞及轉折句使用情況。結果，林文月譯本中的語氣詞密度高出豐子愷一倍，顯示林譯的白話風格較濃厚，而林所使用的轉折句類型也較為豐富，代表兩個譯本在話語結構上有一定 2. 依序為先行資料（preliminary date）、宏觀層面（macro-level）、微觀層面（micro level）以及系統脈絡（systemic context）等四個步驟。 3 全書共有 54 帖（回）。 6.

(11) 的差異，因此所造成的「讀者效應」（329）也不一樣。何元建最後指出，描述翻譯學的目的，「是要定量分析翻譯過程，最終解釋翻譯現象」（330），而這也正是筆者在此論文中試圖達成的目標。. 第二節. 語料庫翻譯研究. Baker 於 2000 年發表的 Towards a Methodology for Investigating the Style of a Literary Translator 一文，首度運用語料庫探討譯者的風格，以 Peter Bush（翻譯葡萄牙文、西班牙文）及 Peter Clark（翻譯阿拉伯文）各自的數本譯作當成語料，從相異詞比率、平均句長、單字 say 的各種時式來分析兩位譯者的風格。在此研究中，Baker 並未強調將譯文與原文比對，而是依據語料庫軟體所得的數據或檢索結果，解讀譯者的文字習慣。Baker 認為，語料庫能夠幫助研究者從譯文裡找出模式，進一步發掘譯者的風格，這即是本論文的研究方向，期望能藉由語料庫描述出兩岸譯文的差異。在台灣的語料庫翻譯學研究方面，就筆者所知，目前尚未有研究者利用語料庫針對兩岸翻譯風格差異來分析。國內的 CTS 研究係由陳瑞清（2003）引進，其在〈語料庫翻譯學：英漢翻譯的研究與應用初探〉裡詳盡介紹了此領域的相關理論及應用範圍，並且陸續提出研究成果（陳瑞清，2004；Chen, 2006）。陳瑞清的研究納入兩岸同本異譯，不過重點在於檢驗漢語譯本的明朗化現象。以其 2004 年發表的〈漢譯文本的形合趨勢：以語料庫為本的翻譯學研究〉為例，此研究使用十三本科普類書籍，建立了英語平行語料庫，先利用斷詞軟體標記出語料的詞類，藉由語料庫檢索功能，找出中文譯本裡使用頻率最高的三十個關聯連接詞4，接著再將統計數據與中研院的原創漢語文本比較，發現譯文所使用的連詞出現頻率在大致上均高於原創中文，且繁簡譯本皆然，證明科普類譯文裡確實有明朗化的現象。在本論文中，筆者將參考此種研究方式，比較兩岸小說類譯文. 4. 關於斷詞軟體及語料庫檢索功能的使用，筆者在第三章研究方法中將會介紹。 7.

(12) 的連詞使用情況。余清華於 2007 年的研究5使用語料庫來探討海明威小說《The Old Man and The Sea》兩位中文譯者（張愛玲與余光中）之翻譯風格。此研究的分析著重於「平均句長」、「相異詞比率」、「語氣詞」、「常用字 / 詞」四個部分。在平均句長方面，余光中的譯文句子較短，顯示其用字簡潔，文筆也較精練。在相異詞比率上，張愛玲較低，表示所使用的詞彙變化較少。至於翻譯書中人物對話時，語氣詞（例如「吧」、「嗎」、「呢」）的使用頻率，余光中明顯高於張愛玲，可見余光中傾向於多用語氣詞來強調人物的情緒。此外，余清華統計了兩種譯本各最常使用的前一千個字 / 詞出現頻率，並計算出這些常用字 / 詞在譯文之中的覆蓋率（coverage rate），再以 χ²統計檢定6，數據顯示，兩位譯者在常用字 / 詞的使用頻率上並未達到顯著差異。林俊宏（2006）也利用了語料庫統計高羅佩 The Chinese Maze Murders 三種譯本的平均句長，其研究方法是以《清平山堂話本》與《警世通言》為古代文本比照，以及中研究二百萬詞語料庫做為現代漢語比照，分析其間的句長關係。研究結果顯示，雖然三種譯本為求仿古效果，大量使用四字句，平均句長也比現代語料還短，但是從統計數據上看得出來，隨著時代演進，譯本使用四字句之比例有下降的趨勢，而且平均句長的數值愈來愈高。從上述幾位研究者的研究結果看來，若要運用語料庫來比較中譯文本的語言差異，確實有可行之處，因此筆者將參考前人的研究方法，並且把研究對象設定為兩岸的小說類同本異譯，至於本論文欲研究比較的主題，則在下一節中歸納說明。. 5. Yu, C.-h. 2007. Similarity and Difference in Translator’s Style: A Case Study of the Two Translations. of Hemingway’s Work. National Taiwan Normal University. 此種檢定方式可判別某字/詞在兩個（相等大小）語料庫中出現頻率的差異是否有統計上之意義（鄧敏君，2004）。 6. 8.

(13) 第三節. 小結. 筆者根據前面兩節的文獻回顧，整理了幾個在比較兩岸譯文差異時值得探討的要點，而這些要點依特性又可分為兩大類，一為量化分析，一為質性分析。量化分析主要有句長、相異詞比率、常用詞覆蓋率三個方面，藉由語料庫等軟體的統計數值，可以看出繁簡體譯文在架構上的差異。質性分析則包括語氣詞、連接詞、西化現象（如「的」、「它」、「們」字的出現頻率）三個項目，主要利用語料庫的搜尋、檢索及搭配功能，分析兩岸譯本的詞語特徵。至於譯文是不是正確，或翻得通達與否，在本研究中不予討論，僅針對筆者從數據或檢索結果中觀察到的現象加以描述。. 9.

(14) 第三章. 研究方法. 本章研究方法分為兩個部分，首先解釋本論文裡語料庫的建立過程，接著說明筆者在研究中使用到的語料庫軟體功能。. 第一節建立語料庫本論文重點為應用語料庫翻譯學的研究方式，描述兩岸小說譯文的差異，因此需要建立兩個分別收錄大陸及台灣譯本的語料庫。不過，在收集好兩岸的同本異譯之後，必須先經過一連串的處理過程，才能將紙本轉換成可供電腦或語料庫軟體使用的機讀語料，以便於研究。以下，筆者將敘述本論文裡語料庫的建置程序。由於本論文所收集之繁簡體字譯作均為紙本，所以建立語料庫的第一個步驟，即是先掃瞄文本，才可讓辨識軟體識別出文字。將掃好的語料存成圖檔，就可用辨識軟體開啟。文本掃瞄完畢之後，接著是以辨識軟體將圖檔轉換成文字（圖 3.1）。筆者使用的是清華 TH-OCR 系統，為對岸開發，可辨識簡體與繁體中文。只要開啟圖檔，選擇要辨識的中文類型，再用滑鼠游標框選欲辨識的範圍（如圖 3.1 右側所示），即可轉換範圍內的文字。此軟體能同時處理多個圖檔，每個圖檔一辨識好，系統就會儲存一個對應的純文字檔，待圖檔全都辨別完成，再點選系統的導出功能，便可將所有純文字檔匯整成一個檔案。. 10.

(15) 圖 3.1 辨識軟體視窗. 然而，辨識完的文字檔案，還不能夠直接使用，必須先和原文比照校對才行，而校稿大概是建立語料庫過程中最耗時費力的步驟。依筆者經驗，使用軟體辨識中文的準確率約為 80%左右，在剩下的 20%中，除了校正錯別字之外，還得填補無法辨別的字詞或段落（此部分通常會呈現亂碼），並且修改標點符號，校對完成之後，才可以利用斷詞系統處理文字檔案。以斷詞系統切割中文語料，目的是要在每個單詞之間插入空格，如果沒有空格的話，語料庫軟體會無法判別，而將整個中文句子或段落視為一個單詞。在本論文中，筆者使用由中研院開發的 CKIP 中文自動斷詞系統來處理語料。將辨識後校對好的語料儲存成純文字檔，或者直接複製貼入 CKIP 處理視窗，接著點選自動斷詞功能，系統就會在中文的單詞之間插入空格，如圖 3.2 所示。. 11.

(16) 圖 3.2 斷詞系統視窗（未標記）. 除了直接斷詞之外，CKIP 還有另一項重要的功能，就是替處理好的語料加上詞類標記，如下圖所示：. 圖 3.3 斷詞系統視窗（加上標記）. 執行完斷詞或詞類標記之後，還需要再經過兩道程序，才能夠讓這些文字成為可供語料庫軟體處理的語料。第一，由於 CKIP 插入的空格為全形，而語料庫軟體所能辨認的空格為半形，因此必須先將文字貼入 Microsoft Word 軟體中，利用尋找及取代功能，將全形的空格都取代為半形。第二，CKIP 斷詞的準確率尚 12.

(17) 未達到百分之百，根據筆者經驗，大約比辨識軟體的辨識率略高，也就是說，這些語料仍需要再校對。而且，未標記與已標記的語料無法共用，所以兩種語料得各自從頭到尾校對一次。修改完成之後，儲存成純文字檔，就可以用語料庫軟體開啟了。. 第二節. 語料庫之功能. 本論文中所使用的語料庫軟體有 Wordsmith Tools 及 Concordance 兩種，以下分別就筆者會運用到的功能加以說明。 Wordsmith Tools 為英國利物浦大學 Mike Scott 教授所開發的軟體7，主要功能有生成詞表、提取關鍵詞、提供詞匯詞語型式等等，而且查詢的結果也能直接以表格的格式複製貼至 Excel，相當方便。在本論文裡，筆者利用的是詞表（WordList）功能，如下圖所示：. 圖 3.4 Wordsmith Tools 主視窗. 選取 WordList 之後，可依照研究者需求開啟一至數個純文字檔，接著就會 7. http://www.lexically.net/wordsmith/ 13.

(18) 看到下方的畫面：. 圖 3.5 WordList 視窗（詞頻功能）. 在上圖裡，Wordsmith Tools 已直接將語料裡的單詞按照出現頻率排序。其中，最左側的 N 欄代表詞頻的名次，Word 指的是單詞，Freq.是單詞出現的次數，接著則是單詞頻率在整個語料裡所佔的百分比。要注意的是，如果一次開啟多個檔案，此軟體會將所有檔案裡的資料合併計算。在上圖的示範裡，筆者總共開啟了兩個檔案，因此在 Texts 欄才會顯示有 2 個文本。而筆者在研究兩岸譯文的常用字覆蓋率時，使用的即是此項功能。開啟語料文字檔之後，只要將排序好的單詞及數據複製至 Excel，再利用其加總與圖表功能，便可製作出相關表格與圖示。另外，若點選視窗左下方的 statistics 標籤，還能看到許多統計數值，如下圖所示：. 14.

(19) 圖 3.6 WordList 視窗（統計功能）. 在圖 3.6 裡，N 欄顯示了各項數值所表示的意義，第 1 跟第 2 欄分別代表筆者所選擇的兩個文本，第 0 欄則是兩個文本合併之後的整體數據。N 欄中的 tokens 是指語料的總詞數，types 為文本裡所使用相異的詞，而相異詞比率（TTR）即是將 types 除以 tokens 所得，數值愈高，表示譯者使用的詞彙愈多樣化，重複愈少，反之則顯示譯文用詞變化愈少。在 standarised TTR 這一列裡，Wordsmith Tools 還提供了標準化後的相異詞比率，依序計算語料中每 1000 字的 TTR 之後，再加以平均，所得的數值更具比較意義。這些概念，筆者在隨後的章節裡都會再進一步討論。除了 Wordsmith Tools 之外，本論文裡還使用了由 R. J. C. Watt 所開發的 Concordance 軟體8，是相當便捷的索引工具。筆者在研究時運用的主要有排序、檢索及顯示搭配功能，以下將分別敘述。從圖 3.7 中可以看到，Concordance 的排序有許多方式，包括以單詞頻率、 8. http://www.concordancesoftware.co.uk/ 15.

(20) 單詞長度、字母順序，也可將中文單詞以筆劃數分類。而筆者在討論句長時，是利用 Length ascending 功能，將排序好的結果複製至 Excel，最後計算出譯文平均每頓長度。. 圖 3.7 Concordance 視窗（排序功能）. 至於 Concordance 的檢索方式，跟一般文書軟體或瀏覽器的尋找功能類似，只要按 Ctrl+F 就能立刻開啟搜尋視窗，接著輸入欲檢索的字詞，就會馬上跳至這個字詞的欄位。以圖 3.8 為例，鍵入「可是」以後，Concordance 便移到該欄位，右側的 No.代表「可是」一詞在語料中總共出現了 18 次，而右半部視窗則會將此詞置中，顯示其前後出現的內文，以及所在的行數。筆者在第五章中需要統計一些特定字詞的出現頻率，即是利用此項功能。. 16.

(21) 圖 3.8 Concordance 視窗（檢索功能）. Concordance 還有一項重要的功能，就是可以顯示詞語的搭配。只要先用檢索方式找到所要的詞，再從選單裡點選 Collocations 這一項（圖 3.9），就會跳出搭配視窗，展現此詞左右兩側所搭配的字詞及頻率（圖 3.10）。利用這種方式，可以看出一個詞最常與其它哪些字詞搭配使用，也可發掘譯者在翻譯時的習慣用法，亦能從另一個方向切入，找出在大量語料中只出現過一次的搭配，探討此種搭配之所以不常出現，是因為譯者的「創譯」或者其它因素導致。圖 3.10 的範例中，顯示了「被」字的搭配，在其右側所接第一個詞的詞類大多是動詞，包括「抓」、「抓住」、「抓到」、「抓起」、「逮捕」、「橇」、「火燒」等，顯示此譯者在使用「被」字時，傾向於以較具負面意義的動詞來搭配。筆者在本論文中即是從此角度出發，希望能從特定字詞的搭配，看出兩岸譯者在用字上的一些差異。. 17.

(22) 圖 3.9 Concordance 視窗（Collocations 功能）. 圖 3.10. Concordance 顯示搭配視窗. 18.

(23) 第三節. 小結. 語料庫的建立，從一開始收集文本，到掃瞄、辨識、斷詞、數次校對，過程可謂漫長，不過語料一旦整理完成，就是非常可貴的研究依據。藉由語料庫的多項功能，研究者可以針對自己的需求，進一步探索各種翻譯現象。本論文的目標，即是希望能從語料庫翻譯學的角度描述大陸及臺灣小說類譯文語言差異，因此在接下來兩章中，筆者將針對兩岸譯本的語料做出量化及質性分析，比較兩岸譯者的語言習慣。. 19.

(24) 第四章. 量化分析. 本章為量化分析，重點在探討繁簡體字兩種譯文於整體語言結構上的異同之處，研究的主題分為句長、相異詞比率、常用詞覆蓋率三大類，而筆者將利用語料庫等軟體計算出這些類別的相關數據，並針對數據上的差別提出合理解釋，比較兩岸譯文之差異。. 第一節. 句長. 本節將句長分成了「大句」及「小句」兩個方面來討論。大句係指以句末點號（句號、問號、驚嘆號）為結尾的句子，其總數也就是譯文的總句數，而平均句長計算方式，是用語料的總字數除以句末點號總數，所得到的結果代表每句字數。小句則是「文中兩個表停頓的標點符號間所夾字數」（林俊宏，2006：98），亦即每頓長度，而此處所指的表停頓標點符號，除了句末點號之外，還包括逗號、冒號、頓號、分號、破折號、刪節號9。在計算平均句長之前，必須求得兩岸語料的總字數。筆者的計算方式，是利用 Word「字數統計」功能算出兩種譯文的全形字總數（大陸共 241076 字，臺灣共 230206 字），再減去所有標點符號，得到簡體版譯文有 214301 字，繁體版譯文則為 202881 字。字數統計好之後，首先來探討大句的平均句長。筆者已將兩岸語料的句末點號數量及平均句長統計整理至以下表格：. 9. 其餘非表停頓的標點符號，如引號、書名號等，一併不計入，在統計譯文總字數時已先扣除。 20.

(25) 表 4-1 兩岸譯文大句平均句長統計. CN 214301 字. TW 202881 字. 。. 7265. 7027. ？. 688. 714. ！. 230. 259. 句末點號總數. 8183. 8000. 平均句長. 26.19. 25.36. * 計算出之數值以四捨五入法取至小數點後第二位。. 從大句的總數來看，台灣譯本是 8000 句，比大陸譯本少了 183 句，但本論文中所蒐集之語料均為兩岸的同本異譯，擷取的篇幅也都相等，何以會有如此的差異？筆者認為這可能是因為台灣譯者傾向於將較短或語氣相關的原文句子合併起來，讓翻譯後的中文更加連貫。試看以下一例：. 【原文】 Did she have a precursor? She did, indeed she did. In point of fact, there might have been no Lolita at all had I not loved, one summer, a certain initial girl-child. In a princedom by the sea. Oh when? About as many years before Lolita was born as my age was that summer. You can always count on a murderer for a fancy prose style.. 以上是從 Lolita 書中節選出來的段落，原文有兩個問號，五個句號，總共七個大句。下面是兩岸的譯文：. 【台灣譯本】在她之前有沒有其他先驅者？有的，的確有的，事實上，如果我沒在某個夏天愛上某個稚齡女孩，也許就不會有羅麗泰。那是在海邊；什麼時候？噢，那年夏天我的年紀大約也像羅麗泰這麼大──一個謀殺犯總是會使用花俏的文字風格。（羅麗泰，第 11 頁）. 【大陸譯本】在她之前有过别人吗？有啊，的确有的。实际上，要是有年夏天我没有爱上某个小女孩儿的话，可能根本就没有洛丽塔。那是在海滨的一个小王国里。啊，是什么时候呢？从那年 21.

(26) 夏天算起，洛丽塔还要过好多年才出世。我当时的年龄大约就相当于那么多年。你永远可以指望一个杀人犯写出一手绝妙的文章。（洛丽塔，第 9 頁）. 在繁體字譯文中，把原文的第二句結尾改成了逗號，第四句結尾改成分號，而在第六句更使用了原文此段落裡未出現的破折號，合併之後，整段變成只有四個大句。簡體字譯文所使用的句末點號則和原文一致，總共七個大句。如此看來，台灣譯者比較不會緊貼著原文的斷句方式，而是考量語氣，在中文裡寫出較為連貫的句子，且所使用的標點符號也較有變化。接著再來看看大句的平均句長部分，大陸譯本是每句 26.19 字，比台灣譯本的 25.36 字高出 0.83 字。就數據上而言，差異雖然不大，但仍顯示出一項特徵，即台灣譯者在整體上用字比較簡潔。不過從另一方面來說，此種現象也可解釋為大陸譯者傾向於將原文訊息解釋得更明確。以 Life and Times of Michael K 兩岸譯本中的一個段落為例：. 【台灣譯本】產婆把麥可．K 接生出來的時候，她第一個注意到的就是他的兔唇。嬰兒的上唇像蝸牛的足體般捲曲著，左鼻孔隙裂開來。產婆遮開母親的視線，手指摳進花蕾般的小嘴，充滿感激地發現孩子的上顎還是完整的。（麥可．K 的生命與時代，第 3 頁）. 【大陸譯本】接生婆在帮助迈克尔．K 从母亲肚子里来到外面这个世界的时候，注意到的第一件事情，就是这个小家伙长着兔唇。他的上唇好像蜗牛脚一样中间向上翻卷着，造成左面的鼻孔是豁开的。她把孩子挡住了一下，让他母亲看不见，然后用手指拨开那个小嘴瓣儿，发现孩子的腭倒是完整的，于是谢天谢地，心里一块石头落了地。（迈克尔．K 的生活与时代，第 1 頁）. 在這個敘事的段落中，兩岸譯本同樣都有三個大句，台灣譯本平均每句 28 字，大陸譯本的平均卻達 43.33 字，高出了 15 字之多，這種差距會讓讀者在閱讀時產生不同的感受。例如，台灣譯本的第一句裡，產婆將 K「接生出來」，還注意到「他的兔唇」，譯文讀起來簡潔平實，且敘事的重心是放在產婆身上。而 22.

(27) 在大陸譯本中，接生婆「帮助」K「从母亲肚子里来到外面这个世界」，然後注意到「这个小家伙长着兔唇」，明顯是將 K 當成主體，使用較多字數描寫出生動的效果。另外，本段落的最後一句，敘述了產婆 / 接生婆對嬰兒兔唇的反應：在台灣譯本中，產婆「遮開」孩子母親的視線，好檢查 K 的上腭，發現完整時的心情是「充滿感激」，敘述方式一樣較為平實；而大陸譯本則是以「把孩子挡住了一下」描繪出動作的畫面，而且在最後用「于是谢天谢地，心里一块石头落了地」更加強調出接生婆的情緒。這兩種表現譯文的方式各有所長，孰為優劣則是見仁見智的問題，其實台灣譯本之中也會出現比大陸譯本更長的句子，不過從整體上來說，台灣譯者的用字比大陸譯者稍微精簡一些。除了大句之外，筆者也計算了小句的平均句長，並且分析其句長分佈。操作的過程，是先使用 Word 軟體的「尋找及取代」功能，消去所有非表停頓的標點符號，接著，以分行符號取代一切表停頓標點符號，再開啟語料庫軟體 Concordance 來處理最後剩下的文字，就能得到語料的小句總句數，以及所有字句的出現頻率。筆者把處理結果複製至 Excel 軟體中，統計了所有字句佔總句數的比例，製作出以下的句長分佈表：. 表 4-2 兩岸譯文小句句長分佈. 句長. CN 句數. 百分比. TW 句數. 百分比. 1. 218. 0.98. 229. 1.03. 2. 1209. 5.46. 1355. 6.11. 3. 967. 4.37. 1030. 4.64. 4. 1543. 6.97. 1599. 7.21. 5. 1474. 6.65. 1558. 7.02. 6. 1817. 8.20. 1813. 8.17. 7. 1826. 8.24. 1862. 8.39. 8. 1715. 7.74. 1795. 8.09. 9. 1674. 7.56. 1732. 7.81. 10. 1475. 6.66. 1561. 7.04. 11. 1359. 6.14. 1402. 6.32. 23.

(28) 12. 1167. 5.27. 1155. 5.21. 13. 1027. 4.64. 1020. 4.60. 14. 823. 3.72. 866. 3.90. 15. 735. 3.32. 702. 3.16. 16. 566. 2.56. 568. 2.56. 17. 461. 2.08. 472. 2.13. 18. 407. 1.84. 353. 1.59. 19. 336. 1.52. 260. 1.17. 20. 256. 1.16. 205. 0.92. 21. 216. 0.98. 159. 0.72. 22. 178. 0.80. 126. 0.57. 23. 113. 0.51. 87. 0.39. 24. 107. 0.48. 66. 0.30. 25. 102. 0.46. 66. 0.30. 26. 79. 0.36. 40. 0.18. 27. 65. 0.29. 27. 0.12. 28. 51. 0.23. 20. 0.09. 29. 38. 0.17. 18. 0.08. 30. 24. 0.11. 9. 0.04. 31. 26. 0.12. 8. 0.04. 32. 16. 0.07. 6. 0.03. 33. 13. 0.06. 5. 0.02. 34. 8. 0.04. 4. 0.02. 35. 14. 0.06. 4. 0.02. 36. 11. 0.05. 2. 0.01. 37. 5. 0.02. 1. 0.00. 38. 3. 0.01. 1. 0.00. 39. 9. 0.04. 40. 5. 0.02. 41. 2. 0.01. 1. 0.00. 42. 4. 0.02. 1. 0.00. 1. 0.00. 1. 0.00. 1. 0.00. 43 44 45 46 47 48. 24.

(29) 49 50. 1. 0.00. 51. 1. 0.00. 1. 0.00. 52 53 總句數. 22150. 22188. 總字數. 214301. 202881. 平均句長 (小句). 9.67. 9.14. * 計算出之數值以四捨五入法取至小數點後第二位。. 根據上表，大陸譯本平均每 9.67 個字一頓，台灣譯本的平均則是 9.14 字，差距不到一字。大陸譯本出現最多的是七字句，共有 1826 句，佔總句數的 8.24%，其次是六字句（共 1817 句，佔 8.20%）及八字句（共 1715 句，佔 7.74%），而台灣譯本句數最高的前三名依序也是七字句（共 1862 句，佔 8.39%）、六字句（共 1813 句，佔 8.17%）、八字句（共 1795 句，佔 8.09%）。由此看來，兩岸小句的平均句長相去不遠。筆者另外依據表 3-2 製作了句長分佈的折線圖，由此圖可以看出兩岸小句句長的分佈趨勢：. 圖4.1 句長分布統計圖 9.00 8.00 7.00 百分比. 6.00 5.00. CN總句數%. 4.00. TW總句數%. 3.00 2.00 1.00 0.00 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 字數. 25.

(30) 在十二字以下的短句，台灣譯本的句數幾乎都比大陸譯本多，所佔的比例加總起來分別是 77.03%與 74.24%，可見台灣譯本在短句上的密集程度比大陸譯本還高。在十三字至二十字的中長句部分，兩岸則是互有高低，加總之後，繁體譯文為 20.04%，簡體譯文是 20.82%，差距很小。值得注意的是長句部分。由圖 3.1 可以清楚看出，在二十字以上的句子，大陸譯本的句數百分比全部都比台灣譯本還高，經過加總之後分別為 4.94%及 2.93%，將近台灣譯本的 1.7 倍，而若只計算三十字句以上加總的比例，大陸譯本是台灣譯本的 3.5 倍。四十個字以上的句子，台灣譯本只出現兩次，大陸譯本則出現了十七次，差距達 8.5 倍，且最長句有 53 字，比台灣譯本最長的 42 字還多出 11 字。由此可見，大陸譯本比台灣譯本還更容易出現長句。整體來看，兩岸小說類譯文在小句平均句長的差異並不算大，這一點符合了賴慈芸的研究結果。而從句長分佈情況來看，在短句部分是台灣譯本比大陸譯本密集，中長句的比例則是幾乎相等，差距最大的是長句比例，簡體字譯本明顯比繁體字譯本高出許多。. 第二節. 相異詞比率. 相異詞比率（Type / Token Ratio）可以顯示出作者或語料庫文本裡所使用詞彙的豐富及多樣性（Baker, 2000）。所謂的 type，是指文本裡總共有多少個相異的詞，而 token 是文本中所有詞的總數，相異詞比率即是用 type 除以 token 所得之比率。以「to be or not to be」為例，這個短句中總共有六個 tokens，但「to」跟「be」各自出現了兩次，所以 types 的總數是四個，其相異詞比率就是 4/6 = 66.67%。文本的相異詞比率愈高，表示用詞也較有變化，反之，要是比率愈低，就代表重複的詞語愈多，變化愈少。不過，要注意的是，無論何種語言，其詞彙量都是有限的，若文本或語料庫的字詞數量愈大，則 token 的數目也會愈多，但 type. 26.

(31) 卻不會以相對的比率增加。也就是說，一旦語料庫的容量大到某個程度之後，type 增加的幅度會愈來愈少，而相異詞比率也會愈來愈小，此時就失去了比較的意義。所以，在比較兩個語料庫的相異詞比率時，研究者通常還會使用透過「標準化」（standarized）之後的比率數據，也就是先按一定長度分批計算文本的相異詞比率，最後再計算所有比率的平均值。例如先計算第 1 至 1000 詞的比率，再計算第 1001 至 2000 詞，接著是第 2001 至 3000 詞，以此類推。此種方式亦適用於比較兩個不同大小的語料庫，而且，經由這種方法計算出來的數值，比一般的相異詞比率來得可靠，因此在本節中會一併列出。在此項研究裡，筆者使用了中研究的 CKIP 斷詞系統以及 WordSmith Tools 語料庫軟體，操作步驟如下： 1.. 使用 CKIP 自動斷詞系統，開啟語料文件檔。點選「執行自動斷詞」。. 2.. 將中文斷詞結果以 unicode 格式儲存成.txt 文件檔。. 3.. 開啟 WordSmith Tools 軟體，選擇製作 WordList，然後選取剛剛儲存好的文件檔。. 4.. 點選 WordList 視窗左下方「statistics」標籤，即可直接獲得 TTR、STTR、總詞數等相關數據。. 以下即為 WordSmith Tools 所統計出之結果：. 表 4-3. 相異詞比率. CN. TW. tokens. 138383. 131135. types. 15702. 15639. TTR. 11.35. 11.93. Standardized TTR. 48.26. 49.97. * 計算出之數值以四捨五入法取至小數點後第二位。. 27.

(32) 中文跟英文的表意單位不同，例如英文的「school」一字，中文要用「學校」兩個字來合成一個詞，因此在計算相異詞比率之前，必須先經由前述的步驟 1，利用斷詞軟體切割中文語料，所以得到的總詞數跟本章第一節計算出的總字數不同。依據上表，簡體字譯本的 token 總數是 138383 個，相異的詞數 type 共有 15702 個，以 type 除以 token 之後得到的比率為 11.35，由 WordSmith 軟體計算出的 Standardized Type / Token Ratio 則是 48.26。而繁體字譯本的總詞數為 131135 個，相異詞數有 15639 個，相異詞比率是 11.93，標準化之後的比率為 49.97。無論在一般的相異詞比率或經過標準化之後的數據上，台灣譯本均高於大陸譯本，這表示台灣譯者在翻譯時所使用的詞彙比較豐富、更有變化，而大陸譯者的譯文則是變化較少、詞彙重複性較高。. 第三節. 常用詞覆蓋率. 利用語料庫軟體，研究者除了能輕易地統計出語料庫中的總詞數與相異詞總數，還能將所有單詞以出現頻率的高低按照次序排列，製作出頻率詞表。透過頻率詞表，可以看出哪些字詞最常使用，或者哪些字詞較不常出現，在比較兩種譯文時，或許也會發掘一些譯者在翻譯時並不自覺的語言習慣。在下列表格中，筆者示範整理了兩岸譯文最常使用的前 50 個單詞，以及各個單詞在整體語料之中所佔的比例：. 表 4-4 兩岸譯文前 50 個常用詞. CN 138383 詞. TW 131135 詞. 單詞. 頻率. 百分比. 單詞. 頻率. 百分比. 1. 的. 9799. 7.08. 的. 8780. 6.70. 2. 他. 3880. 2.80. 他. 3629. 2.77. 3. 了. 2873. 2.08. 我. 2679. 2.04. 4. 一. 2772. 2.00. 一. 2542. 1.94. 5. 我. 2724. 1.97. 在. 2186. 1.67. 28.

(33) 6. 在. 2575. 1.86. 了. 1975. 1.51. 7. 個. 2390. 1.73. 個. 1917. 1.46. 8. 是. 1953. 1.41. 是. 1796. 1.37. 9. 她. 1486. 1.07. 她. 1463. 1.12. 10. 著. 1431. 1.03. 這. 1298. 0.99. 11. 那. 1415. 1.02. 著. 1226. 0.93. 12. 這. 1351. 0.98. 不. 978. 0.75. 13. 不. 1000. 0.72. 說. 950. 0.72. 14. 上. 976. 0.71. 上. 930. 0.71. 15. 說. 955. 0.69. 那. 901. 0.69. 16. 人. 905. 0.65. 人. 836. 0.64. 17. 有. 898. 0.65. 有. 830. 0.63. 18. 地. 851. 0.61. 你. 812. 0.62. 19. 你. 829. 0.60. 就. 749. 0.57. 20. 和. 817. 0.59. 他們. 716. 0.55. 21. 就. 749. 0.54. 我們. 617. 0.47. 22. 他們. 742. 0.54. 會. 604. 0.46. 23. 裡. 732. 0.53. 都. 557. 0.42. 24. 把. 664. 0.48. 裡. 541. 0.41. 25. 也. 648. 0.47. 也. 537. 0.41. 26. 都. 592. 0.43. 和. 524. 0.40. 27. 我們. 586. 0.42. 地. 521. 0.40. 28. 沒有. 490. 0.35. 但. 500. 0.38. 29. 會. 488. 0.35. 要. 474. 0.36. 30. 還. 439. 0.32. 把. 425. 0.32. 31. 要. 417. 0.30. 中. 412. 0.31. 32. 什麼. 405. 0.29. 還. 408. 0.31. 33. 種. 402. 0.29. 很. 401. 0.31. 34. 自己. 396. 0.29. 而. 388. 0.30. 35. 從. 389. 0.28. 讓. 359. 0.27. 36. 對. 385. 0.28. 來. 352. 0.27. 37. 很. 379. 0.27. 得. 347. 0.26. 38. 去. 362. 0.26. 被. 340. 0.26. 39. 又. 362. 0.26. 沒. 333. 0.25. 40. 中. 356. 0.26. 沒有. 329. 0.25. 41. 來. 343. 0.25. 對. 327. 0.25. 42. 得. 340. 0.25. 兩. 326. 0.25. 29.

(34) 43. 被. 339. 0.24. 自己. 325. 0.25. 44. 知道. 328. 0.24. 跟. 309. 0.24. 45. 讓. 322. 0.23. 什麼. 298. 0.23. 46. 到. 309. 0.22. 時. 292. 0.22. 47. 但. 299. 0.22. 知道. 291. 0.22. 48. 已經. 290. 0.21. 從. 290. 0.22. 49. 想. 274. 0.20. 到. 276. 0.21. 50 合計. 兩. 273. 0.20. 想. 274. 0.21. 54980. 39.73. 49170. 37.50. * 計算出之數值以四捨五入法取至小數點後第二位。. 根據上表，大陸譯本最常使用的詞是「的」，總共出現 9799 次，所佔百分比為 7.08%，次常使用的是「他」，出現了 3880 次，佔 2.80%，而臺灣譯本最常出現的單詞一樣也是「的」（8780 次，6.70%）跟「他」（3629 次，2.77%）。接下來，表時態標記的「了」字，在大陸譯文中出現 2873 次，佔 2.08%，是使用頻率第三高的單詞，不過在台灣譯文中卻位於第六名，出現頻率 1975 次，佔 1.51%，兩者差距頗大。在台灣譯本裡，代名詞「他們」跟「我們」的出現率，都比大陸譯本的還高。另外，像「但」這個關聯連接詞，在總詞數較少的繁體字譯本裡出現了 500 次（0.38%），卻在總詞數較多的大陸譯本裡只出現 299 次（0.22%），相差了 1.67 倍。在下個章節中，筆者會針對某些特定類別的單詞加以分析，探討兩岸譯文在用詞頻率或搭配上的差別，以及這些差異對讀者在閱讀譯文時可能會造成什麼不同的效果，而由於本節重點為研究常用詞覆蓋率，所以在此就不進一步討論單詞頻率的差距問題了。所謂覆蓋率，是指在詞頻率表中按次序選擇一定數量的單詞，計算這些單詞在總語料中所佔的比率（楊惠中，2002：23）。例如，將詞頻率表裡第 1 到第 100 個詞的百分比累積相加起來，所得的結果，就是這前 100 個常用詞在整體語料裡的覆蓋率。在語言教學的領域中，覆蓋率算是很重要的概念。像是 BROWN 語料庫裡，前 5000 個常用字的覆蓋率為 86.20%，假使再經過削尾處理. 30.

(35) （lemmatization），把一個單字的不同詞形歸納起來，例如將 do、does、doing、 did、done 全合併在 do 之下，則覆蓋率更可達約 98%（同上註），學習英語時若可以掌握好這些單字，在閱讀或理解上更能事半功倍。筆者在此統計了兩岸譯文裡常用 1000 詞的比例，試圖將覆蓋率的概念應用在翻譯研究上，描述出兩岸譯文的差異。統計的方式，是以 100 個詞為單位，將第 1 至第 100 個常用詞在整體語料中所佔的百分比相加，然後依同樣方式算出第 101 至第 200 個詞數百分比的和，以此類推，一直計算到第 1000 個詞。接著，再將剛剛所得的數據累加，即可得出一組累進的詞數覆蓋率。相關數據的整理結果列表如下：. 表 4-5 兩岸譯文前 1000 個常用詞覆蓋率. CN 總詞數：138383. 詞數. TW 總詞數：131135. 詞頻. 百分比. 累進覆蓋率. 詞頻. 百分比. 累進覆蓋率. 1-100. 64481. 46.60. 46.60. 58526. 44.63. 44.63. 101-200. 10446. 7.55. 54.14. 9853. 7.51. 52.14. 201-300. 6355. 4.59. 58.74. 6178. 4.71. 56.86. 301-400. 4421. 3.19. 61.93. 4306. 3.28. 60.14. 401-500. 3494. 2.52. 64.46. 3400. 2.59. 62.73. 501-600. 2849. 2.06. 66.52. 2795. 2.13. 64.86. 601-700. 2389. 1.73. 68.24. 2372. 1.81. 66.67. 701-800. 2113. 1.53. 69.77. 2083. 1.59. 68.26. 801-900. 1893. 1.37. 71.14. 1859. 1.42. 69.68. 901-1000 總計. 1685. 1.22. 72.35. 1648. 1.26. 70.93. 100126. 72.35. 93020. 70.93. * 計算出之數值以四捨五入法取至小數點後第二位。. 根據上表，兩岸常用的前 1000 詞覆蓋率均佔了各自總語料的七成以上，大陸譯本的比例為 72.35%，高於台灣譯本的 70.93%，也就是說，從大致上看來，在簡體字譯文中常用字重複出現的情況比繁體字譯文還多。詞彙重複多的話，相 31.

(36) 對上文章也就變化較少，因此，整體而言，台灣譯者的文字風格會比大陸譯者稍有變化，使用的語彙較為豐富，而這一點也呼應了本章上一節於相異詞比率的研究結果。如果從各個詞數區間所佔的百分比與覆蓋率來看，還可以發現其它一些值得討論的現象。首先，在 1000 個常用詞十組區間裡的百分比，大陸譯本僅在第 1 至 100 字及第 101 至第 200 字這兩組中高於台灣譯本，覆蓋率為 54.14%，比台灣譯本的 52.14%多出 2%，而在表 4-4 中，前 50 個常用詞的覆蓋率差距則是 2.23%。在第 201 至第 1000 字這八組裡，繁體譯文的覆蓋率是 18.79%，多於簡體譯文的 18.21%，這代表台灣譯文裡的次常用字密度比對岸略高，但是差距甚小。以下用折線圖來表示兩岸譯文在覆蓋率上的相對關係：. 圖4.2 詞數與覆蓋率. 100 90 80. 覆蓋率（%）. 70 60 50 40 30 20 10 0. 100. 200. 300. 400. 500. 600. 700. 800. 900. 1000. CN. 46.60. 54.14. 58.74. 61.93. 64.46. 66.52. 68.24. 69.77. 71.14. 72.35. TW. 44.63. 52.14. 56.86. 60.14. 62.73. 64.86. 66.67. 68.26. 69.68. 70.93. 詞數. 依上圖可見，兩條折線呈現出幾乎平行的趨勢。雖然台灣譯本在中後半段的次常用字覆蓋率總和較高，不過並沒有高出多少，因此繁簡體譯文在前 200 字的比例上拉開之後，就一直維持著大約 1.4 個百分點的穩定差距。筆者另外計算了兩岸譯文前 2000 字的覆蓋率，大陸譯本為 80.24%，台灣譯本是 79.13%，仍然 32.

(37) 相差了 1.11 個百分點。總括來說，大陸譯本的常用字覆蓋率比台灣譯本還高，表示其詞彙的變化較少，重複率高，而這種情況於前 200 個最常用字之中最明顯。在接下來的次常用字裡，台灣譯本的密集程度稍微高於大陸譯本，但是相去不遠。. 33.

(38) 第五章質性分析. 本章質性分析的主題分成語氣詞與感嘆詞、關聯連接詞、西化現象三大類，主要探討兩岸譯文在詞語特徵上的異同之處。研究方式則是利用語料庫的抽取或檢索功能，檢視一些特定詞語的頻率或搭配用法，藉此比較兩岸譯者的文字習慣。. 第一節. 語氣詞與感嘆詞. 語氣詞與感嘆詞（以下統稱語氣詞）能夠表達人或說話者的情緒，讓文字看來有更生動的效果，這類詞語是中文豐富而英語少有的（王飛華，2005），因此，在本節中，筆者將從幾個方面來探討兩岸譯文中使用語氣詞的異同之處。首先，筆者參考了余清華（Yu, 2007）整理的語氣詞列表，並配合 CKIP 斷詞系統的詞類標記功能，利用 Concordance 軟體檢索出繁簡語料中使用的所有語氣詞，按照出現的次數排序，並計算各個項目在整體語氣詞總數中所佔的百分比。整理好的結果列表如下：. 表 5-1 兩岸譯文語氣詞頻率. 頻率. 百分比. 1. CN 嗎. 頻率. 百分比. 27.22. TW 嗎. 187. 221. 33.18. 2. 呢. 151. 21.98. 呢. 110. 16.52. 3. 吧. 113. 16.45. 吧. 106. 15.92. 4. 啊. 92. 13.39. 啊. 85. 12.76. 5. 啦. 34. 4.95. 啦. 30. 4.50. 6. 麼. 34. 4.95. 呀. 23. 3.45. 7. 嗯. 17. 2.47. 哦. 19. 2.85. 8. 呀. 15. 2.18. 嗯. 18. 2.70. 9. 哦. 12. 1.75. 喂. 11. 1.65. 10. 喂. 11. 1.60. 嘛. 11. 1.65. 11. 唉. 8. 1.16. 喔. 11. 1.65. 34.

(39) 12. 嘛. 7. 1.02. 囉. 9. 1.35. 13. 囉. 3. 0.44. 唉. 4. 0.60. 14. 嘍. 2. 0.29. 耶. 4. 0.60. 15. 喲. 1. 0.15. 唔. 2. 0.30. 16. 喲. 1. 0.15. 17 總計. 哇. 1. 0.15. 687. 666. * 本表之百分比，為該語氣詞頻率在所有語氣詞中所佔之比例。 * 計算出之數值以四捨五入法取至小數點後第二位。. 在兩岸譯文的語料裡，大陸譯本總共使用了 15 種語氣詞，總數為 687 個，台灣譯本使用了 17 種語氣詞，總數是 666 個。其中，在繁簡體譯文裡均有出現的語氣詞共 13 種，兩邊排名最高的前五個語氣詞（嗎、呢、吧、啊、啦）順序均相同，在中後半段才稍微有些變化，可以說是大同小異。如果用總句數（大句）來除以語氣詞總數，那麼大陸譯本平均每 11.91 句會出現一次語氣詞，台灣譯本則是平均 12.01 句出現一次。此外，簡體譯文用的「麼」跟「嘍」在繁體譯文之中並未使用（加上網底標明處），而「喔」、「耶」、「唔」、「哇」則是繁體譯文有而簡體譯文沒有的（以框線標明處）。如果單從種類上來看，台灣譯者所使用的語氣詞稍微比大陸譯者豐富一些，但差別也不會太大。以下列舉一些兩岸在語氣詞使用上的異同之處。 1. 兩岸譯本使用同樣的語氣詞：. 【大陸譯本】 “斯蒂芬，把刀收起来。”那个首领模样的人对黝黑的男子说。“你想用铁锤来对付一只甲虫吗？”（道德剧，第 9 頁）. 【台灣譯本】「史蒂芬，把刀子收起來吧。」首領對這個皮膚黝黑的漢子說。「對付一隻甲蟲需要用鎯頭嗎？」（道德劇，第 7 頁）. 35.

(40) 2. 兩岸譯本使用不同的語氣詞：. 【大陸譯本】他的政府怎么可能阻止那座桥倒塌呢？（哈利．波特与混血王子，第 2 頁）. 【台灣譯本】橋要倒塌政府又有什麼辦法呀？（哈利波特：混血王子的背叛，第 19 頁）. 3. 簡體譯本使用語氣詞而繁體譯本未使用：. 【大陸譯本】如果你被禁锢在一片网球场大小的岩石上，一困就是一个月，在暴风雨的季节也许更长一点，你会有什么感觉呢？（到灯塔去，第 4-第 5 頁）. 【台灣譯本】想想看，你怎能忍受一整個月，甚至還有更長的時間，關在一個網球場大的岩石上，還要忍受暴風雨？（燈塔行，第 5 頁）. 4. 繁體譯本使用語氣詞而簡體譯本未使用：. 【大陸譯本】有时我会求爸爸让我坐在他们身边，但爸爸会堵在门口。“走开，现在就走开，”…（追风筝的人，第 4 頁）. 【台灣譯本】有時候我會問爸爸，我可不可以進去和他們一起坐坐，但爸爸會站在門口，「走開吧，」… （追風箏的孩子，第 8 頁）. 如果將語氣詞分成陳述、疑問、感嘆、祈使四個類別10，那麼兩岸語氣詞的分佈狀況可以整理如下：. 10. 此分類方式係參考何元建（2007）比較源氏物語中譯本時針對語氣詞所做的研究。 36.

(41) 表 5-2 兩岸語氣詞分佈狀況. CN. 百分比. TW. 百分比. 疑問. 371. 54.00. 359. 53.90. 陳述. 194. 28.24. 175. 26.28. 感嘆. 77. 11.21. 96. 14.41. 祈使. 45. 6.55. 36. 5.41. * 計算出之數值以四捨五入法取至小數點後第二位。. 根據上表，兩岸使用最多的語氣詞類別依序都是疑問、陳述、感嘆、祈使，分佈的比率也大略相近，差距較多的是感嘆語氣詞，在繁體譯本的語氣詞總數中有 14.41%屬於這一項，簡體譯本則是 11.21%，顯示台灣譯者比大陸譯者更常使用感嘆語氣。若再進一步細分，將各語氣詞後方所搭配的標點符號做個整理，可以得到下列的結果：. 表 5-3 語氣詞與標點符號搭配統計表（簡體字譯本）. ，. 。. 嗎. 170. 15. 1. 呢. 94. 22. 26. 7. 1. 1. 吧. 24. 41. 39. 7. 1. 1. 啊. 8. 50. 17. 12. 1. 3. 啦. 8. 14. 7. 3. 1. 麼. 28. 5. 1. 嗯. 1. 5. 1. 呀. 7. 4. 3. 11. 1. 哦喂. 3. ！. 8. 嘛. 6. ；. 1. 7 1. 7. 唉. ──. ……. ？. 1 1 37. 1 1. 3.

(42) 囉. 1. 1. 嘍. 1. 1. 1 1. 喲總計. 345. 190. 97. 33. 12. 8. 2. 百分比. 50.22. 27.66. 14.12. 4.80. 1.75. 1.16. 0.29. * 計算出之數值以四捨五入法取至小數點後第二位。. 表 5-4 語氣詞與標點符號搭配統計表（繁體字譯本）. ？. ，. 嗎. 204. 15. 呢. 80. 9. 13. 5. 2. 吧. 27. 30. 37. 10. 1. 啊. 12. 47. 11. 14. 1. 啦. 3. 13. 10. 2. 呀. 4. 5. 4. 7. 哦. 4. 8. 7. 嗯. 14. 2. 喂. 5. 6. 嘛. 1. 7. 喔囉. 2. 。. ──. ……. ；. 、. 2. 9. 1. 2. 2. 1 1 1 2. 1. 1. 2 2. 3. 唉. ！. 1 1. 2. 1. 1 4. 耶 1. 唔. 1 1. 喲. 1. 哇總計. 338. 165. 93. 52. 7. 7. 3. 1. 百分比. 50.75. 24.77. 13.96. 7.81. 1.05. 1.05. 0.45. 0.15. * 計算出之數值以四捨五入法取至小數點後第二位。. 由上列表格可見，兩岸語氣詞有半數以上都是搭配問號，以疑問句的形式出現。接下來搭配最多的，是逗號與句號，在這兩類中的語氣詞有一小部分屬於感嘆、疑問跟祈使語氣，其餘大多為陳述語氣。差距最大的是搭配驚嘆號這一欄，. 38.

(43) 台灣譯本是 7.81%，大陸譯本為 4.80%。在兩岸語氣詞中，搭配最多的就是上述四種標點符號，共同出現的次數佔了 95%以上，與其它標點搭配出現的機率顯然很小。整體而言，台灣譯者所使用的語氣詞種類比大陸譯者稍微豐富一些，並且較常使用感嘆語氣，不過除此之外分佈的情況與出現比例都很接近，沒有什麼太大的差異。. 第二節. 關聯連接詞. 陳瑞清（2004）曾經利用自建的英漢平行語料庫，收錄科普類書籍，針對關聯連接詞做了詳細的研究，發現無論是繁體或簡體譯本，使用此類連詞的頻率普遍高於原創的漢語文本，證明譯本裡確實有「明朗化」的現象。在本節中，筆者將以其研究結果為基礎，設定兩岸譯文均已具有明朗化特徵，並以關聯連接詞頻率代表譯文的明朗化程度，頻率愈高，則愈具明朗化特徵，藉此比較繁簡譯本何者特徵較為明顯。筆者在此也參考了陳瑞清的研究方式，以 CKIP 斷詞系統來處理兩岸語料，替所有單詞加上詞類標記，接著搜尋出所有標記為 Cbb 類的關聯連接詞，統計出各項相關數據。首先是兩岸所使用的 Cbb 類連接詞總數，及其在語料整體總詞數中所佔的比例：. 表 5-5 兩岸 Cbb 類關聯連接詞總數. CN 138383 詞. TW 131135 詞. 連詞（88 種）. 百分比. 連詞（83 種）. 百分比. 2558. 1.85%. 2824. 2.15. * 計算出之數值以四捨五入法取至小數點後第二位。 39.

(44) 根據上表，繁體譯本的連詞總共有 2824 個，佔語料總詞數的 2.15%，在數量和比例上都比簡體譯本還多，這顯示繁體譯本的明朗化程度也較高。陳瑞清（2003）指出，中譯文本裡會有明朗化現象，其一可能是受到原文牽制，原本可用意合法（省去連詞）翻譯的句子卻使用形合法（添加連詞），其二是出版社強調「忠實」與「流暢」之編輯策略，另外也可能是譯者受到一些翻譯潛在規律的影響。台灣譯者之所以會寫出明朗化程度較高的譯文，應該也跟這三項因素密切相關。此外，從種類上來看，大陸譯者使用的連詞有 88 種，略高於台灣譯者的 83 種，不過整體頻率的總和還是較低。以下舉出兩個台灣譯本使用連詞而大陸譯本未用的例子： 1. 台灣譯本使用「如果」：. 【大陸譯本】兰登尽量保持礼貌：「麻烦您记下那人的姓名和电话号码，告诉他我在周二离开巴黎前会给他打电话。谢谢。」（达．芬奇密码，第 5 頁）. 【台灣譯本】「你如果好心的話，」蘭登盡可能禮貌地說：「能不能麻煩記下這位先生的名字和電話，然後告訴他說我星期二離開巴黎前會打電話給他？謝謝。」（達文西密碼，第 13 頁）. 2. 台灣譯本使用「雖然……但……」：. 【大陸譯本】他对自己被置于这样一种境地感到愤慨，同时又对坐在对面的这个看上去萎缩了的男人心生同情。（哈利．波特与混血王子，第 11 頁）. 【台灣譯本】雖然他對自己目前的困境感到忿忿不平，但他仍相當同情面前這個垂頭喪氣的人。（哈利波特：混血王子的背叛，第 34 頁）. 40.

(45) 另外，筆者將檢索出的 Cbb 類連詞按出現頻率排序，並計算了每一項數據在整體連詞總數裡所佔的百分比，以便看出兩岸語料中連詞的分佈情況。由於兩岸所使用的連詞種類不少，筆者在此僅列出出現次數最高的前三十項，這些連詞的數量總和各自佔了整體連詞總數的九成以上，應具有代表性。整理後的結果如下表：. 表 5-6 兩岸 Cbb 類關聯連接詞頻率前三十名. 連詞. CN 頻率. 連詞. TW 頻率. 百分比. 百分比. 1. 但. 299. 11.69. 但. 500. 17.71. 2. 而. 278. 10.87. 而. 389. 13.77. 3. 但是. 247. 9.66. 因為. 203. 7.19. 4. 因為. 206. 8.05. 但是. 179. 6.34. 5. 就是. 197. 7.70. 就是. 179. 6.34. 6. 如果. 150. 5.86. 而且. 134. 4.75. 7. 可是. 106. 4.14. 如果. 129. 4.57. 8. 不過. 97. 3.79. 雖然. 83. 2.94. 9. 而且. 78. 3.05. 不過. 79. 2.80. 10. 雖然. 71. 2.78. 所以. 71. 2.51. 11. 並且. 62. 2.42. 可是. 54. 1.91. 12. 所以. 51. 1.99. 於是. 53. 1.88. 13. 儘管. 48. 1.88. 並. 52. 1.84. 14. 要是. 42. 1.64. 因此. 45. 1.59. 15. 然而. 41. 1.60. 儘管. 43. 1.52. 16. 於是. 40. 1.56. 然而. 42. 1.49. 17. 只有. 37. 1.45. 要是. 37. 1.31. 18. 連. 37. 1.45. 若. 35. 1.24. 19. 而是. 28. 1.09. 只要. 34. 1.20. 20. 不管. 27. 1.06. 連. 32. 1.13. 21. 只要. 27. 1.06. 不管. 31. 1.10. 22. 因此. 27. 1.06. 因. 28. 0.99. 23. 並. 27. 1.06. 另外. 27. 0.96. 24. 由於. 26. 1.02. 只有. 27. 0.96. 排序. 41.

(46) 25. 即使. 20. 0.78. 即使. 26. 0.92. 26. 不僅. 18. 0.70. 而是. 23. 0.81. 27. 另外. 18. 0.70. 就算. 15. 0.53. 28. 既. 16. 0.63. 並且. 13. 0.46. 29. 因. 13. 0.51. 不論. 12. 0.42. 30 合計. 以便. 12. 0.47. 以. 12. 0.42. 2346. 91.71. 2587. 91.61. * 計算出之數值以四捨五入法取至小數點後第二位。. 依據上表，兩岸的前三十個常用連詞大多重覆（大陸譯本有而台灣譯本無的連詞以網底標出，台灣譯本有而大陸譯本無的則加上框線），加總後的比率非常接近，前兩名的排序也相同，可見兩岸譯者偏好使用的連詞相仿。不過如果僅加總前五名的比率，那麼台灣譯本是 51.35%，佔了所有連詞的一半以上，而大陸譯本是 47.97%，若只算前兩項的總和，台灣譯本則比大陸譯本多了快九個百分點。綜合本節的研究結果：台灣譯本裡的連詞數量高於大陸譯本，因此明朗化程度較為顯著。兩岸譯者偏好使用的連詞差不多，而且集中在出現次數最多的前三十名裡，其中，台灣譯者在前半段連詞的使用上又比大陸譯者更為密集。. 第三節. 西化現象. 本節將分成四個部分，檢視「的」、「它」、「們」這幾個單詞的頻率或搭配用法，探討兩岸譯文中的西化現象。. 一、的余光中（2002）指出，自五四以來，現代中文受到西化影響，常出現「的」字使用過度頻繁的現象，造成文章句法冗長，不夠簡潔，因而提倡少用「的」字，甚至認為這是「作家得救的起點」（178）。此外，他還利用「的」字出現率來當. 42.

(47) 成判斷文章句法是否短捷的標準，主張「的」字雖不可少，但是要掌握得當，免得「濫用成災」（183）。而賴慈芸（2007）在比對兩岸各類譯文時發現，整體上來說，大陸譯本比台灣譯本常見到「的」字，也更常出現連續使用「的」字之句型。那麼，在本論文的小說譯文語料庫中，兩岸譯者對「的」字的處理有何異同之處？以下筆者將從幾個角度來分析。首先來看「的」字出現率：. 表 5-7 兩岸「的」字出現率. CN（214301 字）. TW（202881 字）. 「的」字頻率. 9799. 8780. 平均. 21.87. 23.11. * 計算出之數值以四捨五入法取至小數點後第二位。. 依上表可見，在大陸譯本中，「的」字出現了 9799 次，若以總字數除以其頻率，則是平均每 21.87 字出現一次，而台灣譯本中，「的」字出現了 8780 次，平均是 23.11 字出現一次。這顯示大陸譯者較常使用「的」字。根據余光中的評判標準，繁體字譯本讀起來的感覺會比簡體字譯本還要短潔一點。接著再來看看「的」常與哪些詞搭配。筆者利用 Concordance 的 Collactions 功能，找出兩岸語料中位於「的」字左邊第一位的詞，並且依頻率高低排序，以下列舉出現次數最高的前二十名參考：. 表 5-8 前二十個與「的」字搭配次數最多之單詞. CN. TW. 1. 他. 550. 他. 537. 2. 我. 314. 我. 260. 3. 她. 269. 她. 240. 43.

(48) 4. 自己. 144. 上. 113. 5. 上. 139. 自己. 80. 6. 他們. 87. 你. 79. 7. 裡. 76. 他們. 75. 8. 你. 68. 裡. 70. 9. 說. 65. 中. 61. 10. 中. 63. 說. 59. 11. 我們. 55. 我們. 56. 12. 所有. 54. 人. 46. 13. 人. 43. 大. 37. 14. 著. 38. 所有. 36. 15. 是. 36. 母親. 35. 16. 這樣. 36. 來. 35. 17. 過. 36. 這樣. 29. 18. 大. 35. 是. 27. 19. 做. 35. 著. 26. 20. 母親. 31. 耶穌. 24. 在上表的 20 個項目裡，兩岸共有 18 項一樣的單詞，且搭配次數最多的前三名（他、我、她）排序也相同，顯示兩岸譯者在「的」字使用上習慣相近，而最常重覆搭配出現的是代名詞。不過，如果將搭配前二十名單詞的頻率加總，所佔比率大概僅有全部與「的」搭配詞數的五分之一而已，因此筆者另外統計了跟「的」搭配次數最多的前十種詞類。這些詞類出現的頻率，已佔總搭配次數的八成以上，更具代表性，也較容易看出「的」字的整體搭配趨勢。統計完成的資料整理列表如下：. 表 5-9 與「的」字搭配之詞類前十名. 詞類. CN 頻率. 詞類. TW 頻率. 百分比. 百分比. 1. VH. 2327. 23.75. VH. 2064. 23.51. 2. Na. 2072. 21.15. Na. 1838. 20.93. 3. Nh. 1599. 16.32. Nh. 1402. 15.97. 4. VC. 590. 6.02. VC. 619. 7.05. 44.

(49) 5. Nc. 430. 4.39. Nc. 431. 4.91. 6. Ncd. 396. 4.04. Ncd. 346. 3.94. 7. VA. 380. 3.88. VA. 342. 3.90. 8. VE. 207. 2.11. Ng. 188. 2.14. 9. VK. 203. 2.07. VK. 171. 1.95. 10 總計. Ng. 183. 1.87. VE. 146. 1.66. 8387. 85.59. 7547. 85.96. * 計算出之數值以四捨五入法取至小數點後第二位。 *本表之詞類，是 CKIP 系統對語料斷詞後加上的簡化標記，各標記所表示的詞類分別為： VH= 狀態不及物述詞，Na=普通名詞，Nh=代名詞，VC=動作及物動詞，Nc=地方詞，Ncd=位置詞， VA=動作不及物動詞，VE=動作句賓動詞，VK=狀態句賓動詞，Ng=後置詞。. 根據上表，在兩岸語料與「的」搭配的詞類前十名完全重覆，甚至只有第 8 及第 10 項順序不同而已。搭配最多的是 VH，即狀態不及物述詞（例如「特別」的、「浪漫」的、「心酸」的、「震驚」的），其次是普通名詞（Na）。在表 5-8 中，雖然與「的」搭配重覆次數最多的單詞是他、我、她等代名詞，不過此種詞類在整體搭配中僅位居第三。綜合前兩項分析，可以看出，不管是在與「的」搭配的單詞或詞類方面，兩岸譯者的習慣均十分接近。接下來是探討兩岸連續使用「的」字的句型。筆者的研究方式，是先利用 Word 軟體的取代功能，將兩岸語料切割成以小句為單位，然後以語料庫軟體 Concordance 開啟，再以萬用字元符號（*）搭配文字來檢索句子中含兩個以上「的」字之句型11。檢索的結果如下表：. 表 5-10 連續使用「的」字句型. CN（22150 句）. TW（22188 句）. 2次. 1153. 784. 3次. 171. 50. 11. 例如要找含兩個以上「的」字之句型就以「*的*的*」檢索，要找三個以上「的」字之句型就以「*的*的*的*」檢索。 45.

(50) 4次. 31. 2. 5次. 5. 0. 總計. 1360. 836. 百分比. 6.14%. 3.77%. * 計算出之數值以四捨五入法取至小數點後第二位。. 在繁體字語料中，連續使用兩個以上「的」字的總共有 836 句，佔總句數的 3.77%，而簡體字語料裡則有 1360 句，佔整體句數的 6.14%，約為繁體語料的 1.6 倍，顯示大陸譯本比台灣譯本還常出現連用「的」字之句型，這個現象與賴慈芸（2007）的研究結果相符。如果分開來看，台灣譯本中有 50 個句子連用了三個「的」，而大陸譯本有 171 句，為台灣譯本的三倍多，此外，連用四次的句子則相差超過十五倍，大陸譯本中甚至還有連用五次的句子。這種現象顯示大陸譯本不但比台灣譯本常連用「的」字，並且更常出現連用三、四次以上的句子，而台灣譯者則普遍節制，盡量避免讓「的」字連續出現太多次。以下列舉幾個簡體字譯本多用「的」字的範例，並與繁體字譯本的處理方式加以比照。. 1. 大陸譯本連用兩個「的」字：. 【大陸譯本】 K 打扫了阳台上的最深的积水，疏通了雨水落水管。（迈克尔．K 的生活和时代，第 17 頁）. 【台灣譯本】 K 把最嚴重的積水給掃到陽台上，也疏通了排水管。（麥可．K 的生命與時代，第 22 頁）. 2. 大陸譯本連用三個「的」字：. 【大陸譯本】 …他的冥想中断了，他转过身来，吸了口气，举目寻找正在给他的幼儿朗读故事的妻子的 46.

(51) 倩影…（到灯塔去，第 46 頁）. 【台灣譯本】 …他突然停止了，轉過身，嘆口氣，揚起他的眼睛，找尋讀故事給小兒子聽的妻子的身影… （燈塔行，第 46 頁）. 3. 大陸譯本連用四個「的」字：. 【大陸譯本】 …他神秘的笔记是用别人看不懂的颠倒的字母记下的…（达．芬奇密码，第 39 頁）. 【台灣譯本】 …他用難以辨認的左右反轉筆跡記下了謎樣的日記…（達文西密碼，第 56 頁）. 4. 大陸譯本連用五個「的」字：. 【大陸譯本】我几乎要相信，我从普通的苟合中得到的感觉，和正常的伟男子在震撼世界的那种惯常的节奏中跟他们正常的伟伴侣结合时所领略到的感觉几乎一般无二。（洛丽塔，第 27 頁）. 【台灣譯本】我很願意相信，我出軌的興奮，相同於那些正常男性與其配偶進行的憾世例行節奏的興奮… （羅麗泰，第 21 頁）. 由上面的例子也可以看出另一個現象：在大陸譯本中，連續使用「的」字次數一多，句子也會變得比較長一些，但台灣譯本的句長則顯得較為平均，沒有特別長的情況，這或許也是造成簡體譯本整體平均句長比繁體譯本還長的其中一項原因。. 二、它根據王力所著的《中國現代語法》（2002），「它」這個字的用法大約在西元. 47.

(52) 1918 年以後開始出現，屬於歐化用語，跟「他」、「她」一樣，分別是模仿英語中的 it、he、she，在中文裡，其實很少使用「它」這種第三人稱代詞，而且「它」的「許多用途都不是中國所原有的」（287）。王力也進一步指出，「它」字的用法不符合中文習慣，因此最好儘量避免。除了王力，其餘翻譯名家如思果（2001）、余光中（2002）等人也都曾指出中文常濫用「它」字的弊病。有鑒於此，筆者於本節中探討了繁簡譯本在「它」字的使用上有何異同之處。以下根據「它」的出現頻率來分析：. 表 5-11 「它（們）」出現頻率. CN. TW. 它. 269. 123. 它們. 49. 38. 總計. 318. 161. 在繁體字語料裡，「它」出現了 123 次，表複數的「它們」是 38 次，合計使用了 161 次，而簡體字語料則共計用了 318 次「它」和「它們」，若從使用的頻率上來看，兩岸相差了幾乎一倍，可見大陸譯者比台灣譯者特別偏好此種譯法，如果以余光中的話來說，大陸譯本的「西化病狀」（余光中，2002：110）顯然要比台灣譯本嚴重許多。根據賴慈芸（2007）在其研究中的粗略估算，大陸譯者使用「它」與「它們」的次數為台灣譯者兩倍以上。依照筆者以 Concordance 軟體統計的結果，簡體譯本中的「它」跟「它們」數量，確實也是繁體譯本的兩倍左右。以下接著列出幾個兩岸使用「它」跟「它們」的對照範例： 1. 兩岸均使用「它」：. 【大陸譯本】 …但是对于数以百万计的信徒来说，那块裹尸布就是不折不扣的圣布，并且教皇也承认了它的真实性…（耶稣裹尸布之谜，第 6 頁） 48.

(53) 【台灣譯本】然而對數百萬的信徒來說，不管碳十四測定的結果是什麼，裹屍布是真實的，而教會也同意讓它接受崇拜。（沉默同盟─耶穌裹屍布之謎，第 20 頁）. 2. 大陸譯本使用「它」，台灣譯本未使用：. 【大陸譯本】那座桥建成还不到十年，最出色的专家也无法解释它怎么会突然整整齐齐地断成两截… （哈利．波特与混血王子，第 2 頁）. 【台灣譯本】這座橋才建不到十年，連最好的專家都百思不解，想不通橋為什麼會啪的一聲剛好斷成兩截…（哈利波特：混血王子的背板，第 19 頁）. 3. 台灣譯本使用「它」，大陸譯本未使用：. 【大陸譯本】其实，我不过是个一无所有的寒酸书生，凭着自己惟一所长的拉丁文，勉强可以混口饭吃。（道德剧，第 3 頁）. 【台灣譯本】我只是個窮書生，就像人們所說的兩袖清風、一身飄零。幸好略懂拉丁文，靠著它可以混口飯吃…（道德劇，第 1 頁）. 4. 大陸譯本使用「它」，台灣譯本使用「牠」：. 【大陸譯本】我们拔掉蜜蜂的尖刺，在那可怜的东西身上系根绳子，每当它想展翅飞走，就把它拉回来，这带给我们无与伦比的快乐。（追风筝的人，第 25 頁）. 【台灣譯本】為了滿足無法抗拒的光榮成就感，我們拔掉蜜蜂身上的刺，用線綁在那隻可憐的小東西身上，每回牠一起飛，就把牠拉回來。（追風箏的孩子，第 29 頁） 49.