第 2.4 節 電腦輔助翻譯工具
2.4.3 翻譯記憶系統、術語管理及品管工具
所謂翻譯記憶系統 (Translation Memory,簡稱 TM),也是一種雙語平行語料庫,
但是透過軟體介面,能夠將資料查詢、待譯句比對、譯文套用等步驟自動化。王正 (2011) 指出,商業化 TM 工具自 1988 年成型以來,近二十年蓬勃發展,主要的工作 原理包括劃分區段 (通常以「句」為單位);自動比對 (支援模糊比對及差異醒目標示);
術語詞典及管理;預翻譯;語料對齊。此外,商用 TM 系統也包含譯案管理的功能 (大 型譯案可共用一致的術語及譯法)、字數分析 (扣除不必重譯部分以節省譯費)、拼字 文法及譯文品質檢查 (術語一致性、多句同譯、一句多譯、數字及縮寫對應) 等。
成熟的商用 TM 系統以句級對應為主流,在 Hutchins (2009) 彙整的翻譯輔助工 具指南中,具有 TM 功能的商用及免費開源軟體共羅列了五十多種。但第一代、第二 代 TM 系統的「全句比對」功能逐漸無法滿足各種翻譯需求,業界及譯者的實務經驗 顯示,翻譯中重複最多的並非「全句」,而是句級以下的詞組、片語或句段。因此,
句級以下的分析、對應、擷取技術等相關研究日益增加16,商用 TM 系統也開始加入 句級以下的自動查詢套用功能,業界稱之為 Advanced Leveraging Translation Memory
16 例如可參見 Macklovitch & Russell (2000);Carl & Way (2003);Zhang, Vogel, & Waibel (2003);Wu, Chuang, Shei, & Chang (2004);Gotti et al. (2005);Birch, Callison-Burch, Osborne, & Koehn (2006);Cromieres (2006);Lepage & Lardilleux (2007);Colominas (2008);Macken, Lefever, & Hoste (2008);Simard & Isabelle (2009);
Martens & Vandeghinste (2010) 等。
(ALTM,進階利用翻譯記憶技術) 17,以進一步提高 TM 的回收利用率。
TM 系統通常結合術語管理功能 (Termbase management),同樣可以做到自動查 詢、自動呈現檢索結果,這一點對於合約翻譯尤其重要。如前所述,基於法律術語的
「單義性」,使用同一術語表示同一概念,乃是法律翻譯的一項重要品質標準 (王道 庚, 2006, pp. 52-54)。過去譯者多使用 Office Word 或 Excel 記錄術語對照表,需要在 譯文檔案與術語表之間來回切換,手動查詢。若有譯者不認識的專門術語,未分馮京 馬涼,應查證而未查,就會發生誤譯。透過 Termbase 的自動查詢顯示功能,原文中 只要出現預先定義的術語,原文/譯文詞組即會「蹦現」在術語窗格,發揮提示的作 用,避免譯者不識術語的失誤。利用快捷鍵可將對譯詞直接插入譯句中適當的位置,
節省打字時間,更可避免打字錯誤而造成誤譯;翻譯過程中出現的新術語,也可「線 上即時加詞」,立刻可以查詢使用。此外,軟體開發業界已建立 TM、Termbase 的資 料交換標準格式,來自不同軟體系統的 TM、Termbase 檔案能夠匯出匯入,讓翻譯知 識更容易累積分享 (參見 Quah, 2006, pp. 119-128; 王正, 2011)。
Bowker 與 Barlow (2004) 比較 TM 系統與語料庫工具的優缺點,建議使用者可 依不同的需求而交替使用;平行語料可以同時用於語料庫與 TM 系統 (參見王正、孫 東雲, 2009),即使是單語語料,亦可匯入 TM 系統以利用其自動檢索功能。然而,不 論 TM 系統或語料庫,軟體工具只能提供功能架構,語料內容並不能夠無中生有,仍 然要人為饋入,同時還要具有足夠的優質語料,才可能達到良好的效益。此外,TM
17 較重要的系統例如 Collaborative Translation Platform™、Déjà Vu X2、ESTeam Translator© 、MultiTrans、
NoBabel™ Translator、Similis 等。Select by demaquina™ 則是作為傳統 TM 系統的輔助工具,先擷取出術語 及重複出現的片語詞組並翻譯套用後,再匯入到傳統 TM 系統中完成翻譯工作。
系統亦如語料庫工具,初期必須投入學習時間,且商用 TM 軟體定價更高。18
TM 系統對於內容重複、術語眾多、文體固定的文類,應用效益最為顯著。鑑 於合約文件的特性,TM 系統與語料庫工具可以發揮絕佳效益,對於專職的合約譯者 或是專門訓練合約翻譯的課程而言,是值得考慮的投資。誠如 Triebel (2009) 所指出:
Common law lawyers seldom draft a contract from scratch, but avail themselves of form books, standard forms, precedents and model contracts. The common law world is drowning in such precedents.
普通法律師草擬合約絕少完全從零開始,而是參照各種合約格式書籍、標準 範本、前例及合約範例。在普通法的世界中,這樣的前例多不勝數。(2009, p.
152,筆者自譯)
台灣中文合約直接套用制式範本或定型化契約的情況,甚至更加普遍,常見的標準條 款具有公式化的特點,各類合約皆大同小異,已如第 2.3.2 節所述。此外,合約撰寫 時既然根據範本或舊版合約而編輯修改,因此翻譯時客戶可能提供舊版譯文,要求相 同的段落必須沿用舊譯不可更動。這些情況都非常適合使用 TM 工具,可以有效減少 翻譯工作量,提高翻譯的效率與品質。
在合約領域的翻譯中,單語專門語料庫可以提供豐富的參考資訊,但檢索效率 與效益不如翻譯記憶系統那麼直接;然而,使用合約 TM 系統所需要的雙語平行語料 資源又嚴重不足。另方面,雙語專門可比語料庫的應用潛力尚未充分發揮,譬如中文 與英文合約專門語料庫包含許多互為翻譯的資料,對譯者而言是寶貴的參考資源,如 何更快速有效的檢索或擷取這些對譯的內容,是值得探討的議題,除可進一步協助譯 者的工作,也能夠用於專門詞典編纂或應用於機器翻譯系統等其他研究領域。
18 除商用 TM 系統之外,免費的 Google 譯者工具包也提供簡易的翻譯記憶及術語管理功能,並結合 Google Translate 自動機器翻譯。
綜觀本節的討論,不論是機器翻譯、語料庫或電腦輔助翻譯工具的研究,對於 專職譯者都帶來了深遠的衝擊。善用各式電腦輔助翻譯工具對今日的譯者而言已經成 為必備的工作條件,“Beyond Translation Memory: Computers and the Professional Translator” (Garcia, 2009) 一文更預言,未來十年專職譯者單憑語言轉換專家的角色,
會愈來愈難以在筆譯職場立足。