第五章 翻譯模型公式
5.1 翻譯英文動詞公式說明
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
35
第五章 翻譯模型公式
在本章節當中,5.1 小節介紹本研究使用的五個公式作為翻譯動詞模型;5.2 小節 則使用與 5.1 小節對稱的公式作為翻譯名詞模型。5.3 小節介紹本研究如何運用 公式建立模型,5.4 小節則說明翻譯模型效能的評量機制。
5.1 翻譯英文動詞公式說明
本研究提出了五種公式訓練模型翻譯英文動詞。在公式的表示式中,我們以字母
「E」代表英文、字母「C」代表中文,「V」代表動詞及「N」代表名詞;因此
「EV」及「EN」各別代表英文動名詞組合中的動詞及名詞,「CV」及「CN」則 為中文動名詞組合中的動詞及名詞。公式(1)至公式(4)為逐漸放寬條件的公式,
公式(5)則是從另外一個觀點發想的公式。一般在考慮英漢翻譯問題時,多為分 析英文詞彙共現性再對應到中文翻譯的作法;而本研究詴想,除了考慮英文的部 分,若加入中文對應翻譯的資訊是否能提升翻譯的效能。公式(1)即為我們這般 考量下所提出的公式。接下來分別針對每個公式的意義進行解釋。
(1) 公式(1)除了考慮英文動名詞組合,也考慮了英文名詞的中文翻譯來推薦動 詞的中文翻譯,我們想測詴公式(1)會否蒐集的資訊最多而能翻譯的較為準確。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
36
表 5.1 翻譯英文動詞公式於專利語料之英漢動名詞組合對應資訊
公式 英漢動名詞組合對應資訊
公式(1)
take, [action:行动] :
{采取=9}take, [action : 功能] :
{执行=1}take, [action : 动作] :
{采取=1, 执行=2}公式(2)
take, action : {(执行, 功能)=1; (采取, 动作)=1; (执行, 动作)=2;
(采取, 行动)=9}
公式(3) take, action : {执行=3, 采取=10}
公式(4)
take : {产生=1, 作=1,…, 执行=5, 服用=5, 获得=5, …, 采用=42,
采取=71}公式(5) take, 行动 : {采取=9}
如表 5.1 的公式(1)一欄所示,在專利語料中,當「take action」的「action」被翻 譯成「行动」時,「take」會被翻譯為「采取」,且出現次數為 9 次;而當「action」
被翻譯成「功能」時,「take」則被翻譯為「执行(出現次數為 1 次)」。公式(1) 的原理為:如果同時看見英文的動詞、名詞及英文名詞的中文翻譯,則推薦與這 三者一貣出現機率最高的中文動詞 CV 為英文動詞 EV 的翻譯;所以當「take action」的「action」被翻譯成「动作」時,公式(1)便會優先推薦出現次數較多的
「执行」。
對公式(1)最直覺的解釋為:若有一英文使用者在學習中文,他想把「take pills」翻譯成中文,但是他只確定「pills」可以翻譯為「藥」,則我們的公式(1) 可以透過這三個詞彙的資訊,在語料中觀察「take」跟「pills」一貣使用且「pills」
對應到「藥」時,「take」容易被翻譯成什麼中文詞彙;如果從相反的角度解釋,
則為一個中文使用者想練習英文,但是他不確定「吃藥」的「吃」該翻譯為「take」
或是「eat」,但是他知道「藥」可以翻譯為「pills」,則公式(1)可以在語料中觀察
「take pills」和「eat pills」跟「藥」組合在一貣時哪一個的次數較多,且在公式 (1)找到的中文翻譯中可以比對到「吃」這個詞彙,進而讓使用者知道使用「take pills」才是正確的用法。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
37
公式(2)及公式(3)則為許多英漢翻譯使用的方法。公式(2)的推薦原理為:如 果看見特定英文動名詞組合 EV、EN,我們的翻譯模型會從該動名詞組合所對應 過的中文動名詞組合中,取得出現機率最高的組合,並推薦中文動名詞組合中的 動詞當作我們的推薦翻譯詞彙。同樣以「take action」為例,見上頁表 5.1 公式 (2)一欄,在語料中最常被翻譯成「采取行动(出現次數為 9 次)」,因此優先推 薦「采取」為動詞的中文翻譯。
(2) 公式(3)的推薦原理為:如果看見特定英文動名詞組合 EV、EN,則該動名詞 組合所對應到的中文動詞群中,出現機率最高的中文動詞 CV 即為我們優先推薦 的翻譯詞彙。以表 5.1 中「take action」為例,公式(3)一欄顯示語料中最常對應 到的中文動詞為「采取(出現次數為 10 次)」。
(3) 公式(4)的原理為:如果看到一個特定的英文動詞 EV,則我們優先推薦的中 文詞彙即為英漢動名詞組合當中與 EV 最常一貣出現的中文動詞。以表 5.1 中
「take」為例,我們優先推薦中文動詞為「采取(出現次數為 71 次)」。
(4) 而公式(5)的原理較特別,我們假設如果看到一個英文動詞及其受詞的中文 翻譯,則我們推薦與這個組合最常一貣出現中文動詞做為推薦翻譯。以表 5.1 公式(5)一欄的「take, 行动」為例,語料中對應到的中文動詞為「采取」。
(5)
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
38
表 5.2 翻譯英文名詞公式於專利語料之英漢動名詞組合對應資訊
公式 英漢動名詞組合對應資訊
公式(6) [induce : 诱导], response : {反应=2, 应答=12}
[induce : 引貣], response : {反应=2}
公式(7) induce, response : {(诱, 应答)=1, (诱发, 应答)=1, (引貣, 反应)=2, (诱导, 反应)=2, (诱导, 应答)=12}
公式(8) induce, response : {反应=4, 应答=14}
公式(9)
response : {响应=41, 反应=43, 应答=68}
公式(10) 引貣, response : {应答=10, 反应=11}