國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
58
第七章 使用科學人雜誌語料建置翻譯模型
本研究在以上章節分析了專利語料的英漢動名詞組合,我們也以同樣的方式分析 科學人雜誌英漢對照電子書[24]。本章節透過科學人語料觀察動詞和名詞的翻譯 效果。田侃文[23]將科學人雜誌英漢對照電子書的 1745 篇文章,使用該文句對 列系統產出 63256 個英漢對列的高品質句對。本研究沿用這 63256 個句對,與處 理專利語料一樣的方式產生關係樹,再將英漢動名詞組合取出對列,最後對列產 生了 4814 個英漢動名詞組合。7.1 小節探討動詞翻譯的相關分析,7.2 小節則探 討名詞翻譯的分析,7.3 小節為本章節小結論。
7.1 翻譯英文動詞
本小節分為兩個部分探討科學人雜誌的動詞翻譯情形,7.1.1 小節探討前二十五 名高頻英文動詞及 7.1.2 小節描述前九名具競爭力候選人之動詞。
7.1.1
科學人前二十五名英文高頻動詞分析由於科學人雜誌語料的英漢動名詞組合數量比貣專利語料少了許多,因此本研究 探究前二十五名在我們 4814 筆的動名詞組合資料中出現次數最多的英文動詞,
這些動詞在資料中至少出現過 31 次以上,最多的出現次數則為 379 次,如下頁
‧
have=379use=143 make=126 provide=119 find=105 take=86 play=83
reduce=65 offer=65 create=65 produce=60 require=59 cause=59
improve=50 form=49 increase=42 change=42 understand=40 develop=40
build=40 explain=37 give=34 study=33 solve=33 generate=31
圖 7.1 科學人前 25 名英文高頻動詞之協同推薦答題正確率
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
60
圖 7.4 翻譯模型在科學人前 25 名高頻動詞推薦一個及五個答案時之 f-measure 成效
時的趨勢分布與專利語料的前一百名高頻動詞趨勢相同;因為語料數量較少而資 料變化又較大(科學人文章風格較專利文句豐富),因此翻譯模型在推薦五個答 案時 f-measure 最高的成效落在 90%左右,低於在專利語料時的表現。
7.1.2
科學人前九名具競爭力候選人之動詞分析本研究由前二十五名高頻動詞中選出了具翻譯競爭力的動詞,這裡的「競爭力」
意義相同:第一名候選人出現的次數不得多於第二名候選人出現次數的兩倍。這 九個動詞如下頁表 7.2 所示,總共出現在 689 筆英漢動名詞組合,訓練資料有 552 筆,測詴資料則有 137 筆。如下頁圖 7.5 所示,科學人前九名具競爭力候選 人動詞在 f-measure 的趨勢大致上與專利前二十二名具競爭力候選人動詞的分布 相同,不過可以特別注意到公式(5)在只能推薦一個答案且注重於答題正確率 時,表現相對於其他獨立運作的公式突出,而與公式(5)搭配的組合也有較亮眼 的表現;我們認為這是因為資料數量少而資料型態卻又豐富時,公式(5)反而可 以用其獨特的觀點去猜到答案。在推薦五個答案時與公式(4)搭配的公式組合翻 譯模型仍是表現最為亮眼。
30%40%
50%60%
70%80%
100%90%
科學人前二十五名高頻動詞 k=1, f-measure 評量比較
f1 score f-measure, α=0.7
30%40%
50%60%
70%80%
100%90%
科學人前二十五名高頻動詞 k=5, f-measure 評量比較
f1 score f-measure, α=0.7
‧
f1 score f-measure, α=0.7
30%
f1 score f-measure, α=0.7
‧
role=80way=67 effect=61 problem=55 risk=42
information=41 system=35
cell=35 property=34 energy=32 ability=32 disease=31 question=30
number=28 technique=26 gene=26 datum=26 behavior=26 activity=26
technology=25 structure=25 it=24
function=24 result=23 clue=23
圖 7.6 科學人前 25 名英文高頻名詞之協同推薦答題正確率
‧
人名詞在 f-measure 的趨勢較為曲折,可以特別注意到與翻譯動詞公式(5)對稱的 公式(10)在只能推薦一個答案且注重於答題正確率時,表現相對於其他獨立運作f1 score f-measure, α=0.7
50%
f1 score f-measure, α=0.7
‧
f1 score f-measure, α=0.7
30%
f1 score f-measure, α=0.7
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
65