• 沒有找到結果。

第六章 結論與未來展望

6.2 未來展望

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

68

6.2 未來展望

從詞彙對列的技術方面,整體的結果還是比不上眾多先進的效能[24]。假若能夠再將英 文詞彙的詞性標記、中文句法的概念和個別詞彙的探討,甚至是由英文字詞當作索引字,

這些因子加入詞彙對列模組中,相信能夠提升詞彙對列整體的效能。如趙紅梅等學者在 漢英詞語對齊規範中所用的方法[17],他們將中文字詞進行過濾,找出對列過程中較為 困難的中文字詞,透過討論其字詞的特性,來對該字詞設定特有的對列規則,跳脫了單 純利用辭典來進行對列,以字詞為單位依照各自的特性來進行對應。

在遺留字詞利用方面,目前雖然是以分數累積做為門檻值,但這有一個很明顯的缺 失,當平行語料的數量到一定的數目之後,分數累積整體的數值便會膨脹,這種情況便 會使得我們不能利用分數累積=1 做為門檻值,應該要依照不同的語料和對列結果,來 選擇新詞彙的門檻值,甚至是利用其他的分析公式來交互搭配,以獲得更準確的新詞 對。

而在校能評估的部分,由於我們手邊的這些平行語料,並無其對列結果的正確答案,

由人工隨機挑選句子來進行評估,雖然可以反映出整體大概的趨勢,但依舊無法精確的 反應出對列效果,我們實際上需要更多、更客觀的對列答案,以進行更客觀的實驗結果 評估與分析。

若能對目前的詞彙對列模組進行改善之後,是必能夠使得該模組運行至更為艱難的 平行語料中,以完成詞彙對列的工作,我們冀望此詞彙對列模組能夠有效地被後來的研 究者利用,甚至整合至其他的翻譯系統中,以協助其進一步的研究工作。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

69

參考文獻

[1] 三民學習網, http://www.grandeast.com.tw/Englishsite/ [Last visited on 2010/05/26].

[2] 中央研究院中文斷詞系統, http://ckipsvr.iis.sinica.edu.tw/ [Last visited on 2010/05/26].

[3] 牛津現代英漢雙解辭典, http://stardict.sourceforge.net/Dictionaries_zh_TW.php [Last visited on 2010/05/26].

[4] 田侃文,英漢專利文書文句對列與應用,國立政治大學資訊科學所,碩士論文,

2009。

[5] 呂明欣,電腦輔助試題翻譯:以國際數學與科學教育成就調查為例,國立政治大學

資訊科學所,碩士論文, 2007。

[6] 狄 克 生 片 語 , http://203.68.17.29/kevin/EteachWeb/DIXON/ [Last visited on 2009/11/10].

[7] 哈工大訊息檢索實驗室同義詞詞林擴充

版, http://www.nlp.org.cn/docs/doclist.php?cat_id=9&type=7 [Last visited on 2010/05/26].

[8] 英 文 諺 語 , http://www.eng.fju.edu.tw/etc/quiz/proverbs.htm [Last visited on 2010/05/26].

[9] 科學人雜誌中英對照電子書, http://edu2.wordpedia.com/taipei_sa/ [Last visited on 2010/05/26].

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

70 [10] 旋元佑文法,

http://tw.myblog.yahoo.com/jw!GFGhGimWHxN4wRWXG1UDIL_XSA--/ [Last visited on 2010/05/26].

[11] 基礎英文1200句, http://hk.geocities.com/cnlyhhp/eng.htm [Last visited on 2010/05/26].

[12] 國民中學學習資源網, http://140.111.34.172/teacool/new_page_2.htm [Last visited on 2010/05/26].

[13] 教育部委託宜蘭縣發展九年一貫課程建智語文學習領域(英文)國中教科書補充資

料暨題庫建置計畫, http://140.111.66.37/english/ [Last visited on 2010/05/26].

[14] 曾元顯、劉昭麟和莊則敬,專利雙語語料之中、英對照詞自動擷取,第二十一屆自

然語言與語音處理研討會論文集,279–292, 2009。

[15] 梅家駿、竺一鳴和高蘊琦,同義詞詞林,上海:上海詞書出版社, 1983

[16] 張智傑,以範例為基礎之英漢TIMSS試題輔助翻譯,國立政治大學資訊科學所,碩

士論文, 2007。

[17] 趙紅梅、劉群、張瑞強、呂雅娟、隅田英一郎和吳翠玲,漢英詞語對齊規範,中文

信息學報第23卷第3期, 2009。

[18] M. H. Bai, J. M. You, K. J. Chen and J. S. Chang, Acquiring Translation Equivalences of Multiword Expressions by Normalized Correlation Frequencies, Proceedings of the 2009

Conference on Empirical Methods in Natural Language Processing, 478–486, 2009.

[19] CEDICT漢英電子字典檔, http://us1.mdbg.net/chindict/chindict.php [Last visited on 2010/05/26].

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

71

[20] J. S. Chang and M. H. Chen, An Alignment Method for Noisy Parallel Corpora based on Image Processing Techniques, Proceedings of the 35th Annual Meeting of the

Association for Computational Linguistics, 297–304, 1997.

[21] D. Chiang, A Hierarchical Phrase-Based Model for Statistical Machine Translation,

Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics,

263–270, 2005.

[22] G. Doddington, Automatic Evaluation of Machine Translation Quality Using N-gram Co-occurrence Statistics, Proceedings of the Second International Conference on Human

Language Technology Research, 138–145, 2002.

[23] Dr.eye 譯 典 通 線 上 辭 典 , http://www.dreye.com:8080/axis/ddict.jsp [Last visited on 2010/05/26].

[24] S. J. Ker and J. S. Chang, A Class-based Approach to Word Alignment, Computational

Linguistics, Vol. 23, No. 2, 313–343, 1997.

[25] S. Le, J. Youbing, D. Lin and S. Yufang, Word Alignment of English-Chinese Bilingual Corpus Based on Chunks, Proceedings of the 2000 Joint SIGDAT Conference on

Empirical Methods in Natural Language Processing and Very Large Corpora, 110–116,

2000.

[26] Y. Ma, N. Stroppa and A. Way, Bootstrapping Word Alignment via Word Packing,

Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics,

304–311, 2007.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

72

[27] Y. Ma, S. Ozdowska, Y. Sun and A. Way, Improving Word Alignment Using Syntactic Dependencies, Proceedings of the Second Workshop on Syntax and Structure in

Statistical Translation, 69–77, 2008.

[28] C. D. Manning and H. Schutze, Foundations of Statistical Natural Language Processing,

The MIT Press, 1999.

[29] C. D. Manning, P.Raghavan and H. Schutze, Introduction to Information Retrieval, Cambridge University Press, 2008.

[30] R. Mihalcea and T. Pedersen, An Evaluation Exercise for Word Alignment, Proceedings

of the HLT-NAACL 2003 Workshop on Building and Using Parallel Texts: Data Driven Machine Ttranslation and Beyond, 1–10, 2003.

[31] F. J. Och, An Efficient Method for Determining Bilingual Word Classes, In 9th

Conference of the European Chapter of the Association for Computational Linguistics,

71–76, 1999.

[32] F. J. Och and Hermann Ney, Improved Statistical Alignment Models, Proceedings of the

38th Annual Meeting of the Association for Computational Linguistics, 440–447, 2000.

[33] K. Papineni, S. Roukos, T. Ward, and W. J. Zhu, BLEU: A Method for Automatic Evaluation of Machine Translation, Proceedings of the 40th Annual Meeting of the

Association for Computational Linguistics, 311–318, 2002.

[34] M. F. Porter, An Algorithm for Suffix Stripping, Program, 130–137, 1980.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

73

[35] D. Ren, H. Wu and H. Wang, Improving Statistical Word Alignment With Various Clues, In Proceedings of

[36] SRILM,

Machine Translation Summit XI, 391–397, 2007.

http://www.speech.sri.com/projects/srilm/ [Last visited on 2010/05/26].

[37] The International Association for the Evaluation of Education Achievement, http://www.uea.nl/

[38]

[Last visited on 2010/05/26].

The Stanford Parser: A statistical

parser, http://nlp.stanford.edu/software/lex-parser.shtml

[39] TIMSS國際數學與科學教育成就趨勢調

查,

[Last visited on 2010/05/26].

http://timss.sec.ntnu.edu.tw/timss2007/news.asp [Last visited on 2010/05/26].

[40] M. Utiyama and H. Isahara, A Japanese-English Patent Parallel Corpus, Proceedings of

the Eleventh Machine Translation Summit, 475–482, 2007.

[41] D. Wu, Grammarless Extraction of Phrasal Translation Examples from Parallel Texts,

Proceedings of the Sixth International Conference on Theoretical and Methodological Issues in Machine Translation, 354–372,1995.

[42] WordNet API, http://wordnet.princeton.edu/ [Last visited on 2010/05/26].

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

75

附錄Ⅱ

在碩士口試的過程中,三位口試委員都給筆者很多的建議語問題,在當時已用口頭 報告的方式回答各個委員的提問,在此將以文字的方式進行記錄。A.

論文口試其他相關討論

「THE」與後面名詞 綁住的策略:此策略之原因是,中文翻譯句時常沒有對英文定冠詞「THE」進行翻譯,如 此一來產生英文遺留字詞,為了減少因為中文翻譯句本身的疏忽,我們則進行 「THE」之 修補策略。B.在口試的過程中, 曾元顯老師也提到訓練語料與翻譯目標兩者之間領域 的關聯度,從實驗結果可以知道,若我們選用的訓練語料與翻譯目標有相當大的關聯性,

則不需要非常龐大的訓練語料,便可以達到一定的翻譯水準。C.是否所有的句子都為「

完全對列」,在此我們是建立在試題本身就皆為完全對列的假設,來進行本論文的實驗。

D.若翻譯目標改變,整體的成效如何:我們將其放至在未來展望,期望未來有其他的測 試語料還其標準的翻譯答案,則可進一步的進行分析比較。

以上A至D四個討論,都是筆者在口試的過程中,三位口試委員的提問與建議,在 此我們將這些題目放至在附錄Ⅱ,以便未來的讀者可以更進一步的了解整個論文的方向,

和其可以改進的弱點,在此再次的感謝三位口試委員的指導,有助學生昭憲在整本論文 的質與量有一定程度的提升。