• 沒有找到結果。

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

1

第一章 緒論

1.1 研究背景與目的

國際教育學 習成就 調 查委員會(The International Association for the Evaluation of Education Achievement, IEA)[37]的核心主題為瞭解世界各國學生對於數學和科學的學 習成就並進行量化,且討論各國教育體制、社會文化等相關因素之關聯性,最終成果可 於國際之間進行比較與分析。在 1970 年和 1980 年分別舉辦了首兩次世界性的國際數學 與科學教育成就調查,兩次累計共有 43 個國家協同參與。IEA 自 1990 年開始推動進行

「第三次國際數學與科學教育成就研究(Trends in International Mathematics and Science Study, TIMSS)」,並計畫往後每四年舉辦一次國際數學與科學教育成就之研究,至今我 國已參與 1999 年、2003 年和 2007 年共三屆。

我國在 1992 年成功通過國際教育學習成就調查委員會的審查,成為正式會員國。

並於 1999 年開始舉辦 TIMSS,調查對象為十三歲學童(相當於國中二年級學生)。2003 年的調查對象除原先的十三歲學童外,新加入了九歲學童(相當於國小四年級學生)。

國立台灣師範大學科學教育中心(以下稱師大科教中心)受行政院國家科學委員會(以 下稱國科會)委託,將 TIMSS 英文試題轉譯成中文試題並舉行測驗及調查研究。主要 的工作流程包含:從 IEA 取得試題內容,由師大科教中心決議進行翻譯工作分配、中文 試題交換審稿校正及翻譯問題討論,最後將中文翻譯試題定稿。至目前為止,師大科教

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

2

中心已將 1999 年、2003 年和 2007 年共三屆試題內容和評量結果,公佈於台灣 TIMSS 官方網站[39],以提供研究之參考。

在這一系列的翻譯工作中,往往利用大量的人力資源和時間來進行人工翻譯,在如 此高成本的花費中,我們可以得到翻譯品質相當優良的中文試題,但也因為是使用了人 力進行人工翻譯,也產生了不同的翻譯者,對相同的英文句型有不同地見解。因此,倘 若能利用機器翻譯(machine translation)的技術來輔助翻譯,便可能提升翻譯速度和翻 譯結果的一致性。

TIMSS 的測驗對象為國小四年級及國中二年級學生,整體的試題內容利用簡單的語 法結構來構成直述句、提問句和誘答選項。在 2007 年,呂明欣架構了一個主要以 TIMSS 為翻譯目標的試題輔助翻譯系統,主要是以英漢翻譯模組和以 SRI Speech Technology and Research Laboratory 所開發的自然語言工具 SRILM[36],來建立 bigram 語言模型,

並輔助翻譯結果的機率式選詞模組來產生中文句子[5],而張智傑則在 2008 年針對呂明 欣之研究進行詞序的改良,主要利用平行語料庫(parallel corpus)之間的中英文平行句 對進行詞彙對列(word alignment)後,觀察中英文句對中詞序的交互現象,以產生詞 序範例樹,並建立詞序範例樹資料庫以進行詞序互換,進而加強翻譯的品質[16]。在 2009 年田侃文更蒐集大量中英原始對照語料,透過動態規劃演算法和門檻值的篩選,產生更 多的中英文平行語料,以增加詞序範例樹的資料量[4],整體的系統流程圖如圖 1.1 所示。

其中我們發現,除了可以像田侃文從平行語料的量來改良詞序範例樹資料庫以外,

詞彙對列模組也是建構詞序範例樹的關鍵因素之一,由於原始系統中張智傑是以辭典為 基礎來進行詞彙對列,主要的步驟是,將中文句子經過中央研究院(以下簡稱中研院)

斷詞系統[2]斷詞之後,再以中文字詞為單位,逐一透過漢英辭典查詢,並且記錄所得到 的英文翻譯集合,最後將英文翻譯集合中的英文單字與英文句子進行比對,且標記詞

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

4

1.2 研究方法

我們主要改進詞彙對列模組的效果,期盼產生更多的詞序範例樹,以達到翻譯系統整體 一致性。主要將會針對詞彙對列進行改良,包含常見的一個中文字詞對應一個英文字詞 之對列方式,我們更將原先辭典內部擁有的複合字資訊(如片語)加以利用,促使詞彙 對列模組可進行一個中文字詞對應多個連續英文字詞之對列情況。我們發展的詞彙對列 模組,主要是以辭典為主,因此辭典檔本身的資訊量和準確度與整個系統效能有著密不 可分的關係。儘管如此,我們 也不能一味的追求龐大的辭典檔,來提升辭彙對列的效能,

因此我們試圖利用史丹佛詞性標記器(Stanford Part-Of-Speech tagging)[38]來進行原詞 處理(lemmatization),來對原始的英文句子中的各個單詞,進行詞性處理(如時態問題、

複數問題等);另一方面,由於中文語言的特性,一個欲表達的概念,常可有多種辭彙 可以交互替換,因此在對應的同時,我們將透過同義詞詞林[7]來對原始的中文字詞進行 擴充,以便增加對應的機會。

在完成第一階段的詞彙對列之後,我們更進一步的來探討中英文平行句對尚未成功 對應的字詞(null alignment[35], 以下稱之為遺留字詞)。詞彙對列主要可產生四種結果,

「完全對列(無任何遺留字詞)」、「只遺留中文字詞」、「只遺留英文字詞」和「中英都有 遺留字詞」,我們將針對「只遺留中文字詞」及「只遺留英文字詞」兩種結果,來進行停用 詞列表的選取和遺留字詞利用的討論;並對「中英都有遺留字詞」進行新詞對的擷取,在 此參考曾元顯[14]所選用的分析公式進行評估,以選取較為正確的新詞對來擴充原始辭 典的詞彙量。最終再搭配擴充之後的辭典執行詞彙對列的動作,以得到更佳的對列結 果。

在訓練語料方面,本系統以不同英文程度的平行語料,國中英文共 7360 句,高中 英文共 9954 句,科學人雜誌從 2002 年 3 月創刊至 2006 年 12 月共 110 篇,使用呂明欣

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

5

[5]簡易中英文句對列,所產生的 2686 句平行語料,期盼從中獲得不同英文程度的詞序 範例樹,來進行實驗比較。

在評估結果方面,我們以召回率及精確率對本系統所產生的結果進行評估與分析,

更同時利用張智傑[16]於 2008 年提出的輔助式機器翻譯系統,以 2007 年國際數學與科 學教育成就趨勢調查(以下簡稱為 TIMSS 2007)進行翻譯,以 BLEU 和 NIST 做為評估 工具,探討詞彙對列模組的改良是否有助於翻譯品質之提升,並以不同語料組合做整體 實驗之比較。

1.3 論文架構

除了在上一小節中簡短的介紹外,在第二章會回顧詞彙對列的技術和遺留字詞之相關研 究,第三章針對高中平行語料來源、詞彙對列模組、詞序範例樹的用途和辭典檔的選取 進行介紹,第四章則對詞彙對列模組之核心技術進行細部的說明,第五章則是利用 BLEU 和 NIST 等工具來對翻譯結果進行評估,第六章則是結論與未來展望。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

6