• 沒有找到結果。

國立政治大學資訊科學系劉昭麟 [email protected]

摘要

劉昭麟(以下自稱為報告人)於二零零八年六月中赴美國俄亥俄州哥倫布市 (Columbus, Ohio, USA),參與了計算語言學會(Association for Computational Linguis-tics,簡稱 ACL)的年會,並且在會議中報告論文。這是這一次出席國際學術會議的報告。

本報告首先列出出席會議的時間、地點、所參與的會議的基本資料和相關網址;然後報 告參與會議所體驗的觀察和心得;最後提出簡短的結論。

1

出訪地點、時間、參與會議

1.1 基本資料

出訪地點:美國俄亥俄州哥倫布市(Columbus, Ohio, USA) 會議時間:二零零八年六月十五日至六月二十日

參與會議:ACL 2008: The Forty Sixth Annual Meeting of the Association for Compu-tational Linguistics: Human Language Technologies

經費來源:國科會研究經費與政治大學資科系部份補助

發表論文:Using Structural Information for Identifying Similar Chinese Characters (附 件五)

相關網址:

ACL:

http://www.aclweb.org

ACL 2008:

http://www.ling.ohio-state.edu/acl08/

1.2 參與過程

ACL 的年會是歷史悠久的計算語言學學術會議,會議的時間從六月十五日到二十 日,其中十五日是主會議前的教學課程(tutorials),十九日和二十日是主會議之後的工作 坊(workshops)。由於距離與時差的問題,報告人必須在台北時間十三日就從台北啟程,

於美國當地時間十五日參與了 Building Practical Spoken Dialog Systems 的教學課程,於 十六日報告論文,並且於十九日參加了 The Third Workshop on Innovative Use of NLP for Building Educational Applications,最後於美國當地時間二十日離開哥倫布市返國。

參與本次會議的台灣學者明顯偏少,只有遇到前清華大學電機系的蘇克毅教授。我 們不能確定這一個低出席率是因為研究經費的限制或者是因為哥倫布市的交通明顯地 不是非常方便,須要在美國其他主要都市轉機過來。儘管這些可能的原因,本次會議仍 然有許多來自香港、新加坡等亞洲的學者。

2

具體觀察與心得

由於 ACL 在計算語言學界的地位,這一個會議的參與人數非常地多,付費註冊的 人數接近 700 人。除了三天的主會議議程之外,有六個會議前的教學課程(參見附件一)

和十個會議後的工作坊(參見附件二)。在論文投稿量方面,合計有 470 篇長篇論文的 稿件和 275 篇短篇論文的投稿,最後會議接受了 119 篇的長篇論文和 64 篇短篇論文。

不管是長篇或者是短篇論文的接受率都僅止於 25%左右。報告人的論文屬於短篇論文。

被接受的長篇論文中,數量最多依序是機器翻譯(machine translation)、語意(semantics)、

語法(syntax)、問答系統(questions & answering)、統計與機器學習(statistical machine learning)、資訊檢索(information retrieval) 和資訊擷取(information extraction);這七個領 域的論文,合計占了所有長篇論文的 59.66%。

在議程的安排方面,ACL 的設計與其他學術領域的主要會議相似。除了教學課程 和工作坊之外,還有為博士班研究生設計的討論議程,請相關領域的專家為現在進行中 的博士論文研究提供建言和相互交流的機會。教學課程則是讓主會議的與會者有機會分 享一些相對比較成熟的技術,以報告人所參與的 Building Practical Spoken Dialog Sys-tems 來說,就是由 Carnegie Mellon University 的教授與研究生介紹他們所建立的語音辨 識系統,並且介紹如何包裝該系統作為應用系統的核心功能。透過這樣的介紹課程,學 習者可以獲得起步所需的知識,以比較低的代價瞭解一個相當複雜的系統。工作坊的主 要功能則是提供學者有機會討論一些正在發展中的研究議題,以報告人所參與的 The Third Workshop on Innovative Use of NLP for Building Educational Applications 來說,與會 者來自許多不同國家,分享他們如何利用計算語言學的相關技術,建構與各國母語和英 語相關的語文教學系統。

機器翻譯的相關研究雖然在國內不屬於主流研究重點,不過卻仍然是今年 ACL 主 會議的重點項目。機器翻譯的相關論文是所有領域中數量最多的,佔有長篇論文的 23%

和短篇論文的 24%,此外還有兩個相關的工作坊(Third Workshop on Statistical Machine Translation 和 Workshop on Parsing German)。Workshop on Parsing German 這一個工作坊 相當有趣,未來我們或許可以主辦一些專注於處理亞洲語系語言的工作坊。

如果要看人氣指標的話,資訊檢索和資訊擷取仍然是最容易吸引人的研究議題。比 起像機器翻譯、語法研究和語意研究這一些比較基礎的研究,資訊檢索和擷取離應用實 務比較接近,因此更容易吸引到人們的注意。

在專題演講(invited talks)方面,我們看到純粹語言學和計算語言學所沒有能夠全心 注意的一些語文認知歷程問題。Marc Swerts 強調語言的溝通除了文字和聲音之外,透 過視覺管道所發出和接收到訊息,也是人們處理語言的重要依據之一。我們的肢體語言 和臉部表情是在語音和用字之外的另一種語言;如果只專注於語音訊號處理或者文字所 攜帶的訊息,則常常不能妥善溝通過程互動各方所試圖傳遞的訊息。

六月十八日的專題演講則是一個與資訊檢索相關的演講。不管是以關鍵詞彙,或者 是以搜尋範例(例如以文找文)來搜尋資訊的方式,都比較是屬於一次性的搜尋工作。

然而,由於人機溝通的效果通常不是完美的,因此以一個程序逐漸地協助查詢者找到真

正想要的資訊,可能是比較務實的目標。Susan Dumais 介紹了許多往這一方向發展的相 關的軟體設計理念和實際系統。

今年的 ACL 學術貢獻講(lifetime achievement award)頒給 University of Sheffield 的 Yorick Wilks。Wilks 的演講介紹了他在自然語言處理與人工智慧研究等多面的研究經 驗,常常也觸及更深層的科學研究理念,如果聽者本身沒有相當廣博的知識和很好的英 文聽力,這樣高階的演講可能是不容易立即吸收。附件三是 Wilks 的演講資料。

關於報告者關於個別論文的聽講心得對於本報告的讀者或許沒有特別的吸引力,

ACL 所有的論文都公開在網路上面,請參閱附件四的議程,與網路上的電子版論文 (http://aclweb.org/anthology-new/)。其他例如六個教學課程和十個工作坊的資料,請分別 參考附件一和附件二的簡介。

除了參與學術會議之外,由於出訪經費的拮据,因此報告人所暫住的旅店距離會議 的飯店有相當的距離,每次來回開會與住所之間,單程就須要步行大約二十幾分鐘,也 因此有許多天的機會來觀察哥倫布市的日常街景。此次由美國而起的世界金融海嘯對於 美國人確實有不小的影響,哥倫布市的大眾運輸系統的使用率看起來相當地高,上下班 時間有不少等車的民眾。這可能不是一般美國中小型城市所常見的景象。

3

結論

我國致力於推展學術研究國際化,近年以來資訊科學這一方面的國際學術研討會如 雨後春筍般的蓬勃發起,除了國際學術會的頂級會議之外,例如 AAAI、IJCAI、ACL、

ICML、UAI、ITS、AIED、COLING、ACM 各 SIG 的年會等等,我國參與其他的新興 的學術研討會的必要性似乎可以做一個整體性的規劃。新興的學術研討會雖然學術知名 度不高,但是常常是培養新領域的搖籃,學術價值不可謂不高;然而,如果長期投注在 這一類新領域的研討會的邊際效用則是可以檢討的。相對地,參與具有傳統聲譽的學術 研討會,則有立竿見影的觀摩效果,可以刺激參與者更加努力、以追求在這一類研討會 發表更好論文的機會。

參考附件

附件一:ACL 2008 教學課程簡介 附件二:ACL 2008 工作坊簡介

附件三:http://www.companions-project.org/downloads/Wilks_ACL08.pdf 附件四:ACL 2008 論文議程

附件五:報告人所發表之論文

相關文件