• 沒有找到結果。

絕妙好詞網站-宋詞語彙網路

在文檔中 宋詞斷詞與本體論之建置 (頁 76-0)

第四章 實驗成果

4.5. 本體論實作

4.5.3. 絕妙好詞網站-宋詞語彙網路

網際網路無遠弗界的特色,讓現代人能藉其助力,跨越時間、空間的限制,

隨時隨地都能夠利用以網際網路為基礎的學習系統(Web-Based Application)進行 學習或資料檢索。

基於上述的概念,我們設計了「絕妙好詞-宋詞語彙網路」網站提供宋詞語彙 資訊的檢索,以便讓這些知識能夠更容易地重複利用。使用網站當做使用介面的 原因在於它具有以下特色:

• 觸角廣、無時空的限制:只要任何使用者能夠使用到網際網路,電腦上有 65

瀏覽器就可以在任何時間、任何地點進行存取。

• 易部署:網站程式只需要部署到一台具備Web伺服器的主機上,就可以運 作,具備零接觸11安裝的特色,降低散發應用程式的成本。和單機版

(Windows應用程式,編譯成EXE檔案)相較之下,單機版程式需要程式 安裝到每個使用者的電腦上,不易進行部署。

• 易管理:由於系統是建置在一台伺服器上,管理者只需要針對一台電腦進 行管理,減輕管理上的負擔。

• 易維護:後續網站程式版本修改時,只要把修改後的二進位檔案更新到伺 服器的網站目錄之中,新版本的程式馬上就可以運作。所有的使用者馬上 可以使用到新版本的程式和功能。而單機版程式後續更新版本時,需要每 一台電腦都重新更新,浪費大量的人力。

圖 22是絕妙好詞網站架構圖,終端使用者可以使用桌上型電腦或者是手持式 裝置透過網際網路連結到絕妙好詞網站伺服器上,透過網站程式從後端資料 庫伺服器中查詢詞彙相關的資訊。

圖 22:絕妙好詞網站架構圖

學習者使用瀏覽器透過網站提供的使用者介面,就可以從網際網路存取相關 的詞彙資訊。參考圖 23,只要輸入想查詢的詞彙,如「梅花」,就可以把使用到

11 零接觸安裝 (no touch deployment),不需要接觸到使用者就可以安裝系統。

66

「梅花」這個詞彙的詞資訊查詢出來。

圖 23:絕妙好詞網站 網站提供的功能包含:

• 宋詞詞牌檢索:查詢詞牌相關資訊。

• 概念階層查詢:查詢詞彙概念分類。

• 詞彙查詢:查詢某詞彙相關語意資訊,包含哪些詞中使用到這個詞彙、詞 牌、作者、同義詞、近義詞、反義詞、對仗詞,以及此詞彙的前後詞彙,

此詞彙所屬的概念階層等相關的語意資訊。

67

68

69 以幫助斷詞。

• 增加構詞規則:我們採用的詞庫中不收錄定詞、量詞、定量複合詞、複疊詞等 詞彙,構詞規則的產生可以補詞庫之不足之處。挑選該增加哪些構詞規則以輔 助斷詞,也是研究的重點。

• 以機器學習方式自動斷詞:未來對於任何斷詞模組都無法正確切分的三字詞部 份,可以考慮尋找詞彙的構詞規則,或結合機率的方式計算字與字之間成詞的 可能性。或者,也可以思考詞彙與詞彙是否經常在上下文中一起出現的共現關 係,以抽取詞句中的詞彙,利用機器學習的方式,自動斷字詞。

在本體論方面,目前本體中的詞彙以及語意資料數量還不夠完備,未來以持 續建置這些資料為重心,才能提供更多的應用。此外,本體資料的建置有賴專家 的引導,才能保持資料的正確性。未來本體的語意資料夠豐富時,可以將本體的 資訊應用在斷詞器上,當做解岐義的一種策略。

70

參考文獻

[1] Fernndez, M., Gmez-Prez, A. and Juristo, N. "Methontology: From ontological art towards ontological engineering”, In Proceedings of Workshop on Ontological Engineering: AAAI-97 Spring Symposium Series, Stanford, CA, 1997.

[2] Michael Gruninger and Mark S Fox, “TOVE Methodology for the Design and Evaluation of Ontologies”, Department of Industrial Engineering University of Toronto, Toronto, Canada, M S A, 1995.

[3] Mike Uschold, Michael Gruninger. The Knowledge Engineering Review, 1996.

[4] Tim Berners-Lee. , Weaving the Web: Origins and Future of the World Wide Web, Texere Publishing, US., 1999.

[5] Resource Description Framework (RDF). 9 Mar. 2006. World Wide Web Consortium. 25 May. 2006 < http://www.w3.org/RDF/>.

[6] Suggested Upper Merged Ontology. 11 Oct. 2005. IEEE Standard Upper Ontology Working Group. 25 May. 2006 <http://ontology.teknowledge.com/>.

[7] 中英雙語知識本體詞網。2003 年 10 月 1 日。中央研究院。2006 年 5 月 25 日。

[11] 俞士汶、胡俊峰,「唐宋詩之詞彙自動分析及應用(Word-based Statistical Analysis of Chinese Ancient Poetry)」,語言暨語言學,第四卷第三期,2003。

[12] 胡俊峰,"基於詞彙語義分析的唐宋詩電腦輔助深層研究",北京大學,博士

71

[25] Mo, Ruo-ping Jean, Yao-Jung Yang, Keh-Jiann Chen and Chu-Ren

Huang., ”Determinative-Measure Compounds in Mandarin Chinese: Their Formation Rules and Parser Implementation.”, In Proceedings of ROCLING IV

(R.O.C. Computational linguistics Conference). , pp. 111-134.

[26] 唐大任,"中文斷詞器之研究",國立交通大學,碩士論文,民國九十一年七 月。

72

[27] 詞庫小組,「資訊處理用中文分詞標準草案」,經濟部中央標準局,1996 年。

[28] 陳弘治,詞學今論,文津出版社,1991 年 7 月。

[29] RDF Vocabulary Description Language 1.0: RDF Schema. 10 Feb. 2004. World Wide Web Consortium. 25 May. 2006 <http://www.w3.org/TR/rdf-schema/>.

[30] OWL Web Ontology Language Overview. 10 Feb. 2004. World Wide Web Consortium. 25 May. 2006 <http://www.w3.org/TR/owl-features/>.

[31] DAML+OIL (March 2001) Reference Description. 18 Decc 2001.World Wide Web Consortium. 25 May. 2006 <http://www.w3.org/TR/daml+oil-reference>.

[32] 高明,王熙元,陳弘治,張仁青,莊雅州,閔宗述,李周龍編,中國文學總 欣賞,9,初版,錦繡文化企業,民國 81 年 8 月。

在文檔中 宋詞斷詞與本體論之建置 (頁 76-0)

相關文件