以知識本體為基礎的語意查詢系統之研究:以圖書館為例 鍾正男、楊豐兆
E-mail: 9314381@mail.dyu.edu.tw
摘 要
在資訊時代裡,無論是求學或是工作、甚至日常生活都需要 資訊與知識協助解決問題。其中以圖書館能提供較完整、較可 靠 與較可信的知識。因為圖書館的書籍是以政府或財團法人的龐大 力量收集的,可以說是集百家之大成;其內容是經過 出版社嚴格 的審查程序,資料內容的可信度與可靠度也比較高。雖然目前的 圖書館檢索系統已經可以讓使用者從Web 圖 形介面輸入關鍵字 搜尋書本或期刊,但是所使用的搜尋演算法是直接採用字串比對 的方式進行搜尋,以這種演算法所檢 索的結果其精確度相當低, 不相關的資料量卻是相當多,這是因為字串比對是根據字形(word lemma)而非字義(word sense)
,使用者當然無法找到真正所需要的 知識。 本研究將杜威十進分類法(Dewey Decimal Classification: DDC)與賴永祥的中 國圖書分類法(New classification Science For Chinese Libraries:CCL)以知識本體的形式呈現,可以定義兩種 圖書分類法中每 一個類別(主類、學科、主題)的詳細資訊,也可 以描述類別與類別之間相關的程度。語意分析的處理方式,可以 找到與檢 索詞語意相似的書籍資訊。當書本所介紹的知識橫跨二 個以上領域時,可以再賦予其它的次分類號以利找出跨領域或多 主題的書籍。 本研究以CCL 與DDC 做為檢索圖書館書目的知識本體 (ontology),使用者利用這個知識本體可以找出與其語 意相似的學 科與主題性質,例如:輸入檢索詞”電腦程式 AND 生物學”,推 論引擎就會找出有關生物資訊學的書籍,不 會只找出標題或書名 有電腦程式(and/or)生物學的資訊。以語意為主的檢索可以找出檢 索詞(Query term)的意義與檢索詞之 間的關係,讓使用者過濾不需 要的資訊內容並且找出真正需要的知識。
關鍵詞 : 本體論、杜威十進分類法、線上公用目錄、中國圖書分類 法 目錄
封面內頁 簽名頁 授權書...iii 中文摘要... v 英文摘
要...vii 誌謝...viii 目錄...ix 圖目
錄...xi 表目錄...xiii 第一章 緒論... 1 1.1 研究背 景... 1 1.2 研究動機與目的... 4 1.3 研究限制與範圍定義... 5 1.4 論 文架構... 5 2.1 杜威十進分類法... 8 2.1.1 歷史與目前使用現況... 8 2.1.2 發展與版本... 9 2.2 中國圖書分類法... 10 2.3 十進分類法的概觀(結構、符號、階 層) ... 11 2.4 知識本體(ontology) ... 15 2.4.1 知識本體的介紹... 15 2.4.2 知識本體分 類... 17 2.4.3 知識本體語言與工具... 18 2.5 語意網... 21 第三章 系統 模型架構與研究方法... 23 3.1 系統目標... 23 3.2 使用者需要分析... 24 3.3 語意查詢系統之架構... 25 第四章 系統的核心模組... 30 4.1 領域知識本
體... 30 4.2 推論引擎... 33 4.3 資料庫... 36 第五章 系統實 作... 38 5.1 系統介面... 38 5.2 系統功能... 38 第六章 結論與 未來... 46 6.1 結論與研究貢獻... 46 6.2 未來的研究... 47 參考文 獻... 48
參考文獻
1. 卜小蝶,” 提供全球圖書資訊服務的線上公用目錄(OPAC) 改進方法”,TANet’95 研討會:台灣校園網路規劃管理與應 用,
頁147-151,中壢市:中央大學,1995。 2. 中英雙語的「語言座標」計畫中文語意網路,
http://corpus.ling.sinica.edu.tw/project/LanguageArchive, Mar.2004. 3. 林俊佑,”在數位圖書館多代理人系統中以本體論為基礎的內 容檢 索”,清華大學資訊工程系碩士論文,2001。 4. 知網(How-net), http://www.keenage.com, Mar. 2004. 5. 陳勇任、林信成、蕭勝文,“模 糊理論與標示語言在電子新聞 管理系統之應用”,2003 年資訊技術應用與發展研討會,2003。 6. 陳惠瑜,”「評析我國大學校院 Web 版線上公用目錄系統之 介面與特性」 ”,國立中央圖書館臺灣分館館刊,p.90-107, Jun. 2001。 7. 提姆·柏納李(Tim Berners-Lee)
,一千零一網(Weaving the Web) ,臺北市:台灣商務印書局館,1999。 8. 曾元顯,” 數位文件之資訊組織與主題分析自動化之技術 與 應用,” 「台北市立圖書館館訊」,頁23-35,DEC. 2002。 9. 曾元顯,”新一代資訊檢索技術在圖書館OPAC 系統的應 用”,大學 圖書館,1 卷3 期,Jul. 1997。 10. 黃居仁,”語意網、詞網與知識本體:淺談未來網路上的知識 運籌” ,佛教圖書館館訊第33 期,2003
。 11. 鄭惠珍,”「中國圖書分類法」之探討-以實例論證”,大學圖 書館 3 卷3 期(民88 年7 月),頁129-148。 12. 賴永祥,中國圖書
分類法,臺北市:文華圖書管理資訊股份 有限公司,Oct. 2001。 13. 戴國瑜,”杜威十進分類法研究” ,文化大學圖書館資訊學研 究所 碩士論文,1973。 14. B. Chandrasekaran, J. Josephson and V. Benjamins, “What are ontologies, and Why do we need them?,” IEEE Intelligent System, Vol.14, No.1, pp. 20-26, 1999. 15. Dewey Decimal Classification, http://www.oclc.org/dewey/, Mar. 2004. 16. Jamshid Beheshti, “OPACs: A research review” Library and Information Science Research, Volume: 19, Issue: 2, pp. 111-133, 1997. 17. Library Of Congress, http://www.loc.gov/catdir/cpso/lcco/lcco.html , Mar. 2004. 18. Protege 2000, http://protege.stanford.edu/ , Mar. 2004. 19. R.H.L.
Chiang, C.E.H. Chua and V.C. Storey, “A smart web query method for semantic retrieval of web data,” Data & Knowledge engineering, Vol.38, No.1, pp. 63-84, Mar. 2001. 20. SUMO ( Suggested Upper Merged Ontology ) , http://ontology.teknowledge.com/, Mar. 2004. 21.
Tim Berners-Lee, James Hendler and Ora Lassila, ”The Semantic Web, http://www.ryerson.ca/~dgrimsha/courses/cps720_02/resources/
Scientific%20American%20The%20Semantic%20Web.htm”, Scientific American, 2001.