第二章 文獻探討
第二節 知識本體技術在圖書館的應用
圖書館自古以來就扮演著知識管理者的角色,隨著時代的進步,各種知識與 其管理方式不斷地在改變,如何將人類的知識做最妥善的保存與利用,一直都是 圖書館著重的議題。在哲學領域中,有著探討「存在」議題的理論,稱為「本體
論」,該理論為探討人類知識或實體存在的特性與屬性,且基於該理論的描述功
能,而受資訊領域沿用,產生目前用於機器推理的知識本體技術,本節將探討在 圖書館、哲學與資訊三方領域的相關性,以及在技術的結合下,已經付諸執行的 計畫與應用。
一、 知識本體與知識組織
阮明淑與溫達茂(2002)將知識組織定義為,將無序或分散的特定知識,以 一定的規則與方法,將其有序、集中、定址,以方便知識的提供、利用與傳播。
該文中提到,概念是知識的基本單位,也是思維的最小單位,並透過所指事物與 語言符號來描述,即語言符號式概念的表達形式,而概念是語言的思想內容,所 指、語言和概念三者之間的關係,常以語意三角來描述。
一般常見的字典、分類表、索引典等工具,主要是作為分類、檢索,或設計 研究、研究進行與知識庫系統建構等,其基礎概念即為知識組織的應用。而知識 組織與知識本體之關聯,須顧慮到今日的數位化資源,在知識組織時需要一個具 有多用途、高彈性的智慧型表達工具,達到完整資訊的呈現與檢索,而知識本體 自哲學領域提出以來,一直扮演著概念化人類知識的工具,透過資訊技術的結合,
可滿足人類對於改善知識組織工具的需求。
16
知識本體 (Ontology)最早是被哲學領域所提出,別稱有存有學、本體論或一 般形上學(general metaphysics),目前已被知識工程領域採納,用來向機器解釋人 類知識,換句話說,也就是使機器具備可認知人類知識之能力,阮明淑與溫達茂
(2002)認為其認知包含如下:1)世界存在著對象。2)對象具有屬性,屬性可用 數值表示。3)對象間有不同關係。4)屬性與關係依時序改變。5)不同時間點會有 事件發生。6)在一定時段上存在過程,對象參與在過程中。7)世界和對象具有不 同狀態。8)事件能導致其他事件發生或狀態改變。9)對象可分解成部分。
以知識組織的角度可看出,知識本體能適用於 Web 環境下作知識之表達,
而表達結果會是為了知識檢索或溝通作準備,因此,若是將此知識組織工具與圖 書館資訊科學所定義的檢索標準與規範作結合,將會是擴展圖書館功能的進一步 研究方向。
二、 知識本體與鏈結資料在圖書館的應用
Tim Berners-Lee(2000)曾提出語意網(Semantic Web)的概念,並指稱鏈結資 料(Linked Data)即是實現語意網概念的最佳途徑,此議題引起了圖書館界的高度 討論。鏈結資料的特色在於能透過等值的描述語句,連結兩個不同來源的結構化 資料,這樣的描述語句包含了 owl:sameAs 與其他類型的鏈結屬性,而這些屬性 是建立在 OWL 語言之下,換句話說,知識本體技術使得鏈結資料具有機器可推 理性,兩者密不可分(Parundekar, Knoblock, & Ambite, 2010)。2011 年,美國史 丹 佛 大 學 圖 書 館 暨 學 術 資 訊 資 源 (Stanford University Libraries and Academic Information Resources, SULAIR)廣邀各界學者,共同討論鏈結資料在圖書館界的 學術發展以及實際應用,而在報告內容中便總結了兩點(Keller, Persons, Glaser,
& Calter, 2011):一是能用來描述資料語意面的意義;二是在資料的語法與格式 面,能超越特定資料結構的限制。
17
鏈結資料因為包含了知識本體的技術,因此除了能強調資料的關聯性,亦可 套用於資訊組織,做為資料表徵與結構化的一種標準與方法,相較於傳統書目資 料的扁平式資料欄位,鏈結資料可將其轉換為(Keller et al., 2011):(1)誰寫了這 本 書 ? (Who wrote the book?)(2) 何 時 出 版 了 這 本 書 ? (When was the book published?)(3)誰出版了這本書?(Who published the book?)(4)在何處出版了這本 書?(Where was the book published?)(5)這本書的內容為何?(What is the book about?)(6)這本書以何種語言撰寫?(What language is it written in?)
為了探究此轉化之可行性,圖書館界開始著手於各項相關計畫,主要的計畫 包括虛擬國際化權威檔(Virtual International Authority File, VIAF)、美國國會圖書 館鏈結資料服務(LC Linked Data Service: Authorities and Vocabularies)、美國國際 圖 書 館 電 腦 中 心 (Online Computer Library Center, OCLC) 的 全 球 圖 書 館 目 錄 (WorldCat)、大英圖書館(British Library, BL)的自由化資料服務(Free data service) 及歐盟的 Europeana 等。柯皓仁與陳亞寧(2013)將這些計畫分為資料值、複合 式與其他,分述如下。
(一) 資料值(data value):
對象為權威檔或控制詞彙,著名的計畫有:
1. VIAF(Virtual International Authority File)
2003 年於柏林召開的國際圖書館協會聯盟(International Federation of Library Associations,簡稱 IFLA)會議上,德國國家圖書館(Die Deutsche Bibliothek,
簡稱 DDB)、美國國會圖書館(Library of Congress,簡稱 LC)和美國國際圖書 館電腦中心(OCLC Online Computer Library Center,簡稱 OCLC)一致同意開發 一個個人名稱的「虛擬國際權威檔」(Virtual International Authority File,簡稱 VIAF),目的是為了實現單一實體能多重名稱、區分同名的多個實體,以及名稱 的形式差異等情形。
18
截自 2014 年為止,已先後加入了波蘭與拉脫維亞國家圖書館,至今已有超 過 29 個國家的 34 餘個單位參與合作(Online Computer Library Center, 2014)。
VIAF 計畫的目標是要證明自動連接來自各個不同國家權威檔紀錄的可行性。
VIAF 以嚴密設計的演算法比對 LC 和 DDB 兩個權威檔間的個人名稱權威紀錄,
但又可以允許國家或區域性的不同權威形式同時存在,支援採用習用的語言、字 型和拼法標目形式的需求。所謂的名稱權威檔包括:個人名稱(people)、團體名稱 (corporations)、會議名稱(conferences)、地理名稱(geographic places)、作品(work)、
內容版本(expression)等(林淑芬,2012)。
2. LC Linked Data Service: Authorities and Vocabularies
LC Linked Data Service 是將 LC 所擁有的各式主題詞(subject headings)、權 威檔(authority file)、分類表(classification)、國家代碼(country)、語言(languages)與 圖像資料索引典(Thesaurus for Graphic Materials)等不同類型的控制詞彙以鏈結資 料的方式提供,使用者可以批次下載所有資料,亦提供使用者以 RDF/XML、JSON、
N-Triples 等格式下載(The Library of Congress, 2014)。 (二) 複合式
除了資料值之外,有些計畫以書目紀錄為主,發展書目紀錄知識本體或是導 入鏈結資料,融合資料元素與資料值,達成資料間的鏈結,包括英國的 BL、歐 盟的 Europeana 及 OCLC 的 WorldCat 等。
(三) 其他
有些計畫像是開放型詮釋資料註冊中心(Open Metadata Registry, OMR),便 同時涵蓋了各式圖書館界相關的知識本體(如:FRBR、FRAD、FRSAD)、控制詞 彙(如:GEM)、內容(如:RDA、ISBD)、資料元素(如:Dublin Core、MARC21) 等不同詮釋資料標準,是一個提供詮釋資料描述、發掘、儲存與交換的綱要資料 庫(databases of schemas)。
19