• 沒有找到結果。

第二章 文獻探討

第二節 語意網與鏈結資料概述

和現今的資料庫技術做很好的結合,也難以完善呈現出書目記錄之間的關係,因 此 MARC 被認為已經不再適用於現在的編目環境(邱子恒,2011)。

第二節 語意網與鏈結資料概述

1998 年 Web 的發明人暨 W3C 主席 Tim Berners-Lee 提出語意網的概念,

希望為全球資訊網的巨量網頁賦予機器可以存取的詮釋資料。藉由標記語言、各 式標準以及軟體程式,使電腦可以理解網頁資料所代表的涵義以及網頁之間的關 係,透過各種交錯複雜的關係連結,使整個網際網路能夠成為一個整合資訊交換 媒體(圖書館學與資訊科學大辭典,2012)。進而運用網頁相互提供的自動化處 理機制,針對語意網上的資料進行瀏覽、搜尋、推理等作業,為使用者作更精確 的資料判斷與處理,提供更多的服務與應用(黃居仁,2003)。

在傳統的網際網路中,文件與文件有超連結關係,但並未指出其關係為何,

如圖 2-1 左方。圖 2-1 右方為語意網之示意圖,相關的文件不但有超連結,而且 會標示出兩個文件之間的連結關係。換言之,語意網中,資源連結會描述該連結 之類型屬性。

語意網的特性是會隨著資訊技術的不斷更新而持續進化,根據 W3C 對語意 網的定義,語意網是一個多層次的堆疊架構,每一層都以其下一層作為基礎(圖 書館學與資訊科學大辭典,2012),如圖 2-2。表 2-1 將由底層往上簡單介紹每 一階層。

10

圖 2- 1 語意網中資源與連結具有類別及屬性

資料來源:Koivunen, M. R., & Miller, E (2001). W3C Semantic Web Activity.

Retrieved from http://www.w3.org/2001/12/semweb-fin/w3csw

圖 2- 2 語意網堆疊示意圖

資料來源:Koivunen, M. R., & Miller, E (2001). W3C Semantic Web Activity.

Retrieved from http://www.w3.org/2001/12/semweb-fin/w3csw

11 字符集(Universal Character Set, UCS);URI 則是資源 的標識,提供識別語意網裡物件(objects)的方法。

XML 架構層

(XML + Namespace + xmlschema)

網頁之資料標記必須以 XML 為標準,加上由 URI

12 版)。台北市:碁峰資訊。;Koivunen, M. R., & Miller, E (2001). W3C Semantic Web Activity. Retrieved from http://www.w3.org/2001/12/semweb-fin/w3csw ;賴 琮瑋(2009)。利用 GoogleMap 應用在維基百科之研究(未出版之碩士論 文)。國立臺灣師範大學,台北市。;圖書館學與資訊科學大辭典(2012)。

語意網 semantic web。檢索自https://terms.naer.edu.tw/detail/1679015/?index=2 語意網作為一個資料網路(Web of Data),它包含了任何人們可能想到的數 據資料,語意網路技術(如:RDF、OWL、SKOS、SPARQL 等)的整合提供了 一個應用程序可以查詢資料,並使用詞彙表進行整合的環境。為了實現資料網路,

使大量的數據以標準化格式來呈現,並且可以透過語意網工具去取得以及管理是 必要的條件。此外,不僅只是語意網需要取得資料,連同資料與資料之間的關係 也必須一起收集,以創造資料網路,而不單單只是純粹的資料集集合。網際網路 上這些相互關聯的資料集被稱作鏈結資料(Antonious, G., & Harmelen, F. v., 2006)。

鏈結資料使資訊變得更容易檢索,其技術是將資料逐一轉為 RDF 格式,並 使用 URI 呈現,再以 HTTP 作為傳輸管道,形成互相鏈結的資料(Berners-Lee, 2006),鏈結資料依循以下四項原則(柯皓仁、陳亞寧,2013;Berners-Lee, 2006): 1. 以 URI 為事物(thing)命名。

13

2. 使用超文本傳輸協定(HyperText Transfer Protocol, HTTP)做為客戶端和伺服 器端之間查詢及傳送 URI 的機制,讓人或電腦可以查詢特定 URI 所代表事 物的相關資訊。

3. 伺服器端使用 RDF 與 SPARQL 協定與 RDF 查詢語言(SPARQL Protocol and RDF Query Language, SPARQL) 等標準,以提供更多的資訊。當伺服器 端接收到客戶端對於特定 URI 的請求時,伺服器端會以標準格式將該 URI 所代表事物的相關資訊傳回給客戶端。若客戶端是「人」,則伺服器端可回 傳 HTML 格式的文件;若客戶端是「應用程式」,則伺服器端可回傳 RDF 格式的文件,以方便客戶端的應用程式針對這些資訊做再利用。

4. 針對特定 URI 所代表事物的相關資訊中,應包含與其他相關事物的連結(連 結到該事物的 URI),使事物之間得以串連,進而達成構築全域資料空間的 目標。

隨著語意網與鏈結資料的概念被提出,圖書館界開始積極探索如何將資料語 意化,並以鏈結資料的形式發布,使書目資訊能夠與網際網路接軌。瑞典國家圖 書館於 2008 年嘗試將瑞典聯合目錄發布為鏈結資料;大英圖書館將館內的國家 書目從 MARC 21 格式轉換為 RDF/XML 格式,並且透過網站提供資料集下載連 結;OCLC 於 2012 年開始逐步將 WorldCat 內數以億計的書目發布為鏈結資料

(朱美華,2018;林澤婓,2016)。2009 年,LC 先後建置了主題標目詞表、權 威名稱檔、國家代碼表、語言代碼表等控制詞表的語意化描述,為 BIBFRAME 奠定了前期基礎(朱美華,2018)。