為達成互通性的目的,不斷有許多協定標準被開發出來。下面茲簡列一些數 位典藏領域常用的協定標準,視不同的功能需求而各有其優缺點。
一、DIENST
DIENST 是 由 DARPA(Defense Advanced Research Projects Agency) 與 NSF(National Science Foundation)贊助 DLI(Digital Libraries Initiative)所發展的計 畫。DIENST 事實上是 OAI-PMH 的前身,其做法也是利用詮釋資料擷取(metadata harvesting)來分享數位化檔案。但是在求功能強大的同時,也使得整個通訊協定 複雜化,因此不得不促使其精簡化的版本--OAI-PMH 的產生。由於兩者承先啟 後的關係,事實上可以透過 DOG(Dienst/OAI-PMH Gateway)做為 DIENST 與 OAI-PMH 伺服器間的相互溝通。10
二、NCSTRL, NCSTRL+
NCSTRL+是由包括美國太空總署 NASA Langley Research Center 專門負責 科 學 與 技 術 資 訊(Scientific and Technical Information , STI) 計 劃 所 發 展 的 Networked Computer Science Technical Reference library(NCSTRL)分散式架構所 擴充的工具集,最初計劃的目標是希望建立一個簡化出版與存取的使用模式,以 便用來整合NASA STI 館藏中各種不同的學科和資料格式。NCSTRL 結合了超過 100 以上的機構,彼此分享資訊科學相關的技術資料。NCSTRL 達成館際間資料 互通的主要協定為Dienst。Dienst 包含了︰儲存體、索引、Meta、使用者介面、
圖書館管理等五個服務組件,並採用HTTP 作為資料傳輸的協定。所以 NCSTRL+
可以說是應用Dienst 協定之 NCSTRL 的擴充版本。NCSTRL+包含兩個主要的技 術︰Clusters 和 Buckets。Clusters 允許依據主題目錄、典藏檔案型態、出版、組 織等條件,任意地結合或分割典藏資料。而Buckets 則是用於聚集數位圖書館線 上出版的智慧型代理人(agent)。Buckets 不僅能夠獨立運作且能負責處理典藏資
10 同 5。
料的管理、與遠端協調顯示的內容等等。
NCSTRL 和 NCSTRL+可以說是現今美國大學院校內資訊科學報告線上出 版最主要的系統之一,而且也提供了數位圖書館間的互通功能。不過由於協定規 範的範圍過大,所以如果有一個新的數位圖書館欲加入此一聯盟,必須修改採取 Dienst 協定,並安裝相關的程式庫,以便能與聯盟的服務提供者作業協同一致。
不過當軟體的版本修定時,所有加入聯盟的數位圖書館系統必須全部配合修正,
否則便無法正常運作。11
三、NESSTAR
就整體而言,Networked Social Science Tools and Resources (NESSTAR)是一 組藉由 Internet 傳播資料的基礎建設,其核心結構為應用 Data Documentation Initiative (DDI)的 XML 版本 metadata 系統。NESSTAR 是由 Norwegian Social Science Data Services (NSD)、UK Data Archive (UKDA)和 Danish Data Archive (DDA)聯合發展的軟體系統,並依據此系統的應用目標而設計的協定。其希望能 達成的目標包括下列四點︰
(1)能找出在不同組織與國家之間各種資料的原始來源 (2)瀏覽這些資料的細節,包括記述資料與原件實體。
(3)能夠因應不同使用者的專業程度,快速且容易的列表與呈現資訊內容
(4)提供資料和文件的選粹服務,包括完整或部分的資訊,甚至製作成適當的表 格以方便使用者應用。
NESSTAR 整體系統架構包括下列三個部分︰
(1)Explorer︰提供圖形式的使用者介面。
(2)Publisher︰各資料提供者處理可分享之典藏資料的伺服器。
(3) Protocol︰負責在其間傳遞以 XML 為標示的 metadata 訊息之交換規範。
11 同 1。
因此其主要實現數位圖書館之間互通性的協定也稱之為 NESSTAR。不過 NESSTAR 處理的資料種類過於簡單,因此有後續 FASTER(Flexible Access to Statistics, Tables and Electronic Resources)的擴充計劃,希望能改善資料處理的深 度與範圍。12
四、Metadata search engine
嚴格來說,如Google, JumpStation II, Northern Light, MetaCrawler, AltaVista Search, EasyASk, Inktomi Enterprise Serach, Mercado, Teapot, HotMeta 等 Metadata 搜尋引擎,並不是為了數位圖書館互通性而發展出來的檢索工具與協定,因為數 位圖書館主要是強調服務的品質,而搜尋引擎則是著重再搜尋結果的品質。也就 是說,搜尋引擎的目標通常是效率高於服務。但是 Meta 搜尋引擎是 Internet 環 境裡取得 metadata 最基本的模式,而且 Metadata 搜尋引擎和一般的網頁搜尋引 擎 所 使 用 的 技 術 與 功能 類 似 。 一 般 網 頁 由於 HTML 屬於程序性標示語言 (Procedural Markup Language),無法提供自動化分析文件的語意內涵,而 metadata 本身屬於描述性標示語言(Descriptive Markup Language),因此能夠很方便地藉由 標籤(tag)自動化分析資料內的結構與內涵。所以對於數位圖書館可以隨時藉由各 種Metadata 搜尋引擎,檢索與獲取其他 DL 的 metadata,達成典藏資料分享的互 通需求。13
五、SDLIP
簡易數位圖書館互通協定(Simple Digital Library Interoperability Protocol,
SDLIP)是由史丹佛大學所發展一個定位為檢索的中介軟體(middleware)。如圖二 所示,在 SDLIP 架構中,資訊前端與後端的資料來源之間是透過數位圖書館 proxy 來達成互通檢索的需求。介於前端與 proxy 之間,SDLIP 定義了包括傳輸 協定、查詢語言以及存取介面等。
12同1。
13同1。
圖二︰SDLIP 系統架構圖
不過SDLIP 使用 proxy 的方式,允許各數位圖書館採用各自專屬的協定方 式,對數位圖書館而言也有下列三項缺點︰
(1) proxy 與各資料來源之間的訊息處理,允許採用各自專屬的協定。採取此種方 式主要是為了考量各數位圖書館實作方便,但是當要新增或註冊一個數位圖書館 時,proxy 必須針對該數位圖書館所使用協定的特性重新修改程式,因此反而導 致整體效率不佳。
(2) 正因為各資料來源端允許使用既有的協定,因此加入 SDLIP 時必須在前端額 外開發處理SDLIP 的程式以便和 proxy 溝通,無法提供公用的程式庫給各數位 圖書館共同使用。
(3) 雖然 SDLIP 提供了整合性的檢索介面,不過使用著仍需逐一送出檢索的需 求,無法透過單一檢索步驟查詢所有聯盟的數位圖書館。14
14同1。
六、GINF
通用互通框架(Generic Interoperability Framework,GINF)主要的目的是希望 能達成各數位圖書館之間存取資料的協定、程式語言、資料模式、格式都能彼此 獨立,並且能夠動態的發掘元件(component)之間的功能,以及統一各元件之間 的介面。因此,GINF 可以說是一種簡化異質系統之間執行元件的整合協定,而 其最大貢獻便是各數位圖書館系統能保有各自獨立的協定、程式語言、資料和介 面描述。GINF 是基於 RDF 所實際運作的框架,透過此框架來作為語意導向的中 介軟體,系統便可藉由此中介軟體開發出高度彈性的主從(client/server)應用模 式。15
七、OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)
OAI-PMH 是一個簡易且具延伸性的輕量化(lightweight)通訊協定。它在設計 上是利用HTTP/XML 來當作底層的通訊協定。其優點是不仰賴任何特殊的資訊 元件技術或是程式語言。OAI-PMH 的主要目標,是藉由資料提供者分享詮釋資 料,而能有效率的傳遞資訊給服務提供者,提供資訊服務。16
八、OpenURL
OpenURL 為一種分散查詢語法,藉由一組已經定義好的標籤(tag),以增進 Web 超連結的能力。組成元件有資料提供者(source)與服務提供者(target),服務 提供者只要遵照此機制,就可以輕易解析資料提供者所傳送的要求。而資料提供
者也可經由此規範,輕易對服務提供者送出深度連結服務要求。17
九、SOAP(Simple Object Access Protocol)
SOAP 最早是由微軟、DevelopMentor、UserLand 所共同提交 IETF(Internet
15同1。
16同5。
17國家圖書館,「數位圖書館分散檢索協定」(民國 90 年 10 月)http://www.ncl.edu.tw/bbs/pdf/6-3-3.pdf
Engineering Task Force)的標準。與 OAI 類似的是它同樣是一個輕量化的通訊協 定,也同樣以 HTTP/XML 的組合做為資料載具。不同的是 SOAP 並沒有像 OAI-PMH 一樣有預先制定的六個命令,而是讓傳遞資料的雙方自行再定義其傳
輸的XML 如何解讀。其優點是能使用的範圍更廣泛,但常需與其他通訊協定合
併使用。由於 SOAP 目前是由 W3C 組織所制定發展,並且將會成為 W3C 的標 準。因此若有需要,OAI-PMH 也可以開發以 SOAP 為通訊載具的版本。18
十、Z39.50
Z39.50 已經是圖書館系統使用很久的開放式檢索協定,主要是由「原始系 統」(或稱 Z39.50 Client) 依靠線上即時連結一個以上的「目標系統」(或稱 Z39.50 Server),使用複雜的通訊協定集執行所需的查詢行為,再逐一取得由目標系統獲 得的查詢結果、排序、去除重覆,最後將處理結果呈現出來。應用在圖書館界的 Z39.50 協定是最普遍的聯盟式典藏資料互動協定之一。而 Z39.50 以 MARC 和 Dublin Core 為資料處理的依據,著重在點對點(peer to peer)的協定服務模式,透 過線上即時查詢目標系統的資訊,然後處理所有遠端回應的資料集之後,再呈現 給前端使用者。強調的是即時性的聯盟檢索服務,中間不存在任何中介者的角 色,前端也不強調資料加值的處理與分析。19
18 同 5。
19同1。
十一、各類型互通協定綜合比較