• 沒有找到結果。

以管理為基礎之整合檢索於圖書館服務之應用

N/A
N/A
Protected

Academic year: 2021

Share "以管理為基礎之整合檢索於圖書館服務之應用"

Copied!
19
0
0

加載中.... (立即查看全文)

全文

(1)

以管理為基礎之整合檢索於圖書館服務之應用

陳光華

1

,葉冠志

2

,江玉婷

3

(

1

臺灣大學圖書資訊學系

2

彰化縣新民國小

3

臺灣大學圖書館)

[摘 要]整合檢索服務是臺灣各大學圖書館積極規劃的資料檢索服務模式。基本上,整合檢索可由 三種方式達成,其一是透過通訊協定,其二是透過檢索技術,其三是透過物件管理。目前各大學圖書 館多數採用檢索技術;採用通訊協定者,如 Z39.50 與 OAI 等較少;應用物件管理的作法,則幾乎沒有。 採用檢索技術的圖書館,常因資源擁有者的變動而無法持續,因此必須經常性的維護資訊檢索服務的 URL 列表,耗費大量人力成本;採用通訊協定的圖書館,則無上述的問題,但僅能整合檢索使用相同 通訊協定的資源。採用物件管理者,必須付出較高的成本,但是卻可擁有完整的整合管理、整合檢索、 智慧產權管理的功能。本文將探討以物件管理為基礎的整合檢索與管理機制,並提出低成本而高彈性 的作法,這樣的整合機制不僅可管理數位物件的詮釋資料,亦能展現「聯合目錄」的功能,讓圖書館 的使用者整合檢索各式異質性的數位資源與實體資源,讓圖書館的管理者整合管理各式異質性的數位 資源與實體資源。 [關鍵詞]數位物件辨識碼 數位物件管理 整合檢索

1 緒論

傳統圖書館管理的資源主要以圖書或期刊為主,但隨著工業技術與資訊科技的發展,今日圖書館 管理的資源已經涵蓋圖書期刊以外的各種新興媒體資料,如錄音帶、錄影帶、影音光碟、資料庫乃至 於數位化的典藏。當全球化的網際網路形成之後,各式各樣的網路資源更成為圖書資訊學研究關注的 焦點,也是圖書館服務的重點。由網際網路存取各種數位化內容已成為發展數位圖書館(Digital Library) 的中心概念,透過數位加值方式建立電子式聯合目錄並提供整合檢索服務更能進一步提升圖書館組織 整理各種資源物件的成效,令使用者更容易地獲得可利用、有價值的知識,進一步提供協助決策與促 進產能的知識管理(Knowledge Management)之目標。在數位化、網路化的環境中,資源的整理、組 織、連結、檢索等加值化處理變得更容易進行,因此提升了各種資源的可利用性與價值性。然而,各 種資源相對於以往變得數量龐大、更新迅速且種類繁多,尤其是數位類型的資源在此方面表現的特別 明顯。因此,在如此複雜且多元化的環境下,對使用者與管理者都形成一個重要的挑戰。如何讓資源 擁有者(管理者)很便利地運用既有的資源管理方式,很容易地整合入全球通用的管理架構與檢索方 式,是立即且重要的研究課題;如何讓使用者透過很簡便的介面,整合檢索分散於網路世界的各項資 源,更是一個重要的研究目標。過去已經有一些作法,如Z39.50通訊協定,由通訊協定的角度,提供 一個整合的檢索環境,但是卻因其屬於heavy-weight的通訊協定,過於複雜且負擔沈重,不易推廣;OAI 則屬於light-weight協定,提供簡易的Verbs(Operations)。前述兩種作法是由通訊協定的角度嘗試提出 整合檢索資源的方案。另外OpenURL 則是以檢索技術的角度,讓使用者可以檢索分散的資源。本文擬 由物件管理的角度探討分散資源的整合檢索,這種作法適用於各種通訊協定與各種檢索技術,同時可 以進行資源擁有權的管理與維護。

(2)

本文是探討如何建構一個以物件管理為基礎的整合檢索與管理機制,這樣的整合檢索機制不僅可 管理數位物件的詮釋資料,亦能展現了「聯合目錄」的功能,讓圖書館的使用者由一個檢索入口,整 合檢索符合需求的數位資源或實體資源。事實上,物件管理的機制已經在國際出版業界形成重要的共 識,並提供整合管理與檢索以及提取物件的功能,如Digital Object Identifier(數位物件辨識碼,簡稱 DOI)系統。DOI系統以DOI的分配為基礎,它是一種持續性的辨識碼,主要應用於電子出版業方面, 提供智慧產權內容的管理與服務。目前DOI系統的發展為國際數位物件辨識碼基金會(International DOI Foundation,簡稱IDF)規範,然而,加入DOI所需費用不貲,臺灣並無任何機構加入DOI系統,而中 國大陸則有4個機構透過CrossRef加入DOI。本文將以管理為基礎的整合檢索出發,討論如何發展低成 本,卻更具有彈性的數位物件管理機制<LIPS-DOI>,並採用通用的詮釋資料格式(Metadata Format), 使數位物件的管理更趨完善。本研究採用的研究方法如下: z 文獻探討法 本計畫擬蒐集討論編碼系統發展的邏輯與應用學術文獻,探討有關編碼方式、詮釋資料、以及解 析機制在網路資源的管理與檢索的應用。 z 系統分析法 我們將分析<LIPS-DOI>主要功能模組,如列舉模組、描述模組、以及解析模組。研究其實作系 統之運作方式與達成的功能機制。 z 系統實作法 我們將實作<LIPS-DOI>,探討其應用於圖書館典藏異質資源。並運用時間相關的通訊協定,讓 系統與全球標準時間同步,確認數位物件之登錄時間,可進一步保護數位物件的智慧財產權。 基本上,我們將建構三個模組(Model),編碼模組(Encoding Model)、描述模組(Description Model)、以及解析模組(Resolution Model)。編碼模組負責數位物件的編碼,亦即是賦予一個唯一 的識別碼,該識別碼可以作為數位物件在網路世界的身份識別,使用者可以透過該識別碼檢索數位物 件,而不論該物件身處何處;描述模組負責數位物件的詮釋資料的管理,本研究將以 Simple Dublin Core (Simple DC)作為基礎詮釋資料格式;解析模組負責將識別碼對應至網路世界的位址,數位物件可能 有複本,可能在一個以上的位址,解析子系統減輕使用者檢索的負擔,使用者不必擔心數位物件所在 的位址,位址可能變動,但是辨識碼維持不變。 本文結構如下,第二節說明整合檢索的相關技術,包括Z39.50、OpenURL、OAI、與DOI等協定或 技術;第三節說明DOI系統以及運作模式;第四節討論<LIPS-DOI>的系統與實作;第五節說明 <LIPS-DOI>之應用;第六節是簡短的結論。

2 整合檢索的相關技術

圖書館長期以來,即以提供資訊服務為己任,也希望提供讀者本館未有之資訊,聯合目錄即為此 一思考方向的具體呈現。在網際網路成為重要的資訊儲存體與資訊傳輸管道,整合檢索便成為資訊提 供者念茲在茲的、亟欲實踐的資訊服務。而電子聯合目錄是達成整合檢索的基礎,無論是虛擬聯合目 錄或是實體聯合目錄。

(3)

本節簡要說明 Z39.50、OpenURL、OAI、與 DOI 等協定或技術。Z39.50 是通訊協定的方式達成分 散式的聯合目錄:OpenURL 是透過檢索技術達成分散式的聯合目錄:OAI 架構中有所謂的 Service Provider,有集中式聯合目錄的模式;DOI 則是集中式聯合目錄,但是整合了資源的管理、資源的檢索、 與智慧產權的維護等功能。 Z39.50 事實上是一套歷史較長,鉅細靡遺,負擔沈重的通訊協定,其目的是為了彌補 HTTP 通訊 協定的「無狀態」(stateless)的缺憾;然而,卻因為野心太大,協定內容過於複雜,開發成本過高, 導致其失敗的結果。但是,我們必須理解 Z39.50 真正讓整合檢索這件事,變成可以用協定標準來達成, 其歷史地位是無庸置疑的。為了改善 Z39.50 的龐雜缺憾,OAI 協定起而代之,訂定 6 個 Verbs,簡化 檢索過程,其提供了具有應用程式獨立性、程式模組的互通性的系統框架,其目標是減少文件傳播的 負擔,提升電子文件存取的效率。(Van de Sompel & Lagoze, 2000)基本上,OAI 的運作模式如圖 1 所 示,目前 OAI 最新的版本是 OAI-PMH v2.0,OAI 詳細的協定內容,並非本文討論的重點,有興趣的 讀者請參閱。(Van de Sompel & Lagoze, 2004)

OpenURL 則是另外一種典型,嘗試透過檢索技術而達成整合檢索的功能。它其實非常類似早期我 們透過 Common Gateway Interface(CGI)的方式,將靜態網頁發展為使用者相關的動態網頁,也就是 使用者可以下指令進行檢索等互動式的網頁服務。但是 OpenURL 引入 Link Resolver 來解決多重網址 的檢索。OpenURL 的發展是自 1999 年 4 月,Van de Sompel & Hochstenbach(1999a, 1999b, 1999c)在 D-Lib Magazine 發表一連串論文而開啟的,其中 Link Resolver 扮演重要角色,它統一集中管理資訊提 供者提供之資訊內容的詮釋資料,所服務的對象為資訊檢索者或是資訊服務單位,而透過此機制可以 得知資訊檢索者尋求資訊時之相關統計數據資料。OpenURL 的架構如圖 2 所示。

Repository

Repository

.

.

.

Data

Provider

Data

Provider

Data

Provider

Service

Provider

Request

Response

Verbs

Records

.

.

.

圖 1:OAI 的運作模式

(4)

數位物件辨識碼(Digital Object Identifier,以下簡稱 DOI)是一種持續辨識碼,此辨識碼一旦被分 配後名稱永遠不會改變的,因此具有永久的辨識性。數位物件辨識碼目前主要被應用在電子出版業方 面,對智慧產權內容提供服務。數位物件辨識碼系統以 DOI 的分配為基礎,實為一個完整的智慧產權 物件管理架構。吾人甚至可以數位物件辨識碼系統為基礎來進一步發展數位環境下的電子商務架構。 在政策上,DOI 系統的發展為國際數位物件辨識碼基金會(International DOI Foundation,簡稱 IDF) 所規範。(IDF, 2005a) IDF 正式於 1998 年成立,希望能在網路數位化環境中提供智慧產權物持續、有效的辨識機制,並 以此作為連結內容提供者與內容使用者的基礎架構,達成智慧產權內容服務管理的目標。IDF 負責政 策指導與協調工作以符合各種內容提供者團體之間不同的需求。運作上,IDF 為一個非營利性並以會 員為基礎的組織,為所有的會員共同管理,會員間相互聯絡並以民主方式討論或建議系統的發展方向。 IDF 會員也共同支持所發展出來的數位物件辨識碼系統。IDF 會員主要包括了下列幾種類型的組織: 1) 各國主要大型、中小型出版公司;2) 網路科技公司;3) 代表作者、圖書館、出版商、承銷商、使 用者的各類學會組織;4) 出版工業的技術提供廠商;5) 其他代表智慧財產的工業組織如音樂、影片、 電影、攝影、多媒體組織等;6) 政府相關部會;7) 其他以電子商務為主要重心的公司、社會、文化、 政治團體或個人。 為了推動 DOI 有效運作,世界上主要的科學、技術與醫學文獻出版商聯合成立了 CrossRef 組織, 建立起 DOI 存取的機制。CrossRef 的主要目標為提倡發展與合作使用創新技術以加速與便利學術研 究,CrossRef 讓學者撰寫學術論文時,可以引用不同出版者發行的數位學術文獻,而不用考慮連結是 否失效的問題,達成參考引用資源有效連結的目標。這其實就是 DOI 的實際應用。目前已經有 1,460 家出版商與學會參加 CrossRef,並使用 DOI 系統提供有效的學術連結。CrossRef 目前有 12,207 種期刊、 20,135 個會議論文集、10,146 本圖書,系統中有 16,529,371 筆記錄。(CrossRef, 2005, August 1)

要注意的是儘管 OAI、OpenURL、DOI 的原始設計目的並不相同。但是皆可達到聯合檢索的目的, 且彼此之間並不互相抵觸,甚至是相輔相成的。例如,DOI 並未限定必須使用何種通訊協定,OAI 也

Link Source OpenURL

Resource

Service

Component

Resolver/Link

Provision of Hooks

Resolution into Links

Hook

Link

Destination

Link

Link

Link

Link

Destination

Link

Destination

Resources

圖 2:OpenURL 的運作模式

(5)

未規範數位物件的編碼。

3 DOI 的運作模式

DOI 系統分配的 DOI 辨識碼是合法的 URN,符合 RFC1737 的規定。DOI 系統主要的功能在分配 全球唯一且持續的辨識碼,但完整的 DOI 系統並非只是一個分配編碼的命名系統而已,其實際上包含 許 多 整 合 性 功 能 。 根 據 IDF 的 規 劃 , 功 能 完 備 的 數 位 物 件 辨 識 系 統 包 含 四 種 機 制 : 1) 列 舉 (Enumeration);2) 描述(Description);3) 解析(Resolution); 4) 政策(Policies),以下分別說明 之。

3.1 列舉

列舉就是分配編碼給 DOI 所辨識的智慧產權實體。比較正確的說法應該是分配「字母數字字串」 (alphanumeric string),因為 DOI 亦可包含字母,為了方便起見,僅以辨識碼稱之。每一個 DOI 均為 一獨特的辨識碼,可用來唯一地辨識一個實體。雖然 DOI 系統會確保同一個 DOI 不會被發行兩次,但 DOI 前綴(prefix)的註冊者(公司或個人)基本上應負責保持物件命名的獨特性。這也就是說,在政 策上,DOI 系統中命名的獨特性是強制的。 由於同一個物件可能原本就擁有數種不同的辨識機制,如一本書可以擁有一個索書號、一個 ISBN 及一個圖書館自動化系統的系統編號,DOI 系統的列舉機制可以將這些辨識碼整合在後綴或詮釋資料 中,因此舊有的辨識碼仍可以繼續使用。此外,DOI 可以用來擴充原有的辨識功能,如將一本有 ISBN 的書或有 ISSN 的期刊再細分更小的章節甚至到段落,只要為每一章節或段落各編一個 DOI,整個圖書 或期刊典藏在編碼上仍然可以保持完整統一性。一批類型不同的資料(如文字、圖畫、語音、影視、 軟體等)只要經過 DOI 系統編碼,再透過 DOI 的詮釋資料資料庫(Metadata Database,簡稱 MDDB) 管理,各種類型的資料就可被輕易地組織整理了。目前沒有經過編碼達到辨識機制的任何類型物件均 可利用 DOI 系統簡單而快速地建立具有唯一性且全球通行的數位辨識碼。(IDF, 2005b)

DOI 為兩個成分所組成:前綴(Prefix)以及後綴(Suffix),中間以正斜線(/)分開。若以語法 表示,DOI 字串的語法為<DIR>.<REG>/<DSS>,其中<DIR>.<REG>即為前綴,而<DSS>即為後綴。前 綴中<DIR>為目錄編號(Directory Code),是必要項,在 Handle 系統中,其唯一的有效值為 "10" , 也就是 DOI 系統使用的的目錄編號,以此作為 DOI 與其他 Handle 系統應用區別之用。Handle 系統將 "10." 開頭的前綴特別保留給 IDF 作為分配 DOI 所使用的目錄編號。<REG> 註冊編號(Registrant's Code),亦為必要項,與目錄編號中間以 "." 分隔,其為 IDF 所分配的 DOI 註冊編號。後綴的<DSS> 為 必要項,是由 DOI 註冊者自行分配。

IDF 鼓勵同一機構申請多個 DOI 前綴,其目的在於同一機構可使用多重式的前綴(multiple prefix) 達成分散管理的目的。此外,由於 DOI 的後綴為註冊者自訂,因此 DOI 系統能夠整合舊有的編碼系統, 同時亦可更新詮釋資料及獲得更多的存取選擇性。

3.2 描述

為 DOI 所辨識的實體建立描述性資料(即詮釋資料)。因為 DOI 本身具有隱誨性,藉由詮釋資料使用 者可獲得 DOI 辨識實體的書目資訊,因此描述對 DOI 系統來說非常重要。而在 DOI 系統中,DOI 本

(6)

身也是詮釋資料的一部份。

DOI 系統的描述架構採用<indecs>計畫的所發展出來的詮釋資料模型要求所有註冊 DOI 的物件都 使用語法結構完整(well-formed)的詮釋資料。這並不是強迫所有註冊之 DOI 智慧產權物件都用同一 種詮釋資料架構來進行描述,而是要求所有的詮釋資料的描述都必須先合於「核心」的規範,然後再 以此核心詮釋資料架構為基礎,達到各種複雜的詮釋資料之間的對映相通及交換互動。如果沒有核心 詮釋資料的規範,詮釋資料之間便容易產生「交換障礙」。(IDF, 2005c)

為了上述的目的,DOI 對每一筆 DOI 註冊時使用的詮釋資料有所控制,要求所有註冊者在註冊 DOI 時其詮釋資料的宣告必須包含「核心詮釋資料」("kernel" of metadata)。不同的類型(types)或類 別(classes)的智慧產權物需要不同的詮釋資料,如期刊文章、音樂錄音或攝影相片資源的描述方式 (description)不同,因此需要不同的詮釋資料。DOI 系統描述資源方面則為要求註冊者(物件擁有者) 描述資源時採用 DOI 應用描述檔(DOI Application Profile,簡稱 DOI-AP,在 DOI 系統發展初期其被 稱為 Genre),每一 DOI 所辨識的實體至少會被分配一種以上或更多的 DOI-AP。基礎應用描述檔 (Base-AP)是最簡單基本的 DOI-AP,也就是包含上述核心詮釋資料中必要宣告項目的應用描述檔。

在 DOI 系統發展初期註冊 DOI 的物件並沒有宣告詮釋資料,因此這些物件的 AP 以「空白應用描 述檔」(Zero-AP)統稱之,DOI 系統將逐漸為這些僅有 Zero-AP 的物件,加上適用的 AP,使其功能不 受到限制。

3.3 解析

DOI 可持續辨識數位物件,相對的 URL 辨識的是網際網路上數位物件的網址。雖然有時 DOI 所 提供的解析與 URL 相同是指向某個網路位址,但這兩者並不完全相同。DOI 辨識的是物件實體,而 URL 辨識的是物件的位址。DOI 的解析是過解析系統建立使用者與物件之間存取使用的橋樑。DOI 具 有「可行動性」(actionable),就是因為解析系統的功能。目前,DOI 解析採用 Handle 系統的技術,以 實例來說明 Handle 系統實際提供服務的方式。例如,PDF 版本的 DOI Handbook 可以使用數位物件辨 識碼 doi:10.1000/182 尋找,如果使用者的電腦安裝了 Handle 系統提供的外掛程式(plug-in)-- CNRI Handle System Resolver,則其瀏覽器可瞭解此通訊協定,或其可以 http://dx.doi.org/10.1000/182(其中 dx.doi.org 為 Handle 系統的 HTTP 代理伺服器)或透過 http://dx.doi.org 提供的 HTTP POST 解析至可 正確存取此物件的位置(目前 URL 為 http://www.doi.org/hb.html)。若物件被移動到別的網址或被更新 的版本取代,物件擁有者只需要更改註冊伺服器上的連結資訊(新的網址),則所有網路上引用此 DOI 的連結均會被正確解析到新的網址,不需擔心有錯誤連結(broken link)的現象,此即 Handle 系統所 提供的解析功能。

維護狀態資料為 DOI 註冊者的基本責任。Handle 系統上的資料類型可以繼續擴充,而使 DOI 可以 解析至任何網際網路尚可存取的資源。DOI 亦可解析至 Java applet 、CGI script 或其他動態的機制。

3.4 政策

政策為整個 DOI 系統運作的管理規則,掌管列舉、描述與解析系統的發展、協調與統合,如圖 3 所示。

(7)

圖 3:DOI 系統政策概念圖

IDF 理事會成員負責整個 DOI 系統的政策執行。註冊代理方面主要是由註冊代理工作小組 (Registration Agency Working Group,簡稱 RAWG)負責,並討論訂定應用描述檔的規範。解析服務 方面則由 Handle 系統掌管規範政策。政策確保 DOI 系統的功能完備。(IDF, 2005d)

4 <LIPS-DOI>系統

由於參與國際的 DOI 系統,必須投入相當高的經費,並非所有的機構或組織可以承擔,為推廣 DOI 的概念與應用,也為了未來臺灣相關機構銜接國際 DOI,我們自 2 年前開始發展<LIPS-DOI>,做 為臺灣使用低成本的準 DOI 系統的另一種選擇。發展<LIPS-DOI>的主要構想是:1) 低成本的系統; 2) 銜接國際 DOI。因此在編碼的考慮與系統的實作,會有些許與 DOI 系統不同。兩年前,我們已經公 布了第一版(葉冠志,2003;葉冠志、陳光華,2004),應用資料庫技術完成 AP 的儲存與檢索。由 於應用資料庫技術,對於檢索的效率而言,較不具優勢,因此,我們決定改採全文檢索技術,並以 Java 技術重新改寫<LIPS-DOI>,以降低檢索所需的時間,更具系統平台之相容性。以下我們將說明 <LIPS-DOI>系統的概況,分別說明系統的組成,以及介面的使用。 4.1 系統的組成 (1) 列舉模組 DOI 列舉子系統的「前綴/後綴」兩者均為隱晦的(opaque),不過由系統管理的觀點上來看,其「前 綴/後綴」代表的是「註冊者資訊/註冊物件原有辨識碼」的原則。也就是說,DOI 字串僅以前綴來區別 註冊使用者,後綴部分則完全由使用者自行定義。<LIPS-DOI>在系統設計上,也開放使用者自行定義 後綴,但不同的是,使用者也可以選擇不定義後綴,而只採用<LIPS-DOI>系統所定義的時間字串作為 辨識碼。<LIPS-DOI>系統語法將註冊之時間字串定義為必要項,置於前綴與後綴中間,後綴部分為選 擇性的。前綴、時間字串、與後綴之間使用“-”符號,而非 DOI 系統的“/”符號,其目的是為了銜接國際

列舉

Enumeration

解析

Resolution

描述

Description

政策

Policies

(8)

DOI 系統。換言之,<LIPS-DOI>可做為臺灣唯一一個於 DOI 系統註冊的機構,取得 DOI 的機構註冊 編碼後,所有於<LIPS-DOI>註冊的數位物件,就可以自動成為 DOI 系統內的數位物件。 <Registrant>-<RegistrationTime>{-<LocalName>} 前綴 時間字串 後綴 圖 4:<LIPS-DOI>的語法 例 如 , 使 用 者 若 選 擇 <LIPS-DOI> 系 統 的 檢 索 服 務 , 可 使 用 <Registrant>- <RegistrationTime>-LocalName>結構的<LIPS-DOI>的數位物件辨識碼;若選擇 DOI 系統的檢索服務, 可使用<DIR>.<REG>/<Registrant>-<RegistrationTime>- <LocalName>結構的 DOI 的數位物件辨識碼。 而<REG>則為<LIPS-DOI>在國際 DOI 的註冊代碼。<LIPS-DOI>系統使用時間字串作為辨識碼的理由 如下所示。 z 智慧產權物件的註冊宣告與時間有絕對關係。 z 時間字串按照年月日時分秒排列,格式為YYYYMMDDhhmmss,長度是14個字元,雖然稍長, 但可理解,且可明確表現出物件的註冊順序。 z 完全沒有使用機構內部物件編碼的註冊者可以依賴<LIPS-DOI>系統時間字串達到辨識功能, 不需另外規劃後綴命名規則。 z 字串可表現出同一時間註冊的物件為單件或多件。 z 不使用後綴的情況下,由字串表面僅可獲得註冊時間資訊,同樣具有DOI考量的隱晦性,但在 批次處理或使用者有需求時仍然保持使用後綴的彈性。 由於的列舉模組採用了時間字串,為保持時間的準確性,<LIPS-DOI>採用時間通訊協定(Time Protocol)下的全球標準時間架構。目前<LIPS-DOI>伺服器使用時間與頻率國家標準實驗室的 NTPClock 軟體(1.21 版)進行校時。(時間與頻率國家標準實驗室,n.d.)目前較常用的時間通訊協定為 NTP (Network Time Protocol,RFC-1305)及 SNTP(Simple Network Time Protocol,RFC-2030)兩種, <LIPS-DOI>目前以後者校時。使用時間通訊協定校時的好處是當<LIPS-DOI>系統如 Handle 系統一樣 發展至全球架構時,時間字串透過全球標準時間的轉換可以明確標示出任何物件註冊的先後順序。 (2) 描述模組

<LIPS-DOI>發展初期希望描述模組可同樣達成 DOI 系統所描述的同類型物件,進而做到管理多種 異質物件詮釋資料之目的。在發展過程中,描述模組應逐步建立所有詮釋資料應有的必備欄位(亦即 核心應用描述檔,Kernel AP),然後發展具獨立性或符合特定需求的 AP。同時亦考慮各類型詮釋資料 之間的對映(Mapping)或稱為詮釋資料互通(Metadata Crosswalk)。

<LIPS-DOI>系統採用都柏林核心集的十五個核心欄位(Simple DC)作為描述模組的核心詮釋資 料,並非使用 DOI 系統定義的核心應用描述檔,主要目的在使描述模組更具有描述實體類型資料的能 力且更符合目前國際上數位典藏計畫所使用的詮釋資料架構。事實上,DOI 也承認可以使用 DC 作為 系統初建的選擇,但強調其核心應用描述檔對物件之描述更為嚴謹,且 Kernel AP 在功能上可提供任何

(9)

詮釋資料對映的基礎。(IDF, 2005e)

<LIPS-DOI>系統和 DOI 系統一樣也是以扁平式的資料結構—XML 字串作為描述物件的方式。 <LIPS-DOI>系統描述模組以 Simple DC 的 XML Schema 為 XML 詮釋資料的資料綱要來驗證其語法是 否正確。

(3) 解析模組

在 DOI 系統的 Handle 架構中,當使用者端使用瀏覽器在網路上瀏覽或使用一組 DOI 如 10.123/456 時,這組 DOI 辨識碼將被送到 Handle 系統進行解析。在此情況中,使用者端的瀏覽器必須裝有 Handle 外掛程式才能理解 Handle 解析的通訊協定,或者使用者端也可透過一台瞭解此通訊協定的代理伺服器 (proxy server)來代理解析工作。Handle 系統包含許多 handle 服務站台,每一服務至少包含一個主要 站台(primary site)以及若干數量的次要站台(secondary sites),而站台中又包含數量若干的 Handle 伺服器。為了達到解析的目的,每一站台複製所有 Handle 服務中的全部 Handles。因此,在全球架構 下,全球註冊服務(Global Handle Registry Service)負責記載本地服務(Public Local Services)的位置 與名稱空間,而不屬於本地服務的解析查詢則可透過本地服務轉到全球註冊服務而由全球註冊服務轉 至負責的另一個本地服務。因此,不論解析查詢由任何地點進入 Handle 系統其均可被傳遞到負責的本 地服務站台而解析至正確存取位置。每一 Handle 可與一種或更多種類型的資料關連,一個 DOI 可以被 解析至一個或多個複本(instances),比方說一個或多個 URL,這也就是單一轉址與多重解析的概念。 <LIPS-DOI>系統參考 DOI 系統的模式,希望先建立解析模組的單一轉址功能,再進一步發展到多重解 析功能。不過在架構上,<LIPS-DOI>系統不像 Handle 系統的複雜,所有服務僅交由同一台伺服器完成, 解析方面以能夠解析<LIPS-DOI>辨識碼的代理服務網址提供代理解析服務。 4.2 介面的使用 (1) 管理介面 <LIPS-DOI>系統的管理介面設計應如 DOI 系統一樣以前綴、使用者名稱、密碼登入管理畫面。管 理功能的發展包括產生新的<LIPS-DOI>辨識碼、編輯已經註冊的數位物件、刪除數位物件、以批次方 式新增╱刪除╱更新數位物件。使用者登入之後,系統應當能夠驗證前綴、名稱、密碼是否正確。然 後列出使用者目前擁有的數位物件,並提供新增、編輯、刪除數位物件等功能選項。我們使用資料庫 儲存<LIPS-DOI>系統註冊會員的詮釋資料,使用 Flat file 的方式儲存數位物件的詮釋資料。

(2) 查詢介面

按照 DOI 系統的規劃,物件的核心應用描述檔(核心詮釋資料)應該是公開的,可以為大眾檢索, 因此我們為<LIPS-DOI>系統設計開放式的查詢介面,提供一般使用者檢索使用,並應設法提高查詢介 面的功能以達到更高的檢索效率。

<LIPS-DOI>可以透過 XSL 技術將 XML 轉成適合使用者覽讀的形式。XSL(Extensible Stylesheet Language)和 CSS 一樣,都是一種排版的樣本語言,而 XSL 是專為 XML 所訂作。因為<LIPS-DOI> 系統中所有的詮釋資料都是以 XML 建置,系統呈現模式的開發則相對地較為簡單,只要引入 XSLT 文 件就可以在瀏覽器上呈現出定義的樣式,目前以適合使用者閱讀的方式呈現出來,呈現上只用表格方 式將十五個欄位排列下來,應足以明確呈現資料。查詢介面也可以應用 XSL 技術將比較重要的詮釋資

(10)

料元素如 title、creator 等資訊呈現至檢索結果畫面。 (3) 資料維護 資料維護方面,<LIPS-DOI>系統設計上需要解決的問題主要有兩者,第一是匯出匯入的問題,第 二是批次處理的問題。 匯出方面,因為描述模組的詮釋資料使用 XML,所以本來就是結構化的資料,使用者可以根據所 需,直接將該筆 XML 資料轉出使用。匯入方面,在更新資料時,<LIPS-DOI>系統應當能夠剖析使用 者傳來的 XML 資料,找出<LIPS-DOI>辨識碼,然後根據這一個辨識碼更新主要資料表中 Description 欄位的值。 批次處理方面,其目的主要在完成資料的大批建置與資料的備份工作。大批建置資料時,使用者 往往已經擁有使用試算表、資料庫軟體等建立結構化的資訊,為了使原本系統內的資料轉出時能夠合 於<LIPS-DOI>使用 Simple DC 作為 Kernel AP 的規範,可將原有的資料轉出成 XML 格式,其中 Identifier 元素的值必須為主鍵值(primary key)或是 ISBN、ISSN、系統流水號等系統內部的唯一辨識號。 <LIPS-DOI>系統只要剖析由舊有系統中轉出的 XML,在 Identifier 元素的值之前再加上前綴與時間字 串,即可將使用者轉出的 XML 資料轉入<LIPS-DOI>的描述模組。

5 <LIPS-DOI>之應用

雖然在目標上,<LIPS-DOI>系統整合的資源以中文資源為主體,但為了展示<LIPS-DOI>可以整合 異質的數位物件與實體物件,並容許不同語言的資料,我們實際將數位圖書館界著名的 D-Lib 電子期 刊,一部份的期刊論文匯入<LIPS-DOI>系統,也匯入臺灣大學圖書館部分館藏之書目資料、臺灣大學 圖書館出版之「大學圖書館」的期刊與期刊論文、以及各式網際網路上的網頁等等資料。並實際測試 註冊者之登入,與數位物件的整批匯入與單筆輸入。 <LIPS-DOI>系統的網址為:http://lipsdoi.lis.ntu.edu.tw/,系統的畫面如圖 5 所示,預設為中文選單, 若要進入英文選單,請點選又上方的 English 鏈結。以下系統展示部分均以中文操作說明之。 圖 5:<LIPS-DOI>系統畫面

(11)

在選單中,「網站介紹」說明有關<LIPS-DOI>系統產生的緣起以及系統目前整合的資源數量與範 圍。「參考資源」部分提供了與本研究相關的技術或文件之連結。「詮釋資料查詢」提供簡單查詢與進 階查詢,讓一般使用者檢索<LIPS-DOI>系統中已註冊的物件,其畫面如圖 6 所示。 「欄位查詢」讓使用者可以依據 Simple DC 的 15 個欄位,來查詢<LIPS-DOI>系統內註冊的物件。 使用者可以根據檢索需求鍵入部分或完整的查詢詞彙,然後按下查詢按鈕即可進行檢索。例如使用者 可以輸入關鍵詞「圖書館」來查詢註冊物件的詮釋資料以尋找到符合的物件。「全文檢索」則令使用者 能夠以不分欄位的方式同時查詢<LIPS-DOI>系統中的註冊物件,其實也就是整合了主要欄位查詢的三 個欄位同時進行查詢。查詢結果的呈現如圖 7 所示,如果使用者要直接轉到查詢所得的某一特定物件, 可以直接點選特定的辨識碼,如點選圖 7 的第二筆資料,則出現如圖 8 的畫面。 圖 6:簡單查詢提供全文檢索與 Simple DC 查詢

(12)

圖 7:簡單查詢結果

(13)

圖 8 顯示的是臺灣大學圖書館 WebPAC 上的圖書記錄,這意味著<LIPS-DOI>系統可以整合查詢各 類型異質的物件,即使是實體物件,如圖書與錄影帶,只要<LIPS-DOI>的註冊使用者將相關實體物件 的詮釋資料與相關的連結,註冊於<LIPS-DOI>系統,如本例,系統可以將讀者的檢索轉到圖書館的線 上公用目錄。 首頁右上方提供註冊使用者登入<LIPS-DOI>,進行各項資源的管理,如匯入新的詮釋資料格式, 註冊新的物件,整批匯入物件,單筆註冊物件;與權限的管理,如使用者權限管理與使用者群組管理。 註冊使用者登入後的畫面如圖 9 所示,可以發現畫面左面的功能選項增加了,這表示註冊使用者除了 可以檢索,也可以管理所屬的資源。若點選資料格式管理,則會進入如圖 10 所示之畫面,註冊使用者 可以瀏覽現有之詮釋資料格式,新增詮釋資料格式,也可更新/編輯詮釋資料格式,刪除詮釋資料格 式。如圖 10 所示,目前系統內的註冊使用者 khchen(其註冊之前綴為 0100001,共註冊了 3 種詮釋資 料格式,包括「淡水河溯源」、「岸裡大社」、「明清檔案」,然而系統畫面顯示了 4 種,因為其中的「都 柏林核心集」是預設的,也就是所謂的 Kernel AP,或是 Base AP。

(14)

圖 10:詮釋資料的管理 當註冊使用者欲匯入新物件時,可以點選「詮釋資料維護」的功能選項,以匯入新物件之詮釋資 料。請參見圖 11,註冊使用者可以選擇整批匯入或是單筆新增物件之詮釋資料。欲以單筆方式新增物 件時,請點選右上角的「單筆新增」,管理介面會轉至單筆註冊新物件之畫面,參見圖 12。在選擇物 件之詮釋資料格式後,本例為使用 Dublin Core,註冊使用者按照欄位著錄註冊物件的詮釋資料後,即 可按下「確定」按鈕註冊此物件。欲以整批方式新增眾多物件時,請點選右上角的「整批匯入」,管理 介面會轉至整批匯入新物件之畫面,參見圖 13。在選擇物件之詮釋資料格式後,本例亦為使用 Dublin Core,註冊使用者必須在「匯入檔案」欄位,輸入欲匯入之檔案的路徑(path),再按下「確定」按鈕 匯入整批物件之詮釋資料。註冊使用者匯入之檔案必須是 well-formed XML 檔案,也就是符合 XML 規 範的檔案,圖 14 為一範例;而為了避免檔案過於龐大,造成傳輸時間過長,影響網路流量,註冊使用 者必須先將檔案壓縮為.ZIP 的壓縮檔案,<LIPS-DOI>系統會在解壓縮後,再處理詮釋資料匯入的工作。

(15)

圖 11:詮釋資料之維護

(16)

圖 13:<LIPS-DOI>系統註冊使用者匯入整批物件

(17)

在「詮釋資料維護」的功能選項中,註冊使用者也可以透過<LIPS-DOI>辨識碼、註冊物件詮釋資 料、註冊物件解析資料,以查詢已經註冊的物件來進行管理或維護的工作。亦可以透過註冊物件清單 瀏覽尋找需要維護之已註冊物件。除了已經註冊的<LIPS-DOI>辨識碼不會再變更之外,註冊物件的詮 釋資料經過編輯之後便可以送出更新資訊。這也就是說,註冊物件的詮釋資料可以被管理,但是其數 位物件辨識碼字串是不會變動的,如果註冊的數位物件在網路上為置有所變動,註冊者只需要透過管 理介面更新網址,則透過<LIPS-DOI>字串仍可以解析到正確的網址。 在系統畫面左方之「代理解析」功能選項,使用者按下連結則可連到<LIPS-DOI>系統所提供的代 理解析服務。<LIPS-DOI>系統本身亦提供代理解析服務,未來將規劃獨立的解析伺服器。使用者可以 在 http://lipsdoi.lis.ntu.edu.tw/proxy/後,直接輸入<LIPS-DOI>辨識碼,如圖 15 所示,即可獲得此物件的 正確解析。目前,<LIPS-DOI>系統的解析模組只達到單一轉址功能,在代理服務網址後鍵入欲解析的 <LIPS-DOI>字串將馬上轉址到此物件最新的解析網址。 圖 15:<LIPS-DOI>系統代理解析服務

6 結論

DOI 系統最大的問題在於其不是免費使用的系統,因此在<LIPS-DOI>系統設計之初,即將系統定 位在整合具有公共存取性的中文資源的應用上,目的即是要避免像 DOI 系統一樣僅針對大型的電子期 刊出版商提供服務。不過由於 DOI 系統已漸形成國際間電子期刊出版的辨識碼標準,因此為了預留 <LIPS-DOI>系統與國際 DOI 系統的接軌,<LIPS-DOI>系統的辨識碼字串語法與 DOI 系統的語法有所

(18)

區別。換句話說,當<LIPS-DOI>系統整合的資源日益增多時,甚至形成重要的註冊碼發行機構時,我 們只要向 IDF 註冊前綴,將<LIPS-DOI> 辨識碼字串整個當作後綴或是向 IANA 申請 URN 使用,即可 形成國際性的、可辨識的數位物件辨識碼,而已經於<LIPS-DOI>註冊之物件,可自然而然地,透過 DOI 系統的檢索服務,為世界各地的使用者取得。 <LIPS-DOI>系統經過第一版的測試,第二版的改版,引入全文檢索功能,期望在檢索功能上,更 具有效能。至於目前系統內整合的資源以中文書目資料為主,包括臺灣大學圖書館出版之大學圖書館 期刊電子全文、臺灣大學圖書資訊系實習圖書館的圖書與期刊、臺灣大學出版品中心電子期刊全文書 目資料等,也有許多如 D-Lib 電子期刊的英文網路資源。實驗系統整合了數位與實體資源的詮釋資料 並發展整合的查詢與檢索介面提供使用,其中包含整合檢索、分欄檢索等檢索機制,以實作經驗印證 了<LIPS-DOI>系統不僅可以應用於數位物件的整合檢索與管理,其亦可使用於實體物件的整理組織。

致謝

本研究係由國科會研究計畫(編號 NSC93-2413-H-002-024)之經費支持,方得以完成,感謝國科 會多年來之支持。

參考文獻

1. CrossRef (2005, August 1). CorssRef Newsletter. Retrieved August 23, 2005, from http://www.crossref.org/01company/10newsletter.html

2. IDF (2005a). Director's Message. Retrieved August 23, 2005, from http://www.doi.org/ welcome.html 3. IDF (2005b). Numbering. In DOI Handbook Version 4.2.0 (Chapter 2). Oxford, UK: International DOI

Foundation (IDF). Retrieved August 23, 2005, from http://www.doi.org/handbook_2000/enumeration.html

4. IDF (2005c). DOI Data Model. In DOI Handbook Version 4.2.0 (Chapter 4). Oxford, UK: International DOI Foundation (IDF). Retrieved August 23, 2005, from

http://www.doi.org/handbook_2000/metadata.html

5. IDF (2005d). Policy. In DOI Handbook Version 4.2.0 (Chapter 6). Oxford, UK: International DOI Foundation (IDF). Retrieved August 23, 2005, from http://www.doi.org/handbook_2000/policies.html 6. IDF (2005e). DOI Resource Metadata Declaration. In DOI Handbook Version 4.2.0 (appendix 5).

Oxford, UK: International DOI Foundation (IDF). Retrieved August 23, 2005, from http://www.doi.org/handbook_2000/appendix_5.html

7. Van de Sompel, H. & Hochstenbach, P. (1999a). Reference Linking in a Hybrid Libary Environment, Part 1: Frameworks for Linking. D-Lib Magazine, 5(4). Retrieved August 23, 2005, from

http://www.dlib.org/dlib/april99/van_de_sompel/04van_de_sompel- pt1. html

8. Van de Sompel, H. & Hochstenbach, P. (1999b). Reference Linking in a Hybrid Libary Environment, Part 2: SFX, a Generic Linking Solution. D-Lib Magazine, 5(4). Retrieved August 23, 2005, from http://www.dlib.org/dlib/april99/van_de_sompel/ 04van_de_sompel- pt2.html

9. Van de Sompel, H. & Hochstenbach, P. (1999c). Reference Linking in a Hybrid Libary Environment, Part 3: Generalizing the SFX solution in the "SFX@Ghent & SFX@LANL" experiment. D-Lib

(19)

Magazine, 5(10). Retrieved August 23, 2005, from

http://www.dlib.org/dlib/october99/van_de_sompel/10van_de_sompel.html

10. Van de Sompel, H. & Lagoze, C. (2000). The Santa Fe Convention of the Open Archives Initiative. D-Lib Magazine, 6(2). Retrieved August 23, 2005, from

http://www.dlib.org/dlib/february00/vandesompel-oai/02vandesompel-oai.html

11. Van de Sompel, H. & Lagoze, C. (Eds) (2004). The Open Archives Initiative Protocol for Metadata Harvesting. Protocol Version 2.0. Retrieved August 23, 2005, from

http://www.openarchives.org/OAI/openarchivesprotocol.htm

12. Van der Vlist, E. (2000). W3C XML Schema Structures Reference. Retrieved August 23, 2005, from http://www.xml.com/pub/a/2000/11/29/schemas/structuresref.html 13. 時間與頻率國家標準實驗室(n.d.)。時間與頻率國家標準實驗室首頁。上網日期:2005 年 8 月 23 日。網址:http://www.stdtime.gov.tw/ 14. 葉冠志(2003)。數位物件辨識碼系統於中文資源之應用。未出版之碩士論文,臺灣大學圖書資 訊學系,臺北市。 15. 葉冠志、陳光華(2004)。數位物件辨識碼系統之實作。大學圖書館,8(1),頁107-129.

作者簡介

陳光華,男性,41 歲,臺灣大學圖書資訊學系副教授,國科會人文學研究中心研究員,臺灣大學圖書 館諮詢顧問。 通信地址:臺灣臺北市大安區羅斯福路四段一號,臺灣大學圖書資訊學系。 郵遞區號:106 聯繫電話:+886-2-33662963 傳真:+886-2-23632859 電子信箱:[email protected] 葉冠志,男性,34 歲,新民國小資訊組長。 通信地址:臺灣彰化縣田中鎮公館路 320 號,新民國小教務處。 郵遞區號:520 聯繫電話:+886-4-8756166 傳真:+886-4-8756220 電子信箱:[email protected] 江玉婷,女性,30 歲,臺灣大學圖書館系統資訊組。 通信地址:臺灣臺北市大安區羅斯福路四段一號,臺灣大學圖書館。 郵遞區號:106 聯繫電話:+886-2-33662294 傳真:+886-2-23634344 電子信箱:[email protected]

數據

圖 3:DOI 系統政策概念圖
圖 7:簡單查詢結果
圖 8 顯示的是臺灣大學圖書館 WebPAC 上的圖書記錄,這意味著&lt;LIPS-DOI&gt;系統可以整合查詢各 類型異質的物件,即使是實體物件,如圖書與錄影帶,只要&lt;LIPS-DOI&gt;的註冊使用者將相關實體物件 的詮釋資料與相關的連結,註冊於&lt;LIPS-DOI&gt;系統,如本例,系統可以將讀者的檢索轉到圖書館的線 上公用目錄。  首頁右上方提供註冊使用者登入&lt;LIPS-DOI&gt;,進行各項資源的管理,如匯入新的詮釋資料格式, 註冊新的物件,整批匯入物件,單筆註冊物件;與
圖 10:詮釋資料的管理  當註冊使用者欲匯入新物件時,可以點選「詮釋資料維護」的功能選項,以匯入新物件之詮釋資 料。請參見圖 11,註冊使用者可以選擇整批匯入或是單筆新增物件之詮釋資料。欲以單筆方式新增物 件時,請點選右上角的「單筆新增」,管理介面會轉至單筆註冊新物件之畫面,參見圖 12。在選擇物 件之詮釋資料格式後,本例為使用 Dublin Core,註冊使用者按照欄位著錄註冊物件的詮釋資料後,即 可按下「確定」按鈕註冊此物件。欲以整批方式新增眾多物件時,請點選右上角的「整批匯入」 ,管理 介面會轉至整
+3

參考文獻

相關文件

第一步:在 VMware 按下 Install VMwave Tools 按下之後系統就會開啟安裝畫面給

Flash 平台 Macromedia 公司宣佈全世界 97.3%的網路瀏覽器都有內建 Flash player 播放器,只要在 Internet Explorer 或 Netscape 瀏覽器,安裝了 Flash Player 播放程式,就可以播放

‡ RFID 運作原理是透過一片小型硬體的無線射頻辨識技 術晶片( RFID chips),利用內含的天線來傳送與接

由於自簽的電子證書並非由知名憑證授權單位簽署,因此當使用者進入網 站時會被瀏覽器標注為不安全(例如使用 Google Chrome

由於 Android 作業系統的開放性和可移植性,它可以被用在大部分電子產品 上,Android 作業系統大多搭載在使用了 ARM 架構的硬體設備上使裝置更加省電

解決方案:取出圖表說明並開啟原始的 PDF 檔供使用者瀏覽 利用資料庫語法來可得知圖表所在的位置,因此可使用 adobe acrobat 函式庫中的

本研究旨在使用 TI-Nspire CAS 計算機之輔助教學模式,融入基礎 統計學的應用,及研究如何使用 TI-Nspire CAS

然而,當 RFID 系統被應用在廣泛領域上的同時,不肖的使用者開始鑽研