第二章 文獻探討
本研究之目的在探討全集描述發展趨勢,具體而言,探究的主題包括全集 描述發展及應用趨勢、全集描述相關標準及技術、檔案特性與全集描述之需求 以及以「國民黨歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)為例,
透過 XSLT 做自動全集轉換,根基於此,文獻探討部分將參閱國內外現有全集 描述相關研究與計畫,加以整理歸納,藉此進一步瞭解研究問題範圍中有哪些 相關研究、既有研究成果與尚待改進之處,依此做為本研究之研究架構與實作 基石。
本章分為六小節,第一節探討全集描述受重視之背景與整理全集描述背景 相關報告及先導計畫;第二節闡明全集與相關服務之定義及特性,瞭解全集描 述整體運行架構;第三節探討全集的描述發展及相關詮釋資料應用;第四節探 討各類典藏機構中所包含的全集類型以及相關全集描述計畫;第五節探討自動 全集轉換,即 XML 文件透過 XSLT 進行轉換之過程;第六節瞭解國民黨歷史 檔案內涵。
第一節 全集背景
本節首先審視目前我們所處的無形資訊環境,瞭解在資訊科技與網際網路 影響下,資訊環境之轉變及其影響、使用者進行資訊資源檢索時所發生的問題 以及典藏機構在資訊組織方面不足之處,透過對這些問題的認識,做為瞭解全 集描述發展之基礎,接著整理近年來全集發展背景相關重要報告及先導計畫,
闡述全集描述在該背景中所扮演之功能及重要性。
一 、全集描述受重視之背景
全集描述對圖書館界來說並不陌生且行之有年,然而近年來由於圖書館受 到資訊科技與網際網路影響,全集描述之重要性再度受到重視,以下探討全集 描述受重視之背景環境及相關因素。
傳統上,典藏機構進行資訊組織時習慣針對單一資源物件即所謂的「單件」
做詳細描述,因此時至今日,整個資訊領域包含圖書館仍是以「單件」做為資 源發現的最前線;然而,隨著電腦技術迅速發展與數位化時代來臨,尤其在網
際網路環境下,典藏機構將蒐藏的資源物件依照某個特性或準則(criterion),
例如按照主題、類型或地點加以分類聚合成為一個「全集」,以「全集」作為一 個整體所進行的描述,讓使用者可以更方便找到所需的相關資源之趨勢與重要 性與日俱增。
影響全集描述之發展可以追溯於下列幾個因素:(Robinson & Johnston, 2003)
1. 改善圖書館(以及其他典藏機構)館藏揭示(disclosure)之需求。在 許多情況中,典藏機構僅提供底層詳細的單件層次描述是無法發揮資 訊揭露功能。
2. 圖書館在資源方面的壓力日益增加,面臨經費緊縮與資料訂費日漸高 漲,因此體悟圖書館與圖書館之間共同合作與資源共享是有益處。
3. 使用者的要求在於能夠透過圖書館甚至橫跨整個資訊管理領域廣泛地 比較相似的實體(entities)。在該領域當中,單件之類型(nature)是 變化廣泛地。(Miller, 2000 as cited in Robinson & Johnston, 2003)
4. 數位化服務之發展試圖尋求提供對資源(包含實體資源與數位化資源)
描述之整合入口(integrated access)。
5. 數位化資源在數量上的快速成長,尤其是透過大規模的數位化計畫。
並且發現這些數位化全集之價值並非來自於當作獨立(stand-alone)
資源使用,而是做為在許多不同的服務中可以再被重複使用的構成要 素。
Johnston 與 Robinson(2002)認為全集描述受到重視的原因有二:
1. 全集描述被視為一種改善實體物件之數位化資源發現過程的有效方 法,特別是當使用者希望搜尋橫跨數個典藏機構中的分散式館藏
(distributed holdings)時。
2. 描述數位化全集之重要性逐漸受到重視。
Johnston(2002)從「使用者」、「服務提供者」與「資源提供者」三個面 向闡述全集描述之發展背景:
1. 「使用者」面
(1) 使用者對資源提供者之結構組織(structural organisation)不感興 趣。
(2) 使用者不想同時檢索多個檢索介面。
(3) 使用者取得資訊是橫跨資源提供者分界線(boundaries),換句話 說,使用者取得資訊不侷限在同一個資源提供者上。
2. 「服務提供者」面
(1) 服務提供者建立各式各樣以使用者為中心之入口(portals)。 (2) 表面內容來自於多個資源提供者(surface content from multiple
resource providers)。 3. 「資源提供者」面
(1) 透過多樣化服務來傳遞內容。
綜上所述,全集描述受重視之背景可從「資訊環境」、「使用者」與「典藏 機構」三個面向加以歸納整理:
1. 資訊環境:資訊科技與網際網路影響整個資訊環境,資訊環境的改變 影響使用者資訊檢索與衝擊典藏機構資訊組織。
2. 使用者:資訊環境的改變,使用者面對為數龐大的實體資源與數位化 資源時容易迷失其中。
3. 典藏機構:目前典藏機構在資訊組織方法上仍然是以單件層次描述為 主,「單件」為資源發現的最前線;然而資訊環境改變,底層詳細的單 件層次描述在某些情況中,例如當典藏資源數量龐大或使用者不闇館 藏特性時,對使用者來說,是無法發揮資源公開揭示功效。
「資訊環境」、「使用者」與「典藏機構」三者在全集描述發展背景中扮演 重要的影響角色,三者之間是彼此牽連且相互影響(interactive),請參閱圖 2-1。
圖 2-1 資訊環境、使用者與典藏機構三者互為影響 資料來源:本研究
二 、全集描述之重要性
以下從「資訊環境」、「典藏機構」以及「使用者」三個面向闡述全集描述 在其中所扮演的重要性:
(一) 資訊環境
資訊科技日新月異與網際網路蓬勃發達,徹底影響與改變的我們所處的無 形資訊環境。英國作家狄更斯(Dickens)在《雙城記》說道:「這是一個最好的年 代,也是一個最壞的年代;這是一個黑暗的時代,也是一個光明的時代。」可 象徵性地用來表明資訊科技進步與網際網路發展時代的某些特徵。
資訊科技發達與網際網路發展一方面意味著使用者可以更方便取得資訊,
以及更多的資源可供選擇;然另一方面,同時也產生新的問題,例如資訊爆炸,
資訊俯拾皆是,除了數量快速成長所帶來的困擾之外,資訊內容品質參差不齊 也是一大問題。使用者身處在這樣的資訊環境中進行資訊檢索時,如何發掘與 找到(find)散置各處的有用資訊與資源,且更進一步的有效取得使用,是資 訊領域亟待解決之問題。
1. 「資訊地景」改變
資訊 環境
典藏 機構
使用 者 互為影響
互為影響 互為影響
「資訊地景」(information landscape)是關於「資訊與資源如何被呈現到一 個群體(groups)或個人手中,讓他們能覺察這個快速變遷、擴展中與多樣化 的資訊環境」的一個概念。「資訊地景」一詞與複合式圖書館(hybrid library)
發展有密切的關連。(Hutton, 2001)
Powell, Heaney 與 Dempsey 等在「RSLP Collection Description」文中,透 過「資訊地景」概念將我們所處的無形資訊環境以及使用者最初的檢索行為更 具體化形容,他們認為:(Powell, Heaney & Dempsey, 2000)
可將「資訊地景」視為一幅等高線圖(contour map)。在這一幅等高 線圖中,有著山脈、小丘、平原與高原…。當研究者勘測此一地形時,
會先尋找最高點。和其他地區相較之下,透過瀏覽該區域的最高點,
更可用來蒐集所需要的資訊…。
以此類推,研究者在最開始的審視調查,所關心的在於識別區域而非 將焦點放在該區域特殊的特徵上,換句話說,識別雨林(識別區域)
超過檢索一份亞馬遜盆地樹冠層(canopy)動物群之分析報告(區域 特殊的特徵)。全集解析模型(an analytic model of collections)
試圖描繪資訊檢索過程中最開始的部分之特性。然而,該地景是多維 多面性的(multidimensional)。在該地景中,一個學者可能視之為山 頂但另一個學者卻可能之視為谷底(trough)。該工作是來設計(制定)
繪圖協定(mapping conventions),在適當的階層描述概論或專一性,
讓研究者在閱讀該地景地圖時可以更富有成效。(全集解析模型及其目 錄)
透過 Bryce 3D 繪圖軟體將「資訊地景」以圖形方式具體表達呈現,請參閱 圖 2-2,「資訊地景」模擬圖:
圖 2-2 「資訊地景」模擬圖 資料來源:本研究
近年來,「資訊地景」發生許多改變,過去瀏覽(navigating)地景一向是 屬於學術研究者或職業研究者,他們習慣於在檔案貯藏處、記錄機關(record offices)、圖書館、博物館與美術館中研究與視察實體物件全集(collections of physical items)。(Chapman, 2004)換句話說,從前會瀏覽此一「資訊地景」的使 用者大都屬於較專業的研究者,他們都是瀏覽實體的資源(檔案)為主。
這些全集(collections)之路徑(路線)往往記錄於主題指引(subject guides)
或指南中,通常依靠一個出版物的指引(reference in a publication)或個人的門 路(personal contact),即所謂「熟悉資源地域的嚮導」(native guide)-幫助使 用者指引出正確的方向。(Chapman, 2004)
然而目前該地景已經顯著地發生變化。從前的使用者群體(指學術研究者)
仍然存在,但是他們想進一步取得包含全國性與國際性等範圍更廣大的資源;
而新的使用者群體正在形成,例如學校的學童、追溯族譜(family tree)或地方 歷史的人們。(Chapman, 2004)
除了使用者群體發生變化之外,資源全集(collections)也發生變化;實體 資源物件仍然存在,但在這些實體物件旁並列了數位化副本(digital copies)以 及新興的電子資源。
許多使用者,特別是新的使用者群體(指學校的學童、追溯族譜或地方歷 史的人們),他們感到在位元這條路上(the bit of the road)沒有任何的路標
(signpost)或任何「熟悉資源地域的嚮導」可以幫助他們指引找到所需的資源。
(Chapman, 2004)
全集描述是一個提供路標或路線圖(roadmaps)的方法,它讓使用者能夠 更有效率的瀏覽「資訊地景」。(Chapman, 2004)
(二) 典藏機構
圖書館、檔案館與博物館等文化機構其管理者編纂館藏之描述,透過該描 述,資源管理者可以更有效率地掌握與管理典藏的資源;對潛在的(potential)
使用者而言,透過該描述所傳達的訊息,可以得知典藏機構中資源的存在狀態 與可利用性,進一步提高資源的取得與利用。
典藏機構中的資源或物件在進行資訊組織時有兩種描述的型態-單件描述 與全集描述。
所謂單件描述就是針對典藏機構中單一資源物件進行相關屬性或特徵的描 述,例如圖書館針對單一書籍著錄題名、作者或出版者等等資訊提供讀者查詢 或博物館針對典藏的單一文物藏品進行描述。
不同於單件描述將焦點置於單一資源的描述上;全集描述視單一資源物件 的集合體為一個整體進行描述,提供的資訊包括視資源集合體為一個整體的資 訊、組成全集的個別項目資訊或是項目之群集(grouping)所構成的子集(subset)
資訊。請參閱圖 2-3,單件描述與全集描述。
圖 2-3 單件描述與全集描述 資料來源:本研究
目前圖書館在資訊組織方面最主要是以單件層次描述為主,然而隨著資訊 環境的改變,數位化資源快速成長,複合式圖書館(hybrid library)型態的出 現,圖書館中除了典藏與提供實體資源之外,更面臨組織與管理為數龐大且成 長快速的異質性(heterogeneous)與分散式(distributed)之數位化與電子資源。
圖書館在面對為數龐大的實體資源與數位化資源之際,傳統底層之單件層 次詮釋資料(item-level metadata)雖然可以對資源做詳細的描述,提供使用者 進行資源檢索,然而對一個身處數量龐大、資源分散與不瞭解館藏特性之使用
「全集」描述
「單件」描述
者而言,詳細的底層單件資源描述仍是不敷使用,因此,圖書館如何有效組織 為數龐大的資源並讓使用者在使用時能夠發現與找到所需的資訊與資源是當務 之急。
除此之外,在數位資源環境中,電子資源與數位化資源的興盛,加上網際 網路發達使然,讓整個世界更加緊密連結、相互依存與資源共享。不同典藏機 構間,例如圖書館、檔案館、博物館與美術館等珍藏人類共同記憶之機構散佈 著極有價值的資源與資料,有效整合這些資源與資料提供使用者利用越來越重 要,因此圖書館與其他典藏機構之間的資源資料互通性問題亟待解決。
綜上所述,典藏機構現行的單件層次描述不足之處:
¾ 對「使用者」而言:
無法有效揭示典藏資源之存在與可利用性。
無法幫助使用者瀏覽為數龐大的異質性與分散式資源。
¾ 對「典藏機構」而言:
不同類型的典藏機構之間資源互通性問題。
為了解決上述之問題,透過全集描述建立起的全集層次描述與單件層次描 述之間互輔相成,典藏機構管理者與其使用者將蒙其利。
古云:「見樹又見林」,意思是對全局掌控的重要性。若將全集(collection)
比擬為一座森林、單件(item)是組成森林中的樹木而全集描述(collection description)是該座森林的一幅透視圖(perspective)。在一座森林中散佈各式各 樣的樹木(各式各樣實體資源與電子資源),假想一位伐木工人想要找尋心目中 的樹木當材料,若他直接進入茫茫的樹海中找尋,很快的他將迷失在這片樹海 中;但若他能夠參照該座森林的透視圖,經由透視圖上的地形標高與特徵,將 可迅速瞭解這座森林的地形概況,也可以知道所需要的樹木分佈在哪一個區域
(不同的地形與氣候產生不同型態的樹木類型)。透過全集描述讓使用者在資訊 查詢時可以從大處著眼,小處著手,不會犯下只見樹不見林的因小失大。
因此,典藏機構應提供描繪資訊地圖的能力(即提供全集描述),讓使用者 透過閱讀該資訊地圖迅速掌握典藏資源的結構分佈,即分辨資訊地圖中的資訊 地景,再依其使用需求針對有興趣的資源內容做進一步的使用;否則,僅僅提 供資源最底層描述資料,使用者在檢索時將一頭栽進眾多的資源之中,迷失方 向。
(三) 使用者
1. 檢索過程
全集描述支援使用者進行資訊的檢索。由於使用者檢索資訊的層次範圍從 非常具體明確到非常普遍籠統,因此,符合使用者檢索準則之實體或資源很可 能是一個明確具體的單件、一個代表性類型的單件或是一個涵蓋特別領域之單 件的全集。
然而,不論使用者檢索什麼,其檢索過程皆是相同-使用者想要發現、識 別、選擇與取得實體(entities):(Chapman, 2004)
¾ 發現(discover):發掘一個或更多符合使用者檢索準則(search criteria)之實體。
¾ 識別(identify):確認被描述的實體是符合其檢索需要的實體。
¾ 選擇(select):選擇符合使用者在內容或實體格式(physical format)等需求有關的實體,以及剔除不適當的實體。
¾ 取得(obtain):透過適當的方法,得到使用被描述的實體。例如 透過購買、借出、從資料庫取得或是線上取得電子資源等等方法。
2. 檢索目標與檢索工具
無論如何,對所有的檢索來說,當相同的基本過程(發現-識別-選擇-
取得)是必需的時候,支援使用者檢索的工具必須依照使用者檢索目標類型而 不同:(Chapman, 2004)
¾ 若使用者正在檢索一個具體且明確的單件(specific item),則檔 案館、博物館與圖書館等典藏機構皆已經擁有一個發展成熟的單 件層次描述提供給使用者利用。
¾ 若使用者是檢索相關資源全集時,則全集層次描述(collection level descriptions)可以讓使用者橫跨領域進行檢索。
舊式指引(Old-style directories)應用在同領域 (in-domain) 檢索上是傑出 的;然而在跨領域(cross-domain)檢索上,使用全集層次描述則有較佳之成效。
(Chapman, 2004)
三 、全集背景相關報告與先導計畫
本節透過近年發生於英國有關全集發展背景之重要報告與先導計畫,瞭解 全集整體情境之發展,包含「完全揭示原則」(Full Disclosure)、研究支援圖書 館計畫(RSLP)及其影響、「資源委員會」與跨領域全集描繪(mapping)、聯 合資訊系統委員會資訊環境(JISC Information Environment)以及數位內容創作 等。
在 這 些 重 要 報 告 與 先 導 計 畫 當 中 , 強 調 三 個 重 要 議 題 , 即 資 源 取 得
(access)、合作(collaboration)與整合(integration)。(Robinson & Johnston, 2003)
(一) 完全揭示原則(Full Disclosure)
「完全揭示原則」是由英國國家圖書館(British Library)、英國圖書資訊委 員會 (Library and Information Commission,簡稱 LIC)以及英國圖書資訊合作委 員會(Library and Information Cooperation Council,簡稱 LINC)等三個組織共 同出資研究之成果,報告於 1999 年由 Chapman、Kingsley 與 Dempsey 所提出。
「完全揭示原則」是一個跨領域的先導計畫,目的在揭示公開圖書館與檔 案館中全集之價值,讓一般民眾可以使用。(Chapman, Kingsley & Dempsey, 1999)
「完全揭示原則」報告目的在為圖書館與檔案館領域發展一個從原本的手 冊目錄(manual catalogues)轉換至機讀格式記錄(machine-readable records)
之回溯性資料轉換(retrospective conversion)策略方法。報告主要焦點集中在 單件層次描述之回溯性資料轉換策略上。報告中建議應該為圖書館發展一個全 集層次描述註冊機制,類似於英國的全國檔案記錄(National Register of Archives)。(Robinson & Johnston, 2003)
「 完 全 揭 示 原 則 」 報 告 當 中 發 現 全 集 描 述 是 任 何 回 溯 轉 換 策 略 中
(retro-conversion strategy)一個很重要的構成要素,特別是把全集描述做為瀏 覽圖書館與檔案館中的全集之輔助時。
後續的相關研究於 2002 年由文化遺產協會(Cultural Heritage Consortium,
簡稱 CHC)提出「完全揭示原則優先性研究」(Full Disclosure Prioritisation Study)。該研究調查如何替回溯性資料轉換設定優先性(priority)並擴展其範 圍至回溯性編目(retrospective cataloguing)與博物館的文件全集(documentary
collections)之中。
在「完全揭示原則優先性研究」報告中曾提及全集層次描述是在識別更精 細的回溯性資料轉換(retrospective conversion)、編目與文件工作(documentation work)前不可或缺的第一步。(Cultural Heritage Consortium, 2002 as cited in Robinson & Johnston, 2003)
(二) 研究支援圖書館計畫(RSLP)及其影響
研究支援圖書館計畫(Research Support Libraries Programme,簡稱 RSLP)
是英國國家型先導計畫,始於 1999 年,於 2002 年結束。該計畫是由英國四所 高等教育基金(funding bodies)提供經費。
研究支援圖書館計畫(RSLP)之目標有二:(Robinson & Johnston, 2003)
1. 為了全集的管理,所做的擴大合作準備工作。
2. 為了提高全集的發現與取得,而增加與改善全集相關資訊。
全集層次描述達成下列兩個目標,它提供:
1. 全集強度(strengths)相關資訊。透過全集強度資訊,可以幫助一群 圖書館之間改善館藏強弱之決策,換句話說,透過該強度訊息,圖書 館之間可以知道彼此館藏之熟強熟弱,達到圖書館館藏之互助合作與 互補不足之效果。
2. 全集內容資訊與可利用(access)情況。透過該訊息,研究者可以發 現與選擇有興趣的全集,作進一步的使用。
英國高等教育機構/英國國家圖書館專門小組(Higher Education/British Library Task Force)向圖書館支援研究工作小組(Research Support Libraries Group)提出「協調分散於全國之研究資源合集」報告1中指出:圖書館在資源 方面之壓力日漸增加,館藏發展政策從典藏(holding)轉變為取得(access),
且逐漸體認到,為了所有圖書館之利益,圖書館之間應該彼此合作與資源共享。
(Robinson & Johnston, 2003)
1 Coordinating the distributed national collection of research resources: Report to the Research Support Libraries Group.
「協調分散於全國之研究資源合集」報告反映出研究支援圖書館計畫
(RSLP)之遠景(perspective)。該報告注意到英國的學術研究者早已倚賴分散 式全國性全集(distributed national collection)研究資源。改善協調能力與管理 分散的全集將能促進資源的取得與增進取得之效率。該報告認為全集描述是協 調工作不可或缺的重要基礎。(Robinson & Johnston, 2003)
(三) 「資源委員會」與跨領域全集描繪
由於英國政府致力於改善公共服務之傳遞,因此非常重視破除機構之間的 界線與強調聯合工作('joined-up' working),並符合使用者之需求。英國政府機 構在許多領域當中,透過資金分配,尋求促進不同機構間共同合作的方法。
(Robinson & Johnston, 2003)
該方法反映在近年來由「資源委員會」2(Resource)所主導的幾個策略性 先導計畫上。在英國,已經建立起許多區域性機關(Regional Agencies)做為 提供協調與跨領域(橫跨博物館、檔案館與圖書館領域)之策略性組織。
(Robinson & Johnston, 2003)
在「為將來而保存過去:面對一個全國性全集管理架構」3一文當中,確認 圖書館、博物館與檔案館三個領域中對管理工作(stewardship)的不同方法,
並強調這三個領域彼此共同合作之跡象是逐漸增加。「資源委員會」同時也識別
「分散式全國性全集」(distributed national collection)概念,強調針對這些資源 進行描繪(mapping)是一件很重要的工作:(Resource, 2001 as cited in Robinson
& Johnston, 2003)
文化遺產策略性管理之起始點是建立在-對各式各樣組成分散式全國 性全集的本質(nature)及其位置有比較好的瞭解之上。同時,此一 瞭解也是,兩個擁有共同利益(interests)之機構進行合作前,不可 或缺的。使用者有必要知道有哪些資源存在與瞭解這些資源座落於何 處。
2 資源委員會(Resource)也稱為博物館、圖書館與檔案館委員會(The Museums, Libraries and Archives Council,簡稱 MLA)。
3 Preserving the past for the future: towards a national framework for collections management.
「資源委員會」成立全集管理與發展小組(Collections Management and Development Group)執行相關建議。儘管早已存在相當多的全集描繪(mapping)
行動,然而這些現存的行動尚須加以協調,才能將其成果達到一個完全整合的 整體。同時也需要使用可被接受的標準做為全集的管理。(Robinson & Johnston, 2003)
(四) 聯合資訊系統委員會資訊環境
聯合資訊系統委員會(Joint Information Systems Committee,簡稱 JISC)是 英國一個負責促進科技創新應用以及運用資訊科技到高等教育機構當中的委員 會。
聯合資訊系統委員會(JISC)典藏與管理一個擁有各式各樣類別之內容,
這些內容以數位化全集形式提供使用者取得與利用。內容部分是由聯合資訊系 統委員會(JISC)與個別的機構所發展,其餘的則來自於一些被認可的商業內 容 提 供 者 所 發 展 。 這 些 全 集 的 整 體 往 往 被 稱 為 分 散 式 全 國 性 電 子 資 源
(Distributed National Electronic Resource,簡稱 DNER)。在 2003 年時,這些全 集典型地是透過以網際網路為基礎的個別服務所取得。正因如此,這些服務的 使用者必須逐一瀏覽與學習使用分散且各自獨立的檢索介面,常常造成使用上 的不便。因此當前的發展行動將焦點放在建造一個「資訊環境」,在這個「資訊 環境」中,允許使用者可以跟全集產生互動(interact),成為一個更緊密地結合 的整體。除此之外,也提供使用者對全集之內容一個更無縫存取(seamless access)的資訊環境。(Robinson & Johnston, 2003)
聯合資訊系統委員會資訊環境(JISC Information Environment,簡稱 JISC IE)基礎的技術架構是個三階層模型(three-layer model)。這三個層次分別是 供應階層(provision layer)、聯合階層(fusion layer)以及呈現階層(presentation layer),如圖 2-4 與圖 2-5 所示。
圖 2-4 聯合資訊系統委員會資訊環境架構圖
資料來源:Powell, A. & Lyon, L. (2002). The JISC Information Environment and Web services. Retrieved January 19, 2006, from
http://www.ariadne.ac.uk/issue31/information-environments/
圖 2-5 聯合資訊系統委員會資訊環境技術結構圖
資料來源:Powell, A. (2005). JISC Information Environment Architecture.
Retrieved January 19, 2006, from
http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/
「呈現服務」(presentation services)能夠提供使用者橫越過多個「內容提
供者」(content providers)發現服務內容,讓使用者有一個單獨的資源入口,而 不必造訪瀏覽多個網站。在該技術架構中可將「呈現服務」視為入口(portals)。
在聯合資訊系統委員會資訊環境中,全集層次描述之作用在於允許內容提 供者公開揭示其全集內容的資訊;且讓「呈現服務」(與其他軟體工具)來決定 使用者可以利用與取得哪些全集。當新的數位全集被創造出來且得到授權後,
其描述將會被發佈,且自動成為一個可進入使用的入口。
(五) 數位內容創作
整個歐洲的文化記憶機構(cultural memory organizations)皆從事於實體資 源數位化工作。數位化之主要目的在於提高文化遺產的可利用性以及增加資源 的取得使用。例如英國的 NOF-digitize 計畫(New Opportunities Fund-Digitize,
簡稱 NOF-digitize),創造出新的數位化資源的全集。NOF-digitize 計畫之目的 除了在保護實體資源與促進觀光之外,最主要的目的在於創造數位學習資源。
(Robinson & Johnston, 2003)
儘管這類數位內容創作有時會因為零碎的入口(piecemeal approach)而遭 詬病,然而有一個漸增的認識與瞭解,即「這些數位全集之真正價值並非來自 於做為單獨的資源使用,而是在透過這些數位資源的整合成為一個可以在許多 不同以使用者為目的(user-oriented)之服務中被重複使用的元件。」(Besser, 2002;
IMLS Digital Library Forum, 2001 as cited in Robinson & Johnston, 2003)
定位(locate)與整合符合所需的全集此類服務功能,取決於描述這些全集 的全集層次詮釋資料紀錄之可得性(availability)。在全集層次(collection level)
描述資源往往用來提供從計畫的入口進入 NOF-digitize 計畫資源中。(Robinson
& Johnston, 2003)
第二節 全集與相關服務
為了進一步瞭解全集描述整體運作架構及相關服務機制,本節探討全集、
構成全集之單件以及相關服務之定義及特性。
一 、全集
(一) 全集定義及特性
全集即資源的集合體(an aggregation of resources)。(Powell, 1999)全集類 型例如4:
¾ 圖書館、博物館與檔案館中的館藏
¾ 圖書館、博物館與檔案館之目錄
¾ 網頁目錄(例如 Google 網頁目錄5)
¾ 主題式入口網站(subject gateways)
¾ 事件之彙集 (例如一系列的講演)
¾ 資料庫
¾ 搜尋引擎
在全集的定義當中並未明確規定需要聚合多少單件才可算是一個全集,理 論上,一個全集當中僅由一個單件所構成之情況是可能發生。(Johnston &
Robinson, 2002)
組成全集之單件類型(型態)可以是實體單件或數位化單件。實體單件例 如書籍、期刊、博物館藝術品、照片與文件記錄等等類型;數位化單件例如網 頁、資料庫與影像等。(Powell, 1999)透過圖示表達構成一個全集之單件類型 型態,請參照圖 2-6:
4僅為部分全集類型,而非涵蓋所有全集之類型。
5 Google 網頁目錄:http://www.google.com.tw/dirhp?hl=zh-TW&tab=wd&q=
colle ction 全 集
Physical items 實 體 項 目 Digital items
數 位 化 項 目
資 料 庫 網 頁 影 像 文 件 記 錄 書 籍 照 片 博 物 館 藝 術 品
圖 2-6 構成全集之單件類型 資料來源:本研究
在許多情況中,數位化單件是實體單件的代替物,或數位化單件是最主要 的呈現型態,即所謂的原生數位資源(born-digital),僅以數位格式產生與存在。
有些全集是其他全集的目錄,例如典型的圖書館目錄,本身是一個全集,它在 圖書館中描述一個或更多的全集當中的單件。全集可以依照類型(type)、主題 區域(subject area)、資源的地理所在地或其他的標準來加以歸類。(Powell, 1999)
全集有永久性(permanence)或暫時性(transience)等不同變化程度。例 如一個數位化單件之全集可能僅存在於當使用者查詢與運用的轉換期間;對實 體單件而言,集合體(aggregation)的產生可能僅在一個有限的期間當中,例 如在博物館中常見的主題特展,展出期間,向其他的典藏機構租借相關物品以 達成一全集。當展覽結束後,這些租借的展覽品會歸還原本的典藏機構。
全集之聚合過程(the process of aggregation)並非一定意味實體物件並置 並列(juxtaposition)。換句話說,全集可以是以分散式(distributed)的型態出 現,當中的單件是橫跨散佈於多個實體位置。(Johnston & Robinson, 2002)
綜合以上所述,表 2-1 從組成全集之單件類型、數量、全集存在型態與全 集分佈狀態加以整理歸納:
表 2-1 全集與特徵
全集 特徵
組成全集之單件類型
實體單件 數位化單件
需要聚合多少單件才可稱全集 沒有數量上的限定,理論上,一個 全集至少包含一個單件
全集存在型態
永久性 暫時性
全集分佈狀態
並置並列 分散式
(二) 實用粒度(functional granularity)
典藏機構在決定其典藏資源構成全集的方法上,Heaney 建議以實用的觀點 和方法即以「實用主義」(pragmatism)作為基礎:(Heaney, 2000 as cited in Robinson & Johnston, 2003)
典藏機構應當選擇本身實用的觀點作為基礎,例如典藏機構視為在「資 源發現」或「全集管理」上有用或必需的全集描述之元素細部的詳細 程度,必須是清楚明確,即典藏機構應當採取「實用粒度」之方法來 決定。
視單件之集合體為一個單位,進而描述該單位之特性或特徵,若能夠符合
「資源揭露公開」與「資源管理」之目的,就可稱之為一個全集。(Robinson &
Johnston, 2003)
蘇格蘭全集網絡(Scottish Collections Network,簡稱 SCONE)計畫中說明 了「實用粒度」概念是用來決定哪一個集合體值得做為全集而進行描述之簡單
「基本原則」(rule of thumb):(SCONE, 2002 as cited in Robinson & Johnston, 2003)
決定一個全集是否被紀錄在蘇格蘭全集網絡(SCONE)中,取決於考慮 該全集如何被定義、由什麼人來定義且是為了哪一類型的使用者而 言。若研究者或管理者確定該全集,則該全集有記錄之價值。
二 、單件
(一) 單件定義及特性
單件(item)即單一的物件(an individual object)。(Powell, 1999)單件常 常又被稱為資源(resources)、物件(objects)、文件(documents)或類文件物 件(Document-Like Objects,簡稱 DLO)。單件類型例如6:
¾ 單本書
¾ 單幅畫
¾ 單一網頁
¾ 單一影像檔
¾ 單一聲音檔
¾ 單部電影
全集與單件兩者之間的分界線是模糊的,主要原因在於單件本身也可能是 其他物件的全集,例如一個網頁可能是文字、影像或程式類型(applets)等的 全集。(Powell, 1999)
三 、服務
(一) 服務定義及類型
全集之服務旨在為終端使用者(end-users)提供機制(mechanism),讓使 用者可以取得全集或組成全集之單件。(Powell, 1999)
全集之服務可分成實體的服務(physical)與數位化服務(digital)兩種類
6僅為部分單件類型,非涵蓋所有單件之類型。
型。
實體的服務,例如使用者親自進入圖書館或博物館中使用全集,典藏機構 所提供取得全集的服務可稱之為有形的服務,請參考圖 2-7;反之,在數位化 服務中,使用者並非親臨典藏機構,而是僅透過應用層次服務(an application level service)以及相關協定(protocol)進行檢索以取得典藏機構或網站中的數 位化全集或數位化單件。(Powell, 1999)請參考圖 2-8。
圖 2-7 全集與實體服務
資料來源:改編自 Robinson, B. & Johnston, P. (2003). Collection-Level Description: Friend or Foe? An Overview of the Use of Collection Level Description
in Libraries and Related Institutions. Alexandria, 15(1), 7-21.
OPAC
實體單件之全集 實體位置 實體服務
數位型式全集
詮釋資料記錄 數位化位置 網路服務
圖 2-8 全集與數位化服務
資料來源:改編自 Robinson, B. & Johnston, P. (2003). Collection-Level Description: Friend or Foe? An Overview of the Use of Collection Level Description
in Libraries and Related Institutions. Alexandria, 15(1), 7-21.
在實際的情境中,實體的服務與數位化服務兩者之間有時是互為影響,例 如當時用者親臨典藏機構,首先透過典藏機構所提供的 Web-based 檢索介面查 詢所需要的全集,然後才進行實體資源取得,此一過程涉及實體的服務與數位 化服務兩種服務。
第三節 描述全集
全集的描述就是以單件之集合體作為描述單位,進行其屬性或相關特徵的 描述。目的除了讓使用者透過該描述所提供的訊息進而發掘符合所需的全集及 其單件資源之外,也方便典藏機構進行資源管理與資源交換。
一 、全集層次詮釋資料
最初,典藏機構中的全集是以無特定結構的文字文件來描述,例如圖書館 常藉由網站的「館藏特色簡介」一組網頁來描述館藏全集;歷史檔案館常常透
數位化單件全集
數位型式全集
詮釋資料記錄 數位化位置
網路服務 數位化位置
網站
過「檔案館指南」小冊子之簡介來描述典藏檔案之全集與典藏檔案資源之特色,
透過該描述所提供的資訊可讓潛在使用者瞭解這些全集(收藏品)存在狀態相 關訊息,提高資源的可利用性。
由於上述這些描述是無特定結構形式(網頁或紙本),不同類型的典藏機構 有不同的描述與呈現全集的方法,因此很難將這些描述加以「組織」與「定位」
這些描述檔案的所在地點;然若每一個典藏機構在建立全集描述時能夠採用公 開的(open)、具有結構性(structured)、標準化(standardized)與機讀格式
(machine-readable formats)之形式來描述全集將會有顯著之優點,請參考圖 2-9。國外許多計畫設計出具有結構且標準化的全集描述標準來避免上述可能發 生的困難。
圖 2-9 以標準化格式來描述全集 資料來源:本研究
Powell、Heaney 與 Dempsey(2000)認為當典藏機構採用標準化的格式來描 述全集其優點包括:
1. 使用者能夠發現與找出感興趣的全集。
2. 使用者在一個受控制的方法下橫越多個全集進行檢索。
3. 基於候選全集(candidate collections)之特性來改善(refinement)分 散式檢索方法(distributed searching approaches)。
4. 軟體基於瞭解使用者之偏好,代替使用者執行此類的檢索任務。
全集
公開
機讀格式
描述 具結構性
標準化 使用者方便
找尋全集
典藏機構方 便管理全集
(一) 建立全集層次詮釋資料之原因
對全集資源提供者來說,當底層的單件層次詮釋資料無法有效揭示典藏訊 息或是典藏的資源尚未編目無法提供使用者進行資源檢索時,則可透過建立全 集層次詮釋資料,公開揭示典藏資源之訊息。
對使用者而言,透過全集層次詮釋資料所提供之訊息,可以發掘(discover)
與定位出(locate)符合所需的全集,即瞭解全集資源的範圍、型式、組成全集 之單件以及取得該全集時相關限制等有用的資訊。
全集層次詮釋資料一個很重要功能在於它支援使用者瀏覽為數龐大的異質 性與分散式的資源,即所謂「高層次瀏覽」(high-level navigation),請參考圖 2-10。全集層次詮釋資料並非是用來取代目前典藏機構中現行的單件層次詮釋 資料。(Robinson & Johnston, 2003)進一步來說,全集層次詮釋資料與單件層次 詮釋資料兩者之間是互輔關係。
圖 2-10 「全集層次」詮釋資料與「單件層次」詮釋資料 資料來源:本研究
由於不同的典藏機構,各自使用不同的標準來描述其典藏的單件,因此,
當研究者希望取得散置在不同典藏機構中的全集資源,進行跨領域檢索時,全 集層次詮釋資料扮演了一個重要的支援角色。即使是全集當中的單件與描述這
「全集」
描述
「單件」
描述
「全集層次」
詮釋資料
「單件層次」
詮釋資料
High-level navigation
Low-level navigation
些單件的詮釋資料格式是由不同的標準所組成的情況下,在全集層次上的描 述,提供了廣泛地比較相似的高層次物件(high-level objects)之可能性。
(Robinson & Johnston, 2003)
Johnston(2003)從「全集提供者」、「使用者」與「軟體代理者」三個面 向說明建立全集層次詮釋資料之原因:
1. 「全集提供者」方面
(1) 透過全集層次詮釋資料,全集提供者可以對使用者公開關於全集 方面的資訊。
2. 「使用者」方面
(1) 透過全集層次詮釋資料,使用者可以發現與確定全集的所在位 置。
(2) 根據全集層次詮釋資料之概括性的描述,選擇符合所需之全集進 行探究與檢索。
(3) 比較全集(compare collections as broadly similar objects, even where items heterogeneous)。
(4) 瞭解全集的取得與利用情況。
3. 「軟體代理者」方面
(1) 透過全集層次詮釋資料,軟體代理者(software agents)可以代表 使用者選擇全集進行檢索。
(2) 透過全集層次詮釋資料,軟體代理者可以橫跨多個全集控制查 尋。
(二) 全集層次詮釋資料之功能需求
全集層次詮釋資料與單件層次詮釋資料兩種不同層次之詮釋資料格式扮演 的功能角色不同,因此在設計時,功能需求將會有所不同。
劉煒等(2004)認為全集層次詮釋資料之功能需求有三,分別為「分散式 資訊檢索」、「單件資源發現」與「異質資訊系統的互通性」:
1. 分散式資訊檢索
有效的全集描述機制可以「引導檢索方向」與「縮小檢索範圍」。為了達成 此目標,全集層次詮釋資料之功能必須達成:(劉煒,2004)
(1) 簡單、靈活且實用的通用標準,除了能夠適用於不同的領域之 外,也能為不同的網路檢索工具所支援。
(2) 能根據不同的使用者需求方便,簡單自動創建。因此,全集層次 詮釋資料必須基於開放的標準,例如 XML 與 RDF。
2. 單件資源發現
全集層次詮釋資料最根本之目的在方便使用者找出符合所需的單件資源。
因此僅僅只有全集層次的描述還是不足,必須還要有一個廣泛實用的標準,這 個標準應該:(劉煒,2004)
(1) 既能描述全集又能描述單件:目前只有 Z39.50 Profile for Access to Digital Collections 既可描述全集又能描述單件,還能描述該全集 中的子集合,該全集的父集合,該全集的關聯集合,以及它們之 間的相互關係。「檔案描述編碼格式」(EAD)、RSLP 全集描述
(RSLP Collection Description)與「都柏林核心集全集描述應用 規範」(DC CD AP)也有描述父集合與子集合的機制,但不能描 述它們之間的關係。
(2) 全集與單件之間的連結:在全集與其子集合之間,全集與其單件 之間提供一定的「連結方法」與「連結機制」。這種機制需要控 制詞彙(controlled vocabulary 受控詞表)例如索引典(thesaurus 敘詞表)之協助,詞表可以定義一個父類和它的子類之間的關係。
3. 異質資訊系統的互通性
全集層次詮釋資料之應用有助於跨語言、跨學科、多層次的資料共用和互 通性(互操作):(劉煒,2004)
(1) 提供對分散式的全集進行動態描述的機制,這是全集描述與單件 描述相較之下,更為複雜之處:
全集具有很多的層次,要以哪一層次作為描述的物件,需要 根據使用者之需求動態地定位。這就要求全集層次詮釋資料 要對層次的劃分有一個明確但靈活的定義。這一點 RSLP CD、「都柏林核心集全集描述應用規範」(DC CD AP)都考
慮到了,但只有 Z39.50 Profile for Access to Digital Collections 定義了一個框架模型。
全集的分散式特點決定了分散式資源要麼位於不同的實體位 置,要麼屬於不同的資訊系統,它們的資料結構、格式、類 型、檢索介面等都是異質的。全集描述要能夠支援這些異質 資源間的無縫(seamless)組合。在分散式環境中,全集由 異質組成部分動態地組合而成,因此就要求全集層次詮釋資 料不僅僅是一套平面的詮釋資料元素集,而是立體的、動態 的。
(2) 在不同語言種類之間,專業術語和自然語言之間提供語意鏈結。
在這方面,詞表的使用同樣重要。
(三) 全集層次詮釋資料相關發展
不同的領域及用途上,可應用於描述全集之詮釋資料格式眾多,以下依據
「領域」、「功能類型」以及「發展時間脈絡」三個不同的面向進行整理與歸納:
1. 「領域」面向
各 領 域 中 可 應 用 於 描 述 全 集 之 詮 釋 資 料 , 例 如 圖 書 館 界 早 期 的 Conspectus、ISO 2146 與 Z39.50 Profile for Access to Digital Collections;檔案界 的 「 檔 案 描 述 編 碼 格 式 」( EAD)與「國際檔案描述通用標準」(General International Standard Archival Description,簡稱 ISAD(G));應用在政府資訊指 引服務的 GILS(Government Information Locator Service,簡稱 GILS);用於描 述網路資源的 Web Collections;應用於網站內容彙集方面的 RSS(可稱為 RDF Site Summary、Rich Site Summary 或 Really Simple Syndication)。跨學科領域方 面,例如英國的研究支援圖書館計畫(RSLP)的全集描述計畫(Collection Description project)發展出的全集描述詮釋資料綱要架構(schema)與「都柏 林核心集全集描述應用規範」(DC CD AP)等。相關整理請參考表 2-2。
表 2-2 不同領域應用於描述全集之詮釋資料格式
領域 詮釋資料格式
圖書館 Conspectus
ISO 2146
Z39.50 Profile for Access to Digital Collections
檔案館
EAD ISAD(G)
政府資訊 GILS
網路資源
RSS Web Collections
跨學科領域
RSLP CD DC CD AP
2. 「功能類型」面向
可應用來描述全集之詮釋資料,若依照「功能類型」面向進行分析,劉煒 等(2004)認為可區分成「純描述」與「功能性」兩種類型:
(1) 「純描述」型
早期對全集的純文本描述。目前現行(主流)方案大多採用現成的一套或 幾套數位物件詮釋資料方案為基礎,加以合併與複用,並加入描述全集(資源 集合)的屬性內容擴展而成。(劉煒,2004)
「純描述」型之應用例如:
¾ UKOLN Simple Collection Description
¾ RSLP CD
¾ DC CD AP
¾ GILS
¾ EAD
(2) 「功能性」型
提供一個標準、結構化的規範框架或封裝方法,規定各類構成元素的內容、
句法和語意表達方法以及各類物件之間的關係,提供系統自定義能力,但具體 的屬性和語意只有獲得實例後才能得到。
這種方法具有更加靈活的結構,便於擴展,也便於電腦進行交互或自動處 理。然而,它不是傳統意義上的詮釋資料方案,而僅僅是詮釋資料功能的實現 方案,因此「功能性」型方案可以與「純描述」型方案結合使用,前者提供框 架,後者提供內容。(劉煒,2004)
「功能性」型之應用例如:
¾ Z39.50 Profile for Access to Digital Collections
¾ RSS
「純描述」型與「功能性」型之特徵與相關格式整理於表 2-3。
表 2-3 「純描述」型與「功能性」型之特徵
純描述 功能性
特徵
以現成的詮釋資料為基礎,加以合 併、複用並加入描述全集的屬性內
容擴展而成
提供一個標準的結構化的規範架 構或封裝方法,規定各類構成元 素的內容、句法和語意表達方法
以及各類物件之間的關係。
更靈活的結構,便於擴展,也便 於電腦進行交互或自動處理。
格式
UKOLN Simple Collection Description
RSLP CD DC CD AP
GILS EAD
Z39.50 Profile for Access to Digital Collections
RSS
3. 「發展時間脈絡」面向
若依「發展時間脈絡」整理全集層次詮釋資料,可概分成早期的全集描述 與現行的全集層次詮釋資料規範:(劉煒,2004)
(1) 早期的全集描述
全集層次詮釋資料可追溯到八十年代初對館藏書目整體進行描述的一些標 準,例如研究圖書館組織(RLG)的 Conspectus 標準、ISO 2146 和「國際檔案 描述通用標準」ISAD(G)等。早期的標準規範與目前數位圖書館全集的描述規 範並不完全相同,但是歷史淵源卻是一脈相承。(劉煒,2004)
和單件層次詮釋資料相較之下,全集層次詮釋資料發展較晚。早期歐美國 家的數位圖書館計畫中,若是牽涉到全集層次詮釋資料時,一般都採用「純描 述」型方案,即將現有的詮釋資料規範標準直接用於描述全集,例如 DC、GILS 或 EAD 等;或是將已有的詮釋資料方案增加少量元素,進行擴展而成,例如 英國的 UKOLN Simple Collection Description 方案。(劉煒,2004)
(2) 現行的全集層次詮釋資料規範
目前越來越多的數位圖書館應用不僅提供使用者發現、定位、檢索、獲取 包含在多個全集中的資訊的能力,同時也要求能夠透過軟體能夠「讀懂」詮釋 資料資訊,代替使用者進行資訊發現、定位、檢索、過濾等工作。(劉煒,2004)
因此近年來一些詮釋資料研究將重點放在詮釋資料體系的建設、詮釋資料 標記(置標)方案(即詮釋資料「容器」Container)的標準化、以及詮釋資料
「服務」的實現和標準化方面。例如英國 UKOLN 提出的「RSLP 全集描述綱 要架構」(RSLP Collection Description Schema)除了全集描述元素考慮得比較 周全之外,同時考慮了描述物件之間的關係。(劉煒,2004)
「功能性」類型詮釋資料方案也是目前的研究重點,這類詮釋資料方案不 對具體的描述元素作出規定,而從詮釋資料應用的邏輯模型出發,著重於服務 介面和框架的定義,對如何描述、如何封裝、如何交換、如何達到語意上的一 致進行規定,可以稱之為「詮釋資料協定」,常常需要與面向內容的「純描述」
型詮釋資料方案結合使用。這種方案普遍來自於電腦領域,它們提供一種資源 描述和發現的容器和機制,在實現上更具有普遍意義。例如 Z39.50 Profile for Access to Digital Collections 中對數位資源集合描述的規定,美國國會圖書館的 詮釋資料交換標準 METS 和詮釋資料描述體系 MODS,以及 W3C 在推動語意 網(Semantic Web)時提出的表達全集的方案 RSS 與 DAML 等。(劉煒,2004)
(四) 全集層次詮釋資料未來發展方向
全集層次詮釋資料未來發展趨勢,劉煒等(2004)認為將朝三個方向發展:
「體系結構簡單化、抽象化與模組化」、「基於開放、標準化、系統化的標記規 則」與「吸收最新的語意 Web 技術」:(劉煒,2004)
1. 體系結構簡單化、抽象化與模組化
不論是單件詮釋資料規範,還是全集層次詮釋資料規範,都面臨元素定義 模糊,元素與元素間界限不分明,語意互有交叉以及異構普遍存在的問題。(劉 煒,2004)
現有的全集層次詮釋資料規範一般沿用研究支援圖書館計畫(RSLP)提出 的描述全集的邏輯框架(schema 綱要架構),將全集描述所涉及的詮釋資料內 容分為「全集」(collection)、「位置」(location)與「代理」(agents)三類。「都 柏林核心集全集描述應用規範」(DC CD AP)規定了「描述全集」、「位置服務 關係」、「代理」的三類屬性,給出了它們的定義及其使用方法,但由於一般性 與特殊性的矛盾與生俱來,很多屬性元素的定義和使用方法仍然有爭議,要克 服這些問題,只有盡可能使詮釋資料的體系結構簡單化、抽象化與模組化。(劉 煒,2004)
2. 基於開放、標準化、系統化的標記(Markup)規則
全集層次詮釋資料的標記規範(置標規範)將採用 XML/XML Schema、
RDF 等開放標準以及基於 XML/XML Schema 的標記規範(置標規範),如 METS
(Metadata Encoding and Transmission Standard)和 MODS(Metadata Object Description Schema)。2004 年 2 月,DCMI 發佈「DCMI 抽象模型(Abstract Model)」草案,對 DC 詮釋資料的形式化標記(置標)進行了系統詳細的規定。
該模型的目的主要是提供一個參考模型,在這個模型所提供的容器中,不同專 門的 DC 詮釋資料標記規則(置標規則)可以相互對映(映射)。DC CD AP 工 作組正在制定基於 RDF Schema 和 W3C XML Schemas 的全集層次詮釋資料標 記(置標)指南。(劉煒,2004)
3. 吸收最新的語意 Web 技術
全集層次詮釋資料要求能夠在全集與其子集合之間、集合與其單件之間提 供一定的「連結方法」和「連結機制」。目前這種機制的實現一般是依賴於控制 詞彙(controlled vocabulary 受控詞表)如索引典(thesaurus 敘詞表)的協助。
詞表雖然可以定義一個父類和它的子類之間的關係,然而,這些連結並非總是
自動的,因為各個博物館描述其物件的詮釋資料標準不統一。索引典(thesaurus 敘詞表)也非總是提供一個大類與它所有子類之間的連結。連結不是動態的,
會出現許多無效連結。另外,要在不同語種之間,專業術語和自然語言之間提 供語意連結。這些問題的解決需要倚賴於一種能將所有的分類體系和控制詞彙
(controlled vocabulary 受控詞表)整合起來的多語言的知識表示工具,而 Ontology 正是這樣一種工具。Ontology 是對概念體系的明確的、形式化、可共 用的規範說明。它能明確地定義概念間的關係,用專門的 Ontology 描述語言
(例如 OWL 或 DAML+OIL)對各種關係提供形式化的描述,基於開放的標準,
因而可以方便地共用。Ontology 有強大的語意描述功能,採用 Ontology 建立「知 識地圖」,為不同領域,不同層次,不同粒度的概念提供語意導航,通過 Web Service 的體系架構,可以實現在不同的詮釋資料、不同的專業術語和自然語言 之間提供語意連結。Ontology 為在網路環境中實現開放互通性解決了詮釋資料 語意對映(映射)的問題。但要真正實現異質資訊系統的無縫連結,還必須依 賴於一套系統、靈活與開放的網路體系結構作為基礎,這是 W3C 正在宣導的 Semantic Web Service 技術。Semantic Web Service 可以有效地解決服務集成的 問題,實現詮釋資料的動態註冊和解析。(劉煒,2004)
(五) 早期描述全集相關應用
以下針對早期描述全集之相關應用進行探討:
1. Conspectus(館藏綱要)
(1) 源起
Conspectus 方法(methodology)源自 1979 年美國研究圖書館組織(Research Libraries Group,簡稱 RLG)。在 1980 年代早期由研究圖書館學會(Association of Research Libraries,簡稱 ARL)所採用,作為提供圖書館館藏(collections)
地圖以及用來聚集單一圖書館或一群圖書館之間典藏政策的方法。(Matheson, 1999)採行 Conspectus 方法的國家還包括有蘇格蘭、加拿大、澳大利亞、荷蘭、
瑞典、義大利與西班牙等。
(2) 目的
Conspectus 最初之目的在找尋一個讓圖書館員可以估量其館藏強弱的機 制。有「識別館藏強度」與「確定館藏弱點」雙重目的,以便館藏強弱能夠在 單一圖書館或一群圖書館(甚至橫跨地區或國家)之架構中被察看。主要之用 意是促進圖書館之間的合作,以便有限的資源能夠更有效率的運用來維持圖書