• 沒有找到結果。

數位時代資訊組織之發展趨勢

N/A
N/A
Protected

Academic year: 2021

Share "數位時代資訊組織之發展趨勢"

Copied!
1
0
0

加載中.... (立即查看全文)

全文

(1)

數位時代資訊組織之發展趨勢

The Future Trend for Information Organization in the Digital Age

陳雪華

Hsueh-hua Chen

國立臺灣大學圖書資訊學系教授兼系主任

Professor, Department of Library and Information Science, National Taiwan University

【摘要

Abstract】

網路資訊的應用雖然潛力無窮,但是網路資訊亦有許多問題存在,其中之 一即是網路資源檢索與使用的問題。本文首先回顧資訊組織的發展,進而說明 在數位時代中網路資源編目的一些相關重要計畫,包括:USMARC 欄位 856 的 發展、InterCat 計畫、NetFirst 資料庫、Dublin Core Metadata Initiative 的發展 、 CORC 計畫等。最後則探討數位化資源組織未來的發展趨勢包括:處理對象多 元化、多種詮釋資料並行、詮釋資料的來源、詮釋資料的功能、標準的運用、以及 將資訊組織的觀念擴大運用於知識取用管理中。

Potential applications of Internet resources are innumerable; however, many problems occurred with the application of Internet resources, one of them is information retrieval and use. This paper will first review the development of information organization, then to discuss some of the major projects associated with cataloging Internet resources, including the development of USMARC Field 856, InterCat Project, NetFirst database, Dublin Core Metadata Initiative, and CORC Project, etc. Lastly, it will discuss future trends of digital resources organization, including multi-media resources, parallel metadata, sources of metadata, functions of metadata, application of standards; and furthermore, to expand information organization concept into knowledge management.

【關鍵詞

Keywords】:

網路資源;資訊組織;詮釋資料

Internet resources; Information organization; Metadata

(2)

隨著網際網路全球性的快速發展,各國相繼努力推廣網際網路的普及應用, 整個網路使用人口在近幾年驟增。各種網路資訊應用與服務誠然已蓬勃發展,意 謂著網際網路的應用將普及到人民生活上的每一個環節、工商企業的產銷與經營 管理、以及政府部門的行政作業與為民服務,各種網路資訊應用都將隨之蓬勃發 展。 從網路資源的發展來看,資訊數位化的時代已經來臨。在這波數位化的運 動當中,遭受衝擊最大的可能是原本以保存書籍為主要功能的圖書館;面對排 山倒海而來的大量數位資訊,圖書館要如何因應呢? 紐約公共圖書館於1999 年舉辦了一場「虛擬圖書館高峰會」,全球 35 個大 型圖書館的代表齊聚一堂,共商圖書館如何在數位化世界發揮功能。法國國家圖 書館館長認為數位化肯定是未來圖書館的一部分,然而數位化資訊的技術日新 月異,圖書館光是考慮應該買哪些硬體或軟體,就是一個很大的挑戰。紐約公共 圖書館館長則警告說,除非圖書館加緊腳步趕上時代,否則當代文明的某些部 分以後將會流失,因為目前圖書館主要保存的還是書籍,但書籍絕對無法概括 當代文化的全貌(註1)。 未來的圖書館會是什麼面貌,還沒有一個肯定的答案。不過隨著網際網路 的快速發展與使用人口的增加,數位化資源的重要性肯定是漸增。因此,圖書館 必須能夠掌握數位化資源並提供讀者適切的服務。然而,網路資源浩瀚無邊,任 何一個圖書館無法僅靠一館之力,蒐羅並整理網路資源以滿足讀者之需,網路 編目資源分享的時代已來臨了。

貳、資訊組織的發展

資訊組織是圖書館業務不可缺少的工作內容之一,分類編目工作是伴隨著 圖書館的出現而產生的。一百多年前,杜威在哥倫比亞大學成立第一個圖書館 學院時,分類編目就一直是主要的技術性課程,杜威要求訓練編目卡漂亮、整 齊的書寫(稱為library hand),然而他也相當強調實務工作。到了 1920 年代, 圖書館學課程為了更加專業化而做出重大的檢討與修訂,Ernest Reece 主張文書 和打字的訓練課程只提供給抄寫事務人員就夠了;初級的分類編目、登錄、字母 排序、書目計量安排於大學部的課程;至於研究所的課程則應包括書目問題研 究的必修課程,並且堅持編目的工作應該以服務讀者為終極目標,而非館員自 身理念的滿足或是讓這些技術工作淪為因為本身的需要而獨立存在(註2)。 在1940 年代,圖書館學校的必修課程包括:行政、圖書選擇、編目、參考、 與書目學,其中,編目是整體課程的核心。隨著這門學科的成長,編目規則、分 類表、標題表等編目工具的發展愈趨複雜與完備。有些學校將編目課程依媒體類 型分為圖書編目(基本課程)與其他非書資料編目(進一步課程),有些圖書 館學校分為技術編目與主題編目,另外也有些依照圖書館類型分為公共圖書館

(3)

所使用的杜威分類法與席爾斯標題表(Sears List of Subject Headings)以

及學術圖書館所使用的國會分類法與標題表等不同的課程(註3)。

在1960 年代末 1970 年代初期,許多傳統課程也結合了新的科技而呈現另

一番生機與面貌,如自動化系統應用於電腦編目的技術,即機讀編目格式 (Machine Readable Cataloging Format, 簡稱 MARC)的興起。1967 年對圖書館 員來說是相當值得一提的重要里程碑,三個重要事件的發生奠定了對編目工作 專業化以及其教學上革命性大轉變的基礎。這三個重大事件就是英美編目規則 (Anglo-American Cataloguing Rules, 簡稱 AACR)的出版、MARC 的開始使用,

以及OCLC 組織的成立。AACR 提供了編目記錄內容的標準化格式,MARC 提

供了編目記錄和機讀格式之間相互轉換的方法,而OCLC 最重要的貢獻則是提

供大量現成的合作抄錄編目(註4)。自美國國會圖書館於 1968 年宣佈 LC

MARC 試用成功後,許多國家均紛紛採用,並加以修訂成為各國的 MARC,如 UK MARC、CAN MARC、AUS MARC 等。我國 Chinese MARC 第一版亦於民國 70 年制訂完成,目前已發展到第四版。MARC 是圖書館自動化作業的基礎,具 有很強的擴充性與兼容性,是國際圖書館界公認為最佳的書目資訊描述方式。因 此對傳統卡片式目錄造成極大的衝擊與震撼,突破卡片目錄只能揭示一館館藏 的限制(註5)。 1970 年代的另外一個重要發展就是資訊科學作為一個獨立學門的崛起,並 與圖書館學有緊密的關連,例如在編目方面注重索引製作的理論、語言學理論 (linguistics)、語法學理論(semantics);分類方面著重於分類理論、認知科學 (cognition)等。不過儘管有這麼多的演變,編目課程都一直是圖書館學不變的重 要核心課程(註6)。 隨著1980 年代初線上公用目錄的出現,讀者對其倚賴的程度超乎想像, 加上資料的收集與儲存開始以各種新的型式呈現,於是圖書館就開始嘗試將非 書資料整合入其編目的生產線上,編目員必須處理縮影資料、錄音帶、錄影帶、 電腦檔、光碟、互動式多媒體、資料庫等。隨著資料型式的多樣化與複雜化,編目 工作本身也產生革命性的轉型。原本個別分散的地方性的編目資源不但整合自成 系統,而且能進一步透過多元化的取得途徑分享到網路上,以供世界各地使用, 達到「分散儲存,整合運用」之效。傳統的編目工作不能有效達成此目標,現在 需要一種新的、更大規模的編目系統以著錄各種類型資料的內容,甚至包括那些 圖書館沒有買的、無法儲存的資料型式,如網路資源即為一例(註7)。

參、網路資源編目的相關計畫

目前,在網際網路上充斥著無可計數的各式資訊,如何有效率地找出所需 要的資訊是眾所期望之事。為了增進使用網路資源的效能,許多機構或個人均紛 紛設計各式各樣的網路資源檢索與利用方法。以下針對網路資源編目列出並說明 相關的重要計畫。

(4)

一、USMARC 欄位 856 的發展

OCLC 在 1991 年率先調查研究網路資源,且對其型式和本質取得了進一步 的認識,同時也測試了MARC/AACR2 對於網路資源的適用性。為了檢測這種新 型式的資源對於編目工作的潛在衝擊性,OCLC 進行一項實驗:徵召 30 位來自 世界各地有電腦檔編目經驗的館員,針對一批抽樣的網路資源進行編目,其目 的是要測試網路資源是否「能夠」被編目。 這 個 實 驗 的 結 果 得 到 三 個 重 要 的 發 現 : (1 ) 除 了 少 數 特 例 , MARC/AACR2 足以適用於網路資源的編目形式;(2)必須設計出一個能夠連 結電子資源與其書目的方法;(3)儘管有對於電腦檔編目的熟悉能力,發展網 路資源編目的指引手冊還是必須的。第一個發現使OCLC 建立相當的信心來推 動進一步的網路資源編目工作。對於第三個發現,出版網路資源編目指引手冊 《Cataloging Internet Resources: A Manual and Practical Guide》(註 8)及一些其 它參考資源提供了解決之道。而針對第二個發現的問題,該計畫成員及顧問提出

增加USMARC 的 856 欄位,以著錄網路資源的存放位置與並取得電子資源。

欄位856 是由美國圖書館協會(American Library Association,簡稱 ALA)

之下的一個委員會MARBI,於 1992 年底時提出一個計劃書(proposal 93-4),

建議修改書目資訊的內容以適應網際網路中的各式電子資訊,如電子期刊、電子 文獻等。在這個計劃書中,最主要的改革不在於書目資訊的描述,而是在於電子

資訊所在位置及獲取資訊的表示方法。新增加的欄號856 稱為「電子位置及使用

方式」(Electronic Location and Access),包括的資料單元有:使用方式(如電

子郵件、檔案傳輸、遠程載入、Gopher 或是 http)、主機名稱、路徑、檔案名稱、或 其他可以協助使用者透過網路獲取電子資訊的方法等。在1993 年 1 月,此建議 經修正並通過之後,目前已是 USMARC 的正式欄位了(註 9)。目前 UNI MARC 甚至中國機讀編目格式第四版中亦仿效 USMARC 增加 856 欄位,做為 網路資源位址與取得方法之用。

二、InterCat 計畫

由於前述實驗顯示MARC/AACR2 編目能適用於網路資源,OCLC 提出網

路資源的編目計畫(The OCLC Internet Cataloging Project, 簡稱 InterCat)。這個計 畫的部分經費由美國教育部所贊助,其主要目的是發起美國圖書館界之合作, 共同為網際網路中的資源建置一個可供檢索,且其形式為USMARC 格式的目錄 符合AACR2 的規則,並包含 856 欄位。參與的圖書館可以根據個別的館藏發展 政策和讀者的興趣來選擇自己要編目的資源。這個計畫從 1994 年 10 月到 1996 年3 月,為期 18 個月(註 10)。在此計畫的尾聲,231 位代表幾乎各類型圖書 館的參與者選擇並編目了大約4,700 筆網路資源(註 11)。 簡而言之,InterCat 是由許多圖書館共同參與,並負責辨認、選擇、和編目 網路資源的工作。其方式係以機讀格式與AACR2 標準編目規則,因此書目記錄

(5)

適合放置在一般圖書館目錄或甚至是地區性、全國性的聯合目錄中。然而,以 MARC 格式編目網路資源的問題是:MARC 是勞力密集、描述詳盡的編目方式, 所以其成本也偏高。而且由於其檔案的製作和維護都相當花費時間,所以通常只 適用於最重要的記錄。因此若以MARC 格式來編目內容龐雜、數量龐大的網路資 源,不僅人力與物力所費不貲,而且根本是緩不濟急的一項工作。

三、NetFirst 資料庫

由於InterCat 計畫並不是很成功,OCLC 於 1996 年 2 月宣布一個網路資源 的資料庫--NetFirst。該資料庫之目的是提供網路使用者一個簡單實用的工具,可 以協助使用者較易於探索網路資源。其書目資料來源是併用數種方式得之,包括 自動收集(automated collection)、驗證技術(verification techniques)、以及傳

統的索引、摘要等技術。NetFirst 資料庫收錄的對象有全球資訊網首頁、FTP 站、 電子論壇、網路討論群、圖書館目錄、以及電子期刊等。編輯群針對這些資源加以 評估,通過選擇的步驟之後,首先由索引摘要工作人員負責摘要描述,並依美 國國會圖書館標題系統給予標題。除了一般性的關鍵字檢索之外,NetFirst 也提 供這種控制語彙的標題檢索。此外,每筆記錄亦依杜威十進分類法系統給予分類 號,如此可允許使用者依知識體系的架構來瀏覽網路資源。每筆書目記錄中所包 含的資料項目有:作者、題名、摘要、標題、杜威分類號,以及所在位置,以便使 用者利用超連結方式獲取資料(註12)。在 1999 年 9 月時 NetFirst 資料庫收錄 的數量約有十二萬筆,並以每個月數千筆增加中(註13)。

四、Dublin Core 詮釋資料計畫

在 1994 年 10 月 的 第 二 屆 WWW 會 議 上 , OCLC 的 資 深 研 究 員 Stuart Weibel 提出了整理網路資源對圖書館的重要性。他認為網際網路中雖然有許多 資訊,但人們卻常找不到所需的資訊,所以有必要集合不同領域專家,發展出 一套共同協定的語法,可以跨科際地整合運作,來幫助人們尋找資訊(註 14)。

於是OCLC與國家高速電腦應用中心(National Center for Supercomputing Applications,簡稱NCSA)於1995年3月時,在美國俄亥俄州OCLC的所在地 Dublin共同召開OCLC/NCSA Metadata Workshop,共有52個來自不同領域的學 者專家參與,包括圖書館員、檔案管理員、人文學者、地理學者,以及網際網路 的標準制定者、Z39.50、SGML專家等,共同討論在網路中電子資訊之詮釋應該 包含哪些項目。這些項目稱為「Dublin Core」(簡稱為DC),它們被認為是描述 網路資源最基本須具備的項目。而這些項目的名稱儘量清晰,以便廣大範圍的使 用者都能理解(註15)。此為第一次 Dublin Core 會議。 第一次DC 會議提出 13 個項目欄位,後來又增修為 15 個欄位,包括:1.

(6)

creator);4.簡述(description);5.出版者(publisher);6.其他貢獻者(other contributors );7.日期(date);8.資源類型(resource type);9.資料格式 (format);10.識別資料(resource identifier);11.關連(relation);12.來源 (source);13.語文(language);14.時空涵蓋範圍(coverage);15.權限範圍 (rights management)。

這一次會議稱為DC1,自 1995 年至 1999 年,已舉行 7 次會議,茲將其時

間、地點與會議主題列於下:

DC1--1995 年 3 月 由 OCLC 與 NCSA(The National Center for Supercomputing Applications at the University of Illinois at Urbana-Champaign)共同召開,召開地點位於美國俄亥俄州的 Dublin。

DC2--1996 年 4 月 由 UKOLN(UK Office for Library and Information Networking) 與 OCLC 共同召開,召開地點位於英國的 Warwick。 DC3--1996 年 9 月由 CNI(Coalition for Networked Information) 與 OCLC 共

同召開,召開地點位於美國俄亥俄州的Dublin。

DC4--1997 年 3 月由 OCLC, 澳洲 DSTC (the Distributed Systems Technology Centre)與澳洲國家圖書館共同召開,召開地點位於澳洲的坎培拉 (Canberra)。 DC5--1997 年 10 月由 OCLC 與芬蘭國家圖書館共同召開,召開地點位於芬 蘭的赫爾辛基(Helsinki)。 DC6--1998 年 11 月由美國國會圖書館與 OCLC 共同召開,召開地點位於美 國的華盛頓特區(Washington, D.C.)。 DC7--1999 年 10 月由德國國家圖書館與 OCLC 共同召開,召開地點位於德 國的法蘭克福 (Frankfurt am Main)。 Dublin Core 發展至今已經成為著錄網路資源的最佳詮釋資料,但它不是要

用來取代MARC,而是要幫助 MARC 發展且與其並存的。Dublin Core 是跨越多

學科、科際整合並且具備國際化的,所以其特色就在於其規則運用的彈性,所有 的欄位都是可重覆的、可延伸的,以及可檢索的(註16)。

五、CORC 計畫

Dublin Core 成為著錄網路資源的最佳詮釋資料,但是要如何來創製並共享 網路資源書目資料呢?OCLC 認為其答案在於建構一個能複製其 WorldCat (註 17 ) 現 有 成 就 的 系 統 , 此 即 線 上 資 源 編 目 共 享 計 畫 ( Cooperative Online Resource Catalog,簡稱 CORC)(註 18)。

(7)

OCLC 於 1998 年 10 月提出了 CORC 計畫,用以發展一套供圖書館合作建 立並共享網路資源的編目系統(註19)。該計畫為期為 12-18 個月,計畫結束 後將成為OCLC 的一項正式產品。CORC 參加成員至 1999 年底時已超過 150 個 單位(註20)。這個計畫將建立於先前 OCLC 的一些網路資源資料庫專案的成 果基礎之上,例如InterCat 和 NetFirst,CORC 其參與成員的網站;以及其他研 究網路資源著錄計畫的成果,特別是一些以Dublin Core 為基礎的資源著錄研究 計畫(註21)。 CORC是一項由圖書館合作發展網路資源編目的研究計畫,其目標係使網 路上的龐大資源能夠更有效、更完整的取得,供圖書館使用者利用。CORC 除了 支援傳統的圖書資料檢索外,也將動態的網路資源整合在檢索範圍內,以使用 者導向為依歸,使網路資源更具實用性(註22)。CORC 的主要特徵如下(註 23): 1. 對網路資源進行合作編目; 2. 能適用地方性的和共通性的詮釋資料; 3. 促進詮釋資料在實體和數位資料的整合; 4. 權威控制; 5. RDF/XML 的輸入與輸出; 6. 入口網頁:提供其他相關網頁的連結;

7. MARC 與 Dublin Core 的輸入與輸出;

8. 在單一的系統上整合MARC 和 Dublin Core;

9. 以MARC 與 Dublin Core 編輯記錄格式;

10. 對資源能有彈性的取得; 11. 能支援統一代碼(Unicode); 12. 輔助分類和標題的指定; 13. 能自動設定關鍵字; 14. 能自動擷取資料; 15. 鏈結維護; 16. 透過 Z39.50 檢索的瀏覽介面。 總之,CORC 即是一個建立並共享網路資源詮釋資料的系統,以促進資源 選擇的自動化、詮釋資料本身的建立以及資料之間鏈結的維繫。 雖然CORC 與 InterCat、NetFirst 有同樣的目標,即增進網路資源的利用,

(8)

但對資料處理的方法與強調的重點卻迥異。InterCAT 是在 WorldCat 中研究如何

編目網路資源,因為過去習慣使用OCLC 的編目系統,所以所有的紀錄都是運

用US MARC 的格式並加添欄位 856。目前 InterCat 在 WorldCat 中的資料約有 6

萬筆紀錄,但這計畫已經不活躍了。NetFirst 是一個經由 OCLC FirstSearch 或

OCLC Cataloging Service 可查詢到的網路資源資料庫,OCLC 摘出這些網頁的

摘要和索引記錄,而且有國會圖書館標題和杜威分類號。CORC 是一個合作著錄

網路資源的研究計畫,因為CORC 和 InterCat 有許多相似處,故又將 CORC 計

畫稱為「InterCat2」。而這兩者的不同點在於:CORC 主動藉由 MARC 整合最新 的詮釋資料,這個新系統能用更靈活的方式記錄資料;除此之外,CORC 更強 調記錄輸出格式的可用性,例如運用HTML 與 XML(註 24)。

肆、數位化資源組織未來的發展趨勢

隨著電腦普遍使用的急速增長以及數位資訊的爆炸性生產,從1970 年代 起學術界就開始對數位資訊的儲存發生濃厚的興趣。隨著網際網路不斷的發展以 及儲存數位資訊的各種新技術如雨後春筍般地出現,這些現象引發了許多相關 問題。資訊的儲存、資訊組織與有效的資訊檢索即是其中重要的一些議題。這意 味著對數位資訊進行管理的重要性,不僅是牽涉大量資料的管理問題,更是關 於一套愈趨精確的資訊檢索方法的建立(註25)。 數位化資源組織未來的發展趨勢究竟如何,其實目前尚難斷言,因為網際 網路的發展時間並不久,數位化資源組織的發展尚處於不斷改變中,僅就前一 節所述的一些重要的計畫中探討其可能的發展。

一、

處理對象漸趨多元化

過去圖書館所處理的對象大多為圖書館中所收藏的各類型資料,即編目規 則中所涵蓋的各類媒體,包括圖書、連續性出版品、善本書、地圖資料、樂譜、手 稿、錄音資料、電影片及錄影資料、靜畫資料、立體資料、拓片、縮影資料、電腦檔 等(註26)。 目前網路數位資訊以前所未有的膨脹速率在增加著,這些資源相當多樣化: 從正式到非正式的出版,從文字檔到多媒體檔案,從人文社會到自然科技,從 學術性論文到生活休閒資訊等。隨著資訊科技的發展,這些亦將影響傳統出版品 的形式,由紙本轉為數位化,電子期刊、電子書將愈來愈普遍。由於數位化資訊 動態的本質,其版本控制(version control)將是重要的課題。

二、

多種詮釋資料並行

過去所使用的書目控制方式已漸改變,資訊檢索的方式亦有多種方式。 由 於處理的對象漸趨多元化,各領域亦有其特殊的需求,MARC 雖然仍很重要, 但已不再獨領風騷,多種詮釋資料並行是必然的。目前有些機構閉門造車發展自 家的詮釋資料格式,有些機構則使用逐漸形成共識的詮釋資料標準,如 Dublin

(9)

Core, EAD, FGDC, GILS, TEI 等,其中 Dublin Core 受到最多的矚目。在這種情形 之下,對於能夠處理多種詮釋資料(甚至包括多語言)的管理系統的需求就增 加了。 未來,資訊檢索可及性(accessibility)的提升是一個重要課題,亦即如何能 夠跨資料庫、跨系統、跨網站之間做資訊透通與整合性的搜尋。當然透過豐富而 前後一致的詮釋資料,就能夠有效提升搜尋的效率,不過前提是:描述性的詮 釋資料必需相同、或者是在不同詮釋資料之間的要能夠互相對映(mapping)。總之, 一定程度的相容性是必要的,而達到不同詮釋資料之間的相互可操作性是眾所 期待的事(註27)。 目前,已有一些單位針對詮釋資料之間的相互可操作性提出討論,例如美

國國會圖書館主持的一項計畫就是建立起USMARC、Dublin Core 以及 GILS 三

種格式之間的溝通結構與運作機制。相互可操作性是建立一致性資源儲存系統的 重要條件,並且依賴於各互通詮釋資料格式之間差異門檻的最小化。進一步更理 想的做法是藉由建立一個更上位層次的「超詮釋資料」(super-metadata)來達到 相互可操作性的目標,如此則可使現有及未來的詮釋資料格式能夠同時顧及本

身的高度特殊性又能與其它詮釋資料之間有良好的整合。(註28)W3C 在 1999

年所制訂的「資源著錄架構」(Resource Description Framework, 簡稱 RDF)是一 個針對詮釋資料計設的溝通框架,它即提供此「超詮釋資料」的管道。

三、詮釋資料來自各種不同的來源

過去圖書館書目記錄大多由圖書館編目館員創製,但是現在各類詮釋資料 可能來自各種不同的來源。有些資源描述(書目控制)工作於文獻在建構時即開 始,這種由一般人(非學科領域專家、也非資訊專家)創製的詮釋資料,通常是 資訊物件的原創者,他們所使用的著錄方式通常是在HTML 文件中為個人網頁 製作的metatags。另外,不只侷限於傳統的圖書館與資訊部門,亦包括一些其他 領域的資訊產製者與使用者,如檔案資料室、出版業者、政府機關、產業界等單 位,也愈來愈多學科領域專家參與詮釋資料的創製(註29)。 在定義與著錄詮釋資料方面,過去唯有圖書資訊領域的人擁有此專長,現 在則參與者眾。從正面角度思考,有更多人關心並參與此工作是一件好事,但 從另一角度思考則是圖書館界有其他領域的競爭者。圖書館所扮演的角色將擴 展與其他領域人士(如資訊創作者、製作者與代理者)之合作關係。圖書館在資 訊的控制與使用方面應思考如何增進其加值工作,並確認與圖書館界以外人士 (如:作者、製作者、出版者、資訊仲介者、商業資源)在書目控制方面的合作關 係(註30)。

三、

詮釋資料的功能不僅止於描述數位化物件

許多博物館界、檔案界、圖書館界的專業人士,對於詮釋資料的描述或著錄 功能都相當熟悉,不過詮釋資料不僅止於描述,它也可以用來辨識內容,及記

(10)

錄此資源的管理、處理、保存、與使用。資訊專業人士在考慮與數位化資訊系統結 合後,最後可能必須處理的各種活動,則需要更全面性、概念性的詮釋資料。 在使用者能夠透過網路、取得資訊內容的環境裡,詮釋資料必須標示儲存庫 的名稱與性質,確認內容的真實性與上下文,並能提供資訊專家在實際的參考 諮詢或研究時所能提供的資料。不僅如此,經過深思熟慮再架構出的詮釋資料還 可提供對於內容的其他檢索點,可能是經由數位化資訊系統所開發的。在所有各 式各樣的闡釋裡,詮釋資料不僅用來辨識及描述一個資訊物件;也記載這個物 件如何運作、它的功能、使用、與其他資訊物件的關連、以及應該如何管理。 Anne J. Gilliland-Swetland 按前述之詮釋資料的內涵與功能,把它分為幾大 類別:管理、描述、保存、使用與技術性的詮釋資料,並將之列於表一: 表一 不同類型的詮釋資料與其功能 類型 定義 範例 管理 用來管理資訊資源的詮釋資料 * 物件的取得資訊 * 權限與重製追蹤 * 合法取用的條件的說明 * 典藏資訊 * 數位化之選擇條件 *版本控制 描述 用來描述或辨識資源的資訊 * 編目記錄 * 協尋工具 * 專門領域的索引 * 資源之間的超鏈結關係 * 使用者的評註 保存 與資訊資源保存管理有關的資 訊 * 資源實體狀況的說明 * 為了保存資源的實體物件與電 子版本所採取行動的說明,如資 料的更新與移轉 技術 用來描述系統運作功能 * 軟體與硬體的說明 * 數位化的資訊,如格式、壓縮比 率 * 系統反應時間的記錄 * 驗 證 與 安 全 資 料 , 如 譯 成 密 碼,輸入密碼 使用 用來描述資訊資源的使用層次 與類型 * 展示記錄 * 使用與使用者的記錄追蹤 * 內容再利用與多版本的資訊

(11)

Metadata: Pathways to Digital Information . (Los Angeles: Getty Research Institute; 1998),3.

五、標準的運用(Dublin Core, XML, RDF)

傳統圖書館資訊著錄的標準為MARC。以 MARC 來說,儘管它是我們現在 比較熟悉的、觀念上相對容易理解的,但基本上是屬於記錄格式內容豐富的一邊 因為要能有效率地寫出符合其精緻而高結構性的標準記錄格式之前,編目員必 須接受相當程度的訓練。而另一種稍微精簡的詮釋資料型式就是現今尚在發展當 中的Dublin Core,其設計原意就是以用來著錄網路資源為主,其記錄可支援自 動化及人工輸入(註31)。目前 Dublin Core 已經逐漸成為網路數位資源著錄的 主要標準,其在圖書館的基本應用上有兩個不同的方式(註32): 1. Dublin Core 能使經許可的圖書館資料庫成為廣域網路搜尋服務的一部分,或 讓圖書館在提供圖書館本身或非圖書館的資料庫給讀者時,兩者能維持在同 一水平的水準。這是傳統編目方法無法辦到的。 2. 傳統編目方法所不能有效描述的新興資源,Dublin Core 能補其不足之處,而 使資料的描述更完整。 為了儲存和便於系統間的轉換,有許多種方法可以使用Dublin Core 的資 料編碼,包括:以HTML 為基礎的網頁所使用的 HTML META 標籤、以及整合

延伸標記語言(Extensible Markup Language, 簡稱 XML)與 RDF 等方法。

XML 是 SGML 簡化後的語法,是 W3C 於 1998 年 2 月所頒佈的標準,取 SGML 之長,補 HTML 之短,獲得許多大廠(如:Microsoft、Netscape 等)的支 持,並可完全支援中文。XML 可做為詮釋資料的編碼標準, 它提供了詮釋資料 在語法層次上的互通性,使之跨越特定平台、特定系統的限制。RDF 資料模式則 提供了一致性的資源描述方式,使我們能以標準化的方式在Web 上交換詮釋資 料,並降低自動化處理程式的開發複雜度。雖然RDF 資料模式可以用許多語法 來表達,W3C 建議以 XML 做為 RDF 資料模式的標準語法。XML 表達資訊結構 (structure ) 的 基 礎 , 而 RDF 是 表 達 語 意 ( semantics ) 的 基 礎 , 此 稱 為 RDF/XML 語法(註 33)。 RDF 是一個針對詮釋資料計設的溝通框架,它提供了應用程式在網路上 交換機讀資訊的相互操作性,並強調促進網路資源的自動化處理。RDF 可應用 於相當多樣性的領域,例如:在資源發現方面提供更強的搜尋能力;在編目方 面能記敘特定網址、網頁甚至數位圖書館的內容及其相互關係;藉由特殊程式的 代理促進知識的分享和交換;資源內容的評鑑;敘述表示單一邏輯文獻的網頁 匯整;描述網頁的智慧財產權限。甚至配合數位簽名,RDF 還可以成為建立“ 信用網路”的關鍵,而進一步發展電子化商業行為、合作事業及其它種種應用 (註34)。

(12)

換句話說,RDF 保証了詮釋資料整個交換和運作機能的發展前景,對詮 釋資料和資源著錄的技術而言,此一躍進的重要性可以和HTTP 本身的發明相 互爭輝。儘管這樣的進步對傳統圖書館編目的潛在意義還未明朗化,但有幾點我 們是可以想像的(註35): 資源創作者可以在創作過程中將詮釋資料的記述資料作為資源的一部分 直接附加進去,甚至有些基本記述的資料可以設計讓它由資源本身自動產生。 1. 可以試著將產製詮釋資料記錄的應用程式預設於文書處理軟體、網頁製作軟 體或瀏覽器之內,其目的在於使詮釋資料記錄資料的產生成為一種普遍具 備的功能。 2. 詮釋資料檔可以與資源本身共存、獨立於資源之外,或者內含於其它的詮釋 資料檔。 3. 用來製作網路資源索引的一些工具軟體,不管本身是使用什麼資訊來源, 現在都可以利用Dublin Core 標示來加強索引功能與限定欄位搜尋。 4. 工具軟體將能夠辨識與閱讀RDF 記錄檔並將其轉換為其它適當的格式,包 括MARC 格式。 5. 編目員可以自動地從網路資源獲得資料內容,而不需要再進行抄錄的工作。

六、從書目控制到知識取用管理

資訊傳輸的費用將變為低廉,數位化資料將以網路彼此連結,未來書目資 訊與資訊本身將整合成為一體。因此對於書目控制(bibliographic control)這一 名詞需重新再定義,或甚至使用不同的詞彙,例如:知識取用管理(knowledge access management)。所謂識取用管理即是將知識架構體系作一系統性的統合整 理,在資訊需求者發出需求訊息時能有效取得知識的一個過程。因此不僅提供書 目資訊,更要提供其相關的全文資料。 全文資料可以使用標誌(markup)方式,標誌是可以重複使用資料的關鍵 所在。標誌有兩類,第一類是使用以視覺/外觀為導向的標誌,包括 PDF 與 HTML;另一類是以文獻結構/描述為導向的標誌,包括:TEI、SGML、XML 等。 通用的標誌語言,有兩項特點:具有跨平台的能力,以及除了格式在外型上的 標誌,亦可就其內容做意義上的標誌(註36)。 傳統的編目工作不能有效達成此目標,現在需要一種新的、更大規模的系 統以著錄各種類型資料的內容。為了成為一種知識取用管理的工具,這種新式的 編目系統必須能夠鑑別與控制知識本身,而非僅及於處理承載資訊的外在形體。 要準備產生這種新式的編目系統確實需要相當複雜的技術,所以這一切工作也 必然是極為費時的。 知識取用管理是一項龐大且艱鉅的任務,因為它必須超越知識呈現的外在

(13)

物質形式。然而知識取用管理帶來的好處是無疑的,尤其當圖書館希望擴大其資 訊取得服務的範圍到所有網路涵蓋的資源時。在那樣的情況下資源的外在形體呈 現變得無關緊要,資源的內容則可以被精細地分析與組織,知識取用管理將變 得愈來愈重要。最後我們理想的館藏模式將是全球化的、多媒體的、多樣化的, 而且不再侷限於圖書館狹囿的牆閣之內(註37)。

伍、結語

在圖書館自動化以前,圖書館通常是提供卡片式的實體目錄以幫助讀者查 詢書目資訊、並透過圖書館取得資源,這些資源只限於圖書館本身或他館擁有的 實體資訊。所以在傳統上,圖書館主要作為取得詮釋資料的接觸點,或者是扮演 資訊資源傳遞的角色:不論是快速傳送本館易得的資訊,或者從他館館際互借 來傳遞資料(註38)。 過去圖書館在分類編目工作扮演資訊組織與整理的角色方面盡了很大的心 力,也有一些傲人的成績。例如以編目規則來規範書目描述的內容,以及發展機 讀編目格式成為各圖書館間共通的標準。透過合作編目的計畫,使得書目資源可 以共享,不但加速各館之間編目的速度,減少許多原始編目的時間,也降低編 目工作所耗費的人力與金錢。然而編目規則與機讀編目格式的發展大多以印刷式 資訊為主要考慮對象,因此,也最適用於印刷媒體。 二十世紀後半,資訊科技與網路的發展快速變遷,使得資訊採訪、徵集、著 錄及取得間的界線限制慢慢消彌。對圖書館而言,全球資訊網使圖書館能提供讀 者對其館藏及服務更大接觸面的取得途徑。但是,僅靠單一圖書館提供讀者一些 搜尋方法,以引導讀者去發現且挑出他所需要的網路資源是難以維持長久的, 目前必須努力的方向是藉助全球圖書館界之合作,共同為龐大的網路資源做資 訊加值的工作。在此,標準化的議題變的極為重要。目前正在發展的標準化工具 包括Dublin Core、XML與RDF等都是相當引人注目的。 網際網路成為學術界、商業界以及社會各界人士主要資源管道的事實,已 經迫使包括圖書館在內的許多團體必須以一個嶄新視野來看待提供資訊服務的 工作。儘管圖書館身為資訊中介者的角色並沒有根本上的移易,但圖書館履行這 些角色任務的方法卻有了戲劇化的改變,分類編目的工作需加以擴展為知識取 用管理。 展望未來,我們期待在數位時代的資訊組織工具能帶領我們走向知識取用 管理的境界。我們希望它不但要有書目控制,更要全文標誌與檢索的功能,而且 要輔以權威控制、標題索引典、字典檔、語法規則等能夠提供精確性檢索的工具 以補足一般書目檢索的不足或傳統全文檢索指東打西的陋弊,這樣才能對知識 做周延而有效率的利用。

【附註】

(14)

註1:尹德瀚,「資料數位化:教圖書館太沉重」,中國時報,民國 88 年 7 月 1 日,第 10 版。

註2:Janet Swan Hill & Sheila S. Intner, "Preparing for a Cataloging Career: From Cataloging to Knowledge Management," <http://www.ala.org/congress/hill-intner.html> 註3:同註 2。 註4:同註 2。 註5:胡歐蘭,「二十一世紀機讀編目格式的發展」,華文書目資料庫合作發展研討會 (臺北市:國家圖書館、漢學研究中心主辦,民國88 年 8 月 30 日至 9 月 1 日), 頁2-3。 註6:同註 2。

註7:Jul Erik, "Cataloging Internet Resources: An Assessment and Prospectus", The Serials Librarian 34: 1-2 (1998): 91-104.

註8:Nancy B. Olson, ed., "Cataloging Internet Resources: A Manual and Practical Guide,"

<http://www.purl.org/oclc/cataloging-internet>

註9:Priscilla Caplan, "Cataloging Internet Resources," The Public-Access Computer Systems Review 4:2 (1993): 61-64.

<http://www.nlc-bnc.ca/documents/libraries/cataloging/caplan.txt>

註10:Erik Jul, "U.S. Department of Education Provides Grant for Catalog of Internet Resources," posted in PACS-L, 15 Sep. 1994.

註11:同註 7。

註12:John Sullivan and Nita Dean, "NetFirst Database Introduction," 19 Feb. 1996. <http://www.oclc.org/oclc/press/960219b.htm>

註13:Product Description, 20 September 1999.

<http://www.oclc.org/oclc/netfirst/9352nf/netflyer.htm>

註14:Ron Chepesiuk, "Organizing the Internet: The ‘Core’ of the Challenge," American Libraries 30:1 (Jan. 1999): 60-63.

註15:Stuart Weibel et al,"OCLC/NCSA Metadata Workshop Report,"

<http://OCLC.org.5047/oclc/research/conferences/metadata/dublin_core_report.html>

註16:同註 14。

註17:WorldCat 係供世界各地使用的書目資料系統,該系統至 2000 年 2 月約有四千三

百多萬筆記錄。

註18:OCLC System Statistics. <http://www.oclc.org/oclc/new/stats.htm>

註19:同註 14。

註20:Jay Jordon, "2000 and Beyond – A Great Time for Libraries!" OCLC Newsletter 242 (Nov./Dec. 1999): 3.

註21:Thomas Hickey, "Cooperative Online Resource Catalog Explores Uses for Catalog of Internet Resources,".

(15)

<http://www.oclc.org/oclc/new/n235/cooperative_online_resource_catalog.htm>

註22:OCLC CORC/About CORC

<http://www.oclc.org/oclc/research/projects/corc/about/about.htm>

註23:OCLC CORC Home Page

<http://www.oclc.org/oclc/research/projects/corc/>

註24:OCLC CORC/CORC FAQ

<http://www.oclc.org/oclc/research/projects/corc/about/faq.htm>

註25:Chilvers, A. and Feather, J. "The Management of Digital Data: a Metadata Approach," The Electronic Library: the International Journal for Minicomputer, and Software Applications in Libraries 16:6 (Dec. 1998): 365-372.

註26:中國圖書館學會分類編目委員會修訂,中國編目規則,修訂版(臺北市:中國

圖書館學會,民國84 年)。

註27:Anne J. Gilliland-Swetland, "Defining Metadata, " In Murtha Baca, ed. Introduction to Metadata: Pathways to Digital Information (Los Angeles: Getty Research

Institute,1998),1-8.

註28:同註 25。

註29:同註 25。

註30:ALCTS Taskforce on Meta Access. Midwinter 1996 Meeting Minutes. <http://www.lib.virginia.edu/alcts/about/min196.htm>

註31:同註 25。

註32:Lynch, Clifford. "The Dublin Core Descriptive Metadata Program: Strategic Implications for Libraries and Networked Information Access,"

<http://www.arl.org/newsltr/196/dublin.html> 註33:陳嵩榮、陳昭珍,「XML/RDF Metadata 模式之發展與實作」,華文書目資料庫合 作發展研討會(臺北市:國家圖書館、漢學研究中心主辦,民國88 年 8 月 30 日 至9 月 1 日)。 註34:同註 7。 註35:同註 7。

註36:Alan Morrison, Michael Popham & Karen Wikander. "Creating and Documenting Electronic Texts: A Guide to Good Practice,"

<http://ota.ahds.ac.uk/documents/creating/>

註37:同註 2。

註38:Hickey, Thomas B., Childress, Eric and Watson, Bradley C. "The genesis and development of CORC as an OCLC Office of Research project," OCLC Newsletter 239 (May/June 1999): 28-31

(16)

參考文獻

相關文件

Step 1: With reference to the purpose and the rhetorical structure of the review genre (Stage 3), design a graphic organiser for the major sections and sub-sections of your

Then they work in groups of four to design a questionnaire on diets and eating habits based on the information they have collected from the internet and in Part A, and with

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

This paper presents (i) a review of item selection algorithms from Robbins–Monro to Fred Lord; (ii) the establishment of a large sample foundation for Fred Lord’s maximum

Optim. Humes, The symmetric eigenvalue complementarity problem, Math. Rohn, An algorithm for solving the absolute value equation, Eletron. Seeger and Torki, On eigenvalues induced by

Master Taixu has always thought of Buddhist arts as important, the need to protect Buddhist arts, and using different forms of method to propagate the Buddha's teachings.. However,

The difference resulted from the co- existence of two kinds of words in Buddhist scriptures a foreign words in which di- syllabic words are dominant, and most of them are the

To complete the “plumbing” of associating our vertex data with variables in our shader programs, you need to tell WebGL where in our buffer object to find the vertex data, and