• 沒有找到結果。

中文網路書目資源轉換為圖書館書目格式的可行性初探

N/A
N/A
Protected

Academic year: 2022

Share "中文網路書目資源轉換為圖書館書目格式的可行性初探"

Copied!
22
0
0

加載中.... (立即查看全文)

全文

(1)

中文網路書目資源轉換為圖書館書目 格式的可行性初探

許 靜 芬

本研究從使用者需求及強化目錄角度探討如何在避免重複建檔的前提下,圖書 館採用網路書目資源的可行性。研析的重點包括:使用者的書目資訊需求、中文網 路書目資源內容特色、網路書目資訊轉換為現行圖書館書目格式的可行性等議題。

從研究結果得知使用者普遍對目次、摘要等書目加值資訊有所需求,但圖書館以現 有人力難以自建書目加值資訊。由於出版界在出版物產製、銷售階段,已編製內容 相關的加值資訊,而資料格式轉換問題應可運用現今技術獲得解決,因此,建議圖 書館考量邀集圖書出版業者共同商討資源共享協作方案。

一、   前 言

(一)研究背景

圖書館目錄不僅是館藏管理及資訊服務的基礎,也是傳承人類知識文化產出 的重要紀錄。網路興起之前,圖書館目錄是查詢各類型出版品的主要書目訊息來

摘 要

關鍵詞(Keywords)﹕書目再利用;書目控制;網路資源共享 許靜芬:國家圖書館書目中心編輯;E-mail:tacoma@ncl.edu.tw

(2)

源。但在網路書店及搜書引擎(如:Findbook、好讀書等出版資訊網路機制)盛 行的今日,使用者逐漸轉向各種網路資源尋求出版資訊。儘管這些網路機制的書 目服務最終目的是產品銷售,但不可諱言,這些機制提供使用者許多圖書館目錄 至今仍欠缺的書目資訊及功能。圖書館系統前端查詢功能隨著資訊技術日益改進 的同時,作為資訊服務後盾的書目架構及內容,在更新調整上卻相對緩慢。

美國國會圖書館召集的書目控制的未來工作小組(The Future of Bibliographic Control Workgroup),在2008年公布的研究報告中指出,在書目世界中,圖書館 不是書目資源的唯一生產者,在出版品創作、製作、經銷等各個環節都可能產生 與書目相關的資訊,圖書館應設法將這些現成的資訊納入其目錄中,以減少重複 建立相同資訊耗費的資源。[1] 在圖書館編目人力無法隨館藏增長的情況下,這項 呼籲獲得各地圖書館界的迴響。

圖書館運用網路資訊技術或標準進行跨界資源共享的實作,在歐美已有諸如 以ONIX標準介接出版社書目資料的前例,但在國內出版界並未採用相關國際標準 或擬定共通交換格式,在書目資料建置作業上,目前仍處於各自建檔的情況。而 圖書館為了增加書目加值資訊,編目員如果行有餘力,且可在網路查到現成的加 值書目資料,大多以轉貼網路資料於書目紀錄的摘要、目次等相關欄位,讓使用 者可在查到書目紀錄時,同時獲得與出版品內容相關的訊息。

目前國內圖書館界及出版社在各自建置書目資源過程中,存在許多重複作業 的問題,其中最明顯的是描述性書目資料之重複建檔。但出版界除了提供出版品 的基本描述性書目資料外,卻也掌握了圖書館難以直接取得的加值資訊,例如:

內容簡介、目次、書摘等出版品內容相關資料。這些加值資訊能讓使用者初步了 解出版品內容,是網路書店或蒐書引擎成功的主要原因之一。圖書館具備資料組 織分析的專業能力,若能經由跨界資源共建共享,以避免重複作業為前提,在圖 書館目錄中引進網路中有價值的書目資訊,將有助活化圖書館現有目錄。達成這 個目標的過程事涉多端,本報告將就資源交流面涉及的議題進行初步探討。

(二)研究目的

圖書館目錄建置除了庫存管理之外,最終目的還是為了提供館藏利用指引,

長遠來看,目錄建置更應考量如何永續保存有價值的資訊內容。網路資訊技術改

[1]  Working Group on the Future of Bibliographic Control,“On the Record: Report of the Library of Congress Working Group on the Future of Bibliographic Control,"(January 9, 2008),Retrieved May 21, 2009, from http://www.loc.gov/bibliographic-future/news/lcwg-ontherecord-jan08-final.pdf.

(3)

變了資訊需求程度及獲取途徑,在圖書館目錄逐漸式微的今日,館員應積極瞭解 現行圖書館及網路資源書目內容的優勢及劣勢,以提升目錄建置及利用效能。

書目控制的環境仍不斷在改變,圖書館編目作業及產出也必須有相對的因應 作法。希望經由下列議題的探討結果,提供館員省思的參考:

1. 瞭解使用者的資訊需求與現行目錄內容的落差

從不同的目錄使用目的,了解一般使用者對於書目資訊內容的需求,以及現 行圖書館目錄與資訊需求的落差,並探討現行目錄編製的因應措施及限制。

2. 探討中文網路書目資源內容特色及優勢

網路書店及搜書引擎已成為使用者查詢書目資訊不可或缺的資源,即便是圖 書館員也時常需要利用這些資源。探討這些資源的內容特色,及資源建置者提供 資訊服務的模式,作為現行圖書館目錄改善之對照參考。

3. 探討網路書目資訊轉換為現行書目格式之可行性

比較各種網路書目紀錄的項目,歸納網路書目的內容要項,再將這些內容項 目對應到現行書目機讀格式欄位,以了解資料相容的程度。另外,探討資料轉換 可能衍生的相關問題。

4. 探討圖書館書目納入網路資源的途徑及問題

基於避免重複作業人力及資源浪費的考量,若要將中文書目網路資源納入圖 書館目錄,應盡可能從書目源頭做起。書目源頭從圖書館角度來看,應是預行編 目資料(以下簡稱CIP);若從網路資源來看,書目的源頭則是出版社或網路書 店,圖書館與出版界進行資料交流在國內仍相當有限,除了前項探討的資料格式 轉換問題之外,也會有市場利益、版權問題等待商榷的問題。

5. 探討圖書館現行書目紀錄對出版品內容的著錄情形

分析目前圖書館對書目機讀格式與出版品內容相關欄位的應用情形,以及不 同欄位或著錄方式的優缺點和可能衍生的問題。

(三)研究方法

本研究是以探討如何納入現有網路書目相關資訊,以精進國家圖書館(以下 簡稱「國圖」)的書目資料內容的實際作法為目的。由於國家圖書館的各書目資料 庫的使用對象涵蓋各類型使用者,因此,本研究以探討一般使用者需求為研究取 向,先從近年使用者檢索研究相關文獻瞭解一般使用需求,再透過從相關資料庫篩 選出的書目樣例,進行達成前述各項研究目的之分析比較,採用的研究方法如下:

1. 文獻分析

(4)

經由相關文獻的蒐集與閱讀,以瞭解使用者對於書目檢索結果的需求。近年 來國內外圖資界對於圖書館線上公用目錄查詢介面及書目紀錄內容等相關課題研 究成果,有助瞭解本研究蒐集從使用者觀點提出的資訊需求,以便設定後續資料 蒐集和分析範圍,作為規劃設計符合使用需求的書目改進方案之依據。

2. 內容比較法

選擇臺灣地區10個較具規模的網路書店,另選取全國新書資訊網2011年某月 份完成的預行編目(ISBN/CIP)書目檔,將該檔案中的書目紀錄,逐一在網路書 店及NBINet資料庫中查詢,分析該批書目在網路書店及在圖書館公用目錄的查獲 率,並探討這些中文網路書目資源的內容種類,以及網站經營者提供資訊服務的 模式。

3. 資料格式對應分析

進行網路書店書目內容項目與現行書目機讀格式CMARC、MARC21之對應,

將兩方互通的項目進行比較分類,以初步了解探討網路資料與機讀書目資料轉換 的程度,並探討實際進行資料交換時,對於格式互通需要進行補強的可行方案。

分析NBINet中所有中文書目紀錄針對出版品內容相關資訊,著錄於機讀格式欄位 的分佈情形,作為調整編目作業以深化書目紀錄之規劃參考。

(四)研究範圍

本研究篩選特定中文機讀書目紀錄與相對應的網路書目資料為樣本,進行兩 者內容格式之比較,並以本館NBINet的書目為著錄內容分佈探討之樣本,研究範 圍說明如下:

1. 圖書館中文書目紀錄樣本

由國際標準書號中心提供今年8月編製完成的2,613筆預行編目紀錄所含的 3,162個ISBN號碼,在NBINet聯合目錄中查獲合作館完成編目的517筆書目紀錄

(其中含CMARC及MARC21格式紀錄),以此為與網路資源對照的圖書館書目之 樣本。

2. 中文網路書目資源樣本

選取10個較普遍使用的網路書店或搜書引擎,依據前項取得的圖書館書目樣 本,獲取從各網路機制查得的書目資料內容樣本,作為分析內容種類之依據。網 路書店則分別選擇本身無出版品的通路書店(如:博客來),以及本身為出版社 的網路書店(如:聯經),以了解兩類書店的書目資料內容是否因經營面向不同 而有所差異。

(5)

3. NBINet中文書目紀錄樣本

篩選NBINet中包含目次、摘要(含CMARC欄位327或330、MARC21欄位505 或520)、資源連結(含CMARC或MARC21欄位856)等相關欄位的書目紀錄,作 為探討MARC書目紀錄中,著錄出版品內容相關資訊的欄位應用及分佈之書目資 料樣本。

二、   文獻探討

各種網路探索機制盛行之後,圖書館目錄使用者逐漸轉向探索機制進行多層 次資源檢索—從封面、書目、目次、摘要、篇章以至全文及影像,數位時代的網 路資訊技術將這些原本以實體保存於圖書館的資源,轉換成虛擬檔案在網際網路 公開或有限制的傳佈。在技術到位且持續突飛猛進的時代,圖書館目錄也應超越 基本的庫存功能,強化內容建置的彈性以及與外部資源整合的效能,以符合數位 世代使用者需求。

本章將從文獻探討現代使用者對圖書館書目資訊內容的需求和期許,瞭解現 行目錄待改進之處,再從書目控制的環境變遷及趨勢,尋求充實目錄內容以符合 資訊需求的可能性。

(一)使用者對目錄加值資訊的需求

多年來圖書館界對圖書館目錄的服務方式及效能有諸多討論,網路書店興起 後,檢視網路書店提供的目錄資訊,也可幫助圖書館從另一個角度了解使用者對 目錄內容的需求。

2001年藍文欽分析讀者如何使用圖書館目錄指出,書名、著者、標題及出版 日期,是讀者較常用到的項目。作品語文是讀者用來篩選圖書的重要因素。索書 號對一般使用者無法發揮辨識圖書內容的功能,而是用以指示館藏位置為主。讀 者希望目錄能提供更多能幫助辨識和選擇圖書的內容分析註、解題或摘要,而書 名、摘要、及索引詞彙等具指示內容作用的欄位,是讀者認為最有用的項目。[2]

2001年林珊如以亞馬遜網路書店為例分析書籍網站資訊組織架構及介面設計 提及,標準國際書號、大小、版次、出版社等項目雖為圖書館或大宗採購者需要 的資料,但對一般購書者不是最重要的資訊。依據使用者瀏覽網站動機的分析結

[2]  藍文欽,〈讀者如何使用圖書館目錄所提供的書目資訊〉,載於:盧荷生教授七秩榮慶論文

集編委會編,《盧荷生教授七秩榮慶論文集》(臺北:文史哲,2001.6),頁236。

(6)

果,提供封底文案、內容敘述、目次、大要、作者介紹、內容節錄等對書籍越詳 細的描述,越能幫助使用者判斷,而主題編輯群和其他顧客的評論,皆是刺激閱 讀或是否購買該書的依據。[3]

與使用者需求最直接相關的就是書目紀錄提供的資訊內容。2008年Jia Mi和 Cathy Weng在分析圖書館公用目錄的問題時指出,缺乏加值資訊是圖書館目錄的 問題之一,除了出版品的封面影像之外,使用者也期望能提供目次、摘要等內文 資訊,此功能不僅能運用於圖書,也可延伸運用於文獻檢索。[4] 2010年張慧銖以 大學生為對象的加值資訊(如:封面、書目、目次、內容簡介等)需求研究顯 示,雖然使用者對不同類別的出版品的加值資訊需求程度不一,但整體而言希望 每一種出版品的書目都有加值資訊,以讓使用者對判斷及選擇有信心。[5]

由上述不同時期文獻研究結果顯示,透過目錄查詢、判斷、選擇所需資料的 過程中,使用者的共同需求是以書目的基本敘述項目(如:書名、作者)為資訊 搜尋的切入點,但與資料內容相關的目次、摘要、內容節錄等資訊,才是影響資 料選取的判斷依據。

(二)書目控制生態鏈的資源再利用

各類型資料在創作、編輯、印製等產製過程中,各個流程的處理者或多或少 會產生書目相關資訊,誠如2002年林珊如在研究資訊服務網路行銷一文中所言,

圖書館或檔案資料館之營運同是以供應知識產品為目的,並試圖提供網路線上資 訊服務以促進產品之流通,圖書資訊界在推動數位圖書館或建置網頁的同時,亟 待對網路行銷的問題尋求解答。[6]

2004年張天立在分享網路書店經驗一文指出,網路書店可以扮演好資訊平 台,滿足讀者對不同書籍的好奇心,並隨時提供最新、最充分的資訊。博客來集 合眾多的小眾而成最大眾,充分利用規模經濟與資訊複製,而吸引讀者主要原因 包括:節省時間、分類與檢索比書店精緻完整。就博客來而言,願意考量如何為

[3]  林珊如,〈書籍網站資訊組織架構與瀏覽介面設計的考量—以亞馬遜網路書店為例〉,《大

學圖書館》,5卷1期(2001.3),頁20-21。

[4]  Jia Mi, Cathy Weng,“Revitalizing the Library OPAC: Interface, Searching and Display Challenges,"

Information Technology and Libraries (March. 2008), p.10.

[5]  張慧銖,〈書目加值對目錄使用者辨識與選擇行為影響之研究〉,《圖書資訊學研究》5:1

2010.4),頁17。

[6]  林珊如,〈資訊服務網路行銷之考量—以亞馬遜網路書店為例〉,《檔案季刊》,1:3

(2002.9),頁26。

(7)

圖書館創造書目加值資訊,也建議圖書館在繁多的業務下,思考如何在有限時間 內做有效而非重複的事。[7]

2008年書目控制未來的研究報告中指出,書目控制並非圖書館的專屬職責,

圖書館將成為書目控制大環境中的一個環節。數位時代的書目世界裡包括了一般 出版品、圖書館授權使用的資料、網路公開使用的數位資料等等,這些性質相異 的資料經由不同的描述及處理程序,再分別提供讀者使用。但唯有在一致的書目 控制體系下提供使用這些資料,讀者才能享有更好的書目服務。[8]

2009年IFLA的「國家書目指南工作組」(Working Group on Guidelines for National Bibliographies)在其研究報告中指出,圖書館和出版行業的代理機構雖 在出版物整個生命週期的各階段產生描述性詮釋資料,但因圖書館和出版界對書 目資訊的需求和規範不同,以致在使用和傳布這些詮釋資料時有所困難。[9] 大英 圖書館2007年回應書目控制的未來報告中表示,非常同意運用書目生態鏈各項書 目資源,以其過去25年成功編製CIP並提供英國出版界使用的經驗,這些詮釋資料 已經是大英圖書館在提供服務上的核心資料。[10]

(三)圖書館目錄的跨界交流

2010年Bradford Lee Eden在探討新的使用者環境一文中認為,圖書館在人力 逐漸吃緊的趨勢下,應重新思考書目資訊組織方式,未來在書目編製上,將利用 更多來自出版界的資訊,批次資料更新模式將更為普及,編目員需了解更多樣的 詮釋資料,各類型詮釋資料將趨向於分散建置。[11]

2009年Judy Luther為NISO及OCLC,針對詮釋資料在出版物產製傳布環境中 之串流,研擬的一份白皮書中指出,使用者所需書目資訊的詮釋資料元件,可透 過共通資料傳輸格式(如:ONIX),以便讓書目資訊在圖書館與出版社間進行傳

[7]  張天立,〈網路時代的汽機與挑戰:網路書店的經驗分享〉,《國立成功大學圖書館館

刊》,13(2004.6),頁1-6。

[8]  同註1,p.10。

[9]  国家书目指南工作组,〈数字时代的国家书目:指南和新方向〉,(2009),Retrieved March 9, 2010, from http://www.ifla.org/files/bibliography/national_bibliographies_in_the_digital_age-zh.pdf.

[10] Caroline Brazier,“Report on the Future of Bibliographic Control: British library response to the

Library of Congress Working Group on the Future fo Bibliographic Control,"(December 13, 2007).

Retrieved November 11, 2011, from http://www.bl.uk/bibliographic/pdfs/bl_response_lcwgfbc%28fin al%29.pdf.

[11] Bradford Lee Eden,“The New User Environment: the End of Technical Services?”, Information

Technology and Libraries (June. 2010), pp.94-97.

(8)

輸。但因不同規模的出版社對同一傳輸格式的繁簡型式需求不同,跨界詮釋資料 互通需要進行資訊流程重整,並建立資料交換格式規範、著錄原則、品管機制,

並開發資料交換所需系統,才能確保書目資訊流動之順暢。[12]

在美國國會圖書館的合作編目計畫(Program for Cooperative Cataloging)公 布於2012年2月修訂的「2012年策略方向及實施」文件中強調,PCC將促進不同圖 資社群產生的詮釋資料之再利用,並將擴大引導詮釋資料使用社群(包括:圖書 館、資訊界及出版界),建立詮釋資料建置相關標準,並鼓勵無償的資料交流,

以提升不同詮釋資料間的互通性,以便對使用者資源探索有所助益。[13]

2011年在陳和琴主持的研究計畫報告中指出,出版社所建書目詮釋資料是以 商業用途為導向,與圖書館所建書目詮釋資料以讀者使用服務為導向的目標有所 差異。加上各出版社的資料庫格式不盡相同,在缺乏使用共同標準格式下,使得 圖書館與出版社在電子書的書目資訊交換上困難重重。ONIX主要在克服大型出版 業不同格式豐富產品資訊的挑戰,其目標在於產品資訊傳輸的標準化,提供XML 平台讓批發商、零售商及其他在供應鏈的業者能夠以電子方式接受ONIX傳送而來 的資訊。國內出版社皆未採用ONIX格式,或是對ONIX瞭解不多,或是並不了解 ONIX。倒是OPDS在國內出版界有些知名度。[14]

三、   研究問題與執行方法

(一)研究問題

目錄查詢系統及書目資料是圖書館書目服務的兩項主要資產,自動化系統近 年來不斷研發新的公用目錄查詢功能,試圖讓目錄查詢更契合數位資訊時代的使 用習慣,提供多面向的查詢結果分析,讓使用者能更快速的獲取相關書目訊息。

但在系統後端的書目內容上,增長或改變的幅度卻遠不及網路書店或搜書引擎建 立的書目資源。要重新找回使用者對圖書館目錄的需求,就必須了解網路書目資

[12] Judy Luther, “Streamlining Book Metadata Workflow," (June 30, 2009), Retrieved October 4, 2010,

from http://www.niso.org/publications/white_papers/StreamlineBookMetadataWorkflowWhitePaper.

pdf.

[13] “ PCC Strategic Directions and Actions through 2012,"(February 2, 2012), Retrieved March 11,

2012, from http://www.loc.gov/catdir/pcc/PCC-Strat-Dir-Actions.doc.

[14] 陳和琴計畫主持、劉昌柏計畫參與,「數位出版品國家型永久典藏計畫 數位出版品法定送存

相關議題整合研究-電子書書目格式轉換之研究」(臺北:行政院國家科學委員會補助專題研 究計畫,2011.5.16),頁13。

(9)

源提供了何種能吸引使用者的訊息,圖書館能透過哪些途徑深化書目內容。本報 告研究的議題如下:

1. 探討網路書店書目具備哪些圖書館書目紀錄欠缺的內容

圖書館採用的機讀格式相當嚴謹,從識別段、代碼資料段、著錄段、附註 段、連接款目段、相關題名段、主題分析段、著者段等,在格式設計上已顧及目 錄用以檢索、辨識、選擇的三大功能,亦可運用連接款目進行相關作品的連接。

相較於機讀格式的嚴謹與完備,網路書店或搜書引擎的書目格式簡單許多,

但卻另有與作品內容相關且相當完整的封面、目次、摘要等內容,能進一步引領 使用者一窺出版品的內容。了解網路機制提供的資訊服務,將有助於提供未來規 劃合作方向或提升書目內容實用度的參考依據。

2. 探討網路書目內容與圖書館書目相容的問題

圖書館的書目著錄需要遵循嚴謹的編目規則,部分檢索項目理論上應該要進 行權威控制,資料庫後端對相關欄位之間亦有既定的連接規則。反觀網路書目資 源,除了各家之間著錄方式不同之外,自家書目紀錄對於名稱或語彙並無嚴謹的 著錄規則。

圖書館既要維持原有書目建置架構及規範,但又需要著錄規則不一的網路資 源來充實書目的情況下,在規劃資料匯入或交換時,必須考量如何處理著錄內容 格式化的問題。

3. 探討目前圖書館編目採用網路資源的方式及問題

圖書館員了解提供出版品內容對使用者的重要,因此,部分書目紀錄已包 含目次或摘要,但這些內容在網路興起前,必須由編目人員依據待編資料以人工 逐字輸入;網路資源增長後,則可將查獲的資料轉貼於書目紀錄中,不論何種方 式,在實務操作上仍然相當耗費時間精力。

除了轉貼網路資訊之外,MARC21的書目欄位856,也可用於記載制式資源標 識符(Uniform Resource Identifier,縮寫為URI,包括:URL、URN等),以超連 結方式開啟相關網路書目資料所在的網頁或電子檔。這種作法雖然是目前對圖書 館書目格式及編目作業影響最少的做法,但網路資源變動性大,位址一旦更改或 資源遭移除,書目紀錄中記載的URI也就無效。即便自動化系統目前大多有偵測 欄位856的連結網址有效性的功能,並能產生錯誤網址報表,但館員卻無力再回頭 進行網址維護。如何以最經濟且穩定的方式將網路資源納入圖書館目錄,也需多 方考量。

(10)

4. 合作對象與資源授權使用相關問題

網路書目建置者包括通路、出版社、搜書引擎等類型,各家經營網站的方式 與目的雖有相同及相異之處,但基本上都是營利事業,且掌握了出版品書目相關 的重要資源。公務機關如何與民間營利單位合作,並取得合法授權使用的資源,

也有許多有待審慎考量的問題。

(二)執行方法

本研究分析網路書目資源的特色,及其與圖書館現行書目紀錄格式與內容之 異同。並採集NBINet聯合目錄書目紀錄樣本,分析書目加值內容分佈及著錄情 形。各項樣本收集及處理方式說明如下:

1. 資料取樣

由於網路書目資源是本研究主要探討項目,而網路書目資源最顯著的是其書 目加值內容,因此,書目樣本的蒐集也以含與出版品內容相關的記載為必備篩選 條件。

(1)網路書目資源樣本網站

選定10家筆者較常使用的網路書目資源網站,作為書目資源樣本採集來源,

這些網站涵蓋網路書店、出版社、搜書引擎等三類型網站建置單位,其中網路書 店4家:博客來、金石堂、誠品、遠流博識網;出版社5家為三民、時報文化、天 下文化、聯經文化、城邦讀書花園;搜書引擎1家:Findbook。

(2)書目樣本1-用於書目格式內容對照

為了在有限的時間內進行可執行範圍的書目內容對照,先選取本館國際標準 書號中心2011年8月份匯出的預行編目(ISBN/CIP)書目紀錄中的3,162個ISBN,

以這些紀錄的ISBN或書名,分別在樣本網站及NBINet資料庫中查詢,再從查獲的 書目紀錄中,排除CIP紀錄及重複書目紀錄,篩選出NBINet合作館完成編目的不 重複紀錄計517筆,以這些紀錄作為查詢相對應網路書目資源的依據。

(3)書目樣本2-用於分析圖書館書目內容著錄分佈

以CMARC包含欄位327或330,或MARC21包含欄位505或520的中文書目 為篩選條件,從NBINet聯合目錄資料庫篩選出CMARC紀錄130,810筆,以及 MARC21紀錄68,142筆,做為現行書目加值內容整體著錄情形分析的樣本。此 外,再從NBINet篩選出有欄位856,且欄位856包含「封面」、「目次」或「全 文」字樣,另外也必須有ISBN號碼的正式出版品計8,817筆,這批書目樣本將用來 評估運用連結功能串連網路資源的效能。

(11)

2. 採用工具

本研究中的資料分析所應用的工具如下:

(1)以本館自行開發之MARC書目批次處理程式進行特定書目篩選。

(2)以Millennium系統的篩選功能選取相關聯合目錄資料樣本。

(3)以MarcEdit 5.0進行以ISBN查詢下載NBINet書目樣本。

(4)採用Excel進行網站及書目資料之儲存及檢視。

3. 資料內容分析

(1)網路書目資源的紀錄欄位與機讀欄位對應

將10種網路書目資源網站樣本所含的書目紀錄欄位,分別與圖書館書目的機 讀欄位進行對應,分析網路書目紀錄的現有欄位,與機讀書目欄位對應的共通與差 異情形,並將網站資源之間、網站資源與機讀書目的欄位對應結果如表一及表二。

表一:網路書目資源內容與機讀書目內容比較1

(12)

表二:網路書目資源內容與機讀書目內容比較2

(2)與書目樣本1相關的網路書目資源

依據書目樣本1取得的CMARC及MARC21紀錄,以紀錄中的ISBN或書名,於 樣本網站進行查詢,只要能在任一樣本網站查得相關書目,即視該項出版品可查 獲相關網路書目資料。各筆書目的查詢結果樣例如表三:

(13)

表三:書目樣本1在網路書店通路查詢結果及統計樣例

(3)書目樣本1之圖書館書目及網路書目內容對照

從書目樣本1中篩選出含CMARC欄位327或330的書目紀錄26筆,另篩選出含 MARC21欄位505或520的書目紀錄11筆。析出這37筆紀錄排除重複出版品所得的 35筆紀錄,在35種出版品中選取4種出版品樣本,將從NBINet及網路書店查到的 書目紀錄內容進行對照檢視。

(4)書目樣本2之紀錄類型分析

以書目樣本2為母體,分析CMARC及MARC21紀錄中,以機讀格式紀錄標示

(14)

位址第6的「記錄類型」的值,將樣本分為「印刷文字資料」、非「印刷文字資 料」兩區塊,再計算各區書目紀錄中同時有目次及摘要欄位、只有目次或摘要其 一欄位的紀錄數量。

四、   研究結果

由前章各種樣本進行檢視分析後,從小範圍樣本的內容欄位對照檢視,針對 網路書目資源內容及特色、資料查獲率,以及網路資源與圖書館現行書目資料的 比較,獲得兩者相互對照的初步結果。另外,再以NBINet聯合目錄中文書目紀 錄為樣本篩選母體,分析圖書館現有書目加值資訊普遍的著錄方式及內容分佈情 形。各項研究結果說明如下:

(一)網路書目資源樣本網站大同小異

依據網站樣本分析結果初步得知,各網站提供前端顯示的書目紀錄內容大同 小異,記錄中的欄位定義大致相同,但各家之間有欄位多寡的差異。在本次取樣 的10個網站中,通路書店與出版社經營的網路書店呈現的紀錄欄位較多,加值內 容也較完整,搜書引擎的書目紀錄欄位較少,但提供從「比價」功能中,超連結 到各通路或網路書店,可間接獲取更詳細的書目紀錄。

(二)從匯入網路書目資源角度進行內容對照分析

如果考量運用現成的網路書目資料,從網路書目紀錄對應MARC的角度分 析,獲得下列幾項結果:

1. 無法對應MARC專屬欄位的網路書目內容

經過書目樣本1與網路書目資源的對照分析,明顯看出網路書目紀錄的欄位比 起MARC書目紀錄精簡許多,但仍有無法直接對應到專屬MARC欄位的項目,包 括:EAN、開數、重量、印刷方式(黑白/彩色)、內文、序、書摘等項目,但是 這些欄位可對應至定義相近的MARC欄位,例如:將「開數」記載於「裝訂或其 他區別字樣」,其他無相近欄位的資料,則可轉入一般註或定義相關的附註。

2. 部分定義相同的欄位的著錄規則不同

從書目樣本1抽樣4種出版品,分別在NBINet及3家網路書店查到的內容進行 對照,顯示部分能對應的項目,記載的內容形式有所差異,例如:網路書目紀錄 記載的出版日期形式有「2011/9/1」、「2011年9月1日」等形式,而MARC書目紀 錄著錄形式較一致,但有民國及西元兩種方式。

(15)

(三)從圖書館書目格式規定的角度檢視內容對照結果

機讀格式欄位的代碼資料段(CMARC欄位1XX、MARC21 006-008)的各資 料項,在網路書目紀錄幾乎皆無對應項目。由於圖書館系統在轉入MARC格式紀 錄時,應有基本的欄位檢核,代碼資料段通常會是被檢核的項目之一。

如果考量運用現成的網路書目資料,而網路書目紀錄又無這些MARC必備的 欄位時,如果沒有額外的前置資料處理(例如:必備欄位缺漏時,由程式批次帶 入預設值),圖書館系統將無法接受網路書目紀錄匯入。否則,另一種處理方式 是進行各別處理程序,將網路資源以不同於ISO2709書目的方式轉入。

(四)圖書館編目作業現行引進網路書目資料情況分析

書目樣本1的出版品中,517種樣本書目有492種可在至少一種樣本網站查到相 關書目資訊,查獲率超過95%以上(查詢結果樣例見附錄二),並且都有與內容 相關的書目加值資訊。顯示新近出版且有ISBN號碼的出版品通常可查找到相關的 網路書目資源,包括基本書目資料及多寡不一的書目加值資訊。

從書目樣本2的NBINet資料庫書目篩結果而言,可大致看出圖書館編目員運 用現有書目機讀格式欄位,著錄與出版品內容相關的加值資訊的方式,若再進一 步區分為直接著錄內容及只著錄資源連結網址兩種模式,所得結果如下:

1. 直接輸入加值內容

編目人員依據手邊的待編資料或網路查到的書目加值資訊,將加值內容以人 工直接輸入或轉貼於書目機讀格式的目次及摘要等相關欄位(CMARC欄位327及 330、MARC21欄位505及520),此方式的記錄數量分佈如表四:

表四:NBINet書目之目次或摘要相關欄位運用統計

表四統計顯示:(1)由於CMARC中文書目數量畢竟高於MARC21中文書目 量,因此含目次或摘要的數量相對也較高;(2)在所有含目次或摘要欄位的書目 紀錄中,同時含目次及摘要的比例相當低;(3)印刷文字資料書目含有目次或摘 要的紀錄高過非印刷文字資料書目。

(16)

這些含加值資訊的書目紀錄中,部分紀錄從網路轉貼的摘要內容並不完整,

一部分原因是為了避免超過ISO 2709規定的每筆記錄總長度限制,另一原因可能 是顧及內容版權因素。

2. 著錄網路資源超連結

書目樣本2中篩選出NBINet資料庫中,書目紀錄的欄位856包含「封面」、

「目次」或「全文」字樣,且同一筆紀錄中也具備ISBN號碼的記錄總計8,817筆,

這些紀錄中總計有16,937個超連結。在這些超連結中,以程式檢查出無效的URL 計有1,721個(詳見表五),新舊紀錄皆有無效URL的情形,失效原因以位址改變 或找不到URL的因素居多。

表五:檢核NBINet書目含內容相關URL檢核統計

抽樣檢視上述篩選出的書目,大致可得知直接輸入目次內容的書目紀錄最早 約從1994年開始,其中有目次者也包括未正式出版的研究計畫書等灰色文獻。而 書目樣本2的記錄中,絕大多數的資料建置日期是在2005年之後,與中文網路書店 及通路陸續建置,增加網路資源取得的便利性應有關係。此外,由於MARC格式

(17)

的目次內容為連續文字或以分欄分隔,與網站提供的資料格式並不相同,若要轉 貼目次,編目人員必須要花費相當多的時間與心力於調整資料格式。

五、    結論與建議

圖書館目錄歷經數個世紀的演進,從最初的手寫目錄以至現今的線上目錄,

在數位時代的今日,圖書館作業與網路及資訊技術結合的結果,讓目錄的發展更 形多樣化。各個時期的目錄型式與內容相互影響,而在資訊技術的推波助瀾之 下,進而擴大了目錄建置方式及內容展現的發展空間。

克特(Charles A. Cutter)在十九世紀揭示目錄必須具備檢索、辨識和選擇 三大功能,圖書館目錄已達到這三大基本功能,但數位時代的使用者受到網路蓬 勃發展的影響,對於「內容」的需求與時俱進。使用者在獲知出版品的基本資訊 後,下一步自然而然對內容有所期待,而網路書店實現了讀者的夢想,圖書館對 目錄內容的提升應有所省思。

(一)研究結論

本研究經由中文網路資源與NBINet資料庫的取樣相互比較,以及對NBINet書 目紀錄之加值內容檢視,獲得下列幾項結論:

1. 網路書目雖精簡卻兼具深入的內容資訊

經由中文網路資源樣本分析得知各家網站對市面流通的出版品書目掌握比率 相當高,網路書目紀錄的欄位精簡,但記錄內容能達到基本的檢索、辨識、選擇 的功能。網路資源最大的特色在於其提供與出版品內容相關的加值資訊,例如:

封面、目次、序文、內容簡介、書摘等等,並充分提供採購所需資訊,這些是圖 書館現行目錄無法穩定且有效掌握的訊息。

2. 網路書目與圖書館書目內容重複性高

網路書店在Amazon崛起後,儼然建立了另一座書目寶庫,臺灣地區的網路 書店亦在1990年代末開始蓬勃發展,多年來也累積了相當可觀的書目資源。圖書 館與網路書店的功能雖然不同,但都擁有為數可觀的書目資料。從本次研究中大 致看出網路資源和圖書館書目的基本資訊重疊性相當高,而這些資料在編製過程 中,因目前各自格式或建置規範不同,以致重疊資訊再利用的程度不高,也意味 著人力進行重複作業的浪費。

3. 中文網路書目轉換圖書館書目存在著錄規則問題

圖書館目前普遍採用MARC建立書目紀錄,本次中文網路書目樣本分析得知

(18)

大多數網路書目紀錄欄位皆可對應至現有MARC欄位,欄位對應大致可行,惟部 分定義相通的欄位,在圖書館編目規則對著錄方式有嚴謹的規定,但網路書目紀 錄並無一致的規定。出版社書目格式及著錄不支援圖書館界的編目規則,即便是 國外使用多年的ONIX,也存在不支援英美編目規則AACR2的問題。[15] 另外,在 日期、代碼等著錄形式上,兩種書目也有所差異。

4. 圖書館納入網路書目資源須考量MARC/ISO2709格式限制

若要納入網路書店提供的書目紀錄,依照目前圖書館系統功能,匯入的資料 格式必須是MARC/ISO 2709格式。而ISO 2709標準對於單筆書目紀錄及紀錄中的 單一欄位皆有長度限制。由於網路書店有關出版品內容的資訊相當豐富,若將網 站登載的長篇內容轉入MARC書目紀錄相關欄位,須設法解決圖書館書目紀錄長 度限制的問題。

5. 網路書目資源恐有日久流失的遺憾

從圖書館多年來利用欄位856進行網路資源連結的情形來看,中文書目網路 資源和其他諸多網站資源一樣,都有無法永續保存的潛在問題。現行在網路書店 提供的書目資料,基本作用仍是為了產品銷售,一旦產品停止銷售或隨著時間流 逝,書目資料恐有流失的遺憾。圖書館目錄建置並無營利考量,站在保存有價值 資訊的觀點,更應積極考量收錄網路書目資源於圖書館目錄中。

(二)研究建議

圖書館與網路通路或書店的本質不同,但在書目控制的生態中都扮演重要 的角色。在繁體中文書目資源相當有限的時代,若能進行跨界中文書目資源共建 共享,不僅能省卻圖資社群重複作業的整體耗費,對圖書館而言,可大幅提升目 錄內容的深度,對網路業者來說,也可藉由圖書館目錄轉介,開拓潛在的經濟效 益。

基於上述研究結果,對於建立跨界資源轉換利用有下列幾點建議:

1. 尋求加強網路資源連結之穩定性

網路資源連結是資源共享的途徑之一,但由於儲存的伺服器或位址更動的可 能性極高,不僅影響服務效能,也增加資源建置人員維護異動情形的人力成本,

因此,建議圖資界應共同尋求強化資源連結技術,以提升共享資源的效益。

2. 關注資源共建共享的品質

[15] 同註[14],頁43。

(19)

跨界合作關係因涉及各自領域的需求及作業原則,需要雙方協調才能達成共 識,尤其是不同格式資料之轉換合作。如果採取匯入網路書目資料的方式,但又 顧及不影響原來進行的權威作業,可考量暫時僅針對不牽涉權威作業規範的書目 加值資料進行匯入。但長遠來看,權威控制是書目控制的重要一環,而少數圖書 館又無法全面負擔的情況下,建議也應在討論圖資社群資源共享時,須要針對權 威及書目內容品質控制有所共識。

3. 關注圖書館書目紀錄格式架構的演變發展

MARC在數位時代的圖書館書目建置有其不可及之處,美國國會圖書館於今 年10月31日公布了因應數位時代擬訂新書目架構之計畫 [16],在了解中文網路書 目資源建置架構的同時,亦須關注國際編目相關規範的發展,以從中尋求突破 MARC限制的資料建置轉圜空間。然而,國內出版界有其行之多年、相異於國外 的建檔格式,圖書館在力求遵循相關國際規範的同時,若為了推動國內出版資訊 之再利用,亦需考量研擬與在地出版界進行資料共享的格式轉換機制。

4. 使用出版加值資訊的授權問題

中文書目網路資源中,與出版品內容相關的加值資訊,主要還是來自創作者 或出版社,圖書館再利用這些資訊勢必涉及相關授權議題,圖資界在討論資源共 建共享時,應尋求加值資訊產製源頭協商資訊授權使用問題,並適時邀集出版品 產製過程的各個參與者共同建立長期合作的機制。

 參考文獻

“PCC Strategic Directions and Actions through 2012,"(February 2, 2012), Retrieved March 11, 2012, from http://www.loc.gov/catdir/pcc/PCC-Strat-Dir-Actions.doc.

Bradford Lee Eden,“The New User Environment: the End of Technical Services?”, Information Technology and Libraries (June. 2010), pp.93-100.

Caroline Brazier,“Report on the Future of Bibliographic Control: British library response to the Library of Congress Working Group on the Future fo Bibliographic Control,"(December 13, 2007), Retrieved November 11, 2011, from http://www.bl.uk/bibliographic/pdfs/bl_resp onse_lcwgfbc%28final%29.pdf.

Jia Mi, Cathy Weng,“Revitalizing the Library OPAC: Interface, Searching and Display Challenges,"Information Technology and Libraries (March. 2008), pp.5-22.

[16] Library of Cogress, (2011).“A Bibliographic Framework for the Digital Age,"Retrieved November

12, 2011, from http://www.loc.gov/marc/transition/news/framework-103111.html.

(20)

Judy Luther,“Streamlining Book Metadata Workflow,"(June 30, 2009), Retrieved October 4, 2010, from http://www.niso.org/publications/white_papers/StreamlineBookMetadataWorkfl owWhitePaper.pdf.

Karen Calhoun,“The Changing Nature of Catalog and its Integration with Other Discovery Tool. Final Report,"(March 17, 2006), Retrieved March 11, 2011, from http://www.loc.

gov/catdir/calhoun-report-final.pdf.

Library of Cogress, (2011).“A Bibliographic Framework for the Digital Age,"Retrieved November 12, 2011, from http://www.loc.gov/marc/transition/news/framework-103111.

html.

Library of Congress,“ONIX Project,"Retrieved March 26, 2012, from http://www.loc.gov/

publish/cip/topics/onixpro.html.

Working Group on the Future of Bibliographic Control,“On the Record: Report of the Library of Congress Working Group on the Future of Bibliographic Control,"(January 9, 2008), Retrieved May 21, 2009, from http://www.loc.gov/bibliographic-future/news/lcwg- ontherecord-jan08-final.pdf.

林珊如。〈書籍網站資訊組織架構與瀏覽介面設計的考量—以亞馬遜網路書店為例〉,

《大學圖書館》,5卷1期(2001.3),頁16-32。

林珊如。〈資訊服務網路行銷之考量—以亞馬遜網路書店為例〉,《檔案季刊》,1:3

(2002.9),頁26-35。

張天立。〈網路時代的契機與挑戰:網路書店的經驗分享〉,《國立成功大學圖書館館 刊》,13(2004.6),頁1-6。

張慧銖。〈書目加值對目錄使用者辨識與選擇行為影響之研究〉,《圖書資訊學研究》

5:1(2010.4),頁1-22。

陳和琴計畫主持、劉昌柏計畫參與,「數位出版品國家型永久典藏計畫 數位出版品法定送

存相關議題整合研究-電子書書目格式轉換之研究」(臺北:行政院國家科學委員會

補助專題研究計畫,2011.5.16)。

藍文欽。〈讀者如何使用圖書館目錄所提供的書目資訊〉,載於:盧荷生教授七秩榮慶

論文集編委會編,《盧荷生教授七秩榮慶論文集》(臺北:文史哲,2001.6),頁

215-250。

國家書目指南工作組,〈數位時代的國家書目:指南和新方向〉,(2009)Retrieved March 9, 2010, from http://www.ifla.org/files/bibliography/national_bibliographies_in_the_

digital_age-zh.pdf.

(21)

Abstract

Study on Reusing Chinese Web Resource for Library Catalog

Hsu Ching-fen

This study evalutes the possible ways of reusing web resources for library catalog without duplicate cataloging based on user needs and enhancing catalog. The issues examined include user need for bibliographic information, characteristics of Chinese online bibliographic resources, the possibilities of format conversion between web resource and MARC format. The study concludes that users do need content-related bibliographic information such as table of contents or summary which can not be included in library's routine cataloging due to limited human resource. In order to reuse the content-related information generated by publishers or distributers, the study suggests that libraries should collaborate with publishers in sharing online bibliographic resources.

Keywords(關鍵詞)﹕reusing bibliographic data; bibliographic control; online resource sharing Yu-lin Cheng : Editor, Bibliographic Information Center, National Central Library; E-mail: tacoma@ncl.

edu.tw

(22)

參考文獻

相關文件

In particular, we present a linear-time algorithm for the k-tuple total domination problem for graphs in which each block is a clique, a cycle or a complete bipartite graph,

( Buddhism Goes to the Movies: Introduction to Buddhist Thought and

Building on the strengths of students and considering their future learning needs, plan for a Junior Secondary English Language curriculum to gear students towards the

Other than exploring the feasibility of introducing a salary scale for KG teachers, we also reviewed the implementation of the Scheme in different areas including funding

This is to inform kindergartens and primary schools of the “Library Cards for All School Children” scheme and the arrangement of bulk application for library cards of the

We explicitly saw the dimensional reason for the occurrence of the magnetic catalysis on the basis of the scaling argument. However, the precise form of gap depends

Comparison of B2 auto with B2 150 x B1 100 constrains signal frequency dependence, independent of foreground projections If dust, expect little cross-correlation. If

• elearning pilot scheme (Four True Light Schools): WIFI construction, iPad procurement, elearning school visit and teacher training, English starts the elearning lesson.. 2012 •