中國機讀編目格式與 MARC 21 欄位對照研析:
以定長欄為例
鄭 玉 玲 牛 惠 曼 許 令 華
摘 要
本文首先介紹CMARC3與MARC 21各自的機讀格式轉換發展概況,其次分別 敘述CMARC3及MARC 21在定長欄部份(包括紀錄標示和資料代碼欄)的架構分布 及特色,接著依CMARC3之欄位順序,逐欄比較CMARC3及MARC 21之定長欄內 容,並依資料類型舉例說明。最後將定長欄特殊之轉換情形(如連續性出版品、兼 具多種類型資源)加以釐清。CMARC3和MARC 21在定長欄的架構和使用上有很 大的差異。MARC 21的定長欄在著錄前,須先決定待編文獻的資料類型,再依據資 料類型填入資料內容代碼。CMARC3則可視資料類型需要,同時選用多個資料代碼 欄。近年來,MARC 21因應新編目規範進行相關的修訂,中國機讀編目格式如何順 應全媒體需求加以調整,也是值得關心的議題。
關鍵詞(Keywords)︰ 中國機讀編目格式;美國機讀編目格式;機讀編目格式轉換;定長欄 CMARC3;MARC 21;MARC Conversion;Fixed Fields
鄭玉玲:國家圖書館編目組編輯;E-mail: [email protected] 牛惠曼:國家圖書館編目組助理編輯;E-mail: [email protected] 許令華:國家圖書館編目組編輯;E-mail: [email protected]
一、 前 言
圖 書 館 自 動 化 的 發 展 從 獨 立 模 組 作 業 功 能 到 整 合 性 自 動 化 系 統 , 從 單 一 圖 書館的服務到網路的合作編目,從書目層級的服務到目次內文的服務。在這個資 源組織的脈絡中,機讀編目格式是最常被使用來進行資料交換和書目建置的基本 架構。處於今日資訊傳播共享的趨勢中,各種機讀編目格式及詮釋資料的對應整 合,成為現今書目服務系統重要的課題。國內圖書館使用中國機讀編目格式第三 版(以下簡稱CMARC3)已久,但近年深入研究CMARC3與MARC 21之間對照 的相關研究並不多,因而筆者擬從實際編訂CMARC3轉MARC 21對照表之過程 中 , 比 較 兩 種 機 讀 格 式 的 異 同 , 並 歸 納 轉 換 時 必 須 處 理 的 議 題 , 以 供 圖 資 界 使 用,進而加速國內書目國際化的腳步。
針對兩種機讀編目格式欄位對照研析,可分別從機讀編目格式轉換發展、定 長欄、變長欄、以及代碼與指標等項目進行比較。若從CMARC3對應至MARC 21,CMARC3共計3,548項(定長欄1,588項,變長欄1,565項,附錄395項),
可 對 應 至MARC 21者共計為3,315項(定長欄1,531項,變長欄1,398項,附錄 395項),對應率為93.4%。由於篇幅限制,本文擬先以機讀編目格式轉換發 展及定長欄為例進行研析,從欄位及分欄之層次,分別敘述CMARC3及MARC 2 1 在 定 長 欄 部 分 ( 包 括 紀 錄 標 示 及 資 料 代 碼 欄 ) 的 架 構 分 布 及 特 色 , 進 而 依 CMARC3之欄位順序,逐欄比較CMARC3及MARC 21之定長欄內容,並依資料 類 型 舉 例 說 明 。 此 外 , 並 將 特 殊 之 轉 換 情 形 ( 如 連 續 性 資 源 、 兼 具 多 種 類 型 資 源……)加以釐清。至於變長欄及代碼與指標等內容的比較,將另文說明。
本文主要對照範圍為中國機讀編目格式第三版以及MARC 21自1999年至今 公 布 於 官 方 網 站 的 標 準 格 式 及 修 訂 內 容 , 另 參 考 國 際 電 腦 圖 書 館 中 心 (Online Computer Library Center,簡稱OCLC)公布於其網站的書目著錄相關規定
“Bibliographic Formats and Standards”,同時參考教育部出版的《中國機讀 編 目 格 式 轉 至 美 國 機 讀 編 目 格 式 對 照 表 》 , 以 及 美 國 國 會 圖 書 館 (Library of Congress)公布的“UNIMARC to MARC 21 Conversion Specifications”。
二、 機讀格式對照轉換發展之比較
轉換作業是機讀編目格式在現今網路資訊環境中,重要的求存之道。機讀格 式的轉換則牽涉到機讀格式與機讀格式、機讀格式與標示語言、機讀格式與詮釋
資料轉換等議題。
(一) CMARC3的轉換概況 1.CMARC3與機讀格式的轉換
早期國內不同機讀格式轉換需求源自於西文抄錄編目的需要,目的是為了節 省西文圖書資料編目的時間,近年則在於中文書目國際化的理念,期望臺灣的出 版品與書目資源也能躍上國際舞臺。
民國82年起,中國圖書館學會圖書館自動化規畫委員會與教育部有關單位協 洽後,擬訂並提出「中國機讀編目格式與美國機讀編目格式互轉計畫」,並於同 年12月完成《中國機讀編目格式第三版轉至美國機讀編目格式對照表》,此為國 內機讀編目格式轉換之肇始。
民 國94年國家圖書館著手規畫CMARC3與MARC 21對照表,隨後並依據 該對照表開發「CMARC3轉MARC 21轉換程式」,該程式除了MARC格式轉換 外 , 尚 包 括 拼 音 及 字 碼 轉 換 , 且 經OCLC上傳測試。所有經過反覆測試的轉換 規 則 , 最 終 也 反 應 在 該 對 照 表 中 , 並 寫 入 轉 換 程 式 內 , 以 確 保 轉 換 後 之 資 料 進 行書目國際化之可行性。《中國機讀編目格式第三版轉MARC 21 Bibliographic Format對照表》於民國98年3月正式付梓。
2.CMARC3與標示語言的轉換
民 國9 0 年 吳 政 叡 教 授 即 針 對 中 國 機 讀 編 目 格 式 第 三 版 之 文 件 格 式 定 義
(Document Type Definition,簡稱DTD)進行研究[1];民國92年林信成教授建 構以XML與中國機讀編目格式簡篇為基礎的編目模組。[2]國家圖書館於民國93年 開 始著手進行 中國機讀編目 格式轉換XML語法之任務。計畫內容包括研訂「中 文文件格式定義(CMARC DTD)」,進行包含ISO 2709與XML兩種資料格式 及BIG-5、CCCII與Unicode三種不同字碼互轉的「CMARC3-XML轉換程式」開 發工作,是項轉換程式於同年10月底完成開發,且透過線上註冊方式提供免費下 載與離線使用。[3]
[1] 吳政叡,〈中國機讀編目格式第三版XML之DTD草案〉,《圖書館學刊》,30(2001.6),頁 38-62。
[2] 楊翔淳、林信成,〈以XML與CMARC簡篇為基礎之編目模組設計〉,《圖書與資訊學刊》,
47(2003.11),頁42-58。
[3] 李莉茜、黃莉玲、牛惠曼,〈從ISO 2709到XML:國家圖書館CMARC3 ─ XML轉換程式介 紹〉,載於:胡歐蘭教授七秩榮慶籌備小組編著,《21世紀數位圖書館發展趨勢》(臺北:文 華,2005),頁183-184。
3.CMARC3與詮釋資料的轉換
民 國87年[4]及89年[5]吳 政 叡 教 授 曾 為 都 柏 林 核 心 集 (Dublin Core,簡稱 DC)與中國機讀編目格式對照發表研究。國家圖書館於民國97年完成CMARC3 與 都 柏林 核 心集 之 對 應 , 利 用此 對照 將 館 藏資 料 庫之CMARC3書目紀錄轉換整 合至該館之數位多元查詢系統中。
(二) MARC 21的轉換概況 1.MARC 21與機讀格式的轉換
美 國 國 會 圖 書 館 是 世 界 上 第 一 個 進 行 機 讀 編 目 格 式 轉 換 的 圖 書 館 。1 9 8 0 年 代 該 館 完 成U S M A R C 轉 換 至 U N I M A R C 的 對 照 工 作 , 2 0 0 1 年 該 館 再 公 布
“UNIMARC to MARC 21 Conversion Specifications”第三版。[6]
2.MARC 21與標示語言的轉換
從1 9 9 0 年 代 起 , 美 國 國 會 圖 書 館 網 路 發 展 與 機 讀 編 目 標 準 辦 公 室 ( L C Network Development and MARC Standards Office)開始進行MARC DTDs
(Machine Readable Cataloging Document Type Definition)計畫,目的在於 建構一個標準的SGML DTD,以供書目資料從MARC架構轉換成SGML語法。[7]
美國史丹佛大學醫學中心(Stanford University Medical Center)的Lane醫學圖 書館(Lane Medical Library)發表XMLMARC軟體。[8]2002年美國國會圖書館 於網路上提供MARCXML對照功能[9],使得MARC 21書目紀錄得以轉成XML語 法,方便網路傳輸與資源共享。
3.MARC 21與詮釋資料的轉換
從2001年美國國會圖書館發表“Dublin Core/MARC/GILS CrossWalk”成
[4] 吳政叡,〈中國機讀編目格式(第三版)到都柏林核心集對照表〉,《圖書館學刊》,29
(2000.6),頁26-39。
[5] 吳政叡,〈都柏林核心集到中國機讀編目格式的轉換對照表〉,《中國圖書館學會會報》,60 期(1998.6),頁61-73。
[6] “UNIMARC to MARC 21 Conversion Specifications,” Retrieved March 11, 2010, from http://
www.loc.gov/marc/unimarctomarc21.html.
[7] “MARCXML: MARC 21 XML Schema,” Retrieved March 20, 2009, from http://www.loc.gov/
standards/marcxml.
[8] 余顯強,〈應用延伸標示語言與圖書館機讀格式轉換之研究〉,載於:《2004年現代資訊組織 與檢索研討會論文集》(臺北:教育部,1994),頁32。
[9] IFLA-CDNL Alliance for Bibliographic Standards, “ICABS Activity Report August 2006-February 2008,” Retrieved March 20, 2009, from http://archive.ifla.org/VI/7/annual/ICABS-Report02-2008.
pdf.
果以來,該館已完成一連串MARC 21和詮釋資料的對照計畫,包括:MARC 21 與 MODS、Dublin Core 與 MARC 21、Digital Geospatial Metadata 與MARC、
GILS、ONIX 對 MARC 21、UNIMARC 對 MARC 21、MARC Character Sets 對 USC/Unicode。
三、 定長欄 ─ 記錄標示的比較
根據中國機讀編目格式對於定長欄的定義係指「長度固定之欄,每一欄可包 括一個或數個資料單元,欄內之資料單元或分欄,不論其變化如何,欄之長度不 變」。[10]定長欄是機讀編目格式中最繁瑣的部分,這可以從定長欄幾乎佔了機讀 編目格式超過三分之一以上的篇幅而窺知。定長欄內容雖是許多代碼的集合體,
不易一眼就辨識該代碼所代表的意義,然而由於編目時,必須完全根據規定代碼 來選擇著錄,資料長度及內容一致性高,非常有利於電腦系統的運作。因此,定 長欄的資料內容常是電腦系統進行資料篩選及書目資料控制之關鍵項目。
CMARC3與MARC 21之紀錄標示長度均為24位,項目名稱也大致相同。
不 過 著 錄 內 容 和 代 碼 有 些 許 差 異 , 每 個 代 碼 含 括 的 範 圍 也 不 盡 相 同 。 以 下 試 依 CMARC3位址順序,比較兩者之間紀錄標示內容之差異,如表一。
表一:CMARC3與MARC 21之紀錄標示比較
CMARC3 相對應之MARC 21
說 明
位址 名 稱 位址 名 稱
0-4 紀錄長度 00-04 Record length 均佔5位,由程式自動產生
5 紀錄性質 05 Record status CMARC3和MARC 21各有5
個代碼,其中4個代碼意義相
同。
6 紀錄類型 06 Type of record 縮 影 資 料 、 善 本 書 、 拓 片
在MARC 21無特定對應代 碼。
7 書目性質 07 Bibliographic level CMARC3有4個代碼,MARC 21有7個代碼。
[10] 國立中央圖書館中國機讀編目格式修訂小組編撰,《中國機讀編目格式》3版(臺北:國立中 央圖書館,1989),頁3。
CMARC3 相對應之MARC 21
說 明
位址 名 稱 位址 名 稱
8 層次等級 19 Linked record requirement 兩者之涵義稍有不同。
9 未定,以空格表示 09 Character coding scheme 原C M A R C 3 資 料 不 處 理。MARC 21此位址之資料 由CMARC之100/26-29轉入。
10 指標長度 10 Indicator count 內容值均為「2」
11 分欄識別長度 11 Subfield code count 內容值均為「2」
12-16 資料基位 12-16 Base address of data 均佔5位,由程式自動產生。
17 著錄依據 17 Encoding level CMARC3分為4層;MARC 21
分為10層。
18 著錄格式
18 Descriptive cataloging form 說明是否依據ISBD之格式 著 錄 。C M A R C3有3個代 碼;MARC 21有4個代碼,以
「a = AACR2」代表該記錄符 合AACR2之規定。
19 未定,以空格表示 MARC 21位址8補空格
20 欄長位數 20 Length of the Length-of-field
portion 內容值均為「4」。
21 首字位址 21 Length of the starting-character-
position portion 內容值均為「5」。
22 執行定義部分長度 22 Length of the implementation-
defined portion 內容值均為「0」。
23 未定,以空格表示 23 Undefined
茲就CMARC3和MARC 21兩者「紀錄標示」差異較明顯之部分加以說明如 下:
(一)記錄性質(紀錄標示/05)
CMARC3和MARC 21各有5個代碼,其中4個代碼意義相同。CMARC3「o = 有較高層次之記錄」與MARC 21「a = Increase in encoding level」不同。
(二)記錄類型(紀錄標示/06)
CMARC3除了縮影資料「h」、善本書「r」、拓片「u」之外,其他類型資 料大致都有相對應之MARC 21代碼。兩者代碼定義範圍不盡相同。
1.微縮資料
微縮資料在CMARC3以代碼「h」表示,在MARC 21無特定代碼。MARC 21的處理方式是將微縮資料依據微縮原件的內容,分散在各種資料類型代碼。例 如微縮形式的文字資料,在MARC 21以「a = Language material」表示。若為微 縮形式的樂譜,則以「c = Notated music」表示,另於欄位008/29和007說明微 縮特性。
2.善本、拓片
緣 於 善 本 拓 片 為 中 國 文 化 中 特 色 之 文 物 , 所 以 在CMARC3分別以「r」和
「u」代碼代表此兩種紀錄類型,MARC 21中並無特別代碼表示善本或拓片。
3.電子資源
在CMARC3中以「l =電腦檔」表示,且對於各種型態的電子資源並無特 殊 規 定 ( 例 如 電 子 型 態 的 地 圖 資 料 、 電 子 期 刊 …… ) ;MARC 21對於「m = computer file」代碼的定義較為嚴謹,規定只有下列4種資料可以使用此代碼:
電腦軟體(包括:程式、遊戲、字型)
數字資料
電腦驅動之多媒體 線上系統或服務
至於其他型態之電子資源則依其最重要的型態(如:文字資料、圖片、地圖 資料等)選用其他代碼。
4.連續性資源
「連續性」是一種出版的形式,無論是CMARC3或MARC 21,連續性資源 都不被列為是一種紀錄類型,因此連續性的特性不在紀錄標示/06註記,而在紀 錄標示/07著錄。亦即連續出版的各種類型文獻,紀錄標示/06著錄其資料類型,
紀錄標示/07著錄其連續性特性。例如連續出版的紙本期刊,紀錄標示/06內容著 錄為「a」,紀錄標示/07內容著錄為「s」。
(三)書目性質(紀錄標示/07)
MARC 21比CMARC3多3個代碼。CMARC3以「a = 分析款目」做為處 理 期 刊 中 之 論 文 專 欄 、 會 議 記 錄 之 某 篇 論 文 、 圖 書 之 一 章 、 唱 片 之 一 首 曲 子 等。MARC 21則將分析款目直接分為「a = Monographic part」和「b = Serial component part」。MARC 21以代碼「i」做為整合資源的代碼,CMARC3僅 以代碼「s」表示連續性出版品,顯然已經不足以說明線上資料庫及網頁等整合
資 源 之 特 性 。MARC 21以代碼「d = Subunit」說明該資料為合集或檔案的一 部 分,此 為CMARC3所未特別提及的。網路時代的來臨,MARC 21的代碼「 d
= Subunit」似乎更能符合國際編目原則聲明所揭櫫資訊服務的範圍應擴及圖書 館、博物館、檔案館等之理念。
(四)層次等級(紀錄標示/08)
CMARC3以4個代碼說明紀錄間有無從屬關係或紀錄之等級;MARC 21則以 2個代碼區別連接欄位76X-78X中是否有足夠的資料以產生附註,來辨識相關的 紀錄。兩者之涵義稍有不同。
(五)著錄依據(紀錄標示/17)
此 位 址 係 說 明 紀 錄 的 完 整 程 度 , 《 中 國 編 目 規 則 》 將 書 目 資 料 的 著 錄 依 其 詳 簡 分 為 簡 略 、 標 準 及 詳 細 三 種 著 錄 層 次 。 在 機 讀 編 目 格 式 中 也 有 類 似 的 項 目 來表示該筆書目紀錄的完整程度。CMARC3僅分4級,MARC 21則分為10級。
為 了 達 到 書 目 紀 錄 的 品 質 控 制 和 服 務 升 級 , 書 目 紀 錄 的 確 需 要 較 完 整 詳 盡 的 分 級 制 度 。OCLC和全國圖書書目資訊網(National Bibliographic Information Network,簡稱NBINet)也針對書目資料的詳簡區分做了特殊的規定。
1.CMARC3和MARC 21對於著錄詳簡程度的規定
CMARC3和MARC 21都是以1位代碼說明書目紀錄完整程度。兩者對於著錄 依據之比較如表二。
表二:CMARC3與MARC 21之著錄依據(紀錄標示/17)比較
CMARC3 相對應的MARC 21 備註
=完整著錄 = Full 均代表書目依待編文獻本身著錄,且內容完
整
1 =次完整著錄 1 = Full, material not examined 1. 兩者均於回溯建檔時使用。非依資料本身 著錄。
2. MARC 21代碼2除表示非依資料本身著錄 外,檢索標目亦未再查核更新
2 = Less-than-full level
2 =出版前著錄 8 = Prepublication level
3 =不完整著錄 5 = Partial(preliminary)level MARC 21表示可能再增補
7 = Minimal level MARC 21表示不再增補,標目經過權威控制 3 = Abbreviated level MARC 21表示不符合Minimal level的簡編資
料,但標目是合法的。
4 = Core level MARC 21表示符合核心記錄標準,介於Minimal level和Less-than-full level之間
u = Unknown z = Not applicable
2.OCLC對於著錄詳簡程度的規定
OCLC對於著錄依據(Leader/17)有其特殊的規定:OCLC在書目著錄詳簡 程度有較別於MARC 21的特殊規定,亦即只有美國、英國、加拿大、澳大利亞 之 國 家 圖 書 館 、 美 國 醫 學 圖 書 館 及 參 加 幾 個 合 作 編 目 計 畫 , ( 如 書 目 合 作 計 畫
(Bibliographic Record Cooperative Program,簡稱BIBCO)、叢刊合作計畫
(Cooperative Online Serials,簡稱CONSER))的圖書館可用「 」和1~8的 數字,且需於欄位042註記審核機構代碼。一般其他成員館可以採用:[11]
I = Full-level 4 = Core-level K = Less-than-full
L = Full-level (batchload) M = Less-than-full (batchload) 3.NBINet對於著錄詳簡程度的規定
CMARC3的「著錄依據」無法完全反應出書目紀錄欄位資料完整程度,以 及標目是否經過權威控制等狀況。「NBINet合作編目推動小組」於2008年出版 的書目資料處理原則中,將各館書目區分為下列4級,各館仍依機讀編目格式及 編目規則自行記載「紀錄標示/17」之著錄依據,書目中心收到合作館書目資料 後,再依該檢核標準予以區別,並於欄位042(暫定)進行級別註記。[12]
國家級書目 ─ 符合完整級書目且經權威控制者
完整級書目 ─ 具備各類型核心書目紀錄欄位且含標題、類號者 核心級書目 ─ 具備各類型核心書目紀錄欄位者
簡略級書目 ─ 較核心級書目簡略,但符合中國機讀編目格式附錄簡篇 (六)著錄格式(紀錄標示/18)
說明資料是否依據ISBD之格式著錄。基本上,CMARC3和MARC 21兩種代 碼內容相似,但MARC 21有一代碼「a = AACR2」代表該記錄符合AACR2之規 定。
[11] OCLC, “ELVL Encoding Level,” Retrieved September 10, 2009, from http://www.oclc.org/
bibformats/en/fixedfield/elvl.shtm.
[12] 國家圖書館NBINet合作編目推動小組,《NBINet合作編目書目資料處理原則》(臺北:國家 圖書館,2008),頁13-14。
四、 定長欄 ─ 資料代碼欄之比較
資 料 代 碼 欄 是 機 讀 格 式 中 以 固 定 長 度 的 資 料 內 容 值 , 說 明 該 文 獻 之 出 版 情 況、性質代碼、語文、國別及各種類型資料的特性等之欄位。
(一) CMARC3資料代碼欄簡介
CMARC3主要以1XX代碼資料段著錄長度固定之資料。1XX段各欄位有指 標、有分欄,除了欄位101、122、123外,其他欄位大部分欄位指標未定,以空 格表示。欄位分布依序為:
100 一般性資料 101 作品語文 102 出版國別
105 資料代碼欄:圖書、善本書 106 資料代碼欄:文字資料形式特性 110 資料代碼欄:連續性出版品
115 資料代碼欄:投影資料、錄影資料、影片 120 資料代碼欄:地圖資料 ─ 一般性 121 資料代碼欄:地圖資料形式及特性 122 資料代碼欄:作品涵蓋時間
123 資料代碼欄:地圖資料 ─ 比例尺與座標 124 資料代碼欄:地圖資料 ─ 特殊資料類型 125 資料代碼欄:樂譜資料與非音樂性錄音資料 126 資料代碼欄:錄音資料形式特性
127 資料代碼欄:錄音資料播放或樂譜演奏之時間 128 資料代碼欄:音樂演奏作品
129 資料代碼欄:拓片
130 資料代碼欄:縮影資料形式特性 131 資料代碼欄:大地、網格、垂直測量 135 資料代碼欄:電腦檔
中國機讀編目格式以欄位100著錄一般性資料代碼,固定長度35位。內容包 括:輸入日期(8位)、出版情況(1位)、出版年(8位)、適用對象(3位)、
政府出版品代碼(1位)、修正紀錄代碼(1位)、編目語文(3位)、音譯代碼
(1位)、字集(4位)、附加字集(4位)、題名語文代碼(1位)。欄位100為 必備欄,各種資料類型的在編文獻,均須著錄此欄位之代碼。
(二) MARC 21之資料代碼欄簡介
MARC 21代碼欄部分主要以欄位006(定長欄資料代碼 ─ 附加資料)、
007(定長欄資料代碼 ─ 稽核細節)、008(定長欄資料代碼)來表示,各欄 位無指標、無分欄。
1.欄位008(定長欄資料代碼)
欄 位008為主要之代碼欄,欄長佔40位(位址0-39),其中位址00-17 及 35-39為所有資料類型均需著錄的內容。包括:輸入日期(6位)、出版情況(1 位)、出版年(8位)、出版國別(3位)、編目語言(3位)、修正紀錄代碼(1 位)、書目來源代碼(1位)。
位址18-34分為七種資料類型加以定義,每一種資料類型的位址18-34,均依 其資料特性而著錄代表不同意義之資料,亦即同樣是使用欄位008,位置雖然相 同,但是所代表的內容意義卻截然不同。
008 - Books
008 - Computer files 008 - Maps
008 - Music
008 - Continuing resources 008 - Visual materials 008 - Mixed materials
也 就 是M A R C 2 1 的 欄 位 0 0 8 有 非 常 明 顯 的 排 他 性 , 著 錄 前 必 須 先 決 定 待 編 文 獻 的 資 料 類 型 , 再 依 該 類 型 填 入008/18-34每個位址所代表之資料內容代 碼 。此種作法 和CMARC3以不同欄位表示各種資料類型的代碼相異。比如說,
CMARC3圖書資料的代碼欄為欄位105,電腦檔的代碼欄為欄位135,使用上並 沒有嚴格的排他性,亦即沒有嚴格限制用了欄位105不可以再使用欄位135。
若以程式處理機讀編目格式轉換時,MARC 21欄位008位址/18-34的資料類 型可依Leader 06與07之內容代碼加以判斷,詳見表三。
表三:MARC 21欄位008/18-34資料類型判斷依據
Leader/06與/07 欄位008/18-34資料類型
(1) Leader/06 = a 且 Leader/07 = a or c or d or m
(2) Leader/06 = t Books
Leader/06 = m Computer files
Leader/06 = e or f Maps
Leader/06 = c or d or i or j Music
Leader/06 = a且Leader/07 = b or i or s Continuing resources
Leader/06 = g or k or o or r Visual materials
Leader/06 = p Mixed materials
2.欄位006(定長欄資料代碼 ─ 附加資料)
在MARC 21中,對於具有多重類型的待編文獻,除了以Leader和欄位008 紀錄主要資料特性外,另以欄位006紀錄其第二種之資料特性(例如文字資料附 帶錄音帶附件、連續出版的地圖資料)。電子出版品在Leader若不是使用「m - Computer file」而採用其他類型代碼時,也可以用欄位006著錄電腦資料相關特 性。
欄 位006的長度為18位(位址00-17),和欄位008的資料類型區分方式相 同。同樣分為下列幾種資料類型,欄位006的位址01-17與MARC 21欄位008位址 18-34內容代碼互相對應。
006 - Books
006 - Computer files 006 - Maps
006 - Music
006 - Continuing resources 006 - Visual materials 006 - Mixed materials
在此要特別注意的是,MARC 21 Leader/06 代碼「m - Computer file」僅 限 於 電 腦 軟 體 ( 程 式 、 遊 戲 、 字 型 ) 、 數 據 資 料 、 以 電 腦 操 控 之 多 媒 體 、 線 上 系 統 及 服 務 。 至 於 兼 具 其 他 類 型 之 電 子 出 版 品 仍 依 該 主 要 類 型 填 寫Leader及欄 位008,而電子出版品之特性則在欄位006表示。CMARC3在這方面並沒有特殊 規定和說明,例如對於一般文字資料的電子資源,紀錄標示可以選用「l =電腦 檔」,並且同時記載欄位105和欄位135,或依MARC 21的選擇標準,紀錄標示 先選用「a = 印刷型式之文字資料」,並且同時記載欄位105和欄位135。
CMARC3處理多重資料類型時同時記載多個資料代碼欄的作法(如欄位105 至欄位135),在資料欲轉換成MARC 21時,需特別留意欄位006、007和008的 轉換方式,方不致於使書目資料在機讀格式轉換後,發生資料類型交叉錯置的情 形。
3.欄位007(稽核細節定長欄)
M A R C 2 1 的 欄 位 0 0 7 「 P h y s i c a l D e s c r i p t i o n F i x e d F i e l d – G e n e r a l Information」著錄與稽核細節(如高廣、規格等)相關的資料代碼,和008、
006一樣地依位址記錄各種資料類型的稽核細節。著錄在欄位007的資料可能是 待編文獻的主體,也可能是主體的附件。欄位007將資料分為15種資料類型。欄 位007/00的資料代碼「Category of material」決定其後跟隨的代碼內容。欄位 007/00的代碼值如下:
007/00 = a(Map)
007/00 = c(Electronic resource)
007/00 = d(Globe)
007/00 = f(Tactile material)
007/00 = g(Projected graphic)
007/00 = h(Microform)
007/00 = k(Nonprojected graphic)
007/00 = m(Motion picture)
007/00 = o(kit)
007/00 = q(Notated music)
007/00 = r(Remote sensing image)
007/00 = s(Sound recording)
007/00 = t(Text)
007/00 = v(Videorecording)
007/00 = z(Unspecified)
(三) CMARC3 與MARC 21資料代碼欄比較
CMARC3 與MARC 21資料代碼欄的對應可從欄位100、101、102、105- 135及多重資料類型等方面加以討論。
1.CMARC3欄位100與MARC 21的對應
CMARC3欄位100大致對應至MARC 21之欄位008(除了字集代碼100/26- 29對應MARC 21 Leader/09、編目語文代碼100/22-24對應MARC 21欄位040$b 之外)。至於CMARC3欄位100/25音譯代碼及欄位100/30-33附加字集在MARC 21並無相對應之內容。
2.CMARC3欄位101與MARC 21的對應
CMARC3欄位101對應到MARC 21可分為兩種情形來討論。倘若CMARC3 欄 位101資料內容只有1個$a時,則將該代碼直接對應至MARC 21欄位008/35- 37;但若CMARC3欄位101資料內容不只1個$a時(亦即有兩個以上$a或還包括 其他分欄時),則將第一個$a對應至MARC 21欄位008/35-37外,另需再將欄位 101之內容全部對應至MARC 21之欄位041。
3.CMARC3欄位102與MARC 21的對應
C M A R C 3 欄 位 1 0 2 對 應 到 M A R C 2 1 也 可 分 為 兩 種 情 況 來 討 論 。 倘 若 CMARC3欄位102只有1個$a,則將該$a之代碼轉入MARC 21欄位008/15-17。
但 若C M A R C 3 欄 位 1 0 2 有 2 個 以 上 $ a , 則 除 了 第 1 個 $ a 對 應 到 M A R C 2 1 欄 位 008/15-17外,需再全部轉換到MARC 21欄位044。由於CMARC3國家代碼採用 ISO 3166-1,而MARC 21之國家代碼採用“MARC Code List for Countries”所 列之代碼, 因此 兩 種格式 代碼轉換時 , 必須根據 代碼 轉 換表, 將CMARC3所使 用之代碼轉換成MARC 21所使用之代碼。筆者將另文討論代碼的轉換問題。
4.CMARC3欄位105-135與MARC 21的對應
使用中國機讀編目格式時,除了著錄欄位「100 一般性資料」、「101作品 語 文 」 、 「102 出版國別」之外,各種類型文獻採用的資料代碼欄及相對應之 MARC 21欄位並列詳見表四。
表四:CMARC3欄位105-135與MARC 21資料代碼欄之對應
資料類型 CMARC3資料代碼欄
(除欄位100外) MARC 21
印刷型式之文字資料 105 008 - Books
手稿型式之文字資料 105 008 - Books
樂 譜 125、127、128 008 - Music
地 圖
120、121、122、123、124 007 - Maps
007 - Remote sensing image 007 - Globe
008 - Maps
034 - Coded cartographic mathematical data045 - Time period of content
動態放映資料 115 007 - Videorecording
007 - Motion picture 008 - Visual materials
縮影資料
106、130 007 - Microform
008 - Books
008 - Continuing resource 008 - Maps
008 - Mixed material 008 - Music 008 - Visual materials 錄音(非音樂性) 125、126、127 007 - Sound recording
008 - Music
錄音(音樂性)
125、126、127、128 007 - Sound recording 008 - Music
047 - Form of musical composition code 048 - Number of musical instruments or voice code
靜畫、圖片、設計圖及 靜態放映資料
115、116 007 - Motion picture 007 - Projected graphic 007 - Nonprojected graphic 007 - Videorecording 008 - Visual materials
電腦檔 135 008 - Computer files
多媒體組件 106 008 - Mixed material
特殊教學資料 依教學資料類型填註各相關欄位 008 - Visual materials
立體藝術品、實物 無 008 - Visual materials
善 本 105 008 - Books
拓 片 129 500 - General Note
5.多重資料類型的對應
上述欄位為單純一種資料類型之著錄方式,倘若該文獻為連續性出版品或兼 具連續出版或多重性質,則依下列方式對應:
(1)印刷形式之連續性出版品
若紀錄標示位址6(紀錄類型)為「a」,且紀錄標示位址7(書目性質)為
「s」,則欄位110轉入MARC 21之欄位008「Continuing Resources」
(2)兼具多重類型之出版品
CMARC3與MARC 21對於兼具多重類型之出版品在資料代碼欄處理方式 不同。CMARC3並未對於欄位105至135間多個欄位同時著錄的優先順序嚴格限 定,因此在CMARC3欄位105至135間進行與MARC 21轉換時,必須留意先判別 主要資料類型。
① 兼具多種類型之連續性出版品
如連續出版的地圖或連續出版的電子資源,紀錄標示位址6(紀錄類型)
非 為 「a」,且紀錄標示位址7(書目性質)為「s」,則欄位110轉入MARC 21之欄位006。
② MARC 21欄位008
MARC 21以相同欄位008提供不同的資料類型使用,在進行資料轉換時,
若在編文獻兼具多重資料類型時,轉換時又該如何決定使用MARC 21何種資 料 類 型 的 欄 位008呢?分析結果建議採用CMARC3紀錄標示位址06(紀錄類 型)及位址07(書目性質)之內容值為判斷欄位008資料類型之依據,並且只 取用欄位105-135間相對應之資料類型定長欄,轉入MARC 21相對應資料代碼 欄,若不在表列清單中之CMARC3資料代碼欄,則不轉換。轉為MARC 21定 長欄後,再依長度自動補齊定長欄空缺的位址,詳見表五。
表五:多重類型轉換時資料代碼欄優先轉換欄位
資料種類 CMARC3 紀錄標示
/06及/07內容值
需轉換CMARC3之資 料代碼欄至MARC 21
之007或008
附註
印刷型式之單本文字資料 a且leader/7 = m 105 印刷型式之連續性出版品 a且leader/7 = s 110
手稿型式之文字資料 b 105
資料種類 CMARC3 紀錄標示 /06及/07內容值
需轉換CMARC3之資 料代碼欄至MARC 21
之007或008
附註
樂譜 c或d 125、127、128 *
地圖 e或f 120、121、122、
123、124
*
動態放映資料 g 115 *
縮影資料 h 130 *
錄音(非音樂性) i 125、126、127 *
錄音(音樂性) j 125、126、127、128 *
靜畫、圖片、設計圖及靜態 放映資料
k 115、116 靜態放映資料通常
只填115;靜畫、圖 片、設計圖、年畫 只填116;*
電腦檔 l 135 *
多媒體組件 m 106 *
特殊教學資料 n 依教學資料類型填註
各相關欄位
*
立體藝術品、實物 p 無 *
善本 r 105 *
拓片 u 129 *
* CMARC3之欄位110轉至MARC 21之欄位006可參考《中國機讀編目格式對照表第三版轉 MARC 21 Bibliographic Format對照表》,頁51-58。[13]
* 若leader/07 = s,則同時將CMARC3之欄位110轉至MARC 21之欄位006。
③ MARC 21欄位007
若在編文獻 兼 具多重類型,CMARC3將會出現多重著錄之資料代碼欄,
這些欄位對應到MARC 21 欄位007時,同樣面臨如何決定欄位007位址00之資 料類型代碼。處理方式可從下列二擇一:
A. 參 考 前 述 只 轉 優 先 轉 換 欄 位 , 並 依 該 欄 位 0 0 8 資 料 類 型 選 用 欄 位 007/00之資料類型,其他次要特性不轉(詳見表五);
B. 參考第一個轉入MARC 21欄位007之CMARC3資料代碼欄(115- 135)之資料類型,以決定MARC 21欄位007位址00之資料類型代碼
[13] 國家圖書館編目組編訂,《中國機讀編目格式對照表第三版轉MARC 21 Bibliographic Format對 照表》(臺北:國家圖書館,2009),頁51-58。
(Category of material),以及後續跟隨之代碼內容,詳見表六。
表六:多重類型轉換時MARC 21欄位007位址00資料類型判斷依據 CMARC資料代碼欄(115-135) MARC 21欄位007位址00之內容值 115位址7內容值為a-k m (motion picture)
g (projected graphic) 115位址7內容值為l-q v (videorecording) 115位址7內容值為r-x g (projected graphic)
116 k (Microform)
120 a (Map)
121 a (Map)
122 a (Map)
123 a (Map)
124 a (Map)
125只有$a q (Notated music)
125只有$b s (Sounding recording)
126 s (Sounding recording)
127 s (Sounding recording)
128 s (Sounding recording)
129 k (Nonprojected graphic)
130 h (Microform)
131 a (Map)
135 c (Electronic resource)
五、 結 論
定長欄是電腦系統進行資料篩選以進行書目控制時的重要關鍵,其著錄時必 須完全根據機讀編目格式規定的代碼,著錄長度亦須一致。CMARC3與MARC 21之間的主要差異之一,即是定長欄的架構非常不同。MARC 21定長欄位有非 常 明 顯 的 排 他 性 , 著 錄 前 必 須 先 決 定 待 編 文 獻 的 資 料 類 型 , 再 依 據 資 料 類 型 填 入資料內容代碼。對於兼具有多重類型的待編文獻,MARC 21除了以Leader和 欄位008記錄主要資料特性外,另以欄位006記錄其第二種資料特性,欄位007則 記 載稽核細節 代碼。而CMARC3以不同欄位表示不同類型資料的資料代碼欄,
但彼此之間並無嚴格的排他性,換言之,多重類型的待編文獻可重複著錄所需的
代碼資料欄,並無主從之分。因此進行CMARC3轉MARC 21時,必須特別留意 CMARC3欄位115-135與MARC 21欄位006-008的對應,且必須配合更細緻的判 斷條件以訂定轉換程序,避免資料間被錯置覆蓋。
就兩種機讀編目格式各自的架構而言,各有其特色,雖然因此造成轉換時的 困難,但無優劣之分。然而就未來的趨勢觀察,其呈現的形式應是益形多元,編 目時是否需先判斷的主體類型,應偏重載體或內容?抑或隨其多元同時並列其代 碼資料?建議兩種MARC的修訂者都應深思,以使新一代的MARC更符合未來資 料的著錄與應用。
就 兩 種 機 讀 編 目 格 式 的 對 照 而 言 , 除 了 本 文 所 述 的 定 長 欄 外 , 變 長 欄 和 指 標代碼部份值得做進一步的對照研析。近來MARC 21也因應〈書目紀錄功能需 求〉(Functional Requirements for Bibliographic Records,簡稱FRBR)和《資 源描述與檢索》(Resource Description and Access,簡稱RDA)的完成,進行 相關的修訂。中國機讀編目格式如何順應網路數位資源及全媒體資訊服務環境的 需求進行相關的變革,也是國內圖書資訊界應該投入關心的議題。
The Research and Analysis of CMARC3 and MARC 21 Bibliographic Format
Mapping:
A Case Study of Fixed Fields
Yu-lin Cheng Hui-man Niu Ling-hua Hsu
Abstract
This article first introduces the general situation of machine readable form conversion, and then compares the contents of leader and datafields of CMARC3 and MARC 21 by material type. Finally, the transformation of the multi-type bibliographic records is discussed. It is concluded that there are many differences between the fixed fields of CMARC3 and MARC 21. When cataloging multi-type materials, catalogers have to decide the data type before using the fixed fields of MARC 21, while CMARC3 allows the users to use multiple fixed fields simultaneously. The revision of CMARC3 for adaption to the new media environment is also suggested.
Keywords(關鍵詞)︰ CMARC3;MARC 21;MARC Conversion;Fixed Fields
中國機讀編目格式;美國機讀編目格式;機讀編目格式轉換;定長欄 Yu-lin Cheng:Editor, Cataloging Division, National Central Library;E-mail: [email protected] Hui-man Niu:Assistant Editor, Cataloging Division, National Central Library;E-mail: nhmtku@ncl.
edu.tw
Ling-hua Hsu:Editor, Cataloging Division, National Central Library;E-mail: [email protected]