• 沒有找到結果。

第二章 文獻探討

第四節 BIBFRAME 轉換相關研究

目前國內就 BIBFRAME 2.0 轉換的探討文獻並不多,本節將概述國外與 BIBFRAME 2.0 相關之研究現況。

一、MARC 21 與 BIBFRAME 2.0 之轉置研究

BIBFRAME 在實際轉換的過程與轉換後的結果仍有許多問題需要解決,Xu 等人(2017)將 MARC 21 映射至 BIBFRAME 2.0 以完整的對照表(Crosswalk)

計畫呈現,使用 MARCEdit 將大約 1000 條 MARCXML 記錄作補強,接著以 Oxygen XML Editor 將這些增補過的 MARC 書目紀錄轉換為 BIBFRAME 2.0 RDF

47

/ XML,並透過 W3C 的 RDF 驗證服務(W3C RDF Validation Service)去驗證選 定的幾條書目記錄。在整個研究當中,關於轉換工具與轉換過程發現了一些問題:

1. 國際碼如果不是使用 NFC 標準則須進行預處理

在 W3C 的 RDF 驗證程序當中,如果處理文件當中包含重音符(grave accent), 會導致系統跳出警示「String not in Unicode Normal C」,因 W3C 的文件當中規 定 國 際 碼 ( Unicode ) 標 準 必 須 使 用 NFC ( Normalization Form Canonical Decomposition, Normal Form C),為了要執行 W3C 的 RDF 驗證,必須先針對國 際碼的 NFC 做預處理,將之正規化。LC 將此做為轉換步驟的一部分,做為必備 的預先處理步驟。

2. 使用 rdf:value 做為 URIs 可能會產生問題

BIBFRAME RDF 管線(pipeline)中的工具會將 rdf:value 裡的 URI 轉換為文 字。在下游處理(down streaming process)過程中,程式會將兩者都標記成文字,

很難去區分混合了文字和 URI 的 rdf:value 兩者之間有何不同。

3. URI 內可能會出現空格

使用像是 Oxygen XML Editor 的工具來運行 XSLT 轉換器可能會為創建 URI

(minted URI)添加空格,例如,在記錄識別碼(record identifier)和「#」字號 加上元素名稱之間經常會多出空格符號。以美國國會圖書館控制號 5226 的書目 為例,「bibframe.example.org/5226#Topic650-22」應是一串完整的 URI,但在

「bibframe.example.org/5226」與「#Topic650-22」就會被空格隔開,造成網址有 問題。

4. URI 查詢匹配欄位不全

48

MARCEdit 等工具可以使用 MARC 指標分欄 0 將從 LC 鏈結資料服務以及 詞彙網站(vocabulary gateways)所匹配到的 URI 批量匯入 MARC 21 的 100、

700 等欄位。但是對於欄位 700 分欄 a 與分欄 t 的 MARCEdit VIAF URI 查詢僅 適用於欄位 700 分欄 a(個人名稱),這會導致 MARC 700 分欄 t(作品題名)

的呈現有缺失。需要修復 MARCEdit VIAF URI 的查詢功能以同時涵蓋作者和作 品題名的 URI。

5. 仍有許多未映射的欄位

從 MARC 欄位 852 轉換到 bf:Item 和 MARC 86X 集叢號(serials)仍然是以 人工轉換或是各館依照需求針對 marc2bibframe2 轉換器進行改寫,LC 所發布的 轉換規範表格只為這些欄位提供部分映射指令。許多機構以這些欄位來儲存他們 的單件資訊,但另外一些機構則選擇使用欄位 XX9、X9X 和 9XX 等本地定義段 來儲存單件資訊。如果機構能夠提供本地單件資訊進行映射的範例,對於 LC 未 來欲將此部分映射與現有的 BIBFRAME 轉換規範與工具相結合將會有很大的幫 助。

此外,規範表格內有許多未映射的欄位,以 nac 或是 ignore 標註之,LC 預 計這些欄位資料將來不會再作使用,但仍然可能存在有特定的機構對象需要這些 欄位的映射,屆時這些機構可能就必須同上述情況一樣,需要自行針對轉換工具 進行改寫。

6. 集叢關係轉換困難

目前的 BIBFRAME 架構不提供將集叢編號(series numbering)與特定集叢 項(series statement)或是識別碼(identifier)產生關連的方法,因此,以多個集 叢發布的實例核心層級將會導致資料混淆(confusing data)。

49

Michael 與 Han(2019)透過設計和執行一種適用於網路目錄應用程式

(cataloging web application)的最低限度的轉換框架——Metadata Maker,探討 由 LC 制定的 MARC 21 轉置為 BIBFRAME 2.0 之轉換規範。在評估過程中,發 現由 LC 轉換規範所導致的三個關鍵結構性問題,包含數據的重複性;RDF/XML 內普遍為空白節點;以及目前 MARC 記錄環境的 URI 上字串資料值的普遍性,

並且針對這三個問題提出各自的本地解決方案。

二、FRBR 與 BIBFRAME 2.0 之轉置研究

Zapounidou 等人(2017)將 FRBR 與 BIBFRAME 2.0 模型進行映射,提出 在不同概念模型之間成功進行映射的關鍵是在欄位映射與資料轉換後,要保留資 源內容的「關係」,使模型與書目家族之間的兼容性得以提升,該研究以一組

《Odyssey》(奧德賽)書目做為範例進行研究,分別針對「作品對應至單一內容 版本(expression)」與「作品對應至多個內容版本(以譯本與改編本為例)」兩 種情況進行探討,欲確認從 FRBR 到 BIBFRAME 2.0 的映射中,是否以及如何 去保留書目內容關係和家族關係。

研究內說明作品對應至單一內容版本,由 FRBR 映射至 BIBFRAME 2.0 的 情況:FRBR 裡的作品與內容版本在語意上被包含在 BIBFRAME 的作品核心當 中(以虛線標註);載體版本(Manifestation)實體映射到 BIBFRAME 2.0 的實 例核心層級,而單件( Item)實體則映射到 BIBFRAME 2.0 單件核心層級

(Zapounidou, Sfakakis, & Papatheodorou, 2017)。如圖 2-17 所示。

50

圖 2-17 作品對應單一內容版本示意圖

資料來源:Zapounidou, S., Sfakakis, M., & Papatheodorou, C. (2017, September).

Preserving Bibliographic Relationships in Mappings from FRBR to BIBFRAME 2.0.

Paper session presented at the 21st International Conference on Theory and Practice of Digital Libraries, Greece. Retrieved from

https://www.semanticscholar.org/paper/Preserving-Bibliographic-Relationships-in-Mappings-Zapounidou-Sfakakis/07cc0d95695645a9500152025bd62b9fb7dcbd7c

在「作品對應至多個內容版本」的情況下,圖 2-18 裡顯示,作品《Odyssey》

對應至兩個內容版本,一個為古文版,另一個是著名的英文譯本,由於 FRBR 的 作品與內容版本一併被簡化至 BIBFRAME 2.0 的作品核心層級,在映射的過程 當中沒有辦法將「兩者擁有共同原始(progenitor)作品」的關係保留下來。研究 結果亦提到,即便可以保留同一書目家族作品之間的關係,但映射後不一定能在 BIBFRAME 當中表示原始作品。圖 2-18 中以點虛線標註 BIBFRAME 2.0 作品

《Odyssey》,以表示跟兩個衍伸作品之間的關聯,它的概念與 Svenonius 所提出 的超作品「superwork」概念類似,且能夠將所有以某種方式所衍伸的 BIBFRAME 2.0 作品聚集在一起(Zapounidou et al., 2017)。

51

圖 2-18 以譯本為例之 FRBR 至 BIBFRAME 2.0 映射示意圖

資料來源:Zapounidou, S., Sfakakis, M., & Papatheodorou, C. (2017, September).

Preserving Bibliographic Relationships in Mappings from FRBR to BIBFRAME 2.0.

Paper session presented at the 21st International Conference on Theory and Practice of Digital Libraries, Greece. Retrieved from

https://www.semanticscholar.org/paper/Preserving-Bibliographic-Relationships-in-Mappings-Zapounidou-Sfakakis/07cc0d95695645a9500152025bd62b9fb7dcbd7c