• 沒有找到結果。

第二章 文獻探討

第一節 數位典藏工作流程

(American Memory Pilot Program, American Memory),將國會圖書館內的歷史文 獻、照片及影音資料等典藏數位化,並將數位化資料燒錄至光碟片中,分發至 44 所 選 定 的 學 校 及 圖 書 館 , 後 來 此 計 畫 就 成 為 美 國 國 會 的 數 位 典 藏 計 畫 (National Digital Library Program / Library of Congress, NDLP) (The Library of Congress, 1990)。

我國的「數位典藏國家型科技計畫」於民國 91 年 1 月 1 日 正式成立,第一

9

一個數位典藏系統建置是否完善,可由其工作流程的規劃是否可行、流暢、

以使用者為導向而知。參照國內外數位典藏機構如澳洲國家圖書館於 1996 年開 始進行之「澳洲數位圖書館」先導計畫,其於 2000 年至 2004 年執行五年計畫提 到其中詳述了工作原則(National Library of Australia[NLA], 2000)。

美國國家資訊標準組織(National Information Standards Organization, NISO)提 供數位典藏建構指南手冊(A Framework of Guidance for Building Good Digital Collections)該手冊定義了建置數位典藏的四項核心工作,分別為典藏品彙整 (collections)、數位物件(objects)、詮釋資料(metadata)、與計畫管理(projects),其 中 NISO 在典藏品彙整(collection)有訂立物件典藏的九大原則,包括(NISO, 2007):

10

圖 2- 1 數位內容建置專案執行工作分解範例

資料來源:褚如君、陳秀華、詹景勛(2010)。數位化工作流程指南,p25。

數位資訊是數位典藏的核心元素,數位資訊生命週期包含生產、典藏、傳 播與使用(呈現)四個階段( Hodge, 2000)。數位典藏不單純只是資料轉換的程序,

在「數位典藏與數位學習國家型科技計畫」將數位典藏分成以下六個工作流程:

採集、後製、典藏、應用加值、傳播、使用與呈現,如圖 2-2,分述如下。

圖 2- 2 數位典藏工作流程架構圖

資料來源:蔡永橙、黃國倫、邱志義(2007) 。數位典藏技術導論,P.9

11 釋資料著錄採用都柏林核心集(Dublin Core,簡稱 DC)、文本資料交換採 用文獻編碼計畫(Text encoding initiative, TEI)、數位資料的封裝採 用 詮 釋 資 料 編 碼 與 傳 輸 標 準 ( Metadata Encoding and Transmission Standard, METS),茲分述如下:

1. 都柏林核心集(Dublin Core,簡稱 DC)

(access)、保存(preservation)、應用(use of collections)等四個層面去 思考建立詮釋資料的用途,與詮釋資料使用者之需求,以使詮釋資料的分析

12

格式(Format)、資源識別代號(Identifier)、關連(Relation)、來源(Source) 、 語言(Language)、涵蓋時空(Coverage)、版權規範(Rights)。

在深入瞭解都柏林核心集的元素定義及使用方式前,需先瞭解都柏林核 心集的三大原則,方能正確的使用都柏林核心集:

(1) 一對一原則(The One-to-One Principle)

一筆都柏林核心集的詮釋資料紀錄僅描述一個資源的一個形式或版本,

而非擴展至該資源的其他形式。例如,一幅畫作除了原件外亦有掃描成數位 圖檔時,則一筆詮釋資料紀錄僅可描述畫作原件,或是描述數位圖檔,不可 同時描述原件及數位圖檔。

(2) 簡化原則(The Dumb-down Principle):

此原則係指每個元素之下,使用者可忽略任何的限定詞,直接使用未限 定的資料值。刪去限定詞後所保留下來的資料值,雖然可能會失去一些特定 性,對資源發掘仍是正確而且有用。例如,有一資源名稱為「婦女頭飾」, 其英文名稱為「female head ornament」;族語名稱為「vanga」。在填寫時,

主要標題填寫於標題元素中,而另外二個名稱則填寫於標題元素修飾詞別名 之中。或者可不使用任何修飾詞,將三個名稱皆填寫於標題元素。

(3) 適宜的資料值(Appropriate values):

特定元素或限定詞的最佳實務(best practice)會隨著脈絡而有所不同,

一般而言,詮釋資料解譯者總是機器,結果是實作者所無法預測。因此最佳 實務可能對如何建構 DC 詮釋資料加諸特定限制,但是對於發掘資源的需 求須加以留意 (陳亞寧等編,2010) 。

2. 文獻編碼計畫(Text encoding initiative, TEI)

本研究與其他數位典藏系統文本交流採用 TEI(Text encoding initiative)

文獻編碼計畫,其為國際性的計劃,主要用在人文、社會科學、語言學,依 據這個標準可以達到資訊交換的目的,它有發展一套指導方針且有簡潔版本,

可以做為電子全文文獻交換,目前已被廣泛用於由圖書館、 博物館、 出版 商和個別學者對文本的線上研究、 教學和保存,主要結構如下

13

在文獻表頭資訊<teiHeader>包含了以下四項:

(1) 檔案描述(File description);包含題名敘述、版本敘述、出版描述。

(2) 編碼描述(Encoding description);描述電子文獻來源及相關資源德關 係。

(3) 文獻描述(Profile description);文獻創建過程的重要資訊。

(4) 更新、修訂記錄(Revision description):改版紀錄。

在文獻全文<body>方面包含了

(1) 文獻內容本體之前的資訊(font):前言、致謝詞、摘要等。

(2) 文獻本體(body):文獻主要內容

(3) 文獻內容本體之後的資訊(back):備註、索引、附錄等(Text Encoding Initiative [TEI], 2013)。

3. 資料編碼與傳輸標準(Metadata Encoding and Transmission Standard,METS)

資 料 編 碼 與 傳 輸 標 準 ( Metadata Encoding and Transmission Standard,METS)是以 XML 為基礎所發展出來的資料框架,起先由數位圖 書館聯盟(Digital Library Federation )贊助研發,現由美國國會圖書館(Library of Congress) 負 責 維 護 , 可 做 為 開 放 式 典 藏 資 訊 系 統 (Open Archival Information System, OAIS)參考模式之提交資訊封包(Submission Information Package,SIP)、典藏資訊封包(Archival Information Package, AIP)、傳播資訊 封包 DIP(Dissemination Information Package)之間的詮釋資料交換,主要結構 包含七個部分:METS 標目(Mets Header)、描述性後設資料(Descriptive Metadata Section)、管理性詮釋資料(Administrative Metadata Section)、檔 案段(File Section)、結構地圖(Structure Map)、結構性連結(Structural Links)

及行為段(Behavior Section),僅有結構地圖為必選,METS 標目與檔案段 可選部分。

(1) METS 標目(Mets Header):METS 的詮釋資料包含主要包括 METS 文 件的建立、最後修訂時間以及 METS 文件狀態。

14

(2) 描述性詮釋資料(Descriptive Metadata Section):可分成外部描述性詮 釋資料與內部描述性詮釋資料,外部描述性詮釋資料是以連結方式指向 儲存在外部系統中的數位資料;內部描述性詮釋資料是將不同的詮釋資 料封裝在 METS 文件中 。

(3) 管理性詮釋資料(Administrative Metadata Section):由技術性 Metadata 子元素為<techMD>、權利性 Metadata 子元素為<rightsMD>、來源 Metadata 子 元 素 為 <sourceMD> 、 數 位 起 源 Metadata 子 元 素 為 聯起來(The Library of Congress , 2015)。

(三) 典藏:

15

統,有利於後續的傳播與應用。在數位典藏技術導論(蔡永橙、黃國倫、邱 志義,2007)中提出了「數位典藏系統之模組架構」,如圖 2-3,將數位典藏 系統切分成階層式模組來討論,包括數位化物件、詮釋資料、資料庫管理、

圖像管理、影音管理、版權管理、資訊檢索技術、應用系統等,其每一階層 都有一個或多個模組提供特定功能。

圖 2- 3 數位典藏系統之模組架構

資料來源:蔡永橙、黃國倫、邱志義(2007) 。數位典藏技術導論,P.11 其中數位化物件在前置作業時需詳細規劃,典藏品的品質也要詳細把關,

詮釋資料與資料庫建置需由專業人員參與,如此方利於資訊的檢索與加值應 用。

(四) 加值應用:

數位典藏後的檔案、素材,透過加值運用,更可以達到學習、研究、加 值等效用,進而發揮數位典藏之真正目的 (拓展臺灣數位典藏計畫,2013)。

根據項潔、陳雪華、陳昭珍、郭筑盈(2005)指出,數位典藏加值可應用至

「休閒與娛樂」、「學習與研究」、「文化與生活」等領域上。

(五) 傳播:

建構完成之數位典藏系統,利用網際網路或數位媒體傳達給使用者, 建 構系統之時需考量使用者之需求及使用者端各種設備及作業系統之差異性,

16

調整系統的相容性。

(六) 使用與呈現:

設計多種資訊存取方法,包括瀏覽及進階查詢,以提供使用者正確且快 速取得所需之資訊。

二、 開放式典藏資訊系統參考模型

開放式典藏資訊系統(Open Archival Information System, OAIS)參考模型 (Reference Model)為美國太空資訊系統諮詢委員會所發展,目前已通過 ISO 標準,

該參考模型中的功能模型(Functional Model)涵蓋六大功能實體:攝入(Ingest)、典 藏儲存(Archive Storage)、資料管理(Data Management)、取用(Access)、行政管理 (Administration)、以及保存規劃(Preservation Planning)。此參考模型提出所提出 的開放式數位典藏庫架構,近年來已被廣泛的接受與使用。OAIS 參考模型如圖 2-4。

圖 2- 4 OAIS 參考模型

資料來源:http://public.ccsds.org/publications/archive/650x0m2.pdf p.44 依據 OAIS 參考模式的定義:可將數位典藏活動視為一個由資訊生產 (Productor)、資訊消費者(Comsumer)、管理者(Management)及典藏儲存(Archival Storage)等四個實體所組成的互動環境,其主要的六大功能為 (Consultative Committee for Space Data Systems[CCSDS], 2012):

17

(一) 攝入(Ingest)

此功能主要是負責接收生產者的提交資訊封包(Submission Information Package,SIP)。也就是說典藏品在數位化建立前,就必須進行相關傳送標 準的訂定,如資料格式、類型、傳送方式、實體文件等,並將處理完的封包 轉換成典藏資訊封包(Archival Information Package, AIP)格式,且符合規劃 時的 典藏 標準 ,再 將 封 包 傳 至資料 管理 (Data Management) 和典 藏儲存 (Archival Storage)兩者。

(二) 典藏儲存(Archive Storage)

接收數位化典藏品產生的典藏資訊封包(AIP)並永久儲存。在儲存當中 需符合檔案的資料格式和交換標準,且隨時更新儲存設備,定期做資訊確認,

提供傳輸、偵錯等工作,再以 AIP 方式傳送。

(三) 資料管理(Data Management)

管理檔案資料庫與詮釋資料的功能,保持資料庫架構的完整性,執行資 料庫更新,且提供系統維護和取用服務,以支援典藏機構的運作,資訊依結 果輸出給資訊存取封包。

(四) 取用(Access)

此階段功能提供的功能在 OAIS 中是將使用者的請求轉換成傳播資訊 封包 DIP(Dissemination Information Package),讓使用者可以檢索系統的資 訊及與使用者互動。

(五) 行政管理(Administration)

此階段提供的服務和功能是確保檔案系統的整體運作。包括生產者的資 料徵集和提交與協定審議:從規格建議書、維護計劃書、軟硬體架構、資料 儲存、檔案管理等,行政管理在數位典藏計畫的作用是在擬訂計畫方針、維 護系統運作與作業品質管理。

(六) 保存規劃(Preservation Planning)

為監測 OAIS 的環境所提供建議的保存計畫,用來確保使用者可以取

18

得 OAIS 中所儲存的資訊,保存計畫的功能能包括評估檔案的內容和資訊 的更新,擬定資訊長久保存的標準和策略,提供週期性風險評估,及監測技 術環境和使用者族群調查。

三、 小結

數位化工作流程為數位典藏系統建置之關鍵,畢竟典藏品數量龐大,種類繁 雜,沒有良好的流程控管,整個系統將雜亂無章,品質將受影響,更遑論加值應 用。參照國內外各種數位化工作流程,下一節將討論依數位化工作流程,在實務 面可能遇到之問題,分析這些問題及相關文獻的看法,希望以此作為本研究設計 與開發出「宗教研修學院數位典藏系統」的藍本,為後續對此議題有興趣的研究 者提供一個方向。

19

相關文件