• 沒有找到結果。

PREMIS 的緣起與發展

第二章 文獻探討

第三節 PREMIS 的緣起與發展

本節首先介紹 PREMIS 的緣起,說明 PREMIS 工作小組的組成和開發過 程;並說明開放式典藏資訊系統(Open Archiving Information System,簡稱 OAIS)與保存性詮釋資料之間的關係;接著介紹 PREMIS 資料辭典,說明物 件、事件、代理者和權利敘述四種實體,以及實體所延伸出的語意單元;最後 說明保存性詮釋資料的發展現況以及各國的保存性詮釋資料項目;最後為小 結。

一、 PREMIS 緣起

2003 年 6 月,OCLC 和 RLG 聯合組織了由國際專家們所組成的 PREMIS 工 作小組,該工作小組使用詮釋資料來支持各項數位保存的活動。工作小組的成 員由超過 30 名參加者所組成,代表 5 個不同國家和領域,包括圖書館、檔案 館、博物館、政府機關和私人企業。工作小組的工作為開發一套可廣泛用於數 位保存環境中的保存性詮釋資料標準,以協助數位資料的創造、管理及利用。

工作小組在 2005 年 5 月發布了 PREMIS 資料辭典的最終報告(Data Dictionary for Preservation Metadata: Final Report of the PREMIS Working Group),該報告 為第一版。除了資料辭典之外,工作小組還發布了一套 XML Schema,以支持 在數位保存中執行資料辭典。PREMIS 工作小組的成立是為了鞏固 OCLC 和 RLG 發起的早期工作:保存性詮釋資料框架工作小組(the Preservation Metadata Framework,簡稱 PMF)。在 2001 至 2002 年期間,PMF 工作小組對典藏數位 物件相關的資料類型做了概述,他們在報告「詮釋資料框架」中,提出了詮釋 資料原型的列表,以支持數位物件的保存。然而,這還需要額外的工作來支持 這些原型元素的執行。PREMIS 工作小組進一步的發展 PMF 小組的的工作,並 開發資料辭典中詮釋資料的核心部分,以實踐保存系統中詮釋資料的創造、管

二、 開放式典藏資訊系統

國際標準組織(International Organization for Standardization,簡稱 ISO)於 2003 年發佈了開放式典藏資訊系統參考模式(Reference Model for an Open Archiving Information System,簡稱 OAIS Reference Model),是建置數位物件長 期保存資訊系統的標準規範。OAIS 可分為功能模型(Functional Model)、資訊 模 型 ( Information Model ) 和 資 訊 封 包 轉 換 ( Information Package Transformation)等三部分,其中功能模型包含了六項保存庫必須具備的功能模 組,分別為攝入(Ingesting)、典藏儲存(Archive Storage)、資料管理(Data Management)、資料取用(Access)、行政管理(Administration)和保存計畫

(Preservation Planning),如圖 2-6 所示,以下針對各項功能模組做說明。

圖2- 6 OAIS 功能模型

資料來源:Consultative Committee for Space Data Systems. (2012). Reference Model for an Open Archiving Information System (OAIS). Retrieved from

https://public.ccsds.org/pubs/650x0m2.pdf

1. 攝入:係指數位物件及其詮釋資料封包被數位物件生產者提交給 OAIS 保存 庫的程序。攝入負責接收生產者的提交資訊封包(Submission Information

Package,簡稱 SIP),包含數位物件儲存的檔案、詮釋資料等。攝入程序涉 及生產者和 OAIS 保存庫間傳送規則標準的訂定,如資料格式、類型、形 式、傳送方式、實體文件等。在攝入SIP 後,會根據 OAIS 保存庫所制定的 檔案標準規範進行處理後,再轉換成典藏資訊封包(Archival Information Package,簡稱 AIP)傳至典藏儲存模組;數位物件的描述性資訊則儲存至 資料管理模組。

2. 典藏儲存:典藏儲存功能為接收攝入功能產生的 AIP 並且儲存。儲存時需 符合儲存的需求,如典藏級、或瀏覽級等,並且隨時更新儲存媒體,定期 確認資訊,提供傳輸、偵錯等相關工作,最後以 AIP 的方式傳送。

3. 資料管理:資料管理功能是管理典藏品的詮釋資料,包括管理檔案資料 庫,維護檔案結構、完整性和資料庫更新等。

4. 資料取用:資料取用功能為輔助使用者取得資訊。將使用者要求的資訊轉 換成傳播資訊封包(Dissemination Information Package,簡稱 DIP),讓使 用者可以進行檢索、取得回應,提供應用。

5. 行政管理:行政管理主要負責規範整體系統運作。

6. 保存計畫:保存計畫功能為發展長期保存的政策,確保使用者可以取用 OAIS 內儲存的資訊。

OAIS 的流程藉由人員和系統的配合,以完成數位物件的長期保存與維護。

流程為生產者產生SIP,經由攝入功能將 SIP 轉換為 AIP,再傳送至檔案儲存功 能,同時也將 SIP 的描述資訊傳送給資料管理功能,以提供使用者進行查詢。

當使用者進行檢索時,透過取用功能將檢索結果轉換為 DIP 封包,傳遞給使用 者。藉由生產者提供資訊,管理者規劃和評估 OAIS 政策及運作,使用者透過 OAIS 的服務取得資訊。

三、 PREMIS 資料辭典

PREMIS 工作小組在 2005 年發布資料辭典後告一段落,並由美國國會圖書 館開始贊助 PREMIS 的維護活動,以維護資料辭典和協調其他工作,加深對保

會,負責進一步開發 PREMIS 資料辭典和 XML Schema,並促進其使用。編輯 委員會的成員在修訂資料辭典時,只要累積到足夠的評論以保證其可行,就會 盡力讓利益相關者參與資料辭典的修訂,向保存界通報其討論的問題,並諮詢 專家,徵求對資料辭典修訂的建議。

PREMIS 資料辭典植基於 OAIS 參考模式(ISO 14721,2012),其後續版 本利用 PREMIS 增加的使用次數和執行保存計畫的經驗作為資料辭典修訂之依 據,因此從另一個角度來看,PREMIS 也可說是 OAIS 參考模式的具體實現。

PREMIS 之版本歷史如表 2-6 所示。

表2- 6 PREMIS 之版本歷史

Version Release Date

Version 1.0 May 2005

Schema Version 1.0 17 May 2005 Schema Version 1.1 27 September 2005

Version 2.0 March 2008

Schema Version 2.0 17 July 2008

Version 2.1 January 2011

Schema Version 2.1 6 January 2011

Version 2.2 July 2012

Schema Version 2.2 15 May 2012 Schema Version 2.3 4 August 2014

Version 3.0 June 2015

資料來源:PREMIS Data Dictionary for Preservation Metadata, Version 3.0.

PREMIS 資料辭典定義了語意單元(Semantic Units)。在資料辭典中定義的 每個語意單元都被映射到資料模型中的某一個實體。因此,語意單元也可以解 讀成實體的屬性(Property)。在 PREMIS 版本 2.0 中所設計的資料模型將數位保 存活動定義成重要的五個實體,分別是:內容實體(Intellectual Entity)、物件

(Object)、事件(Event)、代理者(Agent)和權利(Rights),如圖 2-7 所示。

而在 PREMIS 版本 3.0 中,則將數位保存活動重新定義成重要的四個實體,分 別是:物件、事件、代理者和權利敘述,而內容實體被修改至物件實體當中的

一個類別,如圖2-8 所示。

圖2- 7 PREMIS 資料模型 2.0

在圖2-7 中,實體由方框表示,實體之間的關係由箭頭表示。箭頭的方向表

統,或與物件相關聯的權利敘述,例如:PDF 檔案的 出版者。

4. 權利敘述:對一個物件或代理者所採取行動的許可,

例如:允許因保存目的而複製PDF 檔案。

資料來源:本研究整理。

PREMIS 資料辭典 3.0 主要包括幾點改變和補充。重點如下:

(一) 將內容實體重新定位至「物件」實體類別中,以便在 PREMIS 中進行附加 描述並鏈結到相關的 PREMIS 實體。

(二) 重新定位一個新的實體:「環境」實體,即使用數位物件所需的軟硬體,

以便可以對物件實體進行描述和保存。也就是說,它們可以被描述為內容 實體,並以表徵方式、文件或位元流的型態來呈現。

(三) 將實體物件(Physical Objects)添加到 PREMIS 的範圍內,以便它們可以被 描述且與數位物件相關。

(四) 在物件實體中添加一個新的語意單元:preservationLevelType(O, NR),

以表示保存功能的類型將被預期應用在已給定的保存級別物件中。

(五) 在代理者 實體 中添加 一個新 的 語意 單元, 以 表達軟體 代理 者的版 本:

agentVersion(O, NR)。

(六) 在事件實體中添加一個新的語意單元:eventDetailInformation(O, NR)。

圖 2-9 顯示了所有與 PREMIS 相關的詮釋資料,包括:描述性詮釋資料、

數位物件保存系統企業規則、格式相關技術性詮釋資料,以及代理者、權利、

儲存媒體和硬體的細節等。PREMIS 為保存性詮釋資料核心的核心,如圖中最 深色的部分。

圖2- 9 PREMIS 與保存性詮釋資料

資料來源:Caplan, P. (2009). Understanding PREMIS. Retrieved from

https://www.loc.gov/standards/premis/understanding-premis.pdf

在 PREMIS 3.0 中,將數位保存活動用四種實體表示,分別是:物件、事 件、代理者和權利敘述,而每種實體皆包含了不同的語意單元,如表2-8 所示。

其中 M 代表必備的(Mandatory)、O 代表選備的(Optional)、R 代表可重複 的(Repeatable)、NR 代表不可重複的(Non-Repeatable)。

表2- 8 PREMIS 語意單元

1.3 preservationLevel (O, R) [Intellectual Entity, Representation, File]

1.3.1 preservationLevelType (O, NR) [Intellectual Entity, Representation, File]

1.3.2 preservationLevelValue (M, NR) [Intellectual Entity, Representation, File]

1.3.3 preservationLevelRole (O, NR) [Intellectual Entity, Representation, File]

1.3.4 preservationLevelRationale (O, R) [Intellectual Entity, Representation, File]

1.3.5 preservationLevelDateAssigned (O, NR) [Intellectual Entity, Representation, File]

1.4 significantProperties (O, R)

1.4.1 significantPropertiesType (O, NR) 1.4.2 significantPropertiesValue (O, NR) 1.4.3 significantPropertiesExtension (O, R) 1.5 objectCharacteristics (M, R) [File, Bitstream]

1.5.1 compositionLevel (O, NR) [File, Bitstream]

1.5.6 inhibitors (O, R) [File, Bitstream]

1.5.6.1 inhibitorType (M, NR) [File, Bitstream]

1.5.6.2 inhibitorTarget (O, R) [File, Bitstream]

1.5.6.3 inhibitorKey (O, NR) [File, Bitstream]

1.5.7 objectCharacteristicsExtension (O, R) [File, Bitstream]

1.6 originalName (O, NR) [Intellectual Entity, Representation, File]

1.7 storage (O, R) [Representation, File, Bitstream]

1.7.1 contentLocation (O, NR) [Representation, File, Bitstream]

1.7.1.1 contentLocationType (M, NR) [Representation, File, Bitstream]

1.7.1.2 contentLocationValue (M, NR) [Representation, File, Bitstream]

1.7.2 storageMedium (O, NR) [Representation, File, Bitstream]

1.8 signatureInformation (O, R) [File, Bitstream]

1.8.1 signature (O, R) [File, Bitstream]

1.9 environmentFunction (O, R) [Intellectual Entity of type environment]

1.9.1 environmentFunctionType (M, NR) [Intellectual Entity of type environment]

1.9.2 environmentFunctionLevel (M, NR) [Intellectual Entity of type environment]

1.10 environmentDesignation (O, R) [Intellectual Entity of type environment]

1.10.1 environmentName (M, NR) [Intellectual Entity of type environment]

1.11 environmentRegistry (O, R) [Intellectual Entity of type environment]

1.11.1 environmentRegistryName (M, NR) [Intellectual Entity of type environment]

1.11.2 environmentRegistryKey (M, NR) [Intellectual Entity of type environment]

1.11.3 environmentRegistryRole (O, NR) [Intellectual Entity of type environment]

1.12 environmentExtension (O, R) [Intellectual Entity of type environment]

1.13 relationship (O, R)

1.13.6 relatedEnvironmentCharacteristic (O, NR) [Representation, File, Bitstream]

1.14 linkingEventIdentifier (O, R)

1.14.1 linkingEventIdentifierType (M, NR) 1.14.2 linkingEventIdentifierValue (M, NR) 1.15 linkingRightsStatementIdentifier (O, R)

1.15.1 linkingRightsStatementIdentifierType (M, NR) 2.5 eventOutcomeInformation (O, R) 2.5.1 eventOutcome (O, NR) 2.5.2 eventOutcomeDetail (O, R)

2.5.2.1 eventOutcomeDetailNote (O, NR) 2.5.2.2 eventOutcomeDetailExtension (O, R) 2.6 linkingAgentIdentifier (O, R)

2.6.1 linkingAgentIdentifierType (M, NR) 2.6.2 linkingAgentIdentifierValue (M, NR) 2.6.3 linkingAgentRole (O, R)

2.7 linkingObjectIdentifier (O, R)

2.7.1 linkingObjectIdentifierType (M, NR) 2.7.2 linkingObjectIdentifierValue (M, NR) 2.7.3 linkingObjectRole (O, R)

Agent 代理者

3.1 agentIdentifier (M, R)

3.1.1 agentIdentifierType (M, NR) 3.8 linkingRightsStatementIdentifier (O, R)

3.8.1 linkingRightsStatementIdentifierType (M, NR) 3.8.2 linkingRightsStatementIdentifierValue (M, NR) 3.9 linkingEnvironmentIdentifier (O, R)

3.9.1 linkingEnvironmentIdentifierType (M, NR) 3.9.2 linkingEnvironmentIdentifierValue (M, NR)

1.9.3 linkingEnvironmentRole (O, R) Rights 權利敘述

4.1.3.6.1 startDate (O, NR)

4.1.7.3.1 startDate (M, NR) 4.1.7.3.2 endDate (O, NR) 4.1.7.4 termOfRestriction (O, NR) 4.1.7.4.1 startDate (M, NR) 4.1.7.4.2 endDate (O, NR) 4.1.7.5 rightsGrantedNote (O, R) 4.1.8 linkingObjectIdentifier (O, R)

4.1.8.1 linkingObjectIdentifierType (M, NR) 4.1.8.2 linkingObjectIdentifierValue (M, NR) 4.1.8.3 linkingObjectRole (O, R)

4.1.9 linkingAgentIdentifier (O, R)

4.1.9.1 linkingAgentIdentifierType (M, NR) 4.1.9.2 linkingAgentIdentifierValue (M, NR) 4.1.9.3 linkingAgentRole (O, R)

4.2 rightsExtension (O, R)

資料來源:PREMIS Data Dictionary for Preservation Metadata, Version 3.0.

其中,PREMIS 資料辭典對每個語意單元都給予詳細的說明,表 2-9 為語義 單元

objectIdentifier 的定義。

表2- 9 objectIdentifier 的定義

語意單元 1.1 objectIdentifier

語意成分 1.1.1 objectIdentifierType 1.1.2 objectIdentifierValue

定義 用於辨認保存庫系統中物件的唯一指定標識。

對於所有儲存的物件來說,objectIdentifier欄位都是必備

的。

objectIdentifier是可重複的,以便記錄保存庫分配的標識 符和外部分配的標識符。(請參閱“創建/維護”註解。)

庫只使用一種類型的標識符,則可以假設類型並且不需 被記錄。

⚫ 應該使用永久標識符,但特定標識符是執行特定計畫才

會使用的。

資料來源:PREMIS Data Dictionary for Preservation Metadata, Version 3.0.

數位物件保存需要相當重視數位物件的固定性、完整性和真實性的概念。

數位物件若缺乏這些特徵,對於有保存文化記憶使命的機構幾乎沒有任何價值

(PREMIS Editorial Committee, 2015)。驗證數位物件的固定性可以透過數位簽 章的方式,建立一訊息摘要演算法來檢查,若該演算法產生的訊息摘要與後來 使用相同演算法產生的訊息摘要相同,則表示該物件沒有經過未授權的竄改。

訊息摘要類似於指紋(Fingerprint)的概念,不同的訊息所產生出來的訊息摘要 都不相同,而訊息摘要是以複雜的雜湊函數(Hash Function)所計算出來的,

若先後計算出的兩組雜湊值相同則可表示數位物件並未經過竄改。

雖然這個過程可以確保數位物件未被竄改,但它不能解決物件完整性和真 實性的問題。在 PREMIS 模型中,驗證物件的完整性被認為是一個事件,格式 的驗證和確認是文件完整性的關鍵指標。完整性需要透過特殊程式來驗證所有 文件是否存在並被正確地命名,例如:JHOVE,可使用 1.5.4 format 處理。而數 位物件的所有更動歷史都必須完整地記錄下來,數位物件才能維持原有的真實 性。

四、 保存性詮釋資料發展現況

為了利用保存性詮釋資料協助數位資訊的長期保存,許多國家和機構紛紛

為了利用保存性詮釋資料協助數位資訊的長期保存,許多國家和機構紛紛

相關文件