• 沒有找到結果。

數位物件保存的重要概念

第四章 研究結果分析

第四節 數位物件保存的重要概念

本節主要討論數位物件長期保存的呈現層面,牽涉到數位物件幾項重要的 概念,包括呈現性、持續性、固定性、真實性和完整性等。接著說明國內文化 記憶機構訂定數位物件保存政策的情形,以及國內文化記憶機構處理數位物件 的關聯情形的方法。

(一) 呈現性

1. 選擇適當的檔案保存格式

呈 現 性 意 指 確 保 數 位 物 件 是 可 顯 示 、 可 播 放 , 或 是 可 用 的 (Caplan, 2008),選擇適合數位物件保存的檔案格式是達成呈現性的重要方法。PREMIS 建議可使用1.5.4.1 formatDesignation 記錄物件的檔案保存格式。

現在圖檔的話,主要都是用 TIFF 還有 JPG。然後如果是影音檔的話,

我們是參考國圖有一個叫資料數位化與命名原則的規則,它說可能你 話,必須註明在 1.5.6 inhibitors,以利未來執行轉置等數位物件保存工作。在這 次訪談中,各機構均未對長期保存用的典藏級數位物件進行前述各項保護(僅 有瀏覽級物件可能加入各項保護),因此也就不會用到 1.5.6 inhibitors。

網路上的都是加工的浮水印,你在上面看不到,印下來就會看的到。

那防盜拷的話,就是它不讓你下載,但防盜拷這個機制很難去做,除 非是你要加浮水印、加密,加密的話你要整個要加密嗎?你不可能人

家在檢索的時候,打開這影像要密碼,除非你是數位保存物件裡面把

PREMIS 建議可利用 1.7.2 storageMedium 和 1.9.1 environmentFunctionType 記錄物件保存的軟硬體環境。在這次訪談中,各機構表示仍有少數需要使用特 定軟硬體才能讀取的數位物件。

我們就是會考慮國內或是國外的一些標準,所以我們盡量都是以標準 的檔案格式去存取,所以沒有。(L04)

有些以前拍的錄影帶它只能搭那個錄影機嘛!那一種的話,目前我們 有遇到,但是我們就是丟給外面,我們就是直接找人家做處理掉。

(L05)

然後它的設計就是你要先下載他某一個類似看圖的軟體,然後這個軟 體就是只有這家公司開發的,就是等於說你每次進這個資料庫你要瀏 覽這一本善本的那個影像檔,你可能還要先下載這家公司的 app 之類 的,才有辦法瀏覽。然後因為現在狀況就是這個資料庫現在已經沒有 在更新了,已經停止維護。(L07)

4. 舊的保存格式需做轉換

可利用 1.5.4.1.1 formatName 記錄檔案保存格式的名稱,並將格式的版本運1.5.4.1.2 formatVersion 處理,其他格式相關資訊可記錄在 1.5.4.3 formatNote 中。數位物件長期保存會遇到格式過時無法讀取的問題,因此需定時將舊的格 式做轉換或淘汰。

現在目前都還可以讀取,可是像我們 VOD 那一塊,最近這兩年應該要 趕快處理了!目前都還可以讀,可是相關的東西它會有需要做格式轉 換的問題。目前我個人發現的大概就這幾塊,就是 VOD 、ASF、

WMA、WMV 它需要做轉換。(L02)

就是看時代的變化吧!如果有需要的話,當然就是會再進行轉檔這樣 子。(L04)

就好像最早 VHS 的資料夾,如果你要讓 VHS 資料夾在它所有 VHS 的 player 被淘汰之前影像留存,你一定要把它轉出來,轉出來到 disk 上 面去,要不然它就不見了。(A03)

或是當初當然可能有比較舊的、比較低解析度的,那大部分都有把它 轉上來啦!(M01)

(二) 持續性

1. 載體因素

在數位物件長期保存的過程中,容易遇到載體故障、載體規格不符或載體 敏感度等的問題,造成無法讀取的情況。PREMIS 利用 1.7 storage 記錄物件儲存 載體與位置的資訊,如果同一物件的相同複本存放在不同的儲存載體與位置,

則必須重複著錄。

我們還沒有發生過像硬碟沒辦法讀取的情況,光碟有讀不出來的情 況,應該是電腦的規格吧!電腦像每個廠商的電腦有的時候光碟機的 問題、敏感度的問題,有些讀不出來。可是當它拿到別的光碟機,它 又讀出來了!(L01)

我們沒有辦法防止光碟故障,我就算給它貼什麼保護膜或是什麼也都 沒有辦法防止,我已經極盡所能把它放在一個低濕度、溫度波動很小 的環境,但是它隨著自己本身塗料的劣化也是可能讀不到,或是光碟 它很容易遇到挑片,它必須要回到原來的燒錄機才讀的到,它換了機 器就讀不到,這種東西你甚至於無法預防。(A03)

2. 控制保存環境

控制保存環境也是長期保存需重視的部分,將物件控制在一個恆溫、恆濕 的環境,或者將物件置於防潮櫃上鎖。但即便保存在這樣的環境,載體也可能 隨著本身的劣化而導致無法讀取。

另外就是保存的環境盡量控制的讓它可以不容易受到損壞,所以防潮 櫃這件事情來做。(L02)

我們在地下室是有一個特藏書庫,那邊就是會保持恆溫、恆濕,因為 主要是光碟資料跟日文舊籍存在那一邊。(L06)

我已經極盡所能把它放在一個低濕度、溫度波動很小的環境,但是它 隨著自己本身塗料的劣化也是可能讀不到。(A03)

3. 加強定期備份

加強備份,定期做備份!我們目前有定數位物件備存的 SOP,大概規 定說每隔幾年,第一批的光碟要不要重新再重 co 一遍這樣,我們現在 目前是有定這一個。(L06)

4. 固定清查

比如說格式的轉換,或者是其他,其實我們都有固定在做清查啦!清 查其實也是因為數位物件保存的政策下面所要做的一件事情,否則我 們不會就是很辛苦的每年都要把那些硬碟全部拿出來全部讀一遍,然 後或者是光碟全部拿出來讀取看看它是不是正常這樣子。(A04)

(三) 固定性

固定性意指保存系統必須確保數位物件並未經過有意無意的竄改,屬於 PREMIS 中的 1.5.2 fixity。可藉由 Checksum、數位簽章的方式來驗證數位物件的 固定性,可利用訊息摘要演算法(1.5.2.1 messageDigestAlgorithm)來處理。實 務上,在資料量大的時候,有意無意的竄改防不勝防。

(1) Checksum

Checksum 是沒有做,因為光建檔都來不及了!根本沒時間去管後續那 個管理的問題,那因為這種機率不高。(L06)

這個部分我們不會在放在系統以後才進行,Checksum 我們是在圖檔產 生的時候就要進行了。(A03)

現在的硬碟管理系統它都很成熟了,它自己毀損的機會不太高,比如 說它有做可能 raid file 或是什麼,它自己就有一個安全的管理機制,當 你某一塊毀損的時候,我可以從其他的地方去把它補救回來。當然它 可能會用 checksum 的方法,或者是說…anyway,它就是會有一套的機 制去把它做 recuperate 找回來。(M01)

(2) 數位簽章

我們這邊算是提供一個封裝檔的檢測工具,那如果是封裝都是機關在 執行。封裝其實就是使用憑證卡的一種簽署機制,透過這種封裝幫你 做一些資料的演算。那當然後續接手的人其實可以透過驗證的方式確 認說這個檔案的雜湊資訊是正確的,來確保說這個檔案其實沒有被竄 改過。(A04)

(3) 其他資安維護

在這次訪談中,受訪機構表示系統的資安維護係以防火牆、在系統加入防 寫功能和透過帳號權限控管等方式進行。

因為我們不是每一天都會或是甚至沒有定時的檢核機制,所以我們可 能就真的只能依賴防火牆跟掃毒軟體,然後或者是說有學校的一些通 知,是不會去跑 Checksum。(L04)

如果談這種資安的,那大家每個單位都有問題,我在想的應該是說

Metadata 吧!Metadata 有 11 多萬筆,每一筆都有幾十個欄位,確實,

你如果哪一天故意或是無意的去修到一個資料,再發現了可能是 50 年 後,有沒有人剛好去看到那一筆的資料去撈出看,然後發現它是錯 的,因為有時候被撈出來,看的人還不一定看得懂,你懂這個機率 嗎?你資料一多的時候就有這個問題。(M03)

就變成防寫,譬如說我那個帶子我可以設不可以寫。那就是說我們會 認為像這樣的東西它被無意的篡改幾乎的機率很低。(L02)

因為每個資料庫都有就負責 key 那個 metadata 的人員,然後我們就是 會針對他的帳號的權限去開設,就是我們有一個後台可以去設定說你 只能幹嘛,甚至說你只能唯讀。(L07)

大家所有的電腦一開機你就要登入你的帳號,那你連到那個網路硬碟 它需要一個權限,然後那個權限也是跟著你的帳號,然後甚至我們是 跟著電腦機器,它會鎖你的 IP,所以你能夠連到那個網路硬碟其實要 經過層層的關卡才能夠連到。(A04)

(4) 圖像的竄改比較沒有太大的意義

影像數位化這個部分不是問題啦,因為你總不能一個藍地黃虎旗改成 紅地黃虎旗吧,圖不是沒有辦法改,是說這個意義在哪裡?(M03)

(四) 真實性、完整性

必須將數位物件的內容、架構與關聯性都保存下來,目的在於保存數位物 件的完整性,以供持續取用數位物件的內容。然而,數位物件的所有更動歷史 都必須完整地記錄下來,數位物件才能維持原有的真實性。PREMIS 建議可在 1.4 format 和 2.3 eventDateTime 中記錄物件的格式和更動歷史。

因為 checksum 是為了保存它的完整性跟正確性,所以應該是要寫在系 統,就好像我們所有的數位檔案會跟著 checksum 放在一起。(L02)

保存系統會記錄說這個物件什麼時候進來的,然後這個物件跟這個 metadata 什麼時候進來的。(L02)

法律跟權利文件,我們有權利去授權或者是使用。那檔案機關也是,

這個在之前是依據公文,你什麼時候轉移進來的?(A03)

除了實體的數位內容之外,還有 metadata 都透過系統來管理,那系統

進來、做什麼樣的事情、讀、寫、刪除、修改。(M01)

(五) 數位物件關聯情形

數位物件通常都是以數位檔案命名原則 1.1 objectIdentifier 的方式處理,

PREMIS 建議數位物件之間的關聯情形可利用 1.13 relationship 記錄。

1. 當物件兩者相關時

就是用數位檔名去讓它變一個 collection,就那個 collection 下面,然後 再去分,可能這個作品 A、作品 B、作品 C、作品 D,然後作品 001、

相關文件