第一章 緒 論
第一節 研究動機
檔案是隨著人類活動產生的副產品,肩負著記錄人類活動、權利義 務劃分的重大使命,也是承載人類記憶的重要元素。檔案的存在可追溯 到極早的年代,用來記載檔案的媒體也不斷演變,例如泥板、石刻、羊 皮紙、甲骨、竹簡等媒體,都曾在檔案史上佔有一席之地,紙張的發 明,更是檔案史上的革命進展。在人類活動中累積下來的檔案,不但具 有資訊、憑證等價值,早期甚至是權力的象徵,更是珍貴的史料,檔案 保存工作的重要性不言可喻。經過多年研究與經驗累積,藉由控制儲藏 環境、提升載體穩定性(如採用去酸紙張、燻蒸)等方法,紙質檔案的 保存對典藏機構而言已非難事,讓世人得以藉由這些珍貴的史料,一窺 早期人類的生活面貌。
近年來,資訊科技的進步,改變了人類溝通的方式、知識的管理和 傳承、資訊的散播和儲存,對人類社會產生革命性的影響。圖書館增加 了許多數位館藏,檔案館開始面對大量的電子文書,並將原有的珍貴館 藏轉換為數位物件典藏。博物館也紛紛進行藏品數位化的計畫,透過網 路的無遠弗屆,與世界共享。這些數位物件,有些是單純的文字檔,有 些有圖像、聲音,甚至是以多媒體形態儲存。
然而,在大量資料都倚賴數位化保存的同時,並不代表人類可以高 枕無憂,因為看似穩當的數位典藏方式,即使建立了適當的儲存環境,
做好各種安全控管,未必能保證數位物件可供長期使用。
數位儲存媒體的容量雖遠比紙張大出許多,生產媒體的業者也宣稱 其使用年限可達一定水準,但事實上數位儲存媒體比一般人想像中脆弱 得多,必須在嚴密的環境控制下,才能確保不受潮濕、塵埃、黴菌等侵 害,管理者也必須定期檢測,並將資料轉存(refresh)到新媒體。許多國 家的檔案工作者已研究出適合數位媒體儲存的環境,以轉存來確保資料 可讀性的方法也已被普遍應用。1
不過,由於資訊科技進展迅速,許多透過數位化方式典藏的珍貴資 料在數十年、甚至在媒體的壽命終結之前,就無法再以新一代電腦軟硬 體系統讀取;有些數位物件的相關紀錄文件未能配套保存,以致後人雖 有技術,也很難找出對應的作業系統,導致無法讀取;有些雖能夠讀 取,但卻無法正確解讀原有資料的意義…伴隨這些狀況而來的是,典藏 資料的真實性與可靠性常遭質疑。2尤其是具有唯一性特質的文書與檔 案,一但資料流失,業務的憑證不見了,權利義務無法辨明,更糟的,
可能是人類共同記憶的流失。
諸 如 此 類 的 狀 況 , 已 出 現 在 許 多 歐 美 國 家 , 如 美 國 人 口 普 查 局
(Bureau of the Census)將 1960 年代進行的人口普查資料儲存在磁帶 上,並將磁帶存放在嚴密控制的環境中。1976 年,美國國家檔案局判定 其中部分具有永久保存價值,此時卻發現,部分磁帶必須以某種早已被 淘汰的機型讀取,當時全世界只剩下兩部,一部在日本,一部則早已進 了博物館3。幸而在各方努力下,於 1979 年挽回大部分資料。4諸如此類 的例子不勝枚舉,許多珍貴的資料就此流失,我們這一代的共同記憶能 否順利保存下去,令人憂心。
資訊科技的快速進展,使圖書館、檔案館等負責保存人類知識與活 動紀錄的機構面臨空前挑戰。有學者提出解決方法。最直接的,就是將 原本的軟硬體保存起來(technology preservation),並定期轉存,然而,
也許某些特別有歷史價值的軟硬體可能值得這麼做,但就長期來看,未 免昂貴而不切實際5。轉置(migration)是近年廣受矚目的方法之一,也 就是定期將數位資料從原有的軟硬體環境移到另一個軟硬體環境下,我 國的電子出版品就採用轉置的方法協助保存工作;6 Jeff Rothenburg 提出 的技術模擬策略(emulation)也引起很多討論,國際間已有機構針對此 一方法進行實驗。7
無論採用轉置或技術模擬保存數位資料,都必須搜集大量有關數位 物件的詳細資料及典藏工作的所有相關資訊,將之編碼為保存後設資料
(preservation metadata),這些後設資料將有助於數位物件在未來經歷軟 硬體環境的變遷時,得以重組、解讀,提供後人使用,同時,數位物件 的真實性與完整性也可以藉由這些後設資料確認。
2
過去,圖書資訊學界投注許多心力進行後設資料相關研究,但焦點 多放在後設資料的資料搜尋及檢索功能,如Dublin Core、EAD(Encoded Archival Description)等。近幾年來,國際間已有不少專家學者體認到後 設資料在數位典藏工作上扮演的關鍵性角色,已有許多機構進行研究,
嘗試提出保存後設資料的架構、項目。具有代表性的,如美國Research Libraries Group(RLG)的保存後設資料工作小組8、英國的Cedars(curl exemplars in digital archives)計畫9、澳洲國家圖書館數位保存計畫10、歐 洲NEDLIB(Networked European Deposit Library)方案11以及OCLC/
RLG也結合不同領域、地區的學者專家,集思廣益,進行相關研究,已 提出保存後設資料建議架構及項目,研究並持續進行。12
國史館、國史館台灣文獻館、中研院近史所檔案館及故宮博物院是 我國重要的檔案典藏機構,為配合資訊科技的進步、減少歷史檔案原件 因多次借閱使用造成的傷害,各機構的檔案數位化工作已行之有年,但 似乎輕忽了數位化資料長期保存工作的困難,國內學界對此領域的討論 也不多。我國行政院在 1990 年 7 月通過成立「國家典藏數位化計畫」,
並於 1992 年起正式展開「數位典藏國家型科技計畫」13,國史館、國史 館台灣文獻館、故宮博物院及中研院近史所檔案館都參與其中。國家典 藏數位化計畫中設有後設資料工作小組,但工作重心仍放在資源發現與 共享,並未針對保存後設資料多所著墨。在達成資源共享的目的後,如 何讓數位化的珍貴史料能夠長久提供使用,並確保其真實及完整性不受 質疑,進而加強數位化館藏的管理,發展合適的保存後設資料項目,配 合典藏策略的執行,是刻不容緩的工作。
第二節 研究目的
儲存媒體不夠穩定、科技淘汰迅速等因素,已對數位資料的長期保 存工作造成很大挑戰,如何設法解決這些問題,避免珍貴資料流失,是 圖書資訊學界、檔案界甚至資訊界共同關切的話題。目前,已有許多機 構針對數位資料長期保存的相關議題進行研究,在這些計畫中,都強調 數位保存後設資料是不可或缺的配套措施,也是確保數位資料真實性、
完整性的重要元素。為此,許多團隊各自提出長期保存數位資料所需的 保存後設資料架構及項目,供各界參考,若能以這些研究結果為出發 點,並考量典藏機構特殊需求,發展各機構特有的保存後設資料項目,
不但能有助於數位資料的長期保存,採同一架構發展出來的資料項目,
未來也能互通有無,彼此共享。
本研究擬採用文獻法、比較研究法及深度訪談法,從探討數位保存 工作面對的困境出發,先了解國內主要檔案典藏機構檔案數位化計畫執 行現況,進而分析國外數位保存後設資料格式的發展背景、特色及異 同,並以中研院近史所檔案館的檔案數位化計畫為研究對象,提出保存 後設資料相關建議做為參考,主要目的如下︰
一、 探討數位保存工作困境及相關策略,並分析保存後設資料對數 位資料長期保存工作的重要性;
二、 了解國外保存後設資料研究發展現況;
三、 探討國內檔案典藏機構數位典藏計畫現況及後設資料發展情 形;
四、 針對中研院近史所檔案館檔案數位化資料特性,規劃保存後設 資料項目,以助數位物件長久保存決策的制定與執行,並供其 他機構參考。
4
第三節 研究問題
本研究假設,數位資料的保存工作,須透過保存後設資料記錄歷程 及相關資訊,才不致於因媒體脆弱及科技變遷等因素而損及資料的真實 性及完整性,甚至資料完全流失。國際間有關保存後設資料的發展方案 甚多,提出的項目不甚相同,目前也還沒有共同的標準。此外,保存後 設資料項目的需求因典藏機構及館藏而異,若能由幾個保存後設資料項 目找出其共同點,亦即核心項目,配合研究對象數位保存工作需求,應 可自行發展一適用於研究對象之保存後設資料項目。因此,本研究擬就 下列問題提出解答︰
一、 RLG、NLA、Cedars 及 NEDLIB 所提出保存後設資料項目的發 展背景及項目,其相同及相異點為何?
二、 以中研院近史所檔案館角度來看,該機構有無針對數位化檔案 資料規劃保存政策及計畫?採用何種保存技術或方法?數位化 檔案資料後設資料包括哪些項目?若要確保數位化檔案資料的 完整性及真實性,其數位化計畫的保存後設資料應包含哪些項 目?與現有後設資料項目有無重疊之處?在館藏管理工作上,
保存後設資料還能發揮什麼功能?保存後設資料如何產生?有 沒有可能與現有後設資料連結?
第四節 名詞解釋
一、數位保存(digital preservation;long-term preservation)
通常指的是資料以數位形式保存的過程。數位物件有些是原生的,
本來就儲存於數位媒體上,有些則是因為保存而改變成數位化格式。數 位保存的目的在於確保所有數位物件的可用性、持久性及智慧整合性,
也就是確保數位物件長期的儲存、維護及檢索取得。14 二、保存後設資料(preservation metadata)
後設資料(metadata),直譯中文為「有關資料的資料」或「描述資 料的資料」,過去後設資料相關研究的焦點多在於協助搜尋、檢索資料 上,近年典藏後設資料逐漸受到重視。保存後設資料包括數位物件背景 脈絡(context)、內容編碼方式、呈現格式、媒體寫入方式、軟硬體系統 資料等,使用者讀取或使用數位物件時,必須依靠保存後設資料,才能 將零散在媒體各部分的資訊組合成數位物件的原貌,並順利解讀。
6
【本章註釋】
1Margaret Hedstrom, “Digital Preservation: a Time Bomb for Digital Libraries,”
http://www.uky.edu/~kiernan/DL/hedstrom.html (2001/10/20).
2 Jeff Rothenburg, “Ensuring the Longevity of Digital Documents,” Scientific American, v.272 n.1 (1995): 42-7.
3 Task Force on Archiving of Digital Information, Preserving Digital Information:
Report of the Task Force on Archiving of Digital Information (Washington DC:
Commission on Preservation and Access, 1996):2. Also available from http://www.rlg.org/ArchTF/ .
4 Margaret O. Adams and Thomas E. Brown, “Myths and Realities About the 1960 Census,” Prologue v.32 n.4( winter 2000).
http://www.archives.gov/publications/prologue/winter_2000_1960_census.html (2001/10/10)
5 Tony Hendley, Comparison of Methods & Costs of Digital Preservation, British Library Research and Innovation Report 106 (London: British Library Research and Innovation Centre, 1998).
http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html#_Toc422 714273 (2001/12/12)
6 Michael Day , “Issues and Approaches to Preservation Metadata,” 1998.
http://www.rlg.org/preserv/joint/day.html also at
http://www.ukoln.ac.uk/metadata/presentations/rlg-npo/wawick.html (2001/5/5)
7 同註 2。
8 RLG Working Group on Preservation Issues of Metadata, Final Report (Mountain View, CA:RLG,1998). http://www.rlg.org/preserv/presmeta.html (2000/10/12)
9 Cedars Project, http://www.leeds.ac.uk/cedars/
10 National Library of Australia, “Preserving Access to Digital Information,” National Library of Australia Website. http://www.nla.gov.au/padi/about.html (2002/9/18).
11 NEDLIB homepage, http://www.konbib.nl/nedlib/ (2003/5/15).
12 OCLC/RLG Working Group on Preservation Metadata, Preservation Metadata and the OAIS Information Model: A Metadata Framework to Support the Preservation of Digital Objects (Dublin, Ohio: OCLC), 2002.
http://www.oclc.org/research/projects/pmwg/pm_framework.pdf (2003/1/1).
13 數位典藏國家型科技計畫網站,http://www.ndap.org.tw/.
14 同註 6。
8