第二章 文獻探討
第一節 數位典藏工作流程
數位典藏起源於1990 年美國國會圖書館推動的「美國記憶(American Memory, AM)先導計畫」(The Library of Congress, n.d.),隨後各國紛紛重視並投入數位 典藏。數位典藏是指將有價值的典藏品,透過數位化方式建檔進行保存的過程,
可真實地呈現典藏品,也可有利於使用者的取用與未來的加值應用。如何的長久 保存並取用典藏品是數位典藏中相當重要的議題,為了讓資料得以永續保存,必 須依據原始資料的特性採取不同數位化方式、數位化處理原則,以及檔案格式,
同時也須考量到典藏單位設備、日後資訊檢索的需求、網路上資料的傳輸速度等 問題。
數位典藏是投入許多時間及人力的工作,故需要有明確的工作流程管理模式 與標準,以提供執行數位典藏的單位遵循。數位化作業的工作流程依據各典藏機 構特性、典藏品而有不同的作業流程方式。數位典藏與數位學習國家型科技計畫 出版了一系列不同主題的數位化工作流程指南叢書,根據「數位化工作流程指南-專案規劃」(褚如君、陳秀華、詹景勛,2010)一書中將數位化工作以「專案」
的方式進行控管,將工作流程分成三個階段:前置規劃、內容建置、資料庫呈現
(參見圖 2-1),由一開始資源的評估,如數位化的物件、人力、設備、時程等 進行規劃;到數位內容的建置,如數位典藏文物的掃描、品質控管、驗收與資料
保存等;最後為後設資料的撰寫以及資料庫系統的建置,每個單位可以視自己的 需求去訂立細項的執行。
圖2- 1 數位內容建置專案執行工作分解範例
資料來源:褚如君、陳秀華、詹景勛(2010)。數位化工作流程指南-專案規劃,p25。
在「數位化工作流程指南:整合性工作流程」(王雅萍、陳美智,2010)一 書中從各類物件之數位化工作流程中歸納出共通性,表 2-1 列出了各類物件於數 位化工作流程的共同性,包含前置作業、數位化工作、資料保存、加值運用等四 個階段和每一個階段的工作步驟。前置作業「後設資料需求評估分析」中,不同 的物件有不同的欄位,欄位必須依照物件類型而所有增減;再者,數位化工作的 階段,不同的數位化物件其數位化的工作流程也不同,以相片為例,在掃瞄或翻 拍時需要進行色彩的校正;影音資料的數位化需要轉檔或剪輯等。
表2- 1 各類物件工作流程的共同性
資料來源:王雅萍、陳美智(2010)。數位化工作流程指南,p35。
本研究同時也參考「數位典藏與數位學習國家型科技計畫」分項計畫中「拓 資料來源:拓展臺灣數位典藏(http://content.ndap.org.tw)
一、 前置作業
檢視典藏物件的保存現況,瞭解原件的保存狀況,例如磁帶有無發霉、脆化、 解析度:600dpi
壓縮品質:不壓縮
2. 視訊檔分成了永久保存檔、視訊串流檔兩種,檔案格式參見表 2-3。 資料傳輸率:300kbps
檔案時間:1-5 分鐘(具有代表性或主題畫面呈現)
取樣率:44.1kHz / 24bit/sample 聲道:立體音
聲音串流檔
(網路瀏覽用)
檔案格式:Mp3
取樣率:44.1 kHz / 16bit/sample(原規定 24 bit/sample) 聲道:立體音
頻寬:64Kbps
檔案時間:聲音前端30 秒至 60 秒間
詮釋資料,並將原件掃描,以不壓縮格式,儲存一份永久檔,再視需求轉
色調深度:黑白;灰階-每像素8-bits;彩色-每像素 24-bits 解析度: 150dpi~300 dpi 或影像大小:從 500x400 至 1000x700 pixels
預覽影像
檔案格式:GIF(壓縮,原生影像至 GIF)
色調深度:每像素8-bits
解析度或影像大小: 72dpi 或影像大小從 150x100 到 200 x 200 pixels
資料來源:數位典藏與數位學習國家型科技計畫技術彙編,2007
(1) C1 級:物件已被拍攝成相片或正/負底片,但須經過數位化的掃描
(ImageScanning)及影像處理(ImageProcessing)之後轉化為 A 級 物件者;
(2) C2 級:物件已儲存在錄音帶或錄影帶上,但須經過類比訊號數位化
(Analog-to-Digital Conversion)之後轉化為 A 級物件者;
4. D 級:指實體物件且尚未轉化成任何媒體形式者,依照物件的狀態分成進行 不同的數位化處理,
(1) D1 級:指實體物件需被拍攝成正/負底片之後轉化為 C1 級物件者;
(2) D2 級:指實體物件需被錄影成錄影帶或錄音成錄音帶之後轉化為 C2 級 物件者;分成D1、D2、D3、D4 四個級別;
(3) D3 級:指實體物件需用掃描器掃描成影像檔後,再將其中的文字影像以 OCR 的轉成文字資料之 A 級物件者;
(4) D4 級:指實體物件只需用數位式的裝置(如數位相機/攝影機、掃描器等)
輸入而產生A 級物件者。
依照上述物件的分級,即可進行將 D 級物件轉製成 C 級物件,然後將 C 級 和B 級物件製成 A 級物件的數位化工作。
二、 作品數位化程序
在此階段,需要訂立數位化程序的工作流程,數位化工作流程包括四種進行 方式(謝顒丞,2008):
(一) 以數位相機直接拍攝進行數位化;
(二) 以正片拍攝典藏品,再進行掃描數位化;
(三) 典藏品直接掃描數位化;
(四) 影音拍攝、錄製、轉檔、剪輯。這部分使用於影音類典藏品,或專家人 物專訪、活動之錄影、錄音等。
究竟該以何種方式進行數位化,則須依據典藏單位欲典藏之物件保存的狀況
滾筒式的掃描程序包括掃描程序包括掃描的前置準備(原件登錄並建立掃描 清單、檢查掃描正片與清洗、清潔滾筒、上油及貼正片、對焦與參數設定)、正 式掃描、後續作業(正片的清洗、檔案的檢查、儲存不同格式與規格的檔案);
平台式的掃描程序包括掃描程序包括物件提借、檢視文件保存狀況、擺放與固定 掃瞄物件、設備校正、預掃、掃描、歸還、掃瞄影像品質檢查與修整等作業。
數位拍攝則包括物件提借、檢視文物保存狀況、拍攝場地佈置、擺放與固定 拍攝物件、正式拍攝、物件歸還、檢視物件拍攝品質等的程序(謝顒丞,2003)。
拍攝必須要有充足的作業時間,才能有理想的拍攝品質。另外還需要建立色彩管 理模式,每個人對於色彩的感知不同,因此為了使典藏物件與數位影像檔案的顯 示正確的顏色,因此透過儀器以及標準化流程來定義色彩的數值。在數位影像色 彩管理有三個主要的流程,影像輸入、影像處理、影像輸出,如透過數位相機、
掃描器進行影像的擷取,Adobe Photoshop 作影像處理,影像輸出如螢幕顯示器畫 面顯示的影像、噴墨印表機、相紙輸出機、印刷廠等,這些載體都有不同的色彩 特性(李珮瑛、王雅萍、高朗軒,2009),因此在數位典藏過程中,每個階段的 色彩管理都必須要落實。進行校色的環境,需保持光線充足,對於檢視影像品質 之電腦螢幕同樣建議進行色彩校正,在進行檢視影像色彩呈現較有準則,以確保 製作出來的是最佳化的數位影像,有利於後續檔案輸出印製、加值應用。
製作完成的數位物件需轉錄到儲存的媒體並作備份,如 DVD 光碟或是外接 式硬碟(賴忠勤,2007),光碟燒錄完成後放置於無酸保存泡棉,存放於無酸保 存光碟套或光碟單片保存盒中,每盒正面需以無酸筆註明作品檔號,避免之後管 理不易。每張燒錄出來的光碟都需經過專業品管人員測試讀取、開檔,以確保檔 案沒有毀損,燒錄的光碟品質良好,以利於後續數位典藏資料庫的建置。
三、 後設資料標準訂立與編目
建立後設資料可以提供後續數位典藏資料庫的全文資料檢索,此部分的工作 包括確認後設資料的欄位,訂立欄位的規範。而依照典藏品類型的不同,所採用 之後設資料標準也因此不同。在國際後設資料標準中,目前藝術類的包含有:
Dublin Core(都柏林核心集)、CDWA(Categories for the Description of Works of Art, 藝術品描述類目)、VRA Core Categories(視覺資源核心類目)等。
(一) Dublin Core,都柏林核心集
都柏林核心集其特色是簡單,具延展性,跨學科,跨資料類型,其15 個主要 欄位為:Title (題名)、Subject (主題)、Description (描述)、Type (類型) 、Source (來 源)、Relation (關聯性)、Coverage (時空範圍)、Creator (主要作者)、Publisher (出 版者)、Contributor (其他作者)、Rights (著作權)、Date (日期)、Format (型式)、
Identifier (識別碼)、Language (語言)(Hillmann, 2005)。目前國內「數位典藏與 數位學習國家型科技計畫」建置的「數位典藏與數位學習成果入口網」即採用 Dublin Core 標準,參見圖 2-3。
圖2- 3 數位典藏與數位學習成果入口網採用都柏林標準
資料來源:http://catalog.digitalarchives.tw/dacs5/System/Search/Advanced_search.jsp
(二) CDWA,藝術品描述類目
CDWA 由 Getty 研究機構的藝術資訊專案小組(Art Information Task Force, AITF)所發展之標準,為藝術資料庫提供一個詳盡的結構指引,著重藝術品完整 的生命週期記載資訊,共有27 個主類目(Categories)(J. Paul Getty Trust & College Art Association, Inc., 2009),同時為了因應快速使用,CDWA 標準也推出了「CDWA Lite」,搭配網路資料擷取協定(Open Archives Initiative Protocol for Metadata Harvesting,簡稱 OAI-PMH),以增加應用的範圍以及資訊的互通與交換(蔡永 橙、邱志義,2007)。
(三) VRA Core Categories,視覺資源核心類目
VRA Core Categories 是由許多能被多次應用在建立描述視覺文化物件
(Object)及影像(Image)紀錄的一組元素集所構成,VRA 類目的次序是任意 的,資料庫建構者可視其需求來決定描述資料的適當順序(中央研究院後設資料 工作組研譯,2006),目前已發展到 VRA Core 4.0(Visual Resource Association, 2007)。 Dublin Core的 15個欄位為基 礎
不同的資料類 型間,以 Dublin Core的 15個欄位及 XML語法交換
圖2- 4 以 Dublin Core 為核心之設計理念 資料來源:陳昭珍,2005
四、 資料儲存與管理
數位化工作後,最重要的就是數位化之檔案該如何儲存與管理,檔案該儲存 於何種儲存設備中,需考慮經費、有無足夠空間放置儲存的設備等,資訊儲存相 關設備及架構,說明如下(賴忠勤,2007):
(一) 主機硬碟:一般僅作為作業系統、數位典藏系統運作之用,其擴充性有 限。
(二) 磁碟陣列(Redundant Array of Independent Disks, RAID)技術:避免硬 碟毀損所造成資料的損壞,可應用在主機硬碟、NAS、SAN 等儲存設備 中,磁碟陣列是把多個硬碟組合起來的。
(三) NAS (Network Attached Storage):作為網路儲存專用之儲存伺服器,可 以供多臺主機分享,價格較便宜。
(四) SAN (Storage Area Network):存儲區域網路,主機透過光纖網路連結光
(四) SAN (Storage Area Network):存儲區域網路,主機透過光纖網路連結光