• 沒有找到結果。

數位典藏國家型科技計畫 臺灣大學典藏數位化計畫-臺灣大學臺灣文獻文物典藏數位化計畫(子計畫一) 5/5

N/A
N/A
Protected

Academic year: 2021

Share "數位典藏國家型科技計畫 臺灣大學典藏數位化計畫-臺灣大學臺灣文獻文物典藏數位化計畫(子計畫一) 5/5"

Copied!
91
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會專題研究計畫 成果報告

數位典藏國家型科技計畫 臺灣大學典藏數位化計畫--臺灣

大學臺灣文獻文物典藏數位化計畫(子計畫一) 5/5

研究成果報告(完整版)

計 畫 類 別 : 整合型 計 畫 編 號 : NSC 95-2422-H-002-001- 執 行 期 間 : 95 年 01 月 01 日至 95 年 12 月 31 日 執 行 單 位 : 國立臺灣大學資訊工程學系暨研究所 計 畫 主 持 人 : 項潔 計畫參與人員: 1:陳光華、邱婉容、鍾月華、李沐嫻、陳慧怡、粘芸蓁、張 家瑋、吳哲叡、于維林、許玲華 2:洪淑芬、郭嘉文、郭美玲、呂淑惠、江玉婷 處 理 方 式 : 本計畫涉及專利或其他智慧財產權,1 年後可公開查詢

中 華 民 國 96 年 03 月 09 日

(2)

行政院國家科學委員會補助專題研究計畫

□期中進度報告

臺灣大學臺灣文獻文物典藏數位化計畫

計畫類別:□ 個別型計畫 ■ 國家型計畫

計畫編號:NSC

95-2422-H-002-001-執行期間:95 年 1 月 1 日至 95 年 12 月 31 日

計畫主持人:項潔教授

共同主持人:陳光華教授

協同研究人員:邱婉容主任

計畫參與人員: 洪淑芬、郭嘉文、郭美玲、江玉婷、呂淑惠

鍾月華、陳慧怡、李沐嫻、張家瑋、粘芸蓁、吳哲叡、于維

林、許玲華等

成果報告類型(依經費核定清單規定繳交):□精簡報告 ■完整報告

本成果報告包括以下應繳交之附件:

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

處理方式:除產學合作研究計畫、提升產業技術及人才培育研究計畫、列

管計畫及下列情形者外,得立即公開查詢

□涉及專利或其他智慧財產權,□一年□二年後可公開查詢

執行單位:國立臺灣大學圖書館

中 華 民 國 九 十 五 年 十二 月 三十 日

(3)

中文摘要

本計畫所進行的數位化資料包括《淡新檔案》、《臺灣古拓碑》、《伊能嘉矩手稿》三部 分。《淡新檔案》乃西元1776 年至 1895 年間臺北府、淡水廳及新竹縣的行政及司法相關檔 案。《臺灣古拓碑》則是日據時代日本學者拓印歷史古蹟碑文、廟宇等特殊建築之牆壁銘文 與雕刻或樑柱對聯等,使部分已不存在、因改建或重新裝潢而消失的臺灣歷史遺蹟之內涵得 以保存。《伊能嘉矩手稿》包括伊能先生手稿、出版資料、報章雜誌剪報,以及日本岩手縣 遠野市立博物館及其遺族收藏的相關資料。本計畫除將以上三種資料影像數位化外,《淡新 檔案》、《臺灣古拓碑》亦將內容文字數位化。本計畫之最終目標是為此三類資料的數位化成 果,建置為互動式資料庫,方便檢索使用。 關鍵詞:臺大圖書館、數位典藏、淡新檔案、臺灣古拓碑、伊能嘉矩手稿

Abstract

National Taiwan University Library holds abundant Taiwan Studies materials which are now essential resources for researches in Taiwan history and culture. The collections being digitized in this project include “Tan-Hsin-Tang-An”, Taiwan Cultural Relic Rubbings and the manuscripts of Ino Kanori (1867-1925).

“Tan-Hsin-Tang-An” is the complete collection of 19,152 documents of 1,621 administrative and judicial court cases of northern Taiwan (including the Taipei Fu, Tanshui Ting, and Hsinchu Prefecture) from 1776 to 1895. This collection reveals many different facets of the Taiwan society during the reign of the Qing Dynasty and is an indispensable first-hand source for the study of Taiwan economics, law and society.

Taiwan Cultural Relic Rubbings held in the National Taiwan University Library were made during Japanese Occupation. They were transformed from the sculptures on monuments, temples, etc. Some of those monuments or old buildings are no more in existence now. The rubbings, well conserved in the Special Collections Department of National Taiwan University Library, are important resources for the study of Taiwan culture and history, even garden layout designs and calligraphy arts.

Ino Kanori was a Japanese anthropologist who came to Taiwan in 1895, immediately after the secession of Taiwan to Japan by the Qing Danysty. Ino, a pioneer in field studies in Taiwan, conducted extensive in-depth research in the languages, customs, and cultures of the indigenous Taiwanese people through field trips and interviews. The countless manuscripts he left behind are invaluable for anthropologists and historians.

(4)

Images and metadata records for each collection will be integrated into an information retrieval system. The public will then be able to access to the treasuries over Internet.

關鍵詞:National Taiwan University Library、Digitization Techniques、Tan-Hsin-Tang-An、 Taiwan Cultural Relic Rubbing、Ino Kanori Manuscripts

(5)

九十五年度「臺灣大學典藏數位化計畫」

臺灣大學臺灣文獻文物典藏數位化計畫

研究報告書

目 次

一、 計畫概述 ...

1 (一)計畫名稱 ...1 (二)計畫目標 ...1 (三)計畫內容 ...2 (四)計畫時程 ...2 (五)計畫架構...3 (六)參與人員 ...4 (七)經費運用 ...6 (八)執行方法 ...7 (九)執行過程 ...8

二、執行成效 ...

10 (一)計畫成果 ...10 1. 數位化內容簡介 ... 10 2. 設定的規範與標準 ... 13 (1)產出規格 ... 13 (2)作業規範 ... 14 (3)採行標準 ... 15 (4)工作程序 ... 15 (二)計畫管理 ...16 (三)後續工作構想之重點 ...17

三、執行成果 ... 19

四、評估主要計畫成果之價值及貢獻度...

23

五、檢討與展望 ... 24

附件

附件一:

臺灣大學臺灣文獻文物典藏數位化工作注意事項及工作原則

.25 附件二:

資料修裱記錄表

...35 附件三:

國立臺灣大學圖書館《淡新檔案》檔案命名規範....

... 36 附件四:

國立臺灣大學圖書館《伊能嘉矩手稿資料庫》檔案命名規範

..43 附件五:

國立臺灣大學圖書館數位化影像製作規範. ...

44

(6)

附件六:

臺大圖書館淡新檔案欄位及其與臺灣史料 metadata 欄位對應

表...

61 附件七:

臺大圖書館伊能嘉矩手稿欄位對應表...

67 附件八:

臺大圖書館伊能手稿四種檢索欄位與索引欄位對應一覽表...

77 附件九:

淡新檔案_Metadata 建檔須知...

78 附件十:

淡新檔案印刷出版校稿注意事項...

84 附件十一:

淡新檔案數位化流程圖...

87

(7)

九十五年度「數位典藏國家型科技化計畫」

臺灣大學臺灣文獻文物典藏數位化計畫

結案報告書

一、 計畫概述

國立臺灣大學圖書館成立歷史悠久,自日據時期以來,收藏資料範

圍廣泛,館藏中包涵多種具有珍貴性與獨一性之文獻文物資料,均為學

術研究上的重要資源。然過去因資料脆弱,難以使用,無法滿足研究學

者之需。本館於民國八十七年、八十八年曾執行「國科會數位博物館專

案先導計畫──淡水河溯源」,自九十年度起參與「國家典藏數位化計

畫」

,得以整體性地規劃珍貴館藏資料之數位化;自九十一年度起持續參

與「數位典藏國家型科技計畫」

,加速館藏臺灣文獻文物資料的數位化與

資料庫建置,使該批深具臺灣文化特色之資料早日供眾使用,裨益學術

研究之推展。

本計畫將國立臺灣大學圖書館典藏之珍貴臺灣文獻文物三大資料群

《淡新檔案》

《伊能嘉矩手稿》

《台灣古拓碑》加以數位化;計畫執行以

影像與全文之數位化並行,且為每一件資料建立「詮釋資料」

(metadata)

進而為各種資料建置資料庫。最後透過網站,將本館珍藏資料之資料庫,

提供學界檢索利用,並進行推廣教育。臺灣大學圖書館執行此計畫乃是延

續近年來努力進行之館藏特藏資料之全文與影像數位化工作。在電腦新科

技的應用下,珍貴的典藏資料方得以資料原貌的形式,呈現在研究者眼

前,達成保存與供眾使用雙重功能。

(一) 機構計畫名稱:

「臺灣大學典藏數位化計畫」:臺灣大學臺灣文獻文物典藏數位化計畫

(二)計畫目標:

(8)

將國立臺灣大學圖書館典藏之珍貴臺灣文獻文物加以數位化;不僅

將資料之影像進行數位化,且將資料之內容進行全文輸入與斷句、為每

一件資料建立「詮釋資料」

(metadata),進而為各種資料建置資料庫。最

後透過網站,將本館珍藏資料之資料庫,提供學界檢索利用,並進行推

廣教育。

(三)計畫內容:

國立臺灣大學圖書館就下列珍藏資料進行影像及全文數位化、資料

內容判讀與斷句、metadata 建檔,以及資料庫建置:

一、

《淡新檔案》

二、

《伊能嘉矩手稿》

三、

《臺灣古拓碑》

(四)計畫時程:

民國 95 年 1 月 1 日──民國 95 年 12 月 31 日

(9)

(五)計畫架構

臺灣文獻文物典藏數位化計畫 淡新檔案 臺灣古拓碑 伊能嘉矩手稿 影像數位化 全文標校 影像數位化 全文標校 影像數位化 影像掃瞄 影像檢驗 影紙本輸出 影像光碟 全文排版 成書出版 轉全文PDF 檔 拍攝正片 掃描底片 影像檢驗 影像紙本及光碟 影像掃瞄 影像檢驗 影像光碟 網頁及資料庫 網頁 綜合檢索資料庫 計畫概述 內容簡介 經驗分享 相關規範 三種資料群metadata 建檔 資料庫影像嵌入浮水印 資料庫介面及管理系統設計 數位化成果匯入 資料庫系統維護 網站資料更新及維護 全文排版 轉全文PDF 檔

(10)

(六)參與人員:

計畫總主持人:陳泰然(國立臺灣大學副校長)

子計畫主持人:項潔(國立臺灣大學資訊工程學系教授兼圖書館館長)

共 同 主 持 人 : 陳光華(國立臺灣大學圖書資訊學系副教授)

協同研究人員:邱婉容(國立臺灣大學圖書館特藏組主任)

專任研究助理:鍾月華、陳慧怡、李沐嫻、張家瑋、粘芸蓁、吳哲叡、于維

林、許玲華

研究人員:

洪淑芬、郭嘉文、郭美玲、江玉婷、呂淑惠

(11)

姓 名 職 稱 人 數 年齡層 分佈 專 長 主 要 工 作 內 容 項 潔 主持人 教授、館長 1 51-60 自動推論、電子 圖書館與博物 館、程式邏輯、 代理型程式。 計畫整合與進度督導 陳光華 共 同 主 持 人 1 41-50 資訊檢索、自然 語言處理、電子 圖書館 規劃系統建置整合相關事宜 邱婉容 協 同 研 究 人員、 主任 2 41-50 行政、計畫整體 規劃 規劃計畫相關工作之進行 督導系統整合相關事宜 洪淑芬 計畫執行之規劃 擬定規格、資料建置督導 郭嘉文 計畫作業管控 數位化作業程序協調、執行進度管 控、執行成果監驗 郭美玲 編審 3 30-50 計畫作業管控 系統建置執行 呂淑惠 數位化作業程序協調、執行進度管 控、執行成果監驗 江玉婷 組員 2 30-50 計畫作業管控 系統建置執行 鍾月華 數位化素材整理、資料建置及彙整 陳慧怡 數位化素材整理、資料建置及彙整 李沐嫻 數位化素材整理、資料建置 張家瑋 數位化素材整理、資料建置及彙整、 行政庶務 粘芸蓁 數位化素材整理、資料建置 于維林 數位化素材整理、資料建置 吳哲叡 數位化素材整理、資料建置 許玲華 助理 8 20-60 學歷背景: 圖書資訊 數位化素材整理

(12)

(七)經費運用:

確實謹守「專款專用」之原則,各筆帳目均詳列支出明細。各筆建檔費用報

帳時,均載明單價、字數、筆數等。

本年度本計畫執行經費為 NT$8,725,000。經費分配及各項經費支出之詳細情

形如下表所示:

單位:元

1 計畫本年度為符合辦理國科會科會助理離職儲金人員共七名,故由管理費流出 125,542 元,流入人事費以便離職儲金之辦 理。 預算科目 核定金額 95 年累計支用額 執行率 保留 額 執行情形說明 人事費 3,303,200 ( 原 核 定 : 3,303,200,由管理費 流入 125,542,流出 其他費用 505,752) 2,922,990 88% 0 其他費 用 4,000,000(原 核定 4000,000,由人 事費流入 505,752) 4,505,752 113% 0 經常 門 管理費 921,8001 (原核定:921,800, 流入人事費 125,542) 796,258 86% 0 1. 人事費:聘僱專任助理 7 名,負責日常行 政庶務(薪資報帳、公文傳遞)、計畫書/ 管考/執行進度等書面資料答覆、建檔資料 彙整、數位化素材整理及其他臨時交辦事 務。 2. 其他費用: a、 資料處理費:數位化資料轉檔、數位 化資料備份、瑕疵影像補掃及紙本輸 出、影像檔檢驗、資料檢索、後設資 料(metadata)建檔、全文電子檔打 字、古文書斷句標點、metadata 校 正、全文電子檔校正、metadata 增 補、古文書全文電子檔排版等。 b、 雜費:光碟、磁片、墨水匣、碳粉夾、 鍵盤、滑鼠等電腦耗材、印表機用 紙、辦公文具、原件影本影印及裝訂 (全文打字、校稿、metadata 建檔使 用)、影印 (計畫書/管考報告/會議 記錄)、工作紀錄照片沖洗、參加國 內研討會差旅費(參觀其他機構計畫 及訪查計畫相關文獻資料)等。 3. 管理費:行政管理、水電等費用 資本 門 儀器設 備費/ 研究設 備費 500,000 500,000 100% 0 1. 研究設備費: a、 印表機等電腦周邊設備:計畫專任助 理處理行政庶務、後設資料建檔、繕 打檔名清單、數位化影像檢查、全文 PDF 檔掃瞄等使用。 b、 磁碟陣列:儲存數位化成果。 c、 數位化儲存設備:儲存數位化成果 (光碟、輸出紙本)。 d、 外接式硬碟:數位化成果備份。 小計 8,725,000 8,725,000 100% 0

(13)

(八)執行方法:

國立臺灣大學圖書館於執行本計畫時,特別以下列方法,使上述數位化

之過程中,得以達到正確且嚴謹地執行每一必要的工作,並確實掌握進度、

記錄工作成果之目的:

1. 針對主要的數位化工作如資料清點、資料維護、影像數位化、全文

數位化、Metadata 建置、資料庫建置等,擬訂「國立臺灣大學圖書

館文獻文物典藏數位化工作注意事項及工作原則」(附件一),作為

數位化工作的指導原則。

2. 製作詳細的資料清單,以供資料修裱及數位化工作時,記錄原件調

取與歸還之需,確保珍貴資料不致被誤置或遺失。

3. 對於需要修裱之文件,逐一確實填寫「資料修裱記錄表」

(附件二),

詳實記載每件資料修裱前後之狀況,以作為修裱後瞭解資料原貌之

憑。

4. 製作各種資料的工作進度記錄表,有助於每一階段工作成果的統計。

5. 製作檢驗數位成果品質之記錄表,例如「《淡新檔案》影像檢查記錄

表」

,以利日後進行修正作業之用。

6. 在 Metadata 格式、系統程式等相關決策的形成過程中,除於早期多

方請教專家以及有類似資料數位化經驗之機構外,並於機構內,由

負責內容建置之同仁與系統程式撰寫人員透過數次會議,詳加說明

討論,且將於程式初步完成後,進行測試並不斷加強功能,以期產

出最適於整合各資料群及便利讀者使用之系統。

(14)

(九)執行過程:

九十五年度「臺灣大學臺灣文獻文物典藏數位化計畫」共針對三種資

料進行數位化。本年度為九十四年度計畫之持續,重點工作為 Metadata 建

檔、全文建檔與校對與影像數位化等,詳細情形如下:

1.《淡新檔案》:

a. 資料修復:

根據九十年度完成之盤點記錄,系統性地進行破損資料之修裱

工作:為維護資料的完整性,並使資料在使用時不致輕易裂損,以

及使文件在日後進行數位化工作時能順利處理,對於殘破之件,依

序進行修裱,一者可達到維護文獻文物之功能,另者可使數位化影

像易於判讀。

b. 浮水印嵌入:

由國家經費支援數位化完成之資料,雖然目的在於提供使用,

然對於使用者之使用行為,仍必須加以規範,防犯侵權行為之發生。

本館業於九十二年度完成浮水印嵌入之測試,並開始進行浮水印之

嵌入,九十五年度將繼續將已整理完畢之數位影像檔進行浮水印之

嵌入作業,以保護本館智慧財產權。

c. 全文輸入與標點:

持續進行全文輸入與標點,準備下一階段之排版、印刷、全文

PDF 分件轉檔工作。

d. 全文檔排版與校對:

就輸入之全文文字進行排版、校對及注釋之工作。

《淡新檔案》

至 91 年已出版第 1-8 冊,93 年出版第 9-12 冊,94 年出版第 13-16

冊,95 年度已完成第 17-20 冊之出版。

《淡新檔案》之資料庫將同時

提供原件影像檔與全文 PDF 檔供使用者對照參用。

e. Metadata 建檔:

(15)

Metadata 之主題、關鍵字欄位,參考《淡新檔案》原由戴炎輝

教授創立之分類架構,使未來研究者於使用該資料庫時,仍能依原

已習慣之按類查找方式,找尋需使用之資料。另外,在人名、地名

等欄位的建置,也有所加強,裨使資料檢索,更具效率。

f. 數位化成果匯入資料庫檢索系統

檢查影像連結的正確性,以及數位影像的網路呈現效果。

2.《伊能嘉矩手稿》

a. 數位影像檔檢查:

逐一開啟影像檔,檢查掃描範圍之選取是否合乎規定,並確認

各個檔案是否完整燒錄,可順利開啟。

b. 浮水印嵌入:

由國家經費支援數位化完成之資料,雖然目的在於提供使用,

然對於使用者之使用行為,仍必須加以規範,防犯侵權行為之發生。

因此,本館於九十三年開始將已整理完畢之數位影像檔進行浮水印

之嵌入作業,九十五年度將繼續將已整理完畢之數位影像檔進行浮

水印之嵌入作業,以保護保護本館智慧財產權。

c. Metadata 建檔:

依照訂定之 Metadata 建置規範,進行各欄位之資料建置工作。

d. Metadata 校正:

就已建置完成之 Metadata 進行核對工作,逐一檢查每筆資料各

欄位使否正確無誤,除更正錯誤欄位資料,並同時增補其他新增資

料。

e. Metadata 與影像連結檢查

核對 Metadata 檔與影像檔連結之正確性,將有問題之資料或影

像檔加以記錄,未來將批次改正及重新掃描。

(16)

f. 數位化成果匯入資料庫檢索系統。

檢查影像連結的正確性,以及數位影像的網路呈現效果。

3.《臺灣古拓碑》

a. 影像數位化(補拍攝):

(a) 先拍攝為黑白負片

(b) 以片匣式掃描機分區掃描負片為數位檔

(c) 將分區之數位檔進行接圖

b. 全文數位化:

(a) 逐件輸入全文文字

(b) 進行全文斷句標點

(c) 將全文文字,根據原碑文之樣式進行排版,以利使用者對照研究。

c. Metadata 建檔:

(a)依照訂定之 Metadata 建置規範,進行各欄位之資料建置工作。

(b)查核原碑之存廢

參考現有之碑碣參考工具書,逐件確認原碑之存廢、或被遷

移後之現址,將之著錄於 Metadata 之中,以利學者查考利用。

d.數位化成果匯入資料庫檢索系統

檢查影像連結的正確性,以及數位影像的網路呈現效果。

二、執行成效

(一)計畫成果

1. 數位化內容簡介:

(17)

本計畫預計於五年內將臺灣大學圖書館珍貴典藏之文獻資料加以整理

並數位化,包括圖書、檔案、文書、拓本等資料;數位化之資料加以彙整後,

建置典藏數位資料庫。本子計畫擬完成數位化之館藏資料庫包括:

(1)淡新檔案全文及影像資料庫

在現存的清代臺灣省、府、州、縣廳署檔案中,以「淡新檔案」

最具規模、完整而亙及長時間。該資料是清乾隆四十一(1776)年至光

緒二十一(1895)年臺灣淡水廳、臺北府及新竹縣之行政與司法檔案。

日人稱之為「臺灣文書」。台北帝大時期承接該批檔案後,並未整理,

迨至民國三十六年底,本校法律系戴炎輝教授始予進行整理工作,至民

國四十二年三月完成,歷時五年三個月,並重新命名為「淡新檔案」。

將檔案內之文件分為行政、民事及刑事三大編,共 1,163 案,19,152

件,內容以財政、撫墾、田房、錢債、財產侵奪、人身自由、風化等類

為最多,類別則以行政編最多,以年代計則以光緒年間最多。該批檔案

中由上級機關(省、府)發出之札飭或示諭,不僅資料甚為珍貴,且可

窺知台灣府政或省政之一斑,其餘案件亦可明瞭清代廳縣之行政。本檔

案為研究前清時代臺灣行政、司法、經濟、社會、農業等極具價值之第

一手資料,尤對研究清季臺灣法制史、地方行政史、社會經濟史等深具

學術價值,可謂是本館鎮館之寶。

(2)伊能嘉矩手稿影像資料庫

「伊能文庫」為台北帝大時期圖書館蒐購之第一個特藏文庫,為

日本臺灣研究學者伊能嘉矩之珍貴手稿、手繪圖、書信、照片、田野調

查筆記、早期期刊及報紙剪貼等臺灣日據時期珍貴史料。入藏經過及內

容特色謹略述如后:

伊能嘉矩(1867-1925)為臺灣研究之先驅學者。臺大圖書館於

1928 年台北帝國大學開校前,透過臺灣總督府東京出張所,自日本岩

手縣遠野市伊能嘉矩遺族購入伊能嘉矩手稿、書信、藏書及臺灣原住民

(18)

器物一批,入藏文政學部「土俗學、人種學講座」研究室。後圖書館成

立,始將圖書資料部分移入圖書館收藏,即「伊能文庫」,器物部分仍

留土俗人種學(今之人類學系)標本陳列室,成為該室的重要收藏。圖

書資料當中包含伊能先生之有關臺灣研究之圖書、手稿、剪報、照片等

珍貴資料,資料類型大致分為下列數類:

a、 明治、大正時代所出版的臺灣關係洋裝書

b、 伊能嘉矩蒐集的清代刊本

c、 伊能嘉矩手鈔的資料集及其匯編

d、 伊能嘉矩的採訪調查筆記

e、 伊能嘉矩的著作及未刊原稿

f、 他人的意見書、調查資料

g、 雜誌、報紙剪貼

其中第(c)至(g)項為手稿及剪貼資料,甚為珍貴。

本館於民國 87 年 11 月至 12 月間為慶祝創校七十週年校慶,特舉

辦「伊能嘉矩與臺灣研究特展」

,除將本館所藏伊能文庫中手稿、剪貼、

線裝書及重要圖書展示外,並商借本校人類學系所藏伊能氏所收集之原

住民器物二十三件,及日本伊能氏家屬與遠野市立博物館所藏之伊能手

稿、手繪圖、書信、照片等第一手資料,參與展出,同時編製出版《伊

能嘉矩與臺灣研究特展專刊》乙書,登載數篇專文,分別介紹伊能嘉矩、

本館所藏「伊能文庫」

、伊能嘉矩的臺灣研究等,另收錄「伊能嘉矩年

譜」

「伊能嘉矩著作目錄」

「伊能嘉矩研究目錄」等參考文獻,可提供

臺灣或平埔族研究之學者專家參考。本館除將館藏「伊能文庫」中之珍

貴手稿、田野調查筆記、早期期刊及報紙剪貼、照片等進行數位化工作

外,亦將日本所藏伊能資料之數位化工作於本計畫中執行。

(3)日據時期臺灣地區拓碑全文及影像資料庫

本館於 86 年 12 月自人類學系接收日據時期臺北帝大蒐集之臺灣

地區古拓本,內容含「臺灣府城碑」

、赤崁樓之「報恩閣碑」

、臺南「龍

山寺碑記」、臺南開元寺「鄭成功之書」等共 189 餘幅,其中包括不

(19)

少實物已毀損不存者,因此這批文化遺產堪稱無價瑰寶。

2. 設定的規範與標準:

(1)產出規格

a.

Metadata:以 Dublin Core 的著錄基本欄位項目為依據,設計適用

於古文書、照片、拓本等不同類資料之 Metadata 欄位格

式。

b. 數位影像檔:

b-1.《淡新檔案》

1. 典藏級 Tiff 檔:全彩,300 dpi

2. 電子商務級 JPEG 檔:Tiff 檔壓縮為 1/85

3. 公共資訊級 JPEG 檔:

for display and net-print:150 dpi

for display only:75 dpi

b-2.《臺灣古拓碑》:

先拍攝 4*10 黑白負片,再掃描底片為 Tiff 檔(還原後為 400

dpi)

,然後接圖。接圖完成後,將之轉檔為適宜網路傳輸用的

JPEG 檔。

b-3.《伊能嘉矩手稿》

直接掃描:全彩,300-600 dpi

c.

數位文字檔:

c-1.《淡新檔案》

:初步輸入為純文字檔,以標校排版完成之 word 檔

分件轉檔輸出為 pdf 檔。

說明:《淡新檔案》印刷版至今已出版至第二十冊。印刷版之出

版費用由本館業務費支出,僅全文輸入與文字校稿、PDF

(20)

檔轉檔之費用由本計畫支付。《淡新檔案》需進行全文打

字及全文標點,因原件多於行間含有小字雙行並排之情

形,前已有八冊已出版印刷之書籍,此部分採掃描方式取

得全文影像檔,一者可節省文字輸入之費用,另者可節省

校核之工夫。第九冊起則利用標校排版完成之 Word 檔,

以轉檔方式輸出成影像檔,以節省掃描所需之人力及時

間。未出版之部分,本館將持續進行打字及排版工作。

資料內容之全文打字建檔作業將採外包方式,承製人員需

依本計畫擬定之打字建檔規範進行打字。至於全文標點之

部分,本館聘請具學科背景(例如歷史系)或曾修習過淡

新檔案相關課程之研究生,使其依照本計畫所訂定之全文

標點規範(如附件十,

《淡新檔案》印刷出版校稿注意事

項)

,進行全文標點。原文艱深者,另延請專家學者幫助

解讀。

c-2.《臺灣古拓碑》:初步輸入為純文字檔,以標校並依原件樣

式排版之 word 檔轉檔輸出為 pdf 檔。

(2)作業規範

本計畫所將數位化的資料數量甚多,從事工作的人員因此為數亦

多,而在長時期的計畫執行期間,工作人員不免有所異動。為使不同

時期、不同人員的工作,能維持一致性,達到齊一的標準,本館特於

各項數位化工作進行之前,訂定相關的規範。各種規範於工作人員開

始參與工作之前,或為個人進行個別解說,或以小型集會之方式進行

說明。以下列舉之作業規範,為目前執行數位化工作之依據,大多收

錄於《數位典藏技術彙編:2002 年版》之中:

a. 伊能手稿數位化規格-3

b. 《淡新檔案》檔案命名規範(附件三)

c. 《伊能手稿》檔案命名規範(附件四)

d. 臺灣大學數位化影像規格暨影像製作說明:(附件五)

(a)

《淡新檔案》

(b)

《伊能手稿》

(21)

(c)

《臺灣古拓碑》

e. 臺大圖書館淡新檔案欄位及其與臺灣史料 Metadata 欄位對應表

(附件六)

f. 臺大圖書館伊能手稿欄位及其與臺灣史料 Metadata 欄位對應表

(附件七)

g. 臺大圖書館伊能手稿四種檢索欄位與索引欄位對應一覽表(附件

八)

h. Metadata 建檔規範說明:以《淡新檔案》為例 (附件九)

i. 古文書校稿及排版說明:以《淡新檔案》為例 (如附件十)

j. 古文書數位化流程:以《淡新檔案》為例 (如附件十一)

(3)採行標準

a. Metadata:以國際標準之一的 Dublin Core 為依據,設計適用的

Metadata 欄位格式(請參見前述清單)

b. 數位影像檔:本館進行數位化的資料,因尺寸、資料狀況特殊,各

有不同考量與製作方式,故解析度規格有所差異。但

本館各資料群數位檔之解析度,均足以提供不同目的

之使用。

(4)工作程序

a.

《淡新檔案》

盤點/記錄修裱需要、記錄浮貼位置、製作清單 Æ 繕打檔名 label

(於掃描時補助原件已褪色之編號) Æ 修裱 Æ 掃描、轉檔 Æ 檢

查影像檔 Æ 全文輸入、標點、校對、印刷 Æ 轉檔已排版之全文檔

為 PDF 檔 Æ 檢查 PDF 檔 Æ Metadata 填表製作 Æ Metadata 輸入

建檔 Æ 檢查修正 Metadata Æ 將各種數位檔交與系統資訊人員後

b. 《伊能嘉矩手稿》:

檢查影像檔 Æ 補掃瑕疵影像檔 Æ 建置 Metadata Æ 檢查及修正

(22)

Metadata(確認影像檔與 Metadata 檔是否對應無誤 Æ將各種數位

檔交與系統資訊人員後續

c.

《臺灣古拓碑》:

繕打檔名 label(於掃描時補助原件未編號之不足) Æ 修裱 Æ 拍

攝正片、掃描正片及接圖、轉檔 Æ 檢查影像檔 Æ 全文輸入、標點、

校對 Æ 修正全文電子檔 Æ轉檔已排版之全文檔為 pdf 檔Æ檢查

pdf 檔Æ Metadata 填表製作 Æ Metadata 輸入建檔 Æ 檢查修正

Metadata Æ 將各種數位檔交與系統資訊人員後續

d. 檢索程式與網頁:

設計個別 Excel 檔之程式 Æ 輸入表格Æ設定欄位 mapping table Æ

歸納資料之 metadata 內容 Æ 根據歸納結果,撰寫檢索程式,並彙

整所有資料於資料庫中Æ設計網頁,永續經營維護。

(二)計畫管理

本計畫與相關計畫的配合包括 1.臺灣大學校內整合;2.配合「數位典

藏國家型科技計畫」聯合目錄之製作;3.提供數典國家型科技計畫訓練推廣

之用等,分述如下:

1. 臺灣大學校內整合

臺灣大學典藏數位化計畫共有七個子計畫參與「數位典藏國家型科

技計畫」

,即「臺灣大學臺灣文獻文物典藏數位化計畫」

「臺灣大學植物

標本館典藏數位化計畫」、

「臺灣大學昆蟲標本館典藏數位化計畫」、「臺

灣地質科學典藏數位化博物館」

、「臺灣大學人類學系典藏文物數位化計

畫」

、「臺灣大學動物博物館典藏數位化計畫」

、「臺灣大學數位典藏技術

研發計畫」等。為了機構內之充分協調、充分分享數位化經驗,並及時

傳達與說明、討論計畫辦公室之交辦事項,定期召開本校七個子計畫之

會議。並且由第七子計畫開發 e-KM 知識管理系統,有效管理文件、分享

執行經驗避免錯誤及冗長的摸索過程,整合各子計畫性質相似之數位化

(23)

原件,建立各種不同性質之資料群所適用之標準數位化工作流程。透過

內部會議報告及 e-KM 系統、分享經驗、聘請學者作專題解說、開課講授

等各種形式之活動,本機構各參與數位化計畫的子計畫工作人員,於數

位化過程中,在各項作業規範、人員培訓、問題處理、資訊分享等均彼

此協助,得以迅速有效的學習相關知識,並瞭解不同領域之藏品特色,

提供工作人員多角度的思考與智能,發揮整合型計畫之功效。是機構內

資源的充分利用,也是機構內合作精神的發揮與落實。

此外,本計畫除將原件影像及資訊妥為典藏,更已與本校其他子計畫

之資料庫整合,建立臺灣大學數位典藏聯合目錄,讓使用者得以彈指間掌

握臺灣大學珍貴文物精髓。

2. 配合「數位典藏國家型科技計畫」聯合目錄之製作

「數位典藏國家型科技計畫」內容發展分項計畫規劃建置聯合目

錄。本子計畫配合建置聯合目錄之需要,於相關的內容發展分項計畫主

題小組舉辦會議時,均出席報告、參與討論,並提供資料建置主題的聯

合目錄,並依聯合目錄有關共通欄位之規劃,將本館已完成的《淡新檔

案》

、《伊能嘉矩手稿》

、《臺灣古拓碑》metadata 轉換為 XML 格式提供建

置聯合目錄。

3. 提供

數典國家型科技計畫

訓練推廣之用

本子計畫於 92 年度起,將整理好的數位檔陸續進行浮水印嵌入之工

作,並配合「數位典藏國家型科技計畫」各計畫舉辦之活動,將已嵌入

浮水印之影像檔儘速轉入資料庫以供推廣訓練活動之用。

(三)後續工作構想之重點

本計畫自「數位典藏國家型科技計畫」的先導計畫「國家典藏數位化計畫」

即開始參與執行,至今已累積相當的數位化成果,利用該已產出之數位化成果,

未來擬從事之工作構想如下:

1.將數位化資訊轉化為可使用的知識—第二期計畫

第一期計畫重點在於將資料數位化並建置銓釋資料,而這些數位化資料要

(24)

能為學者專家充分用於研究教學,必須將第一期完成的數位化資料藉由各式工

具轉化為可使用且合於學者專家所需的知識。故規劃在第二期計畫中,與相關

系所合作,發展索引典、職官表、年表、GIS 等相關工具,與第一期完成的淡新

檔案、臺灣古碑拓本、伊能嘉矩手稿數位化資料及第二期建置的數位典藏結合,

使真正成為能為學者專家所用之資料。

2.完整呈現日治時代至光復初期臺灣研究資料—第二期計畫

臺大圖書館典藏許多日治時代臺灣研究第一手資料,第一期計畫進行的淡

新檔案、臺灣古碑拓本、及伊能嘉矩手稿乃為其中之一部分。為完整呈現日治

時代至光復初期臺灣研究的第一手資料,擬將本館典藏的其他臺灣研究資料,

如田代安定手稿(臺灣植物調查與規劃)

、狄寶賽文庫(中美合作的建設歷史研

究)、歌仔冊等進行數位典藏,豐富國內生物多樣性、美援臺灣時代史料以及臺

灣傳統語言音樂等之研究資源,促進相關領域之研究。

3. 發展數位典藏之教學研究應用—第二期計畫

針對第一期淡新檔案數位成果,除了在本年度規劃完成淡新檔案教學圖書

光碟的製作之外,第二期計畫將進行《淡新檔案》學習知識網,建置淡新檔案

知識庫及淡新檔案的數位教材,透過線上教材的建置及建立研究所需之工具與

環境的雙軌努力,提升數位典藏在高等教育與學術研究利用之深度與廣度。

4.持續進行修復破損資料,以利數位化作業的進行

為能順利進行影像掃描及全文建檔作業,必須先將破損資料加以修復,原

始文件圖文方能完整呈現於數位檔中,同時有利於資料之長久保存。凡資料狀

況不良而不適數位化者,即取出先行修復。修復工作由具修復古籍技術之技師

進行之。而為顧及資料之安全,將以徵得技師駐館並配合於上班時段內進行修

復工作為原則。

第二期計畫擬進行的數位典藏資料,如田代文庫等,仍有部分需要修復,

因此本館於第二期仍將持續進行典藏資料的修復,以使影像數位化作業得以順

利完成。

(25)

三、執行成果(output)

(一)論文發表項數

會議(期刊)名稱

論文名稱

日期(年/月)

地點

發表人

說明(註)

數位時代圖書館館藏發展研討會 臺灣機構典藏發展芻議 2006/01 中興大學圖書館 項潔、洪筱盈

(二)、文章發表項數

會議(期刊)名稱

文章名稱

日期(年/

月)

地點

發表人

說明

大學圖書館 University Library Journal RFID 技術之應用實務及其與圖書 館暨校園 e-commerce 之建立 RFID Technology Applications and a Discussionof RFID-enabled e-commerce for Campus/

Libraries 2006/3 10 卷 1 期 P.67-87 游張松‧洪淑 芬 國家圖書館館刊 National Central Library Bulletin 網路資源備份保存技術與應用探 析

Web Preservation: with Introduction to Required Techniques and Applications

2006/12, 2006 Number 2 洪淑芬

(三)94 年其他成果(例如:光碟、書籍…等)

項目

創作代表人

內容

日期(年/月)

淡新檔案 17-20 冊 吳密察、項潔 淡新檔案民事編:人事、田房 2006/10

(26)

(四)95 年度數位產出清單:

實體數位化類型 文字資料 多媒體資料 後設資料 子計畫 名稱 資料群 細目名稱 內容 主題2 數位 化產 出3 1. 文獻 掃描 (頁 ) 2. 文字 輸入 (字) 3. 目錄/ 書目/ 標籤 (筆) 4. 2D 影像檔 (張) 5. 3D 影像 檔 (張 ) 6. 聲音 (Audio) (小時) 7. 影片、 動態 影像 (Video) (小時) 8. 動態 影音 (Flash ) (小 時) 9. 其他 (請註明 類型、數 量及單 位) 電腦 儲存量 (MB) 筆數 MB 工作 描述 台灣大學 台灣文獻 文物典藏 數位化計 畫 《淡新 檔案》 全文輸入 E 實際 2,900,000 13.5 文字鍵入 全文標點 (21-24 冊) E 實際 1,200,000 7.6 文字標校 集叢出版 (17-20 冊) E 實際 書籍 4 冊 圖書出版 全文檔 (13-16 冊) 分件 PDF 轉 檔 E 實際 2,248 件 245 全文檔案 轉檔 2 內容主題請依16 個主題分類,以英文字母(A~Q)標示:A 動物、B 植物、C 地質、D 人類學、E 檔案、F 器物、G 書畫、H 地圖與遙 測影像、I 金石拓片、J 善本古籍、K 考古、L 新聞、M 語言、N 漢籍全文、O 影音、P 建築或 Q 其他。 3 「數位化產出」預估:請填入95 年 1 月至 12 月預估值;實際:請填入 95 年 1 月至 6 月實際值。

(27)

實體數位化類型 文字資料 多媒體資料 後設資料 子計畫 名稱 資料群 細目名稱 內容 主題2 數位 化產 出3 1. 文獻 掃描 (頁 ) 2. 文字 輸入 (字) 3. 目錄/ 書目/ 標籤 (筆) 4. 2D 影像檔 (張) 5. 3D 影像 檔 (張 ) 6. 聲音 (Audio) (小時) 7. 影片、 動態 影像 (Video) (小時) 8. 動態 影音 (Flash ) (小 時) 9. 其他 (請註明 類型、數 量及單 位) 電腦 儲存量 (MB) 筆數 MB 工作 描述 全文檔 PDF(13-16 冊)浮水印 嵌入 E 實際 2,248 件 415.8 PDF 影像 嵌入浮水 印 原件修裱 E 實際 500 件 影像增補 掃描(修裱 件) E 實際 500 58,000 完成修裱 原件影像 數位化 (修裱 件) 浮水印嵌 入(修裱 件,150dpi 公共資訊 影像檔) E 實際 500 250 Metadata 內容增補 建檔 E 實際 5,000 7

(28)

實體數位化類型 文字資料 多媒體資料 後設資料 子計畫 名稱 資料群 細目名稱 內容 主題2 數位 化產 出3 1. 文獻 掃描 (頁 ) 2. 文字 輸入 (字) 3. 目錄/ 書目/ 標籤 (筆) 4. 2D 影像檔 (張) 5. 3D 影像 檔 (張 ) 6. 聲音 (Audio) (小時) 7. 影片、 動態 影像 (Video) (小時) 8. 動態 影音 (Flash ) (小 時) 9. 其他 (請註明 類型、數 量及單 位) 電腦 儲存量 (MB) 筆數 MB 工作 描述 教學圖書 定稿製作 E 實際 書籍 1 冊 伊能嘉 矩手稿 影像增補 及修正性 掃描 E 實際 135 1,746 影像數位 化(增補 件) 浮水印嵌 入 E 實際 135 120 臺灣古 拓碑 光碟規劃 製作 E 實際 光碟一片 650 合 計 實際 62097.9 5,000 7

(29)

四、評估主要計畫成果之價值與貢獻度(impacts)

(一)學術面

(1) 本年已出版紙本淡新檔案民事篇第 17-20 冊,提供清晰且經標校之文獻資料,易於 查閱;另亦完成出版淡新檔案教學圖書的定稿製作,其之出版將有助於臺灣史及法 制史教學研究之進行。 (2) 透過 metadata 描述資料之建立,完成本館重點特藏資料各原件的內容判讀、詮釋及 分析或描述等工作,有助研究者辨別該件資料是否符合其研究所需。

(二)經濟效益面

透過數位授權,將淡新檔案、台灣古拓碑及伊能嘉矩手稿三大資料群之數位影 像、全文,經過推動數位授權將文化瑰寶分享並公開於「市」,將文化與數位科技 結合,實現文化產業化、產業文化化的目標,並增強文化創意產業的生產力及促進 經濟產業升級。例如,五南書局透過數典計畫網站申請淡新檔案的影像授權,刊載 於其出版品《追尋臺灣法律的足跡:事件百選與法律史研究》(2006 年 7 月出版); 又宜蘭縣立蘭陽博物館亦透過數典計畫網站申請伊能手稿的影像授權,刊載於其出 版品《噶瑪蘭族》(2006 年 10 月出版)。

(三)社會衝擊面

透過淡新檔案教學圖書與臺灣古拓碑光碟版的規劃製作、數位典藏文章的發 表、數位典藏開放授權以及各種講習、參訪和研討會的參與講授,本計畫擔任知識 傳授者之角色,不僅增進計畫參與人員之相關知識與能力,更將古文書之相關知識 推廣普及,而後進一步將數位典藏技術與社會大眾分享,達成社會教育之目標並促 進數位內容產業的加值利用、數位學習的相關應用等,豐富數位內容產業之內容, 為未來的數位產業相關發展奠立基礎。

(30)

五、檢討與展望

本計畫自「數位典藏國家型科技計畫」的先導計畫「國家典藏數位化計畫」即開始 參與執行,至今已累積相當的數位化成果,利用該已產出之數位化成果,未來擬從事之 工作構想如下: 1.將數位化資訊轉化為可使用的知識—第二期計畫 第一期計畫重點在於將資料數位化並建置銓釋資料,而這些數位化資料要能為學者 專家充分用於研究教學,必須將第一期完成的數位化資料藉由各式工具轉化為可使用且 合於學者專家所需的知識。故規劃在第二期計畫中,與相關系所合作,發展索引典、職 官表、年表、GIS 等相關工具,與第一期完成的淡新檔案、臺灣古碑拓本、伊能嘉矩手稿 數位化資料及第二期建置的數位典藏結合,使真正成為能為學者專家所用之資料。 2.完整呈現日治時代至光復初期臺灣研究資料—第二期計畫 臺大圖書館典藏許多日治時代臺灣研究第一手資料,第一期計畫進行的淡新檔案、 臺灣古碑拓本、及伊能嘉矩手稿乃為其中之一部分。為完整呈現日治時代至光復初期臺 灣研究的第一手資料,擬將本館典藏的其他臺灣研究資料,如田代安定手稿(臺灣植物 調查與規劃)、狄寶賽文庫(中美合作的建設歷史研究)、歌仔冊等進行數位典藏,豐富國 內生物多樣性、美援臺灣時代史料以及臺灣傳統語言音樂等之研究資源,促進相關領域 之研究。 3.發展數位典藏之教學研究應用

第二期計畫 針對第一期淡新檔案數位成果,除了在本年度規劃完成淡新檔案教學圖書的製作之 外,第二期計畫將進行《淡新檔案》學習知識網,建置淡新檔案知識庫及淡新檔案的數 位教材,透過線上教材的建置及建立研究所需之工具與環境的雙軌努力,提升數位典藏 在高等教育與學術研究利用之深度與廣度。

(31)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.1

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 盤點館藏 已有出版相關書目或書影之資料,可參考已出版 之資料一一盤核館藏。 破損嚴重而難以翻開者,不得勉強翻開, 而需先進行修裱 製作「盤點記錄表」,詳載每一件 之尺寸、破損情形、附件浮貼之 張數及位置,以及需否修裱(參 考附件 3-1) 1. 由專責館員設計製作「盤點記錄表」,示範 指導工讀生盤點及記錄 2. 完成盤點後,手書「盤點記錄表」輸入為電 子檔,列印二份備用 「盤點記錄表」輸入為電子檔後,須再仔 細核對手書原稿 資料清點 於「盤點記錄表」上為每一件資 料訂定檔名 參考已出版之資料上的資料編號,將各件資料一 一編號。 檔名之訂定必須符合影像檔、文字檔、 Metadata 檔之共同需要: ƒ 單張為一件者,一張資料即需一個 檔名 ƒ 數張合為一件者,各張需有個別檔 名以利影像及全文數位化之需,但 必須明確反映某數個檔為同屬一 件(同一筆)資料,以符合建置 Metadata 之需

附件一

(32)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.2

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 製作「修裱記錄表」 (附件3-2) 國立臺灣大學圖書館特藏組設計 設計為以勾選為主的表格,方便記錄 進行資料修裱 1. 以限制型招標,招募修裱技術良好之技師

2.

駐館修裱

3.

已裱褙之資料添購護夾 1. 不得於原件上書寫記號文字 2. 浮貼必要時可取下,但須筆記各張浮貼 的所在位置,襯裱加強後貼回原處 3. 不得以化學漿糊修裱 4. 各原件顏色差異大,修裱時各件必須以 近原件顏色之紙襯裱 5. 原件裝訂成冊者,修裱後必須依原裝訂 方式裝訂。為裱修而拆件時,拆件之 初,得於裝訂邊之角落,以鉛筆書寫頁 次,以保日後裝訂時順序無誤 6. 檔名打印或書寫於襯裱紙張或護夾上 資料維護 點收修裱資料 批次點收 1. 由專責館員點收 2. 點收時各件資料均需一一核對「盤點記 錄表」,確保附件浮貼張數及位置無誤 3. 點收無誤,則專責館員需在「盤點記錄 表」及「修裱記錄表」上簽名

附件一

(33)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.3

工 作 項 目 工 作 內 容 工 作 進 行 方 式 原 則 資料處理: 1. 資料原件之調取及點收 2. 調取資料及回收資料時詳細清 點並由雙方簽名確認 3. 提供「盤點清單」(得列印節縮 版;只列印必要之欄位)予廠 商,供其拍攝或掃描時據以附 與各檔檔名 4. 如採先拍攝後數位化,則彩色 正片之編號(即各件之檔名) 事先打印於自粘貼紙,提供廠 商貼於每一正片之保存袋上。 1.駐館進行影像數位化 2.古文書資料極易於作業過程中受損,故廠商進 行作業時,得由本館派工讀生全程幫著資料之 攤置、換件、Header(或 Footer)之換置 3.如採直接數位化方式,則各光碟編號與所含檔 名清單之對照表由廠商製作 1. 必須顧及未來出版之須,故此次為影像 數位化而調取原件,解析度必須達可供 出版之用的清晰度 2. 依序批次調件供數位化;調件及還件 時,均必須由專責館員確定無誤並在 「盤點記錄表」上簽名。調取資料之廠 商亦必須於調件時簽名 設計各種資料專用之制式 Header 或 footer,於拍攝或掃描每一件資 料時,均將之涵括於影幅中 編號部分得: 1.事先打印編號條 或 2.以數字方塊排列 需包括: 1. 國立臺灣大學圖書館 2. 《――資料名稱――》 3. 案件編號 影像數位化︵接下頁︶ 規格與設備之規劃: 1. 擬定數位化之方式、使用器材 與媒體材料、數位化之規格 2. 規劃選擇媒體儲存之硬體設 備(櫥櫃) 3. 規劃選擇為電子檔儲存及檢 索目的之用的主機及伺服器 1. 參考相關的文獻如技術報告,並參酌「數位典 藏計畫」參與單位的研討意見 2. 以不同的方式試作,了解各種方式的數位化效 果,經評估後選定作業方式 方式一: 1. 首先拍攝彩色正片 2. 掃描正片為 Tiff 檔 3. 將 Tiff 檔批次轉檔為 JPEG 檔,供網路 傳輸之用 方式二: 直接掃描,但須慎選不致損傷資料之方 式,餘同上列方式一之 2、3

附件一

(34)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.4

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 招標: 1. 撰擬數位化招標公告招募廠商 2. 撰擬儲存櫃招標公告購入典藏用櫥櫃 3. 撰擬主機及伺服器設備之招標 公告,購入設備 以限制型招標,招募數位化技術及配合度良好之 廠商 在與廠商簽訂之合約中,包括「國立臺灣 大學圖書館(典藏單位)為資料之擁有者, 廠商不得於作業過程中,將任何該合約對 象之資料影像,透過任何複製方式,私作 流通或加值利用。」之條款 資料備份: 1. 彩色正片同時拍攝二份,一為 數位化處理、未來出版之用, 一為作為母片永久典藏之用 2. 掃描正片時,首先掃為 Tiff 檔,再以自動轉檔的方式,批 次轉為 JEPG 檔 先拍後掃之情形: 1. 廠商駐館拍攝正片 2. 一份正片提供廠商掃描為數位檔。廠商得於簽 署「借用資料同意書」後,將資料攜出館外作 業 3. Tiff 檔批次轉為 JPEG 檔 直接掃描之情形: 1. 廠商駐館掃描 2. Tiff 檔批次轉為 JPEG 檔 1. 彩色正片兩份均須保存於具溫濕控制 之儲存櫃 2. 電子檔除儲存於光碟之外,如伺服器設 備容量足夠,則儲存完整的一份於伺服 器中。(如得儲存於伺服器,則考慮規 定廠商駐館掃描正片,直接存入伺服器 中再燒製光碟) 3. Tiff檔光碟以具有溫濕控制功能之儲存櫃保存 4. JPEG 檔除存於一般儲存櫃,但需放置於 具溫濕度控制之專室 影像數位化︵續上頁︶ 品質管理: 1. 檢查影像品質 2. 查核檔名與影像內容之對應 是否正確無誤 1. 由專任助理與工讀生於館內檢查 2. 以「盤點記錄表」以及標註有檔名之《國立臺 灣大學藏『岸裡大社文書』》影本、《淡新檔案》 微捲影印版為品檢之依據 3. 如有品質不佳之影像檔,或遺漏之影像檔,一 一於「盤點記錄表」上詳細記錄 4. 如JPEG 檔品質不佳,不再檢查 Tiff 檔,而直接 再提供彩色正片,供廠商重新掃描並轉檔。 5. 上述步驟 4.如發現為彩色正片不佳,則通知廠 商批次前來補拍及完成數位化為 Tiff 檔與 JPEG 檔之作業 1. 以 JPEG 檔進行影像檔之檢查 2. 影像檔必須清晰 3. 影像檔必須拍攝/掃描完整資料:週邊 完整、涵括原件標簽及國立臺灣大學圖 書館專有的 header 或 Footer

附件一

(35)
(36)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.5

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 影印: 已有影印本者放大影印本(如《國 立 臺 灣 大 學 藏 『 岸 裡 大 社 文 書』》),於每一件上標註檔名 由影印公司代印 1.《國立臺灣大學藏『岸裡大社文書』》計 五冊,約含 1152 件,2000 張,影印資 料以每50 件(張)裝訂為一冊為原則 2.臺灣古拓碑之打字以懸掛原件,根據原 件打字為原則 擬定全文打字輸入之規則 專責館員參酌其他單位類似資料之全文建檔規 範,擬定規則之草案,經討論後定稿 所擬定規範應適用於國立臺灣大學圖書館所 收藏之各類古文書及金石拓片全文建檔之用 1. 打字 2. 掃描為 PDF 檔:《淡新檔案》 因已出版第一冊至第六冊打字 本,第七、第八冊正在排版中。 故全文數位化將以出版之印刷 本逐件掃描為 PDF 檔為原則 由工讀生進行打字輸入或掃描印刷本為 PDF 檔 打字: 1. 存為純文字檔 2. 依原件換行的位置折行 3. 打字者負責儲存於電腦硬碟中之外,並 負責備份打字初稿於磁片 4. 論字計酬,難辨識之資料得酌增酬勞 列印打字之全文 1. 設定每件印出時均含檔名 2. 每 50 件裝訂為一份 全文數位化︵接下頁︶ 全文斷句 + 一校 1. 《岸裡大社文書》:核對放大影印之《國立臺 灣大學藏『岸裡大社文書』》。《淡新檔案》:全 文 PDF 檔必須對照已出版的原書,以確認每一 件應掃描區域的完整性。 2. 《臺灣古拓碑》:懸掛原件,根據原件校稿 3. 以列印之打字檔進行斷句及校正 4. 由對該類資料具備知識之專家進行斷句 1. 只進行斷句,不加註新式標點符號 2. 斷句與一校同時進行 3. 論件計酬,較長之資料得酌增酬勞

附件一

(37)

根據一校結果,更正電子檔 由工讀生進行文字檔之更正 1. 負責更正文字檔者,負責再將更正檔備 份於磁片

2. 論字計酬

(38)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.6

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 審稿(二校) 1. 由對該類資料具備知識之專家進行審稿 2. 《岸裡大社文書》:核對放大影印之《國立臺 灣大學藏『岸裡大社文書』》。《淡新檔案》:全 文 PDF 檔必須對照已出版的原書,以確認每一 件應掃描區域的完整性。 3. 《臺灣古拓碑》:懸掛原件,根據原件校稿 4. 以列印之打字檔進行斷句及校正 論件計酬 根據二校結果,更正電子檔 由工讀生進行文字檔之更正 1. 負責更正文字檔者,負責再將更正檔備 份於磁片 2. 論字計酬 列印已根據二校稿更正過之全文 電子檔備查 全文數位化︵續上頁︶ 資料備份 由專責館員負責督導備份及光碟燒製 1. 全文數位檔燒製光碟二份,一份以具有 溫濕控制功能之儲存櫃保存 2. 另一份光碟備份除存於一般儲存櫃,但 需放置於具溫濕度控制之專室 3. 提供備份與資訊人員進行納入資料庫 的後續工作

附件一

(39)

國 立 臺 灣 大 學 典 藏 數 位 化 工 作 注 意 事 項 與 工 作 原 則 _ p.7

工 作

項 目

工 作 內 容 工 作 進 行 方 式 原 則 訂定Metadata 欄位 1. 檢討臺大圖書館之「臺灣史料 Metadata 欄位一覽 表(草案)」中《岸裡大社文書》之欄位 2. 與專家學者討論後定案 符合國際標準 選定Metadata 輸入界面之軟體 參酌其他單位類似資料建 Metadata 所選用之界 面,經與資訊專家討論後選定 優先考慮不同的 Metadata 輸入人員均可鍵 入同一資料庫之軟體 擬定建Metadata 之規範 由專責館員撰擬,經詢求資訊專家確認後定稿 內容包括各欄位之定義、填寫於各欄位之資料的來源 設計製作書面工作表 1. 根據已訂定之欄位設計 2. 委由印刷廠印製表格 聘請對該資料具備知識之專家,填 製Metadata 書面工作表 必要時由學者專家協助招募作業 論件計酬 人員訓練 批次舉行填製Metadata 之說明會 尋求每一位Metadata 填製人員工作細節認定上的一致性 將書面之 Metadata 工作表輸入為 電子檔 由專任研究助理或工讀生進行輸入 專責館員負責點交(收)資料,掌控進度 審核+一校: 1. 審核 Metadata 資料之正確性 2. 檢查有無遺漏未建 Metadata 之件 1. 批次列印電子檔 2. 提供列印之 Metadata 與影印本《國立臺灣大學藏『岸 裡大社文書』》供學者專家核對,進行修正或增刪 1. 聘請學者專家進行審校 2. 論件計酬 建 Metada ta 根據審核之結果: 1. 修正 Metadata 電子檔 2. 補製作 Metadata 資料 1. 由專任研究助理或工讀生進行修正 Metadata 之電子檔 2. 由 專 任 研 究 助 理 或 工 讀 生 找 出 遺 漏 製 作 Metadata 之影印,提供與填製 Metadata 書面工 作表之專家補填製Metadata 工作表。然後再重 複前述「審核+一校」及其後的必要工作

附件一

(40)

資料備份 由專責館員負責督導備份及光碟燒製 1. 所完成的 Metadata 檔燒製成光碟二份,一份 未壓縮,以具有溫濕控制功能之儲存櫃保存 2. 另一光碟備份為壓縮檔,儲存於一般儲存 櫃,但需放置於具溫濕度控制之專室 3. 建 Metadata 過程中,批次將所完成的 Metadata 資料提供與資訊人員進行建置資料庫

附件一

(41)

35

(42)

36

國立臺灣大學圖書館

《淡新檔案》檔案命名規範

壹、

檔名訂定與檢索

為將《淡新檔案》之各種數位化資料建置成「互動式全文與影像資料庫」,檔名訂定必須 依循特定之規範準則,而且同一文件之metadata、文字檔、影像檔之檔案名稱必須一致,以 利資料庫檢索程式之撰寫等後續作業。 《淡新檔案》依資料狀況分析,其組成要件可分為「案」、「件」、「附件」、「浮貼」:每一 「案」均含數「件」,每一「件」可能又含「附件」。而不論「件」或「附件」,均可能又含「浮 貼」。「浮貼」有的貼於「件」外緣,有的貼於「件」本文之上。此外,不論「件」或「附件」, 又可能因其上下過高或左右過長,而必須加以區劃後掃描。 針對上述各種不同情況、不同層級之資料加以掃描之後,為掃描檔案進行命名之原則與 目的如下: 原則:能表達該檔案之層級意義,例如:其為「案由」、「件」或「附件」,以及其是否為 需加以區劃之件及其在區劃中之所屬位置等。 目的:使撰寫檢索程式時,得以使某一筆資料相關之上級、平行與下屬相關之資料,均 能在該筆資料被檢索出時,一併呈現於檢索結果中,以利使用者點選上級、平行 或下屬相關之資料。 為達成上述原則與目的,《淡新檔案》之檔名基本上規劃為六段;各段之檔名之標示及其 所代表之意義如下述。

貳、

檔名釋義(以第

22402 案為例)

每一檔案名稱標示包括二段至六段不等,悉依資料之實況而定檔名,最多可定到第六段, 最少包括二段,且第六段僅為A、B 袋同時含相同案、件號資料之情況而設,數量極為稀少。 各檔名必須包括的基本段為第一段與第二段。各段之間以 _(底線)加以區隔。如有資料檔 名需延伸至第五段或第六段,但前幾段卻無相關資料,則無相關資料之段位,必須依規定填 入 00 或 0 ,以使各具特定意義之檔名區段,保持於特定之區段位置。(請參見「參、情形 六」之例) TH22402 _002 _01 _01 _1 _A TH22402 _002 _01 _01R _9 _B 第一段 英文代碼+案號 第二段 件號 第三段 附件 第四段 浮貼 第五段 分區 第六段 A 或 B 袋 基本段 附件三

(43)

37 第一段:《淡新檔案》英文代碼+案號。例如,TH22402。 第二段:件號,含三碼。例如,002;以 000 表示該案之案由或主旨。 第三段:附件,含二碼。例如,01。同一「件」可能含數「附件」,則該段分別填入 01(表 附件一)、02(表附件二),餘類推。如該「件」資料不含「附件」,則該段為00。(請 參見「參、情形三」) 第四段:浮貼,最多含三碼,最少者為二碼。例如,01+ R。以 01R 表示有浮貼掀開後掃描者, 以01 表示浮貼覆蓋本文進行掃描者。 第五段:1 至 9 區,含一碼。文件過大時,需分區掃描者。一般需區劃之後掃描者,大多為 1 區+2 區(左右寬,需區劃為左右二截掃描);或 1 區+2 區+3 區;或 1 區+4 區(上 下長,需區劃為上下二截掃描);或1 區+4 區+7 區;或 1 區+2 區+4 區+5 區(方正 但長寬均超大,則區劃為四區掃描);餘類推。若不需分區掃描,但同一案、件號之 資料卻同時出現於A、B 袋中(但是二者為不同之二件資料),則本段以0 表示。(請 參見「參、情形六」) 第六段:A 袋或 B 袋。不同袋資料編號相同時,以 A、B 表示該筆資料所屬袋名。 分區掃描時,區號之定義如下: 一文「件」最多可分9 區掃描,各區之編號如圖示:

9

8

7

6

5

4

3

2

1

22402 019 附件三

(44)

38

參、

《淡新檔案》掃描方式及檔案命名範例

情形 範例 掃描方式 檔案命名 22402 案「案由」 TH22402_000 22402 案、第 001 件 TH22402_001 22402 案、第 002 件 TH22402_002 一、「案」之下含數「件」 資料,各「件」資料為 單純之單一文件,無「附 件」,亦無「浮貼」。 22402 案、第 051 件 每一件個別掃描為 一檔。 TH22402_051 第22402 案第 001 件本文 TH22402_001 第22402 案第 001 件之附件一 TH22402_001_01 二、「案」之下的某「件」 資料,含「附件」,無「浮 貼」。 第22402 案第 001 件之附件二 該件資料、附件分 別 掃 描 為 個 別 的 檔。 TH22402_001_02 第22402 案第 002 件,本文外緣有外 凸之浮貼。 外凸浮貼與文件內 文 一 併 掃 描 為 一 檔。(浮貼與本文視 同一體的情況) TH22402_002 浮貼覆蓋著本文文 字時進行掃描。 TH22402_003_00_01 三、「案」之下含數「件」 資料,其中有某些「件」 資料含「浮貼」,無「附 件」。 第22402 案第 003 件 本 文 及 其 浮 貼。(浮貼覆蓋於 本文文字之上。) 覆蓋著本文文字之 全 部 浮 貼 掀 開 之 後,再掃描一次。 TH22402_003_00_01R 浮貼覆蓋著本文文 字時掃描一次。 TH22402_016_00_01 第22402 案第 016 件 本 文 及 其 浮 貼 ( 浮 貼 覆 蓋 於 本 文文字之上。) 覆蓋著本文文字之 全部浮貼掀開後, 再掃描一次。 TH22402_016_00_01R 第22402 案第 016 件之附件一 個別掃描為一檔。 TH22402_016_01 第22402 案第 016 件之附件二 個別掃描為一檔。 TH22402_016_02 四、「案」之下的某「件」 資料含「浮貼」,亦含一 或數個「附件」。 第22402 案第 016 件之附件三 個別掃描為一檔。 TH22402_016_03 附件三

(45)

39 情形 範例 掃描方式 檔案命名 第22402 案第 017 件附件二,於浮貼覆 蓋原文時掃描一次 TH22402_017_02_01 五、「案」之下的某「件」 所含之某「附件」含 有「浮貼」。 第 22402 案 第 017 件附件二本 文及其浮貼 第22402 案第 017 件附件二,於全部浮 貼掀開後,再掃描一 次 TH22402_017_02_01R (第22402 案 A 袋 含17 件) 第 22402 案 001 件 第 22402 案 017 件 TH22402_001_00_00_0_A TH22402_017_00_00_0_A 六、同一「案」因資料量 多,被分裝於A、B 兩袋,而各袋內之資 料編號起始號碼相 同。(A、B 袋內的資 料並非複本,但原件 編號卻相同。惟本例 數量極稀,故將A、B 之檔名標示註記置於 第六段) (第 22402 案 B 袋含19 件) 第 22402 案 001 件 第 22402 案 019 件 檔 名 訂 定 原 則 依 前述一~五。A、B 袋之各件、附件、 浮 貼 均 需 一 一 掃 描。 TH22402_001_00_00_0_B TH22402_019_00_00_0_B 七、無法判斷屬於何「件」 之「附件」,權且將之 作為「案由」之「附 件」。 第 22402 案有二 附件不知其歸屬 於何件。 二 附 件 需 個 別 加 以掃描,如需區劃 再加以掃描,則區 劃方式同「貳、檔 名釋義」之解說 TH22402_000_01 TH22402_000_02 附件三

(46)

40

肆、練習例

一、檔名解讀 TH32108_029 第32108 案之第 29 件本身 TH32108_029_00_01R 第29 件無附件,但有浮貼,於全部浮貼掀開後掃描者 TH32108_029_01 第29 件的附件一 TH32108_029_02 第29 件的附件二 TH32108_029_02_01R 第29 件的附件二,於全部浮貼掀開後掃描者 TH32108_029_02_00_0_A 第29 件的附件二,為裝於 A 袋之件 TH32108_029_02_01R_0_A 第29 件的附件二,為裝於 A 袋之件,於全部浮貼掀開後 掃描者 TH32108_029_02_00_0_B 第29 件的附件二,裝於 B 袋之件 第一例 TH32108_029_02_01R_0_B 第29 件的附件二,裝於 B 袋之件,於全部浮貼掀開後掃 描者 TH32108_029_01 第29 件的附件一 TH32108_029_02 第29 件的附件二 TH32108_029_02_01R 第29 件的附件二,於全部浮貼掀開後掃描者 TH32108_029_02_00_0_A 第29 件的附件二,為裝於 A 袋之件 TH32108_029_02_01R_0_A 第29 件的附件二,為裝於 A 袋之件,於全部浮貼掀開後 掃描者 第二例 TH32108_029_02_00_0_B 第29 件的附件二,裝於 B 袋之件 附件三

(47)

41 TH32108_029_02_00_1_B TH32108_029_02_00_2_B 第29 件的附件二,為裝於 B 袋之件,屬分區掃描之第一 區(區域之劃分如上圖)。 第29 件的附件二,為裝於 B 袋之件,屬分區掃描之第二 區 三例 TH32108_029_02_01R_1_B TH32108_029_02_01R_2_B 第29 件的附件二,為裝於 B 袋之件,於全部浮貼掀開後 掃描者,屬分區掃描之第一區。 第29 件的附件二,為裝於 B 袋之件,於全部浮貼掀開後 掃描者,屬分區掃描之第二區。 第四例 TH32108_029_02_00_1_B TH32108_029_02_00_2_B TH32108_029_02_00_3_B TH32108_029_02_01R_1_B TH32108_029_02_01R_2_B TH32108_029_02_01R_3_B 各段檔名之說明請參照第三例。 第五例 TH32108_029_03_00_1 TH32108_029_03_00_4 第29 件的附件 3,屬分區掃描之第一區(區域之劃分如上 圖) 第29 件的附件 3,屬分區掃描之第四區。 1 2 3 2 1 案件號標籤 4 1 附件三

(48)

42 第六例 TH32108_029_03_00_1 TH32108_029_03_00_4 TH32108_029_03_00_7 各段檔名之說明請參照第五例。 二、檔名訂定 1. 第 25102 案「案由」,不含附件、浮貼 TH25102_000 2. 第 25102 案第一件,不含附件、浮貼 TH25102_001 3. 第 25102 案第三件的附件二,含浮貼 TH25102_003_02_01 TH25102_003_02_01R 4. 第 25102 案第三件原件,同時出現於 A、B 袋中 TH25102_003_00_00_0_A TH25102_003_00_00_0_B 5. 第 25102 案第三件含附件,其中的第 三件之附件一同時出現於A、B 袋中 TH25102_003_01_00_0_A TH25102_003_01_00_0_B 6. 第 25102 案第三件含附件,其中的第 三件之附件一含浮貼,且因其上下過 高,需區劃為上、下二截掃描 TH25102_003_01_01_1 TH25102_003_01_01_4 TH25102_003_01_01R_1 TH25102_003_01_01R_4 7. 第 25102 案第三件同時出現在 A、B 袋中,含附件,其中在A 袋內之件的 附件一含浮貼,且因其上下過高,需 區分為上、下二截掃描 TH25102_003_01_01_1_A TH25102_003_01_01_4_A TH25102_003_01_01R_1_A TH25102_003_01_01R_4_A 1 4 4 1 7

(49)

43

國立臺灣大學圖書館

《伊能嘉矩手稿資料庫》檔案命名規範

檔名共

11 碼

‹ 主檔名—共 8 碼,組成如下: ¾ 1~4 碼:為藏品原有之流水編號,例如:M001。(4 碼) ¾ 5 碼:為冊數編號。第 1~9 冊分別以阿拉伯數字 1~9 編號,第 10 冊以後則以小寫英文 字母編號。例如:“3"代表第 3 冊,“a"代表第 10 冊,“f"代表第 15 冊。(1 碼) ¾ 6~8 碼:代表本影像之頁碼編號。例如:本影像為第 M001 號手稿第 3 冊的第 8 頁, 則本影像檔之檔名為M0013008。(3 碼) ‹ 若有因原件大於 A3 而必須分成數次掃描的情況(例如書中摺頁),檔案命名原則與上例 相同,但在原檔名之後(副檔名之前)標示“-1"、“-2"等,表示這些影像屬於同一原 件。例如:“M0013008-1.tif"、“M0013008-2.tif"。 ‹ 檔名後面 3 碼(副檔名):一律小寫。 JPEG 檔:“.jpg" TIFF 檔:“.tif" 附件四

(50)

44

國 立 臺 灣 大 學 圖 書 館

《 淡 新 檔 案 》 典 藏 數 位 化 影 像 製 作 規 範

目 錄

一、前言... 47 二、資料描述與廠商承製方法... 47 三、《淡新檔案》數位化影像製作規格... 47 3.1 製作文件項目... 47 3.2 《淡新檔案》數位化影像製作規格... 47 3.3 製作光碟備份... 48 3.4 製作數位化影像所需機器設備與工作方法... 48 3.5 影像電子檔格式與命名規則... 48 3.6 光碟與燒錄品質... 48 3.7 工作地點、場地、作業時間與規範... 48 3.8 電子文件保管... 49 3.9 製作數位化影像能量需求... 49 3.10 時程安排... 49 3.11 品檢及改善需求... 49 四、數位影像紙本備份之製作... 51 五、其他... 51 5.1 建議廠商投標前必須出席說明會... 51 5.2 廠商工作時,必須完全遵循圖書館指派陪同工作人員之指示 51 5.3 文件領取與繳回... 51 5.4 數位影像製作機器規格條件... 51 附件五之一

數據

Illustration 插圖  (新增)  (新增)  Dimension 高廣尺寸(長 x 寬)  稽核資料-高廣尺寸(410$b)  稽核資料-高廣尺寸(410$b)  Attachments 附件  稽核資料-附件(410$c)附註:一般註(800)

參考文獻

相關文件

IRB 編號 SG14300A#18 計畫主持人 楊宗穎

圖三 104 年度數學學門研究單位計畫件數分佈.. 民國 104 年 11 月 自然科學簡訊第二十七卷第四期 統計. 統計學門 104 年度大批申請專題研究計畫 共核定通過 118

臺大機構典藏NTUR (National Taiwan University 二 Repository, http://ntur.lib.ntu.edu.tw) 經驗與協助推 動臺灣學術機構典藏TAIR (Taiwan Academic Institutional Repository,

之整合及阿里山觀光軸線延伸發展計畫 期中規劃階段 雲嘉南-4 雲林縣 臺灣宗教旅遊及宗教文化園區之規劃 期中規劃階段 雲嘉南-5 臺南縣 雲嘉南農業經濟發展計畫

IRB 編號 SC19109A 計畫主持人 李奕德 通報次數 4

IRB 編號 SC19096B#2 【CIRB 副審】 計畫主持人 洪志強 計畫名稱. 一項針對荷爾蒙受體陽性、HER2 陰性的早期乳癌患者,評估 ribociclib

IRB 編號 SC19025A 計畫主持人 吳明儒 通報次數 1

IRB 編號 SF18239B 計畫主持人 李騰裕 通報次數 2