• 沒有找到結果。

校史館藏數位化實務 校史館藏數位化實務

N/A
N/A
Protected

Academic year: 2021

Share "校史館藏數位化實務 校史館藏數位化實務"

Copied!
28
0
0

加載中.... (立即查看全文)

全文

(1)

校史館藏數位化實務 校史館藏數位化實務

國立政治大學圖書資訊與檔案學研究所 助理教授 林巧敏

年 月 日 2010年 7月13日

1

大 綱

z 校史檔案館藏類型

z 校史檔案館藏類型

z 數位掃瞄作業規劃

z 後設資料(metadata)與標準

z 數位典藏系統設計

z 數位權利管理(DRM)

2

(2)

校史檔案館藏類型

z

校史文物:如校旗、重要競賽的獎盃、校園模型、外賓 贈品、有歷史紀念性教學用品儀器及器材等。

贈品 有歷史紀念性教學用品儀器及器材等

z

公文類:具有史料價值非現行之公文書,經鑑定具永久 保存價值,移轉成為校史檔案。

z

公務性質的出版品:如行事曆、課程時間表、概況、簡 介、預算決算報告、重要會議記錄等。

z

記錄大學史事的一般出版品:如紀念刊、特刊、畢業紀 念冊等

念冊等。

z

校內各系所院、單位及社團具代表性出版品:如校訊、

學會會訊、學術期刊創刊號、紀念品、研發商品等。

3

校史檔案館藏類型(續)

z

師生課外或校園具特殊意義之活動紀錄:如特別活動、

學術活動、名人來訪之相片、圖片、影片、錄音帶、

錄影帶 實物等 錄影帶、實物等。

z

校內建築物的資料:如設計圖、籌備、破土、施工、

落成啟用情形、舊建築物的修復記錄。

z

刊載學校相關之重要報導:如報紙、雜誌等媒體記錄。

z

學校校務、行政管理單位之會議議程、會議記錄及會 議文件等。

傑出師生 校友之個人手稿或文物

z

傑出師生、校友之個人手稿或文物。

z

其他校內單位有關重大史事資料。

4

(3)

校史檔案館藏特性

z 檔案媒體形式多元 檔案媒體形式多元

z 檔案規格尺寸不一

z 檔案格式互異

數位化作業複雜 需要依 數位化作業複雜,需要依 資料媒體形式分開考量

5

數位掃瞄作業規劃

z 建立政策文件

z 前置準備工作

z 數位化轉換過程

z 數位化後製處理

z 檔案儲存與備份

6

(4)

建立政策文件

z 建立數位化作業工作流程圖

z 研訂數位化工作手冊

z 研訂數位化工作手冊

z

含作業程序、步驟、工具、規範、品質要求與檢核 標準

z 訂定數位化格式標準與規範

z

檔案格式:可採黑白、灰階、彩色三種規格TIFF、

JPEG、GIF格式儲存

z

解析度:200DPI-500DPI

z

命名原則:資料數位化與命名原則規範、電子檔案 命名原則

z

詮釋資料格式:參酌機關檔案管理資訊化作業要點、

DC 、EAD

7

檔案數位化作業流程圖

8

(5)

彩色模式

z 有全彩、高彩、256色,全彩可表現16,777,216種顏色,

非常豐富,但檔案資料量很大。256色已經可以把一般 的影像效果表達的相當逼真 是目前較常用的彩色模 的影像效果表達的相當逼真,是目前較常用的彩色模 式。

9

灰階模式

z 像素用8個位元來表示,亮度值範圍為0~255,0 表示黑色、255表示白色,共有256(2 8 )個不同 表示黑色 255表示白色 共有256(2 )個不同 層次深淺的灰色變化,也稱為256灰階。

10

(6)

黑白模式

z 只有黑與白兩色,檔案體積小,但無法顯 示圖像的細節,只適用於純文字內容。

示圖像的細節 只適用於純文字內容

11

檔案格式 檔案

類型 色彩表現 特性 微軟支

援軟體 不能儲存印刷用的色彩模 W d E l

圖檔格式比較分析

BMP 點陣式 全彩 不能儲存印刷用的色彩模 式影像,為Windows標準 的影像格式

Word、Excel、

PowerPoint、

FrontPage、IE

GIF 點陣式 256色 可指定透明色彩做影像去 背及顯示動畫

Word、Excel、

PowerPoint、

FrontPage、IE

W d E l

JPG(JEPG) 點陣式 全彩 檔案體積小是優點但有一

定程度的失真

Word、Excel、

PowerPoint、

FrontPage、IE

TIF(TIFF) 點陣式 全彩 最適宜作印刷用的圖檔格

Word、Excel、

PowerPoint、

FrontPage 12

(7)

解析度單位

z 解析度單位通常是以DPI (Dot Per Inch)與 PPI (Pixel Per Inch)為主。

z DPI適用於平面輸出單位,印表機解析度

z PPI則是螢幕上的像素單位,例如顯示器 解析度

解析度。

13

掃瞄規格比較

規格 優點 缺點

黑白影像 所需儲存空間 顏色與文字重疊處 黑白影像

解析度300dpi

所需儲存空間 較小,掃瞄花 費時間少

顏色與文字重疊處 無法忠實呈現

灰階影像 解析度200dpi

影像效果優於 黑白影像

所需儲存空間較大,

掃瞄時間長 彩色影像

解析度200dpi

藉由不同顏色 表現,忠實呈 現檔案原貌

所需儲存空間較大,

掃瞄時間更為費時

14

(8)

一般掃瞄規格建議

z 不是不變的標準,會隨著資訊技術改變,色彩 模式需視原件內容性質決定

模式需視原件內容性質決定

z 永久典藏級

z

檔案格式TIFF、不壓縮、解析度300-600dpi

z 流通服務級

z

檔案格式JPG、壓縮比10:1、解析度150-300dpi

網路瀏覽級

z 網路瀏覽級

z

檔案格式GIF、原生影像不壓縮、解析度72dpi

15

資料數位化與命名原則規範

z 命名方式+註冊機關代碼+註冊資源代碼

z 命名方式如以URN方式則為urn DOI則為doi

z 命名方式如以URN方式則為urn,DOI則為doi。

z 註冊機關代碼如為URN informal方式,則由申 請機關向註冊中心(IANA)申請分發為urn-d

(d為數字),若為DOI,則向註冊中心(FDI 或CrossRef)申請分發一代碼。

註冊資源代碼則由註冊單位內部自編 無一定

z 註冊資源代碼則由註冊單位內部自編,無一定 格式但要內部為唯一代號。

16

(9)

電子檔案命名原則

z 檔號+影像序號

z 檔案目錄層級採階層式三層之架構訂定之。第一層為機關代碼加上 單位識別碼、第二層為案卷層級之檔號(年度號=分類號=案次號)、

單位識別碼、第二層為案卷層級之檔號(年度號=分類號=案次號)、

第三層為案件層級之檔號(年度號=分類號=案次號=卷次號=目次 號),各層之間以斜線〝/〞或反斜線〝\〞分隔。

z 例如:檔案名稱以文號表示

z 300010000A/091=101=001/091=101=001=002=003/0920002345.pdf

z 300010000A表示機關代碼,091表示年度號, 101表示分類號, 001表 示案次號,002表示卷次號,003表示目次號,0920002345表示文號,

pdf表示副檔名。

例如 機關代碼與單位識別碼之表示

z 例如:機關代碼與單位識別碼之表示

z 300010000A000001/091=101=001/091=101=001=002=003/0920002345.p df

z 300010000A表示機關代碼,000001表示單位識別碼,091表示年度號,

101表示分類號,001表示案次號,002表示卷次號,003表示目次號,

0920002345.pdf 表示電腦檔名稱。

17

前置準備工作

z 實體物件的現況分析

分析保存狀況 數量估計 材質尺寸 媒體

z 分析保存狀況、數量估計、材質尺寸、媒體 形式

z 實體物件的選擇

z 考量藏品價值(保存年限)、使用者需求、

保存的風險、智慧財產權歸屬問題 z 實體物件造冊列清單

z 載明足以辨識數位物件之特徵項目與頁數

18

(10)

前置準備工作(續)

z 選擇施作方式

z 委託專業廠商或機關自行訓練人員施作 z 準備場地與設備

z 與庫房區隔之影像掃瞄工作區

z 考量紙質類、微縮片、照片、底片、立體文 物、影音等檔案不同設備需求以及操作的方 物、影音等檔案不同設備需求以及操作的方 便性

z 人員教育訓練

19

影像數位化辦理方式

藏品管 理部門

負責規劃影像數位化之材料範圍、數量清理、作 業流程規劃及人力調配等事項。

自行 辦理

資訊 部門

負責協助掃描作業相關軟硬體之規劃及設置,包 含個人電腦、掃描器、印表機、集線器、光碟燒 錄器、區域網路架設、電子檔案命名及影像檔儲 存規劃等事項。

其他幕

僚部門 協助辦理數位化場地及經費支援等事務性工作。

委外 辦理

透過對外召商方式,委由具專業經驗之廠商負責辦理檔案

影像掃描作業。

20

(11)

數位化轉換過程

z 依物件特性與需求決定數位化方式

影像掃瞄 數位攝影 人工輸入 光學文字

z 影像掃瞄、數位攝影、人工輸入、光學文字 辨識(OCR)

z 依物件特性選擇數位化設備

z 紙質文獻:平台式、平床式、饋紙式掃描器

z 微縮資料:微縮膠捲掃描器

z 微縮資料 微縮膠捲掃描器

z 底片、正片:底片掃描器、滾筒掃描器

z 書畫或立體文物:數位相機或數位機背

21

各式掃描設備

平台式掃描設備 平台式掃描

饋紙式掃描器

22

(12)

各式掃描設備

平床式掃描設備 滾筒掃描器

微縮片轉製數位影像 23

各式掃描設備

數位相機與機背 翻拍台

底片掃描器 24

(13)

數位化轉換過程(續)

z 根據數位化程序進行數位轉製

z

提卷

z

提卷

z

拆卷、起釘、編碼(以6B鉛筆逐頁正下方編寫流水 號)、整平

z

分件:以案件為掃瞄單位,依檔案目錄清單分件並 填寫作業驗證單

z 特殊狀況處理

z

紙張過薄、透光或背面有字可襯紙

z

紙張過薄、透光或背面有字可襯紙

z

尺寸過大可分段掃瞄後,以接圖處理

z

破損或沾黏應先修補或分離

z

裝訂書刊不拆卷會有黑邊可採平床式掃描器

25

數位化後製處理

z 文字校正

z 以人工2至3次校正 以人工 至3次校正 z 圖檔檢查

z 歪斜、色偏、去黑邊黑點、清晰度比對

z 以繪圖軟體進行品質調校

z 修圖以不失真為原則,目的在提高清晰度,不在比原件漂亮 z 數位檔案命名存檔

z 數位檔案格式轉換

z 依館藏政策進行不同格式轉換(典藏級、流通級、網路瀏覽級)

26

(14)

整理/掃描作業驗證單 抄寫檔號

整理/掃描作業驗證單範例

編寫頁碼 簽名:

拆卷作業 簽名:

掃描作業 簽名:

掃描總頁數 共 頁

品質複檢結果

首件檔號

末件檔號

27

影像校正

修正前 修正後

28

(15)

影像檢查問題

29

小 結

z 影像掃瞄前需要規劃詳盡之作業流程,並 建立工作標準作業手冊

建立工作標準作業手冊

z 數位物件選擇需建立原則,數位不是取代 原件的思考,數位化的迷失是容易忽略日 後保存維護的成本,基於成本效益考量,

不必然所有檔案均數位化 不必然所有檔案均數位化

z 檔案命名原則需要依循標準,避免重複

30

(16)

後設資料(metadata)與標準

z 何謂metadata?

M t :變換 改變 在 之後的

z Meta~:變換、改變、在~之後的 Meta data Ö data about data

z

依使用社群或使用情境,不同領域有各自慣用的名稱。

資料 後製的

在…之上

資料的資料

z

圖書資訊界常用詮釋資料,資訊技術界常用後設資料,

亦有稱元資料或元數據。

31

Metadata的定義

z Metadata主要是描述物件屬性(property)的 資訊,用來支持如指示儲存位置、歷史資料、

資訊,用來支持如指示儲存位置 歷史資料 資源尋找、文件紀錄等功能。

z 詮釋資料算是一種電子式目錄,為了達到編製 目錄的目的,必須描述並收藏數據的內容或特 色,進而達成協助數據檢索的目的。

z 將一群龐雜資料予以結構化的替代資訊

z 將一群龐雜資料予以結構化的替代資訊

(surrogate),並建立資料間的相互關係,以 利檢索與利用。

32

(17)

生活可見的Metadata

z 會員資料表中姓名、生日、電話等項目

z 會員資料表中姓名、生日、電話等項目

z 圖書館館藏目錄描述圖書特性的書名、作 者、出版者等項目

z 各項物品清單中描述物品外型、功能與特 色等項目

色等項目

Metadata的功能生活中隨處可見,

只是我們不特別稱之為Metadata

33

Metadata的產生

z 人為著錄

由訊息生產者著錄

z 由訊息生產者著錄

---訊息生產者主題著錄能力較佳

z 由專家編製而成

---專家對於描述著錄之能力較佳

z 機器擷取

z 關鍵詞索引

z 訊息處理過程相關紀錄

34

(18)

Metadata的作用

z

不同的metadata格式支援不同的目的需求。

z

數位藏品的擁有者、管理者與提供者希望metadata協助:

建置數位資源控制的機制

z

建置數位資源控制的機制

z

管理數位資源

z

數位資源使用與檢索

z

數位藏品的終端使用者希望metadata協助數位資源的:

z

找尋

z

辨識

z

選擇

z

選擇

z

獲取使用

z

詮釋

35

特定領域的metadata

z 特色:著重特定領域資訊的共同需求與著錄標 準。

z 典型代表

z

圖書館社群:MARC

z

博物館社群:CDWA、CIDOC

z

檔案館社群:EAD

z

政府社群:GILS

視覺資源社群 VRA C C i

z

視覺資源社群:VRA Core Categories

z

植物標本館社群:HISPID、DarwinCore

z

音樂社群:SMDL

36

(19)

都柏林核心集 (Dublin Core)

z 都柏林核心集是1995年3月由國際圖書館電腦中 心(OCLC)和National Center for

心(OCLC)和National Center for

Supercomputing Applications(NCSA)所聯合 贊助的研討會,邀請五十二位來自圖書館、電 腦、網路方面的學者和專家,共同研討下的產 物,目的是希望建立一套描述網路上數位資訊 特色的方法,來協助資訊檢索。

特色的方法 來協助資訊檢索

z 因其具備描述物件之基本項目,故廣泛被使用 在不同領域。

37

都柏林核心集描述內容

Title (題名) Creator (主要作者)

S bj t D i ti

Subject (主題) Description (描述)

Type (類型) Format (型式)

Publisher (出版者) Source (來源)

Language (語言) Contributor (其他作者) Date (日期) Relation (關聯性)

Date (日期) Relation (關聯性)

Identifier (識別碼) Rights (著作權)

Coverage (時空範圍)

38

(20)

Metadata的發展步驟

z 導入階段:選擇合適的matadata

找出已被廣泛應用或接受的標準

z

找出已被廣泛應用或接受的標準

z

確認採用metadata標準的目的

z

確認metadata標準的應用範圍

z

分析資料元素的類目結構與完整性

z

必要時對現有資料元素進行修正或定義

z 著錄階段:建立書面著錄原則,依式著錄

z 管理及使用階段:不斷維護擴充metadata

39

小結

z Metadata是提供數位藏品內容指引的依據,有 助於藏品的管理與應用。

助於藏品的管理與應用。

z 因應各種不同藏品特性所開發之Metadata為數 者眾,如何選擇合適的Metadata是重要的評估 工作,應依需求採用既有的標準,或是根據既 有標準加以修訂採用。

z 選擇Metadata不以眼前需求為唯一考量,應將 未來發展併同納入考慮。

40

(21)

數位典藏系統設計

z

需要內容專家與技術人才之合作

z

數位典藏系統使用到多項資訊技術,特定人員無法

z

數位典藏系統使用到多項資訊技術 特定人員無法 全數熟悉掌握,需要有擅長溝通的內容專家與具系 統整合經驗之技術人才共同參與。

z

後設資料分析需與系統分析資料結合

z

系統分析前需先著手後設資料分析,避免後設資料 與系統設計內容矛盾。

z

預為考量典藏系統發展的通用性

z

後設資料需事先將不同類型典藏資料納入考量,以 保留彈性與發展空間。

41

系統建置流程

規劃 分析 設計 開發

規劃 分析 設計 開發

後設資 料專家

系統開發資訊 技術人員 典藏內

容專家

產出 產出 產出 產出

系統規 格書

後設資料需 求規格書

系統需求 與設計規 格書

數位典 藏系統

42

(22)

系統功能設計

z 數位物件典藏管理功能

z 系統安全機制(權限控管)

z 數位權利管理機制

z 資訊檢索介面設計

z 資料備份與異地備援機制

z 典藏資料交換機制(互通性考量)

43

系統建置委外招標方式

z 採購法規定:機關辦理採購應以維護公共利益及公 平合理為原則,對廠商不得為無正當理由之差別待 遇。

z 採購方式

z 公開招標:以公告方式邀請不特定廠商投標。

z 選擇性招標:以公告方式預先依一定資格條件辦 理廠商資格審查後,再進行邀請符合資格廠商投 標。

z 限制性招標:指不經公告程序,邀請兩家以上廠 商比價或僅邀請一家廠商議價。

44

(23)

系統需求規格書的撰寫

z

目的:使作業有標準依據可循,以保障作業全程之工作 品質達到所要求之水準,而且品質一致。

z

原則:

z

愈詳細嚴格規範,愈有保障

z

對尚未規劃完成之細節,以「作業之前須與館方負責 人洽商後定案」保留招標後再補充之彈性。

z

內容要項

z

專案名稱與範圍

z

功能需求說明

z

功能需求說明

z

交付事項

z

雙方責任

z

專案管理(交付期程及項目、教育訓練、付款方式)

45

小結

z 數位典藏系統設計涉及相當多資訊處 理技術,需要資訊技術人員協助,提 供系統功能建議,資訊內容專家需要 偕同提供使用角度需求與資訊內容結 構的詮釋,始能建構理想的數位典藏 構的詮釋,始能建構理想的數位典藏 系統。

46

(24)

數位權利管理(DRM)

z 數位權利管理

z 數位權利管理

z 著作權與授權

z 數位典藏著作權問題探討

47

為何要數位版權管理?

z 數位物件可被輕易複製

z 對於數位物件的傳輸無法有效控管

z 對於擁有權的判定與追尋相當困難

z 數位內容本身的完整性與認證問題 數位內容本身的完整性與認證問題

48

(25)

數位權利管理之定義

z

數位權利管理(digital rights management, DRM)是 結合硬體與軟體的存取機制,將數位內容設定存取權限,

結合硬體與軟體的存取機制,將數位內容設定存取權限,

並與儲存媒體連結,使得數位內容在其生命週期內從產 生到消滅,都能受到保護。對於使用過程中不論其是否 被複製,可以持續追蹤與管理數位內容之使用狀況。

z

主要目的在限制他人對其著作之使用,包括未經其同意,

無法接觸、列印、儲存、重製、傳輸或修改其著作內容,

無法接觸、列印、儲存、重製、傳輸或修改其著作內容,

同時也以數位方式在著作內容上作相關權利的標示與授 權條件的註記。

49

版權管理的觀念

z 版權保護與合理使用

z 建立數位版權管理(DRM)機制

z 建立數位版權管理(DRM)機制

z

著作、著作權利人、授權範圍、授權期限、權利金、

利益分配等。

z 使用者的限制 (全部開放、IP或帳號管理)

z 版權的保護

z

權限管理

z

權限管理

z

浮水印保護

z

數位檔案品質與使用分級限制(典藏、下載、預覽)

版權的處理 50

(26)

爭取授權工作

z 訂定爭取授權策略

z 釐清授權內容及範圍

z 確認授權合作對象(個人、團體、出版單位)

z 訂定授權方案

z 訂定相關文件

z 著作授權同意書

z 著作授權同意書

z 合約範本 (有償、無償)

51

數位典藏著作權問題探討

z

著作權人不明的授權問題-針對著作權人不明或難尋之 典藏品進行數位化時所涉及之授權和數位著作權權利取 得問題?

得問題?

z

「授權利用」為著作權法之基本原則,無法避免。為建 立數位典藏資料庫而利用他人受著作權法保護著作,合 理使用空間不大,應取得授權方可使用,以避免侵權爭 執。

z

或許可以尋求立法,針對經過努力查考,著作人或著作或許可以尋求立法 針對經過努力查考 著作人或著作 財產權人仍不詳之著作,可經向主管機關申請獲准後,

並依主管機關所定金額提存使用報酬後,使用該著作,

以解決此一困難。

52

(27)

著作權授權問題

z 典藏數位化後的內容及資料庫,提供給個人或 廠商使用時,授權條件應如何訂定?

z 數位典藏資料庫之授權條件,首應是非專屬授 權,避免公務資源為少數民間企業所壟斷,而 獲授權之人,其得利用之地域、時間、內容、

利用方法或其他事項,得否再授權第三人,亦 應約定清楚。

z 為掌握主控權,數位典藏資料庫之授權條件,

z 為掌握主控權,數位典藏資料庫之授權條件,

應訂定期限,以便得視運作情況發展,修改或 終止授權契約。

53

內容隱私權問題

z

開放應用數位化的文獻資料,關於資料內容涉及隱私權問 題,應如何兼顧?

z

數位典藏資料庫之內容資料,難免涉及隱私權與有無捏造 事實之爭議。對於尚生存於世之人,應重視其隱私權之保 護,但亦應考量公眾知的權利。至少在資料之法定保密期 間內,不宜對外開放。

z

對於涉及已故去世之隱私,應偏重於公眾知的權利之保護。

至於數位典藏資料庫之內容資料有無捏造事實之爭議,除 非明顯有誣蔑之情形,應留待史學考證。

上述問題探討資料參考來源:章忠信,著作權筆記,

http://www.copyrightnote.org/

54

(28)

避免著作權爭議的方式

z 原則上應該假設所有作品均受到著作權保護

z 如非作品著作權人 應取得作品著作權人授權

z 如非作品著作權人,應取得作品著作權人授權 始得利用之

z 確認主張權利者是否為真正擁有著作權之人

z 於日常編審作業中加入著作權確認程序,避免 因趕稿疏忽、委外製作缺乏管理等因素,產生 著作權侵害問題

著作權侵害問題

z 如涉及爭議,找尋是否有合理使用抗辯的空間

55

小 結

z 數位典藏系統需要有數位版權管理 功能

z 知悉著作權與隱私權相關規範

z 數位物件日常編審作業應加入著作

z 數位物件日常編審作業應加入著作 權確認程序

56

參考文獻

相關文件

1999年10月,臺灣大學校長陳維昭教授與法鼓山 中華佛學研究所創辦人聖嚴法師正式締約,擴大 佛學網路資料庫的內容及工作範圍,並正式更名 為「佛學數位圖書館暨博物館」計畫 (Digital

三.在高解析度電視尚未普及前, HD攝錄機 也可以轉換成SD格式來拍攝, 仍然能在一 般的寬銀幕或 標準銀幕之電視觀賞HDV 格式的影像.----不過所觀賞到的影像品質 是SD的 畫質。... Sony Digital

博物館是一座城市歷史與文化的縮影,也是認識一座

Warnen 和高斯 (Gauss) 等人也相繼獨立發表了 複數的幾 何表示。 其中以高斯的工作對於後代的數學產生普遍的影響。 實際上 Euler 並不是憑 空想像推 導出 Euler

版面為 A4 單面全彩印刷。桂冠葉及星星圖案以燙金方式印刷。... 附件四

print –dtiff my_image.tif: 將目前指定的圖形,產生 TIFF 格式的影像檔,並以my_image.tif 的檔名儲存。.

因本校開、閉幕式會場(校史館大講堂)座位有限,故開放各報名學校行政人 員或師長代表每校 1 名、社團評選報名社團代表每社團各 1

理解並欣賞幾何的性質可以透過坐標而轉化成數與式的 關係,而數與式的代數操作也可以透過坐標產生對應的