第三章 研究設計與實施
第四節 資料蒐集與分析
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第四節 資料蒐集與分析
本研究的實作階段主要是以台北市延平高級中學為校史數位典藏系統 的建置對象,數位典藏的目標是將學校有價值的歷史、文化及學術資產以 數位化的方式予以保存,因此建置數位典藏的首要工作就是系統化的將原 始資料作分析、組織與整理,並且選用最適合的數位化方法與技術。
延平中學校史數位典藏系統的原始資料編目、典藏管理及數位化的任 務進行上,乃是以延平中學為核心,進行採編、典藏閱覽與執行工作,內 容包括原始資料的蒐集、分析、整理、資料編目與典藏,並發展適用於校 史數位典藏系統的後設資料,負責將原始資料數位化。主要的工作項目計 有:
(一)延平中學原始典藏資料的蒐集、分析、整理;
(二)訂定校史數位典藏系統後設(Metadata)資料;
(三)針對校史數位典藏系統原始典藏進行編目;
(四)編制資料庫檢索後設資料著錄手冊;
(五)數位加值教學資源發展;
(六)典藏品數位化。
一、延平中學的校史資料
民國卅四年日本戰敗投降,延平中學創辦人朱昭陽先生秉承「生命的 意義,不在當大臣,而在培養大臣」的理念,創辦延平大學。創校董事有 林獻堂、蔡培火、楊肇嘉、杜聰明、吳三連、丘念台、游彌堅等熱心教育 人士。民國三十五年九月正式招收學生,因不足三科無法成立大學,故取 名為「延平學院」,招收有志攻讀經濟、法律兩科的學生,台灣人創辦的 第一所大學就這樣誕生了。當時的延平學院的師資都是一時碩彥,如杜聰 明、曹欽源、洪遜欣、張漢裕、林茂生等台大教授。三十六年二月初,學 校放寒假。二十七日,延平北路查緝私煙的事件發生,撼動台灣社會的
「二二八事件」爆發。軍隊開進學校,假借發現學校藏有武器為由命令停 辦。事件後,時局混亂,朱昭陽先生積極奔走復校事宜,三十七年九月以 延平高中補習學校名義先行復校,聘請許多資深知名教授任教,其中包括 前總統李登輝先生。民國四十二年在現今建國南路校地上建校,四十八年 中學奉准立案繼續辦理至今。
延平中學曾經是大學,這事鮮為人知,延平的早期歷史在灰塵中湮 沒,只怕因為褪色的記憶更形模糊淡忘,為了喚起延平中學群體共同的記 憶,凝聚共同的情感,激發共同的力量,開發建置延平中學校史數位典藏 系統,實有其必要性。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
三、後設資料(Metadata)設計
後設資料是針對校史數位典藏的物件,訂定合適的著錄格式,以記錄 所有數位化的物件資料,達到辨識功用,並藉以搜尋、選擇與取用。後設 資料的制訂需以典藏文物的特性為首要考量,而資訊交換與取用的互通性 也不能忽視,在此前提下,本研究採用開放式的系統交換標準,以都柏林 核心集(Dublin Core)為制定後設資料的規範,並參考CDWA (Categories for the Description of Works of Art)文物描述後設資料標準,以及由 國科會(科技部前身)數位博物館專案計畫-資源組織與檢索規範工作小組 (ROSS)所發展的MICI-D,最後再參酌台灣百年圖書館史數位圖書館建構之 研究報告,定義出符合本研究要建立的校史數位典藏特性的Metadata資 料。
(一) 都柏林核心集(Dublin Core)
都柏林核心集是為了便利於網路電子資源的探索,在1995年3月由 OCLC公司(Online Computer Library Center)與美國國家高速電腦應用中 心(National Center for Supercomputing Applications, 簡稱NCSA)贊 助。結合來自圖書館、電腦和網路界的專家學者共同研究,主要目的在於 希望建立一套描述網路電子資源的簡單格式,以增進網路資源檢索與利 用。從Dublin Core15種資料項,可以發現其資源描述格式非常簡單易 懂,這正是都柏林核心集最初發展的概念 ─ 簡單化的設計原則,目的在 於讓資源的創造者或出版者可以自行建立符合其資源內容的metadata,而 不需要具備深厚學科知識的專家來建立,而描述的資料可直接載入資源檢 索指南以供瀏覽檢索,且結構化的資料,又可增進網路資源檢索的精確性 與資源分享的目的。簡單歸納都柏林核心集(Dublin Core)具有簡單(僅有 15個欄位)、延伸性強、非圖書館專業人員亦容易使用等特性,因此目前 已為國際所廣泛使用,且成為制定數位典藏Metadata的標準。
(二) CDWA文物描述後設資料標準
此標準主要在發展一套資訊結構,作為博物館與檔案學界描述藝術文 物(如繪畫、雕刻、陶藝、建築等)及其影像資料的標準,是由Paul Getty Trust的藝術資訊小組(The Art Information Task Force, AITF)於1990 年代研發完成,其設計理念是從藝術作品研究、展示與教育功能需求出 發,著重藝術品完整的生命週期記載資訊,提供給研究者一致、可信的內 容。另一方面,CDWA所定義的架構(共有27項主要類目)也提供交換和共享 的功能,使各地的典藏機構可以交換藏品資訊。除了著重於「物」的描 述,AITF也陸續發展人、地、索引典等相關標準,為藝術作品提供更具品
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
質控制的資料著錄規範。
(三) MICI-DC
MICI-DC係由國科會(科技部前身)數位博物館專案計畫-資源組織與檢 索之規範工作小組(ROSS)所制定,ROSS成立於1997年,主要工作項目有研 究博物館藏品之背景與特性、國內外現有之後設資料格式及後設資料資料 庫,與完整數位典藏系統之關係,當然也包括調查瞭解可能使用者的資訊 需求與搜尋行為。MICI-DC是以Dublin Core的15個基本欄位為架構,參考 Dublin Core的修飾語(Qualifier)與分析博物館藏品之特性而訂定的,
MICI-DC已應用於國科會數位博物館專案計畫中的多個計畫,包括故宮博 物院典藏文物的資源描述。
因此,計畫先從現行合適後設資料規範著手,經過比較後採用台灣百 年圖書館史數位圖書館先導計畫研究報告中,針對圖書館文物所設計的後 設資料(王梅玲等, 2008),再參酌文建會國家文化資料庫中相關之後設 資料與國科會數位博物館專案計畫之後設資料,然後依照校史數位典藏計 畫之需求加以修改完成。最後,研究計畫制定的後設資料,主要是依據 Dublin Core的15個欄位,及參考CDWA與MICI-DC,為考量未來資訊交換與 取用的互通性,儘可能地使用Dublin Core和MICI-DC所制定的修飾語,但 亦兼顧學校校史數位典藏系統收藏品的特性另訂適用的修飾語,目前已完 成全部典藏文物後設資料。另外,為了方便編目於著錄資料時有規則可依 循,也訂定了Metadata著錄手冊,附錄三即為Metadata著錄手冊的初稿。
在規劃後設資料Metadata格式以配合學校數位典藏計畫需求與數位典 藏系統之架構,修改後設資料格式,訂定有簡史與大事紀、人物(含口述 歷史)、建築物、出版品(書目資料)、照片、檔案及文物等七種Metadata 格式。本研究計畫內容主要有關學校發展的歷史軌跡,故以校史為資料主 軸,包括人、地、時、事、物。人是人物;時是簡史與大事紀;事與物是 建築物、出版品、文物,所以以學校為主軸,包括學校基本資料後設資料 (簡史、大事紀、組織編制)、相關人物、出版品、建築物、照片、檔案與 文物後設資料,本研究所用的Metadata資料結構示意圖係參考台灣百年圖 書館史數位圖書館建構之研究報告(王梅玲等, 2008)而設計完成,如圖 3-3所示。
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
同樣的,瀏覽者進行有特定目的的瀏覽就是檢索(Query),可依據檢 索關鍵字詞等方式查詢資料庫,搜尋所需的特定資料。由於校史數位典藏 系統資料類別物件很多,為了讓瀏覽者能快速地找到所檢索的標的物,網 站必須具備便利的檢索功能,換言之,要建置一完善的數位典藏系統需要 有幾個重要的要素,如豐富的數位化典藏、完善的典藏資訊組織、以及友 善且功能強大的典藏瀏覽與檢索服務等,這些都是不可或缺的。因此,建 置一個數位典藏系統首先要將典藏品數位化,接著典藏資訊的組織及建立 典藏瀏覽與檢索之間的關連性,如圖3-4所示,數位典藏資訊組織與瀏 覽、檢索之間的關連性。
圖 3-4 數位典藏化、典藏資訊組織與資訊檢索之比對示意圖 由圖3-4可清楚呈現典藏數位化、典藏資訊組織及典藏瀏覽與檢索之 間的關連性,首先需要將典藏品數位化,並且透過資訊組織來描述該數位 化藏品的屬性,這一部份是屬於創作原始資料編目、典藏管理與數位化的 工作階段;其次,將數位化的藏品及其屬性存入資料庫中,再由程式自動 從資料庫中擷取相關資料組成瀏覽的頁面,或提供閱覽者檢索,這部份就 是後續建置校史數位典藏系統平台的重點所在。
後設資料訂定之後,即可據以針對校史數位典藏系統的典藏文物進行 資訊組織、著錄。至於所使用的著錄工具,因為國科會(科技部前身)數位 博物館計畫-資源組織與檢索之規範與系統實作計畫(ROSS)專案有開發一 個XML(Extensible Markup Language)的後設資料管理系統,能兼容各種
典藏數位化
瀏覽使用者 詞彙分析 分類查詢
檢索到的資訊 比對機制
典藏資訊組織 (編目、索引) 分類與分析
(訂定數位典 藏後設資料)
校史典藏 資料庫
系統
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
後設資料的編目與管理,它可利用DTD(Document Type Definition)建立 資料庫、編輯後設資料、編輯權威檔、查詢、轉入與轉出XML文件。本研 究計劃參考此系統來設計校史數位典藏系統,以節省重複開發類似系統所 需的人力、物力、與時間。XML後設資料管理系統之所以能夠支援各種不 同的後設資料,主要的原因之一是其採用XML做為後設資料交換的機制,
當要用此系統著錄之前,首先必須先設計系統所使用的後設資料類別與格 式。在制定完成後設資料後,必須要將其表示成XML DTD(Document Type Definition)格式,再將此XML DTD匯入系統,如圖3-5所示的步驟一及步
當要用此系統著錄之前,首先必須先設計系統所使用的後設資料類別與格 式。在制定完成後設資料後,必須要將其表示成XML DTD(Document Type Definition)格式,再將此XML DTD匯入系統,如圖3-5所示的步驟一及步