第四章 詮釋資料格式對映與轉換實作
本章分為七個小節,第一節瞭解檔案全宗與全集之關係。第二節針對「國 民黨歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)兩種不同描述層次
(level)詮釋資料格式進行結構與欄位分析。第三節瞭解國民黨歷史檔案內涵,
接著進行兩詮釋資料格式欄位對映(mapping)與說明兩詮釋資料格式內容轉換
(conversion) 。第四節透過可延伸樣式表語言轉換(XSLT)技術,進行詮釋資 料格式結構轉換實作,由平面式單件層次詮釋資料編目記錄轉換成階層式全集 層次詮釋資料編目記錄。第五節探討自動全集轉換實作相關問題。第六節探討
「檔案描述編碼格式」 (EAD)與「RSLP 全集描述綱要架構」之對映關係。第 七節探討檔案全集描述呈現介面。
第一節 檔案全宗與全集
不同類型的典藏機構環境,由於典藏資源的特性與管理文化上的差異,除 了對全集之概念有不同的認定與定義之外,也產生不同的全集型態與全集描述 方法。本節深入瞭解檔案的特質、全集的特性以及全集的需求面。
一 、檔案的特質
檔案的特質可歸納為以下六點: (薛理桂,民 87)
1. 唯一性:檔案管理的前身是文書管理,在文書管理的階段,大約有 95
%的文書將被銷毀,只餘留下約 5%的文書具備持續性價值,進而成 為檔案。因而,所遺留下的檔案大都具備唯一性的特質。
2. 多元性:檔案大多係政府單位處理公務的結晶,政府單位包羅萬象,
因而檔案的內涵也無所不包。檔案所使用的媒體也具多元性從紙本式 手稿、公文到錄音帶、照片、地圖等無所不包。
3. 公平性:檔案係政府單位處理公務的結果,大都屬於真實性的資料,
除非少數有造假的情況。因而,在法律的證據與歷史的研究,檔案具
有「第一手證據」 (First hand evidence)的價值。可依據檔案解釋事實
的真實情況。
4. 可靠性:檔案的產生係由於政府單位公務人員處理公務的需要,並非 特意要產生的文書。經由產生後的公文書在公務單位若干年的保存 後,經鑑定有保存的價值、再移轉到檔案館典藏,成為正式的檔案。
由於檔案具有官方的特性,其處理過程是歷經法定的程序,因而具有 可靠性。
5. 自然性:檔案的產生是自然的彙集、漸進的與連續性的成果。
6. 關連性:公務人員在處理公務的過程中,並非單只處理本身的業務,
常會有與其他單位有關連的情況,可能在一件檔案中與數個單位有密 切關係。除了本機構內與其他單位有關連,還可能與機構外的其他單 位有關連。
二 、檔案的編排與描述
瞭解檔案的特質之後,進一步瞭解檔案在編排與描述上之特點。
檔案學上,對於檔案的典藏或管理上十分重視「整體編排」與「描述的完 整性」 ,以下說明檔案的編排與檔案的描述:
(一) 檔案的編排(arrangement)
由於檔案是隨著組織(機關)或個人之業務與活動,有機的成長累積,因 此檔案處理過程中尊重三個重要的原則,分別為「全宗原則」 、 「來源原則」以 及「原始順序原則」 :
1. 「全宗原則」 : 「全宗原則」為檔案學的核心,指的是同一組織(機關)
或個人所產生之檔案,應視為一不可分割之整體予以處理,以確保原 始檔案文件之間關聯性及整體性。
2. 「來源原則」 :依檔案來源及產生的單位,進行檔案分類,以利檔案整 理與編目。
3. 「原始順序原則」 :維持原始檔案單位之檔案案卷排列順序,以反映出
原始單位在檔案產生時之業務需求及檔案使用情況。
(二) 檔案的描述(description)
在檔案處理過程中, 「全宗原則」 、 「來源原則」與「原始順序原則」等三個 重要原則之具體應用,形成了檔案處理的全宗(fonds)、系列(Series)、案卷
(file)以及單件(item)四個主要層級。
由於檔案處理的過程中強調層級的處理與層級之間的關係,以維護檔案的 原始歷史價值,便於檔案的編排與描述以及協助檔案管理者處理檔案,因此,
檔案在描述上屬於「多層級描述」 。
在「多層級描述」中,全宗層級為檔案描述的最高(大)層級,提供檔案 記錄之背景描述資訊,例如檔案記錄的範圍與內容、摘要、相關全宗人物的傳 記與歷史等資訊。在全宗層級進行描述,即以檔案資源的集合體作為描述的單 位進行描述,也可稱為檔案資源的全集描述。
在全宗層級進行描述之優點可從使用者、典藏機構管理者以及資料交換等 三個面向進行說明:
1. 使用者面向:全宗的描述資訊,可幫助使用者在查檢全宗檔案之初,
就可對此全宗檔案建立起一個概略性的了解。
2. 典藏機構管理者面向:檔案典藏具有保存歷史的重要意義,全宗描述 有助於釐清典藏主題的歷史傳記、重要事件及典藏價值,由管理角度 來看,全宗描述有助於了解典藏品的相關典藏狀況等資訊。
3. 資料交換面向:全宗層級是檔案描述時基本的描述層級,因此在全宗 層級進行描述將有助於與國內外相關計劃進行資料的交換。
三 、檔案全宗與全集
經由上述第一節檔案的特質與第二節檔案的編排與描述,瞭解檔案界習慣 上使用「全宗」(fonds)來稱呼其典型描述資料的集合體,而不用「全集」
(collection)來指稱其典型描述資料的集合體;雖然「檔案的全宗」與「人為 的全集」都可稱之為「全集」 ,但兩者實際上仍有許多不同的特質:
1. 「檔案的全宗」 :可以瞭解單件檔案的起源(起源原則) ,且它們的排
列反映出一個組織或個人記錄它們最初的工作順序(原始順序原則) 。
2. 「人為的全集」 : 「人為的全集」當中的單件是關連的,但是缺乏全宗 的凝聚一致性(coherence)。
以下進一步整理「檔案的全宗」與「人為的全集」兩種「全集」之異同,
請參考表 4-1:
表 4-1 「檔案的全宗」與「人為的全集」之異同 類型
異同
檔案的全宗 人為的全集
聚成全集準則 「全宗原則」 、 「來源原則」以及
「原始順序原則」 主題、類型、格式、地點
聚集方式 非特意聚集,屬於自然的彙集、
漸進的與連續性 人為特意聚集
描述單位 以一個機構或個人所有的檔案
文件集合體進行描述 以單一資源之集合體進行描述
單件與單件之
間 單件與單件之間有關連性
單件與單件之間除了擁有共同 的某一特質之外,缺乏缺乏全宗
的凝聚一致性 組成全集之單
件內涵 多元性
全集類型 兩者皆可稱為全集
四 、本研究單件轉全集之必要性
本研究以國民黨歷史檔案為全集描述實作對象,目前「國民黨黨史館」在
檔案描述編目上是以單筆檔案作為描述的單位,以單筆檔案所建立起的檔案單
件層次描述對使用者而言無法瞭解檔案整體脈絡之外,從管理角度來看,僅建
立檔案單件層次描述將無助於了解典藏品的相關典藏狀況;因此有必要將目前
的檔案單件層次描述轉換成檔案全宗(全集)層次描述,轉換後可便於瞭解檔
案之整體脈絡與檔案典藏品相關典藏狀況。檔案單件層次描述與檔案全宗層次
描述之優缺點比較請參考表 4-2。
表 4-2 檔案單件層次描述與檔案全宗層次描述之優缺點 描述類型
優缺點
檔案單件層次描述 檔案全宗層次描述
詮釋資料格式 「國民黨歷史檔案詮釋資料」 「檔案描述編碼格式」 (EAD)
描述單位 單筆檔案 檔案紀錄整體-全宗
優點
不需透過檔案專家就可進行單筆 檔案編目。
單筆檔案特質詳細描述。
幫助使用者瞭解檔案整體脈絡架 構。
幫助管理者掌握典藏品相關典藏 狀況資訊。
資料交換。
缺點 檔案單件層次描述無法瞭解整體
檔案架構脈絡。
需經由對檔案整體內涵有全盤瞭 解之檔案專家才能進行檔案全宗
層次的描述。
第二節 詮釋資料格式結構與欄位分析
瞭解檔案之特質、全集的特性、全集的需求面以及本研究單件轉全集必要 性之後,進入本研究自動全集轉換實作部分。
本研究在自動全集轉換實作部分以描述單筆檔案之「國民黨歷史檔案詮釋 資料」以及描述檔案全宗之「檔案描述編碼格式」(EAD)兩種詮釋資料格式 為例,探討由單件層次描述編目記錄轉換為全集層次描述編目記錄之自動全集 轉換相關問題。
由「國民黨歷史檔案詮釋資料」 (以單件為主要描述單位之單件層次詮釋資 料)對映轉換(mapping/crosswalk)成「檔案描述編碼格式」 (EAD)檔案檢索 工具(archival finding aids)(以資源集合體為主要描述單位之全集層次詮釋資 料) ,首要工作便是分析與列出「國民黨歷史檔案詮釋資料」與「檔案描述編碼 格式」 (EAD)描述項目欄位(fields 或稱 metadata element sets)之間的對映。
本節首先分析要進行對映轉換的詮釋資料格式之結構與欄位,即「國民黨
歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)之結構為何?欄位有多 少,定義為何?
本研究進行兩詮釋資料格式架構對映與轉換, 「國民黨歷史檔案詮釋資料」
是以其資料欄位,而「檔案描述編碼格式」(EAD)則是以檔案單元主要結構 之檔案描述作為格式對映之項目。
以下分別從「國民黨歷史檔案詮釋資料」與「檔案描述編碼格式」 (EAD)
之背景、結構、組成的欄位(或稱元素)以及相關屬性進行分析。
一 、「國民黨歷史檔案詮釋資料」結構與欄位分析
(一) 背景
中國國民黨歷史檔案,根據其所編纂的史料目錄,係分為「總類」 、 「屬於 人的」 、 「屬於事的」、 「專檔」四類;但是這份目錄不同於實際上所使用之檔案 卡片目錄。
檔案卡片目錄分為「一般」 (從興中會時期至 1969 年的檔案) 、 「漢」檔(即
「漢口檔案」 ,包括國民黨武漢時期第一屆及第二屆中央執委會檔案) 、 「會」檔
(各種會議記錄檔案) 、 「中」檔(中央委員會相關檔案) 、 「部」檔(聯俄容共 時期士農工商內政五部的檔案) 、 「監」檔(國民政府時期中監會) 、 「政」檔(有 關內政及各項國政業務的檔案) 、 「特」檔(各種特種檔案)、 「環」檔(環龍路 檔案) 、 「稚」檔(吳稚暉專檔)與「膺」檔(迪鷹專檔)等十一類。
對於一個身處數量龐大、內容包羅萬象歷史檔案中的使用者來說,僅僅透 過目前的檔案卡片目錄進行檔案的檢索將十分困難,且這些歷史檔案檔案也並 非全部對外開放,造成實際使用上相當不便。
(二) 「國民黨歷史檔案詮釋資料」結構與欄位分析
「國民黨黨史館」提供的檔案卡片目錄是以單筆檔案作為描述單位,而「國
民黨歷史檔案詮釋資料」是根據卡片目錄記載的內容進行欄位之設計,屬於平
面式單筆檔案描述結構,其結構之示意圖請參考圖 4-1:
國民黨歷史檔案詮釋資料
類別 類別序號
標題 標題關鍵字
創作者 創作者關鍵字
出版年月 出版者 出版地 出版地關鍵字
版本 卷期 裝訂 技法 原件/重製
數量單位 備註 備註關鍵字
語言 保存型式
來源 數位物件 開本(尺寸)
保存情況
創作者姓名 角色
圖 4-1 「國民黨歷史檔案詮釋資料」平面式單筆檔案描述結構 資料來源:本研究
「國民黨歷史檔案詮釋資料」其描述項目欄位包含-類別、類別序號、標 題、標題關鍵字、創作者、創作者姓名、角色、創作者關鍵字、出版年月、出 版者、出版地、出版地關鍵字、版本、卷期、裝訂、技法、原件/重製、數量單 位、備註、備註關鍵字、語言、保存型式、來源、開本(尺寸) 、數位物件、保 存情況等欄位,以下透過表 4-3 分析「國民黨歷史檔案詮釋資料」結構之欄位 與相關說明:
表 4-3 「國民黨歷史檔案詮釋資料」欄位及說明
欄位名稱 / <標籤> 說明
類別 / <classification> 國民黨歷史檔案卡片目錄分類。必備且不可重 複。著錄範例:稚、環、001、6.41。
類別序號 / <classificationNumber> 國民黨歷史檔案類別後的一組純數字編號。必 備且不可重複。著錄範例:00001、001、1、2.1。
標題 / <title> 給予檔案紀錄之名稱或題名。必備且不可重
複。著錄範例:吳稚暉致戴傳賢函。
標題關鍵字 / <titleKeyword> 標題欄位解析出的關鍵字,表達檔案紀錄主題 之片語或關鍵字。非必備且可重複。
創作者姓名 /
<creatorName>
對檔案紀錄內容主要負 責 之 人 名 或 機 關 團 體 名。非必備且不可重複。
著錄範例:吳稚暉。
創作者 /
<creator>
角色 / <character>
對 檔 案 紀 錄 內 容 主 要負責之人。非必備
且可重複。 檔案紀錄內容負責之人
或機關團體所扮演的角 色。非必備且不可重複。
著錄範例:撰、擬、主編。
創作者關鍵字 / <creatorKeyword> 創作者欄位解析出的人名或機關團體名之關鍵 字。非必備且可重複。
出版年月 / <issuedDate> 檔案紀錄以目前形式呈現之日期。非必備且不 可重複。著錄範例:1927/03/29。
出版者 / <publisher>
將檔案紀錄以目前之形式呈現出版之負責人或 機關單位。非必備且不可重複。著錄範例:大 陸雜誌社。
出版地 / <issuedPlace> 檔案記錄、出版品或刊物出版之地理位置。非 必備且不可重複。著錄範例:南京、重慶。
出版地關鍵字 /
<issuedPlaceKeyword>
出版地欄位解析出的地名關鍵字。非必備且可 重複。
版本 / <edition>
檔案記錄、出版品或刊物之版本類別。非必備 且不可重複。著錄範例:1 版、再版、中英文對 照版。
卷期 / <volume> 檔案記錄、出版品或刊物之卷期。非必備且不 可重複。著錄範例:第一期、第一卷第四期。
裝訂 / <binding> 檔案記錄、出版品或刊物之裝訂方式。非必備
且不可重複。著錄範例:平裝、裱裝、線裝。
技法 / <technique> 呈現檔案紀錄所使用之技術或方法。非必備且 可重複。著錄範例:鋼筆、毛筆、鉛印、剪報。
原件/重製 / <duplication> 檔案記錄目前呈現之類型。非必備且不可重 複。著錄範例:原件、抄件、稿件。
數量單位 / <quantity> 檔案記錄之數量。非必備且可重複。著錄範例:
1 張、全 1 冊。
備註 / <note> 著錄檔案紀錄相關之註解。非必備且可重複。
備註關鍵字 / <noteKeyword> 備註欄位解析出表達檔案紀錄資源主題之關鍵 字或片語。非必備且可重複。
語言 / <language> 檔案紀錄內容所使用之語言。非必備且不可重 複。著錄範例:日文、法文、英文。
保存型式 / <pattern>
檔案記錄呈現保存之形體類型。非必備且不可 重複。著錄範例:名片、明信片、報刊、小冊 子、袖珍本。
來源 / <source>
敘述檔案紀錄的來源,讓使用者得知該檔案紀 錄之來源。非必備且不可重複。著錄範例:中 央秘書處計劃檢查士編印、中委會第一組編印。
開本(尺寸) / <format> 檔案紀錄之實體尺寸描述。非必備且不可重 複。著錄範例:16 開、10 吋、長條。
數位物件 / <digitalObject> 檔案紀錄數位化影像檔。非必備且不可重複。
保存情況 / <condition> 檔案紀錄目前的保存狀態。非必備且不可重 複。著錄範例:不全。
二 、「檔案描述編碼格式」 (EAD)結構與欄位分析
(一) 背景
「檔案描述編碼格式」(EAD)是網際網路環境下用於檢索工具編碼的標
準,也是專門用於描述檔案手稿紀錄所設計之詮釋資料格式,其階層式的檔案 資源描述架構,可完整表達檔案編排與描述的「全宗原則」 、 「來源原則」、 「原 始順序原則」以及「多層次描述原則」 ,將相關的檔案紀錄聚合在一起,成為一 個檔案全宗,反映出檔案資料實體的原始排列順序與結構,有助於使用者瞭解 和檢索被描述的檔案紀錄資料。
「檔案描述編碼格式」(EAD)除了能提供全宗(全集)整體概括性之描 述,幫助使用者迅速判斷組成該全宗之系列或單件是否符合所需之外,也能進 一步描述組成該全宗之系列或單件相關資訊,提供使用者進一步查詢使用,即 透過全宗層次的描述讓使用者在資訊查詢時可從大處著眼(全宗的描述) ,小處 著手(系列或單件的描述) 。
「檔案描述編碼格式」 (EAD)之結構由「EAD 標目」 (EAD Header) 、 「序 言」 (Front Matter)與「檔案描述」 (Archival Description)三大部分所組成,以 下針對這三個部分所包含之元素(elements)、子元素(subelements)以及相關 屬性(attributes)進行整理與說明。
(二) 「EAD 標目」
「檔案描述編碼格式」 (EAD)結構的第一個組成部分為「EAD 標目」 (EAD Header) 。 「EAD 標目」主要用於描述檢索工具本身相關的資訊,例如檢索工具 的產生、出版、修訂或發行等相關訊息。
在「EAD 標目」元素之下有四個子元素,依序為「EAD 識別」(EAD Identifier) ,屬於必備元素; 「文件描述」 (File Description) ,屬於必備元素; 「背 景描述」(Profile Description),屬於選擇性元素以及「修訂描述」(Revision Description) ,屬於選擇性元素。 「EAD 標目」元素結構如圖 4-3 所示:
檔案描述編碼格式
<ead>
EAD標目
<eadheader>
EAD識別
<eadid>
必備元素
文件描述
<filedesc>
必備元素
背景描述
<profiledesc>
修訂描述
<revisiondesc>
序言
<frontmatter>
檔案描述
<archdesc>
圖 4-3 「EAD 標目」元素結構
資料來源:本研究
詳細的「EAD 標目」元素說明階層式架構表格請參考附錄一。
(三) 「序言」
「檔案描述編碼格式」(EAD)結構的第二個組成部分為「序言」(Front Matter) 。「序言」元素將焦點集中在檢索工具的建立、出版或運用上而非有關 檔案被描述的資訊。 「序言」元素結構如圖 4-4 所示:
檔案描述編碼格式
<ead>
EAD標目
<eadheader>
序言
<frontmatter>
檔案描述
<archdesc>
題名頁
<titlepage>
文字片段
<div>
圖 4-4 「序言」元素結構 資料來源:本研究
詳細的「序言」元素及說明之階層式架構表格請參考附錄二。
(四) 「檔案描述」
「檔案描述編碼格式」(EAD)結構的第三個組成部分為「檔案描述」
(Archival Description),該元素及其子元素主要用於描述檔案記錄本身以及檔 案記錄管理上的相關資訊。
「檔案描述」元素能表達多層次之描述架構,彙編包括「視檔案資料整體 為一個單位」以及「組成該檔案資料整體之部件」的相關描述資訊,體現檔案 檢索工具表達階層結構之能力,讓不能親臨檔案實體典藏館之使用者只要透過 網際網路查詢,就可瞭解一個全宗檔案組成之系列、卷、件的完整資訊。
「檔案描述」元素結構如圖 4-5 所示:
檔案描述編碼格式
<ead>
EAD標目
<eadheader>
序言
<frontmatter>
檔案描述
<archdesc>
控制取得狀態
<accessrestrict>
描述識別
<did>
傳記或歷史
<bioghist>
範圍與內容
<scopecontent>
編排
<arrangement>
控制使用狀態
<userestrict>
權威控制
<controlaccess>
附屬成分描述
<dsc>
自然增長
<accruals>
採訪資訊
<acqinfo>
其他可取得之類型
<altformavail>
鑑定資訊
<appraisal>
書目
<bibliography>
保管歷史
<custodhist>
數位檔案物件
<dao>
數位檔案物件 群組<daogrp>
描述群組
<descgrp>
歸檔方式
<fileplan>
索引
<index>
附註
<note>
其他的描述資 料<odd>
原件位置
<originalsloc>
其他檢索工具
<otherfindaid>
實體特徵與技 術需求
<phystech>
建議引用
<prefercite>
處理資訊
<processinfo>
相關資料
<relatedmaterial>
逐頁資訊
<runner>
附件資料
<separatedmaterial>
圖 4-5 「檔案描述」元素結構 資料來源:本研究 詳細的「檔案描述」元素說明表格請參考附錄三。
典型的檢索工具對一個全宗(全集)有兩個或三個觀點,每個觀點描述相 同資料主體,但是在詳細程度上呈現變化: (Frusciano, 2000)
¾ 多層次描述之「第一層」
用一個非常一般方式描述全集整體。
提供資料類型之概觀。
指出有意義的重要人物以及主題代表。
提供檔案起源(provenance)與存取(access)等相關資訊。
全面地描述全集,可能包含一個書目性梗概或代理者歷史以 及範圍與內容註。
¾ 多層次描述之「第二層」
焦點集中在全集當中的資料群集(groupings)。
比在第一層更加詳細描述每一個群集。
強調更多具體的資料類型、附加的個體與主題代表。
包含在整體中的系列或副系列之敘述性描述,可能被描繪在 檢索工具中。
依全集的複雜性與典藏機構之慣例而定,該中間層次描述
(mid-level description)或許是不需要的。
¾ 多層次描述之「第三層」
可能描述每卷(file)或每個單件(item)。
常採取檔案卷夾(container)或文件夾(folder)清單目錄形 式。
這 些 清 單 目 錄 明 確 地 呈 現 出 檔 案 資 料 智 力 活 動 階 層
(intellectual hierarchy),研究者運用這些清單目錄來取得資 料。
「檔案描述編碼格式」(EAD)之「檔案描述」元素中透過「附屬成分描 述」元素表達多層次描述之架構,如圖 4-6 所示,依實際檔案資料層級或典藏 機構描述慣例而呈現出不同的檔案描述層次:
檔案整體
<archdesc>
檔案組成部分
<c01>
檔案組成部分
<c01>
更小組成部分
<c02>
<dsc>
更小組成部分
<c02>
更小組成部分
<c02>
更小組成部分
<c02>
單一記錄檔案
<c03>
單一記錄檔案
<c03>
全宗層次 Fonds level
系列層次 Series level
卷層次 File level
件層次 Item level 高層次描述 High level description
低層次描述 Low level description 附屬成分描述
圖 4-6 「附屬成分描述」元素之階層式描述架構
資料來源:本研究
第三節 詮釋資料格式欄位語意對映與欄位內容轉換
目前「國民黨黨史館」中典藏的歷史檔案在資訊組織方面主要是以單件檔 案作為描述的單位以及資源發現的最前線;若要從目前底層詳細的單件層次檔 案描述建立起上層的全集層次檔案描述,需先瞭解國民黨歷史檔案整體之內 涵,再根據這些內涵設計符合本研究之「檔案描述編碼格式」 (EAD),進行全 宗描述,分析與設計步驟如下:
1. 國民黨歷史檔案內涵之分析
瞭解全集描述實作對象檔案整體之內涵,例如國民黨歷史檔案在編排上所 包含的層級,以確定全集描述之主體描述單位以及構成該主體描述單位之群組。
2. 分析全集層次詮釋資料「檔案描述編碼格式」 (EAD)
根據國民黨歷史檔案內涵,分析「檔案描述編碼格式」(EAD)中需包含 的檔案層級以及採用的元素、屬性與屬性值,即分析「檔案描述編碼格式」
(EAD)中哪些元素用於全集資源的揭示與描述,哪些元素用來與「國民黨歷 史檔案詮釋資料」欄位進行對映。
3. 進行兩詮釋資料格式欄位對映。
一 、國民黨歷史檔案內涵分析
以檔案編排之「全宗原則」 、 「起源原則」與「原始順序原則」三大原則為 基礎以及參考「國民黨黨史館」之檔案卡片目錄,將國民黨歷史檔案分為全宗、
系列與件三個層級,以下針對這三個層級之間的關係進行說明:
1. 全宗:在本研究中全宗是「中國國民黨」此一組織內產生的所有檔案 紀錄文件之彙集,屬於「組織全宗」 。
2. 系列:在全宗層級的下一個層次為系列,用來定義國民黨歷史檔案的 第二層結構,本研究依照「國民黨黨史館」檔案卡片目錄進行劃分,
系列層級包含「國防最高委員會會議記錄」 、 「國防最高委員會檔案」、
「上海環龍路檔案」、「中央改造委員會檔案」、「中央改造委員會紀
錄」 、 「中央改造委員會各種工作簡報」 、 「第七屆中央常務委員會議記
錄」以及「吳稚暉先生檔案」等八個系列。
3. 單件:在系列層級之下,用來定義國民黨歷史檔案的第三層結構,是 本研究中檔案的最小描述單位。
二 、本研究「檔案描述編碼格式」 (EAD)分析
以國民黨歷史檔案內涵分析為基礎,分析「檔案描述編碼格式」(EAD)
中透過哪些層級與元素用於全宗的描述,哪些元素用來與「國民黨歷史檔案詮 釋資料」欄位進行對映,分為四個部分進行分析,請參考圖 4-7:
檔案描述編碼格式<ead>
EAD標目<eadheader>
檔案描述<archdesc>
全宗(全集)描述 系列描述
單件描述
圖 4-7 本研究「檔案描述編碼格式」(EAD)分析 資料來源:本研究
以下分析這四個部分所採用的元素。
(一) 「EAD 標目」元素與屬性分析
「EAD 標目」(EAD Header)元素主要是用來描述國民黨歷史檔案檢索工
具的相關資訊,並非用來描述檔案主體。在此部分構成的元素包含:
¾ EAD 識別(EAD Identifier)元素
¾ 文件描述(File Description)元素
標題敘述(Title Statement)元素
檢索工具正題名(Title Proper of the Finding Aid)元素
¾ 背景描述(Profile Description)元素
建立(Creation)元素
日期(Date)元素
使用語言(Language Usage)元素
語言(Language)元素
「EAD 標目」元素、屬性與值之階層式架構請參考圖 4-8,詳細的階層式 分析表格請參考附錄四。
圖 4-8 「EAD 標目」元素、屬性與值
資料來源:本研究
(二) 「檔案描述」元素與屬性分析
「檔案描述」 (Archival Description)元素第一層以全宗作為描述的單位,
進行檔案資料整體之內容、背景和範圍的描述,除此之外,也提供有助於檔案 資料使用上與管理上的相關資訊,透過這些元素(欄位)所建立起的描述資料 可稱為檔案的全宗層次描述或稱之為檔案資源的全集層次描述,提供檔案資源 整體概觀的描述,讓使用者可根據這些描述資料,瞭解全宗及其所含括檔案之 情況。
本研究中「檔案描述」第一層用來描述檔案全宗整體之內容、背景、範圍 與數量等相關元素與子元素是參考英國「檔案中心」EAD 線上樣版(EAD 2002 Online Template)中所採用的元素與子元素。
用來描述全宗的元素與子元素包含:
¾ 描述識別(Descriptive Identification)元素
單元識別(ID of the Unit)元素
單元題名(Title of the Unit)元素
單元日期(Date of the Unit)元素
典藏機構(Repository)元素
實體描述(Physical Description)元素
範圍(Extent)元素
起源(Origination)元素
資料之語言(Language of the Material)元素
語言(Language)元素
¾ 傳記或歷史(Biography or History)元素
¾ 範圍與內容(Scope and Content)元素
¾ 控制取得狀態(Conditions Governing Access)元素
¾ 其他檢索工具(Other Finding Aid)元素
¾ 相關資料(Related Material)元素
¾ 書目(Bibliography)元素
¾ 權威控制(Controlled Access Headings)元素
「檔案描述」元素、屬性與值階層式架構請參考圖 4-9,詳細的階層式分 析表格請參考附錄五。
圖 4-9 「檔案描述」元素、屬性與值 資料來源:本研究
(三) 「附屬成分描述」元素與屬性分析
「附屬成分描述」 (Description of Subordinate Components)元素主要用來 描述全宗所包含的「系列」以及「系列」當中所包含的「件」 。
用來描述「系列」的元素與子元素包含:
¾ 附屬成分描述(Description of Subordinate Components)元素
組成部件(Component)元素(系列)
描述識別(Descriptive Identification)元素
z 單元識別(ID of the Unit)元素
z 單元題名(Title of the Unit)元素 z 單元日期(Date of the Unit)元素
z 資料之語言(Language of the Material)元素
範圍與內容(Scope and Content)元素
編排(Arrangement)元素
控制取得狀態(Conditions Governing Access)
控制使用狀態(Conditions Governing Use)
「附屬成分描述」元素、屬性與值階層式架構請參考圖 4-10,詳細的階層 式分析表格請參考附錄六。
圖 4-10 「附屬成分描述」元素、屬性與值 資料來源:本研究
(四) 單件層次描述元素與屬性分析
單件層次描述元素與屬性主要用來描述單件檔案紀錄,為了進行「國民黨 歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)兩種不同描述粒度層次 之詮釋資料格式對映轉換,本研究將「檔案描述編碼格式」(EAD)之單件層 次描述所使用之元素、屬性與值的分析獨立成單個表格。
描述單件檔案的元素與子元素包含:
¾ 組成部件(Component)元素(件)
描述識別(Descriptive Identification)元素
單元識別(ID of the Unit)元素
單元題名(Title of the Unit)元素
起源(Origination)元素
單元日期(Date of the Unit)元素
資料之語言(Language of the Material)元素
實體描述(Physical Description)元素
數位檔案物件(Digital Archival Object)元素
附註(Note)元素
權威控制(Controlled Access Headings)元素
單件層次描述元素與屬性分析階層式架構請參考圖 4-11,詳細的階層式分 析表格請參考附錄七。
圖 4-11 單件層次描述元素、屬性與值
資料來源:本研究
三 、「國民黨歷史檔案詮釋資料」欄位對映 EAD 欄位
(一) 詮釋資料格式欄位對映與轉換相關問題
當兩種詮釋資料格式進行對映轉換時,需考慮的問題包含:(Moen, 2005) 1. 兩詮釋資料格式之間的語意(semantic)、結構(structural)與資料轉
換(data conversion)。
2. 單向對映(one-way)或可反(逆)轉的對映(reversible)。
3. 兩個元素之間的對映情形
(1) 一對一(one-to-one) :來源資料元素對應至目標資料元素。
(2) 一對多(one-to-many) :來源綱要架構(schema)中的元素對映 至目標架構(schema)時,拆解成兩個以上的資料元素。
(3) 多對一(many-to-one) :來源綱要架構(schema)中的元素在對 映至目標綱要架構(schema)時,需將多個資料元素合併成一個 資料元素。
(4) 一對零(one-to-zero) :語意上沒有相容的元素。
4. 資料轉換(Data conversion)
(1) 從包含較少格式到包含較多格式(From less inclusive to more inclusive format) 。
(2) 從未受控制到受控制的詞彙。
根據「國民黨歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)兩詮 釋資料格式結構與欄位分析為基礎,以下分別從結構轉換、語意轉譯以及詮釋 資料格式欄位內容轉換等三方面分析「國民黨歷史檔案詮釋資料」對映轉換至
「檔案描述編碼格式」 (EAD)之情形:
1. 結構轉換方面(structural transform)
(1) 平面式(flat)描述結構轉換成階層式(hierarchical)描述結構:
與「國民黨歷史檔案詮釋資料」平面式單一描述結構相較之下「檔
案描述編碼格式」(EAD)屬於階層式多層次描述結構,因此在 進行詮釋資料格式對映轉換時是由平面式詮釋資料格式對映轉 換成階層式詮釋資料格式。
(2) 描述粒度(granularity)層次:兩詮釋資料格式可表達描述粒度層 次(粗細)之能力不同。 「檔案描述編碼格式」 (EAD)可表達檔 案資源的全宗(全集)層次描述、系列層次描述以及單件層次描 述;而「國民黨歷史檔案詮釋資料」僅能表達單一描述粒度,即 描述資源詳細之特徵。因此在進行兩詮釋資料格式對映轉換時必 須對映轉換至相同的描述粒度層次中。
綜合上述結構轉換方面兩小點,圖 4-12 為「國民黨歷史檔案詮釋資料」對 映到「檔案描述編碼格式」(EAD)結構之示意圖,由平面式描述結構轉換成 階層式描述結構且對映至相同的描述粒度層次:
檔案描述編碼格式
<ead>
EAD標目
<eadheader>
檔案描述
<archdesc>
全宗層次:
描述檔案整體 系列層次:
描述檔案內部組成部分 件層次:
描述檔案內部單筆記錄檔案 單筆KMT歷史檔案編目記錄
High level description
Low level description 對映轉換
圖 4-12 「國民黨歷史檔案詮釋資料」與 EAD 結構轉換 資料來源:本研究
2. 語意轉譯方面(semantic translation)
(1) 描述項目欄位名稱:兩詮釋資料描述項目之欄位名稱不同, 「國
民黨歷史檔案詮釋資料」主要是依據國民黨歷史檔案之特性特質
所設計,屬於地方性(local)之詮釋資料格式;而「檔案描述編
碼格式」(EAD)則是國際檔案界用於檔案檢索工具編碼的詮釋
資料格式標準,因此在「國民黨歷史檔案詮釋資料」中較特定用
來描述國民黨歷史檔案資料特性或特質之欄位在對映到「檔案描
述編碼格式」(EAD)中檔案描述的欄位時,由於欄位語意不相
容問題,產生某些欄位無法對映情況。兩詮釋資料格式欄位詳細 的對映情形將於下面進行分析與說明。
3. 兩詮釋資料格式欄位內容轉換(conversion)
(1) 資料轉換內容控制部分: 「國民黨歷史檔案詮釋資料」中的「標 題關鍵字」 、 「創作者關鍵字」 、 「出版地關鍵字」以及「備註關鍵 字」等欄位的關鍵字並未進行權威控制;而「檔案描述編碼格式」
(EAD)中的權威控制欄位(元素)缺乏可應用在本研究實作對 象進行檔案內容權威控制之權威控制參照檔。國外常採用檔案描 述規則(Archives, Personal Papers,and Manuscripts,簡稱 APPM) 、 美國國會圖書館標題表(Library of Congress Subject Headings,簡 稱 LCSH)或美國國會圖書館人名權威檔(Library of Congress Name Authority File,簡稱 LCNAF)等作為檢索工具內容標準。
(二) 「國民黨歷史檔案詮釋資料」欄位對映 EAD 欄位
再瞭解詮釋資料格式欄位對映與轉換相關問題之後,進一步分析「國民黨 歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)兩詮釋資料格式欄位對 映情形。
「國民黨歷史檔案詮釋資料」欄位對映到「檔案描述編碼格式」(EAD)
結構中檔案描述之單件層次描述欄位可分為四種情形,分別為『語意相容可直 接對映的欄位』 、 『加入屬性與值進行對映的欄位』、 『無直接可對映的欄位』以 及『不進行對映的欄位』 ,以下針對這四種對映情形進行說明:
1. 語意相容可直接對映的欄位:即「國民黨歷史檔案詮釋資料」中的欄 位其語意可相容於「檔案描述編碼格式」(EAD)中的欄位。此情況 所包含的欄位有:
¾ 標題-單元題名
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 標題 單元題名
標籤對映 <title> <archdesc><dsc><c02
level="item"><did><unittitle
encodinganalog="245$a">
¾ 創作者姓名-名稱(原始創作者欄位中的資料並未區隔個人名 稱、家族名稱或法人團體名稱,因此對映至「檔案描述編碼格式」
(EAD)中的名稱欄位,確保欄位對映時語意上的最大相容性)
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 創作者姓名 名稱
標籤對映 <creatorName>
<archdesc><dsc><c02 level="item"><did><originati
on label="Creator:"><name>
¾ 出版年月-單元日期
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 出版年月 單元日期
標籤對映 <issuedDate>
<archdesc><dsc><c02 level="item"><did><unitdate
type="inclusive"
encodinganalog="245$f">
¾ 數量單位-範圍
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 數量單位 範圍
標籤對映 <quantity>
<archdesc><dsc><c02 level="item"><did><physdes
c> <extent
encodinganalog="300$a">
¾ 語言-使用語言
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 語言 使用語言
標籤對映 <language>
<archdesc><dsc><c02 level="item"><did><langmat
erial ><language encodinganalog="546">
¾ 開本(尺寸)-尺寸
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 開本(尺寸) 尺寸
標籤對映 <format>
<archdesc><dsc><c02 level="item"><did><physdes
c><dimensions encodinganalog="300$c">
¾ 數位物件-數位檔案物件(更為精確的來說是對映至「數位檔案 物件」欄位中的「數位檔案物件描述」欄位的「段落」欄位)
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 數位物件 數位檔案物件
標籤對映 <digitalObject>
<archdesc><dsc><c02 level="item"><did><dao
linktype="simple"
href="Text"><daodesc><p>
2. 加入屬性與屬性值進行對映的欄位:於「檔案描述編碼格式」 (EAD)
檔案描述欄位(或稱元素)中加入特定的屬性(attribute)與值(value) ,
讓欄位更為專指(specific)再進行欄位的對映。此情況所包含的欄位
有:
¾ 類別-單元識別(屬性名稱="屬性值")
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 類別 單元識別(標籤屬性="類別
")
標籤對映 <classification>
<archdesc><dsc><c02 level="item"><did><unitid
label="classification"
encodinganalog="099">
¾ 類別序號-單元識別
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 類別序號 單元識別(標籤屬性="類別
序號")
標籤對映 <classificationNumber>
<archdesc><dsc><c02 level="item"><did><unitid label="classificationNumber"
encodinganalog="099">
¾ 角色-名稱*
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 角色 名稱(角色屬性="角色")
標籤對映 <character>
<archdesc><dsc><c02 level="item"><did><originati
on label="Creator:"><name
role="character">
¾ 裝訂-實體面
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 裝訂 實體面(類型屬性="裝訂")
標籤對映 <binding>
<archdesc><dsc><c02 level="item"><did><physdes
c> <physfacet encodinganalog="300$b"
type="binding">
¾ 技法-實體面
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 技法 實體面(類型屬性="技法")
標籤對映 <technique>
<archdesc><dsc><c02 level="item"><did><physdes
c> <physfacet encodinganalog="300$b"
type="technique">
¾ 原件/重製-實體面
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 原件/重製 實體面(類型屬性="原件/
重製")
標籤對映 <duplication>
<archdesc><dsc><c02 level="item"><did><physdes
c><physfacet encodinganalog="300$b"
type="duplication">
¾ 保存型式-實體面
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 保存型式 實體面(類型屬性="保存型
式")
標籤對映 <pattern>
<archdesc><dsc><c02 level="item"><did><physdes
c><physfacet encodinganalog="300$b"
type="pattern">
¾ 出版地關鍵字-權威控制:地理名稱
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 出版地關鍵字 地理名稱(角色屬性="主題
")
標籤對映 <issuedPlaceKeyword>
<archdesc><dsc><c02 level="item"><controlaccess
><controlaccess><geogname role="subject"
encodinganalog="651"
source="Text" rules="local">
3. 無直接可對映的欄位:語意上沒有相容的欄位,但原始欄位中的檔案 特質描述資料可提供使用者作為判斷檔案內容的有用資訊,則將此情 況中的欄位對映至「檔案描述編碼格式」 (EAD)的「附註」(Note)
元素並加入標籤(LABEL)屬性與屬性值之後的「段落」 (Paragraph)
元素裡。此情況所包含的欄位有:
¾ 出版者-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 出版者 附註(出版者)
標籤對映 <publisher>
<archdesc><dsc><c02 level="item"><did><note
label="publisher"><p>
¾ 出版地-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 出版地 附註(出版地)
標籤對映 <issuedPlace>
<archdesc><dsc><c02 level="item"><did><note label="issuedPlace"><p>
¾ 版本-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 版本 附註(版本)
標籤對映 <edition>
<archdesc><dsc><c02 level="item"><did><note
label="edition"><p>
¾ 卷期-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 卷期 附註(卷期)
標籤對映 <volume>
<archdesc><dsc><c02 level="item"><did><note
label="volume"><p>
¾ 備註-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 備註 附註(備註)
標籤對映 <note>
<archdesc><dsc>< c02 level="item"><did><note
label="note"><p>
¾ 來源-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 來源 附註(來源)
標籤對映 <source>
<archdesc><dsc>< c02 level="item"><did><note
label="source"><p>
¾ 保存情況-附註
國民黨歷史檔案詮釋資料 檔案描述編碼格式
欄位對映 保存情況 附註(保存情況)
標籤對映 <condition>
<archdesc><dsc>< c02 level="item"><did><note
label="condition"><p>
4. 不進行對映的欄位:原始「國民黨歷史檔案詮釋資料」中的「標題關 鍵字」 、 「創作者關鍵字」以及「備註關鍵字」等欄位的資料並未明確 區隔出人名、機關組織名、主題與地名等關鍵字,因此在對映轉換到
「檔案描述編碼格式」(EAD)中的「權威控制」(Controlled Access
Headings)欄位(元素)時,產生內容轉換上的問題;若原始關鍵字
欄位中的資料內容有進一步區隔出人名、機關組織名、主題或地名等
關鍵字時,則關鍵字對映情況為一對多。
詳細的「國民黨歷史檔案詮釋資料」欄位對映到「檔案描述編碼格式」
(EAD)檢索工具中檔案描述之單件層次描述欄位之表格,請參考附錄八。
除了上述欄位語意對映的四種情況之外, 「國民黨歷史檔案詮釋資料」與「檔 案描述編碼格式」(EAD)兩詮釋資料格式在元素之間對映情形包含有「一對 一關係」 、 「多對一關係」以及「一對零關係」等三種對映關係。
第四節 自動全集轉換實作
本章第三節分析兩詮釋資料格式欄位語意對映或稱語意匹配(linguistic matching)以及兩個元素之間的對映情形,請參照圖 4-13 左半部所示,欄位語 意相容對映之分析結果做為第四節撰寫 XSLT 轉換規則文件以進行自動全集轉 換實作時之依據。
在本研究中,轉換所指的是由「國民黨歷史檔案詮釋資料」編目 XML 檔 透過 XSLT 轉換規則文件轉換成「檔案描述編碼格式」(EAD)檢索工具 XML 檔,即詮釋資料格式結構轉換(transformation),請參照圖 4-13 右半部所示。
國民黨歷史檔案詮釋資料 編目記錄XML檔
檔案描述編碼格式(EAD) XML檔
國民黨歷史檔案詮釋資料 欄位
檔案描述編碼格式(EAD) 欄位
欄位語意 相容對映
透過XSLT 進行 結構轉換
詮釋資料格式欄位對映 詮釋資料格式結構轉換
mapping activities
Transformation processes
圖 4-13 「國民黨歷史檔案詮釋資料」對映與轉換到 EAD
資料來源:本研究
一 、XSLT 轉換詮釋資料格式結構
可延伸樣式表語言轉換(XSLT)是一種樹狀結構導向的轉換語言,透過 XSLT 可將 XML 文件樹狀架構轉換成另一個新的架構,本研究即透過可延伸樣 式表語言轉換(XSLT)將單件層次描述的國民黨歷史檔案單筆編目紀錄 XML 檔轉換成全集層次描述的「檔案描述編碼格式」 (EAD)編目記錄 XML 檔。
(一) 本研究運用 XSLT 轉換詮釋資料格式結構流程
本研究運用 XSLT 轉換詮釋資料格式結構流程如下:
1. 設定來源樹(source tree):XSLT 轉換的輸入文件為來源樹,在本研 究中指的是以「國民黨歷史檔案詮釋資料」編目之單筆國民黨歷史檔 案編目記錄 XML 檔。
2. 撰寫 XSLT 對映轉換規則文件:XSLT 對映轉換規則文件記錄「國民 黨歷史檔案詮釋資料」與「檔案描述編碼格式」(EAD)兩詮釋資料 格式之間的資料轉換關係(用於比對元素、建立元素) 、規範從一個詞 彙轉換到另一個詞彙的過程。
3. 設定結果樹(result tree) :透過 XSLT 轉換後的輸出為結果樹,在本研 究中指的是「檔案描述編碼格式」 (EAD)編目記錄 XML 檔。
4. 測試與驗證轉換結構後之結果:由「國民黨歷史檔案詮釋資料」編目 記錄 XML 檔轉換成「檔案描述編碼格式」(EAD)編目記錄 XML 檔 後,透過「檔案描述編碼格式」(EAD)之文件類型定義檔(DTD)
驗證轉換後的檔案檢索工具是否為有效的(valid)。
本研究運用 XSLT 轉換詮釋資料格式結構之流程圖請參考圖 4-14:
XSLT處理器 (XSLT Processor)
結構樹轉換 XSLT Stylesheet Document
結果樹 來源樹
來源文件 國民黨歷史檔 案詮釋資料單 筆編目XML檔
樣版樹
輸出文件 EAD 編目 XML檔
圖 4-14 透過 XSLT 轉換詮釋資料格式結構流程 資料來源:本研究
(二) XSLT 轉換規則文件結構
轉換「國民黨歷史檔案詮釋資料」單筆編目紀錄 XML 檔到「檔案描述編 碼格式」 (EAD)編目紀錄 XML 檔之 XSLT 轉換規則文件本身也是一份 XML 文件,其結構包含 XML 路徑語言、新增元素與轉換語彙,以下針對該份文件 之結構進行簡要說明,完整詳細的 XSLT 轉換規則編碼文件請參考附錄九:
1. XML 路徑語言(XML Path Language,簡稱 XPath) :在 XSLT 轉換規 則文件中,主要是透過 XML 路徑語言(XPath) ,在 XML 文件找尋資 料,其語法可用來指出文件架構或資料之位置,指定需要進行轉換之 內容。
2. 新增元素、屬性與屬性值:在 XSLT 轉換規則文件中為轉換後的結果 樹加入新資料元件,即當來源樹的某一節點符合 XSLT 轉換規則文件 中的某個規則模式時,該規則所涉及的內容將在結果樹中被建立起 來。例如在本研究中,從「國民黨歷史檔案詮釋資料」編目記錄 XML 檔轉換成「檔案描述編碼格式」(EAD)時編目記錄 XML 檔,透過 XSLT 轉換規則文件新增「檔案描述編碼格式」 (EAD)中的「EAD 標目」 、 「檔案描述」等元素及其相關子元素、屬性與屬性值。
3. 轉換語彙:在 XSLT 轉換規則文件中包含了一組規則,用來規範從一
個詞彙轉換到另一個詞彙的過程,定義出兩份不同 XML 文件之間資
料元素的對映關係。在本研究中指的是「國民黨歷史檔案詮釋資料」
欄位對映轉換成「檔案描述編碼格式」(EAD)檔案描述欄位的對映 轉換規則。
二 、自動全集轉換
再撰寫 XSLT 轉換規則文件後,本研究透過 XMLSPY 應用軟體進行單筆國 民黨歷史檔案編目記錄 XML 檔轉換至一筆「檔案描述編碼格式」 (EAD)編目 記錄 XML 檔,即在「國民黨歷史檔案詮釋資料」與「檔案描述編碼格式」 (EAD)
之間交換編目記錄資料。
(一) 單筆國民黨歷史檔案編目記錄轉換實作
以中國國民黨(組織全宗)的「中央改造委員會檔案」 (系列)中的一筆檔 案紀錄(單件)為例,進行單件層次描述編目紀錄轉換為全集層次描述編目記 錄。
圖 4-15 是以「國民黨歷史檔案詮釋資料」編目的單筆檔案描述記錄及其
XML 編碼檔:
<?xml version="1.0" encoding="UTF-8"?>
<kmtArchive>
<classification>6.43</classification>
<classificationNumber>52</classificationNumber>
<title>中改會第52次工作會議紀錄</title>
<titleKeyword>中改會;會議記錄</titleKeyword>
<issuedDate>1951/10/02</issuedDate>
<issuedPlace>台北</issuedPlace>
<issuedPlaceKeyword>台北</issuedPlaceKeyword>
<technique>毛筆</technique>
<technique>油印</technique>
<duplication>原件</duplication>
<quantity>24張</quantity>
<note>附台灣各界1元獻機運動競賽辦法</note>
<noteKeyword>台灣各界1元獻機運動競賽辦法</noteKeyword>
</kmtArchive>
類別 6.43 類別序號 52
標題 中改會第52次工作會議紀錄 標題關鍵字 中改會;會議記錄
出版年月 1951/10/02 出版地 台北
出版地關鍵字 台北
技法 毛筆 技法 油印
原件/重製 原件 數量單位 24張
備註 附台灣各界1元獻機運動競賽辦法 備註關鍵字 台灣各界1元獻機運動競賽辦法
圖 4-15 單筆「國民黨歷史檔案詮釋資料」編目記錄及其 XML 編碼檔 資料來源:本研究
透過 XMLSPY 應用軟體載入 XSLT 轉換規則文件與單筆國民黨歷史檔案編
目紀錄 XML 檔,進行自動全集單筆轉換實作,請參考圖 4-16 自動轉換示意圖:
XSLT轉換規則文件
圖 4-16 本研究自動全集轉換示意圖 資料來源:本研究
表 4-4 為單筆國民黨歷史檔案編目紀錄轉換至「檔案描述編碼格式」 (EAD)
中單件層次描述編目紀錄結果:
表 4-4 單筆國民黨歷史檔案編目紀錄轉換至 EAD 單件層次描述編目紀錄
元素名稱 編目記錄
描述識別<did>
單元識別(標籤屬性="類別")<unitid> 6.43 單元識別(標籤屬性="類別序號")<unitid> 52
單元題名<unittitle> 中改會第 52 次工作會議紀錄
單元日期<unitdate> 1951/10/02
實體描述<physdesc>
數量單位<extent> 24 張 實體面(類型屬性="技法")<physfacet> 毛筆 實體面(類型屬性="技法")<physfacet> 油印 實 體 面 ( 類 型 屬 性 =" 原 件 / 重 製 " )
<physfacet>
原件
附註(標籤屬性="出版地")<note>
段落 台北
附註(標籤屬性="備註")<note>
段落 附台灣各界 1 元獻機運動競賽辦
法 權威控制<controlaccess>
權威控制<controlaccess>
地理名稱(角色屬性="主題")<geogname> 台北
單筆「國民黨歷史檔案詮釋資料」編目紀錄 XML 檔透過 XSLT 轉換規則 文件轉換成「檔案描述編碼格式」 (EAD)編目記錄 XML 檔之完整檔案階層描 述請參照附錄十。
(二) 自動全集轉換實作結果分析
由於「國民黨歷史檔案詮釋資料」欄位是對映至「檔案描述編碼格式」
(EAD)中檔案單件層次描述欄位,因此透過 XSLT 轉換規則文件轉換詮釋資
料格式結構與資料後, 「檔案描述編碼格式」 (EAD)中用來描述全宗、系列以
及用來描述檢索工具等欄位是需要藉由人工方式填入資料,請參考圖 4-17,再
填妥這些欄位的資料後,才能成為一筆完整的檔案資源全集描述。
檔案描述編碼格式<ead>
EAD標目<eadheader>
檔案描述<archdesc>
XSLT
單件描述
欄位對映與資料自動轉入 全集描述
單件描述 系列描述 人工方式填入資料