DOI: 10.6245/JLIS.2017.431/715
中國文物分類主題詞表構建方法學芻議
黃明玉 北京科技大學科技史與文化遺產研究院副教授 E-mail: [email protected] 關鍵詞: 藝術與建築敘詞表;控制詞彙;文化遺產;文物分類;敘詞表/主題詞表; 博物館;知識組織【摘要】
中國文化遺產與博物館領域朝向數位化發展已是大勢所趨,然在資料標準建設方面仍有待建 立相關規範。本文敘述及討論中國文物分類主題詞表的發展背景及過程,以中國現行文物分類體 系以及美國蓋堤研究中心(GRI)研發的藝術與建築敘詞表為基礎,嘗試發展以中國文物概念為 主體的文物分類主題詞表,現階段為確立方法學與初步框架的先期工作。詞表框架草案設立了材 質、活動、物理特質、風格與時代、物件五個分面,所收錄的概念詞彙擬作為控制詞彙支援文物 元數據相關元素的標準化取值。目前已完成現行分類法的詞彙概念分析,並選取AAT 相關概念詞 彙共同作為詞表發展基礎,同時確立了備選詞彙來源,提出後續工作組的建置規畫。未來應視使 用者需求繼續完善分類主題詞表分面,並發展其他重要元素的特殊領域控制詞彙,並在詞表維護、 應用與國際化方面建立工作機制。前言
當前社會中不斷推陳出新的資訊技術影響了文博機構各方面的工作,即使在博物館工作 中最傳統的領域─藏品的編目登錄,也早在1980 年代開始了資訊化的探索和實踐。 研究發現[1],在藏品資訊管理系統中,使用控制詞彙─即採用標準資料值,不但有助於 資訊的組織和管理,更能在後續的資訊利用中實現高效的檢索。主題詞表是控制詞彙的形式 之一,可以管理複雜術語的結構,並界定術語概念之間的關係。本研究為在中國文物領域建 立主題詞表的方法學思考與嘗試,期能拋磚引玉,在未來能有更多的機構和學者的投入,共 同構建完善而豐富的中國文物知識圖譜。構建緣起與背景
截至2016 年,中國已有約 4,600 座博物館,館藏文物約 4,800 萬件。凡有條件的博物館, 均已進行著藏品管理資訊化和藏品、展覽數位化的工作。然而,在中國文博領域1990 年代末開始進行資訊化和數位化以來,雖然累積了大量的文物資料,但這些資料多數長期靜置於資 料庫中,沒有得到有效的整合利用,無法開放檢索;由於缺乏統一的元數據標準[2],各個系 統和資料庫之間無法交換和共用資料,使得國家在資訊化方面的投入沒有得到應有的產出。 有鑑於此,中國國家文物局乃發起「文物數字化保護元數據標準研究」計畫,由科技部提供 支援經費,希望從文物數位化的應用邏輯出發,建設文物元數據方面的框架體系、核心標準、 描述標準、管理保存標準及應用技術規範,從而規範文物數位化的元數據建設。本研究的基 礎為該計畫中的「文物分類體系研究」子計畫,目的在研擬出一套支持描述元數據標準制定 與實施的文物分類行業規範,使元數據的表達具有一定的深度。 文物分類長期以來一直是中國文物博物館界一項未能達成共識的議題,原因是全國各地 博物館的收藏內容不同,從其成立之初在本地已發展出適用於自身機構的分類方法,且有時 會根據各類文物的收藏量自行擬定大、小類別;另一方面,歷代的金石與書畫收藏傳統也形 成了對文物分類的習慣法,影響與沿用至今。所以要在業界推行一套全國統一的文物分類標 準始終存在一定的困難。然傳統的存在即有其合理性與必要性,故需尊重之與兼顧之。 雖然文物的分類方法各不相同,但掌握文物的基礎知識是博物館的重要工作。另外,考 慮到目前中國國家文物局當前推行的「智慧博物館」理念與文化政策在具體應用方面的需求, 其重要訴求為在其「智慧服務」功能板塊中,發揮博物館生產、傳遞知識的目標作用(宋新 潮,2015;羅靜,2015)。是故,本研究以「知識組織」的觀點來考慮何為文物分類在數位化 工作中的適用性做法。其實,傳統分類方法本身就是一種知識組織行為,而今的要務是加入 標準化的概念,將過去的知識遺產轉化為今日可用的資源。擬採用的技術路線為利用知識組 織、語義網路等技術,並建立文物的概念以及概念之間的關聯。 首先,我們將文物分類定義為:依據文物屬性,安排或歸類具有相同或相似屬性的物件。 其次,用分類法的一般原則(標準同一性、窮盡性原則和排他性原則)去檢視過去沿用至今、 並已形諸於相關規範的文物分類法。李濟先生在「古物」一文中曾援引民國廿四年中央古物 保管委員會公布的古物範圍和種類,列舉了十二類古物的名稱和定義,涵蓋古生物和史前遺 物、建築和可移動文物,並注意文物與存在環境的脈絡關係,對今天的文物分類做法仍具有 很高的指導性(李濟,2010)。而新中國成立之後並未承繼上述做法,文物的保護管理劃分為 館藏文物和不可移動文物,逐漸形成兩套分類體系,如此一來導致在文物編目資訊中難以兼 顧(或容易忽略)原本同屬於一個場所或地點的文物脈絡關係。如今文博領域的習慣分類法, 常見用於分類的屬性有材質、功能、技法、年代,有時候也使用風格、形式、等級、關聯性、 社會價值等屬性,如表1 所示。
表1 中國現行文物法規中的分類屬性和類別舉隅 文物類別 分類屬性 可移動文物 不可移動文物 材質 陶器、玉石器、銅器 石雕 製作技法 石刻、織繡、書畫 碑刻、石雕、岩畫 功能 傢俱、法器、武器 洞穴址、聚落址、窯址、古墓葬 工業建築及附屬物、醫療衛生建築 關聯性 名人遺物 名人或貴族墓、烈士墓 形式 磚瓦 池塘井泉、亭臺樓閣 等級 帝王陵寢、普通墓葬 位置 水下遺址、摩崖石刻 時間/年代 近現代重要史蹟 社會價值 中華老字號 註: 上表中的文物類別區分為可移動與不可移動文物,乃沿用目前中國現行的相關行業規範(分別為《館藏 文物登錄規範WW/T0017-2013》附錄以及第三次全國文物普查分類標準),其區分存在可商榷性,且採 用多種分類屬性並不符合標準同一性原則(如:石雕有材質和技法屬性,岩畫有位置和技法屬性),在 此暫不予延伸討論。 由表1 可看出,目前中國使用的文物分類法採用了綜合屬性與枚舉方式,在標準同一性、 排他性和窮盡性方面均有未盡完善之處。在單一分類表中採取多種分類屬性,造成某類文物 可以歸類的位置不只一處,由不同的人操作起來容易發生混淆。故若想沿用過去習慣採用多 種屬性來分類,應選取適用屬性,安排為分面分類法才是合理做法。而上述分面分類法的觀 點,早在1991 年即有學者提出,且提倡在面對用途與形式複雜的物件時使用「範圍注釋」, 也考慮到了粒度選取的問題(祝敬國,1991),然未見後續有所推行,至為可惜。於 2001 年 頒佈的《博物館藏品信息指標體系規範(試行)》,在文物類別(A0211)一項中建議採取各 博物館現行分類辦法,足見並無全國統一做法。而至 2012-16 年實施的全國可移動文物普查 中,則是在單一分類表中採用材質、技法、功能、關聯性等多種屬性將博物館藏品分為 35 大類。通過對十家以上博物館的調研訪談,多數博物館均認為該做法存在問題。 學者吳美美指出,實體文物和數位文物在知識組織方法上存在差異,而從「管理」與「獲 取」兩種觀點出發的知識組織方式也有所不同。數位化工作中的文物分類體系,其對象是實 體文物和數位文物,更多的是應採用「獲取」觀點的知識組織方法(吳美美,2016)。現今有 更為優越的技術支援,使得在數位化工作中實現文物分類標準化成為可能。
數位化、資料值標準與文物分類標準化
文物分類是藏品管理工作中的一環,新的技術也影響了現今博物館藏品管理的性質。王 嵩山先生在論及博物館蒐藏的目的時曾回顧道:過去在博物館的蒐藏與管理中,往往把物件 視為自足的系統,甚少關懷其隱含的關係與脈絡,也未處理物件與知識系統的關聯性(王嵩山,2012)。在博物館的語境中,蒐藏並分類物件或標本,即是在以分類詮釋其領域中對此世 界的認識方式。如今步入數位時代,博物館對資訊社會的回應首要即是以其管理與組織的藏 品知識,面對各種加值應用的(潛在)需求。 資訊技術使我們得以近用藏品資訊,並且進一步交流,但並非每個負責著錄文物編目資 訊的研究人員都會使用相同的術語來描述藏品。即使兩家博物館的主題藏品類似,情況亦然。 根據研究顯示,不同博物館、不同編目人員會使用不同的詞彙描述藏品(Bell, 1994)。在此 情況下,當這些詞彙錄入資訊系統,如何高效和精確檢索藏品資訊就會成為問題,由此產生 了標準化的需求。 以數位文物的生命週期而言,其記錄建檔(documentation)階段所對應的資料標準,通 常針對資料結構、資料內容和資料值區分為元數據標準、編目規則和詞彙標準。其中詞彙標 準即控制詞彙(controlled vocabularies),為用於控制描述藏品的術語選擇的標準。在博物館 的應用中,常見使用的形式有權威檔(authorities)、主題詞表/敘詞表(thesauri)和分類體 系(classification systems),其作用在於準確選擇合適詞彙描述物件,並保持詞彙使用一致; 確保博物館物件有一致分類;把博物館藏品資料和多種權威來源做聯結;為博物館記錄中使 用的術語提供脈絡(如上位詞、下位詞或相關詞彙);讓自動或人工檢索藏品記錄更有效率。 目前在博物館領域已有上百種詞彙標準,涵蓋通用範圍到非常專業的領域(Gilliland, 2016; The Canadian Heritage Information Network, 2016)。
在資訊化實施較早的歐美博物館與文化遺產領域,多見在其文物/藏品資訊管理系統中 的部分資訊項使用控制詞彙,亦即建立該資訊項的標準術語。如擁有800 多萬件藏品的大英 博物館,其藏品資訊管理系統大量使用標準術語,所用控制詞彙均為該館登錄部門與研究部 門人員創建與發展,採用了權威檔和敘詞表兩種形式。前者用於參考文獻、傳記、以及較為 靜態的資訊項,而在可能有複雜關係的資訊項則使用敘詞表,如主題、材質、文化/時代風 格、地理位置等,多數概念(約90%)均有範圍注釋。其登錄部門主管認為,術語(Terminologies) 是博物館知識的代表,該館藏品資料庫歷經25 年的演變與改進,在經過許多不成功的嘗試之 後,最終確立以控制詞彙作為藏品資料值標準的技術路線。又如維多利亞與亞伯特博物館 (V&A Museum)的藏品管理系統,則是建立了事件、組織機構、人物的權威檔和地方、術 語的敘詞表用於藏品資訊的詞彙控制。該館有專門負責術語發展與管理的工作組(約10 人), 由各部門研究人員、圖書館員和校譯員組成。在不可移動文物方面,英國的三處文化遺產管 理機構(Historic England、RCAHMS [3]、RCAHMW [4])也各自發展出共 23 個敘詞表與詞 單,涵蓋考古學、檔案、器物、遺產、紀念物等方面的術語,統稱為FISH Vocabularies,兩 年更新一次,最新版本為2016 年 10 月更新的第 19 版,已發佈為線上資源提供各界免費使用 (Terminology Working Group, 2016)。此外,如法國在 1964 年開展的文化遺產普查,其後由
文化部遺產司文化遺產普查處陸續出版了四部敘詞表,包括圖像學敘詞表(1984)、宗教類文 物敘詞表(1999)、建築敘詞表(2000)、可移動文物敘詞表(2001)(國家文物局,2013)。 綜上,可見控制詞彙在博物館與遺產資訊管理工作中的應用普遍性與重要性。 有鑒於中國文博領域目前已有等同於行業規範的分類方法(《館藏文物登錄規範 WW/ T0017-2013》以及第三次全國文物普查分類標準),而在各地博物館的藏品管理系統中也常見 應用了可選詞單(權威檔)作為一種資料值控制方法,如上海博物館曾建立人名權威檔,以 及常見於有書畫館藏的題材(山水畫、人物畫等)詞單、有瓷器館藏的窯口名稱詞單,或新 石器時期的文化類型詞單等;有些有特殊主題的收藏單位,也見發展出其專用的控制詞彙, 如中國國家圖書館收藏的輿圖,即在比例尺、投影法、地形標記法、視圖法等方面發展了更 具專業性內容的詞單。故在分析行業情況以及委託方和行業需求後,研究計畫團隊提出建制 一文物分類主題詞表以支持描述元數據的設計與應用。該詞表除了應具備分面分類法的功能, 採用傳統的習慣分類法中以材質、功能、技法、形式等作為分類屬性,且針對數位化應用需 求納入標準化的概念,即具備詞義消歧、同義詞控制等功能,並可進一步建立詞表中概念(以 詞彙來表達)的等級關係與相關關係,形成文物概念的語義網路(Zeng, 2016)。誠然,這麼 做的同時,文物分類主題詞表的作用已然不僅止於分類,而得以進一步組織整理相關資訊, 作為日後開放關聯資料的資源,從而或有新的研究發現與作用。
中國文物分類主題詞表建立實施步驟
以AAT 為參考對象 通過調查、對比目前國內外文博領域的相關敘詞表,研究計畫團隊選擇以美國蓋堤研究 中心(Getty Research Institute)發展的藝術與建築敘詞表(Art & Architecture Thesaurus,以下 簡稱 AAT)作為詞表框架的主要參考對象。該詞表為分面的層級結構,八個分面和 35 個層 級組合起來的概念性框架形成了一個藝術和建築的總體分類表(參見表 2)。採用 AAT 框架 有以下優點:AAT 分面和層級採用的元素涵蓋了目前中國文物分類體系採用的文物屬性;是 包含語義網路的資料庫,顯示了概念間的連結與路徑,其語義學路線圖支援以知識為基礎的 資訊搜索,結構化的詞彙表具有同等、層級和聯想等三種語義關係,包含豐富資訊和脈絡性 知識,目前有約 57,047 個相關概念,353,969 個相關概念的術語和其他資訊;為成熟元數據 標準,已發展30 餘年,採用 ISO 和 NISO 標準編輯,有利於以規範術語支援文物知識組織; 為多語敘詞表,在全球範圍內的文博領域使用廣泛,且已和 Getty 其他詞表(地理名稱敘詞 表 TGN、藝術家名錄 ULAN)發佈為開放關聯資料(LOD),有利中國未來和國際文物領域 在數位化方面開展合作;最後,可能也是最重要的一點,是AAT 已由中央研究院和數位典藏 計畫翻譯了繁體中文版本,且AAT 中文化的方法學已發展完備(陳淑君,2012)。兩岸文化同源,多數文物概念基本等同,繁體中文AAT 實為中國大陸在發展文物分類主題詞表的重要 基礎與助力。 表2 AAT 分面和層級 關聯概念 分面 物理特質 分面 風格與時代 分面 代理者分面 活動分面 材料分面 物件分面 商標分面 關聯概念 特質和屬性 風格與時代 個體與群體 學科 材料 建築環境 商標名稱 情況和作用 組織 功能 組件 設計項目 活性有機體 事件 裝備與設備 色彩 身體和心智 活動 物件類型 過程和技術 物件群集 與系統 視覺與語言 傳達 詞表工作方法框架與建立步驟 中國文物分類主題詞表的工作方法框架由三部分內容組成:1.Getty AAT 詞表結構和編輯 規則,以及繁體中文AAT 的部分概念/詞彙及對應分析方法;2.中國現行敘詞表相關國家標 準─主要為《信息與文獻 敘詞表及與其他詞表的交互操作 第一部分:用於信息檢索的敘詞 表》(GB/T 13190.1-2015)和《文獻主題標引規則》(GB/T 3860-2009);3.中國文物領域內容, 包括概念/詞彙、圖像、在智慧博物館項目以及其他數位化計畫中的實務應用。 由於中國文博業界過去沒有編制敘詞表的經驗,整個行業在資訊化標準實施方面的基礎 也較為薄弱,且文物分類主題詞表建立的目的在於服務中國的文博行業與一般大眾;而AAT 的發展基礎為西方的文物,雖然其收錄的概念為一般概念,但仍有許多概念對於中國的使用 者來說近期內派不上用場,故詞表建立初期階段僅選擇AAT 的部分結構作為發展雛形。但在 單一概念的款目結構上則盡可能遵循 AAT 的概念記錄建置標準,包括 ID(精準等同的概念 和AAT 保持一致)、詞彙、相關概念、分面/層級代碼、層級位置、範圍注、來源與貢獻者、 外部連結。詞表與中文AAT 的關係則是在中國現有分類詞彙基礎上,從中文 AAT 中選取目 前可能有應用需求的概念加入詞表,並且採用中英文 AAT 的對應分析方法,以及參考中文 AAT 建置經驗中的工作組設置和方法學框架。詞表建立步驟如下頁圖 1 所示:
圖1 中國文物分類主題詞表初稿建立步驟 詞表建立的具體步驟為:以《館藏文物登錄規範WW/T0017-2013》和「第三次全國文物 普查分類標準」的分類詞彙概念為起點,將35 大類可移動文物類別詞彙拆解為 227 個單一概 念,5 大類不可移動文物詞彙拆解為 109 個概念,合計為 336 個概念,做詞彙概念分析以及 與AAT 的對應分析。詞彙概念的分析方法包括藏品保證原理、文獻保證原理、使用者/機構 保證原理、滾雪球取樣和對應分析,分析的理論基礎為敘詞表的三類語意關係:等同關係、 層級關係、聯想關係,以及屬性結構理論(陳淑君,2012)。對於每一個分類詞彙,先將之拆 解為單一概念,如在古建築中有一類別為「壇廟祠堂」,分別應為壇、廟、祠、堂四個概念; 而後確認英譯詞彙,再查找AAT 是否有此概念(中、英文)詞彙,確認對應類型以及對應至 AAT 的詞彙、分面和層級。每個概念詞彙均備註了英譯詞彙來源、概念分析責任者和校對者、 相關文物、範圍注釋、權威文獻來源(至少三條),並做概念的綜合分析及列出該概念於AAT 階層樹中的位置。 進行對應分析的目的有三:一、作為選擇AAT 分面、層級、概念/詞彙的依據;二、作 為未來繼續發展文物分類主題詞表的標準工作方法和流程;三、作為以後改進傳統文物分類 法的基礎─通過詞彙概念的分析,發現目前傳統分類方法在邏輯、概念、結構和完整度方面 存在的問題,且由於詞表款目結構中包含概念的範圍注釋,該注釋亦可作為傳統分類法的文 物概念定義,進一步提升傳統分類法的標準化程度。 上述提及中國文物的傳統分類習慣採用材質、技法、功能、形式四種屬性,故與AAT 對 應分析結果亦主要落於其中的相關分面與層級,包括:活動分面的過程與技術層級、材料分
面的材料層級、物件分面的建築環境、裝備與設備、物件類型、視覺與語言傳達等層級。考 慮到物件分面中的「組件」層級和「物件群集與系統」層級亦為文物編目的重要概念,雖然 傳統分類法未有明顯以此方式來考慮組織分類,但仍應將相關文物概念納入主題詞表收錄範 圍。另外,由於本詞表主要用於中國文物的數位化成果,故除了上述幾個分面的一般性概念, 在年代、風格以及設計元素等屬性,希望盡可能具備中國文物專有的概念,故再選取兩個分 面中的層級:分別是物理特質分面的設計元素和風格與時代分面的同名層級。綜上,共計五 個分面23 個層級,分面與層級名稱如表 3 所示。 表3 中國文物分類主題詞表框架草案 分面(Facet) 層級(Hierarchy)[5] 物件分面 建築環境 聚落與景觀 複合建築和區域 單一建築作品 開放空間和地點元素 物件類型 組件 物件群集與系統 裝備與設備 裝備 服裝 工具與設備 武器與彈藥 測量裝置 容器 聲音裝置 娛樂用品 運輸工具 視覺與語言傳達 視覺作品 交換媒介 資訊形式 材料分面 材料 活動分面 過程和技術 風格與時代分面 風格與時代 物理特質分面 設計元素 確認詞表初步框架後,分析中國大陸文博行業文物數位化著錄與編目等業務需求,擬從 繁體中文AAT(經詞彙概念分析)選取約 3,000 筆概念記錄加入已完成對應分析、確認分面 與層級位置的原有分類概念詞彙,共同作為詞表發展基礎。而後,針對中國現有資源、行業 狀況,規劃建置詞表的方法學和未來工作組織的實施方式;最後則是形成詞表初稿邀請業內 文物研究領域專家斧正,並與幾所大型國家級博物館和文物管理單位合作,取得文物資料進 行詞表選詞範圍和概念粒度適用性之驗證,並視需要進行方法學的調整與修正。
分類主題詞表對核心元數據的支持 按照上述步驟創建的詞表初稿,可以在研究計畫團隊目前提出的二十項描述元數據核心 元素中,作為控制詞彙支持其中五個元素的取值,包括:文物類型、時間、材質、技法和主 題,如下圖2 所示。除了上述五個元素,核心元素中的「現狀」也需要有標準化詞彙來描述 文物狀況,在該領域目前中國文博界已有大量成果可作為資源,但現階段的詞表重點在於支 援文物基本資料的取值,故對於文物狀況的描述概念詞彙將於下一階段作為發展重點。 圖2 文物描述核心元數據中可應用文物分類主題詞表作為控制詞彙的欄位 詞表工作組建置規畫 在詞表建立過程中,很重要的一點是在承繼中英文AAT 的基礎上建立能為中國博物館數 位化提供學術研究和文物資訊利用等服務所用、具有自身特點的知識組織工具,在此目標下, 應發展自身的方法學以及中國文物領域內容。我們參考了繁體中文AAT 發展過程中關於工作 組的設立方案,希望未來在中國文物分類主題詞表的建置上,能設立五個工作組:方法學研 究與發展、對應分析、中國文物概念研究與發展、技術和功能發展、兩岸交流和國際化。前 三個工作組的任務分別是遵循當前的國家標準、AAT 的基本框架與編輯規則,以及繁體中文 AAT 在翻譯、概念對應分析和概念貢獻的方法學,從概念詞彙的選取到新增,確定工作流程、 品質控制方法和專業人力需求。在詞表下一階段的工作規畫中,概念詞彙來源將從現有的行 業分類法所用詞彙拓展,除收錄、理清現有概念的同義詞、近義詞,以及一字多義的情況, 還擬從多個權威來源分析、整理和添加文物概念詞彙,包括中國分類主題詞表、文物與博物 館機構、權威研究文獻、全國文物普查資料庫、四有檔案標準化成果[6]、其他數位化專案, 以及利用電腦技術從其他權威來源取得領域詞彙,並擬建立邀請文物研究領域之專家學者貢 獻概念詞彙的機制。在技術和功能發展方面,除了詞表款目結構中的文字性內容,也希望能
系統、以及建設規畫中的國家文物資源資料庫的知識組織工具,來進行詞表的功能開發。最 後的國際交流工作組任務則是保持和各國AAT 工作小組的緊密合作,為詞表的國際化和專業 度打好基礎,並進一步與國外文博領域詞表的建立和維持機構也發展合作關係或交流管道。
中國文物分類主題詞表目前進展
分類詞彙對應分析與統計 目前研究計畫團隊已完成現有分類法與AAT 的概念詞彙對應分析,並選取了約 2,980 筆 AAT 詞彙概念,形成詞表初稿,即將與山西博物院、上海博物館、新疆文物局合作,進行詞 表的適用性實驗分析。在實作對應分析後發現,現有分類概念詞彙與AAT 概念有精準等同和 近似等同對應的概念約有一半;約有30%的狹廣對應結果表明,現有分類法中有比 AAT 更為 專指的詞彙概念,以及目前已形成習慣用法的複合概念;有約5%的廣狹對應,以及 11.3%的 關聯對應關係(見表4)。關聯對應關係大部分為不可移動文物概念,這反映了一個特殊現象, 即中國對不可移動文物概念的理解相較於可移動文物,和歐美文博領域差異更大。AAT 中將 建築環境分為:聚落與景觀、複合建築與區域、單一建築作品、開放空間和地點元素四類, 而中國則是在文物保護的進程中直接限定了其類型,區分為古建築、古墓葬、古遺址、石刻 及石窟寺、近現代重要史跡及代表性建築五類。誠然,這只是目前研究階段的一個初步統計, 因為目前使用的分類詞彙對於中國整體文物概念詞彙的代表性還有待進一步研究分析,但由 此開展的概念對比與認識,可以相信未來中國文物分類主題詞表在與AAT 的合作中可以貢獻 諸多中國文物概念,在不可移動文物領域尤為可期。 表4 中國現行分類法詞彙概念與 AAT 概念對應分析結果[7] 對應類型 Mapping type 可移動文物 Cultural objects 不可移動文物 Built Works 統計 Sum 比例 % 精準等同=EQ 119 34 153 45.5% 近似等同~EQ 15 7 22 6.5% 聯集等同EQ+ 1 1 2 0.6% 交集等同EQ| 3 0 3 0.9% 狹廣對應BM 68 33 101 30% 廣狹對應NM 11 6 17 5% 關聯對應RM 10 28 38 11.3% 總數Total 227 109 336 100% 詞彙選取 詞彙選取工作部分,在五個分面的相關層級中初步選取了以物件分面為主要內容(約佔 79%)的概念詞彙。選取的詞彙列表由研究計畫團隊經討論多次形成,但在概念詞彙的粒度與選擇標準方面,仍需取得文物資料分析與實驗,並請相關專家進一步審議;由於詞表未來 的使用對象之一為文博機構的專業編目人員,故詞彙的選取與收錄也有待開展需求調查,以 求和實務應用層面接軌。以不可移動文物常見的材料「玻璃」為例,在AAT 中,玻璃屬於材 料分面的無機材料,又可以成分或來源、形式、技術、屬性、玻璃製作混合物等方式來區分, 在實際編目工作選詞中,是否還需如此精細區分,需再經討論。 此外,在概念詞彙選取執行過程中也發現,「組件」分面涵蓋了文物從整體到原子的概念, 在可見形式上包含了文物的各種組成部分。就編目需求而言,在可移動文物方面,記錄每一 個可分開的部分(如多寶閣文物套組、杯蓋/身/托盤等)是常見做法,然而在不可移動文 物方面,是否應記錄一個建築群的整體到最小組件(如門把手、鉚釘、椅背板與扶手等),則 有待商榷。在建築史研究中,或許單一組件可以反映出某方面的重要發展,而應收錄相關的 組件概念,但實際情況是在不可移動文物的記錄建檔工作中,專業性的研究內容是較弱的環 節,也較少考慮到編目資訊的粒度問題。是故,在編目標準與實際執行情況和業務能力存在 落差的情況下,詞表如何兼顧知識組織目標和實際應用需求,仍需進一步研究。 博物館與圖書館藏品資料權威檔概念初步分析與收錄 本研究計畫中負責文物專門元數據設計規畫的子計畫團隊,在發展各類別文物的描述元 數據研究過程中,也陸續收集了從核心元素擴展的專門元素概念詞彙,如拓片方面的金石材 質與類型、銘文語種、技法,以及繪畫在類型上可依照畫種、社會作用和表現形式、題材內 容與裝裱形式等區分,又如輿圖在其技法方面,於比例尺、投影法、地形標記法、視圖法與 色彩等均有專門描述的概念詞彙,如表5 所示。這些概念經初步對應分析,與 AAT 精準等同 的已收錄於詞表,其他概念則列為備選,待完整對應分析後決定層級位置再行收錄。且如古 籍、拓片、甲骨、輿圖等類別在圖書館界已有編制元數據的工作基礎,故有部分的相關概念 詞彙已形成權威檔,實為分類主題詞表素材的極佳來源。 表5 可移動文物專門元數據元素概念舉隅 文物類別 古籍 拓片 繪畫 傢俱 甲骨 輿圖 專屬元素概念 印刷術 版刻 金石材質 金石類型 銘文語種 技法 文物類型 •畫種 •社會作用和表現形式 •題材內容 •裝裱形式 材質 技法 規格 題識/標記 主題 現狀 文物類型 材質 技法 題識/標記 主題 材質 技法 主題 風格時代 材質 技法 •比例尺 •投影法 •地形標記法 •視圖法 •色彩 主題 風格時代
在計畫團隊調研過程中,受訪的博物館中以故宮博物院(北京)的藏品管理系統發展了 較多控制詞彙(可選詞單形式,名之為「基表數據」),包括產地、尺寸(測量方式)、計量單 位元、來源、材質、紋飾(繪畫、銅器)、重量等,其中的材質和紋飾兩類,經與現行分類法 與AAT 對應分析後,與 AAT 有精準對應關係的詞彙也已收錄於詞表,其餘的列為候選詞彙, 待完整對應分析後決定層級位置再行收錄。
未來展望
當前中國博物館的數位化風潮正方興未艾,在擁抱新技術應用於博物館諸多業務面向的 創想與實踐中,有些有識之士也已體認到文物數位化目前已進入瓶頸階段,面臨元數據標準 缺失、文物基礎資料良莠不齊(僅有較小比例的珍貴文物有豐富的編目資料和研究記錄)、亟 需文物博物館領域專業術語等情況。要解決上述問題,仍需從博物館基礎業務─文物編目與 記錄建檔工作─的落實做起。而今有技術為助,可以數位化工作為契機檢視過去的文物藏品 編目成果,採用標準化做法,或許能補足過去工作的缺環。 中國文博領域「智慧博物館」理念的提出,其包含的智慧保護、智慧管理、智慧服務三 個面向的整合,將物件、人、和博物館資料考慮為一個互動的整體,較之歐洲「聰明博物館」 (Smart Museum)的概念,對博物館業務功能與潛在作用在當今資訊社會中的發揮,可說是 更具有前瞻性的想法。但作為一項國家重大文化政策,在理論建構和實務發展的完備上仍有 待克服諸多複雜問題。而元數據標準研究提出的資料結構和資料值標準(控制詞彙),能在未 來智慧博物館的推動中,在文物藏品資料的組織和交換上起到關鍵作用。建置文物分類主題 詞表對於中國文博領域來說,是一個全新的想法和行動。由於過去在文物資訊系統中對術語 和詞彙沒有標準化舉措,文物資訊的使用機制亦有體制問題等其他複雜因素,雖則目前看似 對主題詞表未有明確的使用者需求,未來的使用者保證機制也有待進一步的工作設計來推行, 然而隨著諸多數位化項目的實施與推進,以及從近兩年子計畫團隊在不同學術交流場合的經 驗得知,許多收藏機構已體認到採用控制詞彙的重要性,行業領域對文物描述控制詞彙的使 用者需求已然浮現。 由於計畫時限與現有資源等因素,中國文物分類主題詞表目前的設計是建立五個分面23 個 層級的結構化詞表,除了完善現有分面與層級的概念收錄,未來希冀能繼續參考AAT 的框架將 其他所需分面與層級發展完備。然而文物既是具備時空屬性的物件,要做到完整編目文物藏品 的標準化,除了一般性詞彙(如物件類型、材料、風格時代、技術等)應做控制,還應在名稱、 地理資訊、創作者以及涉及圖像學的資訊項發展控制詞彙。詞表的建立需要大量人力與時間資 源的投入,故分類詞表的長期目標是從國家分面專門立項,建立詞表編輯系統和資料庫,建立 正式工作組和長期維護團隊,進行中英雙語翻譯,並制定開放的資料政策與提供開放連結服務。誠如美國博物館學者史蒂芬威爾(Stephen E. Weil)所言,博物館領域的豐富度是其他領 域難以超越的,博物館追求的目標相當多元,在教育、精神、社會、身體、心裡或經濟方面 能提供的公共服務種類也幾無止盡,在這些範疇中,博物館都有潛力成為觀眾回憶、探索和 想像的場所,是人們進行非正式學習的重要基地(張譽騰,2015)。目前中國的博物館工作不 但在行業領域本身已進入愈來愈網路化的協作階段,也面臨著不斷變化的文物資訊利用和互 動等外部需求,將自身專業化能力往標準化方向的提升乃勢在必為。
致謝
本詞表建立過程中,承蒙Kent State Univ.曾蕾教授與中央研究院陳淑君博士自初創時期 伊始以來在方法學方面的悉心指導,以及在發展過程中,國家文物局宋新潮副局長、羅靜副 司長以及中國文化遺產研究院孟憲民研究員給予的重要指導和意見,在此謹表由衷謝忱。 本文系中國國家科技支撐計畫項目文物數字化保護元數據標準研究課題(2014BAK07B02) 研究成果之一。
附註
[1]本文暫以博物館語境討論文物與藏品,但所涉文物概念不限定於可移動文物。實則,以 廣義的蒐藏觀念視之,保存文化古蹟與遺址等不可移動文物亦是一種蒐藏行為。 [2]元數據 metadata 一詞為中國大陸用法,在臺灣學界一般稱為詮釋資料或後設資料。 [3]全稱為 The Royal Commission on the Ancient and Historical Monuments of Scotland。 [4]全稱為 The Royal Commission on the Ancient and Historical Monuments of Wales。 [5]此處「層級」(Hierarchy)指 AAT 詞表結構中每個「分面」(facet)下分設的不同分 面專有名稱,並非單純階層(level)之意。 [6]四有檔案指中國《文物保護法》(2015 年修訂版)第十五條中規定,各級文物保護單位, 分別由省、自治區、直轄市人民政府和市、縣級人民政府劃定必要的保護範圍,作出標誌說 明,建立記錄檔案,並區別情況分別設置專門機構或者專人負責管理,「四有」即有保護範 圍、保護標誌、記錄檔案和保管機構。 [7]中國現行分類法詞彙概念多屬於材質、功能、技法、形制,多數對應至 AAT 詞表中的 物件分面(Objects Facet),該分面收錄了以形式、材質、功能分類的可移動與不可移動文物 類型,其中收錄不可移動文物概念的層級名稱為建築環境(Built Environment),亦即,在 AAT 詞表中,以 Objects 概念統攝可移動/不可移動文物,然 Object 一詞常見中譯為「物件」, 容易聯想為僅限於可移動文物。由於本研究對於以「可否移動」作為文物劃分依據存在質疑, 故未採用大陸常見的movable/immovable cultural objects 的直譯譯名,而採用英文相關文獻中 較普及的用法。參考文獻
Bell, L. A. (1994). Gaining access to visual information: Theory, analysis and practice of determining subjects- a review of the literature with descriptive abstracts. Art Documentation, 13(2), 89-94. doi: 10.1086/ adx.13.2.27948634
Gilliland, A. J. (2016). Setting the Stage. In Baca, M. (Ed.), Introduction to Metadata (3rd ed.) (pp.1- 19). Los Angeles, LA: The Getty Research Institute.
Terminology Working Group. (2016). Terminology [Online Forum]. Retrieved from http://heritage-standards. org.uk/terminology/
The Canadian Heritage Information Network. (2016). Making Up the Rules: New Documentaion Standards for
Canadian Museums. Retrieved from http://canada.pch.gc.ca/eng/1443537823690#Toc352158203
王嵩山(2012)。博物館蒐藏學。臺北:原點出版社。
【Wang, Sung-Shan (2012). Beyond Museum Collection. Taipei: Uni-Books.】 李濟(2010)。古物。東南文化,2010(1),79-82。
【Li, Chi (2010). Kuwu. Southeast Culture, 2010(1), 79-82.】
宋新潮(2015)。關於智慧博物館體系建設的思考。中國博物館,2015(2),12-15、41。
【Sung, Hsin-Ch’ao (2015). Kuanyu chihhui powukuan ti’his chienshe te ssuk’ao. Chinese Museum, 2015(2), 12-15、41.】 吳美美(2016)。知識觀和知識組織的幾個觀察和思考。語意網視野下的知識組織與文化資產研討會。 中央研究院數位文化中心,2016 年 6 月 2 日。檢自:http://seminar2016-semanticweb.ascdc.tw/ download/%E7%9F%A5%E8%AD%98%E8%A7%80%E5%92%8C%E7%9F%A5%E8%AD%98%E7% B5%84%E7%B9%94%E7%9A%84%E5%B9%BE%E5%80%8B%E8%A7%80%E5%AF%9F%E5%92 %8C%E6%80%9D%E8%80%83-%E5%90%B3%E7%BE%8E%E7%BE%8E.pdf
【Wu, Mei-Mei (2016). Chihshihkuan ho chihshih tsuchih te chi ko kuanch’a ho ssuk’ao. Knowledge Organization and Cultural Heritage: Perspectives of Semantic Web. Academia Sinica Center for Digital Cultures, (June 2, 2016). Retrieved from http://seminar2016-semanticweb.ascdc.tw/download/%E7%9F% A5%E8%AD%98%E8%A7%80%E5%92%8C%E7%9F%A5%E8%AD%98%E7%B5%84%E7%B9%9 4%E7%9A%84%E5%B9%BE%E5%80%8B%E8%A7%80%E5%AF%9F%E5%92%8C%E6%80%9D% E8%80%83-%E5%90%B3%E7%BE%8E%E7%BE%8E.pdf】
祝敬國(1991)。博物館藏品分類標準化研究。中國博物館,1991(1),30-35、29。
【Chu, Ching-Kuo (1991). Powukuan ts'angp'in fenlei piaochunhua yenchiu. Chinese Museum, 1991(1), 30-35、 29.】
國家文物局第一次全國可移動文物普查工作辦公室(編譯)(2013)。法國文化遺產普查的原則、方 法和實施(163 頁)(原編著:法國文化部文化遺產司文化遺產普查處)。南京市:譯林出版社。 【Fakuo wenhuapu wenhua ich'anssu wenhua ich'an p'uch'a ch'u (2013). Fakuo wenhua ich'an p'uch'a te yuantse, fangfa ho shihshih (pp. 163). Kuochia wenwuchu ti i tz'u ch'uankuo k'o itung wenwu p'uch'a kungtso pankungshih Trans.Nanjing City: Yilin Press.】
陳淑君(2012)。敘詞表的中英詞彙語義對應之研究:以中國藝術領域為例(未出版之博士論文)。 國立臺灣大學圖書資訊學研究所,臺北。
Art (Unpublished doctor’s thesis). Graduate Institute of Library and Information Science, National Taiwan University, Taipei, Taiwan.】
張譽騰(譯)(2015)。博物館重要的事。(原作者:Weil, E. Stephen)。臺北市:五觀藝術。(原著 出版年:2002)
【Weil, E. Stephen (2015). Making Museums Matter. (Chang, Yu-T'eng Trans.). Taipei: Five Senses Arts Management. (Original work published: 2002).】
黃明玉(2016)。文物分類:從庫房管理到知識組織的轉變。中國博物館,2016(1),83-87。
【Huang, Ming-Yu (2016). Wenwu fenlei:ts'ung k'ufang kuanli tao chihshih tsuchih te chuanpien. Chinese Museum, 2016(1), 83-87.】 曾蕾(2016)。知識組織系統(KOS)的跨典範模式研發。語意網視野下的知識組織與文化資產研討 會。中央研究院數位文化中心,2016 年 6 月 2 日。檢自:http://seminar2016-semanticweb.ascdc.tw/ download/%E7%9F%A5%E8%AD%98%E7%B5%84%E7%B9%94%E7%B3%BB%E7%B5%B1(KOS )%E7%9A%84%E8%B7%A8%E5%85%B8%E7%AF%84%E6%A8%A1%E5%BC%8F%E7%A0%94 %E7%99%BC-%E6%9B%BE%E8%95%BE.pdf
【Zeng, Marcia Lei (2016). A paradigm shift in knowledge organization systems/structures/services (KOS) – Potentials and new functions of KOS in the Semantic Web environment. Knowledge Organization and Cultural Heritage: Perspectives of Semantic Web. Academia Sinica Center for Digital Cultures, (June 2, 2016). Retrieved from http://seminar2016-semanticweb.ascdc.tw/download/%E7%9F%A57%B9%94% E7%B3%BB%E7%B5%B1(KOS)%E7%9A%84%E8%B7%A8%E5%85%B8%E7%AF%84%E6%A8% A1%E5%BC%8F%E7%A0%94%E7%99%BC-%E6%9B%BE%E8%95%BE.pdf】
羅靜(2015)。智慧博物館的理論初探與實踐。故宮博物院博物館管理培訓班會議。北京故宮博物院。 【Lo, Ching (2015). Chihhui powukuan te lilun ch'ut'an yu shihchien. Kukung powuyuan powukuan kuanli
Methodology for the Faceted Thesaurus of
Chinese Cultural Heritage: An Initial Discussion
Ming Yu HuangAssociate Professor
Institute of Cultural Heritage and History of Science & Technology, University of Science & Technology Beijing, China
E-mail: [email protected]
Keywords: Art & Architecture Thesaurus (AAT); Controlled Vocabulary; Cultural Heritage; Cultural Objects Classification; Thesaurus; Museum; Knowledge Organization
【Abstract】
The paper is intended as a discussion of methodology for the Faceted Thesaurus of Chinese Cultural Heritage (FTCCH). Our concern is the issue on controlled vocabulary in the context of digitization work of Chinese museums and cultural heritage institutions. On the basis of the traditional classification methods and the Art & Architecture Thesaurus of the Getty Research Institute, the FTCCH will focus on the Chinese cultural objects concepts and terms. There are five facets in the FTCCH draft, including the materials, styles & periods, physical attributes, activities, and objects facets. The terms involved in those facets will serve as controlled vocabularies for the related elements of cultural objects descriptive metadata. After mapping analysis between Chinese cultural objects classification system and AAT, now the FTCCH has about 3,000 concepts from traditions and AAT. We also planned for concepts collecting and teamwork for the next stage. For the best practices, the FTCCH may have to add other facets and hierarchies and should be used with other thesauri or authorities in special fields. In the meantime, the FTCCH also needs to consider the ways of maintenance, application and international collaboration for its own beneficial development.
【Long Abstract】
Background
For a long time, the Chinese museum field still has not reached a consensus on the issue of cultural object classification. The reason is that the museums have their own various collections serious. Since a museum was established, it started to develop a classification method suitable for its organization DOI: 10.6245/JLIS.2017.431/715
purpose and sometimes would determine primary and secondary categories of a classification scheme according to the quantity of their collections. On the other hand, the collection tradition of epigraphy, calligraphy and paintings over the past dynasties also formed a customary classification method of cultural objects with strong impact which has been used till today. Therefore, there always exists a certain difficulty in promoting a nationwide cultural object classification standard in the museum field. First, this study defines cultural object classification as: arranging or categorization of cultural objects with the same or similar attributes. Secondly, this study used rules of classification (consistent principle, exhaustive principle, and exclusive principle) to inspect the traditional classification method for Chinese cultural objects that has been formed into museum practices and related regulations today. Mr. Li Chi cited the scope and types of antiquities announced by Central Commission for the Preservation of Antiquities in 1935 in his paper “Antiquities”, and enumerated the names and definitions of 12 types of antiquities, including ancient organisms & prehistoric relics, buildings, and movable cultural objects. He also paid attention to the contextual relationship between cultural object between cultural objects and their environment. Mr. Li’s perspectives still contribute a lot to the current cultural object classification method. However, after the founding of the New China, the said method was not passed down. The protection and management of cultural heritage were divided into museum collection and immovable cultural heritage. Two classification systems were gradually formed, which caused a difficulty in considering the contextual relationship of cultural objects which originally belong to the same site or place when cataloguing cultural object. The attributes of cultural object as criteria for the current customary classification method taken by museums and cultural heritage institutions commonly include material, function, technique, period, and occasionally include style, form, grade, association and social value. After considered the aim of knowledge organization and demand on data value standard for cultural object’ metadata schema, the research team proposed to build a faceted thesaurus to collect the related concepts/terms. The facets contain the above attributes that has been used for the customary classification method.
Methodology
The methodology framework of the Faceted Thesaurus of Chinese Cultural Heritage (FTCCH) is composed of three parts: 1. structure and editing rules from AAT plus selected concepts/terms and mapping methods from AAT-Taiwan; 2. the national standards on thesauri in China, mainly are <Information and documentation: Thesauri and Interoperability with other vocabularies—Part 1: Thesauri for Information Retrieval> (GB/T 13190.1‐2015) and <Guidelines for determining the subjects and selecting the descriptors> (GB/T 3860‐2009); 3. contents from Chinese cultural heritage fields,
including the concepts/terms, images and practical applications in the Smart Museum Program and other digital museum projects. Taiwan and Mainland China share the cultural origin, and most of the cultural object concepts are basically the same. AAT-Taiwan (http://aat.teldap.tw) is actually an important foundation and assistance to the development of the FTCCH. The developing procedure for the draft framework of FTCCH is shown in Figure 1:
Figure 1 Procedure for Developing the Draft FTCCH
Results
This study completed concepts analysis of the terms from current classification scheme method and selected applicable concepts/terms from AAT as the joint foundation for development of FTCCH. It also intended the sources of candidate concepts/terms. The draft framework of FTCCH includes the five facets: objects facet, materials facet, activities facet, physical attributes facet, style & periods facet, and 23 hierarchies from these facets. The names of the facets and hierarchies are shown in Table 3.
Table 3 Draft Framework of FTCCH
Facet Hierarchy
Objects Facet Built Environment Settlements and Landscapes Built Complexes and Districts Single Built Works
Open Spaces and Site Elements Components
Furnishings and Equipment
Furnishings Costume
Tools and Equipment Weapons and Ammunition Measuring Devices Containers Sound Devices Recreational Artifacts Transportation Vehicles Object Genres
Object Groupings and Systems Visual and Verbal Communication Visual Works
Exchange Media Information Forms Materials Facet Materials
Activities Facet Processes and Techniques Styles and Periods Facet Styles and Periods Physical Attributes Facet Design Elements
The draft thesaurus could support the data value of five elements among the 20 core elements of metadata schema proposed by the Metadata Standard Research Project as controlled vocabularies. The five elements are work type, date, material, technique and subject. After mapping analysis with AAT and selected approximately 3,000 concepts from AAT-Taiwan to form the draft FTCCH, the research team is going to cooperate with Shanxi Museum, Shanghai Museum and Xinjiang Uygur Autonomous Region Bureau of Cultural Heritage to examine and verify the applicability of FTCCH by comparing to the museums’ collections data. From the results of mapping analysis, the author found that there’re approximately a half of the concepts from current classification schemes exactly and inexactly equivalent (EQ) to AAT’s concepts. And the result of approximately 30% of narrower mapping (NM) indicates that there are more specific concepts in Chinese’ cultural object classification scheme, including the bound-terms as customary usage. There is about 5% of broader mapping (BM) and 11.3% of related mapping (RM).
Future Research and Applications
the existing hierarchies, this study also intends to develop the complete framework of FTCCH with all the facets and hierarchies as AAT in the future. Establishing such a thesaurus requires much input of manpower, time and other resources. Therefore, the long‐term objectives of FTCCH are to form a national-level program for its development, set up a formal work group for its long-term maintenance, build the bilingual mechanism of Chinese and English, formulate open data policies and provide open link services. The improvement and application of FTCCH should meet with users’ needs, and also need the mechanism on international collaborations for its sound development.