蔣復璁口述歷史中戰亂時期文獻保存知識本體架構研究
135
0
0
全文
(2)
(3) 謝 感謝看顧我的. 誌. 神,賜給我讀研究所的機會,從未想過會有段四年的研究. 生生涯,因著夢想-讓好知識散在各地,踏上研究生之路。感謝 神藉由研究生 生活削掉我性格的矛盾,砥礪蘆葦般的精神,也如鋤頭,引導我挖掘自我價值。 這段日子,之所以能有所得,很感謝指導老師-吳美美教授。美美老師在 研究面、態度面、做事面總是給予扎心卻很受用的指導,雖然受教的當下直想 摀住耳朵,面對自己的錯誤是令人挫折的,但仍感謝美美老師細膩且精闢的指 教,因為瞭解錯誤才能改變。也很感謝美美老師大力地協助自己研究自己想學 習的技術,若不是遇見這一位好老師,現在的自己仍在吃畫中的餅。 很感謝鄭約書亞牧師,他的證道總能把陷入負面想法泥淖的自己拉出來。 其實研究所的路,我走得很艱辛,各種不適應使腦中常迴盪負面想法:「我不 適合做研究。」、「我走錯路了…」然而牧師的話每每幫助我打贏想法的仗, 讓我重邁步伐,很感謝給予我正能量的牧師。 很感謝克武老師口試時的建議,使我領會歷史學的內涵;很感謝淑君老師 耐心地教導,讓我對知識組織系統有更通透的理解;感謝苑菁助教為所上每位 同學細心地處理教務;感謝千千、善茵、羽涵在論文行政上的協助。感謝親愛 的外婆、爸爸、媽媽、大姊、二哥長時間地關心我、支持我完成學業,有親愛 的家人是我最大的祝福。 最後記下一輩子要記得的研究所時期的體會,也是鄭牧師的證道內容:「不 論是內心、想法、身體或是體質,都要經過鍛鍊和磨練後做到底。若到達盡頭, 就會得到『期望與期盼的事物』。」 詹珮欣. 謹誌於臺師大圖資所 中華民國 106 年 8 月.
(4)
(5) 摘. 要. 口述歷史於二十世紀中葉興起以來,資料量愈加豐富;各領域嘗試再利用 口述歷史資料,如博物館界運用口述歷史資料策展,又如學術界以鏈結資料技 術研究口述歷史資料,然卻不易再利用,乃因口述歷史資料缺乏合適的知識組 織系統加以組織。遂此,為促進口述歷史資料的運用,具有智能編排效能的知 識組織系統有其發展的必要性,而知識本體即具有此效能。於此情境下,本研 究選擇口述歷史個案中蔣復璁口述歷史為探討案例。蔣復璁先生(1898-1990) 是民初重要的教育家及政治家,曾擔任中央圖書館首位館長及遷臺後首位故宮 博物院院長,且於抗戰時期負責中央圖書館籌備處、潛赴上海淪陷區聯繫蒐購 善本古籍事宜、兩度主持中央圖書館籌備處遷移等文獻保存事蹟,在其經歷中 格外顯目,因此探討蔣復璁口述歷史中戰亂時期文獻保存知識本體成為研究焦 點,再進一步討論研究結果合用於口述歷史領域的架構。本研究採用文本分析 法,參考 Biography Light Ontology,共發展出八組模型:人物描述、事件描述、 人物思維、人際、群體勢力、訊息傳遞、圖書遷移以及經費等模型,初步認為 前四組模型可用於表徵口述歷史,後四組則能呈現戰亂時期文獻保存領域知識 的特色。. 關鍵詞:口述歷史、知識本體、蔣復璁、文獻保存、戰時. i.
(6) Abstract Since the second-half of the 20 century, the volume of oral history texts has highly grown up, and people in various domains have attempted to reuse this kind of texts. However, it’s not easy to do so. The reason is that there isn’t a suitable knowledge organization system for the oral history texts. In aim to enhance the reuse of oral history texts, ontological system as a kind of intelligent knowledge organization is required. The Memoirs of Chiang Fu-ts’ung is selected as a case study to explore the possibility of such an ontological system.. Mr. Chiang. Fu-ts’ung (1898-1990) had launched National Central Library during wartime and been appointed the first Librarian of National Central Library. He was then appointed Curator of the National Palace Museum in Taipei. His oral history is valuable in offering unique memories and experiences. That is, Chiang Fu-ts'ung’s efforts and contributions in protecting documents during wartime have been the most treasurable one. As such, this study chooses to explore the ontologies of documents protection based on Chiang Fu-ts'ung's oral history. By applying text analysis approach and adopting Biography Light Ontology (BLO) as a reference schema, this study developed eight modeling, the ontological models, including biography model, event model, thinking model, relationship model, power group model, message delivering model, documents transporting model, and funds model. The possible implications of the research include that the first four models could be used for general oral history ontologies and the second four models could be best representing the ontologies of document protection during wartime. Keywords: oral history, ontology, Chiang Fu-ts’ung, document protection, wartime ii.
(7) 目. 次. 摘要................................................................................................................................. i Abstract ..........................................................................................................................ii 目次...............................................................................................................................iii 表次................................................................................................................................ v 圖次..............................................................................................................................vii 第一章. 緒論............................................................................................................ 1. 第一節 研究背景與動機.......................................................................................... 1 第二節. 研究目的與問題........................................................................................ 3. 第三節. 研究範圍與限制........................................................................................ 4. 第二章. 文獻探討.................................................................................................... 6. 第一節 有關口述歷史.............................................................................................. 6 第二節 有關知識組織與知識本體.......................................................................... 9 第三節 傳記領域知識本體發展現況.................................................................... 11 第四節 戰爭領域知識本體發展現況.................................................................... 27 第五節 小結............................................................................................................ 31 第三章. 研究方法與實施...................................................................................... 37. 第一節 研究設計.................................................................................................... 37 第二節 研究對象.................................................................................................... 37 第三節 研究流程與實施........................................................................................ 38. iii.
(8) 第四節 資料蒐集及分析過程................................................................................ 40 第四章. 研究結果與討論...................................................................................... 48. 第一節 研究結果.................................................................................................... 48 第二節 研究討論.................................................................................................. 108 第五章. 研究結論與建議.................................................................................... 110. 第一節 研究結論.................................................................................................. 110 第二節 未來研究建議.......................................................................................... 114 參考文獻.................................................................................................................... 117. iv.
(9) 表. 次. 表 1 FOAF 穩定狀態中介者相關類別列表 .............................................................. 12 表 2 FOAF 穩定狀態中介者相關屬性列表 .............................................................. 12 表 3 BIO 詞彙歸納表 ................................................................................................. 14 表 4 RELATIONSHIP 詞彙歸納表 ................................................................................. 16 表 5 「托爾斯泰數位化」計畫知識本體列表 ........................................................ 21 表 6 ACTOR 知識本體人物屬性列表 ......................................................................... 22 表 7 CDBD 知識架構表 ............................................................................................. 25 表 8 輔助資料書目列表 ............................................................................................ 40 表 9 BLO 詞彙類別詞語列表 .................................................................................... 42 表 10 BLO 詞彙屬性詞語列表 .................................................................................. 43 表 11 其他詞彙輔助類別詞語 .................................................................................. 43 表 12 其他詞彙輔助屬性詞語 .................................................................................. 44 表 13 人物描述模型之類別階層 .............................................................................. 52 表 14 人物描述模型之新增屬性 .............................................................................. 54 表 15 事件新增屬性 .................................................................................................. 54 表 16 人物描述模型實例 .......................................................................................... 54 表 17 事件描述模型實例 .......................................................................................... 58 表 18 人物思維模型實例 .......................................................................................... 62 表 19 人際模型實例 .................................................................................................. 64 表 20 群體勢力模型實例 .......................................................................................... 67 表 21 訊息傳遞模型實例 .......................................................................................... 70 表 22 圖書遷移模型實例 .......................................................................................... 74 表 23 經費模型實例 .................................................................................................. 76 v.
(10) 表 24 參考架構列表 .................................................................................................. 79 表 25 詞語階層 ......................................................................................................... 79 表 26 類別與屬性清單 ............................................................................................. 81. vi.
(11) 圖. 次. 圖 1 知識本體範疇光譜圖 ......................................................................................... 10 圖 2 BLO 詞彙類別階層 ............................................................................................ 19 圖 3 BLO 詞彙事件屬性示意圖 ................................................................................ 20 圖 4 研究架構圖 ........................................................................................................ 39 圖 5 事件年代表截圖 ................................................................................................ 42 圖 6 以 WORD 列表彙整截圖 .................................................................................... 46 圖 7 標記分析代號與概念截圖 ................................................................................ 47 圖 8 實例排序截圖 .................................................................................................... 47 圖 9 人物描述模型示意圖 ........................................................................................ 52 圖 10 事件描述模型示意圖 ...................................................................................... 58 圖 11 人物思維模型示意圖 ...................................................................................... 61 圖 12 人際模型示意圖 .............................................................................................. 64 圖 13 群體勢力模型示意圖 ...................................................................................... 67 圖 14 訊息傳遞模型示意圖 ...................................................................................... 70 圖 15 圖書遷移模型示意圖 ...................................................................................... 75 圖 16 經費模型示意圖 .............................................................................................. 76 圖 17 戰時文獻保存知識本體模型示意圖 .............................................................. 77 圖 18 戰時文獻保存示意圖(PROTEGE 繪製) ............................................................. 78 圖 19 標記實例示意圖 ............................................................................................ 114. vii.
(12) viii.
(13) 第一章 緒論 《保護非物質文化遺產公約》於 2006 年由聯合國教科文組織公布,宣告非物質文 化遺產為新型的文化遺產類型,舉凡社區、群體或個人的各種社會實踐、觀念表述、 知識、技能及相關工具、實物、手工藝品與文化場所,應受到重視與保護,而非物質 文化遺產所蘊藏的歷史能藉由口述歷史揭示(楊愉珍、陳佳利,2015,頁 85;陳昭珍, 2012)。口述歷史作為重要保存文化遺產機制及史料來源,其藏量於各典藏機構逐年 增加,正需一套整理口述歷史資料的知識架構,然口述歷史的知識架構應具備哪些類 別與屬性?乃本研究觀切焦點。本章將依序談述研究背景與動機、研究目的與研究問 題、研究範圍與限制為本研究揭開序幕。. 第一節 研究背景與動機 口述歷史的定義,許雪姬(2014)扼要地陳述:「口述歷史(Oral History)這個中 文詞彙創發於 1948 年。藉助主訪者的提問得到受訪者回答。形成文本的過程叫口述訪 談,其結果就是口述歷史。」(頁 3)口述歷史因著能補充書寫資料的缺漏之功用, 被各種未被書面文獻紀錄的歷史子領域所應用,從 2014 年臺灣口述歷史學會出版集臺 灣口述歷史理論與實務大成的專書《臺灣口述歷史的理論實務與案例》可見一斑,其 中列舉案例涉及婦女史、原住民史、產業史、地方史、校史、體育史、音樂史、醫療 史、災害史等(許雪姬編,2014)。 現代口述歷史以全球各地發展歷程而言,是近代產物,哥倫比亞大學於 1948 年正 式成立口述歷史研究室,由此作為現代口述歷史的起點(楊祥銀,2004,頁 1-2)。 口述歷史逐漸於各領域所應用,無論是博物館界運用口述歷史資料以實體或線上策展, 如加泰羅尼亞博物館移民歷史入口網站(Carreras & Ferran, 2004)、科羅拉多州高原之聲 網站(Voices of the Colorando Plateau, 2002),或是為歷史重要事件做見證,如南加州大 學大屠殺基金會網站(USC Shoah Foundation, 2017),亦有為保存地方文化,如美國「猶 1.
(14) 大州遺產」計畫 (Fruits of Their Labors, 2017),近年來鏈結開放資料技術發展,學術 界使用該技術於口述歷史資料以進行研究,如 “Linked Jazz”計畫 (Pattuelli, Weller & Szablya, 2011)。 然可於各領域應用的口述歷史資料卻有著資料再利用的障礙。顏佩貞(2012)訪 問各典藏口述歷史相關資料之機構,發現典藏口述歷史資料的機構大部分僅為口述歷 史資料進行簡易建檔,多不對外查詢,其中部分機構建置對外檢索系統,但亦非專為 口述歷史資料建立的系統。顏佩貞進一步對口述歷史相關資料典藏狀況建議數點,其 中一項為「建立口述歷史館藏的智能編排」。因口述歷史資料類型多元,常以資料載 體類型分別蒐藏,若建立資料的智能編排,則能達到以某一個實例為中心連結相關不 同類型資料的整合效能,如以同一位受訪者為中心,連結該受訪者的錄音帶、訪問記 錄、日記等不同類型的資料;另一項建議則是建置全國性口述歷史資料庫,以供外界 查詢,進而推廣口述歷史成果的運用(頁 98-99、104)。國內將既有口述歷史資料再 利用的方式並不多,目前以學術、出版、展覽、網站呈現為主,相較於國外應用口述 歷史之用途則顯得狹窄,如 Ken Howard (2003)曾列舉九大項應用口述歷史之途徑。口 述歷史資料不易再利用之因,除資料開放授權問題,研究者以為口述歷史資料未有一 套具有智能編排效果的知識組織系統加以編目,亦是再利用受阻原因之一,而知識本 體是知識組織系統中能達到智能編排效果的架構,為此,本研究認為口述歷史資料正 需專門的知識本體架構加以組織,以促進其再利用。 近年來,口述歷史於各領域皆有產出,本研究考量時間與人力條件,於眾多口述 歷史文本中選擇單一案例探討,其中擇定蔣復璁先生口述歷史,乃因蔣先生佔有特殊 歷史位置。蔣先生生於清末民初的動盪時代,歷經君主專制政權的革命推翻、軍閥割 據、一次與二次世界大戰的爆發,且與歷史事件參與者多有交往,如蔣中正、朱家驊、 胡適、傅斯年,此外擔負中央圖書館(以下簡稱央圖)籌備任務。瞭解蔣先生的作為, 亦能間接認識近代名人作為、政治史、文化史、圖書館史發展,簡言之,蔣先生的經. 2.
(15) 歷具有歷史與研究價值,而於蔣先生一生中,戰亂期間文獻保存工作是格外顯目的經 歷。 在動盪的戰亂時代,文獻保存工作顯得至關重要。中國歷經數個朝代,每逢朝代 更迭,必有戰爭興起,而文獻常因戰火付之一炬。肖東發、楊虎(2015)曾整理出 20 次圖書大規模遭毀壞的書厄,其中屬於兵燹而致的書厄,如晚清近代外國勢力入侵引 發的戰事,鴉片戰爭、英法聯軍、八國聯軍、上海事變等被列於其中(頁 301-309)。 歷代戰亂中,不少文獻保存者付出相當努力,如宋代詞人李清照與丈夫在戰亂逃亡之 際,仍攜帶金石、古籍十五車南遷;又如金代文學家元好問為免文獻遭南下的蒙古人 毀損,將幾千冊善本藏於夾牆;而清朝太平天國攻打杭州,藏於杭州文瀾閣的《四庫 全書》四散,丁丙、丁申兄弟冒險收拾(焦樹安,1994,頁 93、95、120)。蔣復璁 先生是近現代重要的文獻保存者之一。抗戰時期,為免圖書遭日軍襲擊毀損,蔣先生 二度主持央圖籌備處遷移,此外,曾冒險潛赴上海淪陷區聯繫當地有志之士蒐購善本 古籍事宜;光復後,國共內戰情勢趨於急迫,再度主持央圖遷台。為此,本研究認為 蔣先生的經歷格外能貢獻予戰亂時期文獻保存領域知識。總上述言之,本研究研究動 機始於口述歷史資料再利用障礙正需一知識組織系統協助解決,研究者以為知識本體 架構能作為解決方案之一。此外,因考量研究時間與人力條件,本研究於眾多口述歷 史案例中擇定單一個案予以探究,是以蔣復璁先生口述歷史為研究對象,乃因蔣先生 具歷史價值的經歷,而蔣先生生平事件中,戰亂時期文獻保存工作的作為格外突出, 遂此,本研究將探討蔣先生口述歷史中戰亂時期文獻保存知識本體架構。. 第二節. 研究目的與問題. 本研究動機始於口述歷史資料正需一知識組織系統協助組織,並在口述歷史文本中 選擇蔣復璁先生口述歷史為案例。蔣先生生於清末民初,壯年時期常處於動盪的戰亂時 期,在三十五歲時承接中央圖書館籌備要職,開啟蔣先生戰亂期間文獻保存事業,爾後 三度主持央圖搬遷,以避戰火,冒險潛赴上海淪陷區搶救善本古籍,為此,研究者以為 3.
(16) 蔣先生的經歷中,文獻保存工作是重要事蹟,因此探討蔣復璁先生口述歷史中戰亂期間 文獻保存知識結構成為本研究研究目的,為此訂定兩大研究問題: (一)蔣復璁口述歷史中戰亂時期文獻保存知識本體類別為何? (二)蔣復璁口述歷史中戰亂時期文獻保存知識本體屬性為何?. 第三節. 研究範圍與限制. 本研究旨於分析蔣復璁先生口述歷史中戰亂時期文獻保存知識架構,主要資料來 源為蔣先生口述歷史出版品《蔣復璁口述回憶錄》。由上述研究目的與設計,研究者 認為有以下研究限制: (一) 戰亂時期文獻保存知識架構因著保存者身分以及所處時空會有所不同。蔣先 生承接國家委任籌備中央圖書館使命,乃政府立場的文獻保存者,而中國歷 代常擔任文獻保存者角色之人物如私人藏書家,為民間立場,此類型文獻保 存者亦有獨特的領域知識;此外,蔣先生活躍於東亞地區,本研究不論及其 他國家的文獻保存者,故研究結果有其推論限制。 (二) 本研究資料來源主以蔣先生口述歷史出版品《蔣復璁口述回憶錄》(蔣復璁 等口述、黃克武編,2000),該書為國內唯一一本蔣先生口述歷史出版品, 符合研究目的之所需。然,能探討文獻保存者蔣先生的資料類型不計其數, 諸如蔣先生傳記、蔣先生談論文獻保存工作的著作、他人談論蔣先生的文獻 保存作為之著作等,故研究結果未能窮盡蔣先生的文獻保存領域知識。 (三) 口述歷史若以體裁區分,可分為兩個面向,兩面向下又有數種類型:(1)訪 談方式:訪談單一受訪者、座談會形式訪談多位受訪者;(2)訪談體裁:個 人生平式、歷史事件參與者與見證人、專題式。個人生平式為訪談重要人物, 受訪者一生的事蹟皆須細密地掌握;歷史事件式乃為求得事件全貌而訪談不 同社會階層的事件參與者;專題式側重訪談受訪者經歷與主題相關部分,其 4.
(17) 餘從略(許雪姬,2014,頁 13)。本研究是以蔣先生口述歷史正式出版品為 主要資料來源,蔣先生口述歷史屬個人生平式口述歷史,若進一步討論研究 結果於口述歷史知識本體架構的適用性,僅能推論至個人生平式體裁。. 5.
(18) 第二章 文獻探討 本研究始於關心口述歷史知識本體架構之建立,乃至探討蔣復璁先生口述歷史中 戰亂時期文獻保存知識本體架構,故本章第一節、第二節介紹口述歷史與知識本體等 概念。此外,蔣先生口述歷史出版品體裁為個人生平式,即內容性質屬傳記類型,因 此亦於本章探討傳記相關架構,作為研究參考架構。再者,研究者以為戰爭是戰亂時 期文獻保存領域知識的重要概念,為此蒐集戰爭相關知識本體架構案例。. 第一節. 有關口述歷史. “Oral History”此一英文詞彙正式產生於二十世紀中葉,由美國哥倫比亞大學 歷史學家阿蘭.內文斯(Allan Nevins)所提出,哥倫比亞大學於 1948 年正式成立口述歷 史研究室,由此作為現代口述歷史發展起點(楊祥銀,2004,頁 1-2)。口述歷史始 於訪談者訪問受訪者,後產出訪談紀錄,即所謂的抄本,進而訪談者或研究人員對訪 談過程、錄影音檔案轉譯成抄本過程、抄本內容等加以研究與詮釋,整體而言,現代 口述歷史包含上述一系列過程(Abrams,L., 2010, p.3)。現代口述歷史的興起乃歷史學演 進及科學技術提升而致。二十世紀初期,主張具有「同時代性」的檔案資料為最可靠 歷史證據的蘭克學派,受到科學進步及新史學的挑戰。二十世紀後,知識量急劇增加, 研究人員短時間無法窮盡所有知識,故研究對象漸趨專門化,學科出現分化現象,此 一趨勢下,歷史學領域出現各種大小支派,大支派如政治史、軍事史,小支派如家庭 史、兒童史。歷史學開始出現嶄新的歷史觀點-新史學,認為「各種」人類活動都應 包含在「歷史」中(楊祥銀,2004,頁 14-18)。一般書面檔案僅記錄名人事蹟,無 法提供新興領域的史實,口述歷史能藉由口述訪談採集文獻未記載的人事物,彌補檔 案史料的缺漏,口述歷史由此應運興起。 口述歷史緣起隱約吐露口述歷史特性。楊祥銀(2004,頁 22-36)認為口述歷史 主要有四種特性:人民性、合作性、動態性及跨學科性。人民性是指在研究對象上從 6.
(19) 傳統史學所關注的菁英轉移到一般人民,此外在歷史撰述上也突破歷史學家為人民寫 歷史的傳統,而由史家與人民一同共寫歷史;合作性則表現在訪談過程,即受訪者和 訪談者之間的相互作用。口述歷史是由受訪者提供資訊,而為避免資訊淪為漫無目的 的敘述,訪談者以提問來引導或以相關文物刺激受訪者回想,如此的訪談過程使得口 述歷史成為訪談者與受訪者合作下的產品;動態性的產生源於口述訪談時間點與歷史 事件發生時間點脫離。口述訪談法憑藉受訪者記憶,在事件發生當下及至受訪時間點, 受訪者記憶在此過程中已歷經各種狀況,因而有事後解釋成分,事後解釋的內容會與 歷史事實有所差距;最後一項跨學科性,口述歷史的執行與詮釋須借用各領域的方法 與理論。 除上述口述歷史特性,Abrams(2010)亦提出六項口述歷史特色:口頭表達(orality)、 敘述性(narrative)、展示性(performance)、主觀性(subjectivity)、記憶性(memory)與易變 性(mutability)。因口述歷史文本由口述訪談而生,表達形式為口語用詞,而具有口頭 表達特性;以此為基礎,從口頭表達中,可觀察受訪者敘述所經歷之人事物的敘述型 態,如用字遣詞的方式、敘述的文法結構,是謂敘述性。展示性乃指受訪者口述時的 舉手投足、臉部表情等展現。關於主觀性,乃源於口述歷史學者對受訪者主體立場的 關心,即口述史家不僅訪談發生於受訪者身上的事件經過,亦會訪問其感受。記憶性 與易變性是一體兩面,口述歷史本質為記憶,記憶有一些特性,如即使本人未親身經 歷,仍會受環境影響而形塑成自己的記憶,此為借用現象,又如事發當時的感受以及 事後感受有所不同,因此記憶是易變動的,此相似楊祥銀所言的動態性。 楊祥銀所提的四種特性多屬口述歷史後設的哲學觀,即口述歷史在史學上帶動的 轉變;而 Abrams 認為的六項特色中,口頭表達、敘述性和展示性屬物理性、顯於外 的特性,主觀性、記憶性及易變性則是人類認知特性。上述特性的提出,乃視口述歷 史為始於訪談乃至產出書面紀錄的整體過程,並為尋求能詮釋口述歷史的相關領域理 論基礎。然本研究視口述歷史為最終產物,即書面紀錄,聚焦於口述歷史呈現的內容 7.
(20) 元素,不涉及口述史家詮釋角度。以口述歷史內容角度視之,本研究以為事件性及人 物資訊性是其中的特性,研究者所謂的事件性乃指事件為構成口述歷史內容的主要元 素,亦是本研究知識架構側重表現之特性。從口述歷史緣起背景,可認識到口述歷史 是由各種事件交織而成。此外,口述歷史體裁可分為個人生平式、專題式訪談以及訪 問某重大歷史事件的參與者與見證人之經驗。個人生平式訪談,訪談者會鉅細靡遺地 記錄受訪者從開始有記憶的幼時及至訪談時間點所發生的事件;專題式訪談則是集中 訪問受訪者與該主題相關內容,受訪者本身生命史則略為著墨,重大事件的見證者亦 是同樣方式,訪談重點為該事件相關經歷(許雪姬,2014,頁 13),由此可知,口述 歷史內容主要成分為事件。 而人物資訊性指人物相關的各種特徵訊息。口述歷史因受訪者細膩且生動的記憶, 被形容為歷史的血與肉(楊麗祝、鄭麗玲,2014,頁 277),乃凸顯出其生動性。在 鮮明的敘述中,人物的各種訊息亦被揭露,人物相關訊息在口述歷史的陳述中是難以 或缺的。且口述歷史因為受訪者的經歷之紀錄,受訪者生活於社會中,社會是人群所 形成的區域,因此「人」與「人」互動下的內容是口述歷史常見的訊息。研究爵士樂 家社會網絡的“Linked Jazz”研究計畫正是基於口述歷史經常能呈現出高密度的「人 際互動」之考量,而選擇口述歷史作為資料來源(Pattuelli, Weller & Szablya, 2011, p.160)。 此外,口述歷史較其他史料不同之處為口述歷史乃由活著的歷史人物親自敘述歷史故 事,因此不僅描繪事件發生的經過,亦會表達事件發生原因,原因常為人物想法居中 運籌帷幄──因著人物某些思考而如此行動,因而事件發生。在一般書面史料中,除 日記類型檔案外,較難掌握人物意念,然人物的意念在歷史事件中扮演板機般的角色, 人物想法能從口述過程中被表達,得以補足史料未及之處。另一方面,口述史家除考 究歷史事件的真實性,亦觀察人對於事件的理解與認知(劉靜貞,2014,頁 235), 「理解」與「認知」皆能從人物思維體現。因此人物的想法是口述歷史元素之一。. 8.
(21) 第二節 有關知識組織與知識本體 知識組織一詞最早於 1929 年出現在英國分類學家 H. E. Bliss 的專著中,而知識組 織的定義已於早期被多位國內外學者相繼討論,如 A. Sigel 解釋道:「知識組織是將 含有知識的集合物加入資訊價值的一種跨學科領域的文化活動。」,以及 J.D. Anderson 所認為的定義:「知識組織是有關文獻的描述、內涵、特色、目的及將前述這些活動 予以組織,以利於使用者的尋找。知識組織包含了索引、摘要、編目、 分類、記錄管 理、書目,以及相關文獻資訊的產生或檢索用的書目資料庫。」(引自鄭惠珍,2004, 頁 70);又如國內學者陳亞寧、陳淑君表示:「不難發現這些觀點認為知識必須具體 化身為文獻或文本後,再經由特定方式將文獻內涵的知識層面予以抽離、標引,進而 建立一套系統化作業模式與原則理論,藉以有效整理現有的文獻。」;阮明淑、溫達 茂認為:「知識組織是將無序或分散的特定知識,根據一定的原則與方法,使之有序、 集中、定址,以方便知識的提供、利用和傳播。」(陳亞寧、陳淑君,2001,頁 38; 阮明淑、溫達茂,2002,頁 6)從上述各式定義可發現「知識組織」是一門知識整序 的學問,藉由對知識單元的有序化程序,達到知識的再利用。因此,為解決口述歷史 資料不易再利用之議題,知識組織是方法之一。 關於知識組織方法,蔣永福、李景正(2001)認為有七種:知識表示、知識重組、 知識儲存與檢索、知識編輯、知識佈局與知識監控等,其實踐的成果即為知識組織系 統(Knowledge Organization System, KOS),亦稱為知識組織工具。知識組織系統一詞被 用來統稱各種對人類知識結構進行表達及系統化闡述的語意工具,旨在將某一領域的 基礎語意結構加以模式化以利檢索(陳和琴,2011,頁 66)。Hodge (2000, p.5)表示 知識組織系統依照結構化程度可被分類成三大類型,第一類型為詞彙清單(term lists), 通常具備明確定義,包含關鍵字清單(pick list)、權威檔(authority files)、術語典/詞彙 表(glossaries)、字辭典(dictionary)、地名詞典(gazetteers)及同義詞環(synonym rings); 第二類型為分類與類目(classifications and categories),旨於訂定主題集合,舉凡主題標 9.
(22) 目表(subject headings)、分類表(classification schemes)、主題類目(subject categories)和 知識分類表(taxonomies );第三類型為概念關係詞表(relationship list),著重於詞語及概 念間的關係聯結,索引典(thesaurus)、語意網絡(semantic networks)、知識本體(ontology) 皆屬之。上述工具中,知識本體是近十餘年新加入知識組織系統行列的成員(p.7)。陳 昭珍、陳立原及鍾季倫(2006)認為各種知識組織系統是表現知識本體的不同形式, 在不同程度上表達知識本體特點(頁 81-82),因此圖書資訊學的知識本體探討能以 知識組織系統觀點認識之;此外,McGuinness 認為知識本體最簡單的型態為控制詞彙, 即第一類型知識組織系統,乃至正規化知識本體等範疇(McGuinness, 2003 as cited in Legg, 2007, p.428),並提出知識本體範疇光譜圖(圖 1)。. 圖 1 知識本體範疇光譜圖 資料來源:McGuinness, D. (2003). Ontologies come of age. In D. Fensel, J. Hendler, H. Lieberman,. & W.. Wahlster (Eds.), Spinning the Semantic Web: Bringing the World Wide Web to its full potential (pp. 171-194). Cambridge, MA. MIT Press. as cited in Legg, C. (2007). Ontologies on the semantic Web. Annual review of information science and technology, 41(1), 407-451.. 知識本體架構若以電腦科學領域的方式呈現,Noy 與 McGuinness (2001)說明有三 項基本元素:類別(class)、屬性(property)、實例(instance),此外領域(domain)及範圍(range) 是為限制屬性而有的概念。電腦科學領域認為只要是存在物,皆可被表徵。當領域知 識以宣告式形式(declarative formalism)被表示時,被表示的物件集即被稱為論域(the universe of discourse),物件以及物件間關係以詞語(terms)表達,詞語的整體稱為詞彙 (vocabularies)。為將詞語應用於系統中,需借助公理(axioms)、函式(function)及邏輯理 10.
(23) 論(logical theory)加以定義與限制詞語的解釋及使用,此可促使系統可識讀與推理運作 (Gruber , n.d., section 2, para.2)。因此,在領域知識被表示成物件集中,類別表徵領域 知識的概念,Noy 和 McGuinness 在文中以「酒」領域知識為例,紅酒、白酒皆是「酒」 領域知識中的概念,換言之,紅酒、白酒各是類別;類別可再分出子類別(subclass), 即概念下的子概念,兩者間具有 is-a 關係,如博若萊葡萄酒是紅酒的一種(is-a),則博 若萊葡萄酒是「紅酒」類別下的一子類別;每一類別下涵蓋的最特定物件,即是實例 (instance),如酒杯裡的博若萊葡萄酒是一個實例。為描述類別的特質或類別之間的關 係,則以屬性(property)定義,如酒的產地、酒的濃度、糖分,每種酒的屬性的值(value) 各有不同,如博若萊葡萄酒產於法國,威士忌酒產於蘇格蘭,「法國」與「蘇格蘭」 是「酒產地」該屬性的值(value)。為使電腦程式能推理,需在屬性上做領域(domain) 和範圍(range)的限制,以表其中的邏輯。領域是屬性所能描述的類別,或可謂屬性所 定義、依附的類別,如「糖分」此屬性可用於描述各種類別的酒,因此「酒」類別屬 於屬性「糖分」的領域,但糖分不為酒廠的特質,故「酒廠」類別不在屬性「糖分」 的領域(domain)中;而範圍(range)則是能被允許填入屬性作為值的類別,如「酒廠」 此類別有屬性「生產」,酒廠生產的是酒,因此「酒」類別為屬性「生產」的範圍。. 第三節. 傳記領域知識本體發展現況. 生平式口述歷史的內容性質與傳記相近。本節將探討描述人物資訊、傳記相關知 識本體架構,舉凡 Friend of a Friend、BIO Vocabulary、Relationship Vocabulary、 Biography Light Ontology 等,以及系統個案所發展之知識架構,如「中國歷代人物傳 記資料庫」(China Biographical Database, CBDB)、 「托爾斯泰數位化」計畫(Tolstoy Digital project)及芬蘭二戰鏈結開放資料計畫“WarSampo”。. Friend of a Friend (FOAF) Friend of a Friend (FOAF)詞彙乃產生於 2000 年的 “Friend of a Friend”計畫(簡稱 “FOAF”計畫)。此計畫目的是為連結人與網路上所使用的資訊,並使用語意網(Semantic 11.
(24) Web)技術,形成鏈結資料(Linked Data)系統,得以整合從各種來源而來的資料,其方 式為用 FOAF 詞彙標記個人網站的資訊,發布 FOAF 文件(FOAF document)。承計畫 目的,FOAF 詞彙主要表徵人物的網路環境中基本資訊及人際互動。由於 FOAF 詞彙 連結線上人們形成線上社群,帶動了「認識的網路」(web of acquaintances),進而成為 線上社群應用如推薦系統的信賴基礎(Ding, Zhou, Finin & Joshi, 2005, p. 2)。 FOAF 詞彙分為三大類:核心(core)、社會網路(social web)、鏈結資料應用(Linked Data utilities),共有 13 個類別以及 62 個屬性,類別與屬性的狀態皆分為四類型:穩定 (stable)、不穩定(unstable)、測試(testing)、過時不用(archaic)。其中,與中介者相關且 屬穩定狀態的類別和屬性分別有 4 個(表 1)和 6 個(表 2),類別如中介者(foaf:Agent)、 團體(foaf:Group)、組織(foaf:Organization)、人物(foaf:Person)等,屬性如結識(foaf:knows)、 成員(foaf:member)、製作(foaf:made)、個人信箱(foaf:mbox)等。結識(foaf:knows)為唯 一一個明確用於表徵人物間關係的屬性,定義為某兩人之間有所認識,言下之意為兩 者間有所互動(Brickley & Miller, 2014)。 表 1 FOAF 穩定狀態中介者相關類別列表. 類別. 意涵. foaf:Agent(中介者). 中介者。. foaf:Group(團體). 個體中介者的集合。. foaf:Organization(組織) 社會機構,如公司,較 foaf:group 具體。 foaf:Person(人物). 人物,無論生死、想像人物或真實人物。. 表 2 FOAF 穩定狀態中介者相關屬性列表. 屬性 foaf:knows(結識). 意涵 某人為某人所認識(意謂兩者間有所互動。)。. foaf:member(成員) 團體的一員。 foaf:made(製作). 某事物由中介者所做成。. foaf:mbox(個人信箱) 個人信箱,亦即與一個確切的、第一個擁有者相連的 網路信箱。 12.
(25) 屬性 foaf:maker(作品). 意涵 中介者做成某事物。. foaf:weblog(部落格) 某中介者的網路部落格。. BIO Vocabulary BIO 詞彙由 Ian Davis 與 David Galbraith 所創建,於 2003 年首次公布。BIO 用於 描述人物的傳記資訊,可藉由 BIO 詞彙掌握人物的背景、家譜相關訊息。BIO 詞彙描 述人物一生的方式是藉由敘述人物生命中一系列事件,Ian Davis 與 David Galbraith 認 為事件能形成時間軸,進而定位人際關係,因此 BIO 詞彙定義許多事件類型,共有 36 個詞語。此外,BIO 詞彙也表徵出人物間關係,但並未詳究,僅列出人物基本血緣關 係,如父親(bio:Father)、母親(bio:Mother)及孩子(bio:Child)三個屬性。 因 BIO 詞彙是藉由事件來描述人物生平,其詞語分為五個主題(theme),多與事件 有關:(1)人物屬性(properties of a person),(2)事件類型(types of event),(3)事 件屬性(properties of an event),(4)事件與中介者間的關係屬性(properties that relate an event to an agent),(5)事件間的關係屬性(properties that relate an event to another event) 等。首先,人物屬性詞語如生平簡述(bio:One-line bio)、生平詳述(bio:Biography)、關 鍵詞(bio:Key Words)、父親(bio:Father)、母親(bio:Mother)、孩子(bio:Child)、生命事件 (bio:Life Event)、出生事件(bio:Birth Event)與逝世事件(bio:Death Event)。生平簡述、 生平詳述、關鍵詞皆是對人物的描述,生平簡述是以一行字串呈現,生平詳述可以字 串或是連結到新頁面來陳述,而關鍵詞乃以關鍵詞表述。 第二,事件類型有 36 個類型,本研究將事件類型以特徵歸類如下。以影響範圍區 分,有個體事件(bio:Individual Event)及團體事件(bio:Group Event),個體事件主要影響 單一人物、團體或組織,團體事件則影響至少兩個人物、團體或組織;以主題區分, 可分為九類: (1)人物公職事件(如登基 bio:Accession、加冕禮 bio: Coronation 等等)、 (2)人物家庭事件(如領養 bio:Adoption、結婚 bio: Marriage 等等)、(3)人物信 仰事件(如人物受洗成為基督徒 bio: Baptism、猶太女孩成年儀式 bio: BasMitzvah 等等) 、 13.
(26) (4)人物生死事件(如人物出生 bio: Birth、人物被暗殺 bio:Assassination、土葬 bio: Burial 等等)、(5)人物遷移事件(如移民 bio:Emigration、歸化 bio:Naturalization)、(6)人 物職涯事件(如被雇用 bio: Employment、升遷 bio:Promotion、裁員 bio:Redundancy 等 等)、(7)人物求學事件(如註冊 bio:Enrolment、畢業 bio:Graduation)、(8)人物觸法 事件(如坐牢 bio: Imprisonment)以及(9)其他事件(如易名 bio:Change of Name)。 而 BIO 詞彙描述事件的方式乃藉由四個屬性,分別為發生日期(bio:date)、發生地 點(bio:Place)、影響地域(bio:State)及涉及職位(bio:position)。影響地域是指事件所影響 的區域,如國家,而涉及職位是事件中所介入的職位或官職,屬性值為人物。第四項, 事件與中介者間的關係屬性是指中介者於事件中的角色或人物行動,前者如父母(bio: Parent)、雇主(bio:Employer)、主導人物(bio:Principal)等等,後者為見證人(bio:Witness) 及觀眾(bio:Spectator)。最後一項為事件間的屬性,依據事件間相對發生時間點而定, 如同時進行的事件(bio:Concurrent Event)、先前所進行的事件(bio:Preceding Event)、接 著進行的事件(bio:Following Event)等等(Davis & Galbraith, 2011)。本研究將 BIO 詞彙 歸類如表 3。 表 3 BIO 詞彙歸納表. 主題(theme) 人物屬性. 事件類型. 區分特徵. 詞語. 生平介紹. 生平簡述(bio:One-line bio)、生平詳述 (bio:Biography)、關鍵詞(bio:Key Words). 人際關係. 父親(bio:Father)、母親(bio:Mother)、孩子 (bio:Child)、生命事件(bio:Life Event). 經歷. 出生事件(bio:Birth Event)、逝世事件. 人物公職事件. 人物家庭事件. (bio:Death Event) 登基(bio:Accession)、加冕禮(bio: Coronation)、就職典禮(bio:Inauguration)、授 職儀式(bio:Investiture) 領養(bio:Adoption)、廢除婚約 (bio:Annulment)、結婚(bio:Marriage)、離婚 (bio:Divorce) 14.
(27) 主題(theme). 區分特徵 人物信仰事件. 人物生死事件. 人物遷移事件 人物職涯事件. 事件屬性. 事件與中介者間 的關係屬性 事件間的屬性. 詞語 人物受洗成為基督徒(bio:Baptism)、猶太女 孩成年儀式(bio:BasMitzvah)、神職授任 (bio:Ordination) 人物出生(bio:Birth)、人物被暗殺 (bio:Assassination)、土葬(bio:Burial)、火葬 (bio:Cremation)、死亡(bio:Death)、被處死 (bio:Execution)、葬禮(bio:Funeral)、謀殺 (bio:Murder) 移民(bio:Emigration)、歸化(bio: Naturalization) 職位變遷(bio:Change of Position)、降職 (bio:Demotion)、被迫解僱(bio:Dismissal)、 被雇用(bio:Employment)、升遷 (bio:Promotion)、裁員(bio:Redundancy)、退 休(bio:Retirement). 人物求學事件. 註冊(bio:Enrolment)、畢業(bio:Graduation). 人物觸法事件. 坐牢(bio:Imprisonment). 其他. 易名(bio:Change of Name). 發生背景. 發生日期(bio:date)、發生地點(bio:Place). 影響範圍. 影響地域(bio:State). 人物. 涉及職位(bio:Position). 角色. 父母(bio:Parent)、雇主(bio:Employer)、主導 人物(bio:Principal) 、同伴(bio:Partner). 行動. 見證人(bio:Witness) 、觀眾(bio:Spectator). 時間點. 同時進行的事件(bio:Concurrent Event)、先 前所進行的事件(bio:Preceding Event)、接著 進行的事件(bio:Following Event)、緊接著進 行的事件(bio:Immediately Following Event)、很鄰近所進行的事件 (bio:Immediately Preceding Event). Relationship Vocabulary 人物傳記記載的內容為人物所行之事,人物行事於社會中,必然於人際間有所互 動,而產生各種關係,Relationship 詞彙正是能描述人物間關係的知識本體架構。 Relationship 詞彙由 Ian Davis 及 Eric Vitiello Jr.創建,於 2004 年發布。Relationship 詞 15.
(28) 彙並無類別,皆為描述人物雙方關係類型的屬性,屬性之間亦無階層之分,若不論規 格文件中未詳述意義之詞語(如 rel: Relationship、rel: Participant、rel: Participant In),共 32 個詞語(Davis& Vitiello, 2010)。本研究將 Relationship 詞彙按特點區分,分為五 個層面,每一層面又細分幾種類型(表 4)。 第一層面為家族屬性,意指人物間因扶養或姻親而組成家族,家族屬性可再細分 為 扶 養 及 姻 緣 關 係 , 前 者 如 祖 先 (rel:Ancestor Of) 、 父 母 (rel:Parent Of) 、 後 代 (rel:Descendant Of)等等,後者如終身伴侶(rel:Life Partner of)、訂婚(rel:Engaged To)、 配偶(rel:Spouse Of)等。第二層面為社會關係,乃某人與該人物於社會中互動而建立關 係之類型,類型有四個:(1)鄰居(rel:Neighbor Of);(2)深淺程度不同的友誼,如 點頭之交(rel:Acquaintance Of)、好友(rel:Close Friend Of)等等;(3)師生關係,如弟 子(rel:Apprentice To)、指導者(rel:Mentor Of); (4)職場關係,如同行(rel:Colleague Of)、 雇主(rel:Employed By)、員工(rel:Employer Of)。第三層面是以該人物對某人的「情感」 傾向而區分,如對某人有矛盾情感(rel:Ambivalent Of)、厭惡某人(rel:Enemy Of)。第四 層面為「立場」關係,針對某些人事物,某人相對於該人物之立場,如對手(rel:Antagonist Of)。最後一個層面乃依人物間「互動行為」歸類,類型有三個:(1)不同方式的認 識行為,如對某人有粗淺認識(rel:Knows In Passing)、原本認識某人,後失聯(rel:Lost Contact With)、想更認識某人(rel:Would Like To Know)等等;(2)職場上互動行為, 如為同一目標工作(rel:Collaborates With)、為同樣的雇主工作(rel:Works With);(3) 居家行為,如同住一處(rel: Lives With)。 表 4. Relationship 詞彙歸納表. 層面 家族. 類型 扶養. 詞語 祖先(rel:Ancestor Of)、孩子(rel:Child Of)、後代 (rel:Descendant Of)、孫子(rel:Grandchild Of)、祖父母 (rel:Grandparent Of)、父母(rel:Parent Of)、手足(rel:Sibling Of). 姻緣. 終身伴侶(rel:Life Partner of)、訂婚(rel:Engaged To)、配偶 16.
(29) 層面. 類型. 社會關係. 情感. 詞語. 朋友. (rel:Spouse Of) 點頭之交(rel:Acquaintance Of)、友人(rel:Friend Of)、好友. 師生. (rel:Close Friend Of) 弟子(rel:Apprentice To)、指導者(rel:Mentor Of). 鄰居. 鄰居(rel:Neighbor Of). 職場. 同行(rel:Colleague Of)、雇主(rel:Employed By)、員工. (無). (rel:Employer Of) 對某人有矛盾情感(rel: Ambivalent Of)、厭惡某人 (rel:Enemy Of)。. 立場. (無). 對手(rel:Antagonist Of)。. 互動行為. 認識. 結識(rel:Has Met)、某人因其特殊行為而被認識(rel:Knows By Reputation)、粗淺認識(rel:Knows In Passing)、某人因其 行動而被認識(rel:Knows Of)、原本認識某人,後失聯 (rel:Lost Contact With)、想更認識某人(rel:Would Like To Know)、被某人影響(rel:Influenced By)。. 職場. 為同一目標工作(rel:Collaborates With)、為同樣的雇主工作 (rel:Works With)。. 居家. 同住一處(rel:Lives With)。. Biography Light Ontology Biography Light Ontology(BLO)是美國加州大學柏克萊分校於 2006 至 2009 年進行 的研究計畫成果之一,該計畫名稱為「發現生命:情境中的傳記」(Bringing Lives to Light: Biography in Context,以下簡稱傳記計畫),是另一項於 2004 至 2006 年執行的計畫「支 援學習者:4W」(Support for the Learner: What, Where, When, and Who,以下簡稱 4W 計畫)之關係計畫。BLO 詞彙的設計與上述兩個計畫有所關聯,例如 BLO 詞彙標記的 資料庫能回答 4W-what、where、when、who,此設計源於 4W 計畫。4W 計畫的研 究動機在於國家挹注大量資源於數位化、典藏工作中,但數位環境在提供如同圖書館 參考資源相對應的資源上能力薄弱,因此,4W 計畫基於學習者在學習新概念時會藉 由 5W1H 的方式學習,檢視現有的標準及規範被採用於支援學習者提問 4W 層面的適 切性,並設計出 4W 層面的系統介面(Buckland, Gey & Larson, 2007)。傳記計畫則延續 4W 計畫的 4W 模式,以傳記文本為應用對象,參考既有的知識本體 LODE(An ontology 17.
(30) for Linking Open Descriptions of Events, LODE),LODE 為一描述事件的詞彙。傳記計 畫以事件描述人物經歷的思維,設計出 BLO 知識本體架構,此外,BLO 詞彙將最頂 端的類別「事件」(bl:BioEvent)做為 LODE 類別「事件」(leo:Event)子類,藉此整併入 其他詞彙,如 FOAF、ABC、Bibo。而 BLO 詞彙描述事件的屬性則混合採用 LODE 詞彙及 Event ontology (Ramos, 2009, pp. 5-6)。 BLO 詞彙將事件分為三階層(圖 2),第一層有四大類別:健康狀態相關事件 (bl:ChangeOfHealth) 、 地 點 轉 換 事 件 (bl:ChangeOfLocation) 、 關 係 改 變 事 件 (bl:ChangeOfRelation)、發源事件(bl:Origination)。健康狀態相關事件包含出生與死亡 事件;地點轉換事件未分子類別,但各種事件類型可列於該類,如旅行、遷移、移民; 關係改變事件分為兩類別,一為個人關係改變事件(bl:PersonalRelation),描述人物間 關係,如同事、朋友、師生或同居者等,其下有一子類為親屬關係(bl:KinshipRelation), 可包含法律上的親屬關係(如領養)、名譽親屬關係(如教父母)、姻親以及血親等 等。關係改變事件的另一類別為社會關係改變事件(bl:ChangeOfSocialRelation),是人 物與較大單位的中介者之間的關係,如組織、團體或社群,此類別分為四個子類別: (1)榮譽事件(bl:Commendation),如受獎;(2)教育事件(bl:Education) ,如就讀或 訓練;(3)職涯事件(bl:Occupation);(4)公職事件(bl:OfficeCommission)指進入公 部門或領受神職。. 18.
(31) 圖 2 BLO 詞彙類別階層. 資 料 來 源 : Ramos, M.R.(2009). Biography Light Ontology:An Open Vocabulary For Encoding Biographic Texts [electronic version](Tech. Rep.). California, U.S. : University of California, Berkeley,Electronic Cultural Atlas Initiative. p.5. 屬性方面(圖 3),事件之間有時具有關聯,Ramos 舉犯罪事件為例說明,犯罪事件 之後緊接著為坐牢事件,這兩類事件之間有關係(p.8),針對事件間的關係,以相關事 件( bl:relatedEvent)表徵。此外,關於單一事件的描述,如上述所言,BLO 詞彙採用 LODE 詞彙以及 Event ontology:涉及的中介者(event:isAgentin)、發生時間(leo:attime)、 發生地點(leo:atPlace)和涉及的實體或抽象概念(leo:involved)(圖 3)。. 19.
(32) 圖 3 BLO 詞彙事件屬性示意圖. 資料來源:Ramos, M.R.(2009). Biography Light Ontology:An Open Vocabulary For Encoding Biographic Texts [electronic version](Tech. Rep.). California, U.S. : University of California, Berkeley,Electronic Cultural Atlas Initiative. p.6. 托爾斯泰數位化計畫(The Tolstoy Digital project) 「托爾斯泰數位化」計畫(The Tolstoy Digital project)的目的為出版語意標記的托 爾斯泰作品全集網路版,作品全集包含托氏全部作品及私人檔案,在私人檔案中有 21 卷書信,每一封書信附有該信件提及的人物之評論,萃取評論中的事實(fact)成為該研 究團隊近期工作,其採取的方式為先人工建立知識本體,再依據該知識本體的規則編 寫自動化萃取程式。該研究的知識本體是經人工標記 50 封信件後產生,共標記出 13 個元素:(1)本名(has name),姓名分為(2)在室名(has maiden name)及(3)婚後 名(has marriage name);標記人物人生起訖時間的元素為(4)出生日期(birth date)及(5) 逝世日期(death date);(6)社經地位(social status)用於表示社會階級,如伯爵,可再 20.
(33) 用"place"標記(7)社經地位影響地區(social status:place);(8)專業(profession)指人 物從事工作或專長,可標記(9)專業起始時(profession:date);人際關係有兩大類,一 為(10)親屬關係(kinship with),再區分出(11)親屬關係類型(kinship type),如兒子、 女兒、父親、母親、丈夫、妻子、寡婦、鰥夫等,二為(12)友誼關係(friend of),並 以"friendship type"說明(13)友誼關係類型,如結識、朋友、同事(Anastasia & Matvey, 2015)。本研究將上述元素以類別、屬性、值方式表示如表 5。 表 5 「托爾斯泰數位化」計畫知識本體列表. 類別 人物. 屬性. 子屬性. 值. 本名. Nikolay. <has name: first, middle, last>. Nikolayevich Strahov 在室名. Voronec. <has maiden name> 婚後名. Regekampf. <has marriage name> 出生日期<birth date>. 1801. 逝世日期<death date>. 21 July 1915 Earl(伯爵). 社經地位<social status> 社經地位影響地區. Shevelino village( 雪 費 理 納 莊園). 專業<profession>. Poet(詩人). 專業起始時. since 1865. 親屬關係. Lev Lvovich. <kinship with: name> 親屬關係類型. Son(兒子). <kinship type: son/daughter/…> 友誼關係< friend of: name>. Dmitry Alekseevich Dyakov Friend(朋友). 友誼類型 <friendship type: 21.
(34) 類別. 屬性. 子屬性. 值. acquaintance/…>. Actor Ontology 芬蘭國家型計畫項下子計畫“WarSampo”,其研究成果之一為 Actor 知識本體,乃 根據芬蘭二次世界大戰資料發展而成,此知識本體旨於表徵戰爭中人員(personnel)以 及部隊,且應用於成果網站-WarSampo 語意入口網站(WarSampo semantic portal),此 網站典藏芬蘭於二戰時的各種類型資料,如傷亡資料、照片、事件、戰爭日誌、歷史 地圖等等,其中作為 Actor 知識本體的人物實例以及部隊實例各為 100,000 位士兵、 16,100 個部隊,這些資料集藉由 Actor 知識本體發佈到鏈結資料雲(Linked Open Data Cloud)。 Actor 知識本體的設計思維乃基於戰爭特性,該研究團隊察覺戰爭中的人員變動 很大,隨著人員加入戰役與傷亡,流動速度快;此外,戰爭時,因著欺敵策略,而產 生許多密碼,不易解釋。因此,Actor 知識本體雖為表徵人員和部隊等中介者,但對 中介者的屬性定義並不多,僅提供最基本、不易變動的姓名屬性(表 6)(Leskinen, et al., in press, p.6),而藉由事件表達人物相關訊息的方式,採用以事件描述中介者的 CIDOC 概念參考模式(CIDOC Conceptual Reference Model, 以下簡稱 CIDOC-CRM)的 詞語。用於描述人物的事件有八個事件類型:出生(crm:E67 Birth)、死亡(crm:E69 Death)、 升遷(:Promotion)、服役(:UnitJoining)、參戰(:Battle)、獲獎(:MedalAwarding)、受傷 ((:Wounding)及失蹤(:Disappearing)(p.4)。 表 6. Actor 知識本體人物屬性列表. 類別 人物. 屬性. 值. 主標題(primary title). Jorma (Joppe) Karhunen. 姓氏(family name). Karhunen. 名字(小名)(first name (nickname)) Jorma (Joppe) 相關敘述(text description) “Jorma Karhunen was a Finnish 22.
(35) 類別. 屬性. 值 Air ...”@en. LOD 外部連結(external LOD-links). http://wikidata.org/entity/Q5482501. 相關網頁(related websites). https://en.wikipedia.org/wiki/Jorma Karhunen. 中國歷代人物傳記資料庫 「中國歷代人物傳記資料庫」(the China Biographical Database, CDBD)是奠基於郝 若貝教授(Robert M. Hartwell) (1932 – 1996)發展的資料庫,後遺贈予哈佛燕京學社,目 前由哈佛大學、北京大學、我國中研院等機構共同維護。CDBD 旨於收錄中國歷代人 物傳記資料,截至 2016 年 4 月,共收錄逾 370,000 筆人物傳記資料,資料多為唐代中 葉至明代中葉(China Biographical Database,2017)。CDBD 稱資料庫的物件(object)為 實體(entity),以人物(people)為出發點,定義出親屬(Kinship)、非親屬社會關係(non kinship associations)、社會區分(status)、入仕途徑(Modes of Entry into Government)、宦 歷(offices/postings)、地點(places)、著述(writings)等八個實體(Fuller, 2005)。CDBD 是 以關聯式資料庫形式存在,本研究將 CDBD 實體與屬性整理成知識架構如表 7。 關於人物實體的屬性,CDBD 列出姓名(name)、性別(male or female)、出生日期 (birth)、死亡日期(death)、活躍時期(years of activity)等屬性。Fuller (2005)表示中國歷 史人物姓名格外複雜,除有幼年時所取的「名」、成年之後的「字」、自取代表個人 特色的「號」、身後的稱謂「諡號」(p.2),上述別名以「別名」屬性表述。 與人物息息相關的人際關係,CDBD 將其分為親屬關係及非親屬社會關係。親屬 關係包含九個類型:本人(ego)、父親、母親、弟兄、姊妹、兒子、女兒、丈夫及妻子, 認領關係被含括在內。非親屬社會關係分成三大類:簡易非親屬關係(simple non kinship associations)、服喪關係(mourning associations)、贈予關係(gift giving )等。簡易 非親屬關係為人際互動,定義類型眾多且細緻,例如某人的墓誌銘由某人撰寫(epitaph written by)、被某人推薦(recommended by)、排擠某人(purged)、被某人支持(supported by)、 23.
(36) 某人的恩主(patron of )、黨羽(coalition member of)、黨魁(coalition leader of)、友(friend of) 等。而服喪關係是基於人物可為其師長或其他非親屬關係人哀悼所建立,服喪關係在 CDBD 中 以 五 個 元 素 表 達 : 哀 悼 者 (mourner) 、 被 弔 者 (mourned) 、 哀 悼 時 長 (length of mourning)、喪服顏色(color of mourning robe)及日期(date)。第三種非親屬關 係為贈予關係,以五個元素表述:贈予者(giver)、授受者(recipient )、禮物(gift)、禮物 項目或數量(value (or quantity) of gift)、日期(date)。整體而言,CDBD 將非親屬關係分 為十類:社會關係(一般性)(associations (general))、學術關係類(scholarship)、朋友 關係類(friendship)、政治關係類(politics)、著述關係類(writings)、軍事關係類(military)、 醫療關係類(medicine)、宗教關係類(religion)、家庭關係類(family)和財務關係類(finance) 等(CDBD,2017)。 至 於 CDBD 中 的 社 會 區 分 , 郝 若 貝 教 授 原 將 社 會 區 分 (status) 視 為 工 作 (employment),類似人物職業別,然現行的 CDBD 對此實體應用相當廣泛,本研究略 為區分,如政治角色(如皇帝、統治者、宦官、低階官僚、鄉里長者、處士)、任官 歷程(如以瞽廢、以疾廢、曾被彈劾)、軍事角色(如牙將)、經濟狀況(如富豪)、 婚配狀況(如妾、在室女)、嗜好(如好飲酒)、專長(如工於文、工於古文、精於 拳法)、職業角色(如天文學家、書法家、煉丹家)、工作項目(如管理田產)、學 術角色(如儒學、理學家、門客)、宗教身分(如耶穌會士、比丘尼、僧人)、飲食 習慣(如食素)等。社會區分實體以三個元素定義:社會區分代號(status code)、社會 區分補充文字(status description)、社會區分種類與子類(status category and subcategory 1; status category and subcategory 2)。 而 CDBD 的宦歷(offices)是以官職名稱(office name)、官職職掌(office function)以 及任官事件(postings)等實體所組成。CDBD 之所以將官職名稱及官職職掌區分乃由於 官職名稱或職掌會隨時間變化,相同的官名在不同朝代中所職掌的工作不一定相同, 不同的官名在不同朝代中所負責的工作可能相同。任官事件是人物於任官生涯中官位 24.
(37) 變動、升貶等;任官事件的屬性有地點(address ID)、期間(sequence)、朝代年號(含西 元紀年)(year)等。 由於 CDBD 主要目標之一是檢視歷代中國各地邊界變化,因此需要具備在時間長 河中檢視特定地點的能力,因此設計空間相關實體,分為兩類型,一為地址(addresses), 二為地點(places)。地址指空間中特定名稱的行政管轄區域,相關屬性如地址代號 (address code )、地址名稱(address name)、行政區域類型(administrative type)、地址起迄 年(address first year、address last year);地點是以地圖座標標誌的具體位置,屬性為地 點代號(place code)、地點名稱(place name)、X 軸(xcoordinate)、Y 軸(ycoordinate)。 CDBD 最後一項實體為著述(writings),此實體包含 CDBD 關心的三大著作類型: 碑文與其他古文學體資料(inscriptional and other paleographic material)、印刷版第一手 資料(printed primary texts)及次級資料(secondary scholarship)等。著述屬性有十餘項, 如作者、標題、資料類型(category of writing)、文體(genre)、原始出版時間、原始出版 者、原始出版地點、目前的出版者、目前的出版地點,加上碑文材料的屬性,如捐獻 者、接受者、發現地、發現日期、目前位置、資訊來源等。 表 7 CDBD 知識架構表. 類別 人物. 屬性階層 1. 屬性階層 2. 屬性階層 3. 類型. 姓名 性別. 男、女。. 出生日期 死亡日期 活躍時期 親屬關係. 父親、母親、弟 兄、姊妹、兒子、 女兒、丈夫及妻 子。. 非 親 屬 社 會 簡易非親屬 關係 關係. 某人的墓誌銘由 某人撰寫、被某人 推薦、排擠某人…. 25.
(38) 類別. 屬性階層 1. 屬性階層 2. 屬性階層 3. 類型 等等。. (哀悼者). 服喪關係. 被弔者 哀悼時長 喪服顏色 日期. (給予者). 贈予關係. 授受者 禮物 禮物項目或數量 日期. 社會區分. 社會區分代 號 社會區分補 充文字 社會區分種 類與子類. 宦歷. 官職名稱 官職職掌 任官事件. 地點 期間 朝代年號. (空間). 地址. 地址代號 地址名稱 行政區域類型 地址始年 地址迄年. 地點. 地點代號 地點名稱 X軸 Y軸. (作者). 著述. 標題 資料類型 文體 原始出版時 間 原始出版者 原始出版地 26.
(39) 類別. 屬性階層 1. 屬性階層 2. 屬性階層 3. 類型. 點 目前的出版 者 目前的出版 地點 (碑文). 捐獻者 接受者 發現地 發現日期 目前位置 資訊來源. 第四節. 戰爭領域知識本體發展現況. 本研究旨於探究蔣復璁口述歷史中戰亂時期文獻保存知識架構,「戰亂時期」是 該領域知識的特徵,為此於本節探討戰爭相關的知識本體架構。戰爭方面知識本體架 構類型如軍事策略、戰爭事件,軍事策略是作戰時決策用之軍事知識本體(Military Ontology)(Bowman etl., 2001; Mandrick, n.d. ),戰爭事件知識本體則為描述戰事發生過 程之知識本體,本研究的「戰亂時期」概念指戰爭發生的期間,屬後者,因此本節僅 陳述戰爭事件知識本體案例,如 “WW1LOD”、“WarSampo”、 “Muninn”等計畫所發 展的知識本體。. WW1LOD 計畫 適逢第一次世界大戰百年紀念期間(2014-2018),以第一次世界大戰為主題的研究 計畫紛紛進行,“WW1LOD”即是其中的專案,是芬蘭國家型計畫的子計畫(World War I, 2017)。“WW1LOD”選用的參考架構為 CIDOC-CRM,採用考量乃基於使用者在使用 歷史第一手資料時的需求,使用者需要比較資料中地點、事件與人物等訊息,而 CIDOC-CRM 能連結資料與其所涉及事件,進而掌握資料所指之情境(Mäkelä etl., 2015, p.2)。“WW1LOD”將資料集分為六個核心類別:事件(event)、行動者(actor)、發生地點 (place)、發生時間(time)、關鍵詞(keyword)及主題(theme)。 27.
(40) 關於事件,“WW1LOD”將事件分為幾個層次,最高層次的事件(top-level events) 是由帝國戰爭博物館(Imperial War Museum, IWM)所提供,作為資料集的時間軸基礎, 但 IWM 所提供的事件資訊未包含地點與行動者訊息,因此由專家挑選出 250 餘件的 事件(rich events)作為補充,其屬性有事件名稱、替代名稱、描述、中介者、發生時間、 發生地點、包含(contains)、原因(cause)、影響(effect)。另,為能揭露一戰更具粒度的 事件,定義德國在比利時的暴行事件(atrocity events in Belgium),屬性為事件名稱、發 生時間、發生地點、相關戰役、驅逐出境(deportations)、人體盾牌(human shields)、恐 嚇行動(panic)、遭毀建築(destroyed buildings)、被殺人數(killings)。最後則為拓寬事件 的廣度,採用自動擷取技術,從維基百科以及帝國保衛委員會(Committee of Imperial Defence)的官方資料中擷取事件,前者事件屬性為事件名稱、發生時間、相關維基網 頁及戰場(theatre of war),後者為事件名稱與發生時間(p.4)。再者為行動者(actors),其 屬性如名稱、替代名稱、組織資訊以及行動者間關係,且為與德國暴行事件連結,德 國軍隊被包含於行動者中,屬性為名稱、部隊類型與直屬關係(part of)。 至於事件發生地點與時間,戰時地名已與今日不同,因此 GeoName 詞彙不盡然 能適用,故“WW1LOD”仍舊以 IWM 詞彙為主,除地區名稱外,加上經緯度定位;時 間方面,考量戰爭時間的不確定性,如不同立場的行動者,看待戰事發生的時間範圍 有所不同,為此“WW1LOD”採用 CIDOC-CRM 的時間屬性,可標誌出可能的最早起 始時間、最晚起始時間、最早結束時間及最晚結束時間。最末項的類別為關鍵詞與主 題,乃為系統介面的檢索,使用關鍵詞與主題索引資料。. WarSampo 計畫 同為芬蘭國家型計畫項下子計畫 “WarSampo”,蒐藏二戰中芬蘭的資料,是最大 規模地發佈二戰鏈結開放資料的系統之一。“WarSampo”認為戰爭本質上是一連串的事 件,因此選擇以事件為基礎的模型。事件模型中,如同 “WW1LOD”,“WarSampo”亦 採用 CIDOC-CRM 為參考模型,因考量 CIDOC-CRM 能模型其他歷史資料,如戰爭日 28.
(41) 記、雜誌文章、傷亡人數以及照片。“WarSampo”的資料集由戰時事件、戰時行動者、 時間、歷史地點與地圖、二戰期間芬蘭死傷人數紀錄、戰爭日誌、戰時照片、雜誌文 章等部分構成,每部分以數個類別表徵,以下分述之。 戰時事件的核心類別為事件(crm:E5_Event)、死亡事件(crm:E69_Death),每一個事 件 以 偏 好 名 稱 (skos:prefLabel) 、 以 dct:description 做 文 字 敘 述 , 以 發 生 時 間 (crm:P4_has_time-span) 、 發 生 地 點 (crm:P7_took_place_at) 定 位 時 空 , 以 參 與 (crm:P11_had_participant)、被執行(crm:P14_carried_out_by)連結行動者;死亡事件則以 某人於該事件逝世(crm:P100_was_death_of)表述行動者。戰時行動者的核心類別為行 動者(crm:E39_Actor)、人物(crm:E21_Person)、誕生事件(crm:E67_Birth)、死亡事件 (crm:E69_Death)及解散事件(crm:E68_Dissolution)。行動者又包含人(軍人)與團體(部 隊) ,針對不同類型的行動者各有相對應事件,如個人事件有誕生事件(crm:E67 Birth)、 死亡事件(crm:E69 Death)、升遷(:Promotion)、服役(:PersonJoining)、受傷(:Wounding)、 失蹤(:Disappearing)、獲獎(:MedalAwarding)等(Leskinen et al., in press,p. 4);部隊事件 則有部隊形成事件(:UnitFormation)、解散事件(crm:E68 Dissolution),以這兩個事件構 成部隊的存在期間,存在期間的更名事件(:UnitNaming),這三者屬於部隊內部資訊。 而部隊所經歷的外部事件,如參與在更高單位的行動而形成陣線(:UnitJoining)、行軍 (:TroopMovement)、參戰(:Battle)( p.6)。此外,行動者屬性如上節所述,因軍事行動者 流動速度快,不易掌握,以不易變動的姓名屬性(如姓 foaf:familyName、名 foaf:firstName) 與 基 本 敘 述 (dc:description) 定 義 之 。 對 於 時 空 定 位 , 時 間 的 核 心 類 別 為 crm:E52_Time-Span , 屬 性 為 開 始 時 間 (crm:P82a_begin_of_the_begin) 與 結 束 時 間 (crm:P82b_end_of_the_end);地點的核心類別為地點(crm:E53_Place),屬性包含經緯度 (wgs84:lat, wgs84:long)、區域類型(rdf:type,如鄉鎮市)、涵蓋該地的地區(gs:sfWithin) 以及該地的涵蓋區域(schema:polygon)。. 29.
(42) 戰爭的一個特點為人員死傷,“WarSampo”資料集之一即為死傷紀錄,死傷紀錄是 從芬蘭國家檔案局(the Finnish National Archives)而來的資料記錄,因此類別為資料 (crm:E31_Document) , 而 屬 性 所 表 徵 的 資 訊 如 某 資 訊 被 記 錄 於 其 上 (crm:P70_documents)、死亡者的職業、孩子數量、婚配狀況、埋葬地等。 最後一部份為戰爭日誌、戰時照片及雜誌文章,屬資料來源,因此共通類別為資 料(crm:E31_Document)。戰時日誌與行動者間的連結為記錄(crm:P70_documents),與 其他資源的連結是以格式(dc:hasFormat),發生時間(crm:P4_has_time-span)為日誌撰寫 時間;戰時照片的屬性資訊包含敘述、時間、地點、主題及數位照片與縮圖 URI;雜 誌文章基於層面檢索的效率考量,以屬性表徵書目資訊(如標題、作者、頁數、卷、 冊、格式)與內容(地點、事件;被提及的部隊與人物)。. Muninn 計畫 “Muninn”計畫目的乃為創建第一次世界大戰事件的資料庫,並以在加拿大發生的 戰事為主要研究對象。該計畫從檔案文件、維基百科等資料來源萃取資訊。“Muninn” 計畫發展數個知識本體,如同 FOAF,知識本體亦根據架構運作狀態分為穩定、非常 不穩定、測試及過時,其中墳墓(Graves)知識本體、信仰(Religion)知識本體及軍事 (Military)知識本體屬穩定狀態。 墳墓知識本體與信仰知識本體是為表現出第一次世界大戰的戰爭特色-第一次世 界大戰是歷代戰爭中會致力於找出軍人遺體安息處的戰爭。墳墓知識本體與信仰知識 本體是相輔相成的,信仰知識本體定義了一系列的宗教,如天主教、佛教、英國教會、 伊斯蘭教等 12 個宗教與教派類別,信仰知識本體能說明身亡軍人因著其不同信仰而有 不同的葬埋儀式,墳墓知識本體則詳述埋葬細節。軍事知識本體強調軍事人員所屬的 階級(rank)、軍事行業(military trades)及職責(appointment),依照軍種(armed services) 大致分為陸軍、海軍、空軍;以所武裝的設備定義,則如砲兵、裝甲兵、步兵、騎兵。 軍事知識本體詞語達一百餘個,本研究將其歸類如下。 30.
(43) 按照軍隊編制,可從部隊人數多寡編列,如組(空軍小組 mil:AirForceDetail)、小 隊(飛行小隊 mil:MilitaryAirborneFlight)、中隊(裝甲兵中隊 mil:CavalrySquadron)、集團 軍(mil:FieldArmy);以軍種混搭區分,如騎兵砲兵團(mil:HorseArtillery)、海軍砲兵團 (mil:NavalArtillery)、海陸空聯軍(mil:MilitaryFlightUnit);以任務功能區分,如防備部 隊(mil:Garrison)、商船(mil:NavyMerchant)、攻擊步兵(mil:AssaultGroupInfantry)、運輸 補給品的組織(mil:SupplyTrain)。人物方面,可從三方面區分:(1)服役軍種,如海 軍長官(mil:NavalOfficer);(2)軍事職責範圍,如士官長(mil:WarrantOfficer)、聯繫官 (mil:LiaisonOfficer);(3)參與戰事方式,如戰鬥者(mil:Combatant)、非戰鬥者但會涉 入戰事中(mil:Non-Combatant),舉凡護士、牧師。除部隊及人物實體外,尚有事件及 地點。事件能以行動者、行動方式與行動規模區分:行動者 事件如空軍飛行 (mil:BattleSpace);行動方式如入侵(mil:Invasion)、襲擊(mil:MilitaryRaid);行動規模則 如 軍 事 行 動 (mil:MilitaryOperation) 。 至 於 地 點 , 可 以 功 能 分 類 , 如 砲 兵 預 備 地 (mil:ArtilleryEmplacement)、大型補給站(mil:GrandeBatterie)、倉庫(mil:Depot)、大槽溝 (mil:MilitaryTrench)、空軍總部(mil:AirForceStationRAF);以地域關係區分,如戰區 (mil:WarTheater)、前線(mil:FrontLine)。 屬性方面,針對人物、部隊及事件等類別定義屬性,人物屬性如死亡日 (mil:deathDay) 、 入 伍 地 點 (mil:placeOfEnlistment) 、 隸 屬 階 級 (mil:heldRank) 、 擁 護 (mil:allegiance) 、 情 感 親 屬 關 係 (mil:nextOfKin) ; 部 隊 屬 性 如 指 揮 官 (mil:hasCommanderInChief) 、 作 戰 識 別 旗 幟 (mil:BattleStandard) 、 服 役 號 碼 (mil:militaryServiceNumber)、部隊大小(mil:nominalSize)、隸屬階級(mil:rankOf);事件 屬性如重要人物(mil:hasPrincipal)。. 第五節. 小結. 口述歷史依體裁區分,可分為個人生平式、歷史事件參與者與見證人、專題式, 本研究資料來源《蔣復璁口述回憶錄》屬個人生平式,體裁上類傳記體,為此,本章 31.
Outline
相關文件
能瞭解國際貿 易之種類與特 性,具體敘述 進出口相關當 事人的業務操 作流程:.
4.經中央目的事業主管機關認定符合之種苗 業登記證、符合農業發展條例第3條規定 之農民或農民團體證明文件、具備蘭花產 業經營事實之事業單位證明、具備食用蕈
服務法第 16 條規定: 「公務員有隸屬關係者,無 論涉及職務與否,不得贈受財物。公務員於所辦事 件,不得收受任何餽贈。」第 18
構面 指標 說明 要求條件 3.3 職能內涵 職能基準中 的對應「職能內涵. (知識、技能與態度)」,應涵
上項資料本人同意提供中華民國殘障體育運動總會(簡稱殘總)辦理此項賽事及有關此
主觀機率 指一個事件發生的機率由某 人決定,包括設計上的安排 設定,或者根據相信的程度 而猜測。.. 古典機率 假設樣本空間S中的每一個
學生能圍繞主題說話,能運用連接詞略述 事情的經過,高年級學生可以用較多形容
理論,則認為人的情緒不是單純由事件本身引發的,更多是由當事人對事件的 理解或看法而引起的。ABC 理論的 A 是指誘發事件 (Activating