• 沒有找到結果。

群體傳記學與社會網絡分析之結合研究案例

第二章 文獻探討

第三節 群體傳記學與社會網絡分析之結合研究案例

一、 Trismegistos

Trismegistos(TM),以赫爾墨斯(Hermes)的著名綽號「透特」起名,其 為埃及的智慧和寫作之神,在希臘宗教和哲學中發揮了重要作用,是一個旨在克 服文本研究中語言和學科障礙的平臺,內容來自古代世界,特別是晚期的埃及和 尼羅河谷(大約西元前800 - 800 年)。TM 的核心組成部分是古籍文本,目前共 有 759,163 個條目。此項成果起源於 2004 年科隆大學獲得 Sofja Kovalevskaja Award 補助開始進行「在埃及的希臘羅馬多語言和多文化研究」(Multilingualism and Multiculturalism in Graeco-Roman Egypt),利用現有的希臘古文工具(the Heidelberger Gesamtverzeichnis griechischer Urkunden aus Ägypten , HGV),並結合 魯汶大學(universities of Leuven) 的「古籍魯汶資料庫」(the Leuven Database of Ancient Books, LDAB)研究,在兩個學校的密切合作之下,TM 資料庫於 2005 年創建,它專注於提供來自古羅馬埃及(Graeco-Roman Egypt)已發表的紙質文 獻的資料,之後拓展至銘文和埃及以外的紙沙草紙(papyrus)資料,地理範圍 擴大到整個古代世界。這意味著Trismegistos 越來越希望成為一個可以找到有關 古羅馬埃及所有文本資訊的平台,從而促進跨文化和跨語言的研究(Trismegistos, 2019)。

平台提供直接從文本文字、或是從匯聚的檔案(collections/archives)、地理

萃取出地理資訊,就可從地圖上的點的密集度可以看出資料面所涉及的空間位置,

在地名的呈現頁面,除了此地名的位置介紹、外部連結介紹、各語言名稱資訊、

所出現的文獻,頁面右方提供 URI 識別符和 JSON 格式下載,頁面下方提供參 考資料內容分析,包括語言、文獻類型、人名等圓餅圖等視覺化統計分析圖示,

以及最下方的時間軸提供佐證文獻所涉及的時間年代區間(圖2-13)。

圖2-13、TM 人物頁面

人物網絡分析的部分,有三種網絡模式,分別為共同編輯和出版網絡、共同 創作網絡、親屬關係網絡,前兩者為無向圖的共現關係,親屬關係為有向關係,

根據不同網絡模式提供網絡分析指數,如連線向外連出及向內連進的出入度指數

(In/Out-Degree)、中心性指數、離心率和所連結的節點數量等。節點顏色根據 不同網絡也代表不同意義,像是代表不同語言來源資料(藍色=埃及語、綠色=

希臘語、黃色=混合、橙色=拉丁文、綠色=閃米特(Semitic)、粉紅色=其他語言、

灰色=未知),點的大小根據或是編輯數量、創作數量標示,代表有多少條線連入,

二、 People of Medieval Scotland(PoMS)

英國藝術與人文研究理事會(Arts and Humanities Research Council, AHRC)

和Leverhulme Trust 基金會資助了一項為期三年的計畫(2013-2016),名為「十 二世紀和十三世紀的蘇格蘭蓋爾式轉變」(the Transformation of Gaelic Scotland in the Twelfth and Thirteenth Centuries)。計畫團隊包括格拉斯哥(Glasgow)大學人 文學院以及倫敦國王學院數位人文系,該計畫提供了對照(mapping)機制以及 在PoMS 資料庫社會網絡分析的探索性研究。

中 世 紀 蘇 格 蘭 群 像 (People of Medieval Scotland, PoMS ) 資 料 庫

(http://www.poms.ac.uk/),包含有關蘇格蘭或與蘇格蘭有關的人物參與資訊的彙 編,集結了過去三個計畫的成果:The Paradox of Medieval Scotland (2007-2010);

The Breaking of Britain (2010-2013); and The Community of the Realm in Scotland

(2017-2020)。這些資訊是在 1093 年 11 月 13 日 Malcolm III 死亡到 1314 年 11 錄文獻重現當年社會背景(

Jackson, Cornell and Hammond, 2014)。

這個計畫的開放性和大眾可以近用的程度上也是前所未有的。首先,此網站 上提供了繪製資料集的資料庫。其次,使用Gephi 軟體建立互動式的社會網絡視 覺化功能,以便使用者可以更詳細地探索一些社會圖(sociograms)。第三,大部 分成果發佈在近500 頁的電子書,並可在網站免費獲取,資訊透明和易於獲取,

將有助於鼓勵更多的學術研究(People of Medieval Scotland 1093-1371, 2019)(圖 2-15)。

圖2-15、PoMS 族譜網絡圖,左方分析網絡的各項數值,中間呈現關係,右下方 呈現位於整體網絡的位置

三、 中國歷代人物傳記資料庫

(The China Biographical Database, CBDB)

此資料庫源自於郝若貝教授(Robert M. Hartwell, 1932-1996)教授的個人收 集,他終生致力於研究中國歷史的社經變化,從 1970 年代始,即開發出收集傳 記資料的程式,1990 年代初期開始將其所收集的資料建立開發成資料庫,至他 離世前,此資料庫已收集了超過2 萬 5 千人之傳記和譜系資料,郝若貝教授的目 標在於重現單一個人在多脈絡中的面貌,像是探討個人與他人的地緣關係、職業 出仕表現、或是家族關係等等(中國歷代人物傳記資料庫,2019)。

此資料庫在郝若貝教授過世後,贈與哈佛燕京學社,目前由哈佛大學費正清

建置,截至 2019 年 4 月為止,此資料庫共收錄約 427,000 人的傳記資料,這些 人物主要出自七世紀至十九世紀,現正致力於增加收錄更多唐代和明清的人物傳 記資料(https://projects.iq.harvard.edu/chinesecbdb/home)。其中在社會網絡的資 料整理部分,紀錄超過400 種社會關係,分為 10 大類和 15 小類,使用者可選擇 以大類、小類或特定社會關係進行檢索,再依年代、性別等條件限縮,產生的人 物關係資料,可輸出成社會網絡工具和地理資訊系統軟體可以讀取的檔案格式,

為將群體傳記學、社會網絡分析、地理資訊系統等歷史研究與數位工具集結運用 的最佳教材(科技部數位人文籌畫小組,2015)(圖 2-16)。

圖2-16、CBDB 傳主個人生平資訊、地理資訊、關係資訊

四、 國家圖書館通用型古籍數位人文研究平臺

以國圖特藏明人文集為文本,將其數位化成果全文轉置後,結合政大社資中 心開發之各項數位分析工具,建置出一個既符合人文學者研究需求,又能提供大 眾古籍內容分析的平臺(http://ming.ncl.edu.tw/)。平臺提供全文檢索、檢索結果 後分類、文本自動標註、資訊視覺、統計分析、人物社會網絡分析等數位分析工 具,並將持續進行文本擴充與數位工具之研發。其中提供社會網絡分析的史料人 物關係分析能自動識別文本中的人名,產生視覺化呈現,並方便使用者在視覺圖 面上編輯修改關係,即時同步更新人物關係矩陣並產生新的視覺圖,介面對於人 文學者易上手好用(陳志銘,2018)(圖 2-17)。

圖2-17、古籍平臺史料人物關係工具視覺圖及編輯介面

五、 臺灣歷史人物資料庫(Taiwan Biographical Database, TBDB)

此資料庫(http://tbdb.ntnu.edu.tw)借鏡 CBDB,將所涉及的歷史人物時間 及地點取自近代臺灣史,以《新修彰化縣志・人物志》作為資料庫素材進行數位 人文工具開發,所收錄的 887 位人物分佈文化、經濟、政治、社會背景,字數 超過百萬,地點含括彰化縣 26 鄉鎮市,時距長達 333 年。此資料庫已發展資料 庫檢索、全文檢索、文本探勘、統計分析與社會網絡等分析工具,協助歷史人文 學者研究。其中關於社會網絡分析的部分,從單一傳主網絡的探勘到傳主間的社 群網絡建置,以及結合外部資訊和自動化概念分群所獲得的特徵向量,得出相似 度分群,且得出的結果格式可匯出至其他社會網絡視覺化工具操作分析,或是搭 配資料庫相關時間、空間統計功能、命名實體辨識技術等,觀察群體人物在歷史 脈絡下的縱向橫向發展,以及透過人物與組織之間時空交集的網絡資料,以期從 文本之間建構出宏觀的臺灣史(謝順宏、柯皓仁、張素玢,2018;謝順宏,2018)

(圖2-18)。

圖2-18、TBDB 傳主間的社群網絡

表2-5、具社會網絡分析功能之群體傳記平台

網站名稱 資料內容 提供功能 社會網絡分析層面

Trismegistos

古羅馬埃及時期 古籍文本 的差別比較,甚至可能使宏觀觀點複雜化(Kienle, 2017a)。但是必需留意,創 意性的資料視覺化,有時會破壞資訊所隱含的實證主義,從政治聯繫和社會情感 的統計製圖,到人際交往的網絡圖,資訊視覺化、圖形化的力量,中間所遺失的 資訊,經常是資料在建造時所依據的前提和參數,這些很容易在華麗圖表下被遺

在這些設計中,語言、視覺和統計都是緊密結合的,以便通過設計的簡潔性來呈 現資訊;換句話說:「設計如此之好,以至於它們是看不見的。」因此,在視覺 化背後的環境、主觀條件等因素需要再加以探討,以避免偏頗(Kienle, 2017b)。

相關文件