• 沒有找到結果。

引用關係圖 (IE-M Diagrams)

在文檔中 資訊技術與歷史文獻分析 (頁 141-156)

第六章 明清臺灣行政檔案引用關係之建構

6.3 引用關係圖 (IE-M Diagrams)

截至上一節引用關係建構為止,關心的都是檔案間 pairwise 的引用關係。

但若連結起層層引用的行政文書,便能追溯行政文書的往來過程,解析文書發 文的背後原因,正如我們在 6.1 節舉的例子:光緒帝發出的上諭被四份奏摺引 用,而該上諭又是因為左宗棠奏參李彤恩所引發,因此四份後續奏折的遠因,

其實是左宗棠的奏,把這幾件奏諭根據引用關係連結起來,就形成圖 73。因此 我們希望根據上節建構的引用關係,把具有引用關係的文書層層連結起來。

 73    左宗棠奏參李彤恩所衍生的引用文書示意圖  

為了將引用關係 <d, candidate> 轉化為圖論中的 edges,我們將文書視為 node、引用關係 <d, d’> 視為 directed edge,因此整個『明清臺灣行政檔案』文 件集合(以 D 表示)與所有引用關係就構成一個 graph:G=(D, E),此時 G 不 是 connected graph。我們認為在 G 中兩個彼此無法連通的文件(unreachable nodes)的相關性應該較弱,因此我們希望將 G 切割成一些 connected sub-graphs,

以凸顯整批史料中相關性較強的文書,而暫時忽略不能以引用關係連通的文書。

我們將G 切割成 connected sub-graphs 的方法,是從所有含於引用關係的文 書中,挑選一件開始,把它引用的、以及引用它的文書全都加入一個空的 sub-graph,以 g 表示,接著再把已加入 g 中的文書一個個拿出來,把它引用的、以

及引用它的文書也加入 g,直到沒有新的文書能夠加入為止。這個方法的步驟

D (the corpus) is the set of documents.

E D D is the citation relation on D. (E is irreflexive, asymmetric, and non-transitive.) Let G=(D, E) be a graph.

Let GC be the set of all the maximum connected sub-graphs of G.

That is, GC={G1=(D1, E1), G2=(D2, E2), … , Gn=(Dn, Dn)} where Di D, |Di| 1, Ei E for 1 i n, Di Dj= , Ei Ej= , 1 i,j n and i j, Di D, Ei=E.

GC is constructed in the following way:

Let GC be empty at the beginning.

Let D0={d|(d, d’) E or (d’, d) E, d,d’ D} be the set of documents which has not been added to any sub-graphs yet.

Let E0=E be the set of citation relations which has not been added to any sub-graphs yet.

Let S1…Sk be the sets of duplicate documents. Si Sj= , 1 i,j k and i j, Si D.

buildGraph(d, G=(D,E)) { If d D0

For each d’ D, d’ D0

同內容的檔案合併畫成一個 node,避免重複資訊造成視覺上的複雜度,此外,

我們也畫上了時間軸,讓文書依照時間順序,從上往下排,加強文書的時序感。

同樣以左宗棠參奏李彤恩引發的奏諭為例,實際建構引用關係圖的結果,得到 一個含有 23 件文書的引用關係圖,其轉成視覺化圖形的結果為圖 74,當中雖 然含有 23 件行政文書,但有些是內容相同的副本(即圖上有數字的方框),因 此總計相異的文書僅有10 件,即圖中的 10 個方框。

 74    以「左宗棠參李彤恩之奏」為始所衍生的引用文書,與它們形成的引用關係圖  

以下我們簡短說明此圖中呈現的故事。圖中以粗線標示的,就是我們在 6.1 節提過的六件文書,其他的四件按照時序、從上到下分別是:光緒 10 年 11 月 18 日左宗棠的附片(乃隨奏而附的簡短報告),奏請光緒帝讓自己把己革總

兵楊在元留在台灣供他差遣;第二件是光緒11 年 1 月劉銘傳的附片(可能是隨

有的檔案,最多一個出處有五件:「光緒朝月摺檔」,只收奏摺;連中法戰爭

(針對中法戰爭一事收錄相關史料的合輯)、清實錄臺灣史資料專輯(將編年體 的清實錄中有關台灣者選出)也各僅收了四件、三件,換言之,在這兩書中讀 者都沒有辦法看到這麼完整的文書往來,就算放在同一出處當中,也是分散:

因為都是編年體,按日排序,因此都會拆開,不容易在當中同時關注多條脈絡,

同時找多線的引用關係。透過資訊技術在明清史料中建構的引用關係,以及將 引用的行政文書自動連結形成的引用關係圖,我們能快速的在 37,817 件「明清 臺灣行政檔案」中找出彼此有關、相涉的一群史料,並可以多線找到很多群這 樣的史料。

 26    以「左宗棠參李彤恩之奏」衍生的 23 件引用文書,其出處列表  

出 處 檔 案 數

光緒朝月摺檔 5

中法戰爭 4

清實錄臺灣史資料專輯 3

左宗棠全集 2

清季外交史料 2

楊勇愨公奏議 2

劉銘傳文集 2

軍機處洋務檔光緒 1

清宮洋務始末臺灣史料 1

劉銘傳撫臺前後檔案 1

 75    以「左宗棠參李彤恩之奏」衍生的引用關係圖中,各文書的出處狀況  

我們也注意到建構出的 1101 個引用關係圖中數量較多的(請見下面的表 27)都是清治時期臺灣史上重要的事件,追查這些大圖中的引用連結往往能細 緻的反映出清朝政府是如何處理臺灣的重大政務。舉個例子,最大的圖(含 153 件檔案)呈現於下圖,形成了一個相當複雜的引用網絡,這個圖呈現出乾 隆皇帝如何處理臺灣最大的民亂林爽文事件。這個圖生動反應了林爽文事件如 何從特定地方的反官行動、迅速發展成全島規模的嚴重民亂。從這些與林爽文 事件相關的引用關係圖,我們能仔細看到林爽文事件不同時期、不同線的發展

(請詳見表 27)。

表 27 前 20 大引用關係圖的檔案內容概說 6年(1787-1867)

林爽文事件後對於引發民亂之不肖官員的懲處(財產充公、發放

商增兵以馳援臺灣之事。當時中國內部對於戰略也有不同意見,

慰之意,除要求程祖洛與欽差大臣瑚松額嚴加審訊外,也針對參 19年(1865-1893)

本圖最早的文件,是戴潮春事件之後,一連串關於人員獎賞與人 12年(1721-1832)

這張圖橫跨一百多年,但集中在四個時間點:康熙六十年、乾隆

 76    我們建構出最大的引用關係圖,含 153 件諭旨文書(淺色框)及奏事文書(深色框),此 圖是關於清治時期臺灣最大反官民亂林爽文事件  

我們利用年代分布圖,將整個明清臺灣行政檔案、與具有引用關係的檔案 數量做一比較,可以觀察到,明清臺灣行政檔案中最高峰的 1787-88 年,即林 爽文事件期間,也有相當高的比例具有引用關係,佔了將近一半,若假設我們 建構引用關係方法中的遺漏是平均的,這麼高的檔案引用比例是否意味著:林 爽文事件是一個多方官員通力合作的事件?因為這段時間造成了較多的公文往 返溝通。在『明清臺灣行政檔案』整體年代分布中的其他檔案高峰,有些的引 用關係檔案數量也類似於林爽文事件,佔有約一半的高比例,如1806-07、1833、

1842,是否這些年份發生的事件有具有大量溝通的性質?然而在其他的一些整 體檔案數量高峰的年代,如 1874、1884、1895,含有引用關係的檔案比例相對 較少,是否意味著這些事件中較少需要文書往來行文、溝通?

 77    明清臺灣行政檔案全體、對比具有引用關係的檔案的年代分布圖

我們也將「奏引諭」引用關係的「時間差」統計出來,也就是 <d, d’> 兩檔 的成文日期差距,繪成圖 78。圖中是以年份為單位,一條連結年份 A 與年份 B 的弧線(A 早於 B)代表 B 年份有一份奏引用了 A 年份的諭,但若引用關係中 奏、諭兩檔成文日期在同一年(年內引用),則不畫弧線,只加大該年份的點半 徑。此外,弧的半徑越大、代表相隔時間越長。

從圖中年份的點大小立即可以觀察到:乾隆52、53 年內的確產生了大量的 引用文書,另外在嘉慶 11 年(1806)、道光 13 年(1833)、21 年(1841)、同治 13 年(1874)、光緒 10-11 年(1884-85) 也都有較多的「年內引用」,這個觀察與年代 分布圖的觀察符合。而從圖中弧的大小來看,由於時效性的引用多為「年內引 用」,因此這張圖上反而強調出中等效期、與長效性的引用關係,最吸引目光的

應該是從乾隆53 年射出的許多大弧,這些弧有多個落點,分別指到了嘉慶、道 光、同治年間,其中道光 12 年還有一個弧是指回乾隆 12 年的,這些引用應該 是政策性的引用,survey 過去政策規定的討論。

 78    引用關係時間差的視覺化呈現,弧的垂直距離代表引用的年份距離,弧越大距離越久  

在文檔中 資訊技術與歷史文獻分析 (頁 141-156)