• 沒有找到結果。

第三章 從史料中產生職官任職資訊

3.3 排名候選人名

立 政 治 大 學

Na tiona

l Ch engchi University

名,例如地名或是史料寫作常用名詞,雖然透過與職官名稱平均距離過濾較遠的非人 名,不過對於史料寫作常用名詞剛好又在職官名稱附近的情況下,與職官名稱的平均距 離便無法順利過濾,若是將平均距離設較低的數值,又會有真正人名被過濾掉的可能 性,所以在下一節中主要將針對候選人名當中的非人名進行處理。

3.3 排名候選人名

針對探勘結果組合成候選人名之後,雖然經過平均距離的方式過濾,但是其中仍然混雜 著一些非人名。因此本節將針對候選人名當中的非人名,根據人名與非人名在特質上的 差異,提出四項指標用以區隔出人名與非人名,再依這四項指標的結果對於候選人名進 行排名的動作。

為了過濾候選人名當中的非人名,我們根據人名與非人名之間的特質提出四項指標 做為區隔兩者的參考,這四項指標分別為平均任期、職官品位變化幅度、職官變動率以 及與各職官名稱的平均距離。在接下來各節當中依序介紹,且各項指標皆利用評估合理 性的方式將兩者做差異的排序,使人名可獲得較高的排名,而非人名獲得較低的排名,

讓排名愈低者愈不可能是人名,最後再依據四項指標的排序結果產生總排名,並且盡量 使得非人名集中在較低的排名,以利最後職官年表的產生。

3.3.1 平均任期

一般而言,官員不太可能擔任一個職官之後,馬上又轉任下一個職官,短期內接著再換 另一個職官,從前任職官到後任職官之間的任期間隔不會太短,並且不會頻繁轉任不同 的職官,換句話說,正確人名就任不同職官之間的間隔時間相較非人名來的長,以現實 擔任職官之情況而言也較為合理。相反的,非人名的部份例如史料中寫作常見用詞,包 括疏言、疏報、予故、祭葬、議覆、署理、遵旨…等,若將其視為人名並且計算平均任

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

期,則平均任期理論上會比正確人名來的短暫,因為那些名詞伴隨出現的職官相當多,

並且在職官異動之間的間隔時間極短。

我們利用擔任各職官平均任期的合理性來做為一項指標,理論上非人名職官變化激 烈,平均任期會相當的短暫,而人名則反之。透過平均任期指標將非人名與人名做排序,

並且使得人名能夠取得較高的排名,非人名則獲得較低的排名,用以將兩者做出區隔。

關於候選人名平均任期的計算方式如下,其中 M 為職官異動次數,OTi為第 i 個職官與 i+1 個職官之間的任期間隔,i>1,以月份為單位。

關於職官異動次數以及擔任職官之任期總和判斷,以圖 3.8 額倫特之職官任職資訊 為範例說明,從史料中找尋與額倫特一起出現的職官名稱,根據這些職官名稱判斷額倫 特曾經擔任過之職官,若有多個職官名稱一起出現,我們採取最靠近者視為當時擔任的 職官,若與一起出現的職官名稱之距離超過 6 個字,則將該職官當作雜訊 (Noise),不 視為曾經擔任過的職官。為了判斷擔任職官異動次數,若目前句子中對應的職官名稱和 上一句擔任的職官名稱相同,則視為持續擔任相同一個職官,並且不記錄該句子,而當 句子對應的職官名稱與前一句不同時,這時則代表任職的職官已產生變動,並將該句子 記錄下來,透過以上方式將發生職官異動時之句子擷取出來。因此從圖 3.8 例子中可知,

額倫特於史料中擷取出 8 句職官變動之句子,在最左邊數字代表該人名與對應的職官名 稱之距離,其距離以相間隔的字數為單位,若距離 1 表示該人名與對應的職官名稱中間 隔了一個字,依序往右則列出擔任該職官的時間以及職官名稱,在此我們以史料中第一 次對應到該職官的時間做為其上任時間,其中,若史料當中並無記載上任資訊,則會造 成此部份的任期會有些許誤差,由於史料本身無記載因此無法得知確切的上任時間。

如圖 3.8 所示,第一筆記錄代表額倫特擔任通政使的時間為康熙三十六年六月,並

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

3.3.3 職官變動率

此項指標是說明官員在仕途中職官變動的頻率,一般來說官員於仕途上職官變動不會太 頻繁,擔任職官的情況通常是某期間常與特定職官名稱一起出現,若職官有變動,那麼 經過一段期間才會再伴隨著另一個職官名稱,因此真正人名其職官變動率理論上應該較 低。然而,非人名則相反,職官動輒變動了上百次,換句話說,由於非人名通常沒有擔 任固定職官,不會時常與固定的職官伴隨出現,所以觀察其所有擔任職官的情況,是不 斷地在改變。

關於職官變動率定義為每次伴隨職官名稱出現的次數當中,職官名稱變動的次數為 多少,換句話說,就是在所有史料記載當中,職官變動頻繁與否。若是太過於頻繁則較 為不合理,我們將其視為非人名。職官變動率的計算方式如下,其中 N 為史料中與職官 名稱出現總次數,Xi為第 i 筆擔任的職官,|XiXi+1|為職官變動次數,1≤ i ≤ N。

候選人名職官變動率 = |X i X |i+1 N

以圖 3.8 額倫特為例,擔任了 5 種不同的職官有 4 次的變動,分別是通政使異動為 左副都御史,左副都御史異動為湖廣提督,湖廣提督異動為湖廣總督,湖廣總督異動為 西安將軍,因此其職官變動次數為 4 次,而根據我們在史料中檢索,得知額倫特總共與 職官名稱一起出現了 14 次,其中包含重複的職官名稱,換句話說,若前次伴隨之職官 名稱與後次伴隨之職官名稱皆為同一職官,該人名與職官名稱的出現總次數要視為 2 次,與 3.3.1 節的“擔任不同職官的總數”定義不同,在此定意為伴隨職官名稱出現的 次數,因此額倫特的職官變動率為 4/14 約為 0.28。最後根據各候選人名之職官變動率做 排名,使得 職官變動率較小的候選人名排名較高,職官變動率較大的候選人名排名較低。

3.3.4 與各職官名稱平均距離

此項指標說明人名在史料當中,與各個職官名稱的平均距離通常要比非人名來的近,因

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

在較落後的名次,盡可能使得人名皆分布在非人名的前面,以達到區隔兩者之目的。