• 沒有找到結果。

契書比對流程

第三章 研究方法

3.4 契書特徵比對方法

3.4.3 契書比對流程

有了前兩小節提到的四種契書關係所須滿足的特徵條件以及特徵模糊比對的 方式之後,接著我們就兩兩比對經過詮釋資料與全文特徵擷取所得到的17112 件 契書,檢查是否有符合以上特徵條件的契書關係。

由於這四種契書關係有很多需要比較的特徵條件是重複的,例如同樣都需要 地名A = 地名B、時間上一定是立契時間A ≦ 立契時間B,這些重複的條件可以同 時比較,所以我們設計了一個比對流程,以作較有效率的比對,如圖3.12~圖 3.15。

圖 3.12 為比對流程的上半部,對於 17112*17112 對契書對(A, B),首先利用時

間、地名及檔案名稱過濾掉約99%以上的契書對,得到 1539834 契書對,在這邊 因為希望能增加找到的契書,因此留下無時間資訊的契書。接下來將流程一分為 三,左半邊為買方集合A與賣方集合B有交集的情況有16035 契書對,中間為契書 角色類型為兩方角色,且賣方集合A與賣方集合B有交集的情況有10986 契書對,

右半邊為契書角色類型為兩方角色,且買方集合A與買方集合B的有交集的情況有 4155 契書對,這一部分是為了特別處理詮釋資料裡缺乏賣方資訊的契書關係。

圖 3.13 為左半邊的流程,接著利用分類是否為鬮分契及立契時間是否相等找 到鬮分契多份的關係930 組(一組可能包含超過兩件契書),再利用分類、立契時間 是否相等、賣方所交集的人數是否相等及契書內容相同篩選條件找到契書內容相 同關係29 組,最後再用上下手契篩選條件找出上下手契關係 2143 對。

圖 3.14 為中間的流程,往下再利用 A 與 B 的分類是否為契尾、買方集合是否 有交集及原契與契尾篩選條件找到原契與契尾關係65 對,接著利用分類、立契時 間是否相等、買賣方所交集的人數是否相等及契書內容相同篩選條件找到契書內 容相同關係558 組,最後再用上下手契篩選條件找出上下手契關係 256 對。

圖 3.15 為右半邊的流程,往下再利用 A 與 B 的分類是否為契尾及原契與契尾 篩選條件找到原契與契尾關係55 對(因為右半邊是處理無賣方資訊的契書關係,所 以這裡不再檢查賣方是否有交集),接著利用分類、立契時間是否相等、買方所交 集的人數是否相等及契書內容相同篩選條件找到契書內容相同關係23 組。

經過以上的比對流程,我們共找到上下手契 2399 對、原契與契尾 120 對、鬮 分契多份930 組、契書內容相同 610 組。由於自動重建關係可能會有錯誤,我們 會再由人工檢查確認最後找到的契書關係數。

圖 3.12:契書關係比對流程上半部

圖 3.13:契書關係比對流程下半部左半邊

分類A = 分類B

且 立契時間A = 立契時間B

且 賣方集合A = 賣方集合B

且 符合契書內容相同篩選條件 符合上下手契篩選條件

16035 契書對

鬮分契930 組 10400 契書對 分類A = 分類B = “鬮分契”

且 立契時間A = 立契時間B

上下手契 2143 對

契書內容相同 29 組 17112 件契書共

171122契書對(A, B)

(立契時間A ≦ 立契時間B A無立契時間 或 B無立契時間) 且 地名A = 地名B

且 檔案名稱A ≠ 檔案名稱B

1539834 契書對

買方集合A ∩ 賣方集合B ≠ Φ

契書角色類型A = 契書角色 類型B = “兩方角色”

且 賣方集合A ∩ 賣方集合B

≠ Φ

16035 契書對 4155 契書對

10986 契書對

契書角色類型A = 契書角色 類型B = “兩方角色”

且 買方集合A ∩ 買方集合B

≠ Φ

3.13

3.14

3.15

圖 3.14:契書關係比對流程下半部中間

圖 3.15:契書關係比對流程下半部右半邊

分類A ≠ “契尾” 且 分類B = “契尾”

且 原契與契尾篩選條件

4155 契書對

契尾55 對 4100 契書對

契書內容相同 23 組

分類A = 分類B

且 立契時間A = 立契時間B

且 買方集合A = 買方集合B

且 符合契書內容相同篩選條件 分類A ≠ “契尾” 且 分類B = “契尾”

且 買方集合A ∩ 買方集合B ≠ Φ 且 符合原契與契尾篩選條件

符合上下手契篩選條件 10986 契書對

契尾65 對 10921 契書對

上下手契 256 對

契書內容相同 558 組

分類A = 分類B

且 立契時間A = 立契時間B

且 賣方集合A = 賣方集合B

且 買方集合A = 買方集合B

且 符合契書內容相同篩選條件