• 沒有找到結果。

古契約文書

在文檔中 資訊技術與歷史文獻分析 (頁 49-63)

第三章 THDL 資料內容與前置處理

3.2 古契約文書

3.2.1 資料內容

古契約文書指的是日本統治政府建構完整的地籍管理制度以前,臺灣民間 訂定各種與土地相關的交易時所簽訂的證據文書,像是土地的買賣、租佃、開 墾、鬮分、典借等。契約文書常是由代書所準備、書寫,再由立契人花押。一 張契書的內容通常會包含以下部分(請參見圖 18):

l 契約類型:杜賣契、開墾契、贌耕字、找洗字、鬮分契、典契、胎借字…等 l 立契雙方(或多方)人物:例如杜賣契有賣方與賣方,鬮分契則有參與鬮分

(分產)的各鬮分人,典契有出典人與承典人…等 l 土地的座落與四至界址

l 交易金額

l 在場見證人與代書姓名 l 立契日期

在當時,土地一旦發生糾紛,契約文書便是唯一能用來證明人民對土地擁 有權利的證據,也因此民間有著留存「上手契」的習俗:買賣時賣主需將土地 過往的交易契約全都一併轉移給買主,以確保契書的排他性[1]。然而日本統治 時代(1895-1945)初期引進了西方的測量技術,建構了完整的近代地籍制度,

即:由政府記錄每一筆土地的位置、大小、權利人,並管理地權的過渡,至此,

契約文書喪失了作為土地權利證明的必要性,而被大量釋出,成為學術單位、

博物館和民間的收藏品。

18 一張契書的原件影像(出自: 竹塹北門鄭利源家古契)

古契約文書是了解近代化以前臺灣基層社會的重要材料,歷史學者能藉由 研讀一定數量的契約文書,來了解當時臺灣的土地交易模式、經濟活動、地區 開發、族群關係等議題。然而,契約文書由於失去其重要性而被丟棄、銷燬,

有幸留存下來的也散居各處,掌握在不同典藏單位、學者、與私人收藏家手中,

雖然台灣史學界已經能利用零散的契書,對清代台灣之土地交易與漢番關係等 課題,做出相當精彩的研究[64][65][66][67],但契書資料的分散與蒐集困難,

仍舊是臺灣史研究的重要屏障。

有鑑於此,文建會從民國92 年起委託了多個典藏與學術單位進行台灣古契 書的蒐集與全文數位化工作,希望能以政府之力,蒐集整理臺灣現存的古契約 文書,作為臺灣研究的基礎建設,這批古契書數位化的成果有很大一部分已經 收錄於 THDL 的『古契約文書』文獻集。此外,臺灣大學圖書館自民國 97 年 起也進行了戰後已刊古契書的數位化工作,再加上臺灣大學人類學系典藏的契

約文書,總計目前THDL 的『古契約文書』件數已累積到 35,451 件,全文共有

目列表請見表 3 )。

台灣省文獻委員會典藏北部地區古文書專輯(1)(2) 476

二林鎮志 58

斗六市志 6

在大量史料間尋找相關契書的可能性。黃于鳴正利用此特性進行了契書關係建

圖 19 臺大圖書館製作的「竹塹北門鄭利源號古契書」的數位全文檔,以 Microsoft Word 繕打,並 以雙斜線後接換行符號來仿照原契中換行的位置

20 臺大圖書館製作的「岸裡大社文書」數位全文檔,以純文字檔繕打,並同樣以斜線後接換 行符號來仿照原契中換行的位置

21 國中圖 92 年製作的「總督府檔案抄錄契約文書」數位全文檔,仿照契書原件空白處的地區 註記(契書正文上方的「石井庄 土名石井」),以及契書內文中立契人姓名並排書寫的狀況

圖 22 國中圖 92 年製作的「台南市政府文化局民族文物館暨永漢民藝館古契書」數位全文檔,運 Microsoft Word 表格功能仿照契書原件的樣貌如實製作

更為棘手的是,各批數位化契書採用的詮釋欄位都不一致,雖然契約文書 的內容通常遵循類似的格式,會有立契人、契約類型、契約地點、立契日期等 固定的資訊,但各單位規劃的欄位仍不盡相同,例如以下的圖 23~圖 26,分別 是國立臺中圖書館於92、93 年進行、與臺大圖書館進行的兩批契書詮釋資料中,

對應到「題名」、「分類」、「人物與人物角色」的部分欄位,比較之下可以發現,

各批資料把相同意義的內容著錄在不同的欄位名稱底下,各批採用的分類也都 不相同,人物與人物角色的著錄格式也不太相同。

圖 23 國中圖 92 年製作的詮釋資料表 (使用 Microsoft Excel)

圖 24 國中圖 93 年製作的詮釋資料表,欄位名稱與著錄規範已有不同

25 臺大圖書館為「岸裡大社文書」製作的詮釋資料表 (Microsoft Excel)

26 臺大圖書館後期製作的「竹塹北門鄭利源號古契書」等三資料群時,詮釋資料欄位名稱與 著錄規範已有不同

為了讓來自多種來源的契書資料均能具有一致的資訊量,以便提供一致的 我們把契書的詮釋資料與全文儲存成 self-contained 的 XML 檔,在全文中加註 人名 <PersonName/>、地名<LocName/>、日期<Date/> 等標籤[63], 如圖 27 所 示。

然而,「地點」可說是一份土地契約最重要的資訊,因為土地契約必定牽涉 到一塊或多塊的土地,若能幫這批契書在地圖上描點,則立即可以了解這批契

書的地域分布。但困難在於,從契書中僅能知道土地的「坐落地名」,卻不知道 該地名的「實際地點」,舉例來說,契書提到的地名通常是小地名,在全台灣可 能有很多地方都叫這個地名,再者,台灣古地名常常在改變,也沒有統一的寫 法,唸出來的地名被寫下來可能有四五種寫法,這些都造成了從地名判斷實際 地點的困難,也因此,以往契書研究者需得對地名進行考據,才能知道其現今 的地點。林韋翰先從「讀音」著手,利用這個文獻集找出「同音異名」的地名 對應[80];歐仲翔則利用「總督府檔案抄錄契約文書」中註記的行政區(堡里 街庄)與土名,將 15899 件含有上述資訊的契約文書歸納成當時的行政區劃,

並運用地理資訊系統(Geographic Information System, 簡稱 GIS),將這批契書 呈現在GIS 上,並可套疊現今地圖或是 1904 年的臺灣堡圖[81] 。

27 將契約文書的全文與詮釋資料合併存於 XML 的範例(此例為圖 18 的文字檔)

以上我們介紹了 THDL 兩文獻集的內容與特殊性質,並說明我們透過資訊 技術對兩批數位化史料各自進行了哪些自動化的整理、特徵擷取、與關係的建 構,這些動作都是以人力不容易做到的。然而我們更希望展現的是,以資訊技 術提供歷史學家掌握大量數位化史料的新方法,協助當代的歷史學家進行人力 不易、甚至不能做到的歷史研究。

在文檔中 資訊技術與歷史文獻分析 (頁 49-63)