第五章 結論與未來工作
5.2 未來工作
目前對於人名、地名的模糊比對,只有做字詞的刪減及檢查字的重複及位置,
可以再加進其他的資訊來幫助比對,例如利用字形相近、發音相近或者異體字列 表,比較不同的字是否在列表裡面。也可以加入關於人名、地名的額外資訊,在 人名方面可以加入族譜或者加入合股及家業公號與關係人的對應,這樣當不同的 契約分別使用公號或是個人名義從事交易時才能被找到。地名可能在不同時期有 不同的名稱,契書內提到的地名也可能是指涉較大區域的堡名、庄名,或是小區 域的土名,因此也可加入地名沿革或地名階層的資訊來比對。未來如果有這些資 訊都可以整合進現有方法中改進比對。
除了自動重建方法的改進之外,本研究中找出了四種契書關係,但另外還有 許多可能有利於歷史研究的關係。例如在同一年裡某個人或某個家族賣了或者買 了很多筆土地所分別立的契約、總督府檔案裡的契書原件與官府發給證書的關 係、契書原件與總督府的日文抄本之間的關係,或者像是文件集「岸裡大社」及
「神岡 : 筱雲呂玉慶堂典藏古文書集」裡常見業主與佃戶各立一張出贌字及認贌 字或借銀人與銀主各立一張收銀字及出銀字的對契關係,這些關係都可能對於研 究古契書是有意義的,未來可以嘗試利用現有的或新的契書特徵,訂出合適的特 徵條件來找出這些關係。
另外,原有的契書關係或許也可以再細分,像是鬮分契可以分成家產的鬮分、
合股買地的鬮分,土地的買賣關係也有各種情況,像是買賣大租權或小租權、買 賣土地的耕作權或收租權,這些關係若能再利用更多的契書特徵或不同的條件判 斷來加以區分,都能更有助於古契書的研究。
參考文獻
[1] 吳密察、翁佳音、李文良、林欣宜合著,「臺灣史料集成提要」,台北市:
行政院文化建設委員會、遠流出版公司,2004 年,頁 101-135。
[2] 王世慶,「臺灣民間古文書之搜集整理研究」,臺灣史料論文集上冊,台北縣:
稻鄉,2004 年,頁 367-379。
[3] 行政院文化建設委員會,「國家文化資料庫」網站,
http://nrch.cca.gov.tw/ccahome/index.jsp,檢索日期 2009 年 4 月 29 日。
[4] 項潔、陳詩沛、杜協昌,「台灣古契約文書全文資料庫的建置」,第三屆台灣 古文書與歷史研究學術研討會,逢甲大學歷史與文物管理研究所,2009 年。
[5] 楊毓雯,「『平埔客』之歷史探究︰以道卡斯竹塹社廖姓為對象」,中央大學 客家社會文化研究所碩士論文,2007 年,頁 94。
[6] 國立臺中圖書館,「台灣地區古文書」網站,http://od.ntl.gov.tw/,檢索日期 2009 年 5 月 3 日。
[7] 臺灣大學圖書館,「古契書計劃」網站,http://ci6.lib.ntu.edu.tw:8080/gucci/,
檢索日期2009 年 5 月 3 日。
[8] 楊惠仙編著,「神岡 : 筱雲呂玉慶堂典藏古文書集」,南投市︰國史館臺灣 文獻館,2007 年。
[9] 中研院歷史語言研究所,「傅斯年圖書館珍藏圖籍全文影像資料庫」,
http://lib.ihp.sinica.edu.tw/,檢索日期 2009 年 5 月 11 日。
[10] 臺中縣立文化中心,「古文書藏品展示」網站,
http://www.tchcc.gov.tw/histbook/,檢索日期 2009 年 5 月 3 日。
[11] 臺中縣立文化中心,「台灣中部平埔族古文書數位典藏」網站,
http://ca.tchcc.gov.tw/pingpu/,檢索日期 2009 年 5 月 3 日。
[12] 臺灣大學圖書館,「臺灣大學典藏數位化計劃」網站,
http://www.darc.ntu.edu.tw,檢索日期 2009 年 5 月 3 日。
[13] 臺灣大學數位典藏研究發展中心、臺灣大學數位典藏與自動推論實驗室,
「台灣歷史數位圖書館」,http://thdl.ntu.edu.tw/,檢索日期 2009 年 5 月 3 日。
[14] 臺灣大學數位典藏研究發展中心,http://www.digital.ntu.edu.tw/,檢索日期 2009 年 5 月 3 日。
[15] 臺灣大學數位典藏與自動推論實驗室,http://turing.csie.ntu.edu.tw/,檢索日 期2009 年 5 月 3 日。
[16] 盧家慶,「台灣古契書自動分類與依分類定義契書角色」,臺灣大學資訊工 程學研究所碩士論文,2008 年。
[17] 李文良,「土地行政與契約文書 --- 臺灣總督府檔案抄存契約文書解題」,
臺灣史研究,第十一卷第二期,中央研究院臺灣史研究所,2004 年,頁 223-242。
[18] 張尚斌,「詞夾子演算法在專有名詞辨識上的應用 -以歷史文件為例」,臺 灣大學資訊工程學研究所碩士論文,2007 年。
附錄:重建契書關係列表
以下列出本研究所找到的上下手契 2409 對、原契與契尾 92 對、鬮分契多份 878 組、契書內容相同 531 組。下列每一對及每一組關係前的號碼為依檔名排序 的流水號,上下手契為兩兩一對,格式為(上手契檔名,下手契檔名),原契與契尾 為兩兩一對,格式為(原契檔名,契尾檔名),鬮分契多份為二件以上的契書為一 組,格式為(契書檔名 1,契書檔名 2,……),表示契書檔名 1,契書檔名 2,……等契 書有鬮分契多份的關係,契書內容相同為二件以上的契書為一組,格式為(契書 檔名1,契書檔名 2,……),表示契書檔名 1,契書檔名 2,……等契書有契書內容相 同的關係,可利用契書檔名在THDL 的檢索系統中找到該件契書。