Chapter 3 時間標記
3.3 日期處理
因此只需要按照上面兩個條件去抓取日期。若本篇沒有日期,則代表此篇文
又如以下例子,一篇有多個日期,觀察後發現此三個天干地支雖然都是日期,
但只有辛末為該篇發生日期。後方兩個天干地支「壬子」和「丁卯」皆是未來發 生的事件,紀錄於此。故此篇日期只可取「辛末」。這類型的的文件共有七十六件。
將這有問題的共篇文件人工閱覽,確認是否為日期、或標示錯誤。最後於清 實錄中共有89372 篇有明顯日期資訊。
3.3.2 中西曆轉換程式
圖 3-5. 中西曆轉換對照查詢系統畫面
使用對照資料為臺灣歷史數位博物館(THDL)中的「中西曆轉換對照查詢」工 具。其資料橫跨時間維明洪武元年(1368)~清宣統三年(1912)。利用此資料可 以比對出西元年月日。
太宗文皇帝實錄,卷六十五,天聰八年八月
辛未。諸王大臣等、迎梓宮、奉安於崇政殿。九月。壬子。葬昭陵。十月。丁 卯。上尊諡曰。應天興國弘德彰武寬溫仁聖睿孝文皇帝。廟號太宗。康熙元年。
加上尊諡曰。應天興國弘德彰武寬溫仁聖睿孝隆道顯功文皇帝。雍正元年。加 上尊諡曰。應天興國弘德彰武寬溫仁聖睿孝敬敏隆道顯功文皇帝。乾隆元年。
加上尊諡曰。應天興國弘德彰武寬溫仁聖睿孝敬敏昭定隆道顯功文皇帝。
3.3.3 直接比對
我們目前已經擁有年份、月份、以及日期的天干地支。透過中西曆轉換程式。
直接對應相同的年月日期以及是否是閏月。共直接對應到 88864 篇年代、月份、
以及日期都相符合。
3.3.4 資料校正比對
約剩一千三百多件資料,明明有明確日期資料,卻沒有對應到相對應的西元 年月日。將這一千多筆拿出來看。大致上會有三個問題。
z 帝號不一致問題
如圖 3-6 所示,於「穆宗皇帝實錄」中,其前十四卷為「咸豐十一年七月至十 二月」。然而於中西曆轉換程式中,並沒有咸豐十一年七月至十一月的西元年月 日,而是以「祺祥元年七月至十二月」。
穆宗即位首年國號為「祺祥」,而並非「同治」,於清實錄中更未曾見過此國號。
而以咸豐十一年代替。筆者推測,由於穆宗上位半年以後,慈禧太后垂簾聽政,
故改帝號為「同治」,而慈禧太后攝政直至光緒,故於編穆宗實錄的時候,未編錄
「祺祥元年」,而改以「咸豐十一年」稱之。
於資料處理上並無困難,便將咸豐十一年轉成祺祥元年重新比對,就可以對 應到正確的西元年月日。
圖 3-6. 穆宗實錄(一)目錄頁 z 閏月問題
於數位化版本的清實錄中,會紀錄是否為閏月。然而由於打字樣式不一,或 數位化工作者的遺漏。會偶爾未於閏月中輸入其為閏月。也因此於中西曆對應中 會有錯誤。
撰寫程式過程中,若此篇日期沒有對到,若原本寫是「閏月」則嘗試看看「非 閏月」重新比對。相對的,若未寫「閏月」,則嘗試以「閏月」重新比對。將轉換 過閏月狀態的文章人工看過,並比過文章。尤其閏月是連續的兩個月,兩個月的 天數數量不會超過六十,故不用擔心日期天干地支重複的問題。
z 乙己巳問題
於打字過程中,最容易出錯的問題就是「乙己巳」問題,尤其清實錄中此三 字字形過於相似,因此打字時候經常出現錯誤。利用同樣的方法,將這些文字的 首字代換。若原本是「乙」,則代換成「己」重新對應。若原本是「己」,則代換 成「乙」。而「巳」則代換成「乙」或「巳」。將對應到的部分,人工觀看,確認 其上下篇西元年月日期,與此篇代換後日期是逐序的,才做更改。共成功額外對 應到466 篇屬於「乙己巳」問題的文件。
3.3.5 人工日期校正
上一篇日期為17940325,而此篇文件為 17940316。故必須挑出來並翻閱紙本確認,發現原來上篇日期於數位化過程中打字錯誤。應該為「壬戌」而非打字的「壬戊」
清實錄中共出現了61 次順序問題,我們逐一翻閱清實錄確認修改。但仍
圖 3-7. 清實錄紙本錯誤實例(1/2)
圖 3-8. 清實錄紙本錯誤實例(2/2)
清實錄錯誤日期校正,於附錄三有更詳細的全文資料。
書籍 頁數 清實錄原文 正確應修改
1 高宗純皇帝實錄(五) 257-2 甲子 壬子 2 高宗純皇帝實錄(六) 385-1 丙午 丙戌 3 高宗純皇帝實錄(六) 389-2 辛酉 辛丑 4 高宗純皇帝實錄(十九) 251-1 丁未 己未 5 高宗純皇帝實錄(十九) 312-2 己巳 己丑 6 仁宗睿皇帝實錄(五) 34-1 壬申 丙申 7 文宗顯皇帝實錄(五) 161-2 丙午 丙申 8 文宗顯皇帝實錄(五) 1080-2 庚子 庚午 9 穆宗毅皇帝實錄(五) 215-2 辛酉 辛丑 10 穆宗毅皇帝實錄(六) 839-2 癸酉 癸丑 11 穆宗毅皇帝實錄(六) 1054-2 己卯 乙卯 12 穆宗毅皇帝實錄(七) 120-1 丙子 丙午