• 沒有找到結果。

第五章 結論與建議

第三節 後續研究建議

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

142

長學習;對使用者有利點在於能針對機構提供的數位化物件影像隨意挑選自己所 需的研究素材,透過自行辨識並直接比對物件影像內容,除了可以便於建置自身 研究電子檔外,也能提供機構經研究者整理過的全文資料,將古籍物件內容資訊 發揮到最大效益。雖然中國哲學書電子化計畫採內容完全公開的方式,會讓典藏 機構有所卻步,但機構在人力預算有所限制的情況下,可考慮朝這種運作模式去 進行典藏數位全文化。

第三節 後續研究建議

本研究以準實驗研究操作與深度半結構式訪談並行的方式進行研究探討,發 現機構對於數位典藏全文化計畫執行的經驗看法,以及對於 OCR 辨識應用的認 知觀點與未來可能性。綜合本研究的結果發現,提出可作為未來甚至接續研究方 向的議題參考。

壹、 制定周全的全文資料庫建置計畫作業流程之研究

針對全文資料庫建置計畫需擬定周全的作業流程,內容應包含各階段流程步 驟、注意與考量因素以及標準化建立,試圖建立一套標準化的作業流程,提供給 未來想要實行數位典藏全文化的機構參考方針。就目前狀況分析,由於全文資料 庫的建置需要大規模經費預算,且尚未有套完整的作業流程工作守則提供參考,

也因此限制住全文資料庫的發展,如果能建置標準化的作業流程,不僅能替機構 節省初步階段所可能耗費的成本,也能興起各機構對於將自身典藏建置數位化全 文的動機,對於日後不管是學術研究或者知識推廣流通都是有益的。

貳、 OCR 辨識精確率提升之研究

這部份需要由資訊相關背景的人去著手研究,綜合訪談內容,可瞭解 OCR 技術越來越成熟,以往對於辨識妨礙的因素都有解決的方法,因此未來應朝向如 何將 OCR 系統調整轉變成自動調整的方向去進行研究。古籍物件影像辨識率會

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

143

無法提升,主要是因為古籍版面形式多樣、刻印字體風格多元等情形,對於字體 的差異以特徵值儲存進行處理已將影響降到最低,但對於版面形式的差異仍需要 技術人員進行系統調校,才能產生出精確的辨識文稿。未來可針對物件版式調校 過程所產生的變動數據,也儲存成資料庫的形式,以便日後要辨識相似版式物件 時可以自動化進行系統調校。

參、 機構典藏古籍物件版面格式之研究

由於古籍版面格式差異會造成辨識處理的負擔,技術人員進行辨識作業前需 要針對物件影像模式進行系統調校,如果機構能針對相似版式物件同時交付技術 人員處理,不僅能加速數位典藏全文化的流程,也能增加廠商作業的效率。針對 古籍版面格式除了機構人員要進行詮釋資料的著錄外,也需要有相關人員針對不 同機構所典藏古籍之版式樣態進行研究分析,瞭解機構典藏古籍的版式種類樣態、

數量類型等資訊,可提供機構進行數位化全文處理時,能有進行物件分配處理的 參考依據。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

144

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

145

參考文獻

壹、 中文部份

中央研究院歷史語言研究所(2016)。漢籍電子文獻資料庫。檢自:

http://hanchi.ihp.sinica.edu.tw/ihp/hanji.htm

中央研究院歷史語言研究所籌備處(1928)。歷史語言研究所工作之旨趣。中央 研究院歷史語言研究所集刊,1(1),3-10。

中國哲學書電子化計畫(2017)。本站介紹。檢自:http://ctext.org/zh

中華電子佛典協會(2005)。佛典數位典藏內容開發之研究與建構—數位化工作 流程簡介。檢自: https://www.cbeta.org/download/D1135218308.pdf

中華電子佛典協會(2016)。CBETA 緣起。檢自:http://www.cbeta.org/intro/origin.php 王成勉(2001)。從張岱文集看明代文史的互通。載於中國明代研究學會(主編),

明人文集與明代研究(249-270 頁)。臺北市:明代學會。

王春瑜(2001)。明人文集的人文傳統。載於中國明代研究學會(主編),明人 文集與明代研究(377-387 頁)。臺北市:明代學會。

王寧、張普、石定果、形紅兵、崔永華、柴鴻斌、陳一凡、宋利強、陳民、韓秀 娟、裴立杰(2009)。現代常用字部件及部件名稱規範。中華人民共和國教 育部:國家語言文字工作委員會。

北京書同文電腦技術開發有限責任公司(2016)。四部叢刊電子版。檢自:

http://www.unihan.com.cn/product/sbck/

吉常宏(1994)。中國人的名字別號。臺北市:臺灣商務。

余崇生(2013)。張岱人物小品的書寫特色。載於余崇生(主編),閱讀明清:明 清文學的文化探索(3-14 頁)。臺北市:萬卷樓。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

146

余顯強(2005)。北平「世界日報」:民初歷史性新聞報紙數位化之研究。圖書 與資訊學刊,54,84-95。

吳士朋(2001)。從《袁中郎全集》看公安派文學運動。載於中國明代研究學會

(主編),明人文集與明代研究(233-248 頁)。臺北市:明代學會。

吳明德、黃文琪、陳世娟(2006)。人文學者使用中文古籍全文資料庫之研究。

圖書資訊學刊,4(1/2),1-15。

吳政上(2004 年 12 月)。漢學研究資源的「再發現」:中央研究院歷史語言研究 所珍藏歷史文物數位典藏計畫。「數位時代漢學研究資源國際研討會」發表 之論文,國家圖書館國際會議廳。

吳振漢(2001)。明代後期舉貢出身文官之仕途。載於中國明代研究學會(主編),

明人文集與明代研究(317-338 頁)。臺北市:明代學會。

吳格(2001)。《明人文集篇目索引數據庫》編製芻議。載於中國明代研究學會(主 編),明人文集與明代研究(407-422 頁)。臺北市:明代學會。

吳智和(2001)。明人文集中的生活史料—以居家休閒生活為例。載於中國明代 研究學會(主編),明人文集與明代研究(135-166 頁)。臺北市:明代學 會。

吳量愷(2001)。《張居正集》與明朝中晚期社會異變。載於中國明代研究學會(主 編),明人文集與明代研究(103-120 頁)。臺北市:明代學會。

吳璧雍、許媛婷(2006)。故宮善本古籍的典藏特色及其數位化發展概況。大學 圖書館,10(2),34-49。

呂信德、溫敏淦、范國清、林志瑋(2009)。相機取像的影像文字截取與切割。

聯大學報,6(2),369-397。

宋建成(2004)。中華百科全書:四部叢刊。檢自:

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

147

http://ap6.pccu.edu.tw/Encyclopedia_media/main-all.asp?id=9743

李佩瑛、程婉如(2009)。期刊報紙數位化工作流程指南。臺北市:數位典藏拓 展台灣數位典藏計畫。

李宜容(1998)。人文及社會學科讀者使用線上公用目錄檢索詞彙之研究。大學 圖書館,2(3),72-104。

李清志(1985)。明代中葉以後版刻特徵。載於吳哲夫(主編),古籍鑑定與維護 研習會專集(96-121 頁)。臺北市:中國圖書館學會。

李焯然(2001)。丘濬及其《瓊台類稿》。載於中國明代研究學會(主編),明人 文集與明代研究(69-86 頁)。臺北市:明代學會。

周駿富(1985)。明代前期版刻特徵。載於吳哲夫(主編),古籍鑑定與維護研習 會專集(83-95 頁)。臺北市:中國圖書館學會。

林妙樺(2004 年 12 月)。古籍導入數位學習之模式初探。「數位時代漢學研究資 源國際研討會」發表之論文,國家圖書館國際會議廳。

邱皓政(2006)。量化研究與統計分析 : SPSS 中文視窗版資料分析範例解析。

臺北市:五南。

凃金堂(2010)。SPSS 與量化硏究。臺北市:五南。

南炳文(2001)。《萬曆起居注》、《明神宗實錄》和《李文節集》中的李延機內閣 奏疏。載於中國明代研究學會(主編),明人文集與明代研究(29-50 頁)。

臺北市:明代學會。

迪志文化出版有限公司(2006)。建庫過程。檢自:

http://www.sikuquanshu.com/project/main.aspx 國立故宮博物院(2016)。善本古籍資料庫。檢自:

http://npmhost.npm.gov.tw/tts/npmmeta/RB/RB.html

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

148

國家圖書館(2016a)。明人文集聯合目錄與篇目索引資料庫。檢自:

http://nclcc.ncl.edu.tw/ttsweb/top_02.htm

國家圖書館(2016b)。館藏特色。檢自:http://www.ncl.edu.tw/content_53.html 國家圖書館(2016c)。古籍與特藏文獻資源。檢自:http://rbook2.ncl.edu.tw/

崔文印(2009)。古籍常識叢談。北京:中華書局。

張俊盛、陳舜德(1995)。雜訊通道模型在 OCR 後處理之應用。影像與識別,3(3) , 98-109。

張圍東(2009),國家圖書館古籍文獻國際合作數位典藏計畫:以美國國會圖書 館為例。臺灣圖書館管理季刊,5(4),99-110。

張璉(2001)。現存明人文集的特色與《明人文集聯合目錄與篇目索引資料庫》

建置概述。載於中國明代研究學會(主編),明人文集與明代研究(423-430 頁)。臺北市:明代學會。

張顯清(2001)。要重視明清之際人士文集的研究和整理——以孫奇逢文集為例。

載於中國明代研究學會(主編),明人文集與明代研究(1-12 頁)。臺北市:

明代學會。

莊德明、鄧賢瑛(2009)。漢字構形資料庫的研發與應用。檢自:

http://cdp.sinica.edu.tw/service/documents/T090904.pdf 陳宏天(1992)。古籍版本概要。臺北市:洪葉文化出版。

陳秀慧(2000)。館藏數位化的程序及其問題。圖書與資訊學刊,33,66-80。

陳和琴(2001)。Metadata 與數位典藏之研討。大學圖書館,5(2),2-11。

陳金木(2008)。電子全文資料庫與學術研究—以《四部叢刊電子全文檢索版》

為例。明道通識論叢,5,122-135。

陳建安、江昭德、王俊雄、江宏昇(2015)。商港 RFID 自動管制應用與優化。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

149

電信研究,45(6),13-22。

陳梧桐(2001)。明人文集的史學價值。載於中國明代研究學會(主編),明人 文集與明代研究(387-406 頁)。臺北市:明代學會。

陳碧月(2013)。風姿綽約的「明清小品」。載於余崇生(主編),閱讀明清:明 清文學的文化探索(15-28 頁)。臺北市:萬卷樓。

陳寶良(2001)。明人文集之學政史料及其價值。載於中國明代研究學會(主編),

明人文集與明代研究(339-358 頁)。臺北市:明代學會。

曾元顯(2004)。應用於資訊檢索的中文 OCR 錯誤詞彙自動更正。中國圖書館 學會會報,72,23-31。

曾逸鴻、林裕淵(2007)。中文文件影像中之特殊字體偵測。科學與工程技術期 刊,3(4),29-39。

華通資訊(2016)。Info Receipt OCR 華通信用卡簽單辨識系統。檢自:

http://www.infoacer.com.tw/software/ReceiptOCR.aspx

項潔、陳雪華、鄭惇方(2002)。數位典藏之產業前景探討。經濟部技術處學界 科專非技術領域學術研討會論文集,435-446。

黃永年(2005)。古籍版本學。南京:江蘇教育出版社。

黃沛榮(2009)。漢字教學的理論與實踐。臺北市:樂學。

黃桂蘭(2001)。論張岱小品文的雅趣與諧趣。載於中國明代研究學會(主編),

明人文集與明代研究(271-288 頁)。臺北市:明代學會。

楊美莉、劉芳如、劉錚雲(2004 年 12 月)。迎向數位時代—國立故宮博物院珍

楊美莉、劉芳如、劉錚雲(2004 年 12 月)。迎向數位時代—國立故宮博物院珍