• 沒有找到結果。

佛學數位資源的建置與開展

N/A
N/A
Protected

Academic year: 2022

Share "佛學數位資源的建置與開展"

Copied!
64
0
0

加載中.... (立即查看全文)

全文

(1)

ISSN: 1996-8000

佛學數位資源的建置與開展 *

杜正民 法鼓佛教學院教授

摘要

近年來台灣所建置的「數位佛學資源」頗獲國際好評,然由於數位化作業 繁複,成果內容豐富,延展輔助應用計畫也不少,一般使用者難以深入瞭解,

以致無法充分運用相關資源進行研究。深感對這些資源作有系統有組織的整 理,是有其必要性與急迫性,因此筆者不揣簡陋,首度就台灣近年來佛學數位 資源的建置作業沿革,以及整體內容作歸納與分類,以期提供可茲運用的資 源。

首先,於文中回顧電子佛典的發展與沿革,依中華電子佛典協會的數位化 作業內容與型式,建構「電子佛典集成」數位化作業三大分期:第一期為數位 化鉛印本、第二期為數位化刊刻本、第三期為數位化寫本與古籍善本。並從各 分期的收錄方針、數位內容特色,以及經文質量,說明其建置成果,藉此讓學 者瞭解電子佛典集成的內容、特色與可應用的數位文獻。

其次,為方便讀者使用,本文將與電子佛典同期進行的各項「佛典數位專 案」,依計畫內容與發展歸屬分為:經典研究、數位經錄、詞彙研究、時空資 訊、社會網絡與整合服務等六大類,藉此分類探討所延伸的電子佛典相關研究 與應用、所開展的佛典數位化相關輔助應用、所提供的強化佛典數位服務功能 等。期能以此掌握佛典數位資源的整體作業與發展現況,提供學界可運用的資 源與方法。

文末,承續藏經數位化的兩大主題,以「電子佛典集成的時代意義」與

* 收稿日期:2012/02/06,通過審核日期:2012/04/26。

(2)

「佛典數位專案的永續發展」,總明台灣當代佛學數位資源建置與發展案例,綜 評漢籍佛典相關數位專案成果,以及檢討未竟之功。最後,以「整合型佛典數 位知識資產」探討佛典數位專案發展的可能作結語。

【目次】

一、前言

二、「電子佛典集成」發展歷程 (一)CBETA 宗旨與理念 (二)CBETA 數位化分期 三、「電子佛典集成」建置成果 (一)集成收錄方針

(二)數位內容特色 (三)經文質量成果

四、「佛典數位專案」輔助應用 (一)「經典研究」(Text Study)

(二)「數位經錄」(Catalogue)

(三)「詞彙研究」(Lexicon)

(四)「時空資訊」(Time-Space)

(五)「社會網絡」(Social Network)

(六)「整合服務」(i-Service)

五、佛學數位資源的時代意義與挑戰 (一)電子佛典集成的時代挑戰 (二)佛典數位專案的永續發展

六、結語──整合型佛典數位「知識資產」

關鍵詞:電子佛典集成、佛典數位專案、佛學數位資源、藏經目錄、

CBETA

(3)

一、前言

中華電子佛典協會(Chinese Buddhist Electronic Text Association,以下簡 稱 CBETA),成立至今已歷十多年,盡可能搜覽歷代漢文佛典文獻,搭配各項 應用專案計畫,完備地建置當代數位資料,成果頗受國際肯定,並讚譽為近代

「數位佛學資源」(Buddhist Digital Resources)的建置範例。然由於數位化作業 繁複,成果內容豐富,延展輔助應用計畫也不少,如非專門從事此項作業之人 士,難以深入瞭解,以致無法充分運用相關數位資源進行研究,甚為可惜。深 感對這些資源作有系統有組織的整理,是有其必要性與急迫性,因此筆者不揣 簡陋,擬拋磚引玉,首度就台灣近年來佛學數位資源的建置作業,作一整體回 顧與分類。

首先,回顧十多年來 CBETA 佛典數位化作業經驗,藉由數位化發展歷程 的脈絡,說明 CBETA 以「電子佛典集成」(Electronic Tripiṭaka Collection)為 標的所進行的數位化作業與內容,並對佛典數位化作業進行判別與分期,詳明 發展過程與沿革,以及對歷代多種版本處理技術之挑戰與突破等。掌握電子佛 典的建置成果,讓學者瞭解電子佛典集成的內容、特色與可應用的資源,以便 靈活運用電子佛典。

進而,將同時期所研發的「佛典數位專案」(Buddhist Digital Projects),依 其內容屬性分類,鳥瞰發展至今的佛典數位資源內涵,以作為教學與研究輔助 之用。再依所判別的分類,個別探討延伸的電子佛典相關研究與應用、開展的 佛典數位化相關輔助應用、提供的強化佛典數位服務功能等。期能以此分類,

掌握佛典數位資源的整體作業與發展現況,提供學界可運用的資源與方法。

接著,就數位化作業的建置、發展與內容,所提供當代佛學數位資源的服 務功能,作為國際數位佛學資源整合協作的基礎平台。最後,則討論佛學數位 資源的時代意義,以及思考整合型佛教數位資源的未來發展。

簡言之,本文除對台灣發展至今的佛學數位資源作一有系統的整理,分判 類別;也對此時期的數位作業與內容作一有組織的回顧,展望未來。是以,以 下擬就台灣近年來建置的「佛學數位資源」(Resources),以「電子佛典集成」

(4)

(Collection)及「佛典數位專案」(Projects)兩大主題作説明。1

二、「電子佛典集成」發展歷程

首先,就 CBETA 成立以來,所進行的「電子佛典集成」成果與發展歷 程,做一整體性的回顧與整理。2

(一)CBETA 宗旨與理念

中華電子佛典協會CBETA 成立於 1998 年,以「收集所有的漢文佛典,以 建立電子佛典集成;研發佛典電子化技術,提昇佛典交流與應用;利用電子媒 體之特性,以利佛典保存與流通;期望讓任何想要閱藏的人都有機會如願以 償。」為宗旨,3 是一非營利性機構,長年持續大規模漢文大藏經全文輸入與 數位化作業,以資源整合分享為前題,近年來透過數位典藏,建立台灣數位佛 典資源,並與學校、圖書館協同合作,將數位佛典資源免費公開大眾使用,讓 現代讀者擁有更便捷、更人性化的互動介面閱讀藏經,也讓全世界的佛學研究 者,獲取佛典版本的學術資訊,以上為該機構的中心理念。

1 本文部分資料係根據筆者近年參與執行的國科會計畫 NSC 99-2631-H-655-001、99- 2631-H-655-002 以及 100-2631-H-655-001 等成果整理而成,並於 2011 年 3 月在美 國亞利桑那大學(The University of Arizona)舉辦的 Spreading Buddha’s Words in China: The Formation and Transformation of the Chinese Buddhist Canon 國際會議口 頭發表,見http://w3.coh.arizona.edu/canonconference/。

2 CBETA 作業內容,應可大分為「數位內容」(Content)與「技術發展」(Tech.)

兩部分。本文以佛典內容為重點,因此除與主題有關之外,不擬於此描述太多技 術 性 問 題 , 以 聚 焦 本 文 主 軸 。 相 關 資 料 可 參 考 CBETA 技 術 網 頁 http://www.cbeta.org/tech/index.htm。或杜正民,〈佛學研究資源數位化作業標準 與規範〉(“Standards of the Digitalized Buddhist Research Resource Project”),

《漢學研究通訊》96,頁 7-16。

3 參考CBETA 網頁,http://www.cbeta.org/intro/index.php。

(5)

(二)CBETA 數位化分期

漢文佛典不但記錄與反映中國佛教的發展,同時也記載中國文明變遷痕 跡。依方廣錩的研究專書中提出大藏經隨著佛教內外因素,其「內容、結構、

祑號都在不斷地演化」,主張應依據漢文大藏經「載體與製作方式的不同,將 至今為止大藏經的發展分為四個時期:寫本時期、刻本時期、近現代印刷本時 期與數碼化時期」,並提出大藏經的分期標準與定義說明。4

反觀電子佛典的數位化歷程,十多年來所進行的「CBETA 電子佛典集成」

(以下簡稱「CBETA 集成」)數位化作業,正好與方廣錩所提的大藏經的分期 脈絡反方向進行──本文依據 CBETA 的成立宗旨、技術標準、數位內容特 性,以及多種版本數位處理的技術突破與所面臨的挑戰等因素,建構出電子佛 典的作業分期:第一期為數位化鉛印本佛典集成,第二期數位化刊刻本暨藏外 文獻,第三期為數位化寫本與古籍善本。而此分期,正也是 CBETA 藏經數位 化作業的發展史,為了讓學界瞭解「CBETA 集成」的內涵,茲將此三個時 期,分別說明如下:

1. 第一期 數位化鉛印本佛典集成

CBETA 從 1998 年到 2007 年,先後完成了《大正新脩大藏經》(以下簡稱

《大正藏》)及《卍新纂續藏經》(以下簡稱《卍續藏》)兩套當代學界較常使用 的佛教藏經數位化作業 ,包括《大正藏》本文及校勘,以及《卍續藏》本文 及校注。

上述 CBETA 的初期作業,以《大正藏》與《卍續藏》兩套鉛印本為底 本,5 進行數位化作業。建構出總字數超過 1 億 5 千萬字的漢文佛典資料庫,

文字正確度高,且全部以符合 TEI 標準的 XML 語言標記,6 10 多年已成為學

4 參方廣錩,《中國寫本大藏經研究》(上海:上海古籍出版社,2006),頁 11- 13。

5 雖然近代製版格式有多種,如照相排版,影印複製等之不同,但因為其原始格式 皆是以鉛字排版印刷,故一律統稱為鉛印本。

6 有關TEI 標準與 XML 語言標記等相關技術問題,可參考杜正民,〈漢文佛典電子 化 ──CBETA 2001 年 採 用 的 技 術 、 標 準 暨 解 決 方 案 〉 ( “The Digitization of

(6)

界、佛教界重要的研修工具。

在 CBETA 進行《卍續藏》數位化作業的同時,為了能順利進行下一期的 作業,於 2005-2007 年間也開始進行「經錄數位化專案(NSC 96-2422-H-655- 001)」作業,共整合 22 部藏經目錄、21 種古經錄。經錄數位化的完成,不但 可作為後期作業的基礎,也朝「佛典集成」的目標前進一大步。7

CBETA 除了每年將成果置於網站上提供下載,同時也將經文資料及讀經 軟體工具(CBReader)製成光碟供人索取,平均每年至少有一萬份的光碟發 行量,這些完全都是無償免費提供。由於前 10 年所完成的資料大部分已整理 發表,故僅此簡說CBETA 的佛典數位化內容與歷程。8

2. 第二期 數位化刊刻本暨藏外文獻

立基於前期「經錄數位化專案」所完成的歷代藏經目錄成果,開始規劃新 一期的歷代藏經補輯作業,2008 年起由法鼓佛教學院(以下簡稱 DDBC)申 請國科會數位典藏國家型科技計畫補助,與 CBETA 共同執行「台北版電子佛 典集成」專案,9 繼續佛典集成作業。CBETA 發展至此階段,基礎佛典文獻數 位化建置已大致完成,蒐集內容也較完整。

Chinese Buddhist Text -- the Technologies and Standards Applied and the Problems Solved by CBETA [Chinese Buddhist Electronic Text Association] in the Year of 2001”),《第四屆中華國際佛學會議──佛教與廿一世紀》(The Fourth Chung Hwa International Conference on Buddhism: The Role of Buddhism in the 21st Century , 台 北 : 法 鼓 文 化 , 2005 ) , 頁 471-492 。 或 http://www.cbeta.org/tech/develop.htm。

7 「經錄數位化專案」詳見本文第四章說明,或請參考杜正民,〈佛學數位資源的 服務功能──以藏經目錄資料庫的建置為例〉,《法鼓佛學學報》6,頁 115-183

(全文http://www.ddbc.edu.tw/zh/downloads/download_document.html?gid=2206)。

杜正民,〈數位經錄與時空資訊的交會〉,《大藏經的整理、保護與研究》(北 京:世界佛教論壇籌備辦公室),頁183-203。

8 有關CBETA 前 10 年的資料,詳閱「CBETA 十週年紀念專輯」,http://www.cbeta.

org/data/cbeta10y/。

9 可參考國科會「台北版電子佛典集成」(NSC 96-2422-H-119-001、97-2631-H-655- 002 與 98-2631-H-655-002),專案網址:http://taipei.ddbc.edu.tw/index.php;國家 型科技計畫網站,TELDAP 數位典藏與數位學習成果,http://digitalarchives.tw/。

(7)

因此按照CBETA 電子佛典集成的方向,規劃 CBETA 收錄經文的四步驟暨 四目標:(一)完成《大正藏》與《卍續藏》漢文佛教典籍──以此作為基 礎。(二)補輯現存歷代藏經經文──完整呈現歷代藏經。(三)新編當代文獻 及藏外文獻──超越古德的整理。(四)若有餘力,再進行寫本及其他形式經 文之數位化。

於完成第一步《大正藏》與《卍續藏》的建置基礎,以下就本分期所進行 的歷代藏經經文補輯作業內容,逐步說明。

(1)啟動補輯作業──《嘉興藏》

2008 年初所發表的成果,是以 CBETA 2007 年的進度為基礎,這一年,除 了完成《卍續藏》校注的上述第一項步驟與目標。也開始進行第二項目標──

參考「藏經目錄」成果,以未收錄在《大正藏》、《卍續藏》的「歷代藏經」經 文的補輯作業為主。

在補輯現存「歷代藏經」經文首期,CBETA 以刊刻本《嘉興藏》的數位 化作業為重心,這是因為在《大正藏》與《卍續藏》尚未收錄的典籍,大都集 中在《嘉興藏》,且當中有豐富的明清禪宗史料,最為學界所企盼,因此此期 的數位化重點為《嘉興藏》。

2008 年的規劃,係依據所查照的歷代經錄成果,初步查核《大正藏》、

《卍續藏》以外經文,收錄《嘉興藏》約有 287 部經 1490 卷,及其它各版藏經 80 部經 1008 卷。

(2)加入藏外文獻──《藏外佛教文獻》與《正史佛教資料彙編》

2009 年發表的成果,是以 2008 年度 CBETA 佛典集成作業結果為主要內 容。這一年,CBETA 著力於上述的第二及第三項目標──以補足現存歷代藏 經經文,與進行當代新編及藏外文獻的集成方向前進。因此,除了現存藏經的 補輯之外,近代學者所整理的藏外文獻,以及許多相關佛學資料,也都是 CBETA 進行數位化的目標。

在「新編近代文獻及藏外文獻」方面,CBETA 取得杜斗城先生所編輯

《正史佛教資料彙編》(共 1 冊)以及方廣錩先生所編輯《藏外佛教文獻》(共

(8)

9 冊)的數位化授權,進行此兩項珍貴的文獻資料的數位內容建置。10

(3)進行拓本作業──《北朝佛教石刻拓片百品》

除了以完成刊刻本《嘉興藏》選輯為目標,同時並進行《北朝佛教石刻拓 片百品》(以下簡稱《百品》)的拓本數位化作業。《百品》數位化作業,是由 DDBC、CBETA 與中央研究院歷史語言研究所三方共同完成的合作案,於 2009 年 9 月開始,作業目標是將顏娟英教授主編的《北朝佛教石刻拓片百品》11 一書之釋文予以數位化。

《百品》全書 277 頁,共 100 品,文字數量雖少,但電腦文字編碼所缺的 文字卻多。對「CBETA 集成」來說,《百品》是很特殊的格式,要將之納入集 成,其經文格式、如何呈現、如何加入全文檢索,也是這一期的考驗與技術突 破。

隨著《百品》的加入,CBETA 在處理材料方面又有新的開展,也就是從

《大正藏》、《卍續藏》的鉛印本,經歷了《嘉興藏》的刻本,到《百品》的拓 本作業,豐富了缺字庫,在古籍數位化的經驗累積也越來越豐富。

(4)《嘉興藏》選輯完工

自 2008 年 3 月至 2009 年 9 月,CBETA 以 18 個月的時間完成了 285 部 1659 卷的《嘉興藏》選輯。再加上作業期間額外完成的《正史》一冊(10 卷)、《藏外》三輯(42 卷),則這 18 個月的平均數位內容產量為每月 95 卷。

進行至此,CBETA 確實體會到隨著所處理的典籍材料不同,所面臨的挑 戰難度也迥異。《嘉興藏》雖沒有校勘、註解,但刻本所形成的大量異體字、

模糊字在在都是全新的挑戰。

10 作業至此,已大致完成 CBETA 集成的體系,亦即「CBETA 電子佛典集成」古今 兩大部分的彙整──「歷代藏經補輯」(簡稱補輯)及「近代文獻新編」(簡稱 新編)。

11 顏娟英,《北朝佛教石刻拓片百品》(台北:中央研究院歷史語言研究所,

2008)。

(9)

(5)補輯歷代藏經──建構「CBETA 電子佛典集成」

經過多年的前置作業及2010 年的密集努力,CBETA 於 2011 年呈現的最新 成果為「歷代藏經補輯」。12 除舊有的內容外,新增的「歷代藏經補輯」,包 括《房山石經》、《趙城金藏》、《高麗藏》、《宋藏遺珍》、《洪武南藏》,共計有 100 部 972 卷。有關「CBETA 集成」藏經底本資料,請參考附錄一。

3. 第三期 數位化寫本與古籍善本

繼 2009 年與中研院史語所合作《北朝佛教石刻拓片百品》後,CBETA 接 著於 2010 年與 DDBC、台灣國家圖書館(以下簡稱 NCL)合作進行「台灣善 本古籍數位化之研究與建構──以國家圖書館善本佛典為主」專案。這項新的 合作案,為期兩年,目標是針對 NCL 所珍藏的善本佛典(包括刊本與寫本,

寫本中含敦煌文獻資料)進行數位升級,包括微卷轉製圖檔、電子全文、網路 連結等等。13 希望這些努力,可以讓 NCL 的特藏,廣為大眾所應用,同時也 能增益「CBETA 電子佛典集成」的內涵。

國家圖書館佛典善本數位化專案

國家圖書館善本古籍數位化專案,經過 2010 年底的收錄經目比對、作業 規劃與討論等細項後,大致規劃進行時程與步驟如下:

1. 第一年工作項目:

(1)著重於 CBETA 未收錄之刻本數位化:因刻本文字較寫本確定,較無 處理電腦缺字方面的問題,14 故第一年度優先處理。

12 所完成的「歷代藏經補輯」數位內容及詳細成果,請參考:http://taipei.ddbc.edu.

tw/finished.php。

13 國科會「台灣善本古籍數位化之研究與建構──以國家圖書館善本佛典為主」

(NSC 99-2631-H-655-002 及 100-2631-H-655-002)專案計畫。數位清單內容,請參 考國家圖書館善本數位化目錄網頁http://taipei.ddbc.edu.tw/ncl_list.php。

14 CBETA 處理電子佛典至 2008 年,除了電腦 Big5 系統原有的近 1 萬 4 千字之外,

又累積了約1 萬 7 千個電腦缺字。CBETA 並就這些在 Big5 系統之外的字,再查核 Unicode 的字碼,以進一步處理共享的資源。有關電腦缺字的處理,屬技術發展 部分,本文就不再詳加描述。

(10)

(2)CBETA 未收錄之寫本前置評估:以 CBETA 未收錄典籍為主,進行評 估作業,以決定後續的數位化作業和呈現模式。

(3)CBETA 已收錄且有圖檔的典籍,進行圖文連結,製作圖文連結表。

2. 第二年工作項目:

(1)進行 CBETA 未收錄之寫本數位化作業。

(2)CBETA 已收錄且有微卷的典籍,轉置黑白圖檔並加上圖文連結。

不同於目前學界只是按原圖檔進行掃描的數位整理方式,CBETA 電子佛 典的特色是不僅是掃描圖檔,同時還可以運用全文數位化資源,複製文字或按 引文功能以直接引用,再進行編寫和應用。

簡言之,回顧 CBETA 多年來佛典數位化經驗與研究成果,在數位內容建 構上,先以漢文大藏經的鉛印本與刻本為前二階段的數位標的物,繼而著手處 理佛教早期拓片文獻,隨著數位資訊技術的提升,加上佛典文獻的多樣性與豐 富性考量,第三期選擇以珍貴的台灣善本古籍佛典,作為主要的數位標的物,

其中包含珍貴的寫本資料,這些不同的格式,顯示出 CBETA 於多種版本處理 的挑戰。

三、「電子佛典集成」建置成果

前一章已就 CBETA 的三期數位化作業,大致介紹其內容與型態。本章將 探討近年來 CBETA 的作業成果,分為集成收錄方針、數位內容特色、經文質 量成果三項,詳述實質內涵。

(一)集成收錄方針

資訊時代的數位佛教文獻,可將浩瀚的佛典呈現別於古文獻不同的新的面 貌與功能,透過歷代所有佛經目錄的掌握,修正近代諸藏編目及勘行之缺失,

補歷代紙型編藏的不足,重新建構歷代以來版本最為完備、內容最為完整的佛 典藏經「電子佛典集成」為目標,成為藏經的總集成,故 CBETA 以集成作為 建置的方向。

(11)

佛典收錄的大原則為將尚未收錄的典籍盡可能補齊,已有收錄的典籍如在 其他版本還有重複者則不收錄。收錄的先後順序,先有《大正藏》、《續藏 經》,之後《嘉興藏》所收錄的典籍則為補足之前所未收的,繼而將歷代藏 經,諸如《高麗藏》、《趙城金藏》等典籍陸續收錄補齊,進行「歷代藏經補 輯」。

(二)數位內容特色

1. TEI 國際規範

電子佛典數位化資料建置的作業標準規範,是採用國際通用標準的 TEI

(Text Encoding and Interchange 文件編碼組織後設資料標誌集),這是針對電子 文獻所制定的標準「標記組」(Tag Set),因為這是一開放、集體發展的標誌標 準 , 適 用 於 所 有 時 期 、 任 何 語 言 的 文 本 , 透 過 XML ( eXtensible Markup Language)此一可延伸性的標誌語言,允許使用者自訂標記的語言,對於許多 交換資料標準的設計是有用的,且提供某種程度的互用性,對於產出的數位文 本將能保存久遠。15 且透過使用此國際標準標記,使 CBETA 製作的電子佛典 更便於國際間分享。

在完成標記後,並且語法檢查無誤之電子文字檔,即可轉出HTML 格式儲 存,並搭配適宜之「樣式表」(Style Sheets),即可於網頁上呈現出型式與內容 兼具的電子全文。

2. XML 標記語言

由於 XML 標記語言,具有普遍處理任何程式語言的特性,隨著標誌越豐 富,資訊表達越完整,是有助於文件的管理。在佛典電子化的過程中,如果僅 僅只是做文字的電子化,那便喪失了原來書本資料所擁有的許多寶貴資訊,例 如:經名、年代、作者、譯者、校勘等等。因此,CBETA 的佛典電子化工

15 參見魯.伯納等人編著,《TEI 使用指南──運用 TEI 處理中文文獻》(台北:數 位典藏與數位學習國家型科技計畫.拓展台灣數位典藏計畫,2009),頁 9-13。

(12)

作,使用 XML 標記技術,將這些寶貴的資訊記錄下來,以便後續進行更廣泛 的學術研究應用。

CBETA 目前已發行一套全新的 XML 版本,此為 CBETA 佛典電子化工程的 一個重大里程碑。為此發行,所有檔案均經仔細查驗,在確認合乎最新 TEI 指 南版本的狀況下予以更新,能讓每個單一字元與國際開放標準相符合,如此更 有利於進行文獻互換,並可由所有符合 XML 的工具加以處理。這樣的成果,

期望為未來佛典的標準標記有所貢獻,開創一個普及化與學術性兼容,且具標 準化的國際性漢文佛典資料庫。

3. 挑戰與突破

CBETA 多年來面臨許多的挑戰,而 CBETA 能一一的克服與突破,主要的 原因,是在於 CBETA 同仁們針對困難點的努力與多所測試,始能有所突破。

茲簡要舉例說明 CBETA 於各期中,因格式的不同,所遇到的問題也有不同的 處理方式。譬如,初期於《大正藏》鉛印本的錯誤問題、電腦缺字的挑戰、校 勘處理困難等作業,因為人力分工得當、輕重緩急分配得當,並能參照國際相 關作業的解決方案,以確立各種版本的經文格式的呈現方式、經文行首資訊的 建立方式、組字式的基本規範等,16 始能於期限內順利完成。

繼之,處理《卍續藏》的困難,則是因《卍續藏》紙本的發行早於《大正 藏》,17 因此有早期排版較簡陋的問題、完全沒有標點句讀、分段不清楚甚或 錯置、以及種種不同於《大正藏》格式的問題等,這些也多是經過 CBETA 多 次的嘗試失敗,努力解決始能作出符合格式的數位版本。進而,如何將之與

《大正藏》彙整為同一目錄以方便呈現,則需就藏經相關的經典部類作研究,

以進行分類處理。

16 有關經文格式、行首資訊與組字式等資訊,可參考http://www.cbeta.org/format/

index.php。

17 無論 1975 年台北新文豐的《卍續藏經》影印本,或東京國書刊行會於 1975-1989 發行的《卍新纂大日本續藏經》,皆是以 1905-1912 於京都藏經書院發行的《卍 大日本續藏經》為影印修訂稿,可知其印製時間是比東京大藏經刊行會於 1924- 1935 發行的《大正新脩大藏經》早,因此於排版技術或製版格式是有所不同。

(13)

後期進行的《嘉興藏》及「歷代藏經補輯」等刻本所形成的大量異體字、

模糊字,以及不同於鉛印本的刻本字型等,對 CBETA 而言,也都是全新的挑 戰。因此於作業上,首先必需建立 CBETA 電子佛典的異體字庫,以便作為查 詢佛典的工具,進而擴大為「漢字資料庫」18,以便管理及進行作業。同時,

也經過多次討論與測試,始將各種經文格式統合,將不同經文格式呈現,以及 將這些不同格式的經文加入全文檢索等作業上的挑戰。

近期,進行中的「拓本」及「寫本」也因為兩種版本格式的不同,所面臨 的挑戰也各有不同,目前也都在一一克服中。無論如何 CBETA 在種種的困難 與挑戰下,已突破過去紙本藏經勘行上的限制,呈現一種全新的漢文佛教藏經 數位化版本,顯示出 CBETA 於處理鉛印本、刻本、拓本及寫本等多種版本處 理技術上的能力。

(三)經文質量成果

十多年來 CBETA 除了在經文數量朝「佛典集成」邁進的同時,也致力於 提升經文內容的品質,包括「用字修訂」與「新式標點」。

於「用字修訂」方面,透過比對《大正藏》與《高麗藏》電子檔,以及歷 來讀者所提的勘誤意見,共處理 204625 個修訂。19 又,為改善古來藏經在斷 句、分段上的不足,CBETA 著手進行新式標點作業,並於 2006 年開始啟動

「新式標點」作業,至2010 年底已共完成 522 經 2203 卷。20

可知 CBETA 的佛典數位化作業,於質於量都盡量兼顧,因此這些年除了 完成上述佛典作業的「數量」之外,同時也致力於「品質」的提昇與改善,有

18 「CBETA 漢字資料庫」目前包含資料庫總筆數:41,450 字,有圖檔、CBETA 自行 編序的 CB 碼、組字式,以及 Big5 通用字,Unicode 通用字及異體字或異體字參 考用字等資料,檢索方式分有以字查字、以碼查字、以形查字、以音查字等方 法 , 以 查 詢 通 用 字 、 異 體 字 以 及 部 首 、 筆 畫 及 注 音 等 相 關 資 訊 , 詳 見 網 頁 http://dict.cbeta.org/。

19 經文用字修訂原則,可參考:http://www.cbeta.org/forum/index.php?topic=31.0。

20 新式標點相關訊息,可參考:http://www.cbeta.org/xb/index.htm。

(14)

關質量提升的作業事務,簡述如下:

1. 數量累積

首先,簡列1998 年至 2010 年底,CBETA 的數位化成果:

1998-2003:《大正藏》,2373 經、8982 卷。

2004-2007:《卍續藏》,1229 經、5060 卷。21 2008-2010 新增數位內容統計:

《嘉興藏》選輯 285 部 1659 卷 《正史佛教資料類編》 1 部 10 卷 《藏外佛教文獻》 77 部 136 卷 《北朝佛教石刻拓片百品》 1 部 100 卷 歷代藏經補輯 100 部 972 卷 ====================================

小計 464 部 2877 卷

累計上述經過數位化的電子佛典數量,CBETA 的漢文佛典集成已經收錄 4165 部 16,925 卷,計 176,253,000 個經文字數,上述數位成果彙整於 2011 年 4 月發行的「CBETA 電子佛典集成 Version 2011」光碟,有關收錄數量與收錄比 率等資訊,請詳附錄二CBETA 作業成果統計數據表。

2. 經文修訂

當讀者閱讀同一部典籍而在不同版本的藏經時,會發現同一區塊內文有用 字不同的情形,這是否算是錯字呢?由於歷代大藏經所依據的底本不一定相 同,若有傳抄差異及訛誤存留在底本上,將會形成版本差異,而且傳抄訛誤也 可能一直流傳於後世。儘管有很好質量的底本為依據,也執行過精密校對作 業,但在後續繁複的編輯作業程序中,難免也有疏漏的地方。由於中國文字語 彙的演變發展,在各朝代上、地域發展上,都是相當活潑的,因此,當閱讀某

21 2008 年之前的詳細成果,請參考網頁 http://www.cbeta.org/data/cbeta10y/cdhistory.

htm。

(15)

版本經文時,看到一個跟以往印象不同的字,其錯誤與否的判斷,是要經過一 番查證。22

在尊重底本及版本用字差異的前提下,對於 CBETA 經文用字修訂,依循 以下「三不、三要」原則概述:

「三不」原則:

通用文字不改:包括諸如異體字、古今字等類似性質的文字變化,在尊重 底本的前提下,都不隨意加以更改。

意思沒錯不改:儘管版本用字不同,但在前後文意思上皆可通,因此不 改。

證據不足不改:CBETA 完全依照《大正藏》等書上文字輸入經文咒語,

且書上一開始就有校勘,說明已下依《燉煌本》載之。除非親眼看到《大正 藏》等所採用的原稿,並且確認少印了咒語經文,則會予以修訂。或者有足夠 的證據可以肯定絕不能少咒語經文,則會予以修訂。

「三要」原則:

不符底本要改:屬於CBETA 輸入與底本不符所形成的錯誤,要改。

字義錯誤要改:可以明顯判斷是字義上的錯誤,卍續藏等書上錯印文字,

當作修訂。但CBETA 所做的修訂仍然保留了原書用字。在實際使用 CBETA 光 碟時,可設定以「修訂前用字」或「修訂後用字」或「同時顯示修訂前後的用 字」來閱讀。

別本更好要改:按照前後文,參考《大正藏》校勘所列示的其他版本如明 本、聖本用字,作更好的經文修訂。

上述「三不、三要」原則,是以嚴謹的考證基礎,盡力而為,也透過開放 的 CBETA 論壇,獲得讀者的回饋意見中,不斷補足改正。相較於傳統紙本印 刷品,電子佛典是「靈活」的,電子文本修改容易,且透過標記語言,更可以 隨時附加額外資料。因此,CBETA 電子佛典不僅在量的方面不斷擴增外,在

22 CBETA 對經文用字的修訂原則,請參考網頁 http://forum.cbeta.org/index.php?topic

=31.0。

(16)

質的方面也越臻於理想,這正是從事經文用字修訂的目的。23

CBETA 目前已收錄的漢文佛典除《大正藏》、《卍續藏》外,也已將歷代 藏經納入豐富的典藏內。同時,除了持續的輸入、校對、標記之外,透過比對

《大正藏》與《高麗藏》電子檔,經文用字的修訂工作也幾乎可以說不曾一日 間斷。

除了《大正藏》、《卍續藏》與《嘉興藏》的用字修訂外,同時還將集成中 各套典籍的用字進行修訂,將修訂成果呈現累積至2011 年 4 月份光碟。

3. 新式標點

為了幫助現代人理解古代文獻,開創讀者閱讀佛典新環境,同時也為改善 藏經在斷句、分段上的不足,所造成的 CBETA 作業困難,為進一步深化電子 佛典品質,因此 CBETA 從 2006 年開始進行句讀與新式標點(以下簡稱「新 標」)作業,包含重新分段,以期達成下列目標:24

(1)為佛典加上符合現代人閱讀習慣的新標,以通暢佛典文義,提昇佛典 閱讀能力。

(2)將新標佛典以程式轉回傳統句讀型式,對《大正藏》、《卍續藏》等句 讀不妥處,提供修訂參考。

且為了促進作業運作順暢,讓作業成果儘可能得到格式上的統一,制定藏 經新標格式規範,包括「CBETA 經文新式標點實務作業說明」以及「CBETA 經文新式標點符號略表」。

電子佛典的集成,不只是質與量上超越現有紙本的有限性,有便捷的檢索 功能,服務更廣大的使用者,此外,在內容上不只是一部大藏經,而是歷代藏 經的總集成,而為了要達成重新建構歷代以來最為完整的佛典藏經的目標,則 需要有統籌管理佛典的藏經目錄,做為最直接與方便的入口。

首先,此第一步工作,已在執行前一期「經錄數位化專案」時完成全面性 完整的數位佛典經錄資料庫,故本計畫以建構匯集所有藏經版本經目,修正現

23 感謝CBETA 總幹事吳寶原先生提供本資料。

24 請參考CBETA 新式標點專案,http://www.cbeta.org/xb/content.htm。

(17)

代台灣中華藏與大陸中華藏的編目及勘行之缺失,掌握所有藏經版本與經目資 訊。

四、「佛典數位專案」輔助應用

除了對 CBETA 的作業分期與內容質量瞭解之外,亦應讓使用者知道在同 期間,所發展的電子佛典相關研究與應用,以及發展的種種周邊專案計畫,始 能完整的掌握目前藏經數位化的發展現況。故接著,就與電子佛典同時期進行 的「佛典數位專案」作簡介。25

筆者多年來參與執行的各專案計畫,依內容與發展時期作歸屬與分類,以 便概要掌握專案與電子佛典的關係,故簡要將佛典相關的數位化計畫,依其性 質大分為六類:一「經典研究」(Text Study)、二「數位經錄」(Catalogue)、

三「詞彙研究」(Lexicon)、四「時空資訊」(Time-Space)、五「社會網絡」

(Social Network)、六「整合服務」(i-Service)。26

(一)「經典研究」(Text Study)

首先,擬以電子佛典與相關經典計畫與沿革,說明「經典研究」的發展與 內涵,今依簡介、內容及功能三項目分別說明,藉此瞭解其資料庫作用與功 能,分述如下:

25 由於各專案計畫內容都有相當的份量,無法於此一一詳細說明,但為了能讓讀者 掌 握 整 體 的 發 展 與 架 構 , 因 此 僅 能 於 文 內 作 簡 單 的 介 紹 , 詳 細 資 料 請 參 照 http://www.ddbc.edu.tw/en/digital_archives/projects.html 或 http://digitalresources forbuddhiststudies.wordpress.com/。

26 此項分類為方便讀者瞭解整體架構,而筆者對計畫的判別方式,係以整體的方式 作簡介,並非對個別計畫作介紹。有關各研究計畫名稱、執行期間與計畫網址等 資料,請參考文末附錄三。

(18)

1. 多語文版本經文比對──《瑜伽師地論》資料庫

27

簡介

由國科會補助「漢文電子佛典製作與運用之研究──以《瑜伽師地論》為 例」的三年研究計劃(2000/08/01-2002/07/31),共完成《瑜伽師地論》與其綱 要書、異譯本(三經二論)、注釋書、梵文原典、藏譯本的電子資料庫,使其 整合一大部《瑜伽師地論》數位資料庫(Yogācārabhūmi Database),可作為學 者在學術上的應用,乃至未來可作為促進與創新佛典 e-Learning 資源網站建置 與應用的典範。

內容

《瑜伽師地論》記載著瑜伽師(修行者、禪師)的修行階位與境界,也是 一部精緻精神生活的追求者之百科全書。本資料庫已陸續整理出《瑜伽師地 論》本論、其綱要書及異譯本(三經二論)、諸注釋本、梵文原典、藏譯本 等,共二十六本電子資料,28 茲簡列已完成項目如下:

漢譯本 6 本 (T1579, T1581, T1582, T1583, T1584, T1602)

注釋本 7 本 (T1580, T1828, T1829, T2259, T2801, T2802, X0794)

梵本 10 本 藏本 3 本

功能

該資料庫網頁,於工具列中依序提供「解題」、「科判」、「梵漢藏全文檢 索」、「辭典」、「參考書目」、「藏經查詢」等按鈕。「梵漢藏全文檢索」功能所 呈現之檢索結果,依經號排序,呈現在介面左欄,右欄「本文區」「檢索」關

27 計畫名稱:漢文電子佛典製作與運用之研究──以《瑜伽師地論》為例;執行期 間:國科會補助三年計畫(1999/08/01-2002/07/31),計畫網址:http://ybh.ddbc.

edu.tw/aboutYBh.php (Version 2008, http://ybh.ddbc.edu.tw/ui.html)。

28 詳細資料請參考http://ybh.ddbc.edu.tw/ui.html 已建置內容。

(19)

鍵字呈現顏色,右欄「本文區」在視窗底下的工具列可呈現游標「所在處」

等,所呈現功能如下圖。

圖1 《瑜伽師地論》資料庫──提供多語經文比對功能

2. 寫本與多語經文比對──《法華經》資料庫

29

簡介

該計畫由故國際知名學者戶田宏文博士(Dr. Toda Hirofumi,於 2003/08 往生)及立正大學三友健教授(Dr. Mitomo Kenyo)與中華佛學研究所共同執 行的「蔣經國學術基金會計畫」所贊助的「《法華經》多種語文版本數位資料 庫的建構與研究」三年計畫。

此項計畫以漢譯《法華經》為主軸,佐以其他各種版本的《法華經》寫

29 計畫名稱:《法華經》多種語文版本數位資料庫的建構與研究;執行期間:蔣經 國學術基金會計畫補助三年計畫(2003/07/01-2005/06/30);計畫網址:http://sdp.

chibs.edu.tw/。詳見計畫申請書全文 http://sdp.chibs.edu.tw/sdp_intro/gn-data/apply.

htm。

(20)

本,進行蒐集、研究,並製作成數位資料。進而,並建立包括梵文寫本、漢譯 本、藏譯本及英譯本等文獻的大型數位資料庫,以進行文獻內容比對,期望藉 由各項語法技術,能讓讀者更容易比對出各種版本《法華經》內容的不同,建 構一套現代文獻研究與教學應用的佛典文獻比對資料庫。

內容

此項計畫就文獻資料而言,可以分為:一、梵文寫本;二、漢譯版本;

三、漢文注釋本等三部分。30

該 資 料 庫 包 含 蒐 集 發 現 於 尼 泊 爾-西藏( Nepal-Tibet)、 中 亞 (Central Asia),以及在北巴基斯坦的基爾基特(Gilgit)的梵文法華經寫本或殘卷。這 些寫本分別館藏於尼泊爾寫本檔案館(Nepalese Manuscripts Archive)、大谷大 學圖書館(Otani Collection)、大英圖書館斯坦因收藏(Stein and Hoernle Collection)、劍橋大學圖書館(Libraries at Cambridge University)等處,這些 典藏各處的《法華經》寫本原稿,經過合作主持人研究整理而數位化,並加以 科判比對及參考文獻等方式呈現於資料庫內。31

漢譯寫本則有,於近代陸續被發掘出來的翻譯版本,如敦煌、絲路沿途發 現的新資料,故宮的館藏,房山石經以及坊間發現的多項文獻寫本等資料。

漢譯版本則有,姚秦鳩摩羅什譯的《妙法蓮華經》7 卷(什譯)、西晉竺 法護譯的《正法華經》10 卷(護譯)與隋闍那崛多共笈多譯的《添品妙法蓮 華經》7 卷(闍笈譯)等譯本,以及相關經疏、釋論的譯本,加上於中國天台 宗相關文獻,將上述漢譯典籍資料,承製為電子檔,置於網路資料庫,供使用 者閱讀、檢索及下載。

功能

大致如《瑜伽師地論》資料庫的功能設計,包括提供全文檢索、引用複

30 詳細資料請參考http://sdp.chibs.edu.tw/userInterface.html。

31 有關寫本的凡例資料,則依照立正大學授權數位化作業的《梵文法華經寫本集 成》內容進行,請參照網頁一覽表,2011/10/3,http://sdp.chibs.edu.tw/sdp_intro/

refsdp/refsdp.htm。

(21)

製、行號顯示。突破的部分,在於加上各版譯本、寫本的對讀功能,此亦是該 專案的另一特色,所呈現功能頁如下圖所示。

圖2 《法華經》資料庫──提供寫本與多語經文比對功能

3. 多語文比對研究平台──《別譯雜阿含經》(T. 100)資料庫

32

簡介

《別譯雜阿含經》(BZA)的數位版本比對資料庫,是由法鼓佛教學院執 行,蔣經國國際學術交流基金會贊助的三年期計畫,進行漢文古籍譯註與數位 編輯的研究,以巴利語與漢文《別譯雜阿含經》(T. 100)的版本比對,並提供 英譯本。

一般而言,《別譯雜阿含經》的 364 篇短經文,至少都有一篇相對應的漢 譯平行經文,以及一篇(附有註釋書)的巴利語經文,通常會同時有許多篇漢 譯與巴利語平行經文,有時甚至會有梵語經文殘卷留存。這項計畫已成功建置

32 計畫名稱:漢文古籍譯註與數位編輯的研究──以巴利語與漢文《別譯雜阿含 經》(T. 100)的版本比對與英譯為例,Shorter Chinese Saṃyukta Āgama(T.

100 ) ; 執 行 期 間 : 蔣 經 國 學 術 基 金 會 計 畫 補 助 三 年 計 畫 ( 2005/07/01- 2008/06/30);計畫網址:http://buddhistinformatics.ddbc.edu.tw/BZA。

(22)

《別譯雜阿含經》的數位比對版本,將上述各種經文版本連結,且所有經文原 始檔皆公開使用。

此外,DDBC 更進一步從事經文研究,並將一部分的《別譯雜阿含經》經 文英譯並補充大量注釋。漢譯經文採用 CBETA(中華電子佛典協會)版本,

巴利語經文則是由印度內觀研究所(Vipassana Research Institute)惠允使用 Chaṭṭha Saṅgāyana CD。

內容

本項數位版本比對計畫內容包括:

(1)將《別譯雜阿含經》與《雜阿含經》的經文標注新式標點符號。

(2)區分並呈現《別譯雜阿含經》與其他漢譯傳本、巴利語本的平行經文 與非平行經文段落,使用者可輕易比較不同經文版本或傳本間的內容差 異。

(3)精揀並擴充《別譯雜阿含經》364 部經之經群內容,呈現於比對目 錄。

(4)將《別譯雜阿含經》擇篇作英文譯注。

(5)於未來可延伸、擴展,並與更多素材結合。

(6)在文本標記與內容管理上,提供日後從事佛教文獻數位版本研究的基 礎。

功能

在比較目錄中,《別譯雜阿含經》364 部經的每一經都與其平行經文以經 群的方式呈現,透過比較目錄,即可連結到同一經群的任一部經文內容。讀者 可在線上選擇想要瀏覽的經群,並可更進一步挑選其中的二至三部平行經文,

自由選用兩欄或三欄式對讀模式,做線上經文比較瀏覽等功能,如下圖所示。

(23)

圖3 《別譯雜阿含經》資料庫──提供可選擇式多語經文比對功能

4. 經文增補與圖文比對──《嘉興大藏經》等增補典籍作業

33

簡介

這是由 2007 年國科會補助「台北版電子佛典集成之研究與建構」專案計 畫的成果,本專案以對 CBETA 尚未收錄與數位化的漢文佛典之典籍內容予以 匯集建構為目標,其中有《嘉興大藏經》285 部典籍的數位化建置,提供經文 與圖檔比對查詢功能。從確定數位化內容開始,原書影印、掃描、輸入、校 對,乃至全文 TEI Markup 標記等各項流程作業,皆遵照詳盡之數位化作業規 範進行。此計畫目標,將突破過去紙本藏經在編目及刊行上的限制,並且完整 掌握所有漢文藏經版本經目,以期能呈現史上最為完整的漢文佛教藏經數位化 版本。

33 計畫名稱:台北版電子佛典集成之研究與建構;執行期間:國科會數位典藏國家 型 科 技 計 畫 補 助 二 年 半 計 畫 (2007/05/01-2009/12/31 ) ; 計 畫 網 址 : http://taipei.ddbc.edu.tw/sutra/JA042_001.php。

(24)

內容

本計畫於第一年度完成《嘉興大藏經》(新文豐版)選輯 285 部典籍數位 化工作並建置圖文連結,接著進行《正史佛教資料類編》1 部、「歷代藏經補 輯」100 部、《藏外佛教文獻》77 部以及其它未收錄經典之數位化工作。茲簡 述本計畫成果如下:

(1)重要性:「台北版電子佛典集成」所收錄的經典數,超越歷代大藏經。

(2)開創性:與佛典數位典藏「經錄與經文內容標記與知識架構」結合,

開創數位佛典新局面。

(3)標準化:進行 XML/TEI 內容標記(Content Markup)及各項數位作業 標準作業,完成數位典藏文獻的製作。

(4)合作:本計畫與 CBETA 合作,建構、整合出最完整的漢籍數位佛 典,提供學人一套精緻完整的現代漢文數位文獻資料庫。

(5)經濟性:數位化經典在複製、傳播、保存上之成本皆較紙本藏經低廉。

(6)研究發展:配合內容的完成,可進行知識架構佛典專有詞彙的抽詞、

詞類分析整理與跨語檢索等資訊研發。

(7)時空性:透過網際網路無遠弗屆之特性,空間上傳播不受距離之限 制,時間上數位化經典之保存與流傳亦突破傳統紙本藏經的限制。

功能

提供使用者在查詢經典、閱讀經本時,有紙本藏經之外更方便經濟的選 擇。開放給國內外讀者,透過在網路連線,提供使用高品質大型漢文資料庫。

本專案提供原書圖檔對讀功能,使用者只要選取行首資訊文字,按下按鈕,即 可呈現該頁的原書圖檔,進行圖文對讀的比對,如下圖示。

(25)

圖4 《嘉興大藏經》增補典籍資料庫──提供佛典全文與原書圖檔比對功能

(二)「數位經錄」(Catalogue)

1. 藏經目錄整合與數位化

34

簡介

此項計畫在國科會補助下,以執行與建構多語言、多版本的佛典目錄的數 位化作業──「佛教藏經目錄數位資料庫」,主要是將各版藏經目錄、歷代古 經 錄 及 佛 教 文 獻 資 料 等 , 配 合 當 代 資 訊 科 技 , 以 超 文 本 Hypertext 與 Metadata,如 XML/TEI Markup 等標準規範,建構佛典知識管理系統,以作為 數位典藏與當代資訊化的基礎。並建置多項佛學數位功能的網站,提供讀者線 上檢索、經文全文連結,以及時空資訊等服務。

34 計畫名稱:佛典數位典藏內容開發之研究與建構──經錄與經文之內容標記與知 識架構(NSC 96-2422-H-655-001);執行期間:國科會數位典藏國家型科技計畫 補助三年計畫(2005/05/01-2008/06/30); 計畫網址:http://jinglu.cbeta.org/。

(26)

內容

所完成資料建檔與連結的藏經目錄有:《房山石經》、《高麗藏》、《永樂北 藏》、《乾隆藏》、《卍正藏》、《大正藏》、《佛教大藏經》、《中華藏》、《新纂卍續 藏》、《開寶藏、《崇寧藏》、《毘盧藏》、《圓覺藏》、《趙城金藏》、《資福藏》、

《磧砂藏》、《宋藏遺珍》、《普寧藏》、《洪武南》、《永樂南》、《縮刻藏》、《嘉興 藏》等22 部歷代藏經目錄資料庫的建置。35

功能

該資料庫以 CBETA 已有的數位典藏為基礎,建構 CBETA 所未列入數位作 業規劃的漢文歷代經錄、各版藏經目錄,及梵、巴、藏等佛典經錄為作業內 容,並規劃經錄數位化作業與功能規劃為三大階段:

第一階段:漢文藏經目錄建置。以完成古今漢文版本藏經目錄資料庫及相 關檢索功能為目標,主要項目為建置漢文佛典經錄資料庫,蒐集以漢文為主的 各種藏經目錄、工具書以及世學目錄中的佛典資料,將紙本目錄輸入、掃描、

轉換成電子檔,進行標記作業,並建成資料庫。再依這些不同版本的經錄資 訊,分別建立個別藏經資料庫,進而將這些資料庫的經目與文獻的超連結、圖 檔連結,以及內容檢索等數位功能,建構一超越紙型功能的「漢文佛典經錄數 位化資料庫」。

第二階段:多語藏經目錄建置。除延續漢文佛典經錄資料庫的建構與連結 外,並依序建置巴利語、藏文及梵文等版本的資料庫。將之整合成跨語的佛典 經錄資料庫,並於網路上提供漢、梵、巴、藏、西文等多語言佛典檢索,及線 上全文閱讀功能。藉由現代資訊科技,完成古人所不能達成的數位多語言、多 種版本比對與連結,以及全文線上閱讀與檢索等功能。

第三階段:完備藏經目錄資料庫與技術整合。延續多語藏經目錄的建置作 業,完成「滿文大藏經」資料庫,為此階段數位化工作項目。並加強技術與文

35 藏經目錄資料庫所參考的文獻資料,請參考「藏經目錄版本參考文獻」表。杜正 民,〈佛學數位資源的服務功能──以藏經目錄資料庫的建置為例〉,《法鼓佛 學學報》6,頁 122-123。

(27)

獻的整合,應用佛經目錄詞彙與跨語詞彙抽取,善用時空資訊處理等技術,完 成時空屬性之佛教電子文化地圖,提供詞彙、時間、空間與藏經相關資訊的服 務,突破傳統經錄的功能。

圖5 「藏經目錄」資料庫──整合多語佛典目錄及歷代藏經目錄、並提供經 目檢索結果與佛典全文連結等功能

2. 圖檔、目錄與多語辭彙──《滿文藏經》研究資料建置

36

簡介

《滿文藏經研究資料》網頁是由法鼓佛教學院於 2007-2008 年間製作的,

其目的是服務對滿族語言、文化有興趣的學者,提供小而美的數位典藏文獻資 料,以利學者研究。

截至目前為止,本網頁完成的主要項目有:1. 滿文藏經翻拍圖檔資料 庫,2. 滿文、漢文、藏文的佛經目錄,3. 滿漢梵藏四種語言對照的佛教詞彙 庫,4. 滿文藏經研究書目。

36 計畫名稱:滿文藏經研究資料;執行期間:法鼓佛教學院(2007-2008);計畫網 址:http://buddhistinformatics.ddbc.edu.tw/manchu/。

(28)

內容

《滿文大藏經》又稱《清文繙譯全藏經》、《清文全藏經》、《滿文甘珠爾》, 正名為《清文繙譯全藏經》(manju hergen i ubaliyambuha amba g’anjur

nomun)。指乾隆三十七年(1772)皇帝勅旨頒布進行滿文藏經翻譯事業,以

漢文大藏經為底本,再以漢文、藏文、蒙文經文互勘、仔細校勘,而繙譯編修 成滿文的大藏經。《清文繙譯全藏經》全部刷印、裝潢工作直到乾隆五十九年 四月二十六日(1794 年 5 月 24 日)才告竣,共有 108 函,採雙面朱印,共刷 印十二套,分藏各處。37

法鼓佛教學院適時購置一套《滿文大藏經》38,為收藏於北京故宮的翻印 版。三百年來,這套藏經全套木雕版仍完整保存在北京,由故宮紫禁城出版社 獲得允准,以原本完好的木雕模版,進行刷印。並在2002 年,完成 20 套滿文 藏經翻印工作。滿文藏經共收有730 部藏經(一說是 699 部),共計 2466 卷,

108 函,另加上四種語言(滿文、中文、藏文、蒙文)的目錄部 1 函。本專案 挑選其中幾函進行數位化,並提供三函滿文佛典上線,包括《心經》、《金剛 經》等重要的經典。

功能

網頁相關功能如下列三項:

(1)線上瀏覽或下載滿文佛經圖檔(1、2、3、4、5、57、59、82 函及目 錄函)。

(2)提供 732 部滿文藏經目錄與漢藏文佛經的對照,並提供各經目所在的 函、卷、頁數所屬位置。

(3)以 Raghu Vira 等編輯的 Pentaglot Dictionary of Buddhist Terms 書 籍,建構梵、藏、滿、漢文等四種語言佛經語彙庫,有1071 條詞彙供線上查詢。

37 參考章宏偉,〈《清文繙譯全藏經》書名、修書機構、翻譯刊刻時間考〉,《法 鼓 佛 學 學 報 》2 , 頁 311-355 。 或 見 故 宮 博 物 院 , 清 乾 隆 滿 文 大 藏 經 , http://www.npm.gov.tw/exh100/dragon_sutra/html/page_tw_03.html。

38 《滿文大藏經》(北京:紫禁城出版,2002)。

(29)

圖6 《滿文藏經》資料庫──提供圖檔、目錄與多語辭彙等功能

(三)「詞彙研究」(Lexicon)

1. 佛教工具資源數位化

39

為達成建立佛教數位工具資源的目標,此項計畫工作重點分成內容文獻與 工具技術開發,二大主軸同時進行。首先,文獻典藏數位化標記部份,重點為 執行佛典詞彙數位化內容之建構。已完成的文獻典藏有《慧琳一切經音義》、

《梵語千字文》、《翻梵語》與《翻譯名義集》等,並整合為佛典詞彙數位資料 庫,於網站無償提供檢索使用。另一工作重點,本專案佛學與資訊團隊進行佛 典詞彙抽斷詞技術與開發各項全文索引及詞彙檢索工具等。40

本計畫主要成果如下:

(1)就量而言:大量全文資料的建構,初期進行的典藏,有:《慧琳一切 經音義》、《梵語千字文》、《翻梵語》與《翻譯名義集》等文獻數位化。

39 計畫名稱:台灣佛教數位工具資源的建構與研究(NSC 97-2631-H-655-001);執 行 期 間 : 國 科 會 數 位 典 藏 國 家 型 科 技 計 畫 補 助 一 年 半 計 畫 (2008/03/01- 2009/07/31);計畫網址:http://dev.ddbc.edu.tw/buddhistlexicon/。

40 此一成果具體展現,可在計畫網頁佛典辭書數位檢索系統中查看:http://140.112.

26.229/cyj/index.py。

(30)

(2)就質而言:進行上述典籍 TEI/XML 內容標記與 Metadata 後設資料基 礎格式的建構。

(3)量產成果:計完成數萬筆數位化詞條產出成果。

(4)數位辭典:提供佛典語料庫「辭典抽辭」、「統計抽辭」及多語詞彙抽 取,並從跨語對應的文獻,建立平行語料庫。

圖7 「佛教工具資源」資料庫──提供佛典辭書檢索、可將檢索結果連結至 佛典全文,並提供相關圖檔與 XML 檔下載等功能

2. 佛教文獻詞彙數位化

41

此項計畫佛教文獻詞彙數位資源之建置基礎原則為「掌握內容,應用技 術」,採用國際文獻標準規範 TEI Markup,處理文獻典藏內容成為後設資料 庫,再透過適當的知識體系架構設計,最後應用資訊技術轉換成數位工具書的

41 計畫名稱:佛教文獻詞彙數位資源之建置與研究──數位時代的佛學工具書與整 合服務(The Study and Creation of Buddhist Lexicographical Resources,NSC98- 2631-H-655-001、99-2631-H-655-001 與 100-2631-H-655-001);執行期間:國科會 數位典藏國家型科技計畫補助三年計畫(2009/08/01-2012/07/31);計畫網址:

http://dev.ddbc.edu.tw/buddhistlexicon/。

(31)

型態,除使用需求觀點設計的資訊表達架構,具備傳統工具書的功能,並提供 跨資料庫連結查詢、資料比對、統計、引用等多項功能。

2008 年度計畫已完成的佛典詞書《翻梵語》與《翻譯名義集》等相關梵 文音譯詞文獻,以及慧琳「一切經音義」漢語詞彙文本數位化作業。

2009 年度進行《唐梵文字》、《唐梵兩語雙對集》與《梵語雜名》等多部 字書,完成建立漢譯佛典梵語詞彙集專書。以及玄應、希麟、可洪「一切經音 義」漢語詞彙文本數位化作業。

2010 年度進行「事彙百科辭書」三大部佛典詞彙的數位化,包括《法苑 珠林》、《經律異相》、《諸經要集》。並進行慧苑《新譯大方廣佛華嚴經音義》

的音義詞書數位化作業。

本專案以完成「藏經文獻後設資料庫、結合相關數位文獻應用技術、建立 學術工具資源與平台」為目標,提供學者「佛典數位工具書」的資源,成為學 者佛學典籍研究與教學的重要平台。

圖8 結合「佛教工具資源」與「佛教文獻詞彙」兩資料庫──提供歷代重 要音義書之「音韻資料」與「詞彙檢索」等功能

(32)

3. 佛學術語電子辭典

42

在 2008 年,法鼓佛教學院已經累積相當數量的佛學字典資料庫和詞彙資 源,採取專案和研究成果開放的原則,免費提供大眾使用。在處理「佛學術語 字辭典」上,也抱持同樣公開免費使用的立場。而為了使辭典內容未來能在各 種情況下被使用,選用了 TEI/XML 標記語言來標註原始檔,並且完全按照 TEI P5 版本的標準來製作。

為盡可能令所有使用者都能運用這套佛學辭典,我們選擇了 StarDict 以及 GoldenDict 字典軟體的格式,作為媒介來瀏覽使用字辭典。StarDict 是個免費 開放軟體,可以在多種的平台和工具上使用。目前可供使用的字辭典如下:43

(1)Soothill-Hodous, A Dictionary of Chinese Buddhist Terms

(2)《翻譯名義大集》(Mahāvyutpatti, bye brag rtog byed)

(3)Pentaglot Dictionary of Buddhist Terms

(4)釋智諭,《南山律學辭典》(Nanshan Vinaya Dictionary)

(5)丁福保,《佛學大辭典》(Ding Fubao, Dictionary of Buddhist Studies)

(6)辛嶋靜志,《正法華經詞典》(Seishi Karashima, A Glossary of

Dharmaraksa’s Translation of the Lotus Sutra)

(7)Dama Bhikkhu, A Chinese Translation of A.P. Buddhadatta’s “Concise

Pali-English Dictionary”: Digital Edition

(8)辛嶋靜志,《妙法蓮華經詞典》(Seishi Karashima, A Glossary of Kumārajīva's translation of the Lotus Sutra)

(9)Jeffrey Hopkins, Tibetan-Sanskrit-English Dictionary

(10)Dan Martin, Tibskrit Philology

上述10 本佛學詞典,經過數位化所產出的詞條累計已有 105141 筆,可供 線上搜尋或下載。並且在 “DDBC Glossaries Search” 介面中,輸入文字或貼上 一段經文,即可以 “Search” 鈕搜尋該字詞的解釋。

42 計畫名稱:佛學術語電子辭典;執行期間:法鼓佛教學院長期計畫;計畫網址:

http://buddhistinformatics.ddbc.edu.tw/glossaries/glossaries.php。

43 詳見網頁資料:http://buddhistinformatics.ddbc.edu.tw/glossaries/glossaries.php。

(33)

而且,上述的成果也收納、連結於 CBETA 開發的閱藏系統,於 2011 年 4 月 所 發 行 的 CBETA 2011 Version 光 碟 中 , 即 包 括 有 工 具 書 資 料 如 下 : GoldenDict 辭典軟體,內含《正法華經詞典》、《漢英梵佛學詞典》、《翻譯名義 大集》、《五譯合璧集要》、《南山律學辭典》、《丁福保佛學大辭典》等部。不論 對於一般使用者或佛學研究者,在閱讀經文同時可以抽取詞彙檢索,都是相當 的方便、實用。

圖9 「佛學電子辭典」──提供多部佛學辭典下載,可配合電子佛典閱讀使用

(四)「時空資訊」(Time-Space)

1. 經錄時空檢索平台

44

簡介

CBETA Lexicon Tool 是在 CBETA 電子佛典集成與藏經目錄建置過程中,結

44 參見專案網頁網址:http://140.112.26.229/cbetalexicon/index.py。

(34)

合時間與空間資訊,所研發的檢索平台,有助於查詢各部佛典的人物、時間、

空間資訊時,獲得詞彙數據與邊界資訊分析。其中詞頻的分布整理功能,以檢 索字串可以看到在大藏經各部類以及朝代時空與義經人物的分布,此外,有 712 部經典有譯經地點紀錄,是以譯經地所在之城市為依據,建立該地名經緯 度座標。

功能

(1)Range:佛典辭彙人、時、地等邊界資訊 Temporal and Spacial Information Search

(2)Concordance:佛典語用檢索排序 Keyword-in-context(KWIC)Search

(3)Advance:佛典音、義辭彙研究與佛學資訊 Buddhist Lexicon and Informatics Studies

(4)Characters:CBETA 全字碼統計 CBETA Unicode Characters Statistics

(5)Gaiji:CBETA 缺字檢索方案 CBETA Gaiji Search

圖10 「經錄時空」資料庫──提供辭彙檢索,以及「人、時、地」等邊界 資訊,並以 Google Earth 呈現佛經翻譯辭彙與「時間、空間」的開展關係

(35)

2. 台灣佛寺時空平台

45

簡介

此項研究計畫以地理資訊系統(Geographic Information System,GIS),整 合「台灣佛教文獻資料庫」與「台灣佛教數位博物館」等網站資料,發展成為 台灣佛教地理資訊平台,以供進階的台灣佛教史地相關研究。並連結有《台灣 佛教期刊》、台灣佛教史料庫,提供台灣佛教的相關研究資料包括期刊論文

(全文)、書籍和期刊論文目錄、訪談紀錄、文件、圖片。

內容

主要以過去台灣佛教史學者之研究為根據,並包含此領域專家闞正宗教授 之研究成果。此外,本計劃除使用寺院本身提供的圖文資訊,更配合 Google Earth 動態地圖技術,以確實定位該寺院現址之經緯度座標及提供相關交通資 訊。本計劃所用文獻,年代始於17 終於 21 世紀,由此得以追蹤台灣佛教數百 年來之傳播發展及地域分布。此中,對於古地點的位置,往往需要作大量的考 證。

功能

可以輸入寺院名稱、地址,或選取縣市、活動、主祀、宗派等條件,可獲 得所需的寺院資料。

並在畫面所顯示的 Google Map 區塊標示搜尋寺院的位置、左邊則會出現 文字的搜尋清單,點選清單的寺廟即可對應到Google Map 上面。

在搜尋結果中點選該筆資料的「詳細資料」,即可獲得該寺院的寺名、電 話、地址、開創者、主供、寺院活動、創建與結束時間、寺院歷程、寺院簡介 等各項寺院資料,並可瀏覽該寺廟的相簿。

45 台灣佛寺時空平台,見網頁http://buddhistinformatics.ddbc.edu.tw/taiwanbudgis/。

(36)

圖11 「台灣佛寺」資料庫──提供地理資訊、寺院檢索、瀏覽寺廟資料與相 簿等功能

3. 數位文本和地理資訊系統

(1)《高僧傳》──漢傳佛教高僧傳研究地理資訊系統46

簡介

佛教傳記文學的價值,不僅僅對於保存佛教史料具有相當貢獻,且對中國 佛教思想亦有深遠之影響,另外也提供當時人們眼中的社會價值觀、著作紀

46 計畫名稱:漢傳佛教高僧傳之時空資訊系統研究計畫(GIS Based Study of the Biographies of Eminent Monks);執行期間:財團法人浩然基金會補助三年期計畫

(2007/04/01-2010/03/31);計畫網址(開發):dev.ddbc.edu.tw/gaosenggis/;計 畫網址(穩態):buddhistinformatics.ddbc.edu.tw/gaosenggis/。

(37)

錄、風俗民情等,亦是研究當時社會背景的重要參考。而且由於保存了當時語 體的習慣用法,讓使用者得以一窺語言發展的究竟。

因此,此項專案研究挑選梁、唐、宋、明四本《高僧傳》,以及比丘尼傳 等傳記,以 TEI/XML 標記語言建立數位文本,進而導入 GIS 地理資訊系統,

運用 Google Earth 免費公開平台,來視覺化各種富有學術價值的佛教高僧傳 記,例如並提供使用者以「人物」、「時間」、與「地點」作為搜尋條件來搜尋 相關的文獻內容,且其中「跨傳搜索」的功能,讓使用者的瀏覽不再侷限於某 單一傳記之中。47

內容

目前所完成的數位文本,包括幾部佛教僧傳,以下依年代排序:

1. 僧祐《出三藏記集》(列傳部),約西元510-518 年 2. 寶唱《比丘尼傳》,約西元516 年

3. 慧皎《梁高僧傳》,約西元519 年 4. 道宣《唐高僧傳》,約西元665 年 5. 贊寧《宋高僧傳》,約西元988 年 6. 宗性《名僧傳抄》,約西元13 世紀 7. 如惺《明高僧傳》,約西元1600 年 8. 明河《補續高僧傳》,約西元1647 年

經過數位化的文本,所建置網頁平台提供超過 3200 筆的僧傳資料,其中 主要的四部傳記《梁高僧傳》、《唐高僧傳》、《宋高僧傳》、《明高僧傳》有 2143 筆,《出三藏記集》301 筆,《比丘尼傳》116 筆,《補續高僧傳》609 筆、

《名僧傳抄》36 筆等。

功能

地理資訊系統是一種具有專業資訊系統空間形式的數據管理系統。在狹義

47 參見《佛教傳記文學視覺化平台》標記工作手冊,網址:http://wiki.ddbc.edu.tw/

pages/《佛教傳記文學視覺化平台》標記工作手冊。

(38)

上,這是一個具有集中、存儲、操作和顯示地理參考資訊的電腦系統。本計畫 利用GIS 技術,結合《高僧傳》文本 TEI 標記,將原本深奧抽象的僧傳內容在 地圖上動態呈現,地圖與文本可雙向互連查詢。

初步先完成各《高僧傳》的TEI 標記,並整理出人物與時空相關資料庫。

其次,在Google Earth 或是 Google Map 平台疊上歷代疆域圖,然後建立索引 及搜尋介面,讓讀者可以在網頁上做圖文參照的檢索閱讀,使用者可以勾選傳 記文本、輸入人名,也可選擇相對應的時間與地點,獲得所需的圖文資料,也 可在輸入條件項目下獲得高僧籍貫統計資料。

在《高僧傳》的空間資料部份,係以高僧的出生地、弘講地、遊化地、駐 錫地等地理位置的標定為主,進一步可經由地理座標上的統計,提供佛教流 布、宗派教區、佛教城市山林等資訊,以動態模擬方式呈現一位高僧的畢生行 履。其最終目標,就是利用新技術所得的嶄新視野,為研究者提出新的方向及 課題。

圖12 《高僧傳》資料庫──提供佛教高僧傳全文、地理資訊,及時間資訊 等研究材料

(39)

(2)《中國佛寺史志》──名山古剎數位典藏48

簡介

《中國佛寺志》叢書所收之佛寺志或為手抄本或為各國圖書館唯一藏本,

此類文獻乃收集各種文本編輯而成,是地方志或地方性歷史文獻之一,更是研 究佛教史的重要史料。本專案的研究目的,除將佛寺志的珍貴史料數位典藏,

廣為流傳之外,並進行相關佛寺志的書目研究和標記作業,使之成為研究中國 佛教歷史不可或缺的數位文獻。此專案建置完成後,透過公開便利的使用介面 一一呈現圖檔、後設資料、數位全文等資源,幫助學者使用人名、地名及時間 的分析,能做更深入的研究。

內容

地方志的收藏主要由2 個 20 世紀木刻版的編輯叢書組成:

《中國佛寺史志彙刊》,台北:明文印行,1980-1985,杜潔祥(110 冊)。

《中國佛寺志叢刊》,江蘇:廣陵書社,2006,張智(130 冊)。

2007 至 2010 期間,數位掃描 237 部寺志圖檔,其中 13 部寺志全文數位化 建置於網站上,這 13 部寺志是以 TEI/XML 標記全文,標記文本中所有的人 名、地名和時間,其標記內容與佛學規範資料庫相結合。預計於 2013 年以紙 本印刷問世。

48 計畫名稱:《中國佛寺史志》數位典藏;執行期間:中華佛學研究所長年計畫;

計 畫 網 址 ( 開 發 ) :http://dev.ddbc.edu.tw/fosizhi/ ; 計 畫 網 址 ( 穩 態 ) : http://buddhistinformatics.ddbc.edu.tw/fosizhi/。

參考文獻

相關文件

Choong, Mun-Keat, (2006), ‘A Comparison of the Pāli and Chinese Versions of the Bhikkhu Saṃyutta, a Collection of Early Buddhist Discourses on Monks’, Buddhist Studies Review

Work Flow Analysis: Since the compound appears in only 2% of the texts and the combination of two glyphs is less than half of 1% of the times when the single glyphs occur, it

This shows that, up until the mid to late Tang Dynasty, objects made of glass and crystal still were both called liuli, whereas the term poli was used to refer to

Keywords: New religious mission, Vietnamese Immigrant, Religious life, Chih Der Buddhist Cultural Exchange Association, Shi

Keywords: Buddhacization, Changing Buddhism, The Young Men’s Buddhist Monthly, Innovation of Buddhism,

資源和支援 學與教資源 社區資源 學校設施 和支援 研究與 發展計劃 學校領導與

An electronic textbook is a comprehensive and self-contained curriculum package with digital print-on demand contents and electronic features (e-features include multimedia

另外關於前現代的 西藏醫學發展與佛教關係的探討,參考 Gyatso (2015), Being human in a Buddhist world: an intellectual history of medicine in early modern Tibet,