• 沒有找到結果。

我國現代文學史料數位化典藏與服務

N/A
N/A
Protected

Academic year: 2022

Share "我國現代文學史料數位化典藏與服務"

Copied!
27
0
0

加載中.... (立即查看全文)

全文

(1)

關鍵詞(Keywords):文學;文學史料;臺灣文學;數位典藏;數位服務

L i t e r a t u r e;Literature Materials;Taiwan Literature;Digital Archives;

Digital Services

莊健國:國家圖書館參考組編輯;E-mail: ckchuang@ncl.edu.tw

摘 要

文學史料是一個民族在特定時空環境下所產生之生活顯影,它穿流於各時代 主流與非主流文化之中,在學術與非學術領域交互影響下孕育出來之心靈記錄,

它不自覺地傳達作者個人或族群的特定意念,有時卻又刻意創作無主觀意識的純 文學作品,因此從文學作品可以了解一個地域的思想發展與演變,文學史料是研 究一個國家或民族的重要資料,本文闡述臺灣地區近十年來文學史料數位化歷 程,藉由文學史料數位化之定義、數位化特徵、數位化背景與發展現況及未來趨 勢等課題,闡述文學典藏數位服務之新觀念與臺灣經驗。

一、 前 言

臺灣地區現代文學發展歷程坎坷,一般說來,打從日據時代開始,臺灣新文 學已經開始萌芽,此一時期代表作家有賴和、吳濁流、蔡秋桐、王白淵、謝春 木、楊守愚、楊逵、楊華、楊雲萍、吳新榮、王詩琅、郭水潭、楊熾昌、張文 環、龍瑛宗、巫永福、呂赫若、林芳年、鍾理和、吳瀛濤、王昶雄等人,其作品 無論是漢詩、白話詩、民謠、散文、小說等,往往傳達著濃厚的殖民文化,從宿

我國現代文學史料數位化 典藏與服務

莊 健 國

(2)

命、鄉愁、悲情的鄉土情感到抵抗、挑戰等嚴肅主題,象徵著臺灣人精神苦悶的 年代。

臺灣光復後,國民政府接收臺灣,臺灣人民正準備回歸戰後安定的日子,孰 料國語的強制推行及二二八事件的歷史悲劇,使得臺灣文學遭逢斷層的不幸,例 如呂赫若、張文環、楊逵、王白淵等人,分別遭到程度不一的政治迫害,有些作 家因此封筆退隱,文學作品銳減。[1]

此後臺灣地區文學發展主流以外省籍作家為主,例如散文家琦君、王鼎鈞、

夏元瑜、林海音等,約至 1 9 7 0 年代本省籍作家對國語的文字處理較為成熟,逐 漸進入所謂「鄉土文學」時期,此一時期文學作家不分省籍,偏好描述周遭的生 活環境與景物,或為市井,或為鄉村,或為社會,就地取材,關懷各階層生活百 態。

到了 1 9 8 0 年代以後,臺灣本土文學再興,新的臺灣現實意識也開始萌芽,

潛伏的本土論者在有利的客觀環境中,開始探出再出發的腳步。8 0 年代,臺灣 社會的歷史主體意識普遍覺醒,臺灣人又開始在臺灣座標尋求臺灣的出路,本土 論因此受到重視而得到普遍的認同。[2]

從上述臺灣現代文學的發展歷程,不難想像此一時期之文學史料不容易徵集 與典藏,一方面是殖民時代距今年代久遠,資料典藏條件較差,且出版品目錄不 完整,文學史料徵集實難齊全,另一方面由於政治主權轉換,有些文學家擔心政 治迫害,不輕易發表作品,因此有部分作品僅剩孤本手稿,其保存條件與環境令 人憂心,最後往往僅能從其遺稿中找到若干創作,而文學家家屬如果不知如何保 存這些珍貴文學史料,最後恐也流落廢紙廠或垃圾堆中,殊為可惜,因此早期臺 灣現代文學史料之庋藏,除了倚重文學家家屬外,圖書館及文學社團的參與典 藏,也是非常重要的一環。

由此可知早期臺灣現代文學史料的徵集與典藏都不容易,更遑論其閱覽服 務,因為讀者不知道有那些史料可以參考,也不知道典藏於何處,常需耗費時 間,奔波於各大圖書館或文學相關資料室,因此政府刻正進行的「臺灣地區地方

[1] 佩謙,〈淺談臺灣新文學〉,《傳統中國文學電子報》,1 9(1 9 9 9 . 9 . 5),網址:h t t p : / / c y b e r f a i r.

taiwanschoolnet.org/c00/21200085/w4.htm。

[2] 游勝冠,「臺灣本土論的興起與發展」(臺北市:東吳大學中國文學研究所碩士論文,1 9 9 1), 頁 1-6。

(3)

文獻典藏數位化」計畫是非常有意義的工作,如能儘早完成,對於各領域研究 者,助益匪淺。

本文作者依其在文學史料領域多年來之實務工作,淺談臺灣地區文學史料數 位化經驗,先從文學史料數位化之定義說起,再敘述文學史料之發展背景,進而 簡述文學史料數位化之特徵及數位化典藏服務與數位化規劃要點,最後再論及文 學史料數位化發展現況與未來趨勢,尚祈各界不吝指正。

二、 文學史料數位化的定義

「文學」一詞根據《正中形音義綜合大辭典》一書所載:「近世所謂文學,

有廣狹二義:廣義泛指一切思想之表現,而以文字記述之者;狹義則專指偏重想 像及感情之藝術作品,如詩歌、小說、戲劇等屬之,亦稱純文學。」

「史料」一詞在前書中則定義如下:「研究或編纂歷史的材料,有實務、紙 面、口傳三種。」另在《中文大辭典》一書,則解釋為「史材也,歷史之參考資 料也」。

「數位化」一詞在《英漢計算機百科辭典》一書之解釋如下:「將物理變數 的類比量度轉換為數字值,而以數位形式改變該量。簡單的說,通信系統中的數 位化通常是指將語言或圖形信號變為二進碼。實際上任何形式的資料在計算機能 接受它們之前都要被數位化」[ 3 ];另陳俞妏在其文章中將數位化一詞解釋為「將 文字或圖像經由數位掃描器、數位照相機的轉換,而成為電腦所能處理的數位數 據。」[4]

綜合上述定義,「文學史料數位化」應該可以解釋為「泛指將一切文學活動 的紀錄以電腦格式儲存,包括文學創作、評論、人物傳記、圖片、手稿、聲音、

視訊等各類型媒體予以數位化,然後可以再經由電腦介面將上述文件或資料以其 原貌呈現。」

三、 文學史料數位化的歷史背景

文學史料數位化的歷史比起其他領域科學似乎稍微落後一些,這是可以輕易 理解的,因為網際網路發展之初,原來是以軍事用途為導向,後來才逐漸使用於

[3] 林在高、宋文強主編,《英漢計算機百科辭典》(臺北市:中央圖書,1996),頁 457-458。

[4] 陳俞妏,〈淺談資料的數位轉換〉,《國立中央圖書館館刊》,28:2(1995.12),頁 3-12。

(4)

科學、商業與教育等領域,但這並不減損文學史料之重要性,在網際網路蓬勃發 展 1 0 年後的今日,學術界有一個共識,那就是 " C o n t e n t s " 的充實才是全球各學 科領域目標一致的方向。「資料內容(C o n t e n t s)」將是未來網路持續發展的主要 條件,那些內容貧瘠、資料不完整、不具權威性、專業性,或無特色的網站,將 很難在下一個世代存活於學術網站領域之中。

文學史料資料庫的歷史首推美國現代語文學會( Modern Language A s s o c i a t i o n,簡稱 M L A)的摘要系統(圖一),這個已經有 4 0 年歷史的資料 庫,收錄 1 9 6 3 年起,有關文學、語言及語言學、民俗學等學術領域之期刊、叢 刊、專書、論文、會議論文集及書目等,編製成索引摘要資料庫( M L A International Bibliography),以供搜尋相關資料來源,是研究西方語言、文學不 可或缺的重要參考工具,也是語言文學領域最權威的資料庫,唯至今尚未推出全 文連結服務。

圖一:美國現代語文學會(MLA)首頁(http://www.mla.org)

如圖二所示,「古騰堡計畫」(Project Gutenberg)是美國伊利諾大學於 1 9 7 1 年開始進行,將屬於公共版權的文學資料如「愛麗斯夢遊仙境」、「莎士比 亞全集」、「羅傑辭典」等全文輸入電腦,供網路上讀者閱讀。這是文學史料數

(5)

位化的重要里程碑,目前全球有好幾個網站免費提供該計畫建置的數位化書籍之 下載服務。

圖二:古騰堡計畫首頁(http://promo.net/pg/)

Contemporary Authors 是另一個著名的作家作品與人物評介工具書,也有超 過 5 0 年的編纂歷史,是該領域重要之參考書。原本是以印刷式書本發行,目前 是改以光碟版發行,收錄 1960 至 1996 年間約 10 萬位當代作家資料,包括小說 家、詩人、劇作家、報界人士及非小說類文學作家。

DiscLit 系列光碟,則包括 American Author、British Author、World Author 等文學系列叢書共約 500 冊之全文資料,是研究美國文學、英國文學及世界文學 之入門參考書。

Essay and General Literature Index 收錄美國、英國及加拿大地區所出版發表 的英文論文及文章,重點強調在人文及社會科學。所包括的主題有:經濟、政 治、歷史、戲劇、電影、文學作品的評論等。每年約收錄3 0 0 冊書籍及 2 0 多種 年刊及期刊中的文章。

文學類資料在我國圖書資訊界的數位化歷史,似乎略佔優勢,以國家圖書館 為例,文學史料是館內第一個數位化成功的領域,其原因有四:一則原先收錄之

(6)

資料已具備數位化之基礎,因為該館曾於 1 9 8 5 年 5 月辦過一次「當代文學史料 展」;二則它的學術領域範圍較明確,資料蒐集時較易掌握;再則國家圖書館擬 先小規模試作數位化工程,以汲取、累積經驗,再擴大範圍至資料龐雜的期刊報 紙、學位論文、善本古籍等類別資料;最後,也是最重要之因素,則是該館正好 搭上「六年國建」專案計畫列車,獲得行政院的專款經費補助,使得該計畫得以 順利推展成功。國家圖書館於 1 9 9 4 年順利推出「當代文學史料影像全文系統」

(圖三),確實具有先導性及指標性之重大意義,該系統收錄五十年來臺灣地區當 代文學作家約兩千餘位之基本資料及其生平傳記、手稿、照片、著作年表、作品 目錄、評論文獻、翻譯文獻、名句及歷屆文學獎得獎紀錄,每年平均有4 0 萬人 次上網使用該資料庫,頗受文學界人士喜好,是國內文學網站之重鎮,對文學研 究學者及熱愛文學之民眾,提供便利之檢索功能。[5] 唯該系統對於文學作品之典 藏尚未建置,殊為可惜,而收錄文學作家之全面性與評述作家基本資料之完整性 仍待改善,如能調整上述缺憾,方能成為臺灣現代文學史料的重要資源。

圖三:當代文學史料影像全文系統首頁(http://lit.ncl.edu.tw)

[5] 當代文學史料影像全文系統網址:http://lit.ncl.edu.tw。

(7)

中央研究院自 1 9 8 4 年起開始建置「漢籍全文資料庫」,至 1 9 9 8 年止先後完 成《二十五史》、《十三經》、「諸子」、「古籍十八種」、《古籍三十四種》、

「大正新脩大藏經」等文獻之數位化工作,超過兩千萬字的臺灣史料、1 千萬字 的大正藏以及其他典籍,合計字數1 億 3,400 萬字,並以每年至少 1 千萬字的速 率,持續成長,是當今國內最具規模的中文古籍資料庫。[6]

元智大學的「網路展書讀」是以古典文學多媒體服務為目標之網站,1 9 9 3 年起即開始中國古籍數位化的研發工作,目前已完成中國古籍數位研究系統包 含:《詩經》、《全唐詩》、《宋詩》、《唐宋詞》、《紅樓夢》等,累計達一千五 百萬字。已完成的網路教學系統包含:倚聲填詞格律自動檢測索引教學系統、依 韻入詩格律自動檢測索引教學系統、唐詩三百首、網路對聯習作系統等。該網站 在網際網路崛起之初即推出,又能持續建置與推廣,因此獲得不少佳評,並對往 後文學網站製作者具有催化作用。[7]

「四庫全書電子版」是兩岸三地合作開發之電子資料庫,收錄文淵閣四庫全 書共 3 , 4 8 0 種典籍,3 6 , 0 0 0 冊圖書,4 7 0 萬頁影像,8 億漢字之中華文化鉅著,

四庫全書電子版以 Unicode 內碼儲存資料,並補充自建造字檔,方便處理與顯示 中文罕用字,而其全文檢索功能更讓研究人員津津樂道,除了可節省時間之外,

更不會遺漏任何一則相關訊息,也不必再像從前,往往為了某一句話或某一特定 主題,翻遍了整部四庫全書,還不一定找得到資料。電子版四庫全書之售價又比 原書便宜,並可節省圖書館書架空間,是學術圖書館數位化的重要資源。

「康熙字典」光碟是根據「同文書局」出版的石印版《康熙字典》為底本製 作而成,共收錄 4 7 , 0 3 5 字,分為 2 1 4 個部首,內容極為豐富,但其編輯體例對 於今日之一般讀者查詢使用卻顯得有點不便,其電子版採用先進的電腦檢索技術 彌補此一不足,提供單字、部首、筆畫、筆順、注音、拼音等多元化的檢索欄位 查詢,讓讀者能夠輕鬆使用此一漢學研究中重要的工具書典籍,還可透過「瀏覽 原書」的功能,直接翻閱《康熙字典》的原文圖像。

「故宮【寒泉】古典文獻全文檢索資料庫」,由陳郁夫教授製作,將多年來自 行開發之古籍文獻,免費提供學界使用,目前已完成《十三經》、《先秦諸子》、

《全唐詩》、《宋元學案》、《明儒學案》、《朱子語類》、《資治通鑑》、《廿五史》

[6] 漢籍電子文獻網址:http://www.sinica.edu.tw/~tdbproj/handy1/。

[7] 網路展書讀網址:http://cls.admin.yzu.edu.tw/。

(8)

[8] 故宮「寒泉」古典文獻全文檢索資料庫網址:http://210.69.170.100/s25/index.htm。

等古典文籍,刻正進行古今圖書集成數位化工程。[8]

「傳記文學」光碟收錄該雜誌第 1 期至第 4 3 3 期(1 9 6 2 . 6 - 1 9 9 8 . 6)間整本雜 誌全文內容,共 15,000 篇文章,一億餘字數,錄製於 10 張光碟資料中。內容包 括自傳、評傳、年譜、回憶錄、名人日記、重要手蹟、珍貴史料、史事研究等傳 記文學與民國史料,提供各篇文章的日期、期號、標題、副標題、作者、專欄、

人物、機關團體等項目的查詢,使用者可透過全文檢索軟體,針對任一欄位、跨 欄位或所有檢索項目,輸入任意字詞進行查找,即可查獲相關書目資料並同時瀏 覽內文影像。

「文訊雜誌紀念光碟」(圖四)收錄該雜誌第 1 期至 200 期(1983.07-2002.6)

之間所有雜誌的全文內容,製作於 D V D 光碟片之中,共約 3 千萬字,6 千餘幅 圖,提供雜誌篇目、專題、作者、被評論者、專欄、卷期的瀏覽與全文檢索功 能,預計於 2002 年底發行。

圖四:文訊雜誌光碟版畫面(圖片由文訊雜誌社提供)

「向陽工坊」由詩人向陽先生主持,成立於 1 9 9 8 年,收錄「向陽的詩」、

「臺灣文學」、「文學傳播」、「報導文學」等文學資源,向陽先生在網際網路環

(9)

境下嘗試多角經營文學網站,相關的網站還包括「向陽文苑」、「向陽詩房」、

「臺灣文學傳播研究室」等,是國內網路文學的重要靈魂人物。[9]

「傳統中國文學網」乃遙光先生創設於1998 年,以發行「傳統中國文學電子 報」起家,經過數次改版與更換網址,並積極尋求合作對象,引進各類型文學資 料,以網路行銷策略,厚植網路文學網站聲望,是近年來急速竄紅的文學網站。

[10]

網站上除發行電子報外,還提供國學入門、文學研究專區、電子書庫、中文 研究所考訊等資訊,是個人經營文學網站成功之典範。

「南方社區文化網路」創立於 1 9 9 5年,發行臺灣本土第一份對大眾發行的

「南方電子報」,宣揚其服務宗旨—「讓商業邏輯下失去戰場的理想在網路發 聲」,並以「社會運動」、「社區運動」、「生態環保」、「弱勢團體」、「文學文 化」為網站五大方向。[11]

「詩路:臺灣現代詩網路聯盟」由網路詩學專家須文蔚先生創立於1 9 9 6年,

是文建會長期支持的網站,集錄大量現代詩資料,是現代詩的專門網站,包括每 日一詩、經典作品典藏、詩集出版簡目、重要詩集精選,以及詩學教室、理論、

評論等。[12]

「臺灣文學研究工作室」由呂興昌教授主持,對臺灣地區各類型本土文學廣 泛探討與推廣,網站內容除臺灣文學研究學者的簡介及相關學位論文外,並有原 住民文學、民間文學、母語文學、臺灣古典文學及新出土的文學資料,以及鄭轄 時期、清領時期、日治時期及國統時期的文學研究等,並收錄相關的研究書目、

研究刊物、研究計畫、學術會議及文學課程等。[13]

「文學咖啡屋」由行政院文建會與聯合報副刊聯合策劃,提供網路創作與聯 合副刊等文學作品,該網站舉辦多結局小說網路大競寫活動,每月均有不同的競 寫題目,入選作品並於每月底與聯副同步刊登。[14]

「岐路花園」由中興大學外文系辦公室李順興老師主持,旨在實驗網路功 能,以之作為文學創作和發行工具,嘗試開發新型的文學表現形式並改良文學傳

[9] 向陽工坊網址:http://netcity2.web.hinet.net/UserData/hylim/default.html。

[10]

傳統中國文學網:http://www.literature.idv.tw。

[11] 南方社區文化網路:http://www.esouth.org。

[12] 詩路網址:http://www.poem.com.tw/。

[13]

臺灣文學研究工作室網址:http://ws.twl.ncku.edu.tw/。

[14] 文學咖啡屋網址:http://www.cca.gov.tw/coffee/。

(10)

播的管道。[15]

臺灣地區一般大學 BBS 站多有文藝相關版面,近年來興起的藝文業BBS 站 有中山大學音樂系的「山抹微雲」、清華大學的「楓橋驛站」、海洋大學「田寮別 業」及成功大學的「貓咪樂園」。「尤里西斯文社」則是最早成立的藝文專業 B B S 站,收有許多早期 B B S 寫手的優秀作品。其中海洋大學的「田寮別業」則 是專業藝文創作站,除了文學討論、創作的版面外,更有「田寮書庫」收錄詩 經、文心雕龍、老子到十三經、諸子百家、歷史傳記到歷代詩詞,是一個相當完 整的資料庫。另外寫手們可於此版設立一個個人專屬版面,收藏自己的作品,也 可與好友們討論創作問題。[16]

大陸地區由政府部門建置的現代文學網站尚未多見,但是民間網站卻有不少 全文型文學網站,例如木子書屋( h t t p : / / l i b r a r y. m u z i . c o m / )、天一書樓

(h t t p : / / w w w. c n o o l . n e t / t i a n y i g e /)、網絡圖書(h t t p : / / w w w. g o t o b o o k . n e t /)、亦凡公 益圖書館(h t t p : / / w w w. s h u k u . n e t /)等,都可在這些網站上輕易取得部分文學作品 的全文內容,惟這些網站是否已取得文字著作權上網之授權,似乎還有待確認。

例如有些網站將臺灣地區作家之作品,如:瓊瑤的《庭院深深》、龍應臺的《野 火集》、三毛的《撒哈拉的故事》、李敖的《北京法源寺》等作品,毫無保留的公 開於網路上,雖然方便網友與讀者利用,但仍應尊重智慧財產權。這些網站大都 小規模經營,既無網站設立或服務宗旨,又無網站負責機構,且非正統資料庫管 理 架 構 , 較 難 期 望 網 站 經 營 的 長 遠 性 。 唯 有 半 官 方 「 超 星 數 字 圖 書 館 」

(h t t p : / / w w w. s s r e a d e r. c o m)(圖五)才是有計畫有規模的經營各學科史料數位化 工程,這網站是由中國國家圖書館與北京世紀超星有限公司合辦,目前已有近十 餘萬冊圖書上網,全部可以在線上瀏覽(需加入會員),號稱是大陸地區目前最 大的網上圖書館。收錄的學科領域涵蓋哲學、宗教;法律、政治、軍事、經濟、

教育、體育等社會學科;數學、物理、化學、天文、生物等自然科學;建築、資 訊、電機等應用科學;世界史地;文學藝術等。目前的服務方式是採會員制,會 員需先購買一定金額之「讀書卡」,待閱讀書刊時,系統會自動扣除儲值點數,

非會員只能預覽數位化書刊之部分影像資料,約10 來頁。

[15] 岐路花園網址:http://audi.nchu.edu.tw/~garden/garden.htm。

[16] 王蘭芬,網路中的文學革命,見網路文學名家觀點,網址:h t t p : / / u d n . c o m / S P E C I A L _ I S S U E / CULTURE/NETLIT/news/news7-2.htm。

(11)

圖五:超星數字圖書館首頁(http://www.ssreader.com)

香港地區的文學資料庫,則以香港中文大學之「香港文學資料庫」(圖六)

為代表,該資料庫收錄之資料以香港地區發表之現代文學創作或評論著述為主,

資料收錄時間可追溯自 1 9 3 0 年代,部分資料提供全文閱讀服務,但僅限於校園 內使用,是研究香港文學作家的重要資源。[17]

圖六:香港文學資料庫(http://hklitpub.lib.cuhk.edu.hk)

[17] 香港文學資料庫網址:http://hklitpub.lib.cuhk.edu.hk/。

(12)

以上僅略述臺灣地區現代文學相關系統與網站,惟礙於篇幅,難免有遺珠之 憾,尚祈見諒。

四、 文學史料數位化的特徵

當我們欲討論文學史料數位化的特徵時,應先明瞭傳統圖書報刊之典藏與服 務困難:

1 . 分類編目耗費人力;

2 . 典藏空間需求量大;

3 . 資料不易長久保存;

4 . 老舊書刊閱覽服務品質較差;

5 . 早期書的書刊目錄索引比較不完整,資料查檢不容易;

6 . 非書資料與特藏資料則更難服務讀者。

接著我們再進一步分析文學史料數位化有哪些特徵?是否可以解決傳統圖書 館的服務限制:

1 . 數位化典藏服務軟硬體投資成本極高:毫無疑問的,數位典藏投入之人力與 經費,是相當可觀的。

2 . 數位化專業人力需求高:唯有專業人員的投入與規劃,才能推出合格的數典 藏產品。

3 . 數位化資料複製容易:數位化資料最大的特點就是複製容易,攜帶方便。

4 . 數位化資料查檢容易:數位化典藏最終目的就是要提供迅速便捷的高品質讀 者服務,因此資料檢索的便利一定是重要特色之一。

5 . 數位化資料節省典藏空間:數位化資料可以節省圖書館的實體空間,這是大 家都肯定的一件事,尤其對於罕用之書刊,佔用圖書館太多空間對圖書館的 發展,並不有利。

6 . 數位化資料不再侷限平面出版品,視聽資料亦可服務:除了圖書期刊等印刷 式資料可以數位化之外,各類型多媒體資料也可以加以數位化後提供線上服 務。

7 . 數位化資料典藏壽命較久遠:資料數位化後,因資料複製容易而可再轉製於 新的儲存媒體上,因此數位資源的長久保存是沒有問題的。

8 . 數位化資料可穿越空間障礙服務讀者:此即遠距圖書服務之概念,透過網路

(13)

可以服務遠端的讀者,這是數位化後縮短服務距離的優點。

9 . 數位出版與網路行銷成為新興行業:數位化出版逐漸在網路新環境中形成,

配合電子商務技術的開發,網路購書行為或閱讀行為已逐漸形成一股氣候,

它已改變的傳統的消費行為。

1 0 .數位化服務實現資源分享的理念:如果沒有著作權問題,數位服務早就實現 資源分享的境界。

11 .數位化服務衍生網路著作權課題:為了保護創作者的智慧財產權,必要的限 制似乎不可避免,因而網路著作權的議題,將會是網路世界中持續發燒的課 題,如何在推動資訊公開與保護著作權人的權益當中取得平衡,還需考驗人 類的智慧。

1 2 .數位化服務是未來的趨勢:無論如何,網路的時代已經來臨,數位服務是人 類未來的發展趨勢,將來上圖書館、看電視、看電影、上班、開會等活動,

都可以在家中的電腦實現。

五、 文學史料數位化的規劃

當吾人開發一套文學史料數位化系統前,必須先思考下列課題:

1 . 該文學史料有無數位化的必要?

2 . 該文學史料能否數位化?

3 . 該文學史料如何數位化?

4 . 該文學史料是否值得數位化?

5 . 文學史料數位化的目的?

6 . 文學史料數位化的好處?

7 . 有無文學史料編輯專業人員?

8 . 有無持續維護數位化系統之資訊能力?

9 . 建置經費問題是否容易解決?

1 0 .數位化持續建置與服務之能力?

在評估以上課題後,如果答案是肯定的,則可再進一步規劃下列需求:人力 需求、技術需求、資金需求。

(一)在人力需求方面

數位化過程必定會增加人力成本,包括人員培訓、系統觀摩、規格書制訂、

(14)

軟硬體採購發包、書目資料建檔、影像資料掃瞄、影音資料建置、系統測試等。

這是維持一個系統運作的必要人力需求,如果機構內尚無建置數位典藏的經驗,

應儘早進行人才培訓,才能應付系統建置所需之專業知識。儘量避免以「急就章」

或「撿現成品」方式規劃人力,以免將來系統完成後,還需面對現實的考驗,萬 一人力資源無法掌控整個系統時,狀況輕者,會造成系統停頓,嚴重者,恐怕還 需重新設計或調整作業,徒然浪費寶貴的時間與經費。文學史料數位化的人力基 本需求有三種,第一要有文學素養者,第二要有資訊素養者,第三要有行政能力 者,前兩者負責規劃文學專屬系統,後者爭取預算與行政作業,三者缺一不可,

相互支援與合作,才有可能在競爭的環境中順利完成任務。

(二)在技術需求方面:

1 . 軟硬體規劃:在技術需求方面,首先需規劃軟硬體相關設備,在硬體方面,

需先計算文件數位化所需之儲存空間及使用人次,才能規劃主機等級及硬碟 儲存空間大小,自大型主機到小型伺服器皆無不可,端看資料的重要性與使 用率。系統軟體方面,如採用套裝軟體,價位較低,建置時程較短,唯系統 功能一般僅能符合基本需求;或考慮開發專屬軟體,費用通常較高,開發時 程較長,但較能符合建置單位之功能需求。另外還需依據作業平臺,搭配資 料庫管理系統(Database management system, DBMS),大型主機大都採用 O r a c l e、I n f o r m i x、S y b a s e 等資料庫管理系統,小型主機可使用 S Q L 或 MYSQL 等,前者價位較高,後者價位較低,有些還是免費使用。

因此建置一個陽春型或小規模的系統,軟硬體初期投資大約只要2 0 萬元至 3 0 萬元之間,全部開發時程只需三個月,就可以建構一個文學史料服務網 站。而較具規模的系統通常需估算一、兩百萬元才能規劃符合資訊安全與標 準作業模組,包括採用雙主機服務,以防駭客入侵,將網頁服務主機置於機 構防火牆之外,提供一般讀者連線使用,而真正存放資料的主機置於機構防 火牆之內,僅限機構內資訊人員及建檔人員使用,並以磁碟陣列規劃儲存之 資料,以避免硬碟故障時,網頁服務必須暫停,另需規劃每週或每日備份建 檔之資料,以防止主機故障時,可恢復先前備份之資料,而全文資料、影像 資料、影音資料則應至少複製兩份以上於D V D 或 C D 上,並保存於不同的 建築物,即所謂之異地典藏,以防天災發生時(如地震、火災、竊盜),還 有可能將另一個備份保存下來。

(15)

2 . 著錄格式:關於文獻資料著錄格式,這幾年在圖書館界數位化系統中,大都 採用詮釋資料格式(M e t a d a t a),詮釋資料是對文件或收藏品資料屬性的一 種描述,目的在促進資料系統中對資料之檢索、管理與分析。這是考量跨機 構、跨主機間之資料交換與整合,並考慮將來與國際接軌之需求,而採用符 合國際標準之「都柏林核心集(Dublin Core)」。這是一個簡單有彈性,且非 圖書館專業人員也可輕易了解和使用的資料描述格式,它的著錄項目有 1 5 項,大致能滿足數位媒體資料編目要件,這 1 5 項包括:坽 主題和關鍵詞

(S u b j e c t)、夌 題名(Ti t l e)、奅 著者 (C r e a t o r)、妵 簡述(D e s c r i p t i o n)、 妺 出版者( P u b l i s h e r)、姏 其他參與者( C o n t r i b u t o r s)、姎 出版日期

(D a t e)、妲 資源類型(Ty p e)、姌 資料格式(F o r m a t)、姁 資源識別代號

( I d e n t i f i e r)、 妶 關 連 ( R e l a t i o n)、 妼 來 源 ( S o u r c e)、 姃 語 言

(Language)、姖 涵蓋時空(Coverage)、妱 版權規範(Rights)。 3 . 數位化格式:數位化典藏內容規格大致需考量下面四種資料格式:[18]

(1)文字資料(Textual Materials)

文字資料數位化有兩種方式,一種是以影像檔格式儲存(如T I F 格式、J P G 格式、G I F 格式),一種是以文字檔格式儲存(如 T X T、W O R D、P D F、H T M L 格式),前者製作成本低,且較節省時間,無須對文字進行校對,適合處理大量 文件,但無法對資料內容進行全文檢索;後者製作成本較高與耗費時間較多,但 是對於文件內容可以進行全文檢索功能,同時也較節省資料儲存空間。試分析比 較此二者之差異:

項目 純文字格式(txt) 影像格式(tif) 備註

檔案大小 3~5KB 約 100KB 以 A4 單頁

(300dpi) 純文字為例

建檔時間 15 分鐘 1 分鐘以內 約 1500 字

建檔費用 較高 較低

全文檢索

文字校對

[18]〈地方文獻數位化之相關標準與作法〉,《地方文獻數位化模式及相關標準研究報告》,(南投 市:臺灣省文化處,1999)。網址:http://plisnetptl.edu.tw/plis88/research/dl/5.html。

(16)

文字排版

文字美編

造字問題

影像品管

資料內容 容易擅改 不易變更

其他限制 無法處理特殊符號 檔案較大不便做成 或圖像資料 電子書

經由上述之分析比較,可知資料內容如不涉及全文檢索時,採影像掃瞄方式 儲存資料較節省時間、人力與經費,例如國家圖書館之「當代文學史料影像全文 系統」、「中華民國期刊論文索引」及「傳記文學」光碟資料庫即採此一模式建 檔;而當文件內容需要做提供檢索之功能時,唯有採用純文字格式建檔方能解 決,例如中央研究院之「二十五史資料庫」、香港迪志文化公司之「四庫全書電 子版」之文字建檔格式。

PDF(Portable Document Format)檔案是近年來另一種熱門儲存文字格式,

它保有純文字格式全文檢索之優點,又有保護文件內容不被修改的功能,甚至有 限制列印及存檔的功能,國家圖書館「全國博碩士論文系統」收錄之論文電子檔 即採用 PDF 格式製作。

(2)圖像資料(Pictorial Materials)

常見的相片、圖片、手稿、畫冊、海報等資料數位化的主要格式,有下列幾 種,一般都是採用掃瞄機來製作:

泝 T I F F:適用黑白、灰階、全彩的文件資料,壓縮效果佳,適合處理 舊籍或檔案資料,並可儲存為保存用圖。

沴 G I F:適用於黑白、灰階、2 5 6 彩圖,壓縮效果亦佳,適合處理預覽 型圖片。

沊 J P E G:適用於灰階與全彩,壓縮效果極佳,適合提供於網路上公眾 瀏覽。

沝 B M P:適用黑白、灰階、全彩的文件資料,壓縮效果普通,適合儲 存為保存用圖。

沀 P D F:適用黑白、灰階、全彩的文件資料,壓縮效果佳,適合處理整

(17)

份文件、整本圖書或期刊,並方便加入浮水印,防止資料被冒用或擅 改,主要提供於網路上的電子書。

目前在國內外,對於文件的保存方式,大都參酌美國國會圖書館的作法,將 一份圖像同時儲存成三種格式:

泝 預視圖(Thumbnail image):以 GIF 格式儲存,供網路上預覽。

沴 檢視圖(Service image):以 JPEG 格式儲存,供網路上瀏覽。

沊 保存用圖(Archival image):以 TIFF 格式儲存,作為永久保存用。

(3)聲音資料(Sound recordings)

聲音資料採用 WAVE 格式、MP3 格式、RA 格式居大宗:

泝 WAVE:檔案較大,一分鐘的聲音需佔用10MB 的空間,適合用來保 存原音。

沴 MP3:最大優點是檔案小,唯略有某種程度失真。

沊 R A:最大優點為線上播放,不用等到檔案全部下載完畢,最大缺點 是容易受到網路品質好壞而影響收聽品質。

(4)視訊資料(Audio-Video Materials)

視訊資料的處理需要之特殊設備與專業人員,處理物件拍攝、影像編輯與剪 接之能力,目前主要的格式有:

泝 AVI:適合處理畫質要求較低階之產品。

沴 QUICK-TIME:適合處理畫質要求較低階之產品。

沊 M P E G:這是最普遍的視訊格式,目前我們最常使用之 V C D 片中的 影音格式,就是採用這種格式,它提供極高的壓縮比例與較高的畫 質。

沝 Streaming Vi d e o:這是可透過網路上直播的一種格式,也是容易受到 網路品質好壞而影響收訊品質。

(三)在資金需求方面

建置一套數位化系統,除了上述人力需求與技術需求外,經費的來源也是非 常重要的,這三者其實缺一不可。資金方面的取得,以政府單位為例,大多需經 過先提出計畫書,再透過預算之編列、審查與核定後,才能正式執行計畫,這中 間約需兩年以上的作業程序,等到系統正式上線完成後,應該才是困難的開始,

這時候如何再去申請經費,維持系統正常運作,也是一門學問,或可考慮再以相

(18)

同名義申請第二期發展計畫,但得看上級單位支不支持該項計畫,否則就只有想 辦法自籌經費,勉力維持系統運作。這也就是我們在網路上經常看到一些網站,

網頁內容無法定期更新的主要原因。其他可以考慮的運作方式,譬如以產品發行 來自籌經費、尋找廠商合作建置、委託開發、尋求金主(基金會)、商品化行銷 等方式皆可,端看其數位化產品有無市場經濟價值,例如故宮博物院的文物複製 品與光碟產品,在市場上反應較熱烈,就不難尋求合作開發的對象,而文學史料 就沒有這麼樂觀了,除了金庸的小說,或少數熱門作品外,一般都很難有創收,

筆者日前在一家量販店無意中發現整套文學電視劇「人間四月天」 1 0 卷錄影 帶,只賣 1 9 9 元(原價 2 , 9 9 0 元),心中感觸良多,文學工作者的酬勞,應該是 不太穩定的。

六、 文學史料數位化的服務

文學史料數位化服務是未來全球資訊服務的一環,它可以結合電子商務,也 可以是圖書館館內服務的延伸,也可能轉型為個人化圖書館型態,也可能結合 PDA 或手機業者的加值服務。

我們先從傳統的圖書館服務說起,以前在圖書館尚未收藏數位化資料前,讀 者必須先到圖書館,利用各種目錄索引來尋找資料的出處,之後再到書架上找尋 書刊,然後才能將資料複印,以便研讀。例如我們如果要找尋有關作家「林海音」

的相關報導與作品評論,在書目索引還沒有自動化之前,必須很辛苦的找尋各月 份的文學雜誌與各報紙副刊及圖書目錄,才能尋獲部分資料,不但沒有效率,資 料蒐集也不完備。現在我們只要在電腦前面鍵入「林海音」三個字,就可以快速 的尋獲資料,甚至可以馬上閱讀雜誌或報紙上的內容,只要該份文件已數位化掃 瞄或建檔。

目前從事文學研究者在蒐集資料時,應該可參酌下列步驟取得目錄或全文資 料:

1 . 文學圖書:可使用「當代文學史料影像全文系統」、「國家圖書館館藏目錄 系統」、「全國圖書目錄系統」,大部分的國內文學圖書,應該都會收錄在這 三個系統內。

2 . 期刊文獻:可先考慮使用「當代文學史料影像全文系統」、「中華民國期刊 論文索引」、「國家圖書館期刊目次系統」、「中國期刊網」,若還不滿意,

(19)

再檢索單一期刊資料庫,如「文訊光碟」、「傳記文學光碟」、「光華雜誌光 碟」等,大部分的國內文學圖書,應該都會收錄在這三個系統內,且大部分 都提供全文列印功能。

3 . 報紙文獻:可先使用「當代文學史料影像全文系統」、「報紙標題索引」查 詢欲檢索之人名或主題,查到後可如有影像,可立即列印出來,不用再調閱 舊報紙或報紙微捲資料。

4 . 學位論文:有關文學相關論文,使用「全國博碩士論文系統」,可免費取得 近幾年來已授權學生之論文全文。早期的博士論文也已數位化,但僅限在國 家圖書館內使用。

5 . 研討會論文集:有關文學研討會的論文集較難掌握,如果主辦單位沒有將會 議論文贈送給圖書館,則讀者就很難取得這份文件,只有參加會議人員,才 有此份資料。這類文件的檢索方法請比照上述第一項「文學圖書」即可。

6 . 網路資源:網路上的文學資源越來越豐富,除了在作家個人網站上,可以尋 獲相關文學資料外,有些雜誌社雖未製作光碟資料庫對外發行,但也在自己 的網站上公開部分雜誌內容,這時可利用網路搜尋引擎,檢索到各類型文學 資料,如「聯合文學」、「橄欖樹文學月刊」、「天下雜誌」等。網路上也可 輕易的找到各種文學創作與評論的文獻,此即「網路文學」,這是近兩三年 來蓬勃發展的新品種文學,讓文學新人有許多的展示作品空間;有些網站為 維持作品品質,投稿創作需經過審核才可上網;有些作家一開始就不打算發 行印刷式作品,直接將創作發表於網路上,供網友免費閱讀。網路文學在文 壇發展史上,必然會記上一筆,雖然日後的發展尚待觀察,但這已經是時代 的潮流,越來越多的文學創作,將會直接在網路上公開,因為新人類使用電 腦的行為,已經成為生活上的一部分,透過網路購物、上課、上班、交友、

看電影、聽音樂已經是很普遍的行為了,雖然還有許多人不習慣或排斥面對 電腦閱讀文學作品,但是時代的潮流已經將人類的生活e化了。

七、 文學史料數位化技術與服務的困難

文學史料數位化是一個頗具挑戰性的工作,它將面臨許多困難等待資訊技術 去克服,且數位化服務觀念也是不斷地改進,因而服務人員必須自我提升,才能 應付資訊時代的潮流,底下分別簡述數位化工作可能需要面臨的困難:

(20)

(一)系統建構

1 . 作業平臺:作業平臺的選擇是一項困難的決定,因為大多數的文史資料工作 者,並不清楚 U n i x、L i n u x、N T 的優缺點,以及各家資料庫管理系統的差 異性,在選擇作業平臺時容易受到軟硬體廠商的左右,或者遷就預算多寡。

基本上 Unix 與 Linux 作業系統相似,Linux 使用在中小型主機較多;NT 作 業系統操作介面與 Wi n d o w s 9 8 較雷同,管理介面較親切,操作上較熟悉,

軟體工程師比較容易尋獲,軟體開發費用相對較低。在資料儲存的安全上,

U n i x、L i n u x 及 N T 作業系統可以使用磁碟陣列,保護資料的安全,當有一 顆硬碟故障時,可以在不關機的狀態下,更換硬碟。在使用層面上,U n i x 及 L i n u x 的主機比較能容許較多瞬間上網人潮,N T 作業系統則對於使用人 次有較多的限制。但無論如何,建議資料庫主機置放於機構之網路防火牆 內,網頁服務主機則置於防火牆之外,較能保護主機的安全。

2 . 字碼問題:目前國內的網路使用者,其電腦大都使用 B I G 5 碼,只能處理 1 3 , 4 6 1 個中文字,再加上預留的造字區,頂多只能增加到 1 9 , 7 8 2 個中文 字,因此肯定無法滿足文字工作者的用字需求,單就文學家的名字當中就有 許多 B I G 碼無法顯示的字,如唯弦、荒涵等,而文學史料經常需要處理日 文或韓文的文獻,這時候如果主機內碼是 B I G 5 碼者,就無法存入日韓文 字,讀者的電腦自然無法顯示這些字碼,字碼不足問題一直困擾圖書資訊 界,國內圖書館界自動化系統大都使用 C C C I I 碼為內碼,可以處理 5 3 , 9 4 0 個字,雖然大部分的中文字都可輸入,並解決日韓文資料的建檔,但一般的 使用者是以 B I G 5 碼電腦連結圖書館自動化系統,因此也無法顯示畫面上的 這些字。使用「國家中文標準交換碼(C N S 11 6 4 2)」,可以處理 4 8 , 0 2 7 個漢 字,雖然已能處理大多數中文字,唯一遺憾的是一般讀者使用的電腦,並無 該內碼,必須自行政院主計處電子處理資料中心下載「C N S 11643 中文標準 交換碼全字庫」,才能使用或顯示該字集,目前這個字集使用較多單位的是 戶政機關。近來資訊界比較推薦使用 U n i c o d e 當內碼,它是一個國際標準 碼,可以容納 7 0 , 0 0 0 字以上的漢字,並且可以處理多國語文,且在國際上 已經普遍使用,因此讀者端的電腦只要使用 Windows 2000 以上作業系統

(部分 Windows 98 作業系統也可使用),其電腦就可以輸入並顯示中文簡繁 體字與日韓文字,雖然有些讀者的電腦不能鍵入B I G 5 碼以外的字,但是能

(21)

接收主機端傳來的 Unicode 字碼,至少已能解決 BIG5 碼無法顯示中文字的 問題。國內主要的入口網站或新聞網站如「 PC Home 」或「東森新聞網」

等,已採用這種模式服務網友,只要在自己的電腦輸入「游錫」兩個字就可 以找到行政院長的資料,這時網頁如能正確顯示「游錫 憛v三個字者,大致 上可以肯定該服務主機是採用Unicode 內碼。

(二)檢索系統

1 . 同義字:當我們在網路上查詢資料時,如果系統主機沒有建置同義字對照表 時,使用者將會有些資料無法查到,例如「臺與台」、「豐與丰」、「莊與庄」

等,最常見的例子是當我們鍵入「臺灣」一詞查詢時,有些系統查不到以

「台灣」著錄的資料,因此如果系統能自動處理同義字,對於一般使用者將 有其便利性。

2 . 參照詞:參照詞表是針對自己開發的資料庫,建置一個可以相互指引的對照 詞,例如將「愛滋病」、「愛死病」、「後天免疫不全症後群」、「A I D S」設 定為參照詞時,則不論讀者輸入那一個詞彙,系統都會去查詢所有的相關詞 彙,這樣才能節省讀者之時間,又不會遺漏資料,但是系統維護人員經常必 須維護這個參照詞庫,才能順利達成服務讀者的美意。

3 . 權威記錄:權威記錄檔通常是使用在圖書館的圖書自動化系統,它可以針對 個人作者、團體作者、題名、標題等款目進行權威控制,舉作家「小野」為 例,所有他發表的作品,不論是用筆名「天牛」、「湯新」或者本名「李遠」

等,都可以透過權威記錄的控制,將其所有的作品一次檢索出來,雖然讀者 或許不知道「小野」還有其他的筆名,但是系統可以透過權威記錄檔,提供 較完整的檢索服務,讓讀者可以查獲這位作家的全部作品。再舉一個團體作 者的例子,例如「行政院文化建設委員會」、「文化建設委員會」、「文建 會」、甚至於將來如改制為「文化部」,都是指同一個單位,如果資料在建置 時已經將其權威記錄關係著錄,則日後查詢資料時不但可將這一單位不同時 期的資料一起檢索出來,而且日後果真升格為「文化部」時,也不需要逐筆 去修改原先已建檔的資料。

(三)系統管理

1 . 著作權:數位文件著作權的問題,可能比其他資訊技術更難克服,尤其目前 國內並無語言文字著作權仲介團體可以負責著作權授權與著作權費用分配事

(22)

宜,因此大多數的數位資料只能在圖書館內提供讀者服務,無法公開於網路 上,讓所有的民眾使用。這一兩年開始,出版社或雜誌社才開始注意著作權 的問題,有許多雜誌在邀稿時就聲明,該文件投稿後的著作權屬雜誌社或出 版社,或者要求作者同意讓該文件公開網站上,於是網路上的電子書及電子 雜誌如雨後春筍般的大量出現,至於較早期的出版品,即便是原發行單位,

也無法任意將書刊內容公開於網路上,這些早期的書刊,如果無法直接在網 路取得,將使電子化服務的成效打折,因此盼望語言文字仲介團體能早日成 立,才能解決授權問題,而將數位化文獻提供於網路上,當然屆時將會是有 償的資訊服務。

2 . 電子媒體保存:由於資訊技術發展速度超乎想像,資料設備與儲存媒體都有 一定之壽命,舉例來說早期的 5 又 1/4 軟式磁碟片,現在幾乎已經無法使用 了,而當初如果有重要的資料存放在磁片上,應該儘早複製於新的媒體,如 CD-ROM 或 DVD 上;再者一般大型主機大概的壽命大概不會超過1 0年,個 人電腦的壽命約 5 年,CD-ROM 光碟片的壽命大約只有 10 年,不管是主機 的更換或是儲存媒體的轉載,都是非常耗費人力的,尤其是主機的更換成本 更高,如果主機的作業系統或中文內碼必須更換,更需耗費人力撰寫程式進 行資料的轉出與轉入。前面提到資料備份的異地典藏觀念,也是近年來資訊 界較認真去執行的觀念,以前各機構資訊單位通常將備份資料存放於機房或 資訊室,但這種作法不一定保險,萬一遇上水災、地震、火災或其他意外 時,這些主要資料與備份資料統統毀於一旦時,試想不知該如何補救,如果 這些資料與民眾的權益有關,該機構將不容易善了,且不知要虛耗多少人 力、經費與時間,才能將資料重建起來,因此各機構應該要有電子媒體長久 典藏的正確觀念。

以上僅列舉一些數位化時可能遭遇的困難,供同道參考,唯資訊技術發展迅 速,說不定在未來三、五年內,這些障礙都已經排除,屆時從事文學史料數位化 者可以更安心的使用數位化系統。

八、 文學史料數位化的現況與發展趨勢

文學史料數位化在國內的發展,主要還是依賴政府的大力推動,例如國家圖 書館建置之「當代文學史料影像全文系統」,以及文建會積極推動的「全國文化

(23)

資料庫」,這些計畫都將會建置可觀的數位典藏成果,前者以優勢的圖書、期 刊、報紙典藏品,將文學資料加以分析整理、掃瞄建檔,對每一位作家皆用同樣 的尺度,竭盡所能的蒐集資料,那怕是小眾作家的相關資料,依然受到公平待 遇,是國內最具有代表性的文學史料網站之一。目前國家圖書館正進行作家資料 調查,希望作家們協助該館就已建檔之資料,進行資料審查與增補工作,以強化 該資料庫的時效性、正確性與完整性,讓全民分享文學殿堂豐碩的果實。

後者正積極建置各類型地方文獻數位化工程,並統籌為「全國文化資料庫」

建置計畫[ 1 9 ],正式以國家級的數位典藏計畫,保存地方文獻與語文,各相關機

構對於地方文獻蒐藏的資料類型,以照片最為普遍,其次分別為口述歷史、文 物、方志、族譜、歌謠/諺語、私文書、報告書、詩文、公文書、碑碣、繪畫、

見聞、海報傳單、書簡、戲劇、戰記、競選資料、日記、訃文、備忘錄等。「全 國文化資料庫」開始執行之後,除將繼續民國 8 8 年的建置「地方文獻數位化計 畫」的藏品,並擴增其藏品內容,所包括的資料類型有:音樂資料、美術資料、

戲劇資料、舞蹈資料、傳統藝術資料、文學資料、電影資料、建築資料等八大 類。其原始資料的來源有兩種:一為已經由中央與地方文化機關/單位收藏的公 藏文化資料,二為尚藏於民間的文化資料。待「全國文化資料庫」逐年將各地方 之文獻與文物建置後,文學工作者將有機會接近珍貴或未曾公開的文學史料。

至於「文建會」直屬機構「國立臺灣文學館」,雖仍在籌備階段(預計民國 9 2 年中開館),但也積極扮演文學史料數位化工程,如《臺灣文學年表》、《臺 灣文學作家作品集資料庫(作家全集)》、《臺灣文學辭典》之編纂計畫,都在規 劃建置當中,假以時日,必定有可觀的成果。

作家本人或其家屬在文學史料數位化領域的貢獻,也是不容忽視的角色,作 家個人網站上可以提供不少文學相關資源,如向陽、張曼娟、金庸、吳淡如、彭 懷真、廖玉蕙、琦君等之網站,相信未來還有更多的作家投入個人網站的建置,

讓讀者有機會在網路上親近作家。

民間文學雜誌業者雖然在不景氣的經濟環境下,慘澹經營,但多少都有一份 傻勁與執著,只要稍有財源,會毫不猶豫的投入數位化工程,如文訊雜誌、聯合 文學、橄欖樹文學月刊等雜誌。

[19]「全國文化資料庫」研究計畫網址:http://www.cca.gov.tw/news/2002/metadata.htm。

(24)

文學相關基金會與社團在文學史料數位化這個領域,也可以扮演重要的角色 與影響力,例如「國家文化藝術基金會」、「蔣經國國際文化交流基金會」、「賴 和基金會」等都長期支持文學相關活動,希望這些基金會能持續贊助文學相關活 動。

文學圖書業者:電子書的發展為雜誌出版業帶來一些生機,雖然國內網路行 銷市場還有許多拓展空間,但總是一個契機,若非網路購物行為糾紛多,其實網 路書店確實有發展的機會。

網路文學的品質雖然還需加強,卻提供一個業餘文學創作者發表作品的園 地,並開放網友討論網站上的作品,這是傳統文學出版品無法做到的,因此有人 將這種文學稱為「網路新文體」,這是由於網路的特質而衍生的新文學品種,不 管作者文學素養深度或文筆洗鍊程度如何,它已經在網路上開創一片新天地,其 中並不乏水平以上的作品,這種依賴網路生態的文學活動,將有繼續擴大的現 象。

著作權是網路發展最大的障礙,也是文學傳播媒介最大的致命傷,但著作權 卻同時保障文學創作者的權益,它像是一把刀子的兩刃,是一體的兩面,當我們 保護著作權人的時候,同時也限制了知識的傳播。我們一方面要鼓勵文字工作者 從事文學創作,並保障其智慧財產權,以獲取基本的酬勞,另一方面又為了要傳 播知識,希望能將文學書刊,免費開放於網路上,供眾閱覽,這真是兩難。將來 或許可以採行較折衷的方式,例如由語言文字仲介團體在網路上代為收取使用 費,再將其收益分配給作者或出版社,就能突破現有的限制,大大方方的在網路 上,提供文學書刊的內容。

文學網路未來的服務趨勢應該是朝個人化、多元化、資源分享與付費制等方 向演進。個人化網頁服務指的是個別化網頁設計,這個理念是為了讓每一位網路 使用者,進到該網站後,感受到個別性、獨特性,網站設計者特別營造一個個人 專屬服務之畫面,每一個會員或使用者,可以依照自己的喜好,設定畫面內容、

偏好的主題、或設定直接進入指定的網頁,而系統主機也會主動與該使用者打招 呼,例如多久沒有拜訪本網站或主動發 E - M a i l 提供該使用者偏好之訊息。在電 子商務網站上的個人化網頁服務,更會紀錄會員的消費偏好、消費能力等訊息,

提供網站經營者寶貴的網路行銷的資訊,目前國內文學網站上尚未提供個人化服 務,或許再過三、五年,讀者可以自行設定網站服務偏好,譬如有些讀者只偏愛

(25)

新詩,系統就可以設計成每當該讀者上網時,就將畫面指定到新詩網頁或某一位 詩人的網頁,享受到VIP 的服務。

網路服務多元化指的是大眾網站與小眾網站都有其生存的空間,各自建置文 學相關資源,各自服務不同類型之讀者,使文學網站多采多姿,造福廣大的網 友。

資源分享是網路資源提供者最期盼的合作模式,只要大家都使用 M e t a d a t a 格式建檔,有朝一日,讀者可以在甲網站可以檢索到乙網站及丙網站的資源。

「知識是無價的」,未來的文學網路服務,可能有部分文學資源是需要付費 的,才能在網路上取得,為了讓文字工作者獲得基本酬勞,支付必要的著作權使 用費,是可以接受的。當然讀者可以自行選擇網路上其他無償的資源或接受有償 的資源。

九、 結 語

[20]

網路世界的最大特點就是「變」,每天都在改變,一切都在改變,誰也無法 留住它,掌握它,唯有親近它、與它妥協或和平共存,才不會違背時代的潮流。

文學史料工作者通常對於資訊科技較為疏遠,這多少會影響數位化的推動腳 步與發展成果,其實科技與人文是可以相處融洽的,雖然資訊科技可能帶來社會 的失序、犯罪的溫床、價值觀的改變、倫理的喪失,但同時也帶動終身學習、遠 距教學、知識普及、資源共享的優點,這道理與「水火」是人類的生存的必要物 質,卻也是最大的災難來源相同,唯有善盡科技的優點,改善人類的生活品質,

才是雙贏之道。

梁實秋先生曾說過:「文學發於心性、基於人性,亦止於人性。」[ 2 1 ],何 懷碩先生也說過:「我們在文學藝術中看到人生的處境、人生的命運—看到我 們自己,這就是共鳴。」[ 2 2 ],可知文學是生活中不可或缺的一部分,作為文學 工作者當善盡一己之力,致力於文學史料保存工作,才能讓後代子孫了解先民的 文化活動與心路歷程。目前在各界的努力下,國內文學史料的數位化工作,雖然

[20]

由於本文撰稿時間倉促,且有些文學機構發展概況不易獲得資訊,文中如有不當之處,尚祈 各界不吝指教。

[21]《中華日報》,1996.4.7,19 版。

[22] 《中華日報》,1999.6.20,16 版。

(26)

有一些小小的成果,但距離虛擬網路文學圖書館的境界,還有一些障礙要克服,

且讓政府與民間通力合作,為國內文學活動注入新生命。

參考書目

1 . 王梅玲,〈數位館藏管理與館藏發展政策〉,《中國圖書館學會館藏發展理 論與實務專題研習班研習手冊》(臺北:中國圖書館學會,2 0 0 2)。

2 . 朱學恕,〈臺灣文學發展現況〉,《大海洋詩雜誌》,57(1998.10)。 3 . 余光中等,〈臺灣五十年來文學的發展〉,《幼獅文藝》,498(1995.6)。 4 . 須文蔚,〈數位文學的前世今生〉,《文訊月刊》,183(2001.1)。

5 . 陳昭珍,〈電子資源的長久保存〉,《佛教圖書館館訊》,25/26(2001.6)。 6 . 陳雪華,〈詮釋資料在數位典藏的應用〉,《中國圖書館學會數位化典藏與服

務專題研習班研習手冊》,(臺北:中國圖書館學會,2002)。

7 . 諸葛俊元,〈略論網路文學創作之現況〉,《國文天地》,190(2001.3)。 8 . 臺灣省文化處地方文獻數位化模式及相關標準研究小組,《地方文獻數位化

模式及相關標準研究報告》(南投:臺灣省文化處,1999)。

(27)

Abstract

The living image of a nation can be perceived from its literature. These works pass through each era among mainstream and non-mainstream cultures, and record the human spirit under the mutual influence of scholarly and non-scholarly fields.

They reflect the specific thoughts of an individual or the subconscious thoughts of a group of nations, and sometimes pure literature works are created with non-subjec- tive consciousness. Therefore one may understand the development and the evolu- tion of the thoughts of a region from its literature. Literature is an important resource when we study the history of a country. This paper explains the development of digi- tized literature in and around Taiwan over the past decade. From the definition of digital archives and the characteristics of digitization to the background and future trends of digital archives, new ideas of digital literature services and Taiwan experi- ences are provided.

Keywords(關鍵詞): L i t e r a t u r e;Literature Materials;Taiwan Literature;Digital Archives;

Digital Services

文學;文學史料;臺灣文學;數位典藏;數位服務

Chien-kuo Chuang:E d i t o r, Reference Department, National Central Library, R.O.C.;E - m a i l : ckchuang@ncl.edu.tw

The Digital Archives and Services of Contemporary Literature Materials

in Taiwan

Chien-kuo Chuang

參考文獻

相關文件

Animal or vegetable fats and oils and their fractiors, boiled, oxidised, dehydrated, sulphurised, blown, polymerised by heat in vacuum or in inert gas or otherwise chemically

Milk and cream, in powder, granule or other solid form, of a fat content, by weight, exceeding 1.5%, not containing added sugar or other sweetening matter.

First, these citations related to Laozi are classified into three types: borrowing Laozi to clarify the thoughts of Huayanjing, viewing Laozi as the thoughts of heretics, and

From an analysis of the highlights and thoughts of Venerable Master Hsing Yun's visits, we can discover the root of Fo Guang Shan's operational mindset.. Keywords: Hai-tian-you-zong,

For 5 to be the precise limit of f(x) as x approaches 3, we must not only be able to bring the difference between f(x) and 5 below each of these three numbers; we must be able

[This function is named after the electrical engineer Oliver Heaviside (1850–1925) and can be used to describe an electric current that is switched on at time t = 0.] Its graph

Reading Task 6: Genre Structure and Language Features. • Now let’s look at how language features (e.g. sentence patterns) are connected to the structure

 develop a better understanding of the design and the features of the English Language curriculum with an emphasis on the senior secondary level;..  gain an insight into the