第一節 研究動機
隨著網際網路和全球資訊網的蓬勃發展,資訊傳播不再是傳統平面媒體的特 權,人們已經漸漸習慣在全球資訊網上尋找自己想要知道的資訊。全球資訊網的 普及也促成了電子圖書館的日漸成熟,如何利用電腦與網路科技提昇圖書館對讀 者的服務(即圖書館的電子化服務)亦是各圖書館努力追尋的目標。
文獻上電子圖書館的相關名詞很多,諸如數位圖書館(Digital Library)、虛擬 圖書館(Virtual Library)、無牆圖書館(Library without Wall)等皆是。
American Digital Library Federation曾在 1998 年提出對數位圖書館(電子圖書 館)的定義[16][19]:
數位圖書館乃是擁有相關資源(包含軟硬體設備、網路、專業人士...等) 以執行下列任務的機構:對數位形式的館藏進行挑選、組織、提供使 用、解譯、傳播、保持完整性、長期保存等工作,並使這些數位形式 的館藏能為特定讀者群快速且經濟地運用。
從這個定義上來看,電子圖書館與傳統圖書館的任務與功能其實並無不同,
只不過電子圖書館所處理的乃是以數位形式的資料為主。根據以上定義,
Cleveland[15]提出了電子圖書館的幾項特性,其中之一為:
數位圖書館是傳統圖書館的另一面貌,其館藏包含電子式(與數位式) 以及印刷和其他(例如,影帶和聲音)媒材。
在胡述兆與吳祖善二位合著的「圖書館學導論」[18]中指出:「所謂的圖書 館,就是運用科學方法,採訪、整理、保存各種印刷與非印刷的資料,以便讀者 利用的機構。」而圖書館的功能則主要有[17]:(1) 收藏與保存,(2) 組織和呈現,
(3) 存取與檢索,(4) 分析、綜合與傳播。在前述定義中特別指明科學方法的運 用,我們認為所謂的電子圖書館,正是要求館員運用最新的電腦與網路科技來進 行各項(數位或傳統)資料的蒐集、組織、保存、傳播與利用,以完成圖書館被賦 予的功能,這正與 American Digital Library Federation 提出的定義不謀而合。
在實務上,究竟要如何實現電子圖書館呢?陳亞寧在「另類圖書館:電子圖 書館綜觀」[20]一文中提出以下推論:
綜上所述,我們可以看出,電子圖書館的主要元素有三,即電子化館藏 (E-Collection)、電子化作業(E-Operation),以及電子化服務(E-Service),因此若要 實現電子圖書館,則必須從館藏、作業、服務等三方面的電子化著手。
圖書館的一切作為都是為了提供讀者良好的服務,協助讀者獲取資訊、運用 資訊,從而產生知識。本論文即是著重於電子化服務,所謂的電子化服務,指的 乃是運用電腦與網路科技來從事圖書館讀者服務。我們認為群體化乃是電子圖書 館時代讀者服務的未來發展方向之一,所謂的群體化即是社群(Community)的概 念,因為知識的產生有時並非光靠單一的個體就能達成的,而是得藉由具有相同 興趣、專長的個體彼此激發靈感、分享心得和知識方能加速知識的產出。本論文 的目的即在於運用資料探勘(Data Mining)的技術來探索社群的持性,從而達成群 體化的電子圖書館讀者服務。
當圖書館想要既深且廣地運用電子技術來實施讀者服務時,首先一定要考量 讀者到底需要什麼服務、現行的服務有什麼不足之處?我們覺得,面對圖書館龐 大的館藏資訊,讀者往往不知哪些館藏是符合其需求的。以下茲列舉一些讀者常
u 電 子 圖 書 館 是 結 合 資 料 、 檔 案 、 典 藏 、 資 訊 、 知 識 、 服 務 以 及 作 業 的 集 合 體 。
u ELIB = Electronic Data/File/Archive/ Information/Knowledge + Automated/Electronic Service
+ Automated/Electronic Operation
遇到的情況:
1. 讀者難以決定要借哪些館藏:讀者在館藏查詢系統上檢索所得之館藏數 量非常大且雜,讀者往往很難決定要借哪些館藏。
2. 讀者不知道有哪些相關館藏:或許讀者事先已預設好要借的館藏主題,
但因不熟悉館藏系統的功能而漏找到一些相關的館藏,而這些相關的館 藏卻是對讀者的學習或研究很有幫助的。
3. 館藏數量漸趨龐大,讀者不知如何利用這些資源:圖書館長期經營後必 然會有館藏越來越多的傾向,此時有效率的管理是非常重要的,如果不 適時地給予讀者適當的建議,那麼,可能會有很多值得一讀的館藏不會 被讀者借閱。
有鑑於此,我們認為若能針對讀者的借閱行為傾向加以分析,藉由分析結果 適時地給予讀者館藏借閱的建議,將可改善前述情況。
本論文應用資訊科技(Information Technology)及企業化模式(Business Model) 來經營圖書館,利用資料探勘(Data Mining)的技術找出大多數使用者的借閱行為 傾向,以改善前述讀者於借閱館藏時所遭遇到的困難,並進一步提供讀者適時適 當的建議,提昇對讀者的服務。
資料探勘(Data Mining)也叫做資料庫探勘(Database Mining)或資料庫知識發 掘(Knowledge Discovery in Database)。簡單地說,資料探勘是從儲存於資料庫 (Database)、資料倉儲(Data Warehouse)或其他資訊儲存器(Information Repository) 的大量資料中發掘出我們感興趣的知識之處理過程。例如在超級市場上,我們可 以從商店的交易資料庫裡找出顧客的消費行為,藉這些行為來提昇商店的業績。
第二節 研究目的
本論文以交通大學圖書館的書目、館藏、交易歷史記錄為基礎,運用資料探 勘的技術探索交通大學讀者的社群特性,並運用資料探勘的成果來提昇圖書館的
經營與服務,期能使交通大學圖書館在交大讀者學術、知識的吸收和產出中扮演 更積極的角色。本論文擬探索的讀者社群關係包含:
1. 館藏借閱的共同性:有類似興趣的讀者通常所借閱的館藏也會很類似,
如何藉由資料探勘的方法把館藏借閱的共同性找出來?
2. 館藏借閱的順序:讀者借閱館藏可能會先借入門的再借深入的,如何藉 由資料探勘的方法把讀者借閱館藏順序的特性找出來?
當我們發掘出讀者的社群關係後,希望能運用這些社群關係達到下列目的:
1. 吸引讀者到館借閱:我們發現很多讀者從未借過館藏,要如何增加借閱 的讀者人數?
2. 提昇館藏借閱率:我們發現有很多館藏是未曾被借閱過的,要如何才能 把這些館藏推銷出去呢?
3. 提昇讀者忠誠度:我們發現很多讀者只借一、兩次就不再借閱,要如何 提昇讀者的忠誠度,使讀者能夠持續地借閱?
4. 協助館藏複本採訪政策:圖書館針對一本書所採購的複本數往往有限,
但有些熱門書讀者常常要預約很久才能借到,有些讀者因此放棄借閱。
要如何找出哪些是熱門的書?哪些書該多買一些複本?
5. 促進館藏流通率:很多熱門的館藏借出後往往會到應還日才歸還,其他 讀者要借閱便要預約很久才能借到,很多人因此放棄借閱。要如何增加 這些館藏的流通率,讓更多的讀者可以借到這些館藏?
第三節 論文架構
本論文第二章介紹相關研究工作,第三章描述資料探勘在圖書館上的應用,
第四章探討分析結果,第五章歸納出結論與未來研究方向。