第一節 研究動機及目的
隨著網際網路的發展與電腦科技的日益進步,資訊數位化已成為世界的趨 勢,電子圖書館也在這股資訊潮流下日漸成熟,而如何利用電腦技術以提昇圖書 館對讀者的服務品質亦成為各圖書館努力的目標。
圖書館的目的是提供讀者良好的服務,協助讀者獲取資訊、運用資訊,從而 產生知識。然而早在 1979 年美國 Pittsburgh 大學的調查報告[7]中指出,圖書館 的館藏資源只有少數被有效利用,值此電子圖書館時代,為了讓讀者快速、有效、
完整地滿足其資訊需求,各圖書館必須善加應用資訊技術以有效幫助讀者使用館 藏資源。
當圖書館想要廣泛地運用資訊技術實施讀者服務時,首要考量即是找出讀者 迫切需求之服務及目前現行服務不足之處。在現今圖書館所提供的服務中,讀者 往往會迷失在館藏檢索系統裡,因為檢索所得資源過多,讀者難以由書名、作者、
出版社等簡要資訊抉擇要借閱的館藏;再加上館藏數量漸趨龐大,若讀者不熟悉 檢索系統的功能,常會找不到所需要的資源。要解決此一困境,圖書館可以透過 對讀者興趣的了解,幫助讀者找尋館藏資源。
卜小蝶在[24]一文中提到,圖書館借閱記錄是讀者使用圖書館資源的最佳
「證據」,也是讀者積極滿足個人資訊需求的行為結果,這類資訊能反映使用者 實際的資訊需求,因此對於掌握讀者興趣,進而作為加強圖書館資源利用的基礎 具有一定的參考價值。除此之外,由於借閱記錄蘊含大量讀者與圖書館互動的歷 史記錄,若能利用資料探勘(Data MIning)的技術從中挖掘隱藏有意義的資訊,不 僅有助於讀者資訊需求的瞭解,還可視為加強圖書館資源利用的重要指標。
資料探勘(Data Mining)是知識管理的應用技術之一,其主要目的在探討如何 從大量資料中,發掘出潛藏有用的資訊或規則,以提供決策參考之用。目前這類 技術多半用於商業、醫學等資料量龐大又具有商機的領域上,如亞馬遜網路書店 (http://www.amazon.com)由銷售記錄發掘顧客消費的消費關聯性,藉此將關連性 產品推薦給有相似購買行為的顧客。運用資料探勘,經營者可更深入了解客戶需 求,甚至可提供量身訂作之個人化服務 ,亦即採用客戶關係管理 (Customer Relationship Management – CRM)的理念,以期增加客戶的滿意度與忠誠度,並確 保在激烈商業競爭的環境裡獲利[27]。
群體化(Community)乃是電子圖書館時代讀者服務的未來發展方向之一,所 謂的群體化即是社群的概念,因為知識的產生有時並非光靠單一的個體就能達成 的,而是得藉由具有相同興趣、專長的個體彼此激發靈感、分享心得與知識方能 加速知識的產出。本論文的目的即在於運用資料探勘的技術來探索讀者社群的持 性,從而達成群體化的電子圖書館讀者服務。為達此一目的,我們建置一套協助 館員瞭解讀者的興趣及需求的探勘系統,讓館員藉由分析借閱記錄找出讀者經常 一起借閱的館藏,再將關聯性館藏推薦給借閱同樣館藏的讀者。由於所找出的關 聯館藏只佔了整個館藏資源微乎其微的一小部分,並不能有效地提供讀者意見,
因此將中國圖書分類法加入分類階層探勘,並讓館員隨著分類階層設定不同的最 小支持度門檻值,挖掘出最適宜的讀者借閱類別關聯性。如此一來,藉由借閱類 別關聯性,根據讀者的借閱記錄分析興趣類別,進而推薦關聯類別的新進館藏給 讀者,讓系統有效地提供更多更實際的借閱建議。
第二節 研究方法及目標
本論文以交通大學圖書館的借閱記錄為基礎,運用資料探勘的技術,探索讀 者借閱館藏及類別的關聯性,並運用探勘的成果來提昇圖書館的經營與服務。
本研究根據圖書館借閱記錄的特性,設計一套適合圖書館的資料探勘系統
「圖書館借閱記錄探勘系統」,簡稱「圖書館資料探勘系統」。藉由資料倉儲(Data Warehousing) [11] 的技術處理圖書館借閱記錄的前置作業,以及運用相關規則探 勘(Association Rule Mining)演算法 H-Mine[14] 的技術找出借閱館藏的關聯性,
除此之外,並以 H-Mine 為基礎發展廣義相關規則探勘(Generalized Association Rule Mining)演算法及多重最小支持度廣義相關規則探勘(Generalized Association Rule Mining with Multiple Minimum Supports)演算法,以便找出借閱類別的關聯 性。
在「圖書館借閱記錄探勘系統」發掘出讀者社群關係後,我們希望能運用這 些成果達到以下目標:
n 提供讀者借閱館藏的建議:透過探勘讀者借閱關聯性,將關聯性館藏推薦給 其他借閱同樣館藏的讀者。如:相關規則“5%有借閱過沉船的讀者也會借 閱盜墓及老貓這二本書”,若有讀者借閱過沉船、盜墓或是老貓中的其中一 本,則推薦另二本給該讀者。在讀者檢索沉船的同時,也可推薦其他關聯館 藏如盜墓給讀者。
n 推薦讀者新進館藏:藉著探勘借閱類別關聯性,經由該讀者的借閱記錄或是 個人化系統中的興趣記錄,推薦讀者可能有興趣的關聯類別新書。如:經由 讀者的借閱記錄或個人興趣記錄得知讀者喜好借閱電腦科學類的書,而探勘 得知借閱類別關聯性“借閱電腦科學類書籍的讀者也同時會對語文類及企 業管理類的書籍有興趣”,因此若有電腦科學類、語文類及企業管理類的新 書時,可發出新書通報推薦該讀者借閱。
第三節 論文架構
本論文第二章是敘述資料探勘相關研究工作,簡介產生相關規則的知名演算 法 Apriori 及我們所選擇適用於圖書館借閱記錄的相關規則演算法 H-Mine;第三
章我們提出以 H-Mine 為基礎的廣義相關規則演算法 H-Mine(Generalized)及多重 最小支持度廣義相關規則演算法 H-Mine(MMS);第四章說明實作的「圖書館借 閱記錄探勘系統」,簡稱「圖書館資料探勘系統」;第五章是圖書館資料探勘系統 效益評估;第六章則歸納結論與未來研究方向。