圖書館記錄探勘系統簡介

第一節研究動機及目的

隨著網際網路的發展與電腦科技的日益進步，資訊數位化已成為世界的趨勢，電子圖書館也在這股資訊潮流下日漸成熟，而如何利用電腦技術以提昇圖書館對讀者的服務品質亦成為各圖書館努力的目標。

圖書館的目的是提供讀者良好的服務，協助讀者獲取資訊、運用資訊，從而產生知識。然而早在 1979 年美國 Pittsburgh 大學的調查報告[7]中指出，圖書館的館藏資源只有少數被有效利用，值此電子圖書館時代，為了讓讀者快速、有效、

完整地滿足其資訊需求，各圖書館必須善加應用資訊技術以有效幫助讀者使用館藏資源。

當圖書館想要廣泛地運用資訊技術實施讀者服務時，首要考量即是找出讀者迫切需求之服務及目前現行服務不足之處。在現今圖書館所提供的服務中，讀者往往會迷失在館藏檢索系統裡，因為檢索所得資源過多，讀者難以由書名、作者、

出版社等簡要資訊抉擇要借閱的館藏；再加上館藏數量漸趨龐大，若讀者不熟悉檢索系統的功能，常會找不到所需要的資源。要解決此一困境，圖書館可以透過對讀者興趣的了解，幫助讀者找尋館藏資源。

卜小蝶在[24]一文中提到，圖書館借閱記錄是讀者使用圖書館資源的最佳

「證據」，也是讀者積極滿足個人資訊需求的行為結果，這類資訊能反映使用者實際的資訊需求，因此對於掌握讀者興趣，進而作為加強圖書館資源利用的基礎具有一定的參考價值。除此之外，由於借閱記錄蘊含大量讀者與圖書館互動的歷史記錄，若能利用資料探勘(Data MIning)的技術從中挖掘隱藏有意義的資訊，不僅有助於讀者資訊需求的瞭解，還可視為加強圖書館資源利用的重要指標。

資料探勘(Data Mining)是知識管理的應用技術之一，其主要目的在探討如何從大量資料中，發掘出潛藏有用的資訊或規則，以提供決策參考之用。目前這類技術多半用於商業、醫學等資料量龐大又具有商機的領域上，如亞馬遜網路書店 (http://www.amazon.com)由銷售記錄發掘顧客消費的消費關聯性，藉此將關連性產品推薦給有相似購買行為的顧客。運用資料探勘，經營者可更深入了解客戶需求，甚至可提供量身訂作之個人化服務，亦即採用客戶關係管理 (Customer Relationship Management – CRM)的理念，以期增加客戶的滿意度與忠誠度，並確保在激烈商業競爭的環境裡獲利[27]。

群體化(Community)乃是電子圖書館時代讀者服務的未來發展方向之一，所謂的群體化即是社群的概念，因為知識的產生有時並非光靠單一的個體就能達成的，而是得藉由具有相同興趣、專長的個體彼此激發靈感、分享心得與知識方能加速知識的產出。本論文的目的即在於運用資料探勘的技術來探索讀者社群的持性，從而達成群體化的電子圖書館讀者服務。為達此一目的，我們建置一套協助館員瞭解讀者的興趣及需求的探勘系統，讓館員藉由分析借閱記錄找出讀者經常一起借閱的館藏，再將關聯性館藏推薦給借閱同樣館藏的讀者。由於所找出的關聯館藏只佔了整個館藏資源微乎其微的一小部分，並不能有效地提供讀者意見，

因此將中國圖書分類法加入分類階層探勘，並讓館員隨著分類階層設定不同的最小支持度門檻值，挖掘出最適宜的讀者借閱類別關聯性。如此一來，藉由借閱類別關聯性，根據讀者的借閱記錄分析興趣類別，進而推薦關聯類別的新進館藏給讀者，讓系統有效地提供更多更實際的借閱建議。

第二節研究方法及目標

本論文以交通大學圖書館的借閱記錄為基礎，運用資料探勘的技術，探索讀者借閱館藏及類別的關聯性，並運用探勘的成果來提昇圖書館的經營與服務。

本研究根據圖書館借閱記錄的特性，設計一套適合圖書館的資料探勘系統

「圖書館借閱記錄探勘系統」，簡稱「圖書館資料探勘系統」。藉由資料倉儲(Data Warehousing) [11] 的技術處理圖書館借閱記錄的前置作業，以及運用相關規則探勘(Association Rule Mining)演算法 H-Mine[14] 的技術找出借閱館藏的關聯性，

除此之外，並以 H-Mine 為基礎發展廣義相關規則探勘(Generalized Association Rule Mining)演算法及多重最小支持度廣義相關規則探勘(Generalized Association Rule Mining with Multiple Minimum Supports)演算法，以便找出借閱類別的關聯性。

在「圖書館借閱記錄探勘系統」發掘出讀者社群關係後，我們希望能運用這些成果達到以下目標：

n 提供讀者借閱館藏的建議：透過探勘讀者借閱關聯性，將關聯性館藏推薦給其他借閱同樣館藏的讀者。如：相關規則“5%有借閱過沉船的讀者也會借閱盜墓及老貓這二本書”，若有讀者借閱過沉船、盜墓或是老貓中的其中一本，則推薦另二本給該讀者。在讀者檢索沉船的同時，也可推薦其他關聯館藏如盜墓給讀者。

n 推薦讀者新進館藏：藉著探勘借閱類別關聯性，經由該讀者的借閱記錄或是個人化系統中的興趣記錄，推薦讀者可能有興趣的關聯類別新書。如：經由讀者的借閱記錄或個人興趣記錄得知讀者喜好借閱電腦科學類的書，而探勘得知借閱類別關聯性“借閱電腦科學類書籍的讀者也同時會對語文類及企業管理類的書籍有興趣”，因此若有電腦科學類、語文類及企業管理類的新書時，可發出新書通報推薦該讀者借閱。

第三節論文架構

本論文第二章是敘述資料探勘相關研究工作，簡介產生相關規則的知名演算法 Apriori 及我們所選擇適用於圖書館借閱記錄的相關規則演算法 H-Mine；第三

章我們提出以 H-Mine 為基礎的廣義相關規則演算法 H-Mine(Generalized)及多重最小支持度廣義相關規則演算法 H-Mine(MMS)；第四章說明實作的「圖書館借閱記錄探勘系統」，簡稱「圖書館資料探勘系統」；第五章是圖書館資料探勘系統效益評估；第六章則歸納結論與未來研究方向。

在文檔中圖書館借閱記錄探勘系統 (頁 10-14)

第一節 研究動機及目的

第二節 研究方法及目標

第三節 論文架構

第一節研究動機及目的

第二節研究方法及目標

第三節論文架構