• 沒有找到結果。

資料探勘在圖書館的應用

壹、書目探勘學(BIBLIOMINING)

書目探勘學(Bibliomining)一詞是 Scott 與 Stanton 於 2003 年首先提出,

在此之前有關資料探堪應用於圖書館領域的研究已經有一些成果,只是研究 人員所用的詞彙,均是以圖書館的資料探勘(Data Mining in Library)來呈 現,因此Scott 與 Stanton 於 2003 年首先創建了書目探勘學(Bibliomining)

一詞,這個名詞的定義就是利用資料探勘 (Data Mining)及書目計量 (Bib liometric)工具於圖書館服務所產生之資料的應用,開創圖書館管理與服務一 新的研究領域,以下針對書目探勘作深入的分析與探討。

一、 何謂書目探勘

書目探勘學始祖Scott Nicholson,是這樣解釋的「書目探勘學就是將資 料探勘技術應用於圖書館」,[58] 更進一步說明「書目探勘學是一種結合資 料探勘技術、書目測量學、統計學及提出研究報告的工具,為了是要在圖書 館的系統中萃取出讀者的基本行為模式」。[58] 藉由書目探勘我們可以更深 層的認識有關於讀者個人化的需求或是行為,以利圖書館的經營者對於經營 圖書館做出更明確的決策建立(Decision-Making)。所以說,書目探勘又稱 為圖書館的資料探勘,就是應用資料探勘技術及書目測量學(Bibliometric)

工具來發掘出增進圖書館服務的有用資訊。[57]

二、 書目探勘的目的

Schulman(1998)在研究中提出,若圖書館已有資料量極大或具特定用 途的資料庫在運作中,圖書館的管理者應會考慮到建置一個決策支援系統,

而且當資料庫持續的成長或更新時,這時絕不可能再利用傳統人工的方式,

來掌握不斷變動的使用者行為模式及趨勢,同時也沒有辦法迅速的調整出最 佳的館藏發展方向,並即時提供最新的資訊服務,所以利用資料探勘技術來 支援決策,以瞭解圖書館使用者的行為,而所探勘出來的結果,就可讓圖書 館重新規劃館藏發展方向與政策的制定,並能根據所瞭解的使用者行為來設 計圖書館相關活動。[63]

Guenther, K.(2000)指出為了要確定圖書館的服務與館藏是否合乎需 要,就要先瞭解使用者的需求是什麼,為了要做出正確的館藏發展政策,就 要先瞭解使用者的資訊需求,因此對於圖書館的管理者而言,可以利用書目 探勘來取得所需要的資訊。[43]

Nicholson(2003)提到圖書館人員想要在資料庫中獲取資訊,可以利用 敘述統計方法或是資料探勘技術,然後發掘出使用者的行為模式,瞭解這些 行為模式的目的有以下幾個幫助:[56]

1. 對於館藏政策有更好的決策。

2. 讓圖書館的服務機制更合理化。

3. 制訂適切的圖書館服務項目以因應網際網路的時代。

4. 深入的瞭解使用者使用圖書館的模式。

書目探勘分析可以找出有用的模組在圖書館的經營上,而且發掘出來的 模組有三個顯著的效益:[57]

1. 有利於改進圖書館的服務,朝向個人化服務。

2. 有利於圖書館管理者在進行決策建立時,能獲得更有價值的參考資 訊。

3. 藉由圖書館使用者行為的書目探勘所發掘出來的行為模組,有利於 圖書館建立更符合需要的服務項目。

因此藉由書目探勘,我們可以清楚的洞悉使用者的真正需求為何,並提 供適切的服務,也能瞭解圖書館本身所制訂的制度是否符合讀者的需要。

Christos Papatheodorou , Sarantos Kapidakis, Michalis Sfakakis, Alexandra Vassiliou(2003)提到,因為圖書館資料的數位化與網際網路的出現,使得 研究圖書館使用者行為的分析迅速發展,藉由分析數位化資料中的紀錄,利 用資料探勘的技術,研究者可以找出使用者的共同行為,建立出一套有意義 的群組關係的資訊來提升資訊的取得。分析的結果也可以找出圖書管理重要 的工作項目以及建議工作的可行性方式。所建立的使用者行為群組關係意味 著使用者的資訊需求與諮詢行為,通常這樣的研究分析,對於圖書館及其使 用者有以下三個助益:[59]

1. 服務的最佳化:他可以幫助管理者重新制訂符合各類使用者需要的 館藏政策、權威資料以及使用者介面。

2. 支援決策:幫助管理者在作圖書館決策時有一個有效的參考資訊。

3. 個人化:藉由推薦相似的主題,幫助使用者易於找出他有興趣的資 訊。

藉由以上分析可以瞭解到,藉由資料探勘技術的協助,圖書館可以獲得 決策的支援,同時更加瞭解圖書館使用者的行為,以便制訂更符合使用者需 要的服務項目與制度,而且資料探勘亦能讓圖書館重新規劃館藏的發展方 向,並根據所瞭解的使用者行為及經過探勘所得到的資訊,合理分配圖書館 的資源。

三、 具探勘價值的圖書館資料

圖書館所能使用的資料探勘技術相當的多,依據圖書館所需的管理目標 及決策項目而有不同的使用方式,不過不管技術是如何,原始資料才是探勘 時的基礎,選擇適當的資料來作適當的分析,才可以獲得正確且合於需求的 訊息,因此根據圖書館相關的電子資料庫,可以將資料的來源分為幾大類:

[22]

1. 圖書館自動化系統之「圖書借閱記錄」

在Larsen、Mancini、Atkins 及 Peters 的文章中均提到利用圖 書館自動化系統內的資料,可以有利於獲取管理資訊,提升管理績 效以及制定管理決策項目。[52]、[54]、[35]、[61]

圖書館的自動化系統中,最值得探勘的就是圖書流通模組,因 為圖書借閱記錄向來是讀者實際使用圖書館資源的「證據」,也是 讀者滿足個人資訊需求的行為結果,其中潛藏大量圖書與讀者監互 動的歷史紀錄,以及有意義的關係或規則。因此,圖書借閱記錄能 反映讀者的實際資訊需求,對於掌握讀者興趣,進而作為加強圖書 館資源利用之基礎,具有一定的參考價值。[2]

同時,為瞭解讀者特性與借閱間的關係,研究中可以將讀者的 興趣項目(如讀者興趣記錄檔)及特性項目(如讀者記錄檔中的性 別、教育程度)加入其中,以瞭解不同社群間的資訊需求是否有不 同的趨向。

2. 電子資源使用統計

現今網路資訊發達,資訊量激增,同時電子資源也不斷的被開 發出來,因此圖書館的經營方式不可能再將服務的項目只集中於有 形的書本之上,對此BanerJee(1998)提到,即使紙本資料未來仍 是圖書館重要的館藏形式,但是電子形式出版品的資訊量將大大的 增加,尤其電子資源是沒有時間與空間限制的,於是透過網路使用

圖書館資料庫檢索、電子期刊等電子資源的使用者,將會是有增無 減的。[36]

Peters(1996)指出電子資源使用記錄可以讓圖書館進行電子 資源採購的效益評估,以作為圖書館經營者管理資訊系統的基礎,

而以往圖書館員憑藉直覺與經驗來執行館藏發展工作,現在可以利 用此一科學的方法協助進行。[61]

雖然圖書館的借閱記錄取得容易且資料量大,有利於資料探勘 的進行,但是圖書館為了要提升全面性的服務品質,則不可忽略電 子資源的紀錄統計資訊,讓電子資源的服務也能正確符合讀者的需 要。

另外,圖書館網站上的登錄記錄檔(Web-Log)也是瞭解使用 者使用圖書館資源的重要參考依據,尤其是電子資源的使用上,藉 由登錄記錄檔的分析探勘,圖書館的決策者可以瞭解哪些電子資源 使用率較高,哪些服務在網站上常被使用,藉此可以發現圖書館服 務的主要項目,並提供足夠的資源以滿足使用者的資訊需求。

3. 其他項目的資源

除了上述的紀錄之外,Lawrence, S., Giles, C. L., & Bollacker, K.

(1999)以及 Ronald, N. K., J. Antonio del Rio, James, A. H., Esther, O. Garcia & Ana, M. R.(2001)研究中指出,圖書館可以利用研 究論文中的參考文獻(Citation),來作分析探勘,以瞭解現在目前 的研究趨勢,以及確認新興的研究領域,同時也可以瞭解到哪些參 考文獻頻繁的被使用。藉由以上的分析,除了可對研究的趨向有所 瞭解之外,也可以利用所的得結果來作為研究領域的分類,將所得 的結果作為讀者書目推薦的參考,因為這樣的資料是直接由研究者 的研究資料所客觀分析的,具有極大的參考意義。所以,利用參考 文獻分析,可以得到以下的幾個重要資訊。[53]、[62]

A. 瞭解文章之間的相關性質。

B. 讓研究者可以有個觀念在文章出版時,注意到校正與修改的工 作。

C. 在前期研究工作進行時,可以得到有意義的文章作參考以提升 研究內容。

D. 縮短找尋資料時所需耗費的時間成本。

四、 書目探勘的過程

書目探勘是將一個大型的研究過程切割成很多的小部分,整個過程我們 稱之為資料庫中的知識發現(Knowledge Discovery in Databases,簡稱 KDD),以下介紹在圖書館的環境中如何進行資料庫中的知識發現。[59]、

[57]、[43]

1. 確定主題(Identify Topic)

第一步就是要確定書目探勘計畫所要探究的主題是什麼。書目探 勘包含兩種形式,預測性的跟描述性的,預測性的書目探勘可以從過 去的資料或是當前的狀況中去推測未來所可能發生的事件,這在過去 的測量技術或是小型的資料中是無法達成的;描述性的書目探勘是在 探究當前的狀況。

2. 建立資料倉儲(Create Data Warehouse)

資料的來源可以讓所要研究的主題被肯定,這樣的資料會從適當 的系統中萃取出來而且會將所有資料相加到單一的資料倉儲之中。另 外在資料倉儲的資料是整理過的而且欄位中遺失的數值也會經過處 理。這個過程將會佔去整個書目探勘過程80%的時間,然而最後成功 的關鍵就是這個步驟。如果圖書館的管理者認為書目探勘是重要的,

資料的來源可以讓所要研究的主題被肯定,這樣的資料會從適當 的系統中萃取出來而且會將所有資料相加到單一的資料倉儲之中。另 外在資料倉儲的資料是整理過的而且欄位中遺失的數值也會經過處 理。這個過程將會佔去整個書目探勘過程80%的時間,然而最後成功 的關鍵就是這個步驟。如果圖書館的管理者認為書目探勘是重要的,

相關文件