• 沒有找到結果。

找出相關讀者群和建立館藏與讀者的表示法

第四章 系統實作

第三節 找出相關讀者群和建立館藏與讀者的表示法

在產生給讀者的推薦清單前,必須先找出協力式過濾所需要的相關讀者群及內容導 向過濾需要的館藏與讀者的表示法。

相關讀者群是用乏析式資料探勘來尋找,而在實作乏析式資料探勘時則參考了[3]

提出以先序樹實作 Apriori 的程式,加以改寫成可處理量化資料的乏析式資料探勘。當 最小支持度為 0.7 時,可? 將近三千名讀者找到所屬的相關讀者群,部份結果節錄如圖 14。在圖 14 中每行代表一個相關讀者群,裡面的項目代表讀者,在同一讀者群中的讀 者會被視為有相同興趣,在每一行最後在括號 “()” 中間的數字代表這個讀者群的支持 度。

圖 14 相關讀者群的頻繁項目集

在內容導向過濾中也需要用關聯規則探勘找出分類樹中各層的關聯規則,在此用的 相關規則探勘演算法是 H- mine。分別對每一層的交易集執行一次 H-mine,在各層應不 同的資料數量分別採取不同的最小支持度 (Min. Support)、最小確信值 (Min. Confidence) 和找出來的關聯規則,如表 20 所列。各階層的關聯規則格式和其確信值如表 21 所列 舉。

階層 最小支持度 (Min. Support)

最小確信值 (Min. Confidence)

關聯規則數量 (Rules Number)

第一層 0.1 0.8 18

0.823094 0.826161 0.805466

0.769517 0.758092 0.80084

… 0.818182 0.824561

為分類樹第三層中共有 1000 個分類,而這 1000 個分類各有各自的表示式,所以整個系 統共有 1000 個不同的表示式來表示所有圖書館的館藏。圖 15 是分類 312 下館藏的屬性 向量分布圖,其中圈起來的部份為類別 312 所在的地方,因為館藏屬於分類 312,所以 其值為 1。

圖 15 類別 312 的屬性向量表示式

把書的表示式 Booki建好後,根據 3.2 節中的方程式 9,可以利用讀者的借閱歷史檔 來產生讀者本身的興趣表示式 Readerj。但是在這裡除了利用借閱歷史檔來產生讀者的表 示式外,讀者還可以藉由調整自己的興趣來改變其興趣表示式。系統中設計了一個介面 讓讀者選擇自己真正喜歡的館藏類別,如圖 19。但因為一般讀者對中國圖書分類法不 是很熟悉,所以系統只提供第一層和第二層涵蓋範圍比較大的分類給讀者選擇,而且在 每一分類名稱之後也加注讀者在這一類中所借閱過的書數。如果讀者選擇了他有興趣的 類別,系統便會在原本讀者的表示式 Readerj 中對這些讀者選定的類別增加一定比例的 權重,而且這增加的比例會因為分類在分類樹上的層數而不同。如果讀者是選擇層數比 較高,範圍較廣泛 (General) 的分類,則增加的權重比例較低,如果是層數比較低,範

圍較小 (Specific) 的分類,則增加的權重比例較高。其理由在於若讀者能指定比較底 reader by chosen

class reader by chosen

class Reader'

jk