• 沒有找到結果。

內容導向的推薦方法

第三章 圖書館館藏推薦

第二節 內容導向的推薦方法

b u

fno b fno u

Rec( , )= ,

方程式 6 協力式過濾的推薦分數計算公式

其中 fnou代表讀者 u 的總同好數,fnou,b代表讀者 u 的同好中借過這本書的人數。

例如讀者 1 有 6 個同好,有一本書 A 被這 6 個同好中的 5 個人借過,則書 A 對讀者 1 的推薦度就為 Rec(1, A) = 5/6 = 83.33%。

綜合而言,本論文提出的協力式過濾推薦係先用關聯規則探勘找出跟讀者有相同興 趣的同好,再利用這些同好來幫讀者過濾圖書館的館藏,找出適合讀者的館藏。

第二節 內容導向的推薦方法

本論文修正[8]中所提出用來建立超級市場中商品和顧客模型的方法,將其應用在建 立圖書館中館藏與讀者的模型,因為超級市場和圖書館的情境有某種程度上的相似,所 以只要稍微加以修改就很容易應用到圖書館,並且符合實際需求。

首先關於建立模型基礎的分類樹,因為圖書館已有很好的館藏分類系統,所以很容 易就可以建立館藏的分類樹。在此我們以『中國圖書分類法』為基礎,取其前三層的分 類表來建立系統分類樹。第一層分成十大類,而在每一個分類之下都有十個子分類,因 此在第二層有 10×10 = 100 個分類,第三層則有 100×10 = 1000 個分類。根據[8]的概念,

本論文系統中的每一個物件都是以一個具有 1000 個屬性的向量來表達。

在? 每一個物件找出他們的表示式之前,需要先找出每一層分類間的關聯規則,因 為我們所採用的分類樹是三階層的架構,所以必須分別找出這三層間各自的關聯規則。

假設用來找出分類間關聯規則的交易集是以一個讀者在 120 天內的借書為一筆交 易,交易中的項目為這段期間內該讀者借閱過的書,如表 16。

交易編號 項目群

T001 000 0034, 803.1 6000 v.20, 805.103 0725, 811.9 7531

T002 310.84 0257, 312.92 3421 c.2, 313 2341, 448.6 5423, 471.55 2876 T003 005.1 4444, 010.307 8700, 020.7 1080, 889 8769 v.2, 890 8728-1 v.1 T004 312.91695 5202-2, 313.98 4005-2, 861.57 6584 v.55, 862.57 0021 v.5 T005 030.8 4500 v.2, 080.25 1557 v.9, 312.33 5214

表 16 以書為交易項目的交易集

在表 16 中每筆交易中的書都是以索書號來表示,因為索書號中包含了分類上的意 義。以中國圖書分類法為主體的索書號分成三個部份,第一部分為實際的分類號,第二 部份是代表作者或叢書,最後是代表其他資訊。以索書號“030.8 4500 v.2”為例,“030.8”

是該本書在中國圖書分類法中的分類號,“4500”指的是作者或叢書名的編號,最後“v.2”

代表其他的資訊,例如在這裡“v.2”是代表第二冊。在交易集中我們將只取分類號的部份。

中國圖書分類法是一種十進位的分類,每一層可以有 0~9 的編號,而分類號的長度 可以依照需要增加。但因為我們的分類樹只用到其最上面三層,所以最多只需取分類號 中前三個數字就可以了。例如第三層也就是最底層的交易集中,每筆交易的項目是以每 本書的索書號前三碼當代表,如表 17;而第二層和第一層交易集中的項目也分別取索 書號的前兩碼和第一碼來表示,如表 18 和表 19。

交易編號 項目群 項目群投影

T001 000, 803, 805, 811 000, 803, 805, 811 T002 310, 312, 313, 448, 471 310, 312, 313, 448, 471 T003 005, 010, 020, 889, 890 005, 010, 020, 889, 890 T004 312, 313, 861, 862 312, 313, 861, 862 T005 030, 080, 312 030, 080, 312

表 17 探勘第三層分類所需的交易集

交易編號 項目群 項目群投影 T001 00, 80, 80, 81 00, 80, 81

T002 31, 31, 31, 44, 47 31, 44, 47

T003 00, 01, 02, 88, 89 00, 01, 02, 88, 89 T004 31, 31, 86, 86 31, 86

T005 03, 08, 31 03, 08, 31

表 18 探勘第二層分類所需的交易集

交易編號 項目群 項目群投影

T001 0, 8, 8, 8 0, 8 T002 3, 3, 3, 4, 4 3, 4 T003 0, 0, 0, 8, 8 0, 8 T004 3, 3, 8, 8 3, 8 T005 0, 0, 3 0, 3

表 19 探勘第一層分類所需的交易集

我們採用[20]所提出來的 H- mine 作為探勘關聯規則的演算法,其原因是這種演算法 不需要產生候選項目集,可以有效率地找出關聯規則。

找出每一層的關聯性規則後,就可以開始建立每本書的表示式。書 i 的表示方法如 下:

Booki = (w(L3C1, i), w(L3C2, i), … , w(L3Ck,i), … , w(L3Cn, i))

方程式 7 書籍屬性向量表示式

其中 L 是代表階層 (Level),C 代表分類 (Class),L3在這裡代表第三層,L3Ck代表 第三層中第 k 個分類,而 w(L3Ck,i) 代表是 Booki在第三層第 k 個分類的權重 (Weight)。

根據 2.4 節中[8]提出的方程式 1 加以修改以符合圖書館的需要,我們提出計算 w(L3Ck,i) 的公式如下,其中 Lp(a) 代表書或分類 a 在第 p 層所屬的分類:

 (within

) (within ) (within

) (within ) (within

) (within ) reader books