• 沒有找到結果。

排序分數度量值正規化計算公式

第六章 結論與未來研究方向

方程式 15 排序分數度量值正規化計算公式

×

=

a a

a a

R R R

100 max

方程式 15 排序分數度量值正規化計算公式

平均滿意度的計算較為簡單,純粹統計讀者回應滿意度的平均值。先算出每個讀者 的滿意度平均值為其個人滿意度,再計算所有讀者個人滿意度的平均值,最後計算出來 的值即為我們需要的所有讀者對系統推薦館藏的平均滿意度。

第三節 結果分析

在交通大學浩然圖書館的個人化館藏推薦系統中,我們收集 415 位讀者對系統推薦 館藏的滿意度回應後,利用平均誤差值、排序分數度量值和平均滿意度這三種方法來判 斷讀者對這個個人化館藏推薦系統的滿意度,結果如表 28。

評估方式

Top N 平均誤差值 排序分數度量值 平均滿意度

Top 10 0.117571 0.827082 0.672096 Top 20 0.111500 0.764413 0.671700 Top 30 0.110378 0.734757 0.670155 Top 40 0.108454 0.706947 0.670730 Top 50 0.108790 0.685876 0.670002

表 28 系統滿意度調查結果

表 28 中的 Top N 代表取系統給讀者的前 N 名推薦的書籍滿意度,例如 Top 10 代表 取系統給讀者的推薦中,推薦排名在前 10 名的書籍滿意度來計算。

圖 21 為平均誤差值結果的折線圖,誤差值大約落在 0.1 和 0.12 之間。因為系統中 給予讀者選擇的滿意度,每個區間相差 0.2,所以誤差 0.1 代表系統的推薦分數和讀者選 擇的滿意度差距仍在一個區間誤差內,代表誤差仍在可接受的合理範圍內。

0.100 0.105 0.110 0.115 0.120 0.125

10 20 30 40 50

Top N

平均誤差值 (MAE)

圖 21 Top N 的平均誤差值

排序分數度量值的結果如圖 22 所示,在 Top 10 得到最佳值 0.83,之後排序分數度 量值隨推薦增多而降低,在 Top 50 得到最低值 0.69,變動的範圍約在 0.15 以內。

0.60 0.65 0.70 0.75 0.80 0.85 0.90

10 20 30 40 50

Top N

排序分數度量值 (RSM)

圖 22 Top N 的排序分數度量值

圖 23 中的結果顯示讀者平均滿意度大約都維持在 0.67 左右,介在滿意度普通 (0.5) 和滿意 (0.7) 之間。當推薦數多時有稍微降低的趨勢,可是變動並不劇烈,這代表我們 的推薦中不管排序前後,讀者喜好程度都差不多,這個現象同時反應出優缺點。優點是 推薦的館藏讀者普遍喜歡,而缺點是推薦排序較高的推薦並沒有得到比較高的滿意度。

0.66 0.67 0.67 0.68 0.68

10 20 30 40 50

Top N

平均滿意度 (Average Satisfaction )

圖 23 Top N 的讀者平均滿意度

從以上的平均誤差值、排序分數度量值和平均滿意度這三種評估的結果,可看出我 們所提出的圖書館個人化館藏推薦系統普遍符合讀者的興趣,達到預期的效果。

第六章 結論與未來研究方向

第一節 結論

本篇論文結合了協力式過濾和內容導向過濾,提出了一個適合圖書館環境的圖書館 個人化館藏推薦系統,並實作在交通大學浩然圖書館的 myLibrary 個人資訊環境上。

在推薦方法的應用上,協力式過濾方面以乏析式資料探勘找出讀者間的關聯性,使 興趣相近的讀者能彼此分享資訊,互相推薦館藏。而內容導向過濾方面則建立一個適合 圖書館館藏環境的系統模型,分別找出館藏的屬性向量表示式及讀者的興趣向量表示 式,使系統能有效地依照讀者興趣來推薦館藏。

圖書館個人化館藏推薦系統實作在 myLibrary 上,同時提供了以下幾個功能:

1. 根據讀者興趣提供推薦:先由協力式過濾找出推薦清單,再以內容導向過濾排 序,能有效找出符合讀者興趣的館藏。

2. 讀者自訂興趣:讀者可依系統提供的興趣選擇功能改變自己的興趣,進而更新 自己的個人興趣檔案,影響系統館藏推薦的結果。

3. 提供書評簡介:在推薦呈現的頁面中,有提供書評簡介的超連結,但因為圖書 館內並沒有書評簡介的資料,所以我們以書籍的國際標準書碼 (ISBN) 或書名 當關鍵字,到網路書店上查詢該推薦書籍的相關資料。當讀者對系統推薦的書 籍沒有概念時,可以參考這些資料來判斷自己是否有興趣。

最後在系統評估的結果上,我們得到的平均誤差值、排序分數度量值和滿意度都達 到不錯的效果,證明這個圖書館個人化館藏推薦系統確實可行,能帶給讀者一個新的管 道來接觸圖書館的館藏。

在未來的數位圖書館中,圖書館將面臨到和網路商店類似的問題,例如網路商店缺 乏店員來推銷產品,數位圖書館在網路上也沒有館員來協助讀者找尋資料。因此如何能 將數位圖書館的功能做到完整,使讀者不需要實際館員協助就能順利使用圖書館的資 源,或者如何能用新的技術在數位圖書館中建立虛擬館員模仿實際館員給予讀者協助,

都是將來數位圖書館必須克服的挑戰。這裡我們提出的圖書館個人化館藏推薦系統,就 是在這方面做努力,希望能幫助讀者找出圖書館中符合興趣的館藏,節省讀者搜尋的時 間,增進圖書館與讀者的互動,使讀者能更方便使用圖書館資源。

第二節 未來研究方向

這個圖書館個人化館藏推薦系統,雖然在效能評估的結果上有不錯的結果,但是這 其實只是推薦系統在圖書館上的初探而已,事實上仍有很大進步的空間。根據系統實作 的心得及讀者回應的意見,我們認為還有以下幾點值得當作圖書館個人化館藏推薦系統 以後改善的方向:

1. 增加探勘相同興趣讀者群的深度:在協力式過濾中,屬於同一群的讀者因為借 的館藏類似,所以推薦的館藏會比較集中,有助於提高在協力式過濾的推薦分 數。利用關聯規則探勘時,如果能盡量找出較長的頻繁項目集,使同一群的讀 者數量能增加,則推薦出來的館藏種類會比較集中,更符合讀者興趣。

2. 讀者借閱書籍數量:當探勘讀者間的關聯規則時,我們聚集交易改以類別為交 易基礎,並正規化項目出現次數為比率。但在事實上這種轉換可能會將一些原 本在數量上可呈現的資訊遺失了。例如在類別 A、B 和 C 中,讀者 1 分別借過 2、3、5 本書,讀者 2 分別借過 20、30、50 本書,讀者 3 分別借過 20、20、20 本書,若從比例上來看讀者 1 和讀者 2 具有相當高的興趣相關,但從數量上來 看則讀者 1 和讀者 3 的興趣可能比較相似。所以如果能將這些數量所代表的意 義也能納入關聯規則探勘時的考量,將可使探勘出來的結果更具意義。

3. 同好的興趣相似強度:目前我們在協力式過濾中,會把每個同好在推薦中所佔 的份量當作相同,沒有考慮到讀者與每個同好間的興趣相似強度應該不盡相 同。當我們在找出相同興趣的讀者群時,其實可以發現每個讀者群的支持度不 同,代表其興趣相似度是不同的。如果能將這些資訊加入協力式過濾中,應該 可以得到更準確的推薦結果。

4. 增加內容導向過濾的分類:目前在內容導向過濾的分類有 1000 類,但由於圖書 館館藏並不是平均分配在每個分類中,所以有些分類館藏特別多,造成目前使 用的分類不足以區分該分類下的館藏。如果可以增加分類的數量,甚至只針對 某些館藏較多的分類下增加分類數量,使內容導向過濾能有效區分該分類下館 藏的不同,將有助於提高內容導向過濾推薦的準確度。

5. 西文圖書推薦:現在因為內容導向過濾中採用的分類是中國圖書分類法,所以 無法將以美國國會圖書分類法分類的西文圖書納入推薦。如果可以整合中國圖 書分類法和美國國會圖書分類法,找出彼此分類互相對應的方法,則系統就可 以增加西文圖書的推薦服務。

6. 已閱讀過或擁有的圖書:給讀者的推薦基本上都是不在讀者借閱歷史中的館 藏,可是事實上有些推薦雖然不在讀者的借閱歷史中,但讀者卻早已閱讀過或 擁有了。所以系統應該提供選項使讀者可以消除這些推薦,甚至我們可以收集 讀者對這些已閱讀過或擁有的圖書的喜好程度,這些資訊可以更有效反應讀者 的實際興趣,將有助於系統判斷讀者的興趣。

7. 個人興趣選擇:系統目前供讀者選取個人興趣的分類是以中國圖書分類法為標 準,可是事實上許多讀者根本不了解這種分類法,因為這種分類法不夠直覺。

將來應該提供給讀者選擇的分類能盡量一般化、直覺化,然後再由系統將讀者 所選擇的選項對應到中國圖書分類法中或者實際需要的分類表上。

8. 滿意度的選擇:在系統滿意度評估上,滿意度的預設值應設為空值,當讀者有 親自選擇滿意度時才記錄讀者給予的值,避免影響評估的客觀性。另外,滿意 度的選擇區間可以縮小,使讀者可以選擇更詳細的滿意度,例如現在有五種滿

意度可以選擇,每個滿意度間相差 0.2,將來可以改為有十個滿意度供選擇,每 個選項之間差距 0.1。但提供給讀者選擇的滿意度間距仍不宜太小,避免造成讀 者選擇上的困擾。提供恰當的滿意度選擇格式,能有助於得到更準確的系統評 估數據,以當作之後系統改進的參考。

9. 考慮讀者興趣與時間之間的關係:有時候讀者興趣會隨時間改變而變更,這點 可以從讀者的借閱歷史中察知。所以當我們建立讀者的個人興趣檔時,可以考 慮借閱書籍與時間的關係,在不同時期借的書其重要性應該給予適當分配,例 如最近借的書可能比較能反應讀者現在的興趣,可以給予較高的重要性比重。

10. 由回應滿意度調整興趣:讀者所回應推薦的滿意度都含有讀者的興趣在內,這 些資訊可用來調整讀者的個人興趣檔,使個人興趣檔能更切合讀者興趣。

以上幾點都是目前的推薦系統中還未完成的工作,有些可以增加推薦的準確度,有 些可以更準確判斷出讀者的興趣,如果能夠一一實作完成必定可以再次提升推薦效能,

? 讀者提供更適合的館藏推薦。