個人化推薦系統

第二章相關研究工作

第二節個人化推薦系統

推薦系統隨著電子商務而蓬勃發展，有相當多的研究和各式各樣的實作系統，同時也有很多推薦系統已經實際在線上運作了。在[24]這篇論文中整理出了一般電子商務上的推薦系統架構，主要把推薦系統分成三大部分，分別為輸入和輸出 (Functional I/O)、

推薦方法 (Recommendation Method) 和其他設計考量 (Other Design Issues)，依序介紹如下：

2.2.1 輸入和輸出

首先，第一部分的輸入和輸出指的是系統需要哪些關於顧客的資訊，以及推薦結果如何呈現給顧客。在輸入這方面包含目標顧客的輸入 (Target Customer Inputs) 和社群資訊的輸入 (Community Inputs) 這兩種。

目標顧客的輸入指的是顧客的興趣輸入，從顧客特意或不經意的情況下，系統可以取得顧客的興趣。有幾種方式可以得到關於顧客興趣的資訊：

1. 直接詢問顧客興趣 (Explicit Navigation)：當顧客在網路商店上瀏覽時，直接要求顧客填入或選擇他們有興趣的商品類別，明確指出他們的興趣所在。通常是在顧客加入會員時，會要求顧客填入一些自己的興趣。

2. 網頁瀏覽記錄 (Implicit Navigation)：由顧客瀏覽過的商品網頁有助於得知顧客感興趣的商品種類。所以分析顧客在網站上的網頁瀏覽記錄，也可以判斷出顧客的興趣。

3. 查詢關鍵字 (Keywords and Item Attributes)：顧客查詢商品時所使用的關鍵字或商品種類。

4. 商品評分 (Rating)：顧客對使用過或購買過的商品的評價。

5. 購買記錄 (Purchase History)：顧客在商店裡曾購買過的商品和時間。

這些顧客所留下來的資訊，都透露著顧客的興趣和商品偏好。善用這些資訊，則推測出來的使用者興趣將更貼近使用者的真正興趣。

社群資料的輸入指的是一般大眾對商品的喜好，在目標顧客的輸入中主要目的是取得顧客的資訊，而社群資料的輸入則是想取得商品的屬性資訊。社群資料包含以下幾種：

1. 商品屬性 (Item Attribute)：包含商品所擁有特定的顧客群，和商品所屬的分類。

2. 熱門商品 (External Item Popularity)：銷售量較高的商品，通常為一般大眾普遍喜歡或在某些時節有特殊需要的商品。

3. 社群購買記錄 (Community Purchase History)：由結合所有個人的購買記錄所組成，可以找出商品銷售的趨勢和商品間的相似度，也是一種隱性的商品評分。

4. 商品評分和心得感想 (Rating and Text Comments)：社群對商品的喜好程度及其評論，有助於突顯商品價值。

收集個人和社群的輸入資訊加以分析，對了解顧客的興趣和分析商品的屬性有很大的幫助，這些收集來的相關資訊都有助於使推薦系統能做出最合適的推薦。

關於輸出部分，指的是要如何把推薦的結果呈現給顧客，通常是推薦系統中最後的步驟，但也是最關鍵性的步驟。因為如果沒有用適當的方式把推薦呈現給顧客，那可能會使顧客沒機會接觸到這些推薦，即使顧客得到推薦也會影響顧客對這些推薦的印象，

使得推薦無法達到預期的功效。推薦的輸出會根據商品不同的性質 (Type)、推薦的數量 (Quantity) 和呈現給顧客看的形式 (Look of Information)而有所不同。通常輸出的方式可分為建議 (Suggestion) 和預期 (Prediction) 這兩種。建議是指給顧客一個未排序過的推薦清單，讓顧客檢閱其中是否有符合需要的商品，避免因為清單中前幾個推薦不滿意而使後面的推薦不被參考。而預期這種方法所給的推薦清單則是有排序過的推薦，甚至會列出系統預期顧客可能的喜好程度，使顧客知道各個商品的推薦強度。

2.2.2 推薦方法

第二部分推薦方式指的是如何找出顧客感興趣的商品並列出推薦清單。推薦方法是推薦系統的核心，方法的好壞直接影響了推薦結果的優劣。而因為需要的不同發展出多種不同的推薦方法，常利用的方法如下：

1. 基本檢索 (Raw Retrieval)：網路商店上通常有基本的商品搜尋引擎，讓顧客輸入關鍵字來找尋有興趣的商品。搜尋引擎可由顧客輸入的關鍵字列出所有相關的商品，但通常只是純粹的字串比對，所以在查全率 (Recall) 和準確度 (Precision) 上都有所不足。

2. 人工選粹 (Manually Selected)：由專家以人工方式建立推薦清單或分類清單，使顧客可以依照自己的興趣選擇需要的清單參考。這種方式有相當高的準確度，

可是需要長期人工維護更新，無法及時提供資訊。

3. 統計分析 (Statistical Summaries)：以統計的方法分析一般顧客的購買趨勢來做推薦，也可以整理出熱門商品清單讓顧客參考。

4. 屬性導向 (Attribute-Based) 推薦：利用商品的屬性和顧客的興趣，比較之間的關係，依此來判斷出顧客可能需要或喜歡的商品。

5. 商品間的關聯性 (Item- to-Item Correlation)：商品間常會有某些關係存在，例如可以找出常被一起購買的商品，當顧客購買某樣商品時，可以推薦給他其它常被一起購買的商品。

6. 顧客間的關聯性 (User-to-User Correlation) ：有些顧客因為購買習慣或興趣相同，可以被歸類在同一個社群中。同社群內的顧客彼此之間可以分享資訊，互相推薦商品。

這些推薦方法並無絕對的好壞，依照需求不同而各有存在的價值。這些方法除了可以獨立運作外，也可以互相搭配使用來提升推薦的效果。例如在[8]中的推薦方法結合了

屬性導向推薦和顧客間的關聯性兩種方法，首先利用顧客間的關聯性來找出顧客可能感興趣的推薦清單，再利用屬性導向推薦來對推薦清單排序，這樣找出來的推薦清單不但參考了社群的意見，也相當符合個人的興趣。而在[9]中則提出了結合商品間的關聯性和顧客間的關聯性的推薦方法以互補這兩種方法的缺點，當要對某位顧客做推薦時，如果找不到相同興趣的顧客，無法用顧客間的關聯性做推薦時，就轉換成用商品間的關聯性，從顧客的購買紀錄中判斷哪些商品顧客目前可能感興趣。

目前推薦系統在電子商務上的應用，比較偏重於個人化的功能，希望能根據每個使用者不同的興趣分別給予使用者符合興趣的推薦。個人化推薦系統主要的方法分成兩種，分別為協力式過濾和內容導向過濾。而在之前提到的方法中，商品間的關聯性和使用者間的關聯性是協力式過濾推薦常用到的方法，而屬性導向推薦其實就是內容導向過濾推薦的別名。協力式過濾和內容導向過濾這兩種方法將分別在本章第三節和第四節中介紹。

2.2.3 其他設計考量

最後，設計一個推薦系統還必須考量到一些特別需求，依照各個網路商店不同的需要分別做不同的設計，通常考量到的主要有個人化的程度 (Degree of Personalization) 和如何把推薦送達 (Delivery) 給顧客這兩個方面。這些設計上的考量甚至會直接影響推薦方法的選擇。

個人化的程度方面可分成三種，主要因為產生推薦的方法不同而有所差異。第一種是無個人化 (Non-Personalized)，例如只用一些統計摘要的方法所產生的推薦，每個人所得到的推薦都是相同的。第二種是短期的個人化 (Ephemeral Personalization)，這種個人化主要是依據顧客最近的網頁瀏覽紀錄或選取了哪些商品，來推薦可能需要的商品，

這種方式大多採用內容導向過濾或利用資料探勘所找出的物品間的關係來做推薦。第三種則是長期的個人化 (Persistent Personalization)，這種方式會長期追蹤顧客的興趣，主

要的推薦方式是利用顧客的歷史紀錄檔找出使用者和使用者間的關係，再利用協力式過濾推薦。

而如何把推薦清單送達給顧客也是一個重要的議題，主要分成主動送出 (Push) 、等候選取 (Pull) 和被動產生 (Passive) 三種。主動送出顧名思義是主動將推薦送給顧客，通常採用電子郵件的方式。主動送出的優處是是可以直接且及時地把訊息送給消費者，吸引顧客光臨，但也可能會被當成廣告信，引起顧客反感。等候選取則是可由顧客自己決定何時要查看推薦。顧客可在瀏覽網站時，可自行點選檢視商店所推薦的商品，

讓顧客享有絕對的自主性。等候選取的困難在於需要引起顧客的興趣來點選瀏覽，所以往往這種方法在應用上造成的效果不彰。第三種被動產生的方法則是當顧客的購物車裡已經有某些商品時，可以根據這些商品來做即時的推薦。被動產生的方法因為直接跟顧客互動，往往推薦的東西和顧客當時的需要接近，所以應用上的效果不錯。但是因為要線上作業，所以特別要考量推薦執行的速度，避免? 了推薦而影響顧客瀏覽網頁的流暢度，使顧客失去耐心。當然以上這三種方法可以互相搭配使用，主要還是依照商品的特性、顧客群習慣和實際施行的效果。

在文檔中圖書館個人化館藏推薦系統 (頁 20-24)

第二章 相關研究工作

第二節 個人化推薦系統

第二章相關研究工作

第二節個人化推薦系統