• 沒有找到結果。

協同過濾推薦系統

第二章 文獻探討

2.3 協同過濾推薦系統

由上可知,協同過濾與社會網絡是近代推薦系統比較常被探討的二種應用 方式,Ansari et al.(2000)形容協同過濾為「類似人類口耳相傳的互動過程」。 Ansari et al.(2000) 利 用 層 級 貝 氏 推 薦 系 統 (a Hierarchical Bayesian Recommendation System)使五種不同型態的輸入資訊得以結合,此五種輸 入資訊分別為:使用者外顯偏好、其他消費者偏好、專家評估、項目特性 與使用者特性。即將難以量測的項目特性與顧客特性之間的互動,將使用 者偏好的異質性與產品異質性一併考慮在內。

以其他消費者偏好加以適當權重計算後所得之結果,視為某單一個體(使用 者)偏好的預測值,是 Anwari et al.(2000)與過往學者僅就外顯的歷史資料分 別之處;尤其現實情境是多數使用者並不願意被詢問繁瑣的問題,應此需 求而提出「善加利用顯性與隱性資料,可以幫助在搜尋目標範疇內給予更 準確的推薦,使推薦系統所需資訊比傳統市場調查方式為少、卻能得到更 精準結果」的概念。

9 新聞出處:http://www.usatoday.com/news/washington/2006-05-10-nsa_x.htm

此外,比較協同過濾與內容過濾之間的差異(Ansari et al., 2000)發現:前者 主張使用者的個體偏好受其他消費者偏好的線性組合影響,後者則針對使 用者本身之於產品特性的偏好而決定推薦;相較之下,協同過濾比內容過 濾更強調「人」(使用者以外之消費者)的影響。

但是,協同過濾最大缺點在於必須使用足量的資料。

倘若新進商品其相關資料稀少(假設相對購買人數未達足額),則系統所產 生的推薦其信賴度降低、甚至無法產生推薦;儘管內容過濾可以整合不同 消費者偏好以適用於新進商品,但準確度尚待驗證的缺點依然存在。同 時,兩者均尚無合理解釋推薦依據的能力、也因為未使用統計模型而使處 理(預測)不確定性的能力相形薄弱。

協同過濾推薦系統,又可劃分為使用者導向與項目(商品)導向;以下針對 兩種常用的協同過濾演算法探討。

2.3.1 項目導向演算法項目導向演算法項目導向演算法項目導向演算法

在眾多的項目導向協同過濾演算法中比較,Sarwar et al.(2001)發現藉由預 先計算項目相似度的模型,可以增加推薦系統在線上使用的規模。

同時,與典型的使用者導向演算法相比,不論是在處理龐雜的資料量或是 推薦品質二個面向,項目導向演算法皆表現較佳。

 規模增進與品質提升之議題

Sarwar et al.(2001)更指出在協同過濾演算的過程中,向來具有挑戰的兩大 議題:

1、 推薦系統本身:當使用者人數或是個別使用者的歷史資料(例如,購買 紀錄)增加時,推薦系統如何在資料規模增進與保有即時功能間取得平 衡?

2、 使用者角度:推薦品質的提升具有絕對關鍵的影響力,使用者需要的 是值得信賴、可以幫忙找出所需項目的推薦。當使用者發現推薦系統

無法滿足他們的需求時,使用者便會拒絕使用此一推薦系統以表示他 們的不滿足。

最困難的卻是此二議題本身互斥:當推薦系統必須處理龐大資料以便取得 優良的推薦結果時,將因為計算速度拖累、進而降低使用者滿意度。

因此,兼顧推薦系統預測的準確程度以及計算速度即為目前推薦系統必須 面對的挑戰之一。

2.3.2 使用者導向演算法使用者導向演算法使用者導向演算法使用者導向演算法

使用者導向演算法與項目導向演算法之差異在於後者比較商品屬性而前 者則是比較使用者屬性。

類似於項目導向演算法面臨的困難點,使用者導向演算法也有相同必須改 善的缺點。

 資料離散與規模增進之議題

受協同過濾演算法無可避免之限制,使用者導向演算法也有如下兩大挑 戰:

1、 資料離散不易使用:對於一個電子商務網站而言,使用者相對於販售 商品而言,其購買率是相對少量(Amazon.com 販售書籍的 1%即是 20,000 冊(Sarwar et al., 2001),枉論個別使用者難以達到如此購買量);

如何在離散程度高的資料之中得到令使用者滿意的推薦是使用者導向 演算法最大的困難。

2、 推薦系統本身:同協同過濾推薦系統本質問題。但當資料規模增進時,

對使用者導向演算法所代表的意義是「同時增加使用者數目與項目數 目」,雙重的規模增加使規模增進更加困難。

相關文件