• 沒有找到結果。

第二章 文獻探討

2.2 推薦系統之主流演算法

2.2.2 社會網絡原型

介紹完協同過濾的傳統模型之後,同樣隸屬於使用消費者與商品間互動的 另一個模型:社會網絡,則為本研究架構之主要概念。

社會網絡概念主要發源自社會心理學的範疇,之後被應用於各方面。簡化 後之社會網絡架構如下:

1、 單點表示社會中的每一個個體,乍看之下無法觀察出其間關聯性。

圖 7 個體分散之社會

2、 社會網絡則由許多單點組合而成,佐以連接線呈現彼此之間的關係。

所謂「關係」可以是個人友誼、電子郵件聯絡人、部落格(blog)或相簿 的好友連結8、校友會、產業協力廠商、分散各地的教會組織…等。

8 如國內無名小站(http://www.wretch.cc/)或國外 Orkut(http://www/orkut.com)

A B C

D E

G H

圖 8 關係連結之社會

3、 從中可以進一步觀察到比較緊密的一群人、或著非常孤獨的單點。

例如,在示意圖(參見圖 9)中,個體B、C、E、F四點彼此之間的 連結較強烈而緊密,它們即被視為同一群。

個體A、G、H則均只有一條向外與其他點相連的連結線,它們相對 孤單;然而最孤獨的是個體I,與外界沒有任何接觸、沒有任何連結,

代表也沒有任何訊息進出。

個體D在此社會網絡中則扮演類似於訊息傳達中繼站的角色,負責將 個體C或個體F所得到的群體資訊傳往A、G。

圖 9 網絡分群之社會

A B C

D E

G H

G I

D E

B C

4、 社會網絡的應用實例:依各種不同的分群方式,可以解讀許多現象、

並從中利用其力量。

近年來利用電子郵件轉寄信的方式協助尋找失蹤家人即為一例,藉由 從一個群體散佈到另一個群體,接觸到廣泛的人群以達到近似廣播的 效果。

同時,2006 年五月的新聞指出美國國家安全局利用電話通聯記錄追蹤 恐怖份子的行蹤9,這也是利用網網相連的概念才能得到如此有效的結 果。

2.2.3 比較比較比較比較協同過濾協同過濾協同過濾原型協同過濾原型原型與社會網絡原型與社會網絡與社會網絡與社會網絡原型原型原型原型

協同過濾著重於將雙方互動的連結,對應(mapping)到消費者身上;而應用 社會網絡的興趣關聯圖雖然同樣處理雙方的互動連結,但對應於商品部 分。

2.3 協同過濾推薦系統 協同過濾推薦系統 協同過濾推薦系統 協同過濾推薦系統

由上可知,協同過濾與社會網絡是近代推薦系統比較常被探討的二種應用 方式,Ansari et al.(2000)形容協同過濾為「類似人類口耳相傳的互動過程」。 Ansari et al.(2000) 利 用 層 級 貝 氏 推 薦 系 統 (a Hierarchical Bayesian Recommendation System)使五種不同型態的輸入資訊得以結合,此五種輸 入資訊分別為:使用者外顯偏好、其他消費者偏好、專家評估、項目特性 與使用者特性。即將難以量測的項目特性與顧客特性之間的互動,將使用 者偏好的異質性與產品異質性一併考慮在內。

以其他消費者偏好加以適當權重計算後所得之結果,視為某單一個體(使用 者)偏好的預測值,是 Anwari et al.(2000)與過往學者僅就外顯的歷史資料分 別之處;尤其現實情境是多數使用者並不願意被詢問繁瑣的問題,應此需 求而提出「善加利用顯性與隱性資料,可以幫助在搜尋目標範疇內給予更 準確的推薦,使推薦系統所需資訊比傳統市場調查方式為少、卻能得到更 精準結果」的概念。

9 新聞出處:http://www.usatoday.com/news/washington/2006-05-10-nsa_x.htm

此外,比較協同過濾與內容過濾之間的差異(Ansari et al., 2000)發現:前者 主張使用者的個體偏好受其他消費者偏好的線性組合影響,後者則針對使 用者本身之於產品特性的偏好而決定推薦;相較之下,協同過濾比內容過 濾更強調「人」(使用者以外之消費者)的影響。

但是,協同過濾最大缺點在於必須使用足量的資料。

倘若新進商品其相關資料稀少(假設相對購買人數未達足額),則系統所產 生的推薦其信賴度降低、甚至無法產生推薦;儘管內容過濾可以整合不同 消費者偏好以適用於新進商品,但準確度尚待驗證的缺點依然存在。同 時,兩者均尚無合理解釋推薦依據的能力、也因為未使用統計模型而使處 理(預測)不確定性的能力相形薄弱。

協同過濾推薦系統,又可劃分為使用者導向與項目(商品)導向;以下針對 兩種常用的協同過濾演算法探討。

2.3.1 項目導向演算法項目導向演算法項目導向演算法項目導向演算法

在眾多的項目導向協同過濾演算法中比較,Sarwar et al.(2001)發現藉由預 先計算項目相似度的模型,可以增加推薦系統在線上使用的規模。

同時,與典型的使用者導向演算法相比,不論是在處理龐雜的資料量或是 推薦品質二個面向,項目導向演算法皆表現較佳。

 規模增進與品質提升之議題

Sarwar et al.(2001)更指出在協同過濾演算的過程中,向來具有挑戰的兩大 議題:

1、 推薦系統本身:當使用者人數或是個別使用者的歷史資料(例如,購買 紀錄)增加時,推薦系統如何在資料規模增進與保有即時功能間取得平 衡?

2、 使用者角度:推薦品質的提升具有絕對關鍵的影響力,使用者需要的 是值得信賴、可以幫忙找出所需項目的推薦。當使用者發現推薦系統

無法滿足他們的需求時,使用者便會拒絕使用此一推薦系統以表示他 們的不滿足。

最困難的卻是此二議題本身互斥:當推薦系統必須處理龐大資料以便取得 優良的推薦結果時,將因為計算速度拖累、進而降低使用者滿意度。

因此,兼顧推薦系統預測的準確程度以及計算速度即為目前推薦系統必須 面對的挑戰之一。

2.3.2 使用者導向演算法使用者導向演算法使用者導向演算法使用者導向演算法

使用者導向演算法與項目導向演算法之差異在於後者比較商品屬性而前 者則是比較使用者屬性。

類似於項目導向演算法面臨的困難點,使用者導向演算法也有相同必須改 善的缺點。

 資料離散與規模增進之議題

受協同過濾演算法無可避免之限制,使用者導向演算法也有如下兩大挑 戰:

1、 資料離散不易使用:對於一個電子商務網站而言,使用者相對於販售 商品而言,其購買率是相對少量(Amazon.com 販售書籍的 1%即是 20,000 冊(Sarwar et al., 2001),枉論個別使用者難以達到如此購買量);

如何在離散程度高的資料之中得到令使用者滿意的推薦是使用者導向 演算法最大的困難。

2、 推薦系統本身:同協同過濾推薦系統本質問題。但當資料規模增進時,

對使用者導向演算法所代表的意義是「同時增加使用者數目與項目數 目」,雙重的規模增加使規模增進更加困難。

2.4 推薦系統之特性 推薦系統之特性 推薦系統之特性 推薦系統之特性

推薦系統經常使用的另一主流方式即為社會網絡;人們信任是隱藏在與其 他人交換資訊、互動過程中產生的結果。

之所以 Ansari et al.(2000)主張個體偏好會受其他人偏好組合的影響,背後 支持的理由正是假設因為信任對方、認同對方與自己是物以類聚、興趣相 似。

Schafer et al.(1999)的實證研究則表現許多使用暢銷商品、平均評等、文字 評論等方式也同樣尋求其他可能與個體相似的使用者、從中預測個體的使 用(消費)行為。

協同過濾推薦系統更強調使用者數目與單一使用者歷史資料的數量,演算 法就是為了依個體與他人過去的歷史行為預測未來,正是依賴個體自己與 其他個體之間的相似程度(Sarwar et al., 2001)。

2.5 社會網絡 社會網絡 社會網絡 社會網絡

儘管經由前述討論,協同過濾推薦系統已改良許多,但就如同 Ansari et al.(2000)提及的個體所能取得之項目選項隨時間改變;非但如此,Palau, Montaner, &Lopez(2004)更提出個體偏好會隨著時間而改變,進而影響推薦 品質。

若欲改善因時間推移而導致推薦品質的改變,就必須建立動態模型以便模 擬此一情況;Palau et al.(2004)建議社會網絡恰可呈現使用者之間某一時點 的動態關係。

因此,將社會網絡與協同過濾結合是研究動態推薦系統發展的起點。

結合協同過濾與社會網絡的模型是將使用者視為節點(node)、節點之間的 (信任)關係則以連結(tie)表示,並藉由探討以下測量變數分析特定網絡:

 點數多寡(size):用於計算其他測量變數。當網絡越大時,越容易呈現 分群(partitioned groups)的現象。

 密度(density):公式可表示為實際存在之連結數目 可能存在之連結數目

10

 程度中心性(Degree Centrality):某單一節點所擁有之連結數目。可分 為進次數(in-degree)與出次數(out-degree)。當進次數高者表示得到他人 信任程度大、影響力較強;當出次數高則表示信任的對象多,容易得 到更多建議、不依靠單一建議來源。

 網 路 集 中 程 度 (Network Centrality) : 可 細 分 為 程 度 中 心 性 (degree centrality)、緊密中心性(closeness centrality)、居間中心性(betweenness centrality)及流量中心性(flow centrality)。如果集中程度高則表示有部 分使用者其階度(in- and/or out- degree)高而部分使用者之階度較低;如 果不集中則表示每位使用者居於類似的基礎、擁有類似的影響力與被 影響程度。

 成員子集合(Clique Membership):當部分節點相對於網絡中其他部分 其彼此之間的連結更為緊密時,產生子集合(clique);子集合表示存在 至少一個社群(community)關係。

 次團體(Faction):研究者可自行設定網絡的次團體數目。

網絡圖可藉由以上測量做為推薦與比較群體間的依據;也可藉由設定信任 門檻(trust threshold)而縮小推薦的發散程度(Palau et al., 2004)、也許得因此 而提高推薦品質。11

2.6 興趣關聯圖 興趣關聯圖 興趣關聯圖 興趣關聯圖

承襲以上脈絡之後,本研究主要依循以下兩篇期刊文章的概念而發展,茲 就主要的參考文獻解釋其精義:

1、 InterestMap: Harvesting Social Network Profiles for Recommendations:

引入圖形概念做為興趣關聯的呈現方式啟發本研究之議題

與本研究最大之不同在於 InterestMap 利用機器學習分辨語意;而本研究的 輸入資訊則是一致化的問卷、並在輸入資訊之際即已進行簡化以便後續處 理。

目前國內針對興趣關聯圖的研究多著重於圖書館的個人化服務部分,然則 本研究的興趣關聯概念則承自於 InterestMap。Liu, &Maes(2005)認為推薦 系統不應該侷限在特定範圍的應用,而應有能力產生廣泛的興趣推薦;因

目前國內針對興趣關聯圖的研究多著重於圖書館的個人化服務部分,然則 本研究的興趣關聯概念則承自於 InterestMap。Liu, &Maes(2005)認為推薦 系統不應該侷限在特定範圍的應用,而應有能力產生廣泛的興趣推薦;因

相關文件