• 沒有找到結果。

第二章 文獻探討

2.1 推薦系統定義

2.1.1 推薦系統類型

網頁推薦系統為早期發展的方法,由於網頁的數量極為龐大,單靠搜尋引擎 蒐集資訊是很沒有效率的行為,故使用推薦系統進行過濾。推薦系統自 1994 年 發展以來已有數種推薦系統方法。Pazzani (1999)將推薦系統分為內容導向式過濾、

協同式過濾、混合式過濾、人口統計式。而後又增加了基於知識推薦。以下介紹

8

1. 內容導向式推薦(Content-based Filtering Recommender)

Pazzani 和 Billsus, (2007)等人定義內容導向式推薦是根據使用者輪廓(User Profiles)來提供推薦項目給予使用者。使用者輪廓範圍包含對項目的評分、歷 程記錄、興趣…等。根據使用者過去的行為來過濾出相似的項目並推薦。較為簡 單的方式是記錄使用者對於有評分的項目,並找到與該項目的相似的項目。這裡 將會出現解釋上的分岔,倘若內容式的推薦策略中包含歷史評分,則會被認為是 協同式過濾的一種類型,但如果不計算歷史評分只計算內容則可以視為非協同式 過濾。

內容導向式過濾有二個主要議題,第一:尋找重要的文件;第二:推薦尚未 被發掘的文件。

在內容導向式推薦系統中較常使用的有 TF-IDF 演算法,TF-IDF 是透過字詞 進行過濾篩選,將文件中的字詞出現頻率高的項目及太少出現的項目去除。

2. 協同式過濾推薦(Collaborative Filtering)

Breese et al. (1998)定義協同式過濾推薦系統是建立在假設上,它是種藉由有 興趣的內容找到也有相似興趣的人們,並且將相似人們也喜好的項目推薦的方法。

Schafer et al. (2007)定義協同式過濾是一種使用其他人們的評價過濾或評估項目 的程序。

在協同式過濾推薦系統中有三個主要角色,第一:使用者、第二:項目、第 三:評分。評價在協同式過濾中扮演連結使用者與項目角色,並能產生使用者與 項目的評分矩陣,而評分的性質可分為顯性(Explicit)與隱性(Implicit)二種,

顯性的評價著重於使用者所提供相關資料或購買資訊,而隱性評分則是觀察使用 者的行為。顯性較容易影響使用者觀感,而隱性較不會影響使用者觀感。

協同式過濾推薦系統藉由近似度來計算使用者相似的使用者或項目,並且將

9

相關程度高的項目推薦給使用者。例如:Resnick et al. (1994)等人發展文章推薦 系統 GroupLens,以協助使用者在網路上搜尋資料時對資料進行過濾,方便人們 尋找。

Su 和 Khoshgoftaar (2009)說明協同式過濾針對評分計算可分為基於記憶與 基於模式二類。

(1) 基於記憶(Memory-based)

使用使用者評分資料或權重計算使用者與項目間的相似分數,並且根據相似 分數進行預測及推薦。而這種方法被應用於電子商務網站中,例如:Amazon。

基於記憶可分為二種計算,分別是基於使用者(User-based)、基於項目

(Item-based)。基於使用者是計算使用者間的近似度,基於項目是計算項目間的 近似度。基於項目較常使用的計算方法有調整後的餘弦近似度(Adjusted Cosine Similarity)、基於餘弦近似度(Cosine-based Similarity)、基於相關的近似度三種

(Correlation-based Similarity)。

(a) 基於使用者

假設有二名使用者𝑢和𝑣,而sim(𝑢, 𝑣)為其近似度分數,𝑟為其評分, 𝑟̅為所 有評分的平均(平均計算時要忽略沒有評分的項目),則可以表示為方程式 2.1。

sim(𝑢, 𝑣) = ∑ (𝑟𝑖∈𝐼 𝑢,𝑖−𝑟̅𝑢)(𝑟𝑣,𝑖−𝑟̅𝑣)

√∑ (𝑟𝑖∈𝐼 𝑢,𝑖−𝑟̅𝑢)2√∑ (𝑟𝑖∈𝐼 𝑣,𝑖−𝑟̅𝑣)2

(2.1)

其解釋為當使用者 Ui相似於某一族群 G 的使用者時,如果 G 族群對 Ij 有興 趣,則猜測 Ui也能對項目 Ij 有興趣,故推薦項目 Ij 給使用者。步驟為收集使用 者評分、計算使用者近似度、提出推薦結果清單。

(b) 基於項目

10

11

3. 人口統計式推薦(Demographic Filtering Recommender)

人口統計式係指使用預先定義好的資料格式提供使用者選擇。例如:性別、

年齡、郵政號碼、教育程度、員工與否等。人口統計式是預先得知使用者的相關 資料,如此不必再花費額外的計算來猜測使用者的相關資料,但由於有隱私問題 要取得個人資料並不容易。

4. 基於知識的推薦(Knowledge-based Recommender)

Burke (2000)認為除了內容式推薦和協同式過濾推薦之外,還有一類是基於 知識的推薦,基於知識的推薦是以使用者與產品之領域知識作為推薦系統之計算 依據,推論使用者需要的產品。其與前面幾種推薦系統最大差異在於不用特別蒐 集大量的使用者及項目資料,就是先定義使用者與項目的近似度,如此甚至能避 免推薦系統冷啟動(Cold Start)。並且此推薦類型也能與其他類型的推薦系統做 結合成為混合式推薦系統。

5. 混合式推薦(Hybrid Recommender System)

混合式推薦系統是透過結合 2 種以上的推薦系統方法來解決單一推薦系統 無法解決的問題。早期有Balabanović 和 Shoham (1997)結合內容導向式過濾和協 同式過濾二種方法發展出 Fab 推薦系統。Burke (2002)整理了混合式推薦系統的

12

特徵結合(Feature combination) 將不同特徵的推薦資料來源結合成單一推 薦演算法

串聯(Cascade) 由一個推薦中提煉出而出另一個推薦

特徵放大(Feature augmentation) 將一種技術用於輸出時亦用於其他計算時 輸入

元層級(Meta-level) 將學習到的推薦系統模型做為輸入到另一 個

相關文件