推薦系統類型

第二章文獻探討

2.1 推薦系統定義

2.1.1 推薦系統類型

網頁推薦系統為早期發展的方法，由於網頁的數量極為龐大，單靠搜尋引擎蒐集資訊是很沒有效率的行為，故使用推薦系統進行過濾。推薦系統自 1994 年發展以來已有數種推薦系統方法。Pazzani (1999)將推薦系統分為內容導向式過濾、

協同式過濾、混合式過濾、人口統計式。而後又增加了基於知識推薦。以下介紹

1. 內容導向式推薦（Content-based Filtering Recommender）

Pazzani 和 Billsus, (2007)等人定義內容導向式推薦是根據使用者輪廓（User Profiles）來提供推薦項目給予使用者。使用者輪廓範圍包含對項目的評分、歷程記錄、興趣…等。根據使用者過去的行為來過濾出相似的項目並推薦。較為簡單的方式是記錄使用者對於有評分的項目，並找到與該項目的相似的項目。這裡將會出現解釋上的分岔，倘若內容式的推薦策略中包含歷史評分，則會被認為是協同式過濾的一種類型，但如果不計算歷史評分只計算內容則可以視為非協同式過濾。

內容導向式過濾有二個主要議題，第一：尋找重要的文件；第二：推薦尚未被發掘的文件。

在內容導向式推薦系統中較常使用的有 TF-IDF 演算法，TF-IDF 是透過字詞進行過濾篩選，將文件中的字詞出現頻率高的項目及太少出現的項目去除。

2. 協同式過濾推薦（Collaborative Filtering）

Breese et al. (1998)定義協同式過濾推薦系統是建立在假設上，它是種藉由有興趣的內容找到也有相似興趣的人們，並且將相似人們也喜好的項目推薦的方法。

Schafer et al. (2007)定義協同式過濾是一種使用其他人們的評價過濾或評估項目的程序。

在協同式過濾推薦系統中有三個主要角色，第一：使用者、第二：項目、第三：評分。評價在協同式過濾中扮演連結使用者與項目角色，並能產生使用者與項目的評分矩陣，而評分的性質可分為顯性（Explicit）與隱性（Implicit）二種，

顯性的評價著重於使用者所提供相關資料或購買資訊，而隱性評分則是觀察使用者的行為。顯性較容易影響使用者觀感，而隱性較不會影響使用者觀感。

協同式過濾推薦系統藉由近似度來計算使用者相似的使用者或項目，並且將

相關程度高的項目推薦給使用者。例如：Resnick et al. (1994)等人發展文章推薦系統 GroupLens，以協助使用者在網路上搜尋資料時對資料進行過濾，方便人們尋找。

Su 和 Khoshgoftaar (2009)說明協同式過濾針對評分計算可分為基於記憶與基於模式二類。

(1) 基於記憶（Memory-based）

使用使用者評分資料或權重計算使用者與項目間的相似分數，並且根據相似分數進行預測及推薦。而這種方法被應用於電子商務網站中，例如：Amazon。

基於記憶可分為二種計算，分別是基於使用者（User-based）、基於項目

（Item-based）。基於使用者是計算使用者間的近似度，基於項目是計算項目間的近似度。基於項目較常使用的計算方法有調整後的餘弦近似度（Adjusted Cosine Similarity）、基於餘弦近似度（Cosine-based Similarity）、基於相關的近似度三種

（Correlation-based Similarity）。

(a) 基於使用者

假設有二名使用者𝑢和𝑣，而sim(𝑢, 𝑣)為其近似度分數，𝑟為其評分， 𝑟̅為所有評分的平均（平均計算時要忽略沒有評分的項目），則可以表示為方程式 2.1。

sim(𝑢, 𝑣) = ^{∑ (𝑟}^𝑖∈𝐼 ^𝑢,𝑖^−𝑟̅^𝑢^)(𝑟^𝑣,𝑖^−𝑟̅^𝑣⁾

√∑ (𝑟_𝑖∈𝐼 _𝑢,𝑖−𝑟̅_𝑢)²√∑ (𝑟_𝑖∈𝐼 _𝑣,𝑖−𝑟̅_𝑣)²

(2.1)

其解釋為當使用者 U_i相似於某一族群 G 的使用者時，如果 G 族群對 Ij 有興 趣，則猜測 Ui也能對項目 Ij 有興趣，故推薦項目 Ij 給使用者。步驟為收集使用者評分、計算使用者近似度、提出推薦結果清單。

(b) 基於項目

3. 人口統計式推薦（Demographic Filtering Recommender）

人口統計式係指使用預先定義好的資料格式提供使用者選擇。例如：性別、

年齡、郵政號碼、教育程度、員工與否等。人口統計式是預先得知使用者的相關資料，如此不必再花費額外的計算來猜測使用者的相關資料，但由於有隱私問題要取得個人資料並不容易。

4. 基於知識的推薦（Knowledge-based Recommender）

Burke (2000)認為除了內容式推薦和協同式過濾推薦之外，還有一類是基於知識的推薦，基於知識的推薦是以使用者與產品之領域知識作為推薦系統之計算依據，推論使用者需要的產品。其與前面幾種推薦系統最大差異在於不用特別蒐集大量的使用者及項目資料，就是先定義使用者與項目的近似度，如此甚至能避免推薦系統冷啟動（Cold Start）。並且此推薦類型也能與其他類型的推薦系統做結合成為混合式推薦系統。

5. 混合式推薦（Hybrid Recommender System）

混合式推薦系統是透過結合 2 種以上的推薦系統方法來解決單一推薦系統無法解決的問題。早期有Balabanović 和 Shoham (1997)結合內容導向式過濾和協同式過濾二種方法發展出 Fab 推薦系統。Burke (2002)整理了混合式推薦系統的

特徵結合（Feature combination）將不同特徵的推薦資料來源結合成單一推薦演算法

串聯（Cascade）由一個推薦中提煉出而出另一個推薦

特徵放大（Feature augmentation）將一種技術用於輸出時亦用於其他計算時輸入

元層級（Meta-level）將學習到的推薦系統模型做為輸入到另一個

在文檔中碩士論文 Department of Information Science and Management Systems National Taitung University Master Thesis 國立臺東大學資訊管理學系 (頁 18-23)

第二章 文獻探討

2.1 推薦系統定義

2.1.1 推薦系統類型

第二章文獻探討