推薦系統

第二章文獻探討

2.3 推薦系統

推薦系統（Recommendation System ）可以視為一群物件的集合，

{ d d d

}

D

= ₁, ₂,..., 。

d 是指資料庫中的某件商品或某個資訊，而推薦系統的主要目

_i 標就是將D 中的某些符合使用者興趣的

d 推薦給使用者（Yager, 2003）

_i 。與資料庫行銷（database marketing）不同的是，推薦系統強調用戶的主動參與，藉由與用戶的互動，並學習用戶的興趣，提供符合使用者需求的有價產品或資訊，以達到推薦的目的。

「推薦系統」這個名稱最早是由Resnick and Varian (1997)所提出。但在此之前，相同的產品或資訊服務推薦概已被學者應用於許多的不同領域。例如：線上音樂推薦（Shardanand & Maes, 1995）；線上新聞主題推薦（Balabanovic´ & Shoham, 1997）；家庭錄影帶（Hill, Stead, Rosenstein, & Furnas, 1995）以及電影推薦系統

（Miller, Albert, Lam, Konstan, & Riedl, 2003）。一般而言，推薦系統可概分為兩大類：內容導向式（Content-based）推薦系統，以及協同過濾式（Collaborative Filtering）

推薦系統，分別介紹如下：

2.3.1 內容導向式推薦

內容導向方式（content-based approach）比協同過濾方式之推薦，更早被應用在篩選資料上。通常內容導向式推薦會根據使用者輸入的關鍵字，由系統來篩選出符合關鍵字或者符合關鍵字語意概念（Semantic Concept）的資料來推薦給使用者。簡言之，內容導向式推薦是指針對產品屬性與客戶偏好相近時就加以推薦。

因為內容導向的方法因為實際考慮到物件的內容屬性，所以系統中的物件利用各自的屬性向量表示式，來比較彼此間相似度時，通常有相當高的準確率。

在內容導向式推薦系統中，使用者是以自己的興趣來建立個人的興趣表示（興趣向量），所以每個人的興趣向量都不盡相同，各有各自的特性，因此系統可以找出每個人不同而只適合某個人的推薦，這使得採用內容導向過濾的推薦系統可以更具備個人化的功能，推薦的東西更能符合個人的需求。

有關於內容導向式推薦系統的研究文獻也相當豐富，應用領域也相當廣泛。

Cheng and Yang（1999）提出基於內容導向的影音資料庫檢索方式，Mooney and Roy

（2000）提出將文章依照興趣排序的書本推薦系統，Wang, Chuang, Hsu and Keh

（2005）則建構一個化妝品選購的內容導向推薦系統。

2.3.2 協同過濾式推薦

協同過濾方式（collaborative filtering approach）推薦系統最早於 1992 年由 Goldberg 等人於研究報告中首先提出（Goldberg, Nichols, Oki, & Terry, 1992），當時被用以處理大量的電子郵件傳送上。此方法先找出一群具有共同興趣、背景或經驗的使用者，形成所謂的「社群（community）」，也就是在某些行為或偏好上有相同特性的成員之集合。透過分析此社群成員的偏好，用群體的觀點來產生推薦項目給特定的個人使用者。換句話說，協同過濾式推薦系統先計算各使用者之間的偏好行為相似度，找出與自己偏好相接近的鄰近群組，透過其他人的意見或建議，來產生使用者沒有經驗但有興趣的推薦資訊來給使用者做為參考。

有關於協同過濾式推薦系統的研究文獻也相當豐富。Schafer, Konstan and Riedl（1999）提出一套協同過濾式推薦系統，協助使用者進行電子商務時得到更多的產品推薦。Kohrs and Merialdo（2001）將協同過濾式推薦系統應用於建構使用者個人化網頁設計。Kuo and Chen（2001）研發出符合個人化喜愛的資訊提供推薦系統。Lee, Kim, and Choi（2003）則是建立了一套適用於網路環境的協同過濾式推薦系統。

目前自動化推薦技術之相關研究主要可分為以下幾種方式：（Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl, 2000）（J. Schafer, J. K. Ben, and J.

Riedl, 1999）（Daniel Billsus and Michael J. Pazzani, 1998）（David Goldberg, David Nichols, and Brian M. Oki, and Douglas Terry, 1992）

1. 非個人化熱門式推薦（Non-Personalized）

2. 物品關聯式推薦（Item-to-Item Correlation）

3. 屬性式推薦（Attribute-Based）

4. 人物關聯式推薦（People-to-People Correlation）

本研究之自動化推薦技術將採用屬性式推薦，並結合個人化偏好之模糊權重資訊檢索整合技術，首先由領域專家標註各影音檔案之屬性，並由各用戶自行將個人化的偏好類別及屬性填入，經過OWA 整合運算之後，產生各用戶對每一個影音檔案的推薦分數，因此可較貼近用戶真實的心智模式，達成興趣偏好關聯式推薦之目的。

2.3.3 資料採礦

資料採礦及探勘（Tzung-Pei Hong, Chan-Sheng Kuo, and Sheng-Chai Chi, 1999）

（Jiawei Han and Michenline Kamber, 2001）是一種為了特殊需求，從已存在於資料庫或資料倉儲之大量資料中，擷取有意義的知識、樣式（Pattern）或關聯性

（Associations）的一種過程。U. Fayyad, G. Piatetsky-shapiro, and P. Smyth（1996）

曾運用資料探勘流程，對使用者的興趣做規則探勘之工作，其主要包含下列步驟：

選取資料、資料前處理與轉換、執行資料探勘、解釋與評價探勘結果等，主要使

用的資料探勘方法如分類、趨勢分析、分群、關聯及循序特徵等，從轉換後的資料中發掘存在的多種特徵及資訊，可採用Rough Set 演算法或 Apriori 演算法，以關聯式法則來探勘未知的隱性知識，分析這些得到的資訊後，可透過文字或視覺化的圖形，對擷取出來的資訊作一解釋與評價。

在Yu（1999）的研究中指出了資料探勘（Data Mining）的技術如何來改善個人化的資訊推薦系統。大略有下列四種方法：群聚（Clustering）與相似度指標

（Similarity indexing）技術可以被用來辨別同等地位的群體或內容。關連法則探勘

（Association rule mining）可以被用來識別產品的關連性與客戶的輪廓資料以供目標行銷之用。

在文檔中客製化影音檢索系統之研發—以可移式語音機之設計為例 (頁 23-26)

第二章 文獻探討