• 沒有找到結果。

第二章 文獻探討

2.3 推薦系統

推 薦 系 統 (Recommendation System ) 可 以 視 為 一 群 物 件 的 集 合 ,

{ d d d

n

}

D

= 1, 2,..., 。

d 是指資料庫中的某件商品或某個資訊,而推薦系統的主要目

i 標就是將D 中的某些符合使用者興趣的

d 推薦給使用者(Yager, 2003)

i 。與資料庫 行銷(database marketing)不同的是,推薦系統強調用戶的主動參與,藉由與用戶 的互動,並學習用戶的興趣,提供符合使用者需求的有價產品或資訊,以達到推 薦的目的。

「推薦系統」這個名稱最早是由Resnick and Varian (1997)所提出。但在此之 前,相同的產品或資訊服務推薦概已被學者應用於許多的不同領域。例如:線上 音樂推薦(Shardanand & Maes, 1995);線上新聞主題推薦(Balabanovic´ & Shoham, 1997);家庭錄影帶(Hill, Stead, Rosenstein, & Furnas, 1995)以及電影推薦系統

(Miller, Albert, Lam, Konstan, & Riedl, 2003)。一般而言,推薦系統可概分為兩大 類:內容導向式(Content-based)推薦系統,以及協同過濾式(Collaborative Filtering)

推薦系統,分別介紹如下:

2.3.1 內容導向式推薦

內容導向方式(content-based approach)比協同過濾方式之推薦,更早被應用 在篩選資料上。通常內容導向式推薦會根據使用者輸入的關鍵字,由系統來篩選 出符合關鍵字或者符合關鍵字語意概念(Semantic Concept)的資料來推薦給使用 者。簡言之,內容導向式推薦是指針對產品屬性與客戶偏好相近時就加以推薦。

因為內容導向的方法因為實際考慮到物件的內容屬性,所以系統中的物件利用各 自的屬性向量表示式,來比較彼此間相似度時,通常有相當高的準確率。

在內容導向式推薦系統中,使用者是以自己的興趣來建立個人的興趣表示(興 趣向量),所以每個人的興趣向量都不盡相同,各有各自的特性,因此系統可以找 出每個人不同而只適合某個人的推薦,這使得採用內容導向過濾的推薦系統可以 更具備個人化的功能,推薦的東西更能符合個人的需求。

有關於內容導向式推薦系統的研究文獻也相當豐富,應用領域也相當廣泛。

Cheng and Yang(1999)提出基於內容導向的影音資料庫檢索方式,Mooney and Roy

(2000)提出將文章依照興趣排序的書本推薦系統,Wang, Chuang, Hsu and Keh

(2005)則建構一個化妝品選購的內容導向推薦系統。

2.3.2 協同過濾式推薦

協同過濾方式(collaborative filtering approach)推薦系統最早於 1992 年由 Goldberg 等人於研究報告中首先提出(Goldberg, Nichols, Oki, & Terry, 1992),當 時被用以處理大量的電子郵件傳送上。此方法先找出一群具有共同興趣、背景或 經驗的使用者,形成所謂的「社群(community)」,也就是在某些行為或偏好上有 相同特性的成員之集合。透過分析此社群成員的偏好,用群體的觀點來產生推薦 項目給特定的個人使用者。換句話說,協同過濾式推薦系統先計算各使用者之間 的偏好行為相似度,找出與自己偏好相接近的鄰近群組,透過其他人的意見或建 議,來產生使用者沒有經驗但有興趣的推薦資訊來給使用者做為參考。

有關於協同過濾式推薦系統的研究文獻也相當豐富。Schafer, Konstan and Riedl(1999)提出一套協同過濾式推薦系統,協助使用者進行電子商務時得到更 多的產品推薦。Kohrs and Merialdo(2001)將協同過濾式推薦系統應用於建構使 用者個人化網頁設計。Kuo and Chen(2001)研發出符合個人化喜愛的資訊提供推 薦系統。Lee, Kim, and Choi(2003)則是建立了一套適用於網路環境的協同過濾式 推薦系統。

目前自動化推薦技術之相關研究主要可分為以下幾種方式:(Badrul Sarwar, George Karypis, Joseph Konstan, and John Riedl, 2000)(J. Schafer, J. K. Ben, and J.

Riedl, 1999)(Daniel Billsus and Michael J. Pazzani, 1998)(David Goldberg, David Nichols, and Brian M. Oki, and Douglas Terry, 1992)

1. 非個人化熱門式推薦(Non-Personalized)

2. 物品關聯式推薦(Item-to-Item Correlation)

3. 屬性式推薦(Attribute-Based)

4. 人物關聯式推薦(People-to-People Correlation)

本研究之自動化推薦技術將採用屬性式推薦,並結合個人化偏好之模糊權重 資訊檢索整合技術,首先由領域專家標註各影音檔案之屬性,並由各用戶自行將 個人化的偏好類別及屬性填入,經過OWA 整合運算之後,產生各用戶對每一個影 音檔案的推薦分數,因此可較貼近用戶真實的心智模式,達成興趣偏好關聯式推 薦之目的。

2.3.3 資料採礦

資料採礦及探勘(Tzung-Pei Hong, Chan-Sheng Kuo, and Sheng-Chai Chi, 1999)

(Jiawei Han and Michenline Kamber, 2001)是一種為了特殊需求,從已存在於資料 庫或資料倉儲之大量資料中,擷取有意義的知識、樣式(Pattern)或關聯性

(Associations)的一種過程。U. Fayyad, G. Piatetsky-shapiro, and P. Smyth(1996)

曾運用資料探勘流程,對使用者的興趣做規則探勘之工作,其主要包含下列步驟:

選取資料、資料前處理與轉換、執行資料探勘、解釋與評價探勘結果等,主要使

用的資料探勘方法如分類、趨勢分析、分群、關聯及循序特徵等,從轉換後的資 料中發掘存在的多種特徵及資訊,可採用Rough Set 演算法或 Apriori 演算法,以 關聯式法則來探勘未知的隱性知識,分析這些得到的資訊後,可透過文字或視覺 化的圖形,對擷取出來的資訊作一解釋與評價。

在Yu(1999)的研究中指出了資料探勘(Data Mining)的技術如何來改善個 人化的資訊推薦系統。大略有下列四種方法:群聚(Clustering)與相似度指標

(Similarity indexing)技術可以被用來辨別同等地位的群體或內容。關連法則探勘

(Association rule mining)可以被用來識別產品的關連性與客戶的輪廓資料以供目 標行銷之用。

相關文件