2、 文獻探討
2.1 資訊推薦
隨著網際網路的蓬勃發展,各式各樣的論壇及網站如雨後春筍般誕 生,不但使得使用者擁有豐富多元的管道來獲取資訊,也帶來資訊蒐集 的便利。雖然網際網路替使用者帶來便利檢索資訊的管道,但也同步產 生資訊超載的現象。為了有效解決此一問題,學者們提出許多不同的因 應之道,然而「資訊推薦」就是其中的解決方法之一,資訊推薦概念就 在此情況下孕育而生。其他學者也呼應資訊推薦能有效解決資訊超載所 帶來的問題,如Senecal and Nantel ( 2004 )認為當使用者接受過多網路外 部資訊時,常常使得使用者不知如何下決定,此時資訊推薦系統就扮演 重要的指引角色。資訊推薦的概念是由資訊檢索與預測理論相互結合,
9
可用來幫助使用者面對蒐集大量資料時,篩選以及過濾的一項機制。
Rashid, Karypis, and Riedl ( 2008 ) 認為資訊推薦系統是可以在複雜的資 訊環境下幫助使用者做出決策,且系統可依據對使用者或項目的瞭解程 度不同而產生不同推薦給使用者。資訊推薦最大的特色在於,可以透過 使用者的偏好、興趣、行為或需求,在資訊眾多的可選擇區域範圍內,
推薦給使用者所需的資訊、服務或產品,藉由資訊推薦的輔助,使用者 不但能得到屬於個人化的資訊服務,更可以減少搜尋資訊成本,增加效 率。然而對於不同領域所應用的資訊推薦,其研究之核心定義也將有所 不同,但對於本研究所構想的研究主題而言,一個較為適切的定義是採 用學者 Yager ( 2003 )研究中所提出之「資訊推薦即是從大量訊息中,提 供使用者所需之資訊。可將資訊推薦視為一物件之集合,D={d1,…,dn},
D為整個資料庫之內容,di為資料庫中某筆資訊,而資訊推薦主要的功用 為將可能符合使用者需求或興趣的di推薦給使用者」。簡言之,即是從大 量資訊裡,藉由資訊推薦系統的協助,找出使用者可能感興趣資訊,進 而推薦之。
資訊推薦廣泛使用於各領域上,尤其以應用於電子商務領域最為活 躍。面對變化莫測的環境及無遠弗屆的網際網路,不論是業者或消費者 都必須即時做出適當的調整和反應。電子商務領域最須克服的難題就是 產品生命週期短,因此資訊推薦系統如何幫助業者在極短時間內創造出
10
最大的商機,正是考驗資訊推薦系統是否良好的準則。Schafer, Konstan, and Riedl ( 2000 )認為資訊推薦系統在電子商務上佔有舉足輕重的角色,
原因在於系統透過記錄使用者對於偏好產品的知識,引導使用者做出更 有效的購買決策,除此之外電子商務領域的資訊推薦系統還擁有三種特 性(1)將瀏覽者轉變成購買者( browsers into buyers )、(2)增加交叉銷售的機 會( cross-sell )、(3)建立顧客忠誠度( loyalty )( Schafer et al., 2000)。黃如慧 ( 2004 )指出電子商務處在瞬息萬變的環境之中,一套優良的資訊推薦系 統能替使用者找出目標客群,協助制訂行銷策略,進而達到最佳效益。
合適的資訊推薦系統不但能替企業帶來正面的效益更能夠帶來收益的增 加,而已有不少成功資訊推薦系統的應用,如世界最大的網路書店 -Amazon(亞馬遜)、全球最大的拍賣市集ebay等,都是知名的成功案例。
將目前的資訊推薦系統從技術以及類型上來劃分,主要可分成三種 型式,分別為內容過濾式、協同過濾式、混合過濾式,以下將分別詳述 其定義、限制及其應用。
2.1.1 內容過濾式 ( content-based filtering, CBF )
內容過濾式主要是透過資料分析找出使用者喜好與項目內容之間的 關係,進一步判斷那些資料可能為使用者所需之內容。此方法使用前必 須先建立使用者輪廓( profiling information ),而使用者輪廓是由一些關鍵 字詞或者是相關文件所組成,方便於系統篩選出符合關鍵字詞或關鍵語
11
意之資料,以供為使用者進行推薦。為了能夠提高準確率,內容過濾式 將每個物件的屬性視為不同,系統則利用各自的屬性差異來表示彼此相 似的程度。內容過濾式將使用者的歷程記錄做為推薦之基礎,由於每個 人的喜好不盡相同,各有各的特性,因此系統能推薦屬於每個人個別之 偏好,此一特性將使得內容過濾式的推薦系統更具有個人化之特色。除 此之外內容過濾式也存在許多的條件限制。以下則為內容過濾式的優缺 點整理( Shardanand and Maes, 1995;Cheung, Tsui, and Liu, 2004;
Adomavicius and Tuzhilin, 2005 )。
1. 優點
(1) 依據使用者興趣、偏好或是過去曾經使用過的紀錄來進行項目的 篩選推薦程序,相較於協同合作式的推薦方式,對於項目推薦結 果的解釋能力較為合情合理,結果也較能讓人接受。
(2) 不但能同時解決協同合作式所面臨的稀疏性( sparsity problem )與 擴展性( scalability problem )的問題,而且推薦之正確率也較協同合 作式來的高。
2. 缺點
(1) 內容過濾式為內容導向的推薦機制,內容必須是能被機器判讀或 是經由人工方式分析來建立其屬性,其他如聲音、影像、圖片等 多媒體資訊內容即無法透過系統做自動化分析及推薦的動作。換
12
言之,難以靠機器判讀的內容,便需要更複雜的處理程序。
(2) 內容過濾式憑藉著使用者過去的歷史偏好與目標項目找出其關聯 性,利用此關聯性對使用者進行推薦,在此同時可能也容易忽略 可能存在的潛在偏好,造成過度特定化的現象。
(3) 內容過濾式無法篩選相同項目間的品質、風格及觀點。若以文章 為例,當系統面對兩篇題目相同,內容品質不一的文章,內容過 濾式法便無法分辨其優劣,造成推薦效果不佳的情況。
(4) 項目內容的特徵(feature)選取,將攸關推薦品質的優劣。
內容過濾式類型的資訊推薦系統廣泛應用於各領域之中,若以內容 過濾式資訊推薦應用於實務上來探討,像是以內容過濾式為篩選機制的 推薦系統,如Chen, Hu, Kuo, and Liang ( 2010 )將內容過濾式推薦應用於 行動電話的選購上,建立一套Personalized recommendation系統,此系統 以網頁形式呈現,應用層次處理法結合行動電話的比較與評價給予顧客 推薦。Lee, Hu, Cheng, and Hsieh ( 2012 )從Amazon.com蒐集資料,並使用 成本敏感的正範例學習法(cost-sensitive learning-based positive example leaning,COLPEL)輔助內容過濾式了解消費者沒有興趣的商品可能為何,
如此一來將可避免推薦出消費者不感興趣之產品。從上述文獻顯示出一 種現象,此現象為內容過濾式型態的資訊推薦系統,為增加其推薦效果,
13
尚須結合一種演算法來做為過濾或篩選的機制,如此一來才能使得系統 推薦品質提高,因此也意味著如要使用該類型之資訊推薦系統,有其必 要再利用合適的演算法進行輔助的動作。也有學者利用內容過濾式來探 討某一現象發生之關鍵因素可能為何,如Blanco-Fernandez, Lopez-Nores, Gil-Solla, Ramos-Cabrer, and Pazos-Arias ( 2011 )曾使用內容過濾式的推 薦來探討擴散激發理論的協同效應。Li et al. ( 2012 )利用內容過濾式推薦 來探討線上社群團體構成的關鍵因子為何,進而提出改善的方針。從上 述文獻可得知內容式過濾不但能提供使用者推薦解決問題的辦法更能夠 替使用者找出問題可能的癥結點。其他內容過濾式的應用,如Kim, Kim, and Cho ( 2008 )認為P2P ( peer-to-peer ) 的網路環境下提供多元的多媒體 資訊,複雜且容易造成資訊超載的現象,為了提供使用者正確的訊息,
必須設計一套以使用者為導向的內容式推薦系統,以便能夠兼顧品質以 及效率。Mooney and Roy(2000)設計一套以推薦書籍為核心的內容推 薦系統,它利用使用者資訊與所選書本之間的關聯為推測基礎,希望它 能準確預測使用者的喜好,並將其可能喜歡的書本依照興趣依序排列。
2.1.2 協同過濾式
協同過濾式推薦是目前較為廣泛的推薦技術,此方法是依據使用者 之間對項目的偏好程度來進行相似度的分群,例如具有共同興趣、背景 或經驗的使用者,形成所謂社群(community)的概念,進而分析社群成
14
員的偏好,利用群體的觀點來產生最相似偏好鄰居的推薦項目給特定族 群的使用者。此方法與內容過濾式推薦最大的不同點在於不需分析使用 者偏好的項目內容,只需找出具有一定相似程度偏好的使用者即可進行 分析、推薦。簡言之,協同過濾式主要概念,為相同偏好的群體成員對 於同樣一件事物容易產生高度的認同感,因此經由行為模式相似的使用 者間找出其共同的關聯性,並透過計算彼此間的關聯程度,即有極大機 會提供興趣相似的使用者感興趣的資訊。Sarwar, Karypis, Konstan, and Riedl (2000)指出協同過濾式的運作程序分為三個步驟:(1)輸入資料表式 ( representation of input data )、(2)建立使用鄰居( neighborhood formation )、
(3)推薦資訊的產生 ( recommendation generation ) 。協同過濾式必須歸納 出與使用者最為相似的使用者,進而產生最近鄰居,才能進行後續推薦 的程序。
協同過濾式不需分析項目內容,系統根據與使用者有著共同志趣的 社群成員購買過的產品或瀏覽過的資訊做為推薦的參考依據。雖然協同 過濾式能夠發掘潛在的需求,但協同過濾式的推薦也有諸多限制。以下 為協同過濾式優缺點的整理( Balabanovic and Shoham, 1997;Herlocker, Konstan, Borchers, and Riedl, 1999;Sarwar et al., 2000;Middleton, Shadbolt, and De-Roure, 2004;Yang, Wang, and You, 2004;Adomavicius and Tuzhilin, 2005)。
15
1. 優點
(1) 彌補內容過濾式推薦的限制:有別於內容過濾式的侷限,協同過 濾式推薦可發掘使用者可能存在的潛在需求,推薦超出預期內的 產品項目。
(2) 群體經驗:可藉由群體( group )的概念,利用其他使用者的經驗、
使用紀錄或曾經評價過的項目,對於評價較高的項目對使用者進 行推薦。
(3) 無須分析內容項目的屬性:不必像內容過濾式耗費時間分析項目 的屬性,協同過濾式的推薦方式是依據與目標使用者具有相同偏 好之群體來進行推薦的程序。
(3) 無須分析內容項目的屬性:不必像內容過濾式耗費時間分析項目 的屬性,協同過濾式的推薦方式是依據與目標使用者具有相同偏 好之群體來進行推薦的程序。