• 沒有找到結果。

決策制定模型與減緩資訊過載的過濾技術

第二章 文獻探討

第一節 決策制定模型與減緩資訊過載的過濾技術

Simon 從情報(Intelligence)、設計(Design)、選擇(Choice)描述決策制 定的四個階段(Simon, 1960),後來在提及此決策模型時,常以 IDC 模型稱之。

決策程序的第一個階段稱為情報活動:搜索亟需決策的新情況;第二個階段稱為 過濾(information filtering)。資訊萃取重視的是資訊的正確,資訊過濾重視的是 符合個人需求(Belkin & Croft, 1992),也比較適合產品客製化議題。資訊過濾技 術後來被廣泛用於推薦系統(Resnick & Varian, 1997)內,在商業應用上,書籍

(Amazon.com)、電影(Netflix.com)、音樂(TiVo.com)已有不錯的成效。

壹、推薦系統

Goldberg、Nichols、Oki 和 Terry(1992)提出 Tapestry 系統解決電子郵件過 載的問題,讓使用者透過建立查詢(query)的方式來過濾出自己有興趣的電子 郵件。Tapestry 系統除了使用內容過濾(content-based filtering, CBF)的技術外,

還使用了協同過濾(collaborative filtering, CF)的技術,後被視為推薦系統的最 早應用。

資訊過濾技術整合至推薦系統內,後應用於多個領域(Park, Kim, Choi, &

Kim, 2012; Yuliana、Giner, Guillermo, & Alejandro, 2013),如書籍、文件、影像、

電影、音樂、醫學、電子商務、美食(gastronomy)、娛樂(entertainment)、數 位學習(e-learning)等,皆取得不錯成效。

推薦系統的定義,以「People provide recommendations as inputs, which the system then aggregates and directs to appropriate recipients」(Resnick & Varian, 1997)

與「Any system that produces individualized recommendations as output or has the effect of guiding the user in a personalized way to interesting or useful objects in a large space of possible opinions」(Burke, 2002)被廣為採用,且指出推薦的三個 重要元素:「個人的(individualized)、有趣(interesting)和有用的(useful)」。

CBF、CF、混合過濾(hybrid filtering) Balabanović 與 Shoham(1997)

記憶為基(memory-based)、塑模(model)為基 Breese、Heckerman 與 Kadie(1998)

非個人化的(non-personalized)、屬性為基、項目對項目關

連(item-to-item correlations)與人對人(people-to-people) Schafer、Konstan 與 Riedl(1999)

CBF、推薦支援、社會式資料採礦(social data mining)與 CF

Terveen 與 Hill(2001)

CF、CBF、人口統計學(demographic)、效用(utility)為

基與知識(knowledge)為基 Burke(2002)

項目對項目協同過濾 Linden、Smith 與 York(2003)

記憶為基協同過濾、塑模為基協同過濾 Adomavicius 與 Tuzhilin(2005)

CBF、CF、混合過濾、人口統計學、知識為基、效用為基 Rao 與 Talwar(2008)

特徵(characteristic)為基1與社會為基2 Ochi、Rao、Takayama 與 Nass(2010)

標籤為基 Zhang、Zhou 與 Zhang(2011)

塑模為基、記憶為基(或啟發式為基) Adomavicius 與 Zhang(2012)

記憶為基、內容為基、社會為基、脈絡依存(context)為

三、混合過濾是結合內容過濾與協同過濾兩種機制的推薦(Balabanović &

Shoham, 1997)。

四、記憶為基利用評比值矩陣(ratings matrix)來比較使用者之間的相似度,

記憶為基最常使用 kNN(k-Nearest Neighbors)的演算法,以 k 個最相 似的鄰居資訊來推薦項目予使用者,而其相似度的計算以皮爾森

即 CBF、CF 與混合過濾(Adomavicius & Tuzhilin, 2005; Resnick & Varian, 1997)。

圖 1 是 CBF 與 CF 的運作方式,CBF 以顧客 A 所喜歡的產品 X,找到相似的產 品 Y 來推薦。CF 以顧客 A 為基準,找到有相似嗜好的其他顧客 X、顧客 Y、顧 客 Z,然後找到顧客 X、顧客 Y 與顧客 Z 喜歡的產品 Y,再推薦回給顧客 A。

圖 1 內容過濾與協同過濾的運作原理

資料來源:Blecker、Friedrich、Kaluza、Abdelkafi 與 Kreutler(2005)

參、推薦系統的研究議題

推薦系統的應用與技術已經相對的廣泛與成熟,然而,仍存有一些問題尚未 解決。例如過度限定、多媒體(如影像、影片)資料特徵萃取、稀疏評比、冷啟 動(cold start)、使用者偏見、隱私等問題(Adomavicius & Tuzhilin, 2005; Bobadilla et al., 2013; de Campos, Fernández-Luna, Huete, & Rueda-Morales, 2010; Kim et al.,

2011; Ochi et al., 2010; Pérez-Gallardo, Alor-Hernández, Cortes-Robles, &

Rodríguez-González, 2013; Schein, Popescul, Ungar, & Pennock, 2002)。

過度限定指的是過於推薦相關的內容,例如,使用者買了哈利波特第一集,

推薦系統會接著推薦哈利波特第二集。稀疏評比指的是使用者對項目的評比資料 少,例如知名的 Netflix3與 Movielens410M 個別只有 2%與 3%的資料被評比。冷 啟動的問題指出的是資料稀少的問題,進一步可以區隔為新使用者(rame-up)、

新項目(item)或新系統的問題(Park & Chu, 2009)。新使用者指的是剛加入網 站的使用者,所以不存在產品購買資料。新項目指的是剛上市的新產品,因為與 其他項目的關聯低,所以資料稀少。新系統指的是剛使用的系統,所以資料庫相 關資料稀少。使用者偏見(bias)指的是個人對於項目的評比值差異大,因此無 法取得使用者真實的偏好。資料越稀疏,推薦精確度愈差(Cacheda, Carneiro, Fernández, & Formoso, 2011)因此,資料稀疏是推薦系統最被重視的問題。

資料稀疏問題的解決方法很多,像是可以結合其他資料來產生推薦清單(雖 然個人化的程序會降低,但是可以等到資料比較豐富時再來改善),例如使用人 口統計資料(Nguyen, Denos, & Berrut, 2007; Lam, Vu, Le, & Duong, 2008)或是 項目特徵資料,如電影的標題、演員陣容(Melville, Mooney, & Nagarajan, 2002)。

或是以社會網絡的觀點來延伸至間接關聯找到更多鄰居(Papagelis, Plexousakis,

& Kutsuras, 2005),還可以利用 query expansion 技術來擴增使用者的輪廓

(Formoso, Fernández, & Cacheda, 2013)。其他做法如 Movielens 要求使用者對電 影評比,取得資料後再進行推薦。洪飛恭(2011)透過與專家會談、模糊理論,

建立消費者需求與產品功能特徵關聯評價法則,接著,利用此關聯評價法則找出 最佳模組產品,做為提供消費者選購產品之建議。另外,推薦應該協助顧客找到 和發現新、相關且有趣的項目(Linden et al., 2003),且應避免推薦太相似的內容,

Kim、Ha、Lee、Jo 與 El-Saddik(2011)建議使用短期興趣資料來推薦。

推薦系統的相似度計算概念對於產品搜尋與客製有很大幫助,下一節本論文 探討大量客製化的模式。

相關文件