決策制定模型與減緩資訊過載的過濾技術

第二章文獻探討

第一節決策制定模型與減緩資訊過載的過濾技術

Simon 從情報（Intelligence）、設計（Design）、選擇（Choice）描述決策制定的四個階段（Simon, 1960），後來在提及此決策模型時，常以 IDC 模型稱之。

決策程序的第一個階段稱為情報活動：搜索亟需決策的新情況；第二個階段稱為過濾（information filtering）。資訊萃取重視的是資訊的正確，資訊過濾重視的是符合個人需求（Belkin & Croft, 1992），也比較適合產品客製化議題。資訊過濾技術後來被廣泛用於推薦系統（Resnick & Varian, 1997）內，在商業應用上，書籍

（Amazon.com）、電影（Netflix.com）、音樂（TiVo.com）已有不錯的成效。

壹、推薦系統

Goldberg、Nichols、Oki 和 Terry（1992）提出 Tapestry 系統解決電子郵件過載的問題，讓使用者透過建立查詢（query）的方式來過濾出自己有興趣的電子郵件。Tapestry 系統除了使用內容過濾（content-based filtering, CBF）的技術外，

還使用了協同過濾（collaborative filtering, CF）的技術，後被視為推薦系統的最早應用。

資訊過濾技術整合至推薦系統內，後應用於多個領域（Park, Kim, Choi, &

Kim, 2012; Yuliana、Giner, Guillermo, & Alejandro, 2013），如書籍、文件、影像、

電影、音樂、醫學、電子商務、美食（gastronomy）、娛樂（entertainment）、數位學習（e-learning）等，皆取得不錯成效。

推薦系統的定義，以「People provide recommendations as inputs, which the system then aggregates and directs to appropriate recipients」（Resnick & Varian, 1997）

與「Any system that produces individualized recommendations as output or has the effect of guiding the user in a personalized way to interesting or useful objects in a large space of possible opinions」（Burke, 2002）被廣為採用，且指出推薦的三個重要元素：「個人的（individualized）、有趣（interesting）和有用的（useful）」。

‧

CBF、CF、混合過濾（hybrid filtering） Balabanović 與 Shoham（1997）

記憶為基（memory-based）、塑模（model）為基 Breese、Heckerman 與 Kadie（1998）

非個人化的（non-personalized）、屬性為基、項目對項目關

連（item-to-item correlations）與人對人（people-to-people） Schafer、Konstan 與 Riedl（1999）

CBF、推薦支援、社會式資料採礦（social data mining）與 CF

Terveen 與 Hill（2001）

CF、CBF、人口統計學（demographic）、效用（utility）為

基與知識（knowledge）為基 Burke（2002）

項目對項目協同過濾 Linden、Smith 與 York（2003）

記憶為基協同過濾、塑模為基協同過濾 Adomavicius 與 Tuzhilin（2005）

CBF、CF、混合過濾、人口統計學、知識為基、效用為基 Rao 與 Talwar（2008）

特徵（characteristic）為基¹與社會為基² Ochi、Rao、Takayama 與 Nass（2010）

標籤為基 Zhang、Zhou 與 Zhang（2011）

塑模為基、記憶為基（或啟發式為基） Adomavicius 與 Zhang（2012）

記憶為基、內容為基、社會為基、脈絡依存（context）為

三、混合過濾是結合內容過濾與協同過濾兩種機制的推薦（Balabanović &

Shoham, 1997）。

四、記憶為基利用評比值矩陣（ratings matrix）來比較使用者之間的相似度，

記憶為基最常使用 kNN（k-Nearest Neighbors）的演算法，以 k 個最相似的鄰居資訊來推薦項目予使用者，而其相似度的計算以皮爾森

‧

即 CBF、CF 與混合過濾（Adomavicius & Tuzhilin, 2005; Resnick & Varian, 1997）。

圖 1 是 CBF 與 CF 的運作方式，CBF 以顧客 A 所喜歡的產品 X，找到相似的產品 Y 來推薦。CF 以顧客 A 為基準，找到有相似嗜好的其他顧客 X、顧客 Y、顧客 Z，然後找到顧客 X、顧客 Y 與顧客 Z 喜歡的產品 Y，再推薦回給顧客 A。

圖 1 內容過濾與協同過濾的運作原理

資料來源：Blecker、Friedrich、Kaluza、Abdelkafi 與 Kreutler（2005）

參、推薦系統的研究議題

推薦系統的應用與技術已經相對的廣泛與成熟，然而，仍存有一些問題尚未解決。例如過度限定、多媒體（如影像、影片）資料特徵萃取、稀疏評比、冷啟動（cold start）、使用者偏見、隱私等問題（Adomavicius & Tuzhilin, 2005; Bobadilla et al., 2013; de Campos, Fernández-Luna, Huete, & Rueda-Morales, 2010; Kim et al.,

‧

2011; Ochi et al., 2010; Pérez-Gallardo, Alor-Hernández, Cortes-Robles, &

Rodríguez-González, 2013; Schein, Popescul, Ungar, & Pennock, 2002）。

過度限定指的是過於推薦相關的內容，例如，使用者買了哈利波特第一集，

推薦系統會接著推薦哈利波特第二集。稀疏評比指的是使用者對項目的評比資料少，例如知名的 Netflix³與 Movielens⁴10M 個別只有 2%與 3%的資料被評比。冷啟動的問題指出的是資料稀少的問題，進一步可以區隔為新使用者（rame-up）、

新項目（item）或新系統的問題（Park & Chu, 2009）。新使用者指的是剛加入網站的使用者，所以不存在產品購買資料。新項目指的是剛上市的新產品，因為與其他項目的關聯低，所以資料稀少。新系統指的是剛使用的系統，所以資料庫相關資料稀少。使用者偏見（bias）指的是個人對於項目的評比值差異大，因此無法取得使用者真實的偏好。資料越稀疏，推薦精確度愈差（Cacheda, Carneiro, Fernández, & Formoso, 2011）因此，資料稀疏是推薦系統最被重視的問題。

資料稀疏問題的解決方法很多，像是可以結合其他資料來產生推薦清單（雖然個人化的程序會降低，但是可以等到資料比較豐富時再來改善），例如使用人口統計資料（Nguyen, Denos, & Berrut, 2007; Lam, Vu, Le, & Duong, 2008）或是項目特徵資料，如電影的標題、演員陣容（Melville, Mooney, & Nagarajan, 2002）。

或是以社會網絡的觀點來延伸至間接關聯找到更多鄰居（Papagelis, Plexousakis,

& Kutsuras, 2005），還可以利用 query expansion 技術來擴增使用者的輪廓

（Formoso, Fernández, & Cacheda, 2013）。其他做法如 Movielens 要求使用者對電影評比，取得資料後再進行推薦。洪飛恭（2011）透過與專家會談、模糊理論，

建立消費者需求與產品功能特徵關聯評價法則，接著，利用此關聯評價法則找出最佳模組產品，做為提供消費者選購產品之建議。另外，推薦應該協助顧客找到和發現新、相關且有趣的項目（Linden et al., 2003），且應避免推薦太相似的內容，

Kim、Ha、Lee、Jo 與 El-Saddik（2011）建議使用短期興趣資料來推薦。

推薦系統的相似度計算概念對於產品搜尋與客製有很大幫助，下一節本論文探討大量客製化的模式。

在文檔中電子賀卡自助式設計系統－以互動演化式計算為基礎 - 政大學術集成 (頁 16-19)

第二章 文獻探討

第一節 決策制定模型與減緩資訊過載的過濾技術

‧

‧

‧

第二章文獻探討

第一節決策制定模型與減緩資訊過載的過濾技術