• 沒有找到結果。

推薦系統主要架構

推薦系統的主要架構,一般認為以Schafer 提出的架構較為完整(Schafer 2001)。在此架 構下,Schafer 將系統分為社群輸入變數(Community inputs)、個人化程度(Degree of personalization)、遞送(Delivery)、個人輸入變數(Target customer inputs)及推薦方法

(Recommendation method),其架構如圖 18。

NCTU SG NCTU Abu PIE@NCTU

圖 18 推薦系統主要架構。修改自資料來源:(Schafer 2001)

(一) 輸入與輸出

「輸入」指進行推薦分析之前需要輸入的資料,Schafer 將之區分為個人輸入變數及社群 輸入變數。個人輸入變數包括了以下五個項目(Schafer 2001),若能完整記錄則能較完整的描 繪使用者的「樣貌」(profile)。

1. 隱性輸入(Implicit Navigation):由使用者的瀏覽記錄可以得知使用者有興趣的物 件,這些平常的瀏覽活動,包含停留時間、順序、點選流向等都在在表示了使用者 獨特的興趣與偏好。例如Amazon.com 就是使用隱性輸入的典型網站。

2. 顯性輸入(Explicit Navigation):以問卷方式請使用者自行填入偏好,通常在加入會 員時輸入,平時也可修改。Amazon.com 在新會員註冊時也會要求(選填)新用戶

填寫。

3. 查詢關鍵字(Keywords/Item Attribute):將使用者輸入的關鍵字也視為喜好。

4. 評價(Rating):使用分級制(如一至五顆星)或二元式(喜歡不喜歡)對購買過的 物件評分。

5. 購買歷史(Purchase History):使用者真正去購買的物件表示了最強的偏好,此類記 錄也應視為是一種隱性輸入。

社群輸入變數可以描繪群體對物件的偏好。由於是社群總體對物件的大量記錄,因此可 以取得物件的屬性資料,這是與「個人輸入變數」欲取得個人資料最大的不同。社群輸入變 數包括了:

1. 物件屬性(Item Attribute):包括物件目標、客戶標籤與物件類別。例如「影片」類 型相較於「二次世界大戰後期紀錄片」的等冷門類型,前者較可能擴大目標客戶群。

由此可以判定商品是屬較熱門或冷門商品。

2. 熱門程度(External Item Popularity):特定節日如耶誕節會有大量需求,或是本身已 是熱門商品,通常銷量較高。由此可以判定商品是平常即暢銷或節日熱銷。

3. 社群購買記錄(Community Purchase History):社群的購買記錄是由個人記錄構成,

因此可以找出商品的銷售趨勢,或是相似商品之間的關係(例如替代性、互補性)。

應視為另一種隱性輸入。

4. 商品評價(Rating and Text Comments):有些網站特別鼓勵使用者留下文字評價。文 字比星等或喜不喜歡等更容易吸引顧客。

一個優良的推薦系統應該綜合個人以及社群輸入變數,以便作出最符合客戶需求的推薦。

在「輸出」部份,Schafer 的架構將推薦的輸出分為三級(Schafer 2001),包括:

1. 建議(Suggestion):指未排序過的推薦。通常直接放在網頁上以「試試這個(try this)」

的形式呈現、通常是單獨項目(只會一次出現一個推薦項目),例如Amazon.com 的 個人化首頁。

2. 預測(Prediction):有結合或不結合個人化偏好二種預測推薦。Schafer 指出 MovieFinder 對電影即提供了「大家的評價」與「我們的評價」兩種預測推薦。

Amazon.com 對書籍也有專家書評以及讀者書評兩種,其評分也是獨立計算。

3. 評價記錄(Rating):讓使用者除了看到總分之外,還可以看到個別評分記錄,以方 便了解大家的評價是否一致。

(二) 推薦方法

Schafer 的架構(Schafer 2001)將推薦方法整理為五類,而此五類各有優缺點、並非是替代 關係,通常可整合多種方法達成所需的推薦效果。

1. 基本搜尋(Raw Retrieval):即網站上的搜尋功能,以關鍵字比對。以 Amazon.com 為例,其提供的是全文檢索,然而大部份網站僅提供特定欄位之搜尋,在此狀況下 使用者不一定可以找到未登錄在主要欄位關鍵字之資料。

2. 人工選擇(Manually Selected):人工建立推薦清單,由於通常是專家建立,具有較 高的參考價值,例如《中國時報》人間副刊的年度選書、誠品選書等名家書單。

3. 統計分析(Statistical Summaries):提供總體使用者的統計數據,這也是網站常使用 來推薦熱門商品的方法,例如熱門一百大、每月暢銷書榜等。此類排行榜通常能發 揮導引功能並成為閱讀指標,然而也招致可能造成閱讀普及化障礙的疑慮(陳慧 敏 )。

4. 屬性基礎(Attribute-based):以產品的詮釋資料屬性作為推薦的判斷,通常會與使 用者的偏好或動作連結。例如推薦新商品給曾買過同類產品的使用者,即內容導向 過濾(Content-based filtering)。

5. 商品間關聯性(Item-to-Item Correlation):商品之間可能存在某些關聯,例如印表機、

印表耗材的互補關聯,或單冊書籍、散文精選的替代性關聯等。例如Amazon.com 在使用者將一商品放入購物車時,會看到一頁「買這件商品的人,也會同時買下列 商品」的資訊。

6. 顧客間關聯性(User-to-User Correlation):根據使用者與使用者之間的關聯性作為 推薦基礎,即協力式過濾(見協力式過濾與關聯規則探勘,頁33)。使用者之間可 能因類似的操作習慣或偏好,可歸為同一類別中,而相同類別的群體意見會影響個 人的推薦結果。

(三) 個人化與傳遞

Schafer 提到仍有其他在設計上需要考慮到的議題(Schafer 2001),包括了個人化與傳遞。

個人化包括了三種,分別是無個人化(Non-Personalized)、暫時性的個人化(Ephemeral Personalization)以及長期性的個人化(Persistent Personalization)。無個人化指的是大家在同 樣的操作下會得到相同的推薦,例如查詢某本書,網站會推薦同類型的書籍。暫時性的個人 化是以一個時期(Session)作為推薦基礎,例如瀏覽時的點選流向作為推薦基礎(見圖 19 紅框處,Recommended Based on Your Browsing History)。通常是以「項目間的關聯性」與「屬 性基礎」兩種方法作出推薦。長期性的個人化需要追蹤使用者長期的使用記錄,例如交易歷 史或圖書館的借閱歷史檔,並利用資料探勘的方法找出使用者之間的關聯。

圖 19 Amazon.com 的個人化推薦。資料來源:Amazon.com 網站

在經過輸入、分析後,最後即是傳遞推薦的方法。好的網站通常會巧妙的融合以下三種 傳遞方式,在最適當的時機送出推薦結果,得到事半功倍的效果;反之,則容易干擾使用者,

甚至降低推薦效果。傳遞包括了推式(push)、拉式(pull)及被動式(passive)。推式即指使 用者無需任何動作網站即會自動送出推薦結果,常見的例子如廣告信;此種效果通常最低,

因為大部份廣告推薦信皆未作到個人化,且發送太頻繁造成困擾;至今除了Amazon.com 少 量使用外,其他網站少見廣告推薦信。拉式即是使用者主動要求,例如點選連結後才看到推 薦清單。被動式是現在最常見的方式,也是效果最好的一種;原因在於它藉由使用者的操作 作為推薦基礎,在行為上產生互動,使用者的接受程度較高,例如輸入關鍵字後再送出相應 的推薦清單(見圖 19 黃框處,Customer with similar Searches Purchased)。

在Schafer 的架構中可以發現,推薦的輸入是後續分析以及輸出的關鍵,具有連動的影 響性。若需要作到長期性的個人化,便需要在顧客資料之間找出關聯、定義所要解決的商業 問題並因應資料結構使用適合的推薦演算法(Recommendation Algorithm),輸入變數部份就 必須包含歷史交易資料。也就因為從輸入到輸出整個過程之中,包含了商業面及技術面的考 量,而使得推薦系統各不相同。

推薦系統的終極願景,在於每個使用者都能夠看到一份屬於自己偏好的網站內容。使用 者不再需要自行一一挑選、過濾想看的內容。資訊沒有超載的問題,因為出現的都是根據偏 好及互動而過濾出來。Amazon.com 的執行長 Jeff Bezos 說(Schafer 2001):「如果我有三百萬 個客戶,那麼我應該就有三百萬個網路商店」。