推薦系統主要架構

推薦系統的主要架構，一般認為以Schafer 提出的架構較為完整(Schafer 2001)。在此架構下，Schafer 將系統分為社群輸入變數（Community inputs）、個人化程度（Degree of personalization）、遞送（Delivery）、個人輸入變數（Target customer inputs）及推薦方法

（Recommendation method），其架構如圖 18。

NCTU SG NCTU Abu PIE@NCTU

圖 18 推薦系統主要架構。修改自資料來源：(Schafer 2001)

（一）輸入與輸出

「輸入」指進行推薦分析之前需要輸入的資料，Schafer 將之區分為個人輸入變數及社群輸入變數。個人輸入變數包括了以下五個項目(Schafer 2001)，若能完整記錄則能較完整的描繪使用者的「樣貌」（profile）。

1. 隱性輸入（Implicit Navigation）：由使用者的瀏覽記錄可以得知使用者有興趣的物件，這些平常的瀏覽活動，包含停留時間、順序、點選流向等都在在表示了使用者獨特的興趣與偏好。例如Amazon.com 就是使用隱性輸入的典型網站。

2. 顯性輸入（Explicit Navigation）：以問卷方式請使用者自行填入偏好，通常在加入會員時輸入，平時也可修改。Amazon.com 在新會員註冊時也會要求（選填）新用戶

填寫。

3. 查詢關鍵字（Keywords/Item Attribute）：將使用者輸入的關鍵字也視為喜好。

4. 評價（Rating）：使用分級制（如一至五顆星）或二元式（喜歡不喜歡）對購買過的物件評分。

5. 購買歷史（Purchase History）：使用者真正去購買的物件表示了最強的偏好，此類記錄也應視為是一種隱性輸入。

社群輸入變數可以描繪群體對物件的偏好。由於是社群總體對物件的大量記錄，因此可以取得物件的屬性資料，這是與「個人輸入變數」欲取得個人資料最大的不同。社群輸入變數包括了：

1. 物件屬性（Item Attribute）：包括物件目標、客戶標籤與物件類別。例如「影片」類型相較於「二次世界大戰後期紀錄片」的等冷門類型，前者較可能擴大目標客戶群。

由此可以判定商品是屬較熱門或冷門商品。

2. 熱門程度（External Item Popularity）：特定節日如耶誕節會有大量需求，或是本身已是熱門商品，通常銷量較高。由此可以判定商品是平常即暢銷或節日熱銷。

3. 社群購買記錄（Community Purchase History）：社群的購買記錄是由個人記錄構成，

因此可以找出商品的銷售趨勢，或是相似商品之間的關係（例如替代性、互補性）。

應視為另一種隱性輸入。

4. 商品評價（Rating and Text Comments）：有些網站特別鼓勵使用者留下文字評價。文字比星等或喜不喜歡等更容易吸引顧客。

一個優良的推薦系統應該綜合個人以及社群輸入變數，以便作出最符合客戶需求的推薦。

在「輸出」部份，Schafer 的架構將推薦的輸出分為三級(Schafer 2001)，包括：

1. 建議（Suggestion）：指未排序過的推薦。通常直接放在網頁上以「試試這個（try this）」

的形式呈現、通常是單獨項目（只會一次出現一個推薦項目），例如Amazon.com 的個人化首頁。

2. 預測（Prediction）：有結合或不結合個人化偏好二種預測推薦。Schafer 指出 MovieFinder 對電影即提供了「大家的評價」與「我們的評價」兩種預測推薦。

Amazon.com 對書籍也有專家書評以及讀者書評兩種，其評分也是獨立計算。

3. 評價記錄（Rating）：讓使用者除了看到總分之外，還可以看到個別評分記錄，以方便了解大家的評價是否一致。

（二）推薦方法

Schafer 的架構(Schafer 2001)將推薦方法整理為五類，而此五類各有優缺點、並非是替代關係，通常可整合多種方法達成所需的推薦效果。

1. 基本搜尋（Raw Retrieval）：即網站上的搜尋功能，以關鍵字比對。以 Amazon.com 為例，其提供的是全文檢索，然而大部份網站僅提供特定欄位之搜尋，在此狀況下使用者不一定可以找到未登錄在主要欄位關鍵字之資料。

2. 人工選擇（Manually Selected）：人工建立推薦清單，由於通常是專家建立，具有較高的參考價值，例如《中國時報》人間副刊的年度選書、誠品選書等名家書單。

3. 統計分析（Statistical Summaries）：提供總體使用者的統計數據，這也是網站常使用來推薦熱門商品的方法，例如熱門一百大、每月暢銷書榜等。此類排行榜通常能發揮導引功能並成為閱讀指標，然而也招致可能造成閱讀普及化障礙的疑慮(陳慧敏 )。

4. 屬性基礎（Attribute-based）：以產品的詮釋資料屬性作為推薦的判斷，通常會與使用者的偏好或動作連結。例如推薦新商品給曾買過同類產品的使用者，即內容導向過濾（Content-based filtering）。

5. 商品間關聯性（Item-to-Item Correlation）：商品之間可能存在某些關聯，例如印表機、

印表耗材的互補關聯，或單冊書籍、散文精選的替代性關聯等。例如Amazon.com 在使用者將一商品放入購物車時，會看到一頁「買這件商品的人，也會同時買下列商品」的資訊。

6. 顧客間關聯性（User-to-User Correlation）：根據使用者與使用者之間的關聯性作為推薦基礎，即協力式過濾（見協力式過濾與關聯規則探勘，頁33）。使用者之間可能因類似的操作習慣或偏好，可歸為同一類別中，而相同類別的群體意見會影響個人的推薦結果。

（三）個人化與傳遞

Schafer 提到仍有其他在設計上需要考慮到的議題(Schafer 2001)，包括了個人化與傳遞。

個人化包括了三種，分別是無個人化（Non-Personalized）、暫時性的個人化（Ephemeral Personalization）以及長期性的個人化（Persistent Personalization）。無個人化指的是大家在同樣的操作下會得到相同的推薦，例如查詢某本書，網站會推薦同類型的書籍。暫時性的個人化是以一個時期（Session）作為推薦基礎，例如瀏覽時的點選流向作為推薦基礎（見圖 19 紅框處，Recommended Based on Your Browsing History）。通常是以「項目間的關聯性」與「屬性基礎」兩種方法作出推薦。長期性的個人化需要追蹤使用者長期的使用記錄，例如交易歷史或圖書館的借閱歷史檔，並利用資料探勘的方法找出使用者之間的關聯。

圖 19 Amazon.com 的個人化推薦。資料來源：Amazon.com 網站

在經過輸入、分析後，最後即是傳遞推薦的方法。好的網站通常會巧妙的融合以下三種傳遞方式，在最適當的時機送出推薦結果，得到事半功倍的效果；反之，則容易干擾使用者，

甚至降低推薦效果。傳遞包括了推式（push）、拉式（pull）及被動式（passive）。推式即指使用者無需任何動作網站即會自動送出推薦結果，常見的例子如廣告信；此種效果通常最低，

因為大部份廣告推薦信皆未作到個人化，且發送太頻繁造成困擾；至今除了Amazon.com 少量使用外，其他網站少見廣告推薦信。拉式即是使用者主動要求，例如點選連結後才看到推薦清單。被動式是現在最常見的方式，也是效果最好的一種；原因在於它藉由使用者的操作作為推薦基礎，在行為上產生互動，使用者的接受程度較高，例如輸入關鍵字後再送出相應的推薦清單（見圖 19 黃框處，Customer with similar Searches Purchased）。

在Schafer 的架構中可以發現，推薦的輸入是後續分析以及輸出的關鍵，具有連動的影響性。若需要作到長期性的個人化，便需要在顧客資料之間找出關聯、定義所要解決的商業問題並因應資料結構使用適合的推薦演算法（Recommendation Algorithm），輸入變數部份就必須包含歷史交易資料。也就因為從輸入到輸出整個過程之中，包含了商業面及技術面的考量，而使得推薦系統各不相同。

推薦系統的終極願景，在於每個使用者都能夠看到一份屬於自己偏好的網站內容。使用者不再需要自行一一挑選、過濾想看的內容。資訊沒有超載的問題，因為出現的都是根據偏好及互動而過濾出來。Amazon.com 的執行長 Jeff Bezos 說(Schafer 2001)：「如果我有三百萬個客戶，那麼我應該就有三百萬個網路商店」。

在文檔中 Web 2.0概念的圖書館個人化推薦系統 (頁 43-49)

（一） 輸入與輸出

（二） 推薦方法

（三） 個人化與傳遞

（一）輸入與輸出

（二）推薦方法

（三）個人化與傳遞