• 沒有找到結果。

應用RFM 模組與權重漸進探勘使用者最近習慣進行協力式推薦

N/A
N/A
Protected

Academic year: 2021

Share "應用RFM 模組與權重漸進探勘使用者最近習慣進行協力式推薦"

Copied!
20
0
0

加載中.... (立即查看全文)

全文

(1)應用 RFM 模組與權重漸進探勘使用者最近習慣進行協力式推薦 Application of Incremental Mining Based on Weight and RFM Model to Collaborative Music Recommendations 林朝興. 唐瑩荃. 南台科技大學資訊管理研究所. 南台科技大學資訊管理研究所. [email protected]. [email protected] network, the large amount of digital music has spread. 摘要. extensively on the Internet. That causes users cannot fallow one’s bent to find out the music or songs they. 現今網際網路快速的發展,大量的數位音樂,. want. Many e-commerce make further efforts to. 已經廣泛在網路上傳播。許多電子商務更是發展音. develop Music Recommendation System to improve. 樂推薦系統來提高顧客需求慾望。而一般線上音樂. customers’ demands and desires. The general on-line. 推薦系統,記錄了使用者所有歷史交易資料,並全. Music Recommendation System records all user’s. 部進行分析。因此,便增加執行時所耗費的成本、. former transaction and analysis them completely. So,. 時間及是否符合使用者目前真正喜好的項目。本研. it increases the cost, time, and items which adapt to. 究利用 RFM 模組分析顧客價值,並且將相同顧客. what users like now or not. This paper combines. 價值歸為同一群組,進而達到分群的動作。結合使. RFM model to analysis customers’ value and classify. 用者最近習慣,提出以權重漸進探勘(IMW)的. the same one as the same group. We combine users’. 構想,以漸進增加交易資料量的方式來探勘最近規. Recent Behavior to Incremental Mining based on. 則,而不需將全部交易資料都做分析,藉以節省計. Weight, which can mine for relations by it, not. 算成本、時間,並以 Apriori 演算法來探勘關聯式. analyzing all data, to decrease to calculate cost and. 規則。相似向量矩陣計算使用者們之間的相似度關. time. It also prospect for Association Rule Mining by. 係,便利相似聚集。最後利用協力式推薦的概念,. the Apriori algorithms. And then, similar vector. 由推薦模組將音樂推薦給使用者,做為個人化推薦. matrix is used to calculate the degree of similarity. 方式。實驗結果顯示,結合 RFM 模組及相似聚集. relation. 推薦較單純只使用 RFM 分群方式為佳。而整體. conveniently. Finally, through the concept of. 上,本研究的推薦準確率高達 0.77,比其他推薦方. Collaborative Filtering, we take advantage of. 法高出 14%~30%,有效的達到個人化推薦的效. recommendation model to be the method of. 果。. individual recommendation that put music up to users.. between. users’. to. assemble. them. According to the experiment results, it is better to use. 關鍵字:權重漸進探勘,RFM 模組,協力式過. the combination of RFM model and similar. 濾,關聯式規則. assembling than RFM classification only. What is. Abstract. more, the accuracy of this research is up to 0.77, which is higher 14% to 30% than the others, to make. Because of the rapid development of internet. up the effect of individual recommendation. 1.

(2) Keywords: Incremental Mining based on Weight,. 一定是使用者真正目前感到興趣的[14] [22]。另外. RFM model, Collaborative Filtering, Association. 以階層分析法(AHP),採用自問自答的問卷方式. Rule. 來設定使用者最近喜好權重,其缺點是使用者必須 自我決策,無任何即時動態的推薦反應,浪費了不. 一、研究背景與目的. 少時間[1] [16]。而有關音樂推薦系統的研究,仍然 以音樂內容特徵做為音樂推薦之研究最多[8] [13]. 亞馬遜網路書店(Amazon.com)的執行長 Jeff. [17],然而這些研究需要加強擷取內容特徵的準確. Bezos 曾經說過:『假如我在網路上有三百萬個顧. 率,否則其推薦滿意度通常不佳。其他,如 Ringo. 客,我就必須有三百萬個網路上的商店』[19]。這. 的音樂推薦系統[21],必須先集合眾人對音樂歌曲. 句話突顯了網路商店的重要性。所以在這資訊發達. 的評價分數,再以協力式推薦方式,達到互相推薦. 的世界中,如何擁有顧客的高忠誠度,是有其必要. 的效果,不過這些傳送都必須透過 e-mail 來執行,. 的。所以,分析顧客價值性是相當重要的,可讓網. 造成無法線上即時音樂推薦。. 站供應商針對高價值顧客做精確的推薦或低價值. 後來也有研究學者以最後的交易筆數,當成使. 顧客的行銷策略,以提高顧客的忠誠度。. 用者最近興趣的探勘結果並加入權重計算,可是這. 隨著數位化風潮與高音質服務需求時代的來. 些研究方法只探勘有限之交易項目,一旦在大量交. 臨,眾多的數位音樂(Mp3、Wav、MPEG)等等,. 易資料下,需要挖掘多少筆交易項目及權重的大小. 有如洪水傾巢而出,一般消費者要將所有的音樂內. 的設定就會變的相當重要與複雜,因此無法更深入. 容消化幾乎是不可能的。加上琳瑯滿目的音樂風. 探討使用者最近興趣的探勘。然而,權重的主要精. 格,一般的推薦系統恐怕無法滿足使用者的主觀意. 神是越接近現在的交易,權重就設的越高。所以加. 識,造成無法符合個人化推薦的主要因素。. 入權重計算可以更得知使用者在最近交易的類別 中最感興趣之項目,也因此可以依權重值大小來給. 然而,全球最暢銷的音樂推薦系統,如:. 予適當的推薦數目。. Amazon、CDNOW 等網站,大部分都以產品為導. 基於以上的描述,本研究目的有三個構面:. 向的銷售推薦而非以顧客為導向的精確策略。因 此,若能有一自動化的輔助系統讓使用者得到許多 1.. 相關的數位音樂歌曲,給予建議或是依據使用者的. 提供一套個人化音樂推薦的機制. 音樂風格偏好進行推薦,必能提高縮短找尋歌曲的. 本研究以提供個人化服務的電子商務為目. 時間及刺激網路音樂的市場,更可以讓使用者接觸. 的,使顧客擁有自己量身訂作的個人化服務機制,. 自己喜好風格的音樂,增加其新鮮感或知識性。. 以提高顧客對網站的高忠誠度。. 近年來發展的過濾系統或推薦系統,幫助使用. 2.. 者將大量的資料,轉換為有用的資訊,提供使用者. 取得顧客價值能力 擁有顧客價值能力,可讓企業或供應商,分析. 有興趣的產品,對使用者做精確有效的推薦。目前. 顧客的消費、忠誠度等能力,好讓企業針對不同的. 相關的推薦系統發展至今,已經產生出相當多的研. 顧客能力,而有另外的行銷策略。. 究方法了,然而許多方法仍不見的理想。. 3.. 以關聯規則來探勘使用者之喜好,其技術是將. 分析顧客的最近歷史交易,節省大量計算. 使用者所有的瀏覽記錄做分析並挖掘出結果為依. 本研究最主要就是透過分析最近歷史交易資. 據,因此系統需要過濾全部的交易資料,造成系統. 料來推薦音樂,所以可協助企業瞭解顧客的消費行. 效率上的延遲,再則挖掘所有交易項目之結果也不. 為與喜好,作為一對一行銷之參考。 2.

(3) 目前推薦系統在電子商務上的應用,比較偏重. 二、文獻探討. 於個人化的功能,希望能根據每個使用者不同的習 慣分別給予使用者符合習慣的推薦,一般較常被應. (一)資料探勘的定義. 用的推薦方法主要為:. 資料探勘的定義就是從大量資料庫中發現知. 1. 內容式導向過濾(Content-Based Filtering):主. 識,將先前並不知道的或潛在有用的資訊從資料庫. 要是根據資料的內容來篩選資料,為內容資訊的延. 中挖掘出來的過程[10]。資料探勘的第一步驟,是. 伸。並根據使用者輸入的關鍵字,由系統來篩選出. 指定探勘和分析的資料,探勘的資料可以從資料庫. 符合這些關鍵字或者符合這些關鍵字的語意概念. 或資料倉儲(Data Warehousing)中,取得表格、. [5][15][22]。. 概略表或記錄文字檔。接著為降低資料量,首先將 收集的資料作整理(Data Cleaning)、資料整合. 2. 協力式導向過濾(Collaborative Filtering) :主要. ( Data Integration ) 或 資 料 的 轉 換 ( Data. 是利用眾人的意見來篩選資料,完全跟資料內容無. Transformation)等等,並且確保使用者資料的完. 關。此方法結合了個人與參考群體的偏好,能夠減. 整。使用資料探勘的方法有分類、趨勢分析、分群、. 少個人參與程度的同時亦能提供個人化資訊[4] [6]. 關聯及循序特徵等,從轉換後的資料中發掘存在的. [7] [9]。. 多重特徵及資訊。在探勘之後,我們可以從資料庫. 目前已有許多的研究針對此兩種方式做比. 存取有趣的知識或規律,並可以從不同角度來觀察. 較。而協力式過濾是目前使用最成功的推薦技術,. 或瀏覽之。發現的知識可被用在決策、流程控制、. 它可以解決內容式導向的一些問題,幫助顧客得到. 資訊管理、查詢管理等等。因此,資料探勘被資訊. 潛在需要,甚至是有意想不到的產品。然而,這些. 業界認為是資料庫系統最重要的前途之一。. 推薦方法並無絕對的好壞,只是依照需求不同而各 有存在的價值。而本研究在推薦技術上是使用協力. (二)推薦系統. 式推薦,因為音樂特徵內容過濾相當不易,可能造. 企業可藉由推薦系統來解決網路上的資訊超. 成準確率的低落,所以我們希望以協力式推薦技. 載,所以利用電子商務網站可以經由顧客歷史資料. 術,達到資訊互相分享的結果。. 的提供、供應商的統計資料及探勘後的規則,來推. (四)顧客價值分析與 RFM 模型. 薦個人化的產品。Schafer(1999)提出推薦系統對 於電子商務上的效益包括[18]:. 傳統上,雖然供應商可以很清楚地知道每日的. 1. 提高顧客忠誠度:透過推薦機制,可以加強企. 銷售額有多少,但是卻很難能將個別顧客與銷售情. 業與消費者的關係,提高顧客忠誠度,降低流失. 況作一連結。而透過資料庫,供應商可以很容易地. 率。. 對顧客進行價值分析,並針對不同價值的顧客進行 不同的資源分配,以及採取不同的行銷策略。根據. 2. 將瀏覽者變成購買者:適時的推薦顧客所喜好. Arthur Hughe, 1994 [11]所言: 『所謂的顧客終身. 的產品,可能會引起購買的慾望,增加產品購買的. 價值(Customer Lifetime Value)是指在未來一段時. 動作。. 間之內,企業或供應商可以從個別顧客中獲得之利. 3. 交叉銷售:推薦系統可以推薦額外的產品給顧. 潤的淨現值』。而供應商可以依據資料庫中顧客的. 客來產生交叉銷售的利益,以提高平均的交易量。. 購買記錄,算出每位顧客可能貢獻於供應商的終身 價值。透過顧客終身價值的計算,供應商除了可以. (三)推薦技術的種類. 預測未來的營收情況外,還可以確認出顧客價值的 3.

(4) 3. 購買金額(Monetary Amount). 高低,以分配不同的資訊資源於不同價值的顧客身 上。. 購買金額是指在一段期間內,顧客購買該供應. 目 前評估 顧客 價值 以 RFM 方 法 廣為運 用. 商產品的總金額。一般而言,當顧客的購買金額愈. [12]。供應商必須根據顧客過去的交易記錄,來對. 高時,則供應商會認為其顧客價值較高。然而,為. 其未來的行銷做預測。供應商以三種構面分析顧客. 了避免新顧客因購買次數過少、購買金額過低,而. 價值:最近購買日、購買頻率、購買金額。. 忽略其重要性,因而在處理購買金額時,我們通常 以平均購買金額來取代。. 首先,最近購買日(Recency)為衡量顧客最. (五)關聯規則—Apriori 演算法. 近一次購買日距離現今時點的日子。一般而言,最 近購買日越小,即表示顧客最近一次購買完產品的. 關聯規則探勘是資料探勘中的方法之ㄧ,經常. 時間距現今不久,所以被認為是較有可能再度購買. 運用於商品交易記錄資料庫上,針對使用者的交易. 的顧客,這群顧客的得分比最近購買日長的顧客要. 行為做分析,找出商品間的關聯規則。再根據這些. 來得高。購買頻率(Frequency)指的是一個顧客. 關聯規則來決定搭配促銷商品和商品架位等行銷. 在一段期間內購買產品的頻率。頻率愈高,則顧客. 策略,藉以提高交易量和營業額。例如:80%購買. 對產品的忠誠度相對較高,此一顧客對公司而言也. 牛奶和果醬的顧客也會同時購買吐司,就是一個典. 相對重要。因此,高購買頻率的顧客得分較高。購. 型的關聯式規則,而本研究也基於這個購物規則來. 買金額(Monetary)指的是在一段期間內,顧客購. 挖掘使用者的最近習慣。從 1993 年 Agrawal 提出. 買該供應商產品金額的總和。一般而言,金額總和. 從交易資料庫中探勘出關聯規則的演算法後[2]. 愈高的顧客,其相對於供應商的重要性也愈高;反. [3],陸續有學者將關聯規則的概念應用到其他領. 之,總和價值愈低的顧客得分就相對不高。透過以. 域,提出適用於該領域的演算法。. 上三種分析指標,可以加總得到各個顧客對供應商. 本研究所採用的高頻項目集合產生方式為. 的價值。. Apriori 演算法,其使用一種稱作逐層搜尋的疊帶. 根據 Arthur Hughes(1994)對 RFM 的定義:. 方法,它會使用 k-項目集合來探索(k+1)項目集 合。首先,我們找出頻繁 l-項目集合的集合,該集. 1. 最近購買日(Recency). 合記作 L1,L1 用來找出頻繁 2-項目集合 L2,而 L2. 最近購買日是指顧客最近一次購買距離分析. 用來找 L3,如此下去,直到不能找到頻繁 k-項目. 時點的天數。一般而言,當顧客最後一次購買的時. 集合,找每個 Lk 都需要對資料庫作一次掃描。為. 間距離在很近,即最近購買日較小時,供應商認為. 了要使用 Apriori 性質,頻繁項目集合的所有非空. 該名顧客會再度消費的機會較高,因而其在最近購. 子集合都必須也是頻繁的。根據定義,如果項目集. 買日指標分數較高。然而,在最近購買日分數的高. 合 I 不滿足最小支持度(Min-support)值,則 I 不. 低來決定顧客的重要性程度時,應考慮到該供應商. 是頻繁的。. 產品的特性,不能單憑最近購買日的分數高低便決 定顧客的重要性程度。. (六)最近興趣與權重相關探討. 2. 購買頻率(Frequency). H.-C. Chen and Arbee L. P. Chen(2001)利用 pitch、duration、loudness,這些音樂標準的特徵抓. 購買頻率是指顧客在一定期間內購買該供應. 取,經過分類然後再經由推薦模組找出一個最適合. 商產品的次數。一般而言,當顧客的購買次數愈多. 的方式將音樂建議給使用者。此篇論文強調的是三. 時,則供應商會認為其忠誠度和顧客價值較高。. 種的推薦模組(CB、COL、SAT),而這三種代表 4.

(5) 表 3 二項集合演進式探勘過程. 的意義分別為 : (1) 抓取使用者最近的興趣; (2) 利用使用者的群組興趣相互推薦; (3) CB、COL. 類別項目 AC AD CD. 的混合型。研究論文中的 CB 方法強調最近興趣的 抓取,並設定權重。可是當大量交易筆數下,如果 只抓取最後幾筆資料來當作最近興趣,實在不足以 代表最近興趣挖掘並且權重配置也無任何動態的. First T1 T2 T5. Last T5 T6 T5. Count 3 3 1. Support 0.5 0.6 0.5. 這樣的選取方式的用意,是越接近現在的記錄. 表示,可能會造成管理者的負擔。而 COL 的應用. 或交易越容易被選取出來,因為越接近現在的紀. 為冷門的推薦,造成使用者滿意度的低落。另外在. 錄,分母就會越小;越久遠的紀錄,分母會越大。. 擷取音樂特徵中不容易達到成果,造成推薦滿意度. 所以演進式探勘的精神即是能隨著時間演進來探. 的不足。其中 COL 的方法套用了[23],提出使用. 勘出客戶的交易或瀏覽習慣。. 者興趣與習慣,興趣的定義為 1 項集合類別,而滿 足 2 項集合類別就定義為習慣。並且利用這兩種結. 我們以表 1 交易資料為例子,將它的每一類別. 果來完成六種分群的動作,由每一群集再進行相似. 項目計算他的 count 值及 support 值,接著刪除不. 度的比對及協力式推薦。此研究目的是為了找出使. 足支持度門檻值(假設 45%)的項目 B。然後利. 用者在最近交易的情形並且得知真正符合最近交. 用剩下的一項高頻項目組合成二項候選項目,一共. 易的興趣類別。因此提出演進式探勘公式,其主要. 產生了{AÆC} 、 {AÆD} 、 {CÆD} ,三個候選項. 精神及步驟都與一般的 Apriori 演算法相同。兩者. 目,之後依照上述方法計算其 count 值及 support. 之間主要的差異在於,掃描資料庫時觀察候選項目. 值。如表 2 所示:. 集是否存在資料庫中;如果有則將候選項目集的. 我 們 從 表 3 探 勘 出 { AÆC }、{ AÆD }、. count 值加一。比對整個資料庫之後,(count 值). {CÆD} ,三個項目規則,我們可以發現,演進式. /(總次數 - item 第一次出現的值+1)所儲存的. 探勘的最主要意義是可以根據交易順序來選取交. 值即爲此候選項目集的支持度。接著判斷其支持度. 易資料,越接近目前的交易就越有可能被選取出. 值是否有超過支持度門檻值的限制,若是超過即成. 來。然而,這樣的探勘方式有一個缺點,就是其方. 爲真正高頻項目。. 法無法分辨{CÆD}這一項目集,因為{CÆD} 只在最近交易中有交易過一次而已,但經由計算,. 表 1 歷史交易資料 交易紀錄 T1 T2 T3 T4 T5 T6. 那類別將會成為興趣類別,可是我們可從交易資料. 類別項目 AC AD ABC C ACD AD. 表內看出交易的比例, {CÆD}只佔有一次,所以 無法認定它是否是真正使用者的最近興趣。 汪軒楷、王台平的策略式資料探勘在個人化推 薦上之研究(2002),提出時間式權重的設定中, 利用瀏覽時間來區分權重的大小,越靠近最近交易. 表 2 一項集合演進式探勘過程. 時間其權重就越大,並利用 Apriori 演算法加上權 類別項目 A B C D. First T1 T3 T1 T2. Last T6 T3 T5 T6. Count 5 1 4 3. 重的計算挖掘最近習慣。我們同樣依表 3 交易資料. Support 0.83 0.25 0.66 0.6. 為例子,不過卻增加了使用者的瀏覽時間及權重設 定,如表 4,我們將一項集合項目的 support 值計 算出來,以 A 為例: (0.1+0.1+0.2+0.4+0.5)/ 6 +(5/6)=1.05. 5.

(6) 綜合以上文獻探討,本研究的目的是希望提供. 表 4 時間權重交易 交易紀 錄 T1 T2 T3 T4 T5 T6. 一個人化音樂推薦方式,而且針對使用者最近習慣 類別項目. 瀏覽時間. 權重. AC AD ABC C ACD AD. 03/16~03/22 03/16~03/22 03/23~03/29 03/30~04/05 04/06~04/12 04/13~04/20. 0.1 0.1 0.2 0.3 0.4 0.5. 這方面的研究來提出不同於一般傳統探勘技術,因 此利用權重漸進探勘將使用者之前的瀏覽記錄透 過本方法來找出最近習慣的類別。. 三、研究方法. 表 5,我們計算出每一類別的 support 值,並刪 (一)研究流程. 除不足支持度門檻值(假設 45%)的項目 B,然 後組合二項候選項目並計算支持度,見表 6 並刪除. 本研究將敘述線上音樂推薦系統的基本流. 不足支持度門檻值的項目{CÆD}。. 程,如圖 1 所示,主要是為了提供使用者音樂的推 薦服務。使用者們透過介面瀏覽的介紹,得知音樂. 表 5 一項集合時間權重探勘 類別項目 A B C D. Count 5 1 4 3. 的作者、風格、特徵樂器、歌名、年份、專輯名稱. Support 1.05 0.19 0.83 0.66. 等等內容訊息,因此使用者可試聽音樂檔案並下載 使用者喜歡的歌曲,而顧客交易資料庫便是記錄音 樂編號、類別風格等等訊息。本研究透過三種模組 階段來呈現音樂推薦的過程, (1)顧客分析模組: 透過歷史交易紀錄的行為將資料進行顧客價值分. 表 6 二項集合時間權重探勘 類別項目 AC AD CD. Count 3 3 1. 群動作,先達到資料整合及分配不同的資源於不同. Support 0.62 0.66 0.23. 價值的顧客身上。 (2)使用者輪廓模組:將使用者 交易資料進行權重漸進分析並取得使用者高頻繁 交易項目的關聯規則,因此可探勘出使用者在最近. 經由上述說明,其時間式權重的結果是在合理. 習慣中的規則。 (3)協力式推薦模組:基於相似向. 範圍內,可是研究中的缺點為管理者需要自己設定. 量比對使用者的相似度後,將可以聚集相似規則使. 權重值,並且依時間的不同而有所改變,因此可造. 用者,最後進行協力式推薦,將相似比對結果做. 成管理者設定權重的負擔。除此之外,時間權重的. top-N 推薦的階段。. 設定很難有一個統一的標準。. 6.

(7) 表 7 最近興趣與權重相關比較 作者. 研究方法. 1. Chen, H.-C. (2001). 2. 3.. 1. Wu, Y.-H. (2001). 2. 3.. 1. 汪軒楷 (2002). 2. 1.. Weng, S.-S. (2004). 2. 3.. 優點. 以音樂內容特徵 提供推薦。 使用三個推薦模 組 ( CB 、 COL 、 SAT)。 使用內容導向過 濾方法。. „ „. 以一項集合代表 興趣,二項集合代 „ 表習慣。 以演進式公式挖 掘使用者最近興 „ 趣及習慣。 使用協力式導向 過濾方法。 以時間權重及 AHP 方 法 改 善 „ Apriori 的不足。 使用協力式導向 過濾方法。 以產品特徵作個 „ 人化推薦。 兩階段分群法。 „ 使用協力式及內 容式導向過濾方 法。. 最近興趣權重計 算的推薦。 SAT 推薦模組提供 顧客不感興趣之 物品。. 將使用者一開始 所選交易分為六 種分群。 推薦結果呈現滿 意度較高。. 缺點. „ „ „. „ „. 音樂內容特徵不 易擷取。 實驗結果,滿意度 低。 最近興趣交易,代 表性不夠。. 演進式演算法, 挖掘結果會產生 過多的規則。 興趣與習慣的集 合,不符合實際。. „ 以 AHP 問 卷 分 析,能夠得到較高 „ 的滿意度。. 權重設定易造成 管理者負擔。 AHP 分析,造成時 間浪費。. „. 產品特徵的表達 易造成管理者負 擔。 大量資料下,特徵 比對使系統效率 降低。. 兩階段分群能夠 更精確分類。 以產品特徵來分 析使用者對產品 的偏好,以利個人 化推薦。. „. 圖 1 線上音樂推薦流程圖 (二)顧客價值分群模組之描述. 群的動作並儲存於類別分群資料庫。而所謂資料分 群(Data Clustering)的原則,就是『群組內的資. 壹、RFM 模組分群定義. 料相似度最高,而群組與群組間的資料相似度最. 由顧客交易資料庫裡儲存著散亂無整合的歷. 低』。因此,我們利用 RFM 模組的構想,將顧客. 史資料,所以一開始要先將顧客交易資料庫做一分. 的最近交易日期、交易頻率及交易金額,當成第一 7.

(8) 計算使用者 U1 的 RFM 價值分數,根據每一個. 階段分群的動作。目的是為了讓往後之推薦能有效 的對高價值顧客或低價值顧客做一適當的推薦。. 使用者的 RFM 價值分數,我們以全部顧客 RFM 的總平均值為一標準,並且以↑表示其值大於總平. 首 先 RFM 模 組 的 定 義 : 最 近 購 買 日. 均值,而↓小於總平均值。利用這種表示可以將群. (Recency) ,是指顧客最近一次購買距離分析時點. 組分為八個(↑↑↑、↑↑↓、↑↓↑、↑↓↓、. 的天數。購買頻率(Frequency) ,是指顧客在一定. ↓↑↑、↓↑↓、↓↓↑、↓↓↓),並將每一位. 期間內購買該供應商產品的次數。購買金額. 使用者分群在符合的群組內。假設表 9,表示著每. (Monetary Amount) ,是指在一段期內,顧客購買. 一位使用者將他的 RFM 價值分數與平均值做一比. 該企業產品的總金額,不過本研究要將購買金額的. 較的結果,因此可以找出每一位使用者的群組型. 計算方式改為計算類別項目(Itemsets)次數,而. 式。每一個群組型式表示著行銷上的不同策略,例. 類別項目只要點選的越多也代表著顧客會花錢在. 如使用者 U3,其購買金額高、購買頻率高、最近. 這個類別項目上,每一個類別項目都代表金額一. 購買日期近,都足以證明使用者 U3 對網站供應商. 元。本研究透過價值分析功能可將顧客分群為八個. 而言,是一個高消費、高忠誠的大客戶,因此與使. 群組,而每一種群組對電子網站供應商,各擁有不. 用者 U3 為同一群組的顧客,都是我們推薦效果最. 同的推薦策略。. 佳的顧客之一。而使用者 U2,可說明為較不常進. 貳、顧客價值分群範例. 入網站的人,所以價值性較低,因此在推薦策略上 當然是以多量、多類別的混合推薦,期待他下次再. 假設使用者 U1 的歷史交易資料,如表 8,分. 度光臨購物。. 別計算使用者 U1 的 RFM 三種價值如下: 最近購買日期(R) :假設目前日期為 2005/06/03, 而使用者 U1 最後一次的交 易時間為 2005/05/14,相距 天 數 是. 2005/06/03 -. 2005/05/14=20(日)。 購買頻率(F) :20(次)。 購買金額(M):42(元)。 表 8 使用者 U1 歷史交易紀錄 交易時間. 交易紀錄. 類別項目. 交易時間. 交易紀錄. 類別項目. 2004/01/11. T1. AB. 2004/08/30. T11. DE. 2004/01/21. T2. CD. 2004/09/11. T12. C. 2004/02/12. T3. ABE. 2004/10/14. T13. ABC. 2004/02/15. T4. E. 2004/11/15. T14. BD. 2004/03/13. T5. CDE. 2004/12/16. T15. AC. 2004/03/19. T6. AB. 2005/01/17. T16. AD. 2004/04/21. T7. AE. 2005/04/18. T17. ABC. 2004/05/24. T8. AB. 2005/05/10. T18. C. 2004/06/21. T9. AB. 2005/05/12. T19. ACD. 2004/07/24. T10. CD. 2005/05/14. T20. AD. 8.

(9) 表 9 以 RFM 價值分群表示 使用者. 最近購買日期(R). 購買頻率(F). 購買金額(M). 顧客的群組型式. U1. 20. 20. 42. R↓F↓M↑. U2. 28. 17. 33. R↑F↓M↓. U3. 22. 30. 44. R↓F↑M↑. U4. 23. 31. 45. R↓F↑M↑. U5. 19. 19. 44. R↓F↓M↑. U6. 9. 20. 45. R↓F↓M↑. U7. 35. 30. 47. R↑F↑M↑. U8. 58. 33. 20. R↑F↑M↓. 總平均. 26.75. 25. 40. 目,並且刪除不足最小支持度 MinSupport 值的類. (三)使用者輪廓模組之描述. 別項目。 壹、權重漸進規則描述. WS. 傳統資料庫由於要計算全部的交易資料,所以. j i. 為第 i 個類別項目在第 j 次漸進交易資料. 中的權重支持度 , Count. j i. 是第 i 個類別項目出. 要來獲得使用者的高頻繁項目,勢必造成系統執行. 現在第 j 次漸進交易的出現次數總和,j 為漸進探. 的時間、成本的增加,影響了電子商務的即時性功. 勘的次數。Wj 是權重值大小的計算,βj 為β的 j. 能。況且,使用者最近交易的選擇中也不一定會一. 次方,為一常數(β<1)。. 直圍繞在相同的類別風格,因此我們先說明最近交. WS i j = WS i j − 1 + ( Count. 易的定義:使用者在過去瀏覽中,最接近目前的交. j i. ×W j). where ,. 易行為,雖然使用者可能會有最近一次與上一次交. WS i0 = 0 ,. Wj = β. j −1. ,. (1). j = 1, 2 ...... n. 易相隔太久的情況。不過這些交易也是使用者的喜 貳、權重漸進基於 Apriori 演算法探勘規則描述. 好內,並不會因時間而來改變。所以我們記錄所有. 本研究利用 Apriori 來探勘最近習慣規則,目. 使用者的歷史交易來做探討。. 的是找出有用的最近習慣規則(Recent behavior 本研究提出 IMW(Incremental Mining based on. rules—Rbr)來進行精確的推薦。因此本方法是將. Weight)的構想,來找出使用者在最近時間內的交. 上述權重漸進的構想加入 Apriori 內,希望透過這. 易習慣類別。目的是利用漸進探勘可以省下全部探. 種簡單的規則思維,求得研究中理想的規則。以下. 勘的時間及動態的探勘出最近習慣。然而加入權重. 是描述挖掘規則的步驟。. 更是為了計算何項類別才是最接近現在的交易。如 1.. 此一來,將可得到一個精確的興趣類別,而不是大. 假設先抓取交易資料內的最後 n 筆交易,並計 算每一項集合類別 i 的次數值。. 約或增加其他類別項目了。然而漸進次數的不同,. 2. 以公式(1)計算 WS 值,比對每一項集合類別. 所得到的結果排列也會不一樣,而影響推薦的數目. i 是否符合 Support 的要求。. 及精確度,所以支持度的設置就格外重要了。 3. 為了計算每一類別交易項目是否達到支持度. 如果不符合就再抓取下一個 n 筆交易資料,並 且再重新計算 WS 值,直到其中有某個類別項. 的門檻,本研究必須設定一個權重支持度(Weight. 目到達了支持度設定,就停止計算。. Support--WS) ,並設定門檻支持度 Support 值,只. 4.. 要通過 Support 的類別,就將其視為高頻繁類別項. 刪除不足 MinSupport 之一項集合項目。並將 通過一項集合類別之高頻繁項目,組合成二項. 9.

(10) 表 11 第二次權重漸進計算. 候選集合,重複上述的方式計算每一個二項集 合類別 i。 5.. 二項候選集合依據之前的一項類別集合所做 的 漸 進 次 數 ( j = 1,2.....n )。 接 著 刪 除 不 足 MinSupport 的集合。. 6.. 交易項目. 類別項目. T17 {ABC} T18 {C} T19 {ACD} T20 {AD}. A B C D E. 最後剩下的二項集合類別將視為使用者的最. 權重支持度 (WS) 2+1*0.9=2.9 0+1*0.9=1.9 1+2*0.9=2.8 2+0*0.9=2 0+0*0.9=0. 近習慣規則(Rbr)。公式(2),將 WS 大於 表 12 第三次權重漸進計算. MinSupport 及小於 Support 的二項類別項目歸 為最近習慣規則。其中[iÆj]為可能類別項目 的表示。 Rbr={[iÆj]|MinSupport≦ WS ([i. → j ]) ≦Support } (2). 參、權重漸進規則探勘範例 假設 Support=4、MinSupport=2、漸進交易量. 交易項目. 類別項目. T15 {AC} T16 {AD} T17 {ABC} T18 {C} T19 {ACD} T20 {AD}. A B C D E. 權重支持度 (WS) 2.9+2*0.81=4.52 1.9+0*0.81=1.9 2.8+1*0.81=3.61 2+1*0.81=2.81 0+0*0.81=0. 表 13 二項集合第一次權重漸進計算. n=2、β=0.9、而類別 i 分別為 A、B、C、D、E 為代表。 由表 8 假設有二十筆使用者 U1 交易項目之歷. 交易項目. 類別項目. T19 {ACD} T20 {AD}. AC AD CD. 史記錄,首先挖掘一項集合類別,假設一開始先抓 取最後兩筆交易項目(n=2),即 T20、T19。計算. 權重支持度 (WS) 1*1=1 2*1=2 1*1=1. 表 14 二項集合第二次權重漸進計算. 每一類別項目的次數並經由公式(1)計算出權重 交易項目. 支 持 度 WS 值 並 無 任 何 一 項 類 別 項 目 符 合. T17 {ABC} T18 {C} T19 {ACD} T20 {AD}. Support=4,如表 10。因此必須再加入另外兩筆交 易項目 T18、T17,而且再一次進行權重漸進計算, 見表 11 依舊未符合 Support 值,所以就一直重複. 類別項目 AC. 權重支持度 (WS) 1+1*0.9=1.9. AD. 2+0*0.9=2. CD. 1+0*0.9=1. 漸進資料的計算,直到完成。表 12 為第三次權重 表 15 二項集合第三次權重漸進計算. 漸進的結果,其中的 A 類別之權重支持度符合 Support 值,因此停止漸進計算,並且將 B、E 類 別項目刪除,因未達到最小支持度(MinSupport =2)。 表 10 第一次權重漸進計算 交易項目. 類別項目. T19 {ACD} T20 {AD}. A B C D E. 權重支持度 (WS) 2*1=2 0*1=0 1*1=1 2*1=2 0*1=0. 交易項目. 類別項目. T15 {AC} T16 {AD} T17 {ABC} T18 {C} T19 {ACD} T20 {AD}. AC. 權重支持度 (WS) 1.9+1*0.81=2.71. AD. 2+1*0.81=2.81. CD. 1+0*0.8=1. A、C、D 類別項目是一項集合的高頻繁項目, 依 照 Apriori 演 算 法 組 合 成 二 項 候 選 集 合 , {AÆC}、{AÆD}、 {CÆD}。表 13 由一項集合 類別的高頻繁項目組合成二項候選集合類別,而二 項候選集合類別的計算次數是依照一項集合類別 總共做了幾次的漸進計算為停止依據(j=3) ,所以. 10.

(11) 表 16 使用者 X 相似矩陣表示. 只要計算至第三次漸進就停止了,理由是要與一項 集合的漸進一致,避免二項集合的漸進過程中,因. A. 無法到達支持度,而不斷的漸進計算,浪費不必要. A B C D E. 的成本。由表 14、表 15 可看出計算的過程,最後 二項集合類別的高頻繁項目規則為{AÆC}、 {AÆD}兩項規則,而{CÆD}這一項因支持度 過低,因此刪除。最後將二項集合類別的高頻繁項. C 1 0. D 1 0 0. E 0 0 0 0. 貳、相似向量之計算. 目作為使用者最近習慣的依據,並進行相似使用者. 相似矩陣轉換成相似向量(Similar vector),. 的聚集。. 相似向量的定義如下:. 最後的結果規則{AÆC}、{AÆD},而且 {AÆD}的權重支持度最大,因此往後的推薦過. SV(X)=[sm12 sm13...sm1n. 程, {AÆD}相關類別產品將推薦較多數目給使用. 進行每一使用者之間的相似度比對。. 了演進式探勘的缺點及時間權重探勘之權重設定. 參、相似使用者聚集. 負擔,所以本研究可得出較精確的探勘結果。. 上述方法是為了完成使用者的相似向量為目. (四)使用者相似類別聚集描述. 的,而現在我們要進行每一使用者之間的相似度比. 壹、相似矩陣建置之探討. 對,以便相似聚集(Similayity)分類的動作。. 這一章節將說明如何再一次聚集相似使用. Similarxy = ( X1 ⊕ Y1 ) + ( X 2 ⊕ Y2 ) + .....(X l ⊕ Yl ). 者,並且依據使用者最近習慣得出的規則來做聚集. Similarset (X)= { Uy∣Similarxy ≦. 分類。目的是為了聚集相似類別項目的使用者,找. θ. }. (5) (6). 公式(5)是計算使用者 X 與使用者 Y 之間相. 出使用者之間更相似的群組,達到真正協力式資訊. 似值(Similarxy),其中 Xl 及 Yl 在這裡是指相似向. 分享的作用。定義如下:. 量 X 或 Y 的第 l 個元素, ⊕ 為互斥或閘(相同為. SM(X)為使用者 X 最近習慣規則(Recent. 零,不相同為一) 。公式(6)設定分類門檻值 θ ,. behavior rules ) 展 開 結 合 成 相 似 矩 陣 ( Similar. 分類門檻值得大小將影響相似使用者的變動,造成. Matrix),矩陣內第 i 列第 j 行的元素為 0,Rbr 為. 推薦程度的不同。將相似值小於等於門檻值的使用. 最近習慣規則[iÆj]可能類別項目,公式(3)。. 者 Y(Uy)歸為使用者 X 的相似集合(Similarset (X))。上述相似矩陣建置及聚集的方式,可以更. ;(m , n = 1,2,3……,p). where. if. (4). 似向量為[0110 000 00 0],求得相似向量後,就可. 法,雖然最後結果相差不遠,可是本研究方法解決. SM(X)= [smij]m×n. sm23 sm24 sm2n ...... sm(m-1)n ]. 經由公式(4) ,可從表 16 轉換使用者 X 的相. 者。我們也可以比較在文獻探討中的另外兩種方. ⎧1, smij = ⎨ ⎩0,. B 0. 清楚的將顧客們做相似的聚集,不同於之前的. (3). RFM 分群。. [i → j ] ∈ Rbr otherwise. 肆、相似類別使用者聚集範例 假設類別項目 i 分別為 A、B、C、D、E 為代. 表 16 假設有 A、B、C、D、E 五個類別項目,. 表,門檻值 θ =2。使用者 UX 最近習慣的類別項. 而使用者 X 最近習慣類別為{AÆC}、 {AÆD}。. 目為{AÆC} 、{AÆD}。表 17 將 UX 最近習慣的. 故在矩陣內[A,C]、[A,D]填入 1,其它仍為 0。. 類別項目表示為向量矩陣方式。接著將 UX 量矩陣 11.

(12) 轉換成相似向量[ 0110 000 00 0 ],然後利用公式. 第二種方式為相似向量分類的結果,我們聚集. (5),以 UX 為基準,與各個 Users 兩兩比對並計. 了同一群組內與其他使用者最相近風格的 Users。. 算相似值。見表 18,求出相似值後,透過分類門. 因此本方法是利用 RFM 分類後在相同群的其他. 檻值 θ =2 來區分相似同好,並聚集為相似同類。. Users 所點選的歌曲來進行相互推薦。這種方式的. 因此清楚看出 UX 與 UY、UZ 為相似同類,而 UW. 目的是經由第二次的分類聚集,可以得出更接近使. 則視為不相似類。. 用者習慣的分類,因此作法就是將其他使用者所選 擇的歌曲,依據之前使用者的喜好類別不重覆推薦. 表 17 向量矩陣表 A A B C D E. B 0. C 1 0. 給使用者,達到協力式資訊分享的結果。. D 1 0 0. E 0 0 0 0. 圖 2 範例說明:假設 U1 的其他相似同好 U2、 U3,可以知道三位 Users 所選擇的歌曲編號(其中 代表第 t 首歌曲)。首先將 U1 與 U2 在相同類別中 不重複的推薦給 U1,例如:U2 將 A:s1,s2、B:s6、. 表 18 UX 與所有使用者之相似值 使用者 UX UY UZ UW. 相似向量 0110 000 00 0 0110 001 00 0 0110 001 10 1 0110 000 01 1. C:s9 推薦給 U1。而 U3 相同的類別也推薦給 U1,. 相似值 0 1 2 3. 例如:U3 將 A:s2,s4、B:s6,s8 推薦給 U1。如此一來 就會綜合 U2 與 U3 兩者的結果不重複的推薦給 U1,即 A:s1,s2,s4、B:s6,s8、C:s9。. (五)協力式推薦模組描述 壹、針對高價值顧客之推薦 本研究在分群模組中,利用 RFM 分析顧客價 值,並分成八個顧客群組,而這種方式,可提供網 站針對價值度不同的顧客做策略性推薦。而本推薦 方法將所有顧客選擇的產品做為推薦的產品,如果 使用者是屬於高價值群組內,那推薦的產品就以探. 圖 2 使用者 U1 與相似同好推薦. 勘結果作協力式推薦;反之,使用者是屬於低價值. 四、實驗設計與結果. 群組內,那推薦的產品就依探勘結果及隨機推薦不 相關產品。. (一)實驗環境與工具. 例如:使用者 U1 是屬於高價值群組內,其探 勘結果為{AÆC}、{AÆD}兩種規則,我們將所有. 本研究的實驗環境與使用的工具如下:. 顧客選擇有關 A、C、D 的產品,推薦給使用者 U1,. 電腦平台:. 達到精確個人化產品推薦。如果使用者 U1 是屬於. ‹. Pentium Ⅲ 800 CPU Server. 加其它類別產品,因為我們必須對低價值群組的顧. ‹. 512MB RAM. 客,多做行銷廣告的策略,好讓這一群組的顧客能. ‹. 40GB Hard Disk. 夠有機會光臨網站並提高消費。. 作業系統:. 貳、使用者相似類別同好之推薦. ‹. 低價值群組內,我們不只推薦相關的產品,還要增. 12. Windows 2000 server.

(13) ‹. Tomcat web server 5.0.28. 推薦 1.. 使 用 權 重 漸 進 與. 資料庫平台:. (IMW+RFM)。. ‹. 推薦 2.. Microsoft Access 2000. RFM. 模 組. 使用權重漸進與 RFM 模組及相似聚集. 開發工具:. (IMW+RFM+Similarity)。. ‹. Java Server Page. 推薦 3.. ‹. J2SDK1.4.2_05. ‹. Java Script. 不使用權重漸進但加入 RFM 模組及相. 似聚集(Non-IMW +RFM + Similarity)。 推薦 4.. 使用權重漸進但是不加入任何分群技. 巧(IMW+Non-Cluster)。 瀏覽器: ‹. (三)實驗資料內容. IE5.0 或以上. 本系統在實驗設計的部份,將以音樂風格為. (二)實驗系統架構說明. 主,建購一個線上音樂推薦系統,來進行本研究之 系統架構如圖 3 所示,共包含四個子系統,五個資. 實驗及後續的實驗評估。. 料庫。 本系統在資料的整理上,主要是推薦之音樂資 後端管理子系統主要負責新增會員註冊、登入. 料內容,及顧客的所有歷史交易資料,分別說明如. 與登出、管理者登入與查詢、產生音樂資料及紀錄. 下:. 交 易 情 況 控 制 。 而 這 些 功 能 , 全 部 透 過 JSP Engine,連接 Client 端與 Server 端之間的回應請. 音樂資料—本研究從網路 Amazon.com 網站或. 求。權重探勘子系統主要是將交易紀錄,進行探勘. 一些中文音樂網站,收集各類風格音樂,共有 160. 使用者的最近喜好類別項目,並紀錄於探勘結果資. 首。並分為五種類別風格。系統在瀏覽器上會呈現. 料庫中。分群管理子系統,則是將顧客歷史交易資. 每首音樂的歌唱者、歌名、價錢、專輯圖片,因此,. 料庫依照 RFM 模組分析進行分群的運算。然後,. 使用者可以觀看這些資訊來點選有興趣的音樂,而. 利用探勘結果資料庫中的資料進行相似矩陣的計. 這些特徵也是每位使用者會考慮的因素。. 算,進一步的找出與使用者擁有相同喜好的人,並. 顧客資料—本實驗共徵得 169 位同學,年齡層. 紀錄在分群資料庫中。. 分佈約在 20~30 歲之間進行,實驗受測者,並要求. 最後的推薦流程子系統包含一個推薦產品管. 每一位受測者必須交易超過 2 次以上,共取得 1731. 理控制元件,將產品的推薦方法分成四種控制,分. 筆交易資料,這些交易紀錄將成為本實驗進行權重. 別為:. 探勘與 RFM 分群或相似聚集之推薦依據。. 13.

(14) 圖 3 音樂系統推薦架構圖 (四)實驗評估. 統的滿意度,瞭解推薦是否符合使用者的需求。本 實驗評估利用兩種方式︰. 在完成整個系統建置後,最後必須進行系統的 測試與評估,評估的目的在於瞭解使用者是否有依. 1.. 正常程序來操作系統,以作為修正系統或瞭解系統. 確率(Precision)[20]。準確率指的是所找出的項. 的貢獻度的參考。也同時試著瞭解使用者對於本系. precision =. 在推薦系統中最常被用來衡量的指標包括準. 目中,有多少是相關的。以下將說明之:. No. of purchased items ∩ recommended items No. of recommend items. 在準確率的計算上,主要是以系統推薦且顧客. (7). 興趣的且願意購買的,因此準確率越高,表示系統. 有購買之產品數量相對於所有推薦產品的數量,可. 推薦的產品越被顧客接受。. 以用來衡量顧客對所推薦產品的接受程度。也就是 2.. 在我們所推薦的產品項目中有多少比例是顧客有. 問卷調查法:利用事先設計妥善的問卷,用. 於調查使用者或管理階層對系統使用的分析與困 14.

(15) 是在最後的日期才進入本系統操作。接下來,我們. 難問題。. 將分析每一群組的使用者在每一個推薦過程的準. 本實驗目的主要是依據系統特性修訂而成,因. 確率與問卷討論。實驗比較總共分為四個推薦方. 此資訊推薦系統如果要填答過多的問卷時,會造成. 法,而實驗將討論比較推薦 1 與推薦 2、推薦 3 與. 使用者的不耐煩或填選不正確的答案,所以我們將. 推薦 2、推薦 4 與推薦 2 的準確率,最後分析問卷. 相關研究的問題濃縮,僅設計了 10 題的問項。問. 調查的滿意度。以下我們分成兩個實驗結果的討. 卷的內容主要在詢問使用者,『衡量權重漸進探勘. 論,分別為準確率討論與問卷討論。. 音樂推薦系統的滿意度』,問卷採李克特五點尺. 表 19. 度,從(一分,非常不滿意)到(五分,非常滿意) , 用此來了解使用者對本推薦系統所抱持的期望與. RFM 群組分佈人數. 群組型式. 態度。. 使用者登入人數. 群1. R↓F↓M↓. 40. 群2. R↓F↓M↑. 28. 群3. R↓F↑M↓. 24. 者,扣除填寫不完全的無效樣本,有效樣本為 169. 群4. R↓F↑M↑. 24. 位。以上每種推薦方法,都有『是否購買』協力推. 群5. R↑F↓M↓. 15. 薦所產生的產品,目的是為了收集相關的準確率指. 群6. R↑F↓M↑. 10. 標。準確率的計算方式為使用者從該推薦區點選的. 群7. R↑F↑M↓. 12. 音樂個數除以推薦的音樂個數,見公式(7) ,例如,. 群8. R↑F↑M↑. 16. (五)實驗結果與討論 本系統共收集了 174 位音樂推薦網站的瀏覽. 若推薦 10 首音樂,使用者願意購買 5 首音樂,則. 總人數. 準確率為 0.5。而系統為實際線上實驗,實驗時間. 169. 準確率討論. 1.. 由 2005 年 6 月 24 日到 2005 年 8 月 16 日,並觀察 這段期間使用者們之行為。為了考量 RFM 模組分. 表 20 是經由實際線上系統操作,將 169 使用. 群的效果,時間的計算採用每日批次的進行,讓. 者之瀏覽行為,由推薦的準確率來看,推薦 1:單. RFM 模組得到最佳的群集效果。由於每個人所登. 純使用 RFM 模組來分群,其平均準確率為 0.67;. 入操作的時間不同,因此在 RFM 模組分群中,我. 推薦 2:使用相似聚集做相似分群,其平均準確率. 們將每一個群組的人數做了下列統計,如下表 19。. 為 0.77;推薦 3:不使用漸進探勘來推薦,其平均 準確率為 0.54;推薦 4:不加入分群方式,其平均. 群組 7 與群組 8,由於是剛開始系統實際測. 準確率為 0.58。可見,推薦 2 的平均準確率相較於. 試,所以人數會比較少,而一般都集中在群組 1、. 推薦 1 高出 14%,較推薦 3 高出 30%,較推薦 4. 群組 2、群組 3 與群組 4,因為測試的使用者大都. 高出 24%。. 表 20 權重漸進+RFM+相似聚集與其他方法的平均準確率. Precision 總平均. IMW. IMW. Non-IMW. IMW. +RFM. +RFM+Similarity. +RFM+Similarity. +Non-Cluster. 0.67. 0.77. 0.54. 0.58. 我們由推薦 2 與其他推薦方法的比較,可以說. 出現較多其他顧客的推薦,因此可能推薦一些非使. 明單純只考慮 RFM 分群,在推薦的過程中可能會. 用者喜好的產品,所以,本實驗設計證明兩階段分 15.

(16) 可能原因是這一群低價值的顧客們潛藏著未來高. 群效果優於單純的一項分群。. 消費的購買力。. 而推薦 3 不使用漸進探勘技巧的方法,在推薦 上會不理會使用者的喜好,完全任意的推薦其他使. 在群組 2、群組 3、群組 4 與群組 6 中,可以. 用者所點選的音樂,造成推薦上會比較雜亂,所以. 明顯的看出推薦 2 的準確率優於其他推薦方法,可. 使用者對這種混亂的推薦,可能感到不喜歡,因此. 能是高購買力與高忠誠度的顧客們,相對於其他推. 推薦後的準確率明顯低於使用探勘的方式,證明權. 薦方法感到不適用,無法準確的推薦這些顧客們的. 重漸進探堪的重要性。. 要求,造成準確率的落差相當大。 最後由這些數據可說明推薦 2 利用權重漸進. 另外,推薦 4 不使用分群技術,其平均準確率 為 0.58,明顯低於推薦 2 使用分群技術的準確率,. 探勘與 RFM 模組及相似聚集的研究方法,能夠推. 因此本研究的分群技術讓使用者更可以得到想要. 薦使用者喜好的音樂,得到高準確率的成果,有效. 的,而不是一堆音樂產品,讓使用者無可適從。圖. 的達到個人化推薦的效果。. 4,顯示 8 個 RFM 分群的準確率的分佈。我們可 以看出群組 5 的推薦 2 準確率最高,達 0.83,而推 薦 2 的群組 1 的結果也有 0.81,綜合這兩項結果,. Precision. IMW+RFM Non-IMW+RFM+Similarity. IMW+RFM+Similarity IMW+Non-Cluster. 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1. 2. 3. 4. 5. 6. 7. 8. RFM群組 圖 4 權重漸進+RFM+相似聚集與其他方法的準確率比較 鬆的瀏覽及測試,並且認同本研究利用最近習慣的. 2.問卷討論. 探勘與推薦恰當的音樂資訊以符合個人化。Q5 的. 經由受測者實際使用本系統後,對受測者進行. 問項分數低於平均滿意度,原因可能是使用者對音. 系統功能滿意度問卷調查,如表 21 所示,Q1、Q2、. 樂本身的認知較弱,所以對音樂推薦系統還是無法. Q3、Q4、Q5、Q6 等六項問題,主要針對受測者. 完全接受。此外,Q7、Q8、Q9、Q10 是針對四種. 對系統整體的感受。就個別項目而言,Q2 分數最. 推薦方法實用性的滿意度調查,滿意度最高的為. 高,達 3.868 分。顯示使用者接受協力式推薦的方. Q8,達 3.710 分,高於平均滿意度,顯示使用者相. 式。而 Q1、Q3、Q4、Q6,也高於總平均滿意度. 當滿意『IMW+RFM+Similarity』 ,這一項推薦的方. 3.484 分,也顯示了整個網站介面讓受測者可以輕 16.

(17) 法。相較之下,『IMW+RFM』這一項推薦方法,. Q10 這兩個問項分數,明顯低於平均滿意度,因此. Q7 滿意度為 3.394,稍微低於平均滿意度,顯示使. 可以看出使用者對不使用權重漸進探勘與無分群. 用者對單純使用 RFM 模組分群,所推薦的產品,. 方式,造成無法恰當的推薦使用者喜好音樂,所以. 滿意度還是感到可以接受,原因可能是使用者點購. 使用者對這兩項方法,都感到不滿意。. 音樂產品不多,造成推薦上無太大的變化。Q9、. 表 21 使用者對推薦音樂系統平均滿意度分析 問卷項目. 平均數. 變異數. 標準差. Q1. 本音樂推薦系統的流程,是否感到滿意. 3.842. 0.353. 0.593. Q2. 你是否認同協力式推薦的方式. 3.868. 0.388. 0.622. Q3. 我可以從本系統的協力推薦得知其他使用者與自己相 同喜好的音樂. 3.786. 0.441. 0.664. Q4. 你是否認同由最近的交易紀錄為推薦依據. 3.763. 0.348. 0.589. Q5. 你是否喜歡以音樂為推薦的系統功能. 3.184. 0.371. 0.608. Q6. 這個系統給于我適當的資訊與推薦符合個人的產品. 3.500. 0.635. 0.796. Q7. 對於『IMW+RFM』是否滿意. 3.394. 0.353. 0.594. Q8. 對於『IMW+RFM+Similarity』是否滿意. 3.710. 0.590. 0.767. Q9. 對於『Non-IMW+RFM+Similarity』是否滿意. 2.973. 0.297. 0.544. 對於『IMW+Non-Cluster』是否滿意. 2.815. 0.262. 0.724. Q 10. 平均滿意度. 3.484. 綜合上述實驗結果,由本研究提出的研究方. 研究為了減少探勘資料庫內的紀錄但又不失其準. 法,可以證明其推薦上的效果,的確優於一般不使. 確度,因此以三個推薦模組流程作說明,分別是顧. 用權重漸進探勘與無任何分群技巧,而且對系統所. 客分析模組:透過歷史交易紀錄的行為將資料進行. 提供的推薦資訊或協力式方法都是感到滿意的,所. 顧客價值分群(Clustering)動作,先達到資料整. 以我們提出的以權重漸進探勘使用者最近習慣之. 合及往後對高價值顧客做適當的推薦。使用者輪廓. 音樂推薦,達到預期的效果。. 模組:主要提出以權重漸進探勘(IMW)並結合 Apriori 演算法,將使用者交易資料進行權重漸進. 五、結論與未來研究方向. 分析並取得使用者高頻繁交易項目的關聯規則,因 此可探勘出使用者在最近習慣中的規則。協力式推 薦模組:基於相似向量比對使用者的相似度後,將. (一)結論與研究貢獻. 可再一次聚集相似使用者,最後進行協力式推薦方. 現今電子商務的快速發展,使得許多實體公司. 法。. 紛紛架起電子商務網站,做起網路生意。如果當使 用者的人數及瀏覽記錄也日益增加,那按照傳統探. 研究結果顯示,結合 RFM 模組及相似聚集推. 勘技術,必定造成相當大的負擔。而此時,為了節. 薦較單純只使用 RFM 分群方式為佳。此外,利用. 省顧客搜尋的時間同時亦提高顧客忠誠度,推薦系. 權重漸進與分群方式,更能夠推薦使用者喜好的音. 統的應用不失為一種有效及個人化的手段。所以本. 樂。而整體上,本研究的推薦準確率高達 0.77,比. 17.

(18) 究的地方。而未來的研究方向有以下幾點:. 其他推薦方法高出 14%~30%,有效的達到個人 化推薦的效果。. 1. 不限定產品類別推薦. 本研究的貢獻主要有三點:. 目前,本研究還是以單純的類別來說明,並無 更深入類別內容的應用,因此推薦的效果就會有差. 1. 兩階段分群效果. 別。往後,希望能夠以類別階層來區別產品,讓產. 本研究為了達到有效的分群效果,採取了兩階. 品多樣化。使推薦產品能夠更接近個人化選擇。. 段分群方法,並且從實驗結果也證實兩階段分群比. 2. 長期的資料收集. 單純使用 RFM 模組分群高出 14%,更讓受測者感 到相當滿意的準確率,因此利用 RFM 模組與相似. 推薦系統在進行效果的評估時,往往都是以少. 聚集,確實可以有效的將顧客群聚在一起,使推薦. 數測試人員與模擬資料來進行,而本研究雖然以實. 的項目更貼近使用者喜好。. 際的線上實驗,不過由於時間的限制,無法收集更 多的使用者資料,因此在相似推薦的過程及數目,. 2. 系統權重動態的配置. 都會有些許的變化,所以如果能夠進行一段較長時. 由文獻探討中,可以得知演進式或時間式兩種. 間的資料收集,相信能夠推薦讓使用者更多滿意的. 探勘在分配權重上的缺點,造成管理者必須不斷的. 音樂。. 依照時間的變化給予權重值,因此系統負擔很大。. 3. 朝使用者更新的研究方向. 而本研究加入權重的動態分配計算,是依照漸進的 次數來遞減權重值,以符合使用者探勘習慣規則的. 一般的推薦系統研究大多是敘述推薦研究的. 權重配置。所以本研究為了解決其它研究上的不. 過程,可是,一定會存在著一個問題,就是使用者. 足,以固定動態的權重配置,得知相同的習慣規. 歷史資料更新。使用者不斷的進行點選動作,因此. 則。此外,權重的計算,更可以清楚的將喜好類別. 資料庫也不斷的記錄,當要分析推薦時,只好再重. 做有排序的分別,好讓推薦產品有差別性的運作。. 新的進行探勘,而造成效率的低落,如果能夠有一 機制能夠以上一次的探勘結果與新的資料做一結. 3. 以顧客為導向來進行個人化行銷. 合,必定能減少資料庫分析的負擔,達到更有效率. 本研究最終的想法,是希望達到個人化的推薦. 及節省時間。. 並得到高度的滿意度,讓系統真正的應用在企業. 4. 結合更多的推薦模型. 上,所以我們將 RFM 模組分析,應用於顧客分群 上,提供銷售人員可以即時的反應顧客的需求與良. 每一種推薦方法都有其優缺點,本研究嘗試以. 好的互動關係。因此,也可以藉由分析顧客消費行. 相似分群及協力式推薦結果的方式,來加強推薦的. 為之差異,來針對使用者個人進行不同的行銷策. 滿意度,未來的研究希望結合更多其它推薦模型,. 略,以提高獲利利益。. 整合其中的優缺點,以提升推薦系統整體的準確 性。. (二)未來研究方向 目前在推薦系統的相關研究上雖然很多,但大. 六、 參考文獻. 部分仍侷限於研究之領域上,而受限在研究資料的 取得不易,往往很少有真正應用在實務產業上,可. [1]. 汪軒楷、王台平,"策略式資料探勘在個人化. 能原因是其成本高,而且執行效果也未達預期的滿. 推薦上之研究",私立真理大學資訊管理學系. 意,因此在推薦系統的研究上仍有許多的改進與研. 碩士論文,2002。 18.

(19) [2]. Agrawal, R. Imielinski, T. and Swami, A.. [9]. Goldberg, D. Nichols, D. Oki, B.M. and Terry,. “Mining Association Rules between Sets of. D. “Using collaborative filtering to weave an. Items in Large Databases,” Proceedings of the. information tapestry,” Communications of the. ACM SIGMOD Conference on Management of. ACM, Vol. 35, December 1992.. Data, 1993, pp.207-216.. [10]. Han Jiawei, Kamber, Micheline “Data Mining:. [3]. Agrawal, R. and Srikant, R. “Fast Algorithms. concepts and techniques,” Morgan Kaufmann, USA, 2001.. for Mining Association Rules,” Proceedings of the 20th International Conference on Very. [11]. Hughes, Arthur , Strategic Database Marketing,. Large Database, Sep. 1994, pp.487-499.. Chicago:Probus Publishing, 1994.. [4]. Basu, C. Haym, H. and Cohen,W.-W.. [12]. Kaymak “Fuzzy target selection using RFM. “Recommendation as Classification: Using. variables” IFSA World Congress and 20th. Social and Content-Based Information in. NAFIPS International Conference, Vol.2, 2001,. Recommendation,” Proceedings of National. pp. 1038 –1043.. Conference on ArtiJicial Intelligence, 1998.. [13]. Kuo, F.-F. and Shan, M.-K. “A Personalized. [5]. Balabanovic, M. and Shoham, Y. “Fab: Content-based. Collaborative. Music Filtering System Based on Melody Style. Filtering. Classification,”. Recommendation,” Communications of the. [14]. Kim Jae Kyeong, Cho Yoon Ho, Kim Woo Ju,. “Application of Web usage mining and product. Kim Je Ran and Suh Ji Hae ”A personalized. taxonomy to collaborative recommendations in Systems. recommendation. with. shopping. Applications, Vol: 26, 2004, pp. 233-246.. Electronic. Internet Commerce. [15]. Lang, K. “NewsWeeder: Learning to filter. behavior for collaborative recommendations,”. netnews,”. Expert Systems with Applications, Vol: 28,. Proceedings. of. the. Twelfth. International Conference on Machine Learning,. 2005, pp. 359-369.. Tahoe City, pp. 331-339, 1995.. [8]. Chen, H.-C. and Chen, Arbee L. P.. [16]. Liu Duen-Ren and Shih Ya-Yueh “Integrating. “Collaborative Filtering and Algorithms: A. AHP. Music Recommendation System Based on. Conference. and. data. mining. for. product. recommendation based on customer lifetime. Music Data Grouping and User Interests,” Proc. international. support,”. for. 301-313.. Hie ”Mining changes in customer buying. ACM. procedure. Research and Applications, Vol: 1,2004, pp.. [7]. Cho Yeong Bin, Cho Yoon Ho and Kim Soung. of. International. pp.9-12,Dec. 2002.. [6]. Cho Yoon Ho and Kim Jae Kyeong. Expert. IEEE. Conference on Multimedia and Expo ICME,. ACM, Vol. 40, March 1997, pp. 66-72.. e-commerce,”. 2002. value,” Information & Management, Vol. 42,. on. Issue: 3, March, 2005, pp. 387-400.. Information and Knowledge Management,. [17]. Shan, M.-K. Kuo, F.-F. and Chen,M.-F. “Music. 2001.. Style Mining and Classification by Melody,” 19.

(20) 2002. IEEE. International. Conference. on. Multimedia and Expo ICME, Vol. 1, Aug. 2002, pp.26-29.. [18]. Schafer, J. B., Konstan, J. and Riedl, J. “Recommender Systems in E-Commerce,” ACM Conference on Electronic Commerce, 1999, pp.158-166.. [19]. Schafer, J. B., Konstan, J. and Riedl, J. “E-Commerce Recommendation Applications,” Data Mining and Knowledge Discovery, Vol. 5, 2001, pp. 11-32.. [20]. Saracevic, T., Kantor, P., Chamis, A.Y., and Trivision, D.“A Study in Information Seeking and Retrieving. Ⅱ. User, Questions and. Effectiveness, " Journal of the American Society for Information Science, Vol.39, 1998, pp.176-195.. [21]. Sharadanand, U. and Maes, P. “Social Information. Filtering:. Algorithms. for. Automating 'Word of mouth',” Proceedings of CHI'95 Conference on Human Factors in Computing System, 1995.. [22]. Weng, S.-S. and Liu, M.-J. “Feature-based recommendations for one-to-one marketing,” Expert Systems with Applications, Vol: 26, 2004, pp. 493-508.. [23]. Wu, Y.-H. and Chen, Arbee L. P. “Enabling Personalized Recommendation on the Web Based on User Interests and Behaviors,” Eleventh International Workshop on Research Issues in Data Engineering, April 2001.. 20.

(21)

參考文獻

相關文件

週五聯課 -My English Heroes 週五聯課 -微電影拍攝及製作 週五聯課 -VR x Movie x閱讀

工作紙 合作學習 同質分組 腦基礎 電子學習 自主學習 異質分組 翻轉教室 生活應用 提問技巧 探究式..

探究式學習 教學類型 (四種類型).. 探究式學習教學 常見模式及實施 Stripling Model of Inquiry.. Connect, wonder, investigate, express

新角色 新角色 新角色 新角色: : : : 學習促進者 學習促進者 學習促進者 學習促進者 提供參與機會 提供參與機會 提供參與機會 提供參與機會 引導而不操控

微算機原理與應用 第6

貼近學生生活 增加學習興趣 善用應用機會 提升表達能力 借用同儕協作 提升學習動機 豐富學習經歷

嗚呼!仲以為桓公果能不用三子矣乎?仲與桓公處幾年矣,亦知桓公之為人

‧ 「種籽」計畫名稱及編號 : 善用社區資源促進 常識科的探究式學習 (KP0107). ‧