National Sun Yat-sen University Institutional Repository:Item 987654321/33449

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※　　　

建構使用者輪廓以支援顧客化網路行銷之研究

　　※

※　　　　　　　※

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：Ｖ個別型計畫　　□整合型計畫

計畫編號：NSC89－2416－H－110－029

執行期間：88年08月01日至89年07月31日

計畫主持人：賴香菊

共同主持人：

本成果報告包括以下應繳交之附件：

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位：中山大學資管系

中　華　民　國　89 年　10 月　30　日

(2)

行政院國家科學委員會專題研究計畫成果報告

建構使用者輪廓以支援顧客化網路行銷之研究

計畫編號：89-2416-H-110-029

執行期限：88年08月01日至89年07月31日

主持人：賴香菊執行機構及單位名稱：中山大學資管系

一、中文摘要 基於顧客化行銷已成為眾多網站努力的目標，本研究首先提出一個系統架構做為建構顧客化行銷系統之基礎，進而提出以群體為顧客化基礎的推論方法論。接著再以實驗方法驗證所提方法論之績效，結果顯示所提方法能學習出更精確的法則。關鍵詞：顧客化行銷、使用者輪廓、電子商務、集群分析、關聯法則。 Abstr act

Since customized marketing has become a critical issue for almost every Web site, this paper proposed a system framework for developing customized marketing systems on the Web. Furthermore, a group-based approach to customized marketing, that integrates methods of clustering and association rules, was also proposed. Following that, a field study was implemented to evaluate the performance of the proposed approach. The results reveal that the integrated approach could learn more precise rules.

Keywords: Customized Marketing, User Profile, Electronic Commerce, Clustering, Association Rules. 二、緣由與目的 由於全球資訊網的超鏈結、多媒體及互動等特性，使得行銷者能以極低的成本進行顧客化行銷(customized marketing)，希望藉由提供契合消費者需求的各項產品或服務內容，來增加網站的競爭優勢 (Kestnbaum, et al., 1998)。目前網站的應用實例如Amazon書店會根據個別消費者過去的購買行為推薦新書，並以該顧客過去的訂購偏好(如信用卡刷卡、快遞方式)來簡化訂購過程；而Firefly則藉由比對過去與該顧客興趣相近的顧客群之偏好進行產品推薦 (Alexander, 1998)。由於了解消費者是進行顧客化行銷的第一步，因此本研究的第一個研究目的即在於提出以使用者輪廓為基礎之顧客化網路行銷系統架構。欲進行顧客化行銷，可以針對個人或興趣群體來學習適合該消費者的行銷法則。但是以個人為基礎之推論其成本較高，且有過度專門化 (over-specialization)的問題 (Balabanovic & Shoham, 1997)，亦即僅侷限於推薦該使用者原先有興趣的內容，而忽略了該使用者可能在其他領域的購買潛力。因此，本研究的第二個研究目的在於提出一個以興趣群體為基礎進行顧客化行銷推論的方法論。 三、結果與討論 (一)顧客化網路行銷之系統架構 顧客化網路行銷的最基本概念，是針對使用者的個人背景或線上行為推薦適當的行銷內容，因此必需有一個使用者輪廓來描述使用者個人特性，並設置一網站資料庫以貯存行銷內容。在使用者輪廓方面，本研究根據相關文獻將資料類型區分為原始資料以及推論資料兩大類，其中原始資料庫貯存所有關於使用者的人口統計、地理區隔、心理特徵與行為反應等資料，而推論引擎對於使用者個人進行推論所獲得的產品使用狀況、品牌忠誠度、偏好及所屬興趣群體等推論結果，則貯存於推論資料庫。至於在網站資料庫中，則貯存著網頁內容、網路商店之產品型錄，以及廣告、促銷等行銷內容，以供顧客化推薦之用。如何針對使用者之個人背景與線上行為等特性，提供適當的行銷內容，則有賴

(3)

於激發相關的行銷法則來決定，因此顧客化系統必需有一個行銷法則庫來貯存這些法則。行銷法則一方面可由行銷者自行建入，另一方面則可透過推論引擎分析使用者的原始資料以及行為資料所對應的行銷內容，自動學習出有用的行銷法則。由於使用者資料的蒐集來源包括內部網站以及外部網站兩方面，因此在顧客化網路行銷系統架構中，設計了兩個介面機制︰其一為負責內部網站與使用者進行互動的資料蒐集與內容展示機制，另一個則是負責蒐集與消費者相關的外部網路資源之外部資料搜尋機制。為了控制整個系統的運作過程，架構中設計了一個控制引擎，接收來自資料蒐集與內容展示機制所傳來的使用者需求，再根據貯存於使用者輪廓與網站資料庫的資料內容來決定激發行銷法則庫內的哪些行銷法則，最後再要求資料蒐集與內容展示機制進行回應。基於輔助行銷者使其能隨時自行更新網站內容，架構中另外設計了一個維護介面，以輔助行銷者以更容易的方式針對網頁內容、程式以及所設定的行銷法則進行維護。綜合上述的探討，本研究提出如圖1 的顧客化網路行銷系統架構，做為進行顧客化行銷之指引。瀏覽器使用者 •Cookies 其他外部網站使用者輪廓︰推論資料 w使用狀況 w品牌忠誠度 w偏好 w興趣群體 ... 使用者輪廓︰原始資料 w人口統計 w地理區隔 w心理特徵 w行為反應... 行銷法則庫 w以個人為基礎 w以群體為基礎網站資料庫 w網頁內容 w產品型錄 w廣告、促銷... 網站伺服器控制引擎資料蒐集與內容展示機制 •CGI •日誌檔外部資料搜尋機制推論引擎行銷者維護介面 •推播圖1︰顧客化網路行銷之系統架構　　 (二)以群體為顧客化基礎之推論方法論 本研究在顧客化行銷的推論方面，將重點設定在如何以興趣群體為基礎進行推論。針對圖1顧客化網路行銷系統架構中的推論引擎，本研究提出如圖2的整合方法論，分為兩個步驟進行。第一個步驟是根據貯存於使用者輪廓的人口統計、地理區隔、心理特徵與行為反應等消費者原始資料進行集群分析，將相近的消費者歸為同一群。本研究探討了數種非階層式集群分析的演算法如K-means、PAM、CLARA及 CLARANS 等 (Kaufman & Rousseeuw, 1990)，基於分析的資料包括了名目、區間與連續尺度，而且資料探勘所蒐集的資料筆數均極大，因此本研究在此建議使用 CLARA或CLARANS演算法來處理集群分析的問題。集群分析所產生的k個中位物件 (medoid)之推論結果以及各個興趣群體之描述將被貯存於使用者輪廓的推論資料內，供未來進行顧客化行銷時，據以決定個別顧客所屬群體之用。 w人口統計 w地理區隔 w心理特徵 w行為反應... w交易 w瀏覽型態 w各群之中位物件 w各群之描述推論引擎 w產品類別 w網頁類別 w廣告... 使用者輪廓︰原始資料使用者輪廓︰推論資料網站資料庫行銷法則庫 w以群體為基礎之關聯法則 w分群結果步驟一︰步驟二︰集群分析 •CLARA •CLARANS 關聯法則 •AprioriHybrid & Algorithm Basic 圖2︰推論行銷法則之方法論第二個步驟則是針對上述分群的結果，以各個興趣群體為分析單位，分別找尋其關聯法則。這些法則可藉由分析貯存於使用者輪廓的原始交易(如購物車、線上購買結果)或是各個消費者的瀏覽型態(如瀏覽產品行為)而推論出。典型的推論結果是找出個別產品間的關聯性，例如使用者瀏覽或是購買了A產品，也通常會同時瀏覽或購買B產品之法則。這些行銷法則，可輔助行銷者將相關的產品一併進行促銷或包裝在一起銷售。除了產品的關聯性之外，網頁內容間的關聯性亦可透過關聯法則找出，幫助行銷者安排網頁內容以及設置超鏈結之用。然而，個別產品或網頁之法則常過於特定，若能針對產品或網頁所屬類

(4)

別進行分析，則行銷者可將這些法則應用到同性質或相同類別的產品上。因此在這個步驟，亦必需藉由網頁資料庫取出交易或瀏覽型態所屬的產品類別、網頁類別以及適合搭配的廣告等資訊。在選擇關聯法則分析的演算法上，本研究探討了七個演算法(Agrawal & Srikant, 1994; Park, et al., 1997) ，其中以 AprioriHybrid與DHP的執行效率較佳，因此本研究建議以AprioriHybrid為主，並加入 DHP裁減資料庫的方法來進行關聯法則之分析。另外，亦加入Algorithm Basic將各個項目擴展為該項目與其所屬類別至原始交易的觀念，以期獲得產品項目與產品類別間，或是產品類別與其他產品類別間之關聯法則。分析後所產生的以群體為基礎之關聯法則將被貯存於行銷法則庫中，做為顧客化行銷之推薦依據。瀏覽器使用者控制引擎擷取使用者個人背景或過去線上行為資料資料蒐集與內容展示機制回應決定所屬興趣群體擷取行銷法則產生顧客化行銷方案使用者輪廓: 原始資料行銷法則庫網站資料庫使用者輪廓: 推論資料 w產品類別 w網頁類別 w廣告... w個人背景 w線上行為 w以群體為基礎之關聯法則需求 w各群之中位物件 w各群之描述 w個人_背景 w線上行為圖3︰控制引擎在以群體為推論基礎之即時顧客化系統之運作過程上述以群體為推論基礎之行銷法則，可透過控制引擎的運作來進行顧客化行銷，如圖3所示。使用者透過瀏覽器將需求送至伺服器的資料蒐集與內容展示機制後，該需求將送至控制引擎處理，此時控制引擎根據此需求由使用者輪廓的原始資料中辨認該使用者的身份，或是與過去的線上行為進行比對，以擷取該使用者個人背景或是所對應的線上行為資料。接著由使用者輪廓之推論資料中找出各群的中位物件及各群描述，透過運算找出最近的中位物件以決定該使用者所屬的興趣群體，而後透過行銷法則庫擷取該群體所推論出的關聯法則，並考量使用者的背景與過去的線上行為以決定法則的優先順序。最後則是擷取網站資料庫內的產品、網頁及廣告等內容，產生顧客化行銷方案，並交回資料蒐集與內容展示機制回應至瀏覽器端。 (三)績效評估 為了驗證所提方法論的績效，本研究以中山大學復文書局網站進行實驗，實驗期間共有320人參與。分為未分群以及分群兩組，後者以消費者的性別、血型、年齡、職業、科系、年級、收入、接觸網路時間、每天上網時數、使用者瀏覽圖書的總秒數、總圖書數，以及購買總數進行集群分析，其最佳分群數為3。隨後再繼續採用 Algorithm Basic 演算法進行關聯法則分析，其支持水準(support)設定為0.1，以比較未分群及分群兩組所找出的關聯法則之績效。目前常見的三個衡量指標為支持水準、信心水準 (confidence) 以及改善水準 (improvement)，其定義如下：假設X與Y是交易集 D的項目集，則支持水準定義為 Prob(X∩Y)，信心水準為Prob(Y|X)，而改善水準則定義為Prob(Y|X)/Prob(Y)。一條關聯法則的支持水準愈高，表示該法則愈有用，而信心水準及改善水準愈高，則表示該法則愈正確。表1是未分群組與分群組中，具有相同法則者進行衡量指標的比較。表中的第一欄是未分群組的所有關聯法則，以第一個關聯法則(B01, L)為例，集群3的支持水準 (0.25)較未分群組(0.11)為高，表示集群分析的結果能夠增加原先法則的支持水準。本研究以「↑」的符號來表示分群後之衡量指標較原先未分群時為高；反之，則以「↓」符號代表該衡量指標變低。從表1可以發現分群之後，絕大多數的法則在支持水準與信心水準這兩個衡量指標均有增加。總計在27條相同的法則中，支持水準增加的有26條法則，而信心水準增加的亦達21條法則。然而改善水準增加的法則數僅有8條，並未過半。從改善水準 (Prob(Y|X)/ Prob(Y))的計算公式來看，其相

(5)

較於信心水準(Prob(Y|X))多除了Prob(Y)，也就是說該衡量指標不僅考慮項目X與Y 間的條件機率，亦試圖排除Y隨機與其他項目出現的可能性，因此改善水準可以說是衡量關聯法則正確性的一個比較保守且嚴格的指標。而本實驗結果之未能增加關聯法則的改善水準，合理的推論是分群之後，能夠同時增加Prob(Y|X)與Prob(Y)。由於支持水準增加的比例高達21/27，因此我們可以解釋分群之後，確實能夠增加法則的正確性，但是僅有8/27的法則增加的幅度強到連帶使得改善水準亦增加。 四、計畫成果自評 本計畫之具體成果包括提出進行顧客化網路行銷之系統架構以及以群體為顧客化基礎之推論方法論，最後並以實驗方法驗證所提方法論之績效。本計畫已寫成一篇論文「 A Group-based Inference Approach to Customized Marketing on the Web – Integrating Clustering and Association Rules Techniques 」刊登於 2000 年的 Hawaii International Conference on System Sciences 研討會論文集中，未來若能與實際網站長期合作，蒐集線上消費者的個人背景與購物過程與購買結果之資料，並在績效評估方面加強統計顯著性之分析，將具有學術期刊發表之價值。 五、參考文獻

Agrawal, R., and Srikant, R., “Fast Algorithms for Mining Association Rules,” Proceedings of the 20th VLDB Conference, Santiago, Chile, 1994, pp.487-499.

Alexander, S., “Web Marketing Gets Personal,” InfoWorld, Vol.20, No.2, 1998, pp.93-94.

Balabanovic, M., and Shoham, Y., “Fab: Content-based, Collaborative Recom-mendation,” Communications of the ACM, Vol.40, No.3, 1997, pp.66-72. Kaufman, L., and Rousseeuw, P. J., Finding

Groups in Data: An Introduction to Cluster Analysis, John Wiley & Sons, New York, 1990.

Kestnbaum, R. D., Kestnbaum, K. T., and Ames, P. W., “Building a Longitudinal Contact Strategy,”Journal of Interactive Marketing, Vol.12, No.1, 1998, pp.56-62.

Park, J. S., Chen, M.-S., and Yu. P. S., “Using a Hash-based Method with Transaction Trimming for Mining Association Rules,” IEEE Transactions on Knowledge and Data Engineering, Vol.9, No.5, 1997, pp.813-825.

表1：瀏覽行為關聯法則之衡量指標比較

分群

未分群 _集群1 _集群2 _集群3

關聯法則2 _[s]1 _[c]1 _[i]1 _[s] _[c] _[i] _[s] _[c] _[i] _[s] _[c] _[i]

(B01, L) 0.11 0.77 1.53 0.25↑ 0.82↑ 1.15↓ (B02, L) 0.12 0.74 1.48 0.20↑ 0.67↓ 1.25↓ 0.18↑ 0.93↑ 1.30↓ (B08, L) 0.12 0.81 1.61 0.26↑ 0.95↑ 1.33↓ (B09, L) 0.10 0.71 1.41 0.17↑ 0.83↑ 1.56↑ 0.19↑ 0.82↑ 1.16↓ (L02, B) 0.15 0.70 1.21 0.17↑ 0.71↑ 1.13↓ 0.26↑ 0.79↑ 1.09↓ (L03, B) 0.12 0.89 1.55 0.17↑ 1.00↑ 1.58↑ 0.23↑ 0.94↑ 1.30↓ (L06, B) 0.12 0.81 1.40 0.13↑ 0.80↓ 1.26↓ 0.26↑ 0.94↑ 1.25↓ (L07, B) 0.10 0.79 1.36 0.17↑ 1.00↑ 1.58↑ 0.23↑ 0.89↑ 1.23↓ (L09, B) 0.11 0.79 1.38 0.17↑ 1.00↑ 1.58↑ 0.19↑ 0.78↓ 1.07↓ (C, M) 0.15 0.48 1.04 0.23↑ 0.70↑ 1.11↑ 0.30↑ 0.81↑ 1.35↑ (C, B) 0.17 0.55 0.96 0.20↑ 0.60↑ 0.95↓ 0.11↓ 0.40↓ 0.86↓ 0.26↑ 0.70↑ 0.97↑ (C, L) 0.12 0.37 0.74 0.13↑ 0.40↑ 0.75↑ 0.19↑ 0.52↑ 0.73↓ (E, M) 0.13 0.74 1.60 0.20↑ 0.67↓ 1.05↓ 0.25↑ 0.95↑ 1.57↓ (M, B, L) 0.15 0.62 1.20 0.20↑ 0.60↓ 1.13↓ 0.33↑ 0.77↑ 1.09↓

Summary3_{: Support (}↑_{): 26/27; Confidence (}↑_{): 21/27; Improvement (}↑_{): 8/27}

Note: 1.衡量指標︰[s]→支持水準; [c]→信心水準; [i]→改善水準。 2.類別︰B→文學類; C→電腦類; E→電子商務; L→非文學類; M→管理類。 圖書︰「B01」是指文學類(B)編號為01之圖書，以此類推。 (B01, L)代表文學類編號01之圖書(B01)與非文學類(L)之關聯法則。 3.本研究針對分為3群與未分群所產生之關聯法則進行比較，如果前者之衡量指標大於後者，以「↑」表示之；反之，則以「↓」表示比較之結果。此外，衡量指標值變大之比例彙總於表格之最後一欄

(6)

National Sun Yat-sen University Institutional Repository:Item 987654321/33449

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※

建構使用者輪廓以支援顧客化網路行銷之研究

※

※ ※

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別：Ｖ個別型計畫 □整合型計畫

計畫編號：NSC89－2416－H－110－029

執行期間：88年08月01日至89年07月31日

計畫主持人：賴香菊

共同主持人：

本成果報告包括以下應繳交之附件：

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位：中山大學資管系

中 華 民 國 89 年 10 月 30 日

行政院國家科學委員會專題研究計畫成果報告

建構使用者輪廓以支援顧客化網路行銷之研究

計畫編號：89-2416-H-110-029

執行期限：88年08月01日至89年07月31日

主持人：賴香菊 執行機構及單位名稱：中山大學資管系

※　　　

　　※

※　　　　　　　※

計畫類別：Ｖ個別型計畫　　□整合型計畫

中　華　民　國　89 年　10 月　30　日

主持人：賴香菊執行機構及單位名稱：中山大學資管系