• 沒有找到結果。

National Sun Yat-sen University Institutional Repository:Item 987654321/33449

N/A
N/A
Protected

Academic year: 2021

Share "National Sun Yat-sen University Institutional Repository:Item 987654321/33449"

Copied!
6
0
0

加載中.... (立即查看全文)

全文

(1)

行政院國家科學委員會補助專題研究計畫成果報告

※※※※※※※※※※※※※※※※※※※※※※※※※

※ ※

※   

建構使用者輪廓以支援顧客化網路行銷之研究

  ※

※       ※

※※※※※※※※※※※※※※※※※※※※※※※※※

計畫類別:V個別型計畫  □整合型計畫

計畫編號:NSC89-2416-H-110-029

執行期間:88年08月01日至89年07月31日

計畫主持人:賴香菊

共同主持人:

本成果報告包括以下應繳交之附件:

□赴國外出差或研習心得報告一份

□赴大陸地區出差或研習心得報告一份

□出席國際學術會議心得報告及發表之論文各一份

□國際合作研究計畫國外研究報告書一份

執行單位:中山大學資管系

中 華 民 國 89 年 10 月 30 日

(2)

行政院國家科學委員會專題研究計畫成果報告

建構使用者輪廓以支援顧客化網路行銷之研究

計畫編號:89-2416-H-110-029

執行期限:88年08月01日至89年07月31日

主持人:賴香菊 執行機構及單位名稱:中山大學資管系

一、中文摘要 基於顧客化行銷已成為眾多網站努力 的目標,本研究首先提出一個系統架構做 為建構顧客化行銷系統之基礎,進而提出 以群體為顧客化基礎的推論方法論。接著 再以實驗方法驗證所提方法論之績效,結 果顯示所提方法能學習出更精確的法則。 關鍵詞:顧客化行銷、使用者輪廓、電子 商務、集群分析、關聯法則。 Abstr act

Since customized marketing has become a critical issue for almost every Web site, this paper proposed a system framework for developing customized marketing systems on the Web. Furthermore, a group-based approach to customized marketing, that integrates methods of clustering and association rules, was also proposed. Following that, a field study was implemented to evaluate the performance of the proposed approach. The results reveal that the integrated approach could learn more precise rules.

Keywords: Customized Marketing, User Profile, Electronic Commerce, Clustering, Association Rules. 二、緣由與目的 由於全球資訊網的超鏈結、多媒體及互 動等特性,使得行銷者能以極低的成本進 行顧客化行銷(customized marketing),希望 藉由提供契合消費者需求的各項產品或服 務 內 容 , 來 增 加 網 站 的 競 爭 優 勢 (Kestnbaum, et al., 1998)。目前網站的應用 實例如Amazon書店會根據個別消費者過 去的購買行為推薦新書,並以該顧客過去 的訂購偏好(如信用卡刷卡、快遞方式)來簡 化訂購過程;而Firefly則藉由比對過去與該 顧客興趣相近的顧客群之偏好進行產品推 薦 (Alexander, 1998)。由於了解消費者是 進行顧客化行銷的第一步,因此本研究的 第一個研究目的即在於提出以使用者輪廓 為基礎之顧客化網路行銷系統架構。 欲進行顧客化行銷,可以針對個人或興 趣群體來學習適合該消費者的行銷法則。 但是以個人為基礎之推論其成本較高,且 有 過 度 專 門 化 (over-specialization)的 問 題 (Balabanovic & Shoham, 1997),亦即僅侷限 於推薦該使用者原先有興趣的內容,而忽 略了該使用者可能在其他領域的購買潛 力。因此,本研究的第二個研究目的在於 提出一個以興趣群體為基礎進行顧客化行 銷推論的方法論。 三、結果與討論 (一)顧客化網路行銷之系統架構 顧客化網路行銷的最基本概念,是針對 使用者的個人背景或線上行為推薦適當的 行銷內容,因此必需有一個使用者輪廓來 描述使用者個人特性,並設置一網站資料 庫以貯存行銷內容。在使用者輪廓方面, 本研究根據相關文獻將資料類型區分為原 始資料以及推論資料兩大類,其中原始資 料庫貯存所有關於使用者的人口統計、地 理區隔、心理特徵與行為反應等資料,而 推論引擎對於使用者個人進行推論所獲得 的產品使用狀況、品牌忠誠度、偏好及所 屬興趣群體等推論結果,則貯存於推論資 料庫。至於在網站資料庫中,則貯存著網 頁內容、網路商店之產品型錄,以及廣告、 促銷等行銷內容,以供顧客化推薦之用。 如何針對使用者之個人背景與線上行 為等特性,提供適當的行銷內容,則有賴

(3)

於激發相關的行銷法則來決定,因此顧客 化系統必需有一個行銷法則庫來貯存這些 法則。行銷法則一方面可由行銷者自行建 入,另一方面則可透過推論引擎分析使用 者的原始資料以及行為資料所對應的行銷 內容,自動學習出有用的行銷法則。 由於使用者資料的蒐集來源包括內部 網站以及外部網站兩方面,因此在顧客化 網路行銷系統架構中,設計了兩個介面機 制︰其一為負責內部網站與使用者進行互 動的資料蒐集與內容展示機制,另一個則 是負責蒐集與消費者相關的外部網路資源 之外部資料搜尋機制。 為了控制整個系統的運作過程,架構中 設計了一個控制引擎,接收來自資料蒐集 與內容展示機制所傳來的使用者需求,再 根據貯存於使用者輪廓與網站資料庫的資 料內容來決定激發行銷法則庫內的哪些行 銷法則,最後再要求資料蒐集與內容展示 機制進行回應。 基於輔助行銷者使其能隨時自行更新 網站內容,架構中另外設計了一個維護介 面,以輔助行銷者以更容易的方式針對網 頁內容、程式以及所設定的行銷法則進行 維護。綜合上述的探討,本研究提出如圖1 的顧客化網路行銷系統架構,做為進行顧 客化行銷之指引。 瀏覽器 使用者 •Cookies 其他外部網站 使用者輪廓︰ 推論資料 w使用狀況 w品牌忠誠度 w偏好 w興趣群體 ... 使用者輪廓︰ 原始資料 w人口統計 w地理區隔 w心理特徵 w行為反應... 行銷法則庫 w以個人為基礎 w以群體為基礎 網站資料庫 w網頁內容 w產品型錄 w廣告、促銷... 網站 伺服器 控制引擎 資料蒐集與 內容展示機制 •CGI •日誌檔 外部資料 搜尋機制 推論引擎 行銷者 維護介面 •推播 圖1︰顧客化網路行銷之系統架構    (二)以群體為顧客化基礎之推論方法論 本研究在顧客化行銷的推論方面,將重 點設定在如何以興趣群體為基礎進行推 論。針對圖1顧客化網路行銷系統架構中的 推論引擎,本研究提出如圖2的整合方法 論,分為兩個步驟進行。第一個步驟是根 據貯存於使用者輪廓的人口統計、地理區 隔、心理特徵與行為反應等消費者原始資 料進行集群分析,將相近的消費者歸為同 一群。本研究探討了數種非階層式集群分 析的演算法如K-means、PAM、CLARA及 CLARANS 等 (Kaufman & Rousseeuw, 1990),基於分析的資料包括了名目、區間 與連續尺度,而且資料探勘所蒐集的資料 筆數均極大,因此本研究在此建議使用 CLARA或CLARANS演算法來處理集群分 析的問題。集群分析所產生的k個中位物件 (medoid)之推論結果以及各個興趣群體之 描述將被貯存於使用者輪廓的推論資料 內,供未來進行顧客化行銷時,據以決定 個別顧客所屬群體之用。 w人口統計 w地理區隔 w心理特徵 w行為反應... w交易 w瀏覽型態 w各群之中位物件 w各群之描述 推論引擎 w產品類別 w網頁類別 w廣告... 使用者輪廓︰ 原始資料 使用者輪廓︰ 推論資料 網站資料庫 行銷法則庫 w以群體為基礎 之關聯法則 w分群結果 步驟一︰ 步驟二︰ 集群分析 •CLARA •CLARANS 關聯法則 •AprioriHybrid & Algorithm Basic 圖2︰推論行銷法則之方法論 第 二 個 步 驟 則 是 針 對 上 述 分 群 的 結 果,以各個興趣群體為分析單位,分別找 尋其關聯法則。這些法則可藉由分析貯存 於使用者輪廓的原始交易(如購物車、線上 購買結果)或是各個消費者的瀏覽型態(如 瀏覽產品行為)而推論出。典型的推論結果 是找出個別產品間的關聯性,例如使用者 瀏覽或是購買了A產品,也通常會同時瀏覽 或購買B產品之法則。這些行銷法則,可輔 助行銷者將相關的產品一併進行促銷或包 裝在一起銷售。除了產品的關聯性之外, 網頁內容間的關聯性亦可透過關聯法則找 出,幫助行銷者安排網頁內容以及設置超 鏈結之用。然而,個別產品或網頁之法則 常過於特定,若能針對產品或網頁所屬類

(4)

別進行分析,則行銷者可將這些法則應用 到同性質或相同類別的產品上。因此在這 個步驟,亦必需藉由網頁資料庫取出交易 或瀏覽型態所屬的產品類別、網頁類別以 及適合搭配的廣告等資訊。 在選擇關聯法則分析的演算法上,本研 究探討了七個演算法(Agrawal & Srikant, 1994; Park, et al., 1997) , 其 中 以 AprioriHybrid與DHP的執行效率較佳,因此 本研究建議以AprioriHybrid為主,並加入 DHP裁減資料庫的方法來進行關聯法則之 分析。另外,亦加入Algorithm Basic將各個 項目擴展為該項目與其所屬類別至原始交 易的觀念,以期獲得產品項目與產品類別 間,或是產品類別與其他產品類別間之關 聯法則。分析後所產生的以群體為基礎之 關聯法則將被貯存於行銷法則庫中,做為 顧客化行銷之推薦依據。 瀏覽器 使用者 控制引擎 擷取使用者個人背景 或過去線上行為資料 資料蒐集與 內容展示機制 回應 決定所屬興趣群體 擷取行銷法則 產生顧客化行銷方案 使用者輪廓: 原始資料 行銷法則庫 網站資料庫 使用者輪廓: 推論資料 w產品類別 w網頁類別 w廣告... w個人背景 w線上行為 w以群體為基礎 之關聯法則 需求 w各群之中位物件 w各群之描述 w個人背景 w線上 行為 圖3︰控制引擎在以群體為推論基礎之即 時顧客化系統之運作過程 上述以群體為推論基礎之行銷法則,可 透過控制引擎的運作來進行顧客化行銷, 如圖3所示。使用者透過瀏覽器將需求送至 伺服器的資料蒐集與內容展示機制後,該 需求將送至控制引擎處理,此時控制引擎 根據此需求由使用者輪廓的原始資料中辨 認該使用者的身份,或是與過去的線上行 為進行比對,以擷取該使用者個人背景或 是所對應的線上行為資料。接著由使用者 輪廓之推論資料中找出各群的中位物件及 各群描述,透過運算找出最近的中位物件 以決定該使用者所屬的興趣群體,而後透 過行銷法則庫擷取該群體所推論出的關聯 法則,並考量使用者的背景與過去的線上 行為以決定法則的優先順序。最後則是擷 取網站資料庫內的產品、網頁及廣告等內 容,產生顧客化行銷方案,並交回資料蒐 集與內容展示機制回應至瀏覽器端。 (三)績效評估 為了驗證所提方法論的績效,本研究以 中山大學復文書局網站進行實驗,實驗期 間共有320人參與。分為未分群以及分群兩 組,後者以消費者的性別、血型、年齡、 職業、科系、年級、收入、接觸網路時間、 每天上網時數、使用者瀏覽圖書的總秒 數、總圖書數,以及購買總數進行集群分 析,其最佳分群數為3。隨後再繼續採用 Algorithm Basic 演 算 法 進 行 關 聯 法 則 分 析,其支持水準(support)設定為0.1,以比 較未分群及分群兩組所找出的關聯法則之 績效。目前常見的三個衡量指標為支持水 準、 信 心 水 準 (confidence) 以及 改善 水 準 (improvement),其定義如下:假設X與Y是 交易集 D的項目集,則 支持水準定義為 Prob(X∩Y),信心水準為Prob(Y|X),而改 善水準則定義為Prob(Y|X)/Prob(Y)。一條關 聯法則的支持水準愈高,表示該法則愈有 用,而信心水準及改善水準愈高,則表示 該法則愈正確。 表1是未分群組與分群組中,具有相同 法則者進行衡量指標的比較。表中的第一 欄是未分群組的所有關聯法則,以第一個 關聯法則(B01, L)為例,集群3的支持水準 (0.25)較未分群組(0.11)為高,表示集群分 析的結果能夠增加原先法則的支持水準。 本研究以「↑」的符號來表示分群後之衡量 指標較原先未分群時為高;反之,則以「↓」 符號代表該衡量指標變低。 從表1可以發現分群之後,絕大多數的 法則在支持水準與信心水準這兩個衡量指 標均有增加。總計在27條相同的法則中, 支持水準增加的有26條法則,而信心水準 增加的亦達21條法則。然而改善水準增加 的法則數僅有8條,並未過半。從改善水準 (Prob(Y|X)/ Prob(Y))的計算公式來看,其相

(5)

較於信心水準(Prob(Y|X))多除了Prob(Y), 也就是說該衡量指標不僅考慮項目X與Y 間的條件機率,亦試圖排除Y隨機與其他項 目出現的可能性,因此改善水準可以說是 衡量關聯法則正確性的一個比較保守且嚴 格的指標。而本實驗結果之未能增加關聯 法則的改善水準,合理的推論是分群之 後,能夠同時增加Prob(Y|X)與Prob(Y)。由 於支持水準增加的比例高達21/27,因此我 們可以解釋分群之後,確實能夠增加法則 的正確性,但是僅有8/27的法則增加的幅度 強到連帶使得改善水準亦增加。 四、計畫成果自評 本計畫之具體成果包括提出進行顧客 化網路行銷之系統架構以及以群體為顧客 化基礎之推論方法論,最後並以實驗方法 驗證所提方法論之績效。 本 計 畫 已 寫 成 一 篇 論 文 「 A Group-based Inference Approach to Customized Marketing on the Web – Integrating Clustering and Association Rules Techniques 」 刊 登 於 2000 年 的 Hawaii International Conference on System Sciences 研討會論文集中,未來若能與實際網站長 期合作,蒐集線上消費者的個人背景與購 物過程與購買結果之資料,並在績效評估 方面加強統計顯著性之分析,將具有學術 期刊發表之價值。 五、參考文獻

Agrawal, R., and Srikant, R., “Fast Algorithms for Mining Association Rules,” Proceedings of the 20th VLDB Conference, Santiago, Chile, 1994, pp.487-499.

Alexander, S., “Web Marketing Gets Personal,” InfoWorld, Vol.20, No.2, 1998, pp.93-94.

Balabanovic, M., and Shoham, Y., “Fab: Content-based, Collaborative Recom-mendation,” Communications of the ACM, Vol.40, No.3, 1997, pp.66-72. Kaufman, L., and Rousseeuw, P. J., Finding

Groups in Data: An Introduction to Cluster Analysis, John Wiley & Sons, New York, 1990.

Kestnbaum, R. D., Kestnbaum, K. T., and Ames, P. W., “Building a Longitudinal Contact Strategy,”Journal of Interactive Marketing, Vol.12, No.1, 1998, pp.56-62.

Park, J. S., Chen, M.-S., and Yu. P. S., “Using a Hash-based Method with Transaction Trimming for Mining Association Rules,” IEEE Transactions on Knowledge and Data Engineering, Vol.9, No.5, 1997, pp.813-825.

表1:瀏覽行為關聯法則之衡量指標比較

分群

未分群 集群1 集群2 集群3

關聯法則2 [s]1 [c]1 [i]1 [s] [c] [i] [s] [c] [i] [s] [c] [i]

(B01, L) 0.11 0.77 1.53 0.25↑ 0.82↑ 1.15↓ (B02, L) 0.12 0.74 1.48 0.20↑ 0.67↓ 1.25↓ 0.18↑ 0.93↑ 1.30↓ (B08, L) 0.12 0.81 1.61 0.26↑ 0.95↑ 1.33↓ (B09, L) 0.10 0.71 1.41 0.17↑ 0.83↑ 1.56↑ 0.19↑ 0.82↑ 1.16↓ (L02, B) 0.15 0.70 1.21 0.17↑ 0.71↑ 1.13↓ 0.26↑ 0.79↑ 1.09↓ (L03, B) 0.12 0.89 1.55 0.17↑ 1.00↑ 1.58↑ 0.23↑ 0.94↑ 1.30↓ (L06, B) 0.12 0.81 1.40 0.13↑ 0.80↓ 1.26↓ 0.26↑ 0.94↑ 1.25↓ (L07, B) 0.10 0.79 1.36 0.17↑ 1.00↑ 1.58↑ 0.23↑ 0.89↑ 1.23↓ (L09, B) 0.11 0.79 1.38 0.17↑ 1.00↑ 1.58↑ 0.19↑ 0.78↓ 1.07↓ (C, M) 0.15 0.48 1.04 0.23↑ 0.70↑ 1.11↑ 0.30↑ 0.81↑ 1.35↑ (C, B) 0.17 0.55 0.96 0.20↑ 0.60↑ 0.95↓ 0.11↓ 0.40↓ 0.86↓ 0.26↑ 0.70↑ 0.97↑ (C, L) 0.12 0.37 0.74 0.13↑ 0.40↑ 0.75↑ 0.19↑ 0.52↑ 0.73↓ (E, M) 0.13 0.74 1.60 0.20↑ 0.67↓ 1.05↓ 0.25↑ 0.95↑ 1.57↓ (M, B, L) 0.15 0.62 1.20 0.20↑ 0.60↓ 1.13↓ 0.33↑ 0.77↑ 1.09↓

Summary3: Support (): 26/27; Confidence (): 21/27; Improvement (): 8/27

Note: 1.衡量指標︰[s]→支持水準; [c]→信心水準; [i]→改善水準。 2.類別︰B→文學類; C→電腦類; E→電子商務; L→非文學類; M→管理類。 圖書︰「B01」是指文學類(B)編號為01之圖書,以此類推。 (B01, L)代表文學類編號01之圖書(B01)與非文學類(L)之關聯法則。 3.本研究針對分為3群與未分群所產生之關聯法則進行比較,如果前者之衡量指標大於後者,以「↑」表示之;反之,則以「↓」表示比較之結果。 此外,衡量指標值變大之比例彙總於表格之最後一欄

(6)

參考文獻

相關文件

排容原理是 一個很容易使用的計數方法, 而它最早被使用的歷史可追溯到早期的一些手稿 中, 以篩選方法 (Sieve Method) 或交叉分類法則 (Principle of Cross Classification)

稅則號別變更標準:指生產貨品所使用的非原產材料 在締約一方或雙方領域內加工,因而使貨品之稅則號 別發生;換言之

收費原則 :CCC Code前6碼相同者歸為1類 登錄10個類別以 內收費 NT$5,000. 超過10個類別每類加收費 NT$1,000(超過部分)

(3) TTQS 是針對機構進行評鑑,而非訓練班別,由於同一個機構 所辦理的不同訓練班別品質不盡相同,故 TTQS

以下 Java 程式執行完後,輸出結果為何?(A)無法編譯,因為 Rectangle 類別不能同時 extends 一個類別且 implemets 一個介面(B)無法編譯,因為 Shapes 類別沒有

sort 函式可將一組資料排序成遞增 (ascending order) 或 遞減順序 (descending order)。. 如果這組資料是一個行或列向量,整組資料會進行排序。

閘門快易通 同仁在執行各項業務 時,如需檢附求職者的 加(退)保資料,以確保 求職者身分資格時,經 求職者本人同意並寫

  系列中一套三冊的內容,分別對應不同類別資優學生的需要,除了讓 教師了解香港資優教育的推行理念及一般資優