支援客戶關係管理分析工具之研究(I)

(1)

1

行政院國家科學委員會專題研究計畫成果報告

支援客戶關係管理分析工具之研究

The Study of Analysis Tools for Suppor ting Customer Relationship Management

計劃編號：NSC-90-2218-E-011-003

執行期限：自民國 90 年 8 月 1 日起至民國 91 年 7 月 31 日止主持人：周碩彥國立台灣科技大學教授

e-mail : sychou@im.ntust.edu.tw

一、中文摘要

顧客關係管理（Customer Relationship Management；CRM）的概念於近幾年內由不同的角度被提出，漸漸地將過去和行銷及銷售相關資訊以及顧客分析概念納入其範圍內。CRM 之所以會受到企業界如此的重視，主要是傳統的行銷概念已經被新浮現的議題重新給予定義，許多研究紛紛朝向新的議題來謀求更多的發展空間，各企業亦瞭解主要的生存之道在於獲得

（acquire）顧客、保留（retain）顧客以及顧客利潤的成長（ grow profitable customers）。因此，如何建立一個以顧客為中心的企業，以保持市場上的競爭優勢，必須要從找到目標客戶群、確認顧客的需求進而達到顧客保留。

本研究在於建立機制與工具，使得利用網站進行顧客資料管理之企業，得以快速的建構出其所需要的資料收集介面，進而進行資料整理及資料探勘。研究中除了建立 web-based 的資料收集模組，並研究歸納出數項分析工具，予以建構成模組供快速整合納入分析系統之用。在資料探勘的工具建構上，亦整合兩項多度空間資料視覺化分析工具：多向度空間評量法及平行座標系統。最終，以一實際的企業測試驗證此系統工具模組之可行性，以及應用此資料探勘工具之果效。

關鍵詞：顧客關係管理、資料探勘、資料

視覺化、多度空間資料分析、WWW 應用

Abstr act

The concept of Customer Relationship Management（CRM） was proposed from various angles in recent years. It gradually encompasses the traditionally emphasized information from marketing, sales and customer analysis in its domain. The reason that CRM attracts so much attention from industry is because in the new business environment, the survival of a company is hinged on her ability to acquire, retain and grow profitable customers. The technology to achieve such goals is therefore critical to the business.

This research has established mechanism and tools for assisting enterprises using websites to gather customer information. With the developed tools, companies can efficiently construct an interface for performing data collection, classification and analysis. In addition to the web-based tool modules, the research identified a few analysis methodologies and implement them so that they can be integrated into the analysis system. Two high-dimensional data visualization methods— multi-dimensional scaling and parallel coordinate system— were implemented to assist the analysis of complex multi-dimensional data obtained from the data collection process. An

(2)

2

experimental case was constructed to verify the applicability and effectiveness of the proposed scheme.

Keywords: Customer Relationship Management, Data Mining, Data Visualization, High-Dimensional Data Analysis, WWW Applications

二、計劃緣由與目的

企業中有百分之八十的利潤是百分之二十的顧客所創造，這說明了為何現在的公司除了利用各行銷方法開拓新群體，對於其顧客亦採用各種分析的方法來找出有價值的顧客群，提供更貼切的服務來留住保留顧客。顧客忠誠度是在潛在的無限商機中是相當重要的一個環節，因為除了可以利用現存顧客群刺激重複購買，並可藉由分析其特徵屬性來預測可能潛在的顧客區段。但是如何能夠從顧客關係管理的觀念出發，來思考真正的達到提昇顧客忠誠度目標呢？積極的創造利潤與保留顧客應該是首要的目標。

本研究旨在在依循客戶關係管理、資料挖掘以及網際探勘等理念，以全球資訊網為平台，發展一套整合性之資訊系統雛型架構，開發視覺化之資料挖掘，並實證應用資料挖掘技術對客戶關係管理的注意為何。系統包含三項主要目標：

首先，建立 web-based 資料收集之開放性環境及輔助功能模組，使用者可基於其需要，簡易的整合本研究所建立提供之工具，快速的完成一套配合網站營運的顧客資料收集及分析探勘系統。

其次，針對多度空間資料視覺化之需要發展輔助工具，以提升資料探勘之果效。利用原有的 cube 之資料結構及結合其橫切面之工具，另外將發展並整合多向度尺度評量法及平行座標系統工具，產生一套多度空間資料視覺化分析工具之雛型。

最後，研究歸納出 niche 之資料收集行業，規劃並建議其資料升級及分析的策略。在實證工作尚可經由建立一經過資料

分類相關技術的電子型錄及購物網站，以設計型錄中各產品如何分類與呈現。此外亦可針對購物網站設計一套完整的 web mining 機制，找出消費者與電子型錄間隱藏的模型，供網站自動產生服務或提供資訊者決策參考用。綜合前兩項的結果，針對個別消費者提供不同方式呈現的網站頁面，以期達到一對一行銷的的理想目標。

三、結果與討論

本研究目的在探討客戶關係管理中所需的分析工作，發展有效的工具以強化 CRM 系統的功效其中包括知識發掘、資料挖掘及網際探勘主要子領域。資料挖掘是目前在資料分析運用上比較新穎的方法，

目的是將一般資料庫中看似無用的資料

（data）轉換成有用的資訊（information）。

Web Usage Mining 分成兩個主要流程，第一是把 web data 轉成適當的 transaction form 的 domain dependent process。透過對購物網站伺服器 server log files 經過 data cleaning 和 transaction identification 的動作後轉成 transaction form 的資料，再和 user registration data 以及其他 usage attributes 整合，接下來配合各種 pattern discovery方法進行 data mining 的 domain independent process。最後將整合的資料用於特定用途，例如針對顧客行為模式發展不同的行銷手法，針對個人偏好的網頁內容設計個人化網頁，而透過網站上個人登錄的個人資料結合，則可分析出顧客的個別行為，配合 e-mail 廣告或線上互動式廣告，即可對不同族群的顧客實施不同的行銷方式。

在分析的過程中，顧客分群與資料分群是非常重要的一部份。資訊視覺化之工具最主要的功能在於輔助決策者從複雜的資料中找出一般分析方法無法找出的特徵，在 CRM 之應用中，資料相當複雜，

常需以多度空間的方式表示其特性，在分析上亦需於多度空間找尋其特徵，故特別需要多向度資料視覺化工具之輔助。許多企業擁有龐大的顧客資料，但卻不知如何

(3)

3

加以運用。其最主要原因在面對大量的顧客數目及多樣的顧客屬性時，不易得到整體性的概觀。多向度評量法是一種多變量分析模式，利用人們對一群事物間的相對關係（距離）資料，建構出一個高度的多向度認知座標空間，由此空間中各事物間的相對關係，可使我們更明確的瞭解人們對這些事物的認知情況，MDS 可在諸概念與諸基本像度未能完全開發的領域中使其資料系統化，多向度評量法可協助企業找出顧客分群，據以提供決策之基礎。

在多向度評量法（圖一）的分析上，

二維及三維認知空間的旋轉可透過向度矩陣乘上旋轉矩陣來處理，然而四度空間以上的旋轉方式無法用旋轉矩陣來處理，故須使用直交正規化矩陣（ orthogonal matrix ）來解決四度空間以上的旋轉問題。在直交正規化矩陣中，每一個向量皆與其他向量彼此垂直且每個向量為單位向量。由直交基底所形成的座標系統的座標軸之間亦是相互垂直的，這個特性與認知空間中的每一個向度軸兩兩垂直的特性相同，所以我們可用一個直交正規化矩陣來代表一個經過旋轉的認知空間。我們可任意產生一組線性獨立的向量，透過 Gram-Schmidt 程序產生一直交正規化矩陣，並以此作為多向度評量法的認知空間。而最佳值函數的判斷則根據平均角度差異或最大角度差兩種方法來找出向度軸最佳值。

另一個整合的視覺化分析工具為平行座標系統（圖二），其主要的方式為將目前常用的多度空間中的直角座標系統中互相垂直的軸，轉換為相互平行的軸。傳統集群分析係依照對某中心的鄰近程度來將物件分類。不管物件之間的距離是如何計算出來的，通常相同集群的物件在座標空間中的位置也會相近。在平行座標系統的實作上，接近一條線的點可表示為一相似物件集合，物件之間的差異只是比例的不同；而與是否接近某點無關。接近於 n 度空間中一條線不同的點表示不同比例的相同物件。透過二個座標系統之間的對偶

性，在平行座標系統中的視覺化表現可作為迪卡爾座標系統視覺化的一個輔助工具。在平行座標系統上應用了 scan-line approach，此演算法使用一條垂直的線（與軸平行），即所謂的 scan-line，在相鄰的軸之間掃瞄並觀察是否有一小範圍內，

scan-line 與很多的邊相交（如圖二）。這些交叉點的鄰近程度可與相對應的迪卡爾座標系統中點與直線的鄰近程度相對應。

假如這些小範圍存在，這些小範圍內的點在迪卡爾座標系統中是接近於一條線的。

透過平行座標系統，可協助使用者找出資料分群，據以協助決策。

四、計畫成果自評

以 web-mining 的方式進行，在資料收集方面可能會遭遇一些不精確的問題：（1）

proxy server— 現存的 web 環境中，許多使用者透過 proxy server 瀏覽網頁，因此許多使用者無法被 web server 辨識出來，以致漏掉許多寶貴的資料。（2）local cache—

不少使用者利用軟體將整個網站的內容 mirror 到自己的電腦，再離線瀏覽；如此也會減少資料、分析使用者資料的機會。

（3）user identification— 有些情況是許多使用者共用一部電腦，或是共用同一種軟體上網；如何在 client 端送出請求後判斷是否為不同使用者所送出的訊息。資料收集不精確的問題將使用 cookie 及 cache busting 或是會員註冊的方法來克服，並透過參與測試之廠商，協助驗證系統的正確性及有效性。

在資料分析上及資料視覺化工具的提供遇到的問題為 server 負荷過大的問題。

因此在資料收集上應採 ASP 模式的概念，假設此項 CRM 服務為 ASP 提供之服務，故設計時必須把此收集完成之資料及分析進行之 server 置於和 web server 分離的機器上。在資料儲存分析及視覺化工具的發展中，亦考慮實體的限制，發展可以高效率之方式完成工作的模組工具。而實例的測試，在大量資料未能及時順利取得時，其中資料仍以模擬的狀況資料執行。

(4)

4

五、參考文獻

1. Y. Aumann, O. Etzioni, R. Feldman, M.

Perkowitz, T. Shmiel, 1998, “Prediciting event sequence: data mining for prefetching web-pages,” Proc. Of the int’s. Conf. on Knowledge Discovery in Databases and Data Mining.

2. Alex Berson and Stephen J. Smith, 1997,

“Data warehousing, data mining, &

OLAP,” McGraw-Hill.

3. Alex Berson, Stephen Smith and Kurt Thearling, 1999, “Building data mining applications for CRM,” McGraw-Hill.

4. J. Carriere and R. Kazman, 1997,

“Webquery: searching and visualizing the web through connectivity,”

Proceedings of the Sixth International World Wide Web Conference (1), pp.

701–711.

5. M.S. Chen, J.S. Park, and P.S.Yu, 1996,

“Data mining for path traversal patterns in a web environment,” Proceedings of 16^th International Conference on Distributed Computing Systems.

6. M.S. Chen, J.S. Park, and P.S.Yu, March/April 1998, “Efficient data mining for path traversal patterns,” IEEE tran. on Knowledge and Data Engineering, Vol. 10, No. 2, pp.

209–221.

7. R. Cooley, B. Mobasher, and J.

Srivastava, 1997, “Web mining:

information and pattern discovery on the world wide web,” Proceedings of International Conference on Tools with Artificial Intelligence, Newport Beach, CA, pp. 558–567.

8. M. Ester, H. P. kriegel, J. Sander, M.

Wimmer, X. Xu, Aug. 1998,

“Incremental clustering for mining in a data warehousing environment,” Proc. of the 24^th Int’l Conf. on Very Large Data Bases, New York, USA, pp. 323–333.

9. Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraci Smyth, and Ramasamy Uthurusamy, 1996,

“Advances in knowledge discovery and

data mining,” AAAI Press/The MIT Press.

10. B. Mobasher, and J. Srivastava, Feb.

1999, “Data preparation for mining world wide web browsing patterns,”

Knowledge and Information Systems, Vol. 1, No. 1.

11. Christopher Westphal and Teresa Blaxton, 1998, “Data mining solutions-methods and tools for solving real-world problems”, John Wiley &

Sons, Inc.

12. J. Yi and N. Sundaresan, 1999, “Mining the web for acronyms using the duality of patterns and relations,” Proceedings of the Second International Workshop on Web Information and Data Management.

13. Data Mining and CRM (Kurt Thearling):

http://www3.shore.net/~kht/index.htm

14. Data Mining Software – Putting

Together the Information Puzzle:

http://www.gslis.utexas.edu/%7Epalmqu is/courses/project/dm_sware.htm

六、圖表

圖一十個屬性向量在二維的偏好性認知空間分布圖

圖二平行座標系統