• 沒有找到結果。

支援客戶關係管理分析工具之研究(I)

N/A
N/A
Protected

Academic year: 2021

Share "支援客戶關係管理分析工具之研究(I)"

Copied!
4
0
0

加載中.... (立即查看全文)

全文

(1)

1

行政院國家科學委員會專題研究計畫成果報告

支援客戶關係管理分析工具之研究

The Study of Analysis Tools for Suppor ting Customer Relationship Management

計劃編號:NSC-90-2218-E-011-003

執行期限:自民國 90 年 8 月 1 日起至民國 91 年 7 月 31 日止 主持人:周碩彥 國立台灣科技大學 教授

e-mail : sychou@im.ntust.edu.tw

一、中文摘要

顧客關係管理(Customer Relationship Management;CRM)的概念於近幾年內由 不同的角度被提出,漸漸地將過去和行銷 及銷售相關資訊以及顧客分析概念納入其 範圍內。CRM 之所以會受到企業界如此的 重視,主要是傳統的行銷概念已經被新浮 現的議題重新給予定義,許多研究紛紛朝 向新的議題來謀求更多的發展空間,各企 業 亦 瞭 解 主 要 的 生 存 之 道 在 於 獲 得

(acquire)顧客、保留(retain)顧客以及 顧 客 利 潤 的 成 長 ( grow profitable customers)。因此,如何建立一個以顧客 為中心的企業,以保持市場上的競爭優 勢,必須要從找到目標客戶群、確認顧客 的需求進而達到顧客保留。

本研究在於建立機制與工具,使得利 用網站進行顧客資料管理之企業,得以快 速的建構出其所需要的資料收集介面,進 而進行資料整理及資料探勘。研究中除了 建立 web-based 的資料收集模組,並研究 歸納出數項分析工具,予以建構成模組供 快速整合納入分析系統之用。在資料探勘 的工具建構上,亦整合兩項多度空間資料 視覺化分析工具:多向度空間評量法及平 行座標系統。最終,以一實際的企業測試 驗證此系統工具模組之可行性,以及應用 此資料探勘工具之果效。

關鍵詞:顧客關係管理、資料探勘、資料

視覺化、多度空間資料分析、WWW 應用

Abstr act

The concept of Customer Relationship Management(CRM) was proposed from various angles in recent years. It gradually encompasses the traditionally emphasized information from marketing, sales and customer analysis in its domain. The reason that CRM attracts so much attention from industry is because in the new business environment, the survival of a company is hinged on her ability to acquire, retain and grow profitable customers. The technology to achieve such goals is therefore critical to the business.

This research has established mechanism and tools for assisting enterprises using websites to gather customer information. With the developed tools, companies can efficiently construct an interface for performing data collection, classification and analysis. In addition to the web-based tool modules, the research identified a few analysis methodologies and implement them so that they can be integrated into the analysis system. Two high-dimensional data visualization methods— multi-dimensional scaling and parallel coordinate system— were implemented to assist the analysis of complex multi-dimensional data obtained from the data collection process. An

(2)

2

experimental case was constructed to verify the applicability and effectiveness of the proposed scheme.

Keywords: Customer Relationship Management, Data Mining, Data Visualization, High-Dimensional Data Analysis, WWW Applications

二、計劃緣由與目的

企業中有百分之八十的利潤是百分之 二十的顧客所創造,這說明了為何現在的 公司除了利用各行銷方法開拓新群體,對 於其顧客亦採用各種分析的方法來找出有 價值的顧客群,提供更貼切的服務來留住 保留顧客。顧客忠誠度是在潛在的無限商 機中是相當重要的一個環節,因為除了可 以利用現存顧客群刺激重複購買,並可藉 由分析其特徵屬性來預測可能潛在的顧客 區段。但是如何能夠從顧客關係管理的觀 念出發,來思考真正的達到提昇顧客忠誠 度目標呢?積極的創造利潤與保留顧客應 該是首要的目標。

本研究旨在在依循客戶關係管理、資 料挖掘以及網際探勘等理念,以全球資訊 網為平台,發展一套整合性之資訊系統雛 型架構,開發視覺化之資料挖掘,並實證 應用資料挖掘技術對客戶關係管理的注意 為何。系統包含三項主要目標:

首先,建立 web-based 資料收集之開 放性環境及輔助功能模組,使用者可基於 其需要,簡易的整合本研究所建立提供之 工具,快速的完成一套配合網站營運的顧 客資料收集及分析探勘系統。

其次,針對多度空間資料視覺化之需 要發展輔助工具,以提升資料探勘之果 效。利用原有的 cube 之資料結構及結合其 橫切面之工具,另外將發展並整合多向度 尺度評量法及平行座標系統工具,產生一 套多度空間資料視覺化分析工具之雛型。

最後,研究歸納出 niche 之資料收集 行業,規劃並建議其資料升級及分析的策 略。在實證工作尚可經由建立一經過資料

分類相關技術的電子型錄及購物網站,以 設計型錄中各產品如何分類與呈現。此外 亦可針對購物網站設計一套完整的 web mining 機制,找出消費者與電子型錄間隱 藏的模型,供網站自動產生服務或提供資 訊者決策參考用。綜合前兩項的結果,針 對個別消費者提供不同方式呈現的網站頁 面,以期達到一對一行銷的的理想目標。

三、結果與討論

本研究目的在探討客戶關係管理中所 需的分析工作,發展有效的工具以強化 CRM 系統的功效其中包括知識發掘、資料 挖掘及網際探勘主要子領域。資料挖掘是 目前在資料分析運用上比較新穎的方法,

目的是將一般資料庫中看似無用的資料

(data)轉換成有用的資訊(information)。

Web Usage Mining 分成兩個主要流 程 , 第 一 是 把 web data 轉 成 適 當 的 transaction form 的 domain dependent process。透過對購物網站伺服器 server log files 經 過 data cleaning 和 transaction identification 的 動 作 後 轉 成 transaction form 的資料,再和 user registration data 以 及其他 usage attributes 整合,接下來配合 各種 pattern discovery方法進行 data mining 的 domain independent process。最後將整 合的資料用於特定用途,例如針對顧客行 為模式發展不同的行銷手法,針對個人偏 好的網頁內容設計個人化網頁,而透過網 站上個人登錄的個人資料結合,則可分析 出顧客的個別行為,配合 e-mail 廣告或線 上互動式廣告,即可對不同族群的顧客實 施不同的行銷方式。

在分析的過程中,顧客分群與資料分 群是非常重要的一部份。資訊視覺化之工 具最主要的功能在於輔助決策者從複雜的 資料中找出一般分析方法無法找出的特 徵,在 CRM 之應用中,資料相當複雜,

常需以多度空間的方式表示其特性,在分 析上亦需於多度空間找尋其特徵,故特別 需要多向度資料視覺化工具之輔助。許多 企業擁有龐大的顧客資料,但卻不知如何

(3)

3

加以運用。其最主要原因在面對大量的顧 客數目及多樣的顧客屬性時,不易得到整 體性的概觀。多向度評量法是一種多變量 分析模式,利用人們對一群事物間的相對 關係(距離)資料,建構出一個高度的多 向度認知座標空間,由此空間中各事物間 的相對關係,可使我們更明確的瞭解人們 對這些事物的認知情況,MDS 可在諸概念 與諸基本像度未能完全開發的領域中使其 資料系統化,多向度評量法可協助企業找 出顧客分群,據以提供決策之基礎。

在多向度評量法(圖一)的分析上,

二維及三維認知空間的旋轉可透過向度矩 陣乘上旋轉矩陣來處理,然而四度空間以 上的旋轉方式無法用旋轉矩陣來處理,故 須 使 用 直 交 正 規 化 矩 陣 ( orthogonal matrix ) 來 解 決 四 度 空 間 以 上 的 旋 轉問 題。在直交正規化矩陣中,每一個向量皆 與其他向量彼此垂直且每個向量為單位向 量。由直交基底所形成的座標系統的座標 軸之間亦是相互垂直的,這個特性與認知 空間中的每一個向度軸兩兩垂直的特性相 同,所以我們可用一個直交正規化矩陣來 代表一個經過旋轉的認知空間。我們可任 意 產 生 一 組 線 性 獨 立 的 向 量 , 透 過 Gram-Schmidt 程序產生一直交正規化矩 陣,並以此作為多向度評量法的認知空 間。而最佳值函數的判斷則根據平均角度 差異或最大角度差兩種方法來找出向度軸 最佳值。

另一個整合的視覺化分析工具為平行 座標系統(圖二),其主要的方式為將目 前常用的多度空間中的直角座標系統中互 相垂直的軸,轉換為相互平行的軸。傳統 集群分析係依照對某中心的鄰近程度來將 物件分類。不管物件之間的距離是如何計 算出來的,通常相同集群的物件在座標空 間中的位置也會相近。在平行座標系統的 實作上,接近一條線的點可表示為一相似 物件集合,物件之間的差異只是比例的不 同;而與是否接近某點無關。接近於 n 度 空間中一條線不同的點表示不同比例的相 同物件。透過二個座標系統之間的對偶

性,在平行座標系統中的視覺化表現可作 為迪卡爾座標系統視覺化的一個輔助工 具。在平行座標系統上應用了 scan-line approach,此演算法使用一條垂直的線(與 軸平行),即所謂的 scan-line,在相鄰的 軸之間掃瞄並觀察是否有一小範圍內,

scan-line 與很多的邊相交(如圖二)。這 些交叉點的鄰近程度可與相對應的迪卡爾 座標系統中點與直線的鄰近程度相對應。

假如這些小範圍存在,這些小範圍內的點 在迪卡爾座標系統中是接近於一條線的。

透過平行座標系統,可協助使用者找出資 料分群,據以協助決策。

四、計畫成果自評

以 web-mining 的方式進行,在資料收 集方面可能會遭遇一些不精確的問題:(1)

proxy server— 現存的 web 環境中,許多使 用者透過 proxy server 瀏覽網頁,因此許多 使用者無法被 web server 辨識出來,以致 漏掉許多寶貴的資料。(2)local cache—

不少使用者利用軟體將整個網站的內容 mirror 到自己的電腦,再離線瀏覽;如此 也會減少資料、分析使用者資料的機會。

(3)user identification— 有些情況是許多 使用者共用一部電腦,或是共用同一種軟 體上網;如何在 client 端送出請求後判斷 是否為不同使用者所送出的訊息。資料收 集不精確的問題將使用 cookie 及 cache busting 或是會員註冊的方法來克服,並透 過參與測試之廠商,協助驗證系統的正確 性及有效性。

在資料分析上及資料視覺化工具的提 供遇到的問題為 server 負荷過大的問題。

因此在資料收集上應採 ASP 模式的概 念,假設此項 CRM 服務為 ASP 提供之服 務,故設計時必須把此收集完成之資料及 分析進行之 server 置於和 web server 分離 的機器上。在資料儲存分析及視覺化工具 的發展中,亦考慮實體的限制,發展可以 高效率之方式完成工作的模組工具。而實 例的測試,在大量資料未能及時順利取得 時,其中資料仍以模擬的狀況資料執行。

(4)

4

五、參考文獻

1. Y. Aumann, O. Etzioni, R. Feldman, M.

Perkowitz, T. Shmiel, 1998, “Prediciting event sequence: data mining for prefetching web-pages,” Proc. Of the int’s. Conf. on Knowledge Discovery in Databases and Data Mining.

2. Alex Berson and Stephen J. Smith, 1997,

“Data warehousing, data mining, &

OLAP,” McGraw-Hill.

3. Alex Berson, Stephen Smith and Kurt Thearling, 1999, “Building data mining applications for CRM,” McGraw-Hill.

4. J. Carriere and R. Kazman, 1997,

“Webquery: searching and visualizing the web through connectivity,”

Proceedings of the Sixth International World Wide Web Conference (1), pp.

701–711.

5. M.S. Chen, J.S. Park, and P.S.Yu, 1996,

“Data mining for path traversal patterns in a web environment,” Proceedings of 16th International Conference on Distributed Computing Systems.

6. M.S. Chen, J.S. Park, and P.S.Yu, March/April 1998, “Efficient data mining for path traversal patterns,” IEEE tran. on Knowledge and Data Engineering, Vol. 10, No. 2, pp.

209–221.

7. R. Cooley, B. Mobasher, and J.

Srivastava, 1997, “Web mining:

information and pattern discovery on the world wide web,” Proceedings of International Conference on Tools with Artificial Intelligence, Newport Beach, CA, pp. 558–567.

8. M. Ester, H. P. kriegel, J. Sander, M.

Wimmer, X. Xu, Aug. 1998,

“Incremental clustering for mining in a data warehousing environment,” Proc. of the 24th Int’l Conf. on Very Large Data Bases, New York, USA, pp. 323–333.

9. Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraci Smyth, and Ramasamy Uthurusamy, 1996,

“Advances in knowledge discovery and

data mining,” AAAI Press/The MIT Press.

10. B. Mobasher, and J. Srivastava, Feb.

1999, “Data preparation for mining world wide web browsing patterns,”

Knowledge and Information Systems, Vol. 1, No. 1.

11. Christopher Westphal and Teresa Blaxton, 1998, “Data mining solutions-methods and tools for solving real-world problems”, John Wiley &

Sons, Inc.

12. J. Yi and N. Sundaresan, 1999, “Mining the web for acronyms using the duality of patterns and relations,” Proceedings of the Second International Workshop on Web Information and Data Management.

13. Data Mining and CRM (Kurt Thearling):

http://www3.shore.net/~kht/index.htm

14. Data Mining Software Putting

Together the Information Puzzle:

http://www.gslis.utexas.edu/%7Epalmqu is/courses/project/dm_sware.htm

六、圖表

圖一 十個屬性向量在二維的偏好性認知 空間分布圖

圖二 平行座標系統

參考文獻

相關文件

  SOA 記錄裏,記載著關於該 域名權責區域的一些主 要網域名稱伺服器 ( primary DNS server) 和其它 相關的次要名稱伺服器 ( secondary DNS server)

並存入百事可樂企業內部網站的 伺服 並存入百事可樂企業內部網站的 IBM RS/6000 伺服 器資料庫。然後,主管與分析師可以使用上型電腦

 一般我們如過是透過分享器或集線器來連接電腦 的話,只需要壓制平行線即可(平行線:兩端接 頭皆為EIA/TIA 568B),

(approximation)依次的進行分解,因此能夠將一個原始輸入訊號分 解成許多較低解析(lower resolution)的成分,這個過程如 Figure 3.4.1 所示,在小波轉換中此過程被稱為

服務提供者透過 SOAP 訊息將網路服務註冊在 UDDI 中,服務需求者也可以透 過 SOAP 向服務仲介者查詢所需的 Web Service 並取得 Web Service 的 WSDL 文件,2.

利用 Web Survey 來蒐集資料有許多的好處。許多研究者利用 Web Survey 進行研究的主要原因在於可以降低成本、即時的回覆。然而,Web Survey

Web 伺服器 Internet information services 6 相關應用工具 SQL Server 2005 Analysis services. SQL server business intelligence development Studio Visual

Registry Server 是建構於第三方具有公信力的一個組織,而 Registry Server 在 Web Service 的架構中,主要的功能類似於提供服務查詢(Yellow