分群方法 簡述
1
階層式分群法
Hierarchical Clustering Algorithms
Partitional Algorithms
以反覆程序直接將資料分解成若干分離 群集,使某能量函數最佳化。
3
混合求解與模式尋找分群法 Mixture-Resolving and Mode-Seeking Algorithms
目的在確認從分配中產生的資料樣式, Nearest Neighbor
Clustering
Fuzzy Clustering
使用模糊技術進行資料分群,單一資料 Representation of Clusters
透過群心點、分類數節點或是邏輯符號 的聯集等方式將來表現分群結果所產生 的資料群集之分佈及其結構,以達到資
料萃取之目的。
7
類神經網路分群法 Artificial Neural Networks for Clustering
基本概念源自生物神經網路,因具備處 Evolutionary Approaches
for Clustering
由自然界演化啟發動機而來,並將所有 可行解進行染色體編碼,被合使用演化 操作因子如選擇、重組與突變等,來尋 找全體母體中最佳的資料分割。
9 搜尋式分群法
Search-Based Approaches
可分成固定與隨機式搜尋法以獲得準則 [Aarts & Korst, 1989]。
10
限制式分群法 Incorporating Domain Constraints in Clustering
分群具有主觀的本質,因此需要根據時
11 大型資料集合分群法 Clustering Large Data Sets
針對數以百萬計高維度的樣式資料集合 進行分群以達到資料萃取,尤其是多媒 體影音型態,目前最佳求解法如以基因 演算法、塔布搜尋法與模擬退火法皆僅 適用小規模資料集合。因此,收斂性的 K-mean 演算法與 Kohonen 的 SOM 受到 矚目[Mao & Jain, 1996]。隨著資料探 勘學門的興起,遂刺激新的分群法產 生,如 CLARANS [Ng & Han, 1994]與 BIRCH[Zhang et al., 1996]
表格 2.4-1 分群方法回顧
本論文即是結合變形的類神經網路學習方法依據客戶交易資料所提出的 客戶分群模型,並舉一實例驗證其客戶分群結果並進而對市場行銷策略做一 參考建議。
3. 改良式客戶分群系統架構概論
3.1. 問題描述與規劃
經濟學家帕列托所提出所謂 80/20 法則,說明了原因和結果、努力和收 穫之間,存在著不平衡的關係。而典型的情況是:80%的收穫,來自 20%的付 出,也就是 80%的結果,歸結於 20%的原因。而在實際的情形下也是如此,20
%的重要客戶貢獻了利潤的 150%;而最差的 40%客戶,使利潤縮減 50%,
可見客戶區隔的重要性。
然而,隨著科技的潮流加上網路交易的發達,企業面對大量的顧客資料 中,尤其經濟規模已由高成長高獲利的商業模式進入穩定成長與微利的商業 模式,企業在尋求客戶的重要性與並將企業最重要的資源置於最重要的客戶 上,並對企業營收與成長幫助不顯著的客戶從新檢討其對應的行銷策略,對 於競爭激烈的成熟市場已是企業中亟需面對的問題。
對於客戶的維持與改善客戶關係一直是企業中常常被提出來的問題。為 了長期吸引顧客,持續改善顧客滿意度、增進競爭力、維持同業領先地位,
企業必須不斷且長期投入資本與人力改善客戶關係,然而企業資源有限,應 用帕列托所提出的 80/20 原則,並研究顯示,20% 的好顧客貢獻了利潤的 150%,而最差的 40%顧客,使利潤縮減 50%。
如此,我們需將最有效的行銷與市場資源投資於收益最大的客戶群中,
所以如何找出最有價值的客戶群並做最有效的行銷計畫成為本論文所要解決 的問題。
3.2. 研究架構
本論文提出一個系統雛形分析客戶資料,並利用 RFM(Recency, Frequency, Monetary)[Huge, 1944],模型作為客戶分群指標,並在分群的邏輯中,應 用人工智慧 Data Mining 的方法,以 SOM 演算法作為客戶分群的邏輯,並探 討分群結果與實際應用的分析。
文中並以半導體產業的客戶資料實際資料模擬系統雛形,並做一結果分 析研討。
歸納本文雛形架構如下:
附圖 3.2-1 分析架構