類別資料之決策樹分析（Decision Tree）

第二節 RFM 模型之聚類分析

三、類別資料之決策樹分析（Decision Tree）

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

三、類別資料之決策樹分析（Decision Tree）

本文經過聚類分析結果，將每個客戶貼上標籤，並分群至三個群體，接著將使用決策樹分析觀察分類之決策點，決策樹屬於數據挖掘中監督式

（supervised）機器學習的技術之一，用來處理分類問題的樹狀結構，其中，蒐集資料共有 8,082 位客戶在英國之網路購物，聚類分析之類別 0 之客戶共有 4,790 個、

類別 1 之客戶共有 3,266 個，最後類別 2 之客戶共有 26 個，首先將資料切割為訓練資料（Training Data）以及測試資料（Testing），切割比例為 70%及 30%，使用 70%之資料（共有 5,657 筆）進行決策樹分析，最後透過 30%之資料（共有 2,425 筆），進行模型適度性檢測，其中，2,425 筆客戶類別為 0 共有 958 筆、類別 1 共有 1,461 筆、類別為 2 共有 6 筆資料，透過混淆矩陣

（Confusion Matrix）來觀察精確度。

由下列樹狀圖觀察每一次分割之決策點，其中，自變數𝑋₀為客戶每次購買時間之鄰近度（Recency）、𝑋₁為客戶在期間內之購買頻率（Frequency）、𝑋₂ 為客戶在期間內之購買金額（Amount），以第一個決策點為例，使用𝑋₀變數進行分割，𝑋₀ ≤ 147.321若為正確，則往決策樹之左邊分支進行下一次的決策值，其分割規則即使用 Gini Index，Gini Index = 0.485，以此類推進行一步步分割，分割至決策樹已無法再繼續分割，分割結果共有 605 筆資料經決策樹模型分類至類別 0、有 1,203 筆資料被分類至類別 1，而類別 2 之資料皆無被正確分類，精確度為 74%（圖 4-13），透過分析結果，類別 1 之客戶數量最多，其精確度亦較高，約為 77%，然而，類別 2 之客戶因樣本數少，因此較無充分之資訊可建構精確度較高之決策樹模型。

圖表 4- 12 Decision Tree Model 之精確性（混淆矩陣）

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖表 4- 13 Decision Tree Model 之決策圖

‧

（Amount）為基礎，使用非監督式學習之聚類分析（Clustering Analysis）之 K-means 演算法，將業務客戶分為有意義的群組中，對每個群組中的消費者主要特徵明確識別，另外，將分類結果為每個客戶貼上標籤，並使用決策樹分析

（Decision Tree）觀察模型樹狀模型之配適結果。

由於此資料進行聚類分析之分類結果，第三類別為消費頻率最高且金額大度，並進行多次分析，或是採用各種分類模型，如羅吉斯回歸模型（Logistic Regression）、決策樹模型（Decision Tree）或是支持向量機（Support Vector Machine）等。

近年來人工智慧技術蓬勃發展，現今許多小型在線零售業者、在線零售行業之新進入者皆相當熱衷於在其業務上進行數據挖掘，提供以消費者為中心的營銷，企業若能善用現有資訊以進行數據分析，進一步提供關於以消費者為中心的行銷策略，將為企業建立較同業更好的優勢以及競爭力。

本文研究限制為因無適合的計算平台，故未使用深度學習之演算法進行聚類分析，僅使用 Python 之機器學習開源軟體 scikit-learn，以 K-means 套件進行聚類分析，未來建議可使用深度學習方法以建構模型，並比較深度學習及機器學習演算法之效能及其配適度，提供研究數據適當之演算法以及平台以進行數據分析，並取得有用之資訊，為企業帶來優勢以及更多的數據價值。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

參考文獻

Adobe. （2018）. Digital Intelligence Briefing. 43.

Breiman, L., Friedman, J., Olshen, R., & Stone, C. （1984）. Classification and Regression Trees. Monterey, CA: Wadsworth. Wadsworth

Statistics/Probability Series: Wadsworth Advanced Books and Software, Belmont, CA.

Cortes, C., & Vapnik, V. （1995）. Support-vector networks. Machine learning, 20

（3）, 273-297.

Deloitte. （2018）. 2018 零售力量與趨勢展望. 1-49.

IBM. （2018）. Shifting toward Enterprise-grade AI.

Provost, F., & Fawcett, T. （2013）. Data Science for Business: What you need to know about data mining and data-analytic thinking: " O'Reilly Media, Inc.".

PwC. （2017）. 2017 年全零售報告 Total Retail 2017. 1-25.

Website

1. Scikit-Learn Retrieved from http://scikit-learn.org/stable/index.html 2. TensorFlow Retrieved from https://www.tensorflow.org/tutorials/

3. Louis Columbus（2017/10）. 80% of Enterprises Are Investing In AI Today.

Retrieved from https://www.forbes.com/sites/louiscolumbus/#1bf1a39e09ef 4. IDC（2018）. 2018 年台灣 ICT 市場十大趨勢預測

Retrieved from www.idc.com/itexecutive

5. UCI Retrieved from https://archive.ics.uci.edu/ml/index.php

在文檔中人工智慧在電子商務的應用 - 政大學術集成 (頁 51-54)

第二節 RFM 模型之聚類分析

三、 類別資料之決策樹分析（Decision Tree）

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

三、類別資料之決策樹分析（Decision Tree）

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

參考文獻

Website

三、類別資料之決策樹分析（Decision Tree）

立政治大學

立政治大學

立政治大學