• 沒有找到結果。

類別資料之決策樹分析(Decision Tree)

第二節 RFM 模型之聚類分析

三、 類別資料之決策樹分析(Decision Tree)

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

三、類別資料之決策樹分析(Decision Tree)

本文經過聚類分析結果,將每個客戶貼上標籤,並分群至三個群體,接著 將使用決策樹分析觀察分類之決策點,決策樹屬於數據挖掘中監督式

(supervised)機器學習的技術之一,用來處理分類問題的樹狀結構,其中,蒐集資料 共有 8,082 位客戶在英國之網路購物,聚類分析之類別 0 之客戶共有 4,790 個、

類別 1 之客戶共有 3,266 個,最後類別 2 之客戶共有 26 個,首先將資料切割為 訓練資料(Training Data)以及測試資料(Testing),切割比例為 70%及 30%,使用 70%之資料(共有 5,657 筆)進行決策樹分析,最後透過 30%之資 料(共有 2,425 筆),進行模型適度性檢測,其中,2,425 筆客戶類別為 0 共有 958 筆、類別 1 共有 1,461 筆、類別為 2 共有 6 筆資料,透過混淆矩陣

(Confusion Matrix)來觀察精確度。

由下列樹狀圖觀察每一次分割之決策點,其中,自變數𝑋0為客戶每次購買 時間之鄰近度(Recency)、𝑋1為客戶在期間內之購買頻率(Frequency) 、𝑋2 為客戶在期間內之購買金額(Amount),以第一個決策點為例,使用𝑋0變數進 行分割,𝑋0 ≤ 147.321若為正確,則往決策樹之左邊分支進行下一次的決策 值,其分割規則即使用 Gini Index,Gini Index = 0.485,以此類推進行一步步 分割,分割至決策樹已無法再繼續分割,分割結果共有 605 筆資料經決策樹模 型分類至類別 0、有 1,203 筆資料被分類至類別 1,而類別 2 之資料皆無被正確 分類,精確度為 74%(圖 4-13),透過分析結果,類別 1 之客戶數量最多,其 精確度亦較高,約為 77%,然而,類別 2 之客戶因樣本數少,因此較無充分之 資訊可建構精確度較高之決策樹模型。

圖表 4- 12 Decision Tree Model 之精確性(混淆矩陣)

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

圖表 4- 13 Decision Tree Model 之決策圖

(Amount)為基礎,使用非監督式學習之聚類分析(Clustering Analysis)之 K-means 演算法,將業務客戶分為有意義的群組中,對每個群組中的消費者主要 特徵明確識別,另外,將分類結果為每個客戶貼上標籤,並使用決策樹分析

(Decision Tree)觀察模型樹狀模型之配適結果。

由於此資料進行聚類分析之分類結果,第三類別為消費頻率最高且金額大 度,並進行多次分析,或是採用各種分類模型,如羅吉斯回歸模型(Logistic Regression)、決策樹模型(Decision Tree)或是支持向量機(Support Vector Machine)等。

近年來人工智慧技術蓬勃發展,現今許多小型在線零售業者、在線零售行 業之新進入者皆相當熱衷於在其業務上進行數據挖掘,提供以消費者為中心的 營銷,企業若能善用現有資訊以進行數據分析,進一步提供關於以消費者為中 心的行銷策略,將為企業建立較同業更好的優勢以及競爭力。

本文研究限制為因無適合的計算平台,故未使用深度學習之演算法進行聚 類分析,僅使用 Python 之機器學習開源軟體 scikit-learn,以 K-means 套件進行 聚類分析,未來建議可使用深度學習方法以建構模型,並比較深度學習及機器 學習演算法之效能及其配適度,提供研究數據適當之演算法以及平台以進行數 據分析,並取得有用之資訊,為企業帶來優勢以及更多的數據價值。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

參考文獻

Adobe. (2018). Digital Intelligence Briefing. 43.

Breiman, L., Friedman, J., Olshen, R., & Stone, C. (1984). Classification and Regression Trees. Monterey, CA: Wadsworth. Wadsworth

Statistics/Probability Series: Wadsworth Advanced Books and Software, Belmont, CA.

Cortes, C., & Vapnik, V. (1995). Support-vector networks. Machine learning, 20

(3), 273-297.

Deloitte. (2018). 2018 零售力量與趨勢展望. 1-49.

IBM. (2018). Shifting toward Enterprise-grade AI.

Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking: " O'Reilly Media, Inc.".

PwC. (2017). 2017 年全零售報告 Total Retail 2017. 1-25.

.

Website

1. Scikit-Learn Retrieved from http://scikit-learn.org/stable/index.html 2. TensorFlow Retrieved from https://www.tensorflow.org/tutorials/

3. Louis Columbus(2017/10). 80% of Enterprises Are Investing In AI Today.

Retrieved from https://www.forbes.com/sites/louiscolumbus/#1bf1a39e09ef 4. IDC(2018). 2018 年台灣 ICT 市場十大趨勢預測

Retrieved from www.idc.com/itexecutive

5. UCI Retrieved from https://archive.ics.uci.edu/ml/index.php