‧
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
無假設H 。其中,若列聯表格中理論次數少於 5 的格數超過 20%格子總數0 (r*c), 則將不進行卡方檢定。
三、 資料採礦
資料採礦(Data Mining)為近幾年來非常熱門的研究工具之一,早期運用在銀 行業、量販業的資料庫行銷,現在各大行業也越趨重視這種大量資料處理的軟體,
尤其是大量的顧客資料再進行消費者行為、滿意度、忠誠度評估、顧客終身價值 等研究,或是特別限制下欲抓出的資料,都可使用資料採礦軟體。但應該如何從 大量的資料中,找出對企業本身有用的資訊呢? 理所當然就必須有一工具,能將 如此重要的任務達成。本研究主要是使用由 SPSS 公司所推出最新版本的「資料 採礦」軟體:Clementine 12.0,資料採礦操作程序如圖 3-1。
資料來源:中華資料採礦協會
圖 3-1 資料採礦操作程序
由圖 3-1 可知,資料採礦是一個確定資料中有效的、新的,可能有用的並且 最終能被理解的模式之重要過程(Fayyad, 1996)。資料採礦是為了要發現出有意 義的樣型或規則,而必須從大量的資料中以自動或是半自動的方式來探索和分析
20
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
資料(Berry and Linoff, 1997)。資料採礦是一種新的且不斷循環的決策支援分析過 程,它能夠從組合在一起的資料中,發現出隱藏其中具有價值的知識,以提供給 企業專業人員參考(Kleissner, 1998)。
1. 而在資料採礦的過程中,資料探勘使用之方法則如下列所示:
(1) 使用節點的功能:
a. 紀錄操作節點:
紀錄操作節點用於紀錄層次修改資料集。這些操作在資料採礦的資料理 解和資料準備階段很重要,因爲通過這些操作,可以使資料滿足特定的 商業要求。紀錄操作選項板包括以下節點:
選擇(Select):依某具體條件,來篩選資料筆數。
樣本(Sample):對資料進行抽樣。
聚合(Aggregate):把輸入的資料轉換成總括性的輸出資訊。
排序(Sort):對特定欄位的資料作排序。
合併(Merge):合併不同來源的資料。
附加(Append):新增資料筆數。
區分(Distinct):消除重複的資料筆數。
b. 資料處理節點:
過濾器節點 (Filter):依模型或目的需求,篩選資料欄位或重新命名 資料欄位。
導出節點 (Derive):依模型或目的需求,新增資料欄位。
再分類節點 (Reclassify):將廣泛性質的資料,依其相近性質,再作 更精簡的分類。
(2) RFM 採礦功能:
進行顧客價值分析時,RFM 模型是廣受應用的方法之一,以下分別說明學 者對最近購買日(Recency)、購買頻率 (Frequency) 與購買金額(Monetary)的定義
21
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
與資料轉換的處理。
a. 最近購買日
最近購買日是指顧客從公司消費任何事物的最近時間點。將資料庫顧客的 資料依最近購買日排序,把距離現今日期最近購買的顧客交易紀錄資料排在最 上層,而將資料庫均分成五等份,每一等份相當於整個資料庫的 20%,而最上 端等份的資料也就是最接近目前日期的 20%,此編碼為「5」,接近目前日期 20%
~40%的等份資料編碼為「4」,以此類推,依序各編碼為「3」、「2」、「1」。而 在進行任何促銷活動之後,編碼數字越大的顧客代表其回應或購買的機率越 大。
b. 購買頻率
購買頻率是指顧客在公司所設定之特定期間內,向該公司進行消費的次數。
衡量購買頻率的方法有很多 (例如:每年平均購買的次數、每年平均購買商品 的數量、一個月期間開支票和存款的總數量等),依企業的產品類別或服務性質 找出最適當的衡量方法,而計算出購買頻率後,同樣依序排列並將其平均分成 五等份,最上端等份的資料為資料庫中次數最多的前 20%,編碼為「5」,依序各 編碼為「4」、「3」、「2」、「1」。編碼越大的顧客代表其回應率越高,但值得注意 的是,若最近購買日與消費頻率同樣編碼為「5」的顧客,在進行促銷活動後,
最近購買日編碼為「5」的顧客會較消費頻率編碼為「5」者有較大的回應率,
表示同樣是好的預測工具,但最近購買日仍優於購買頻率,也因此稱此模型為 RFM,而不是 FRM 或 FMR。
c. 購買金額
消費金額是指顧客在公司所設定之特定期間內,對該公司所支出的金額 。 根據特定時間內所消費的總金額將資料庫顧客的交易資料依序排列後,平均分 為五等份,總消費金額最多的前 20%顧客編碼為「5」,同樣依序各編碼為「4」、
「3」、「2」、「1」。購買金額對回應率的影響不及最近購買日與購買頻率,因其
22
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
回應率需視拆信可能性與購買能力的相對情況而定,購買能力強的人往往有較 多信件,經過濾後則拆閱此促銷信件的機率變低;相對而言,購買能力較弱者,
因信件較少而有較高的拆信可能性,然而經拆閱信件後,購買能力強者則比購 買能力弱者有較大機率進行購買行為(羅巧芳、吳信宏、張恩啟、鄭易英,2008)。
本研究沿用學者對最近購買日、購買頻率以及購買金額此三構面的定義,但本 次研究重點不在於顧客,而是希望利用 RFM 系統來將 B 公司之商品做 RFM Score 並排行,找出最佳銷售商品,以及銷售排名較落後的商品,並藉此機會了 解那些商品促銷十分成功,那些商品還需要利用活動期間搭配商品組合或是滿 額贈等方式,讓顧客有機會試用或體驗銷售排名較後面的商品,進而增加其銷 售機會。
23
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
第肆章 實證分析
本章於第一節針對會員資料、店家銷售資料以及產品銷售(四大類商品)資料 等變數,進行探索性分析。其次,為深入探討各變數與商品間的關係,於第二節 中分別按是否為會員、年齡、性別、使用品牌時間與消費金額間(分組)的交叉分 析,予以敘述。最後,則於第三節中,針對所有商品以及四大類商品,進行 RFM 分析及評分,詳述如下。