第四章、 資料分析
第二節、 獨立性檢定
原本的客戶群或者想開發新客戶都必須了解哪些變數會對於消費額度與消費種
表 14 年齡與消費總額區間之列聯表
第一區間 第二區間 第三區間 第四區間 0 至 45 歲 573 633 444 537 45 至 50 歲 457 576 400 477 50 歲以上 219 270 172 234
表 15 年齡 V.S 消費總額區間之卡方檢定
卡方獨立性檢定
Chisquare 4.392 DF 6 p-value 0.6238
由表格 15 可得知 p-value=0.6238 大於α=0.05,所以不拒絕 ,因此,
年齡與消費總額區間相互獨立,表示兩變數不互相影響。
(三) 卡種 V.S 消費總額區間
此筆數據中,信用卡種類分別為普卡、白金與御璽卡,共三種。首先將三種 卡種各別拆開,再利用單因子次數計算在消費總額的四個區間的分別次數,如表 格 16。
表 16 卡種與消費總額區間之列聯表
第一區間 第二區間 第三區間 第四區間 普卡 839 994 663 834 白金卡 217 248 177 211 御璽卡 193 237 175 204
表 17 卡種 V.S 消費總額區間之卡方檢定
卡方獨立性檢定
Chisquare 1.7904 DF 6 p-value 0.9379
由表格 17 可得知 p-value=0.9379 大於α=0.05,所以不拒絕 ,因此,
卡種與消費總額區間相互獨立,表示兩變數不互相影響。
二、消費種類與各變數間之卡方檢定
公用事業。在接下來的三個小節中,我們將每位消費者對於各類商品之消費次數 做統計,選擇次數最高的一類商品做為代表,使得分析結果能夠更簡潔並且在最 後能夠提出更具體的建議。但在公共事業部份因為個數沒有超過最低限制,因此 在這部分做出來的分析不具參考意義。
(一) 性別 V.S 消費種類
首先,我們先將男女生各別拆開,再利用單因子次數計算在六種消費種類的 分別次數,如表格 18。
表 18 性別與消費種類之列聯表
3C 公用事業 百貨 娛樂 旅遊 餐飲 男性 1010 0 420 202 630 271 女性 1012 2 366 185 640 254
表 19 性別 V.S 消費種類之卡方檢定
卡方獨立性檢定
Chisquare 5.9922 DF 5 p-value 0.307
由表格 19 可得知 p-value=0.307 大於α=0.05,所以不拒絕 ,因此 性別與消費種類相互獨立,表示兩變數不互相影響。
(二) 年齡 V.S 消費種類
年齡分成三大群,分別為0 至 45 歲、45 至 50 歲、50 歲以上。所以首先必 須將三群各別拆開,再利用單因子次數計算在六種消費種類的分別次數,如表格 20。
表 20 年齡與消費種類之列聯表
3C 公用事業 百貨 娛樂 旅遊 餐飲 0 至 45 歲 873 2 331 172 570 239 45 至 50 歲 777 0 304 141 495 193 50 歲以上 372 0 151 74 205 93
表 21 年齡 V.S 消費種類之卡方檢定
卡方獨立性檢定
Chisquare 8.4067 DF 10 p-value 0.5892
由表格 21 可得知 p-value=0.5892 大於α=0.05,所以不拒絕 ,因此年齡與消費 種類相互獨立,表示兩變數不互相影響。
(三) 卡種 V.S 消費種類
信用卡種類分別為普卡、白金與御璽卡,共三種。首先將三種卡種各別拆開,
再利用單因子次數計算在六種消費種類的分別次數,如表格 22。
表 22 年齡與消費種類之列聯表
3C 公用事業 百貨 娛樂 旅遊 餐飲 普卡 1346 2 530 279 821 352 白金卡 361 0 141 54 209 88 御璽卡 361 0 141 54 209 88
表 23 卡種 V.S 消費種類之卡方檢定
卡方獨立性檢定
Chisquare 1.7904 DF 6 p-value 0.9379
由表格 23 可得知 p-value=0.9379 大於α=0.05,所以不拒絕 ,因此 年齡與消費種類相互獨立,表示兩變數不互相影響。
三、各變數間之卡方檢定
上面兩個小節我們已經對於持卡者的消費習慣有一定程度的了解後,接下來 我們想針對個人資料的變數兩兩相互比較,看看哪些因素會相互影響,可藉由這 個分析結果開發新客戶。分析的變數分別為性別、年齡、卡種與地區,挑取三組 做獨立性檢定。
(一)性別 V.S 卡種
首先,我們先將男女生各別拆開,再利用單因子次數計算在三種信用卡的分 別次數,如表格 24。
表 24 性別與卡種之列聯表
普卡 白金卡 御璽卡 男性 1693 435 405 女性 1637 418 404
表 25 性別 V.S 卡種之卡方檢定
卡方獨立性檢定
Chisquare 0.18487 DF 2 p-value 0.9117
由表格 25 可得知 p-value=0.9117 大於α=0.05,所以不拒絕 ,因此 性別與卡種相互獨立,表示兩變數不互相影響。
(二)年齡 V.S 卡種
年齡分成三大群,分別為0 至 45 歲、45 至 50 歲、50 歲以上。所以首先必 須將三群各別拆開,再利用單因子次數計算在三種信用卡的分別次數,如表格 26。
表 26 年齡與卡種之列聯表
普卡 白金卡 御璽卡 0 至 45 歲 1451 373 363 45 至 50 歲 1290 326 294 50 歲以上 589 154 152
表 27 年齡 V.S 卡種之卡方檢定
卡方獨立性檢定
Chisquare 1.6788 DF 4 p-value 0.7946
由表格 27 可得知 p-value=0.7946 大於α=0.05,所以不拒絕 ,因此 年齡與卡種相互獨立,表示兩變數不互相影響。
(三)卡種 V.S 地區
信用卡種類分別為普卡、白金與御璽卡,共三種。首先將三種卡種各別拆開,
再利用單因子次數計算在二十個地區的分別次數,如表格 28。
表 28 卡種與地區之列聯表
普卡 白金卡 御璽卡 普卡 白金卡 御璽卡 宜蘭 60 16 12 新竹市 35 8 11 花蓮 21 3 6 新竹縣 69 15 18 南投 55 10 22 嘉義縣 8 42 2 屏東 198 59 53 嘉義市 108 0 26 苗栗 79 19 24 彰化縣 248 69 73 桃園 196 59 50 台中 371 71 61 高雄 468 141 109 台北市 257 63 57 基隆 36 10 6 台東 11 6 5 雲林 135 40 47 台南 394 61 64 新北 564 159 160 澎湖 17 2 3
表 29 卡種 V.S 地區之卡方檢定
卡方獨立性檢定
Chisquare 239.83 DF 38 p-value < 2.2e-16
由表格 29 可得知 p-value< 2.2e-16 小於α=0.05,所以拒絕 ,因此 年齡與地區相互不獨立,表示兩變數會互相影響。