第四章 實例分析
4.5 例題八:休旅車潛在客戶開發個案
一家休旅車廠商為發掘潛在顧客[20],作了一個問卷調查,調查項目包括 31 項,問卷內容如下表 4-5。前 30 個問卷項目在了解顧客的態度,以 1 表完全不同 意, 9 表完全同意,最後一題則詢問顧客的購車意願。原始資料中有 400 筆記錄,
其中 200 筆做為訓練範例,200 筆做為測試範例。
表 4- 5 休旅車潛在顧客開發之輸入變數
輸入變數 值域
X1= 我是在非常好的生理情況 1~9
X2= 當我必須選擇在二者之間, 我穿戴為時尚, 不為舒適 1~9
X3= 我比大多數我的朋友有更加時髦的衣裳 1~9
X4= 我想要看起來有一點與其他人不同 1~9
X5= 生命太短以至於不能不採取一些賭博 1~9
X6= 我不關注臭氧層 1~9
X7= 我認為政府做太多對於控制汙染 1~9
X8= 基本上,現今社會是好的 1~9
X9= 我沒有時間為慈善做義工 1~9
X10=我們的家庭現今在債務不是太沉重 1~9
X11=我喜歡付現金對一切我買的 1~9
X12=我喜歡在今天花費而讓明天隨它去 1~9
X13=我使用信用卡因為我可以慢慢地支付票據 1~9
X14=當我購物時我很少使用優惠券 1~9
X15=利率是低到足以讓我買我想要的 1~9
X16=我比大多數我的朋友有更多自信 1~9
X17=我喜歡被認為是領導者 1~9
X18=其他人經常要求我幫助他們弄出果醬 1~9
X19=孩子是在婚姻中最重要的東西 1~9
X20=我寧可在家度過一個安靜的晚上比起出去宴會 1~9
X21=外國製造的汽車無法和美國製造的汽車相比 1~9
X22=政府應該限制來自日本的產品的進口 1~9
X23=美國人應該總是設法買美國產品 1~9
X24=我希望去全世界旅行 1~9
X25=我願我能離開現今的生活並做完全不同的事 1~9
X26=我通常是嘗試一項新產品的最早的人之一 1~9
X27=我喜歡努力工作和努力玩樂 1~9
X28=多疑的預言通常是錯誤的 1~9
X29=我能做任何我決心做的事 1~9
X30=從現在起五年我的收入比現在多很多 1~9
Y=我會考慮買 Land Rover 製造的「發現者」 1~9
首先利用部分因子實驗法做 30 因子 32 回合的實驗,並以懲罰係數、核心係 數等兩個參數為噪音因子,經建構 32 × 9 = 288 個模型,建構完畢後將模型的誤 差均方根填入表中。計算每列誤差均方根的平均值Y 後,利用Y 計算各實驗因子 的效果,得到圖 4-7 之結果。由圖可知,實驗因子 X
1、 X
2、 X 、
5X
24、 X
25、
X 、
28X 、
29X
30的效果為負,即代表它們對應的自變數為 X
1、 X
2、 X 、
5X
24、 X 、
25X 、
28X 、
29X
30如果出現在模型的輸入變數中時,誤差均方根分別可以降 低 0.155~0.776,所以是重要的自變數,其餘實驗因子的效果都接近 0 或大於 0,
即代表它們對應的自變數為如果出現在模型的輸入變數中時,誤差均方根無法降 低,所以是不重要的自變數。
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4
X1 X3 X5 X7 X9 X11 X13 X15 X17 X19 X21 X23 X25 X27 X29
實驗因子
因子效果
圖 4- 7 例題八(休旅車潛在客戶開發)的實驗因子效果直條圖
接下來使用上述找到的重要自變數 X
1、 X
2、 X 、
5X
24、 X 、
25X 、
28X
29、 X
30為輸入變數並利用網格法來尋找最佳參數設定。結果得到懲罰係數=10、核 心係數=0.001 時,可得到最佳誤差均方根 1.7363。
為了證明只用自變數 X
1、 X
2、 X 、
5X
24、 X
25、 X
28、 X
29、 X
30為輸入 變數,可得到最精簡、準確的模型,在此以全部三十個自變數為輸入變數,並利 用上述網格法來尋找最佳參數設定。結果得到懲罰係數=10、核心係數=0.001 時,
可得到最佳差均方根 1.7586。
由於題是實際題目,重要自變數並無定論。不過文獻[23]曾利用倒傳遞神經
網路的敏感性分析評估自變數的「重要性指標」如圖 4-8。比較圖 4-7 與圖 4-8
可知,這兩種截然不同的研究方法並無相似的結果,倒傳遞神經網路所找出的重
要變數為 X 、
5X
14、 X 、
15X
24、 X
29與支援向量機的重要變數 X
1、 X
2、 X 、
5X
24、 X
25、 X
28、 X
29、 X
30並不相似,但均得到 X 的重要性遠高於其它自變數的結
5論。
0.00 0.10 0.20 0.30 0.40
X1 X6 X11 X16 X21 X26
輸入變數
通用重要性指標