• 沒有找到結果。

立 政 治 大 學

Na tiona

l Ch engchi University

25

變數所組成的向量, 即代表第 p 個解釋變數的第 i 個觀測值。

令 表示當結果為”是”( =1)時的機率,則描述此機率的運算式稱之為邏輯斯 迴歸模型,其定義如下

, 運算後可得到 結果如下

第三節 分析方法

本研究使用資料採礦軟體-Clementine 12.0 為研究工具,研究流程則採以 SAS 電腦軟體股份有限公司的資料採礦建模流程-SEMMA 進行模型建立,SEMMA 流程圖如下圖 3-4:

圖 3-4 資料採礦建模流程圖 SEMMA 資料來源:http://timkienthuc.blogspot.tw

研究初期將先針對資料作敘述型統計,藉以了解資料的結構,各品牌之變數 分布情況。接著藉由個工具節點,如 Derive、Filter、Field reorder 等,將原始資

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

26

料依已設定之變數定義作轉換或衍生,以利後續研究之進行,本研究變數轉換之 過程如下圖 3-5 所示:

圖 3-5 資料轉換流程圖

建立模型前,為求分析的準確性,利用平衡節點(Balance node)針對反應變數

「欲購買該品牌手機」進行過取樣(Oversampling),調整樣本數中是與否的比例 為一比一,以提高模型之精準度。並以分割區節點(Partition node)將資料以 70:30 的比例區隔為「訓練分割區」與「測試分割區」,將訓練分割區中的資料用以作 模型之建立,再以測試分割區的資料驗證該模型的有效性。上述研究過程以 Clementine 執行如下圖 3-6:

圖 3-6 資料準備流程圖

資料準備完成後進行資料採礦模型建立,依序以決策樹、類神經網路、邏輯 斯迴歸等演算法為各品牌建立最適購買意願模型,其中決策樹又包含 CHAID 決

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

27

策樹、C&RT 決策樹、C5.0 決策樹,以及 QUEST 決策樹共四種,各模型建立完 成後,即可檢視不同模型所辨識出的變數重要性優先順序。最後,以錯誤判斷率 及增益曲線為評估依據,篩選出各品牌品牌力之最適購買意願模型,上述分析過 程可分別由圖 3-7 與圖 3-8 表示。而為達研究目的,依建模結果將於結論提出有 力且具體的參考決策。

圖 3-7 資料採礦模型建立

圖 3-8 最適模型篩選與評估

購買的品牌包含 Apple、HTC、Samsung,佔比依序為 29.3%、28.6%和 20.2%。

而在顧客忠誠度方面的表現,Apple 的顧客忠誠度最高,為 73.7%,HTC 次之,

為 51.4%,忠誠度最低的則為 Sony,為 29.5%。可看出五大品牌的顧客忠誠度比 例排名與消費者未來品牌購買意願排名相同。

經驗(specialty、used、own、most used、last purchase),並將加入人口統計變項以 提高模型的精準度。而模型之演算法將會採用決策樹、類神經網路、邏輯斯迴歸, 機」進行過取樣(oversampling),調整樣本數中是與否的比例為一比一。

(二) 模型建立

以「欲購買 Nokia 手機」為反應變數,透過決策樹(其中決策樹有 CHAID 決 策樹、C&RT 決策樹、C5.0 決策樹,以及 QUEST 決策樹共四種)、類神經網路、

邏輯斯迴歸建立 Nokia 品牌力之購買意願模型,將分述如下:

1. CHAID 決策樹

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

32

下圖 4-1 為 CHAID 決策樹為 Nokia 所分析的出的模型變數重要性圖。各變 數的重要性由高至低排列,依序為現在所使用(own)、覺得比較值得信賴(trust)、

家庭每月平均收入(income_household)、印象較佳(prefer)。對於是否欲購買 Nokia 手機的消費者來說,品牌力成為主要決定關鍵。雖然仍會將家庭每月平均收入納 入考量,但品牌經驗(own)、品牌信賴(trust)是首要的決定因子,並在考量家庭每 月平均收入後,消費者也會以對 Nokia 的品牌偏好(prefer)來決定購買與否。

圖 4-1 手機品牌 Nokia CHAID 決策樹模型變數重要性圖

為求模型的最低誤判率,以下圖 4-2 為 Nokia 的 CHAID 決策樹模型判斷矩 陣作為判別的指標。在 CHAID 決策樹模型中,Testing data 301 筆資料中正確判 斷是否將購買 Nokia 手機有 161 筆,錯誤判斷的筆數則為 140 筆,錯誤判斷率高 達 46.51%。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

33

圖 4-2 手機品牌 Nokia CHAID 決策樹模型判別矩陣圖

2. C&RT 決策樹

下圖 4-3 為 C&RT 決策樹為 Nokia 所分析的出的模型變數重要性圖。各變數 的重要性由高至低排列,依序為工作狀況(job)、年齡(age)、曾經使用過(used)、

家庭每月平均收入(income_household)、覺得比較值得信賴(trust)等等。以 C&RT 決策樹為模型,對於是否欲購買 Nokia 手機,主要端視消費者的工作狀況與年紀,

再者,品牌經驗(used)、家庭每月平均收入(income_household)以及品牌信賴(trust) 為次級重要的變數。

圖 4-3 手機品牌 Nokia C&RT 決策樹模型變數重要性圖

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

34

為求模型的最低誤判率,以下圖 4-4 為 Nokia 的 C&RT 決策樹模型判斷矩陣 作為判別的指標。在 C&RT 決策樹模型中,Testing data 301 筆資料中正確判斷是 否將購買 Nokia 手機有 207 筆,錯誤判斷的筆數則為 94 筆,錯誤判斷率為 31.23%。

圖 4-4 手機品牌 Nokia C&RT 決策樹模型判別矩陣圖

3. C5.0 決策樹

下圖 4-5 為 C5.0 決策樹為 Nokia 所分析的出的模型變數重要性圖。各變數的 重要性由高至低排列,依序為最常使用(most used)、覺得比較值得信賴(trust)、

最近一次購買(last purchase)、印象較佳(prefer)等等。以 C5.0 決策樹為模型,對 於是否欲購買 Nokia 手機,主要重要的決定關鍵皆為品牌力中的品牌經驗(most used、last purchase)、品牌信賴(trust)、品牌偏好(prefer)。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

35

圖 4-5 手機品牌 Nokia C5.0 決策樹模型變數重要性圖

為求模型的最低誤判率,以下圖 4-6 為 Nokia 的 C5.0 決策樹模型判斷矩陣作 為判別的指標。在 C5.0 決策樹模型中,Testing data 301 筆資料中正確判斷是否 將購買 Nokia 手機有 252 筆,錯誤判斷的筆數則為 49 筆,錯誤判斷率為 16.28%。

圖 4-6 手機品牌 Nokia C5.0 決策樹模型判別矩陣圖

4. QUEST 決策樹

下圖 4-7 為 QUEST 決策樹為 Nokia 所分析的出的模型變數重要性圖。各變 數的重要性由高至低排列,依序為覺得比較值得信賴(trust)、工作(job)、教育程

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

36

度(education)等等。以 QUEST 決策樹為模型,對於是否欲購買 Nokia 手機,主 要重要的決定關鍵皆為品牌力中的品牌信賴(trust),其次為消費者個人的工作狀 況及教育程度。

圖 4-7 手機品牌 Nokia QUEST 決策樹模型變數重要性圖

為求模型的最低誤判率,以下圖 4-8 為 Nokia 的 QUEST 決策樹模型判斷矩 陣作為判別的指標。在 QUEST 決策樹模型中,Testing data 301 筆資料中正確判 斷是否將購買 Nokia 手機有 171 筆,錯誤判斷的筆數則 130 筆,錯誤判斷率高達 43.19%。

圖 4-8 手機品牌 Nokia QUEST 決策樹模型判別矩陣圖

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

37

5. 類神經網路

下圖 4-9 為類神經網路為 Nokia 所分析的出的模型變數重要性圖。各變數的 重要性由高至低排列,依序為教育程度(education)、年齡(age)、地區(location)、

最近一次購買(last purchase)、工作(job)等等。以類神經網路為模型,對於是否欲 購買 Nokia 手機,主要的決定關鍵多為消費者自身條件,如教育程度、年齡、所 在地、工作狀況,而品牌力中的品牌經驗(last purchase)則為較次要的決定條件。

圖 4-9 手機品牌 Nokia 類神經網路模型變數重要性圖

為求模型的最低誤判率,以下圖 4-10 為 Nokia 的類神經網路模型判斷矩陣作 為判別的指標。在類神經網路模型中,Testing data 301 筆資料中正確判斷是否將 購買 Nokia 手機有 283 筆,錯誤判斷的筆數則 18 筆,錯誤判斷率為 5.98%。

圖 4-10 手機品牌 Nokia 類神經網路模型判別矩陣圖

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

38

6. 邏輯斯迴歸

下圖 4-11 為邏輯斯迴歸為 Nokia 所分析的出的模型變數重要性圖。各變數的 重要性由高至低排列,依序為最近一次購買(last purchase)、最常使用(most used)、

年齡(age)、覺得比較值得信賴(trust)、印象較佳(prefer)、家庭每月平均收入 (income_household)、教育程度(education)等等。以邏輯斯迴歸為模型,對於是否 欲購買 Nokia 手機,主要的決定關鍵為品牌經驗(last purchase、most used)、年齡 高低、品牌信賴(trust)、品牌偏好(prefer),消費者的家庭平均月收入也會有所影 響。

圖 4-11 手機品牌 Nokia 邏輯斯迴歸模型變數重要性圖

為求模型的最低誤判率,以下圖 4-12 為 Nokia 的邏輯斯迴歸模型判斷矩陣作為 判別的指標。在邏輯斯迴歸模型中,Testing data 301 筆資料中正確判斷是否將購

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

39

買 Nokia 手機有 291 筆,錯誤判斷的筆數則 10 筆,錯誤判斷率為 3.32%。

圖 4-12 手機品牌 Nokia 邏輯斯迴歸模型判別矩陣圖

(三) 模型評估與篩選

以增益曲線(Gain curve)圖綜合比較以上六大模型,越靠近 Best line 的曲線 代表該模型配適越佳。由下圖 4-13 中顯示邏輯斯迴歸模型(藍色線)在 testing data 不到 20%之處已可正確判斷 100%的結果,相較其他模型準確度高相當多,同時 錯誤判斷率也為所有模型中最低的,因此邏輯斯迴歸模型可視為手機品牌 Nokia 購買意願的最適模型。

圖 4-13 手機品牌 Nokia 購買意願模型增益曲線圖

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

40

從所選擇的邏輯斯迴歸模型可歸結出一個結果:Nokia 的品牌力是影響消費 者是否會購買該手機的關鍵因素。決定購買與否的主要關鍵為品牌經驗(last purchase、most used)、品牌信賴(trust)、品牌偏好(prefer),而消費者年紀高低與 家庭平均月收入也會有所影響。

二、 Samsung 品牌力之購買意願模型 (一) 資料轉換

為求分析的準確性,建立模型前的資料轉換將反應變數「欲購買 Samsung 手機」進行過取樣(oversampling),調整樣本數中是與否的比例為一比一。

(二) 模型建立

以「欲購買 Samsung 手機」為反應變數,透過決策樹(其中決策樹有 CHAID 決策樹、C&RT 決策樹、C5.0 決策樹,以及 QUEST 決策樹共四種)、類神經網 路、邏輯斯迴歸建立 Samsung 品牌力之購買意願模型,將分述如下:

1. CHAID 決策樹

下圖 4-14 為 CHAID 決策樹為 Samsung 所分析的出的模型變數重要性圖。各 變數的重要性由高至低排列,依序為覺得比較值得信賴(trust)、現在所使用(own) 等等。對於是否欲購買 Samsung 手機的消費者來說,品牌力成為主要決定關鍵。

尤其其中的品牌信賴(trust)是首要的決定因子,再者則為品牌經驗(own)。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

41

圖 4-14 手機品牌 Samsung CHAID 決策樹模型變數重要性圖

為求模型的最低誤判率,以下圖 4-15 為 Samsung 的 CHAID 決策樹模型判 斷矩陣作為判別的指標。在 CHAID 決策樹模型中,Testing data 301 筆資料中正 確判斷是否將購買 Samsung 手機有 238 筆,錯誤判斷的筆數則為 63 筆,錯誤判 斷率為 20.93%。

圖 4-15 手機品牌 Samsung CHAID 決策樹模型判別矩陣圖

2. C&RT 決策樹

下圖 4-16 為 C&RT 決策樹為 Samsung 所分析的出的模型變數重要性圖。各 變數的重要性由高至低排列,依序為覺得比較值得信賴(trust)、現在所使用(own)

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

42

等等。對於是否欲購買 Samsung 手機的消費者來說,品牌力成為主要決定關鍵。

尤其其中的品牌信賴(trust)是首要的決定因子,再者則為品牌經驗(own),而年齡 也可視為一次要的參考指標。

尤其其中的品牌信賴(trust)是首要的決定因子,再者則為品牌經驗(own),而年齡 也可視為一次要的參考指標。

相關文件