• 沒有找到結果。

應用類神經網路技術於顧客價值分析

N/A
N/A
Protected

Academic year: 2021

Share "應用類神經網路技術於顧客價值分析"

Copied!
8
0
0

加載中.... (立即查看全文)

全文

(1)應用類神經網路技術於顧客價值分析* Applying Neural Network to Customer Value Analysis 趙景明 東吳大學資訊科學系 chao@cis.scu.edu.tw. 楊清潭 東吳大學資訊科學系 nms8910@cis.scu.edu.tw 值,建立量化的顧客價值指標。 2. 應用類神經網路建立預測顧客價值變化 模型 應用資料探勘技術進行知識發掘的方法 中,類神經網路具有自動學習的能力。應用倒 傳遞類神經網路技術,將過去一段固定期間的 顧客交易資料做為輸入源,以目前期間的顧客 價值做為學習目標。經由學習所得的類神經網 路模型,做為未來顧客價值的預測。最後將實 際產業(健康檢查業)的顧客交易資料導入顧客 價值的計算及預測,並針對分析結果提出顧客 價值的區隔建議。. 摘要 企業依據顧客價值的高低,提供顧客不同 的服務及行銷策略,有助於吸引更多高價值的 顧客成為忠實顧客,進而使企業獲得最大的經 營效益。本研究改良傳統 RFM 分析模型,提 出以 RFM 屬性個別差異為權重,建立量化的 顧客價值指標。此外,本研究應用資料探勘中 的類神經網路技術,將過去期間的顧客交易資 料做為輸入源,以目前期間的顧客價值做為學 習目標,建立顧客價值的預測模型。最後將實 際產業的顧客交易資料導入顧客價值的計算 及預測,並針對分析結果提出顧客價值的區隔 建議。研究結果發現本研究所提出之方法可有 效識別及預測顧客的價值。 關鍵詞:顧客價值、資料探勘、類神經網路、 RFM 分析模型. 二、文獻探討 (一) 類神經網路(Neural Network) 人類的大腦持續地從外界輸入訊息並處 理產生適當的輸出反應,它有數十億個神經元 相互連接而產生複雜的神經網路。類神經網路 的組成可分為三個部份,包括最小單位的人工 神經元、由許多人工神經元組成的層及由許多 層組成的網路。相關研究請參考[1,2]。 ( 二 ) 倒 傳 遞 類 神 經 網 路 (Back-propagation Neural Network) 倒傳遞類神經網路屬於類神經網路中的 監督式學習網路,是目前類神經網路模式中最 具代表性、應用最廣的模型。類神經網路是多 階層向前連接式設計,每一個連接點需連接到 下一層。圖 1 是三層倒傳遞類神經網路架構 圖。. 一、簡介 近年來隨著消費市場型態的轉變,行銷方 式也有大幅改變,由原來以整體大眾為行銷對 象 , 逐 漸 朝 向 為 「 關係 行銷 」 (Relationship Marketing) 、 「 一 對 一 行 銷 」 (One-to-One Marketing)及「區隔行銷」(Segment Marketing)。在做顧客區隔策略時,必須先界定所謂 「顧客價值」(Customer Value)。研究顧客價值 的學者很多,主要區別為:一、顧客內心所在 乎的價值,又稱為顧客認知的價值[5,8,9]。二、 顧客對企業的貢獻價值[4]。 本研究之目的是建立通用於各行業的顧 客價值指標,以及應用類神經網路學習顧客價 值的變化以建立顧客價值的預測模型。研究目 的及方法說明如下: 1. 建立量化的顧客價值指標 目前實務界廣泛使用的 RFM 分析模型, 受到許多學者的研究及企業的採用。但因行業 別的差異,對「交易期間」、「交易頻率」及 「交易金額」有不同的重要性,且無法有效量 化 為 單 一 的顧 客 價 值指 標。 本 研 究 提出 以 RFM 屬性個別差異為權重值,將 RFM 屬性轉 換成三度空間向量,計算絕對距離做為顧客價. Wij. H1. Wjk. X1. Y1. T1. Y2. T2. Yk. Tk. H2 X2 HjXi Hj 輸入層. 隱藏層. 輸出層. 圖 1 三層倒傳遞類神經網路架構圖 *. 本研究接受國科會研究計劃(計劃編號 NSC 92-2213-E-031-006)之部分補助. 1.

(2) 其中 Xi 是第 i 個輸入層人工神經元的輸入變數。 Hj 是第 j 個隱藏層神經元的輸出變數。 Yk 是第 k 個輸出層神經元的輸出變數。 Tk 是第 k 個對應的目標輸出變數。 Wij 是輸入層至隱藏層間連結的權重變數。 Wjk 是隱藏層至輸出層間連結的權重變數。 倒傳遞類神經網路的學習過程說明如下: 1. 選出具代表性的學習資料,將資料轉成輸 入向量(一般為 0~1 或-1~+1)做為網路的 輸入變數(X)。 2. 經隱藏層與輸出層的計算,得到網路的輸 出變數(Y)。 3. 比較學習資料的目標輸出值(T)與網路之 計算輸出值(Y),求出誤差值。 4. 根據誤差值重新調整網路層間的權重值 (Wij•Wjk)。 5. 重覆步驟 1 至 4,直到網路的誤差值低於 一個可以容忍的範圍或達到最大重複次 數,即表示網路訓練完成。 (三) 顧客價值(Customer Value) 1. 顧客認知價值 消費者購買商品或服務時心中自有衡量 標準,皆期待能夠「物超所值」,也就是所獲 得的價值大於所付出的價值。而這所謂「價 值」,Zeithaml [10]認為價值是顧客對於付出 與獲得的知覺態度,這種主觀態度影響消費者 對於商品的整體評價。 顧客認知的價值是非常主觀意識的看 法,在某人感受是有價值的,但另一個人的感 受則未必如此。因此有學者提出顧客價值測量 模型,例如,Keeney [5]提出價值焦點思考 (Value-Focused Thinking)、Woodruff [9]提出顧 客 價 值 階 層 模 型 (Customer Value Hierarchy Model)及 Parasuraman [8]提出顧客價值觀測架 構。 2. 顧客貢獻價值 Mulhern [7]提出企業為了提供產品或服 務顧客,針對個人、家庭或其他企業所產生的 成本與從顧客所獲得的利益相較,利益超出成 本的部份,即為顧客獲利性,也就是以顧客對 公司的貢獻狀況評量顧客價值。最為業界普遍 使用的 RFM 分析模型,依據 Hughes [4]研究 中描述, RFM 分析模型在直效行銷(Direct Marketing)領域中已使用超過 30 年,但由於電 腦科技的進步及資料庫系統的成熟應用,才使 RFM 分析模型自 1990 年以來廣泛被使用。 RFM 分析模型是利用顧客過去的歷史交易記 錄,包括最近一次的購買日期(Recency)、一段 期間內的購買頻率(Frequency)及一段期間內 的購買金額(Monetary)來進行顧客價值的衡 量。 RFM 分析模型具有可適用於各個行業的. 特性,且計算邏輯簡單,許多行銷人員在不需 專屬資訊系統輔助下也可進行顧客分析。但 RFM 分析模型存在二項問題:一是個別 RFM 屬性針對不同產業有不同的重要性。例如某些 產業對 R 屬性有很好的區隔能力,但其他產業 可能對 FM 屬性有較佳的區隔能力,而 RFM 分析模型無法針對 RFM 屬性重要性的不同, 整合成單一的區隔指標。二是 RFM 分析模型 不具有預測能力,僅就顧客過去的歷史交易資 料區隔顧客。. 三、研究方法 關於資料探勘流程多位學者已提出各種 版本,例如[3,6],其內容大同小異各有其特 點。本研究歸納整合及加入顧客價值計算後的 研究流程如圖 2 所示。資料前置處理是資料探 勘中非常重要的步驟,前置處理直接影響後續 資料探勘是否能夠得到預期的結果。圖 3 是完 整資料前置處理流程圖。. 收集顧客 歷史交易資料. 資料前置處理. 顧客價值指標. 訓練 類神經網路. 收斂良好? 學習效果?. 否. 修改類神經 網路參數. 是 滙入全部資料. 分析結果. 圖 2 研究流程圖 (一) 收集顧客歷史交易資料 資料收集是資料探勘的首要工作,足夠、 正確的資料內容及品質才能確保後續的研究 得到預期的效果。以下針對健康檢查業的資料 內容加以說明: 1. 營業內容:包括個人身體健康檢查及其 他醫療單位(診所或檢驗所)轉送代檢的 血液檢查。 2.

(3) 營業對象:個人身體健康檢查約佔 50% 營業比重,團體簽約體檢(如學校新生入 學體檢、公司行號員工體檢)約佔 40%營 業比重,其他醫療單位轉送代檢的血液 檢查約佔 10%營業比重。 3. 資料收集範圍:收集最近六年的個人顧 客歷史檢查記錄。以 1997 年至 1999 年 為類神經網路輸入來源資料,以 2000 年 至 2002 年為訓練的目標資料。同時為避 免團體公司行號資料影響個人健康檢查 的消費特性,因此只分析個人健康檢查 部份。 (二) 資料前置處理 資料前置處理主要包括「區隔期間資 料」、「統計 RFM 資料」及「計算 RFM 百 分位數」等步驟,如圖 3 所示。 2.. 順序. 體檢日期. 金額. 1. 1999/05/01. 5000. 2. 2000/02/01. 3000. 3. 2000/12/15. 7000. 最近購買日期(R):2000/12/15,相距 2000/12/31 天數為 16 日 2000/12/31-2000/12/15=16(日) 購買頻率(F):3(次) 購買金額(M):5000+3000+7000=15000(元) 分別就個別期間內的交易資料統計 RFM 資 料。 3. 計算 RFM 的百分位數(Percentile Rank, PR) 傳統的 RFM 模型將顧客 RFM 的屬性標 示為 1~5 的數字,數字愈大代表價值愈高。這 樣清楚的界線區隔顧客等級可能會產生二個 顧客 RFM 屬性非常接近只是前後排列的順序 差異,造成不同的顧客價值等級差距。為解決 以上明顯界線造成誤差問題,本研究改採以百 分位數的表示法,將個別 RFM 屬性的數值排 序,以 0~1 之間的數值表示。舉例說明,某顧 客 A 的 R 屬性的 PR 為 0.2、F 屬性的 PR 為 0.8、M 屬性的 PR 為 0.7,則以 A(0.2, 0.8, 0.7) 代表該顧客 A 的顧客價值向量,如圖 4 所示。 (三) RFM 屬性與消費金額變異數分析 本研究以顧客貢獻價值為顧客價值的分 析基礎,因此對於 RFM 屬性針對消費金額進 行交互作用之多因子變異數分析及 V(顧客價 值指標)針對消費金額進行單因子變異數分 析,以確定是否與消費金額有明顯差異。最後 將有明顯差異的屬性做為類神經網路的輸入 源,訓練類神經網路模型。 (四) 顧客價值指標 傳統 RFM 分析模型依據 Hughes [4]的研 究,應用的行業別不同對 RFM 屬性反應的顧 客消費程度有不同的影響。直效行銷行業中, R 的效果最好,F 其次,而 M 最差。但不是所 有行業 RFM 的重要性都是 R>F>M。因此本研 究提出以獲利性(顧客消費金額)為評量重點, 同時加入個別差異的標準差做為權重值,將 RFM 屬性當成三度空間向量,再計算至原點 的歐幾里德距離(Euclidian Distance)成為顧客 價值,距離越長表示顧客價值越高。這顧客價 值是相對的,所以最後再轉換為百分位數,成 為顧客價值指標(Customer Value Index),顧客 價值指標越接近“1”表示顧客價值越高,反之 越接近“0”表示顧客價值越低。圖 4 為顧客價 值指標概念圖。. 顧客歷史交易資料. 資料整合轉換 過濾. 區隔期間資料. 消費金額 變異數分析. 統計 RFM 資料. 計算 RFM 百分位數. 顧客價值指標. 圖 3 資料前置處理流程圖 區隔期間資料 健康檢查業的區隔期間設定為三年,是因 為依健保局提供免費成人健診規定「40 歲至 64 歲每三年可檢查一次,65 歲以上每年皆可 檢查」,因此設定區隔期間為三年。有些顧客 每年至少做一次綜合性身體檢查,有些則數年 才一次。設定期間為三年相信大部份的顧客至 少已做一次身體檢查。 2. 統計 RFM 資料 將過去期間及目前期間的交易資料分別 計算 RFM 數值。例如,某健康檢查顧客在過 去期間有三次體檢明細如下:. 1.. 3.

(4) F 1 0.8 A(0.2,0.8,0.7). V 0. 0.7. 0.2. R. 1. M. 1 圖 4 顧客價值指標概念 歐幾里德距離:. V=√(WrR)2+(WfF)2+(WmM)2 Wr:R 屬性的標準差 Wf:F 屬性的標準差 Wm:M 屬性的標準差 V:顧客價值 (五) 訓練類神經網路 1. 倒傳遞類神經網路運算邏輯 倒傳遞類神經網路由輸入資料經過網路 計算得到計算輸出值,將計算值與目標值比較 不斷修改人工神經元權重值參數,直到獲得滿 意數值或達到最大循環次數為止,詳細運算邏 輯如下: (1) 假設輸入資料向量陣列 X(P,1)=(Xp,1,Xp,2,Xp,3,…,Xp,i) P:資料的順序號。 i:輸入點的號碼。 (2) 每一個隱藏層或輸出層都由上一層接收 完全相似的向量 X。每一個神經單元依下 列公式計算: Y(P,L,J)=X(P,L-1)*W(J,L)+B(J,L) Y(P,L,J):計算 P 資料在 L 層 J 神經元的結果 X(P,L-1):L-1 層的輸入資料 W(J,L):L 層 J 神經元外部的權重值(weight) B(J,L):L 層 J 神經元的門檻值 (3) Y(P,L,J)的結果再經過轉換函數(Transfer Function)的運算做為下一層神經元的輸 入,本研究以最常使用的 S 型(Sigmoid Function)為轉換函數。 (4) 經過轉換函數後的結果做為一下層神經 元的輸入。 X(P,L)=(f(Y(P,L,1),f(Y(P,L,2),….,f(Y(P,L,K))) K:L 層中所有的神經元數量。 (5) 最後的輸出向量結果為 X(P,O)。 (6) 接著計算與學習目標向量 T(P)的誤差值。 E(P,O)=(T(P)-X(P,O))*X’(P,O) X’(P,O)= (f’(Y(P,O,1),f’(Y(P,O,2),…,f’(Y(P,O,K))) f’是轉換函數 f 的導函數(Derivative) 針對 L 層 J 神經元的誤差向量計算公式如下: E(P,L,J)=. X’(P,L,J)*SUMK(E(P,L+1,K)*W(K,L+1,J)) K:在 L-1 層的第 K 個神經元 (7) 依據上一步驟所得到的誤差向量,修改權 重值。 W(J,L)T+1= W(J,L)T+(eta)*SUMP(E(P,L,J)*X(P,L-1))+ (alpha)*(W(J,L)T-W(J,L)T-1) eta:學習率(Learning Rate) alpha:動量因子(Momentum Factor) T:重複循環(Iteration Cycle) (8) 將所有輸入向量,透過類神經網路並調整 權重值,重複所設定次數使誤差向量縮到 最小。 (9) 均 方 根 誤 差 (Root Mean Square Error, RMSE)是計算自訓練輸出值與目標值之 間的誤差程度,數值越小表示模式的預測 成效越佳。 RMSE=SQRT(SUMP,K((T(P,K)-X(P,O,K))^2)/ (PT*KT)) P:第 P 個輸入資料 K:第 K 個輸出點(node) PT:所有 P 的總數量 KT:所有 K 的總數量 重複執行步驟 1 至 9 重複計算 RMSE,並調整 權重值,直到達到設定的訓練次數。 2. 學習效果評估 倒傳遞類神經網路學習效果的評估,可以 從 RMSE 的數值變化,監控學習曲線收斂 (Convergence)的情況。而學習率(Learning Rate) 的大小直接影響收斂的速度及收斂的品質。同 時過多的隱藏層及人工神經元數量也會影響 學習的結果,以下針對不良學習結果加以說 明: (1) 無法有效收斂 無法有效收斂的原因有下列三種情況: • 類神經網路過於複雜:過多的隱藏 層或過多的人工神經元數量,使 RMSE 無法下降到預期範圍。 • 學習率數值太小:太小的學習率影 響每次循環修改的權重值變量,在 設定的最大學習循環次數內無法達 到收斂效果。. 圖5. 4. 200 次以上有效收斂圖.

(5) 礎,因此針對 RFM 屬性,首要步驟是統計 RFM 屬性的分佈情況及檢定 RFM 屬性與顧客消費 金額是否存在顯著性影響。然後計算 RFM 屬 性個別標準差做為權重值,計算顧客價值指 標。接著將顧客歷史交易資料隨機取樣 10%~30% 為 訓 練 資 料 及 5%~10% 為 測 試 資 料,做為訓練類神經網路之用。最後將所有資 料輸入類神經網路評估模型的正確率。 本研究之實驗對象為國內知名專業健康 檢查機構,應用之開發工具包括系統開發語言 Microsoft Visual Basic 6.0 、 資 料 庫 系 統 Microsoft SQL Server 2000、類神經網路開發工 具 Vesta Qnet V2000 及統計分析系統 SPSS 10.0.7C。 (一) 健康檢查業資料內容 健康檢查業顧客歷史交易資料中過去期 間 的 顧 客 數 量 為 17034 人 , 交 易 總 金 額 139,317,932 元。目前期間顧客數為 18317 人, 交易總金額 194,252,270 元。過去期間及目前 期間同時有消費的顧客 2919 人,占目前期間 的 15.94%,交易總金額為 40,688,620 元,占 目前期間交易總金額的 20.95%。 健康檢查業顧客類別屬於個人顧客,所以 顧客數量大,因此訓練資料取 20%的數量,測 試資料取 5%的數量,做為訓練類神經網路的 資料。輸入屬性共有 4 個,為過去期間的 R,F,M 及 V,而學習目標值為目前期間的顧客價值指 標。 (二) RFM 屬性與消費金額的分佈 由表 1 可得知過去期間(1997~1999)顧客 歷史交易資料中,M 的標準差(9.91)大於 F 的 標準差(4.53)大於 R 的標準差(2.51),因此健康 檢 查 業 過 去 期 間 的 RFM 屬 性 的 重 要 性 M>F>R。 表 1 健康檢查業 RFM 分佈表(過去期間). •. 學習循環次數太小:最大學習循環 次數太小,造成未達有效收斂時已 到學習循環次數。當類神經網路無 法有效收斂,解決方法是「降低類 神經網路複雜度」、「加大學習率 數值」及「提高最大學習循環次 數」。如圖 5 所示,學習次數在 200 以上才得到良好收斂。 (2) 產生波動(Fluctuate) RMSE 發生波動的原因有下列二種: • 學習率數值太大:太大的學習率數 值,使每次修改的權重值過大而造 成 RMSE 忽大忽小無法成為平滑曲 線。 • 學習循環次數過多:過多的學習循 環次數,使學習系統在降低訓練資 料的 RMSE 數值時卻發生不穩定現 象。 當類神經網路產生波動,解決方法是「減 小學習率數值」及「降低學習循環次數」。如 圖 6 所示,學習次數在 1500 以上產生波動的 情況。. 圖 6 產生波動圖 (3) 過度訓練 過度訓練是由於學習循環次數設定過 大 , 造 成 類神 經 網 路持 續降 低 訓 練 資料 的 RMSE,但測試資料的 RMSE 不降反增。這表 示 類 神 經 網路 對 訓 練資 料有 很 好 的 學習 效 果,但測試資料卻效果不佳。這不是我們所樂 於見到的,因為將來的真實資料也會產生效果 不佳的情況。如圖 7 所示,學習次數在 5500 以上,RMSE 不降反增。. >0.0~<=0.1 >0.1~<=0.2 >0.2~<=0.3 >0.3~<=0.4 >0.4~<=0.5 >0.5~<=0.6 >0.6~<=0.7 >0.7~<=0.9 >0.8~<=0.9 >0.9~<=1.0 標準差 (百分比). R 消費金額 10863522 11107830 10679570 9875320 11457400 15482270 19250960 17008950 15420830 18153140 2.51. 比率 7.8 8.0 7.7 7.1 8.2 11.1 13.8 12.2 11.1 13.0. F 消費金額 10365440 10562950 17165230 9948310 8159140 9563240 10243410 14917830 20280890 28076182 4.53. 比率 7.4 7.6 12.3 7.1 5.9 6.9 7.4 10.7 14.6 20.2. M 消費金額 503150 1788000 3097170 4063340 7050462 12316610 117356100 22766980 26990770 43305000. 比率 0.4 1.3 2.2 2.9 5.1 8.8 12.5 16.3 19.4 31.1. 9.91. 由表 2 可得知目前期間(2000~2002)顧客 歷史交易資料中,M 的標準差(8.18)大於 F 的 標準差(3.51)大於 R 的標準差(2.30),健康檢查 業目前期間的 RFM 屬性的重要性 M>F>R,同 時可以發現「過去期間」與「目前期間」RFM 屬性沒有很大的改變。. 圖 7 過度訓練圖 四、實驗建置及結果分析 本研究以顧客貢獻度為顧客價值衡量基 5.

(6) 表 2 健康檢查業 RFM 分佈表(目前期間) >0.0~<=0.1 >0.1~<=0.2 >0.2~<=0.3 >0.3~<=0.4 >0.4~<=0.5 >0.5~<=0.6 >0.6~<=0.7 >0.7~<=0.9 >0.8~<=0.9 >0.9~<=1.0 標準差. R 消費金額 18720010 17149610 12300510 19665180 23153520 17269840 25356130 26853450 16562870 17213100 2.30. 比率 9.6 8.8 6.3 10.1 11.9 8.9 13.1 13.8 8.5 8.9. F 消費金額 10106550 19326920 14632560 20701560 11177390 19766750 17369730 26389220 22028600 32748150 3.51. 比率 5.2 9.9 7.5 10.7 5.8 10.2 8.9 13.6 11.3 16.9. M 消費金額 1064060 3033170 5061890 9510920 16737000 23619560 25106920 26424360 30481450 53115340 8.18. (三) RFM 屬性對消費金額變異數分析結果 對於 RFM 屬性進行變異數分析,以確定 是否與消費金額有明顯影響。採用有交互影響 之多因子變異數分析,檢定最近購買時間、購 買次數及購買金額的強度愈高是否對消費金 額貢獻愈大有顯著性影響。 由表3及表4結果顯示,無論過去期間及目 前期間,p值小於α值=0.05、R值、F值、M值 三因子交互效果檢定顯著,因此可說明隨著最 近購買時間、購買次數及購買金額的強度愈高 對消費金額貢獻愈大有顯著性影響。. 比率 0.5 1.6 2.6 4.9 8.6 12.2 12.9 13.6 15.7 27.3. 表 3 RFM(過去期間)多因子變異數分析檢定 目前期 間健診 交易資 料. 來源 校正後的模式 截距 R值 * F值 * M值 誤差 總和 校正後的總數. 平方和. 自由度. 1.328E+12 2.910E+11 1.328E+12 1.203E+11 3.508E+12 1.448E+12. 548 1 548 17768 18317 18316. 平均平方和 2422653418 2.910E+11 2422653418 6770699.160. F 檢定 357.814 42981.805 357.814. p值. F 檢定 361.919 34871.523 361.919. p值. .000 .000 .000. 表 4 RFM(目前期間)多因子變異數分析檢定 過去期 間健診 交易資 料. 來源 校正後的模式 截距 R值 * F值 * M值 誤差 總和 校正後的總數. 平方和. 自由度. 1.068E+12 1.909E+11 1.068E+12 9.029E+10 2.298E+12 1.158E+12. 539 1 539 16494 17034 17033. (四) 顧客價值指標與消費金額的分佈 經過以標準差為權重值,將 RFM 屬性轉 換為三度空間向量,計算所得到的顧客價值指 標與消費金額分佈如表 5 所示。其中可得知在 過去期間顧客價值最高的 20%的顧客,交易金 額佔總金額的 50.4%;而目前期間顧客價值最 高 的 20% 的 顧 客 , 交 易 金 額 佔 總 金 額 的 43.3%。健康檢查業體檢價格以人為單位,每 位顧客除非增加消費次數否則消費金額差異 性不大,但身體健康檢查不是需要常常做,通 常是 1~3 年做一次。所以顧客價值最高的 20% 顧客,只佔約一半的總消費金額。 分別針對過去期間及目前期間的顧客價 值指標與消費金額進行變異數分析,以確定是 否與消費金額有明顯影響。採用單因子變異數 分析,檢定顧客價值指標的強度愈高是否對消 費金額貢獻愈大有顯著性影響。由表 6 及表 7 表6 V值 0->0.1 0.1->0.2 0.2->0.3 0.3->0.4 0.4->0.5 0.5->0.6 0.6->0.7 0.7->0.8 0.8->0.9 0.9->1.0 總和. 總和 785920 2028020 2886000 4094890 7599260 12031942 17468620 22110510 27512360 42800410 139317932. 平均平方和 1981148054 1.909E+11 1981148054 5474008.464. .000 .000 .000. 結果顯示,p 值為 0 小於 α 值=0.05,故可以 說明顧客價值指標的強度愈高對消費金額貢 獻愈大。 表 5 顧客價值指標與消費金額的分佈表 V(過去期間) V(目前期間) 消費金額 比 消費金額 比 率 率 >0.0~<=0.1 785920 0.6 1408230 0.7 >0.1~<=0.2 2028020 1.5 3079360 1.6 >0.2~<=0.3 2886000 2.1 5305020 2.7 >0.3~<=0.4 4094890 2.9 10896850 5.6 >0.4~<=0.5 7599260 5.5 16050540 8.3 >0.5~<=0.6 12031942 8.6 21878600 11.3 >0.6~<=0.7 17468620 12.5 24856260 12.8 >0.7~<=0.9 22110510 15.9 26697860 13.7 >0.8~<=0.9 27512360 19.7 31444090 16.2 >0.9~<=1.0 42744730 30.7 52590780 27.1. V(過去期間)單因子變異數分析檢定. 總和的百分比 .6% 1.5% 2.1% 2.9% 5.5% 8.6% 12.5% 15.9% 19.7% 30.7% 100.0%. 過去期間健診交易資料 平均數 標準差 461.49 340.44 1190.85 572.59 1693.66 497.74 2404.52 767.31 4462.28 1467.28 7061.00 1811.83 10257.56 2009.74 12975.65 1215.31 16155.23 1923.28 25117.61 9337.65 8178.81 8245.80. 6. 變異數 115901.534 327858.675 247743.951 588770.843 2152923.7 3282745.3 4039048.7 1476969.5 3699005.7 87191686 67993137. 個數 1703 1703 1704 1703 1703 1704 1703 1704 1703 1704 17034.

(7) ANOVA 摘要表 V值 組間 組內 總和. 平方和 9.825E+11 1.756E+11 1.158E+12 表7. V值 0->0.1 0.1->0.2 0.2->0.3 0.3->0.4 0.4->0.5 0.5->0.6 0.6->0.7 0.7->0.8 0.8->0.9 0.9->1.0 總和. 總和 1408230 3079360 5305020 10896850 16050540 21878600 24856260 26697860 31444090 52635460 194252270. 自由度 9 17024 17033. 平均平方和 1.092E+11 10315258.2. F檢定 10583.245. p值 .000. V(目前期間)單因子變異數分析檢定 目前期間健診交易資料 平均數 標準差 769.10 540.92 1680.87 694.58 2895.75 1322.04 5951.31 2666.21 8761.21 3491.29 11942.47 2060.73 13575.24 969.80 14573.07 401.30 17163.80 2229.68 28731.15 9977.33 10605.03 8891.12. 總和的百分比 .7% 1.6% 2.7% 5.6% 8.3% 11.3% 12.8% 13.7% 16.2% 27.1% 100.0%. 變異數 292599.744 482445.660 1747801.4 7108682.3 12189138 4246625.7 940514.028 161044.653 4971456.9 99547123 79051969. 個數 1831 1832 1832 1831 1832 1832 1831 1832 1832 1832 18317. ANOVA 摘要表 V值 組間 組內 總和. 平方和 1.207E+12 2.411E+11 1.448E+12. 自由度 9 18307 18316. 平均平方和 1.341E+11 13170445.5. F檢定 10181.082. p值 .000. (五) 類神經網路學習結果 練結果,其中在隱藏層數量為 2、人工神經元 類神經網路相關參數設定,隱藏層分別由 數量為 18、學習率為 0.006 時有最低的 RMSE 1 至 3 層,人工神經元數量由 8 至 24 個,學 值及最佳的關聯係數。在部份學習率加大時產 習率分別由 0.002 至 0.01,以 0.002 為間隔。 生 過 度 訓 練或 波 動 的現 象, 雖 然 有 更低 的 訓練停止設定 RMSE 值小於或等於 0.01,最 RMSE 值,還是捨棄不列入考慮。限於篇幅表 多訓練次數為 10000 次。 8 僅列隱藏層 2 至 3 層、人工神經元數量 15 表 8 為不同網路結構及不同學習率的訓 至 24 個的學習結果。 表 8 類神經網路學習結果 神經元數 Training Testing Training Cor學習率 隱藏層 Remark RMSE RMSE relatiol 量 0.002 0.265997 0.247656 0.564 0.004 0.255186 0.250006 0.610282 0.006 0.247834 0.256267 0.63899 4500 以上過度訓練 10,5 0.008 0.247675 0.261548 0.639424 5500 以上過度訓練 0.01 0.246485 0.267493 0.646526 2200 以上過度訓練 2 0.002 0.267036 0.24796 0.559254 0.004 0.257263 0.244945 0.60193 0.006 0.250677 0.250309 0.628172 ※ 12,6 0.008 0.247181 0.258711 0.641405 6000 以上過度訓練 0.01 0.245512 0.26373 0.647394 3000 以上過度訓練 0.002 0.266992 0.248489 0.559468 0.004 0.258904 0.250041 0.594956 0.006 0.257223 0.254549 0.601945 10,6,4 0.008 0.253457 0.25684 0.617179 7000 以上過度訓練 0.01 0.250335 0.254098 0.629394 5500 以上過度訓練 3 0.002 0.266391 0.248091 0.562209 0.004 0.26277 0.246288 0.57839 7000 以上過度訓練 0.006 0.254163 0.24924 0.614368 12,8,4 0.008 0.253939 0.252474 0.615294 5500 以上過度訓練 0.01 0.252426 0.256719 0.621283 4000 以上過度訓練 7.

(8) 表 9 是依據類神經網路參數隱藏層數量 為 2、人工神經元數量為 18、學習率為 0.006 時,輸入過去期間全部資料,將運算所得輸出 值比對目標值。誤差在 0.05 範圍內正確率為 54.33%,誤差在 0.1 範圍內正確率為 76.91%。 表 9 類神經網路測試結果 誤差範圍. ±0.05. ±0.1. 正確率. 54.33%. 76.91%. 不顯著。而模糊理論可處理數值型及類別型資 料型態的優點,將可提高學習及預測的準確 率。以下為未來我們幾個研究方向: 1. 研究顧客心理認知層面,對產品屬性、 目的及使用結果的滿意度,增加可能影 響消費金額的屬性。 2. 利用模糊理論可處理數值型及類別型資 料型態的優點,與類神經網路結合,提 高學習及預測的準確率。 六、參考文獻 [1] C. H. Chu and D. Widjaja, “Neural Network System for Forecasting Method Selection,” Decision Support System, vol. 12, pp. 13-24, 1994. [2] M. W. Craven and J.W. Shavlik, “Using Neural Networks for Data Mining,” Future Generation Computer System, vol. 13, pp. 221-229, 1997. [3] U. Fayyad, “Data Mining and Knowledge Discovery in Databases,” Communications of the ACM, vol. 39, no. 11, pp. 22-25, 1996. [4] A. M. Hughes, “Boosting response with RFM,” Marketing Tools, vol. 5, pp. 4-10, 1996. [5] A. R. L. Keeney, Value-Focused Thinking, London: Harvard University Press, 1992. [6] C. Kleissner, “Data Mining for the Enterprise,” in Proceedings of the 31st Annual Hawaii International Conference On System Sciences, pp. 295-304, July 1998. [7] F. J. Mulhern, “Customer Profitability Analysis: Measurement, Concentration, and Research Directions,” Journal of Interactive Marketing, vol. 13, pp. 25-40, 1999. [8] A. Parasuraman, “Reflections on Gaining Competitive Advantage Through Customer Value,” Journal of the Academy of Marketing Science, pp. 154-161, February 1997. [9] R. B. Woodruff, “Customer Value: The Next Source for Competitive Advantage,” Journal of The Academy of Marketing Science, vol. 25, pp. 139-153, 1997. [10] V. A. Zeithaml, “Consumer Perceptions of Price, Quality, and Value: A Means-End Model and Synthesis of Evidence,” Journal of Marketing, vol. 52, pp. 2-22, 1988.. 由以上顧客價值分析得知,過去期間的顧 客價值指標大於 0.6 以上的顧客佔消費總額的 78.8%,目前期間的顧客價值指標大於 0.6 以 上的顧客佔消費總額的 69.8%。因此建議健康 檢查業將舊顧客維繫資源,著重在顧客價值指 標大於 0.6 以上的顧客。而其餘顧客價值指標 0.3~0.6 之間的顧客投入一般的維繫資源,最 後顧客價值指標 0.0~0.3 之間的顧客可考慮列 為放棄顧客,以降低顧客維繫支出。. 五、結論及未來研究 (一) 結論 依據顧客價值的高低,提供顧客不同的服 務及行銷策略,在企業界已行之多年。如何識 別 出 有 價 值的 顧 客 及預 測未 來 高 價 值的 顧 客,是所有企業希望獲得的資訊。 本研究從顧客對公司的貢獻價值,提出以 RFM 分析模型為基礎。首先以變異性分析檢 定 RFM 屬性與消費總金額是否呈現顯著差 異。然後增加以 RFM 屬性個別標準差為權重 值,將 RFM 屬性轉換成三度空間向量,計算 絕對距離做為顧客價值。接著應用類神經網路 技術,將過去期間的顧客交易資料做為輸入 源,以目前期間的顧客價值為學習目標。調整 類神經網路模型的相關參數,監控學習過程曲 線,達到最佳的模型。應用所學習的類神經網 路模型,做為未來顧客價值的預測。最後以實 際產業的顧客交易資料,導入顧客價值指標的 計算及顧客價值的預測,並針對分析結果提出 顧客價值的區隔建議。 (二) 未來研究 影響顧客重複購買的因素很多,包括產品 屬性、目的及使用結果,都會是影響因素。另 外,屬於顧客個人屬性的尚有居住地、年齡、 性別等,本研究經 ANOVA 檢定與消費總金額. 8.

(9)

參考文獻

相關文件

“ Consumer choice behavior in online and traditional supermarkets: the effects of brand name, price, and other search attributes”, International Journal of Research in Marketing,

In this study, the impact of corporate social responsibility to corporate image, service quality, perceived value, customer satisfaction and customer loyalty was explored

Marar (2000), “On the Value of Optimal Myopic Solutions for Dynamic Routing and Scheduling Problems in The Presence of User Noncompliance,” Transportation Science, Vol..

(1982), “An Investigation into the Determinants of Customer Satisfaction,” Journal of Marketing Research, Vol. 1996), “Relationship Marketing in Consumer Markets,” Journal

(1999), “Relationship Marketing and Data Quality Management," SAM Advanced Management Journal, Vol. (2004), “The Role of Multichannel Integration in Customer

(2000), “Assessing the Effects of Quality, Value, and Customer Satisfaction on Consumer Behavioral Intentions in Service Environments,” Journal of Retailing, Vol. (2001),

Through literatures relevant to service quality, service value, customer satisfaction and customer loyalty, this research conducts study on the five aspects of the theme

A model of service quality perceptions and health care consumer behavior. Measurement and evaluation of satisfaction processes in