重複購買之銷售預測─以台灣線上光碟銷售網站為例
59
0
0
全文
(2) 重複購買之銷售預測─以台灣線上光碟銷售網站為例 Repeat Sales Forecasting for CD online Shopping in Taiwan 研 究 生:吳全益 指導教授:唐瓔璋. Student:Chuan-Yi Wu Advisor:Dr. Edwin Tang. 博士. 國 立 交 通 大 學 管理學院碩士在職專班經營管理組 碩 士 論 文. A Thesis Submitted to The Master Program of Business and Management College of Management National Chiao Tung University in partial Fulfillment of the Requirements for the Degree of Master of Business Administration December 2007 Taipei, Taiwan, Republic of China. 中華民國九十六年十二月.
(3) 重複購買之銷售預測─以台灣線上光碟銷售網站為例. 研究生:吳全益. 指導教授:唐瓔璋 博士. 國立交通大學管理學院碩士在職專班經營管理組 摘 要 近年來由於電子商務蓬勃發展,尤其是企業對消費者(B2C)市場更是競爭 激烈,企業為了獲取更多的利益,無不想要擁有更多的客戶。然而因為網 路世界的便利、隨時及無地域性的特性,使得消費者在取得資訊及進行交 易的成本降低,消費者對於企業的忠誠度也大幅下降,電子商務企業的客 戶流失率升高,客戶的消費行為越來越難以掌握及預測。然而企業的資源 有限,無法對所有客戶投入行銷資源,因此顧客關係管理(Customer Relationship management)成為企業管理的主要課題,而其中最重要的關 鍵如何能夠預測這些客戶的消費行為。 近年來行銷研究領域中一個熱門的議題就是如何利用已知的顧客購買行為 (如一定期間內,顧客的購買次數、購買金額、最近一次購買日)等資訊, 應用科學方法來掌握顧客購買行為的變化,運用不同的機率模型來直接算 出每個客戶的活躍度及交易次數,而且這些模型是動態的,可以隨著時間 及客戶消費行為變化直接反映在預測指標上。本研究採用 Bruice 與 Hardie 兩位學者針對美國線上光碟片銷售網站 CDNOW 提出的 BG/NBD 模型,來預測 台灣地區某線上光碟銷售網站消費者的重複購買行為,應用 Microsoft 的 試算表軟體 Excel 來建立完整銷售預測模型,使用該網站的實際交易資料 來驗證該模型對於銷售資料的適用性及預測能力,運用驗證資料來檢驗預 測的準確性,並與一般常用的線性迴歸預測模型加以比較兩者在預測能力 上的優劣。 本研究結果證明 BG/NBD 模型能夠很容易的在 Excel 上建立預測模型,並得 到準確的銷售預測結果。本研究希望藉由該模型在整體銷售預測上的準確 性,能夠協助企業預測客戶重複購買行為及計算顧客未來價值。. 關鍵字: 顧客關係管理、BG/NBD、資料庫行銷、RFM、重複購買、預測. i.
(4) Repeat Sales Forecasting for CD online Shopping in Taiwan. Student: Chuan-Yi Wu. Advisor:. Dr. Edwin Tang. The Master Program of Business and Management College of Management National Chiao Tung University. ABSTRACT Along with the development of marketing, the companies notify the fact that the customer is important to the market competition and their future development. The customer relationship management has become a very important aspect of business management. The core of customer relationship management is customer behavior prediction. The major objective of this research is to assist companies in forecasting the repeat purchase behavior of customer. Aiming at the BG/NBD prediction model (Fader and Hardie 2001), this research applying a simple stochastic model in conjunction with the online CD retailer in Taiwan .The data on the purchasing of CDs at the online retailer X-Company is used as empirical analysis. This research tries to provide modeling exercise to forecast medium-term aggregate CD purchasing by a cohort of new customers. We modeled monthly sales using finite mixture of beta-geometric distribution with a time-varying function to capture the nonstationarity in repeat purchase. In the result this model can easily be implemented within spreadsheet software like Microsoft Excel .The parameter calculation is very efficient and easy by using “Solver” function in Excel. This model provides the ability to describe the underlying sales patterns and produces an excellent purchasing forecast for the X-Company.. Keywords: Database Marketing, Customer Relationship Management, BG/NBD, RFM, Repeat Purchase, Forecast.. ii.
(5) 誌. 謝. 感謝指導教授唐瓔璋博士的教導及協助,並在我寫論文過程中給我相當 多的支持與鼓勵。同時感謝楊千教授、劉芳美教授及蕭中強教授提供的寶 貴意見及指導,讓這份論文更加完善。此外要感謝線上光碟銷售網站提供 的寶貴交易資料,作為本論文的研究資料。 回顧過去兩年半間,除了所上老師們的教導外,也遇到了許多優秀傑出 的同學,大家在團結和諧的氛圍下一起成長,尤其是唐門兄弟姊妹的支持 與鼓勵,讓我覺得學習的日子十分充實與快樂,在此致上衷心的謝意。 對於支持我的家人,尤其是親愛的老婆,感謝妳對我的支持及包容,肩 負起照顧小 Joey 的責任,讓我能夠無後顧之憂地全心學習,順利完成學業。 謝謝你們,感恩在心。. 全益. iii. 2008/1/8.
(6) 目錄 中文摘要................................................................. i 英文摘要................................................................ ii 誌謝................................................................... iii 目錄.................................................................... iv 表目錄.................................................................. vi 圖目錄................................................................. vii 一、. 緒 論 .............................................................. 1. 1.1 1.2 1.3 1.4 二、. 研究背景 ......................................................... 研究目的 ......................................................... 研究對象與範圍 ................................................... 研究流程 .......................................................... 1 2 2 3. 文獻探討 ........................................................... 4. 2.1 2.2 2.3 2.4. 電子商務 網路購物 網路商店 網路行銷. 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12. 客戶關係管理 ..................................................... 6 消費行為分析 ..................................................... 6 RFM 分析模型 ...................................................... 7 NBD 負二項式模型 .................................................. 9 PARETO/NBD 模型(SMC 模型) ........................................ 9 NBD+GG 模型...................................................... 12 BG/NBD 模型 ...................................................... 13 本章小結 ........................................................ 16. 三、 3.1 3.2 3.3 3.4 3.5 3.6. ......................................................... ......................................................... ......................................................... .......................................................... 4 4 5 5. 研究方法 .......................................................... 17 研究假設 ........................................................ 模型建立 ........................................................ 建立首次購買片數機率模型 ........................................ 建立重複購買的機率模型 .......................................... 參數計算 ........................................................ 銷售預測 ........................................................ iv. 17 18 20 20 21 23.
(7) 3.7 四、 4.1 4.2 4.3 4.4 4.5 4.6 五、 5.1 5.2 5.3. 本章小結 ........................................................ 23 資料分析 .......................................................... 24 建立購買次數分配表 .............................................. 建立第一個月份首次購買的模型: .................................. 建立完整模型 .................................................... 計算參數值 ...................................................... 建立預測模型 .................................................... 分析結果 ......................................................... 24 26 29 34 36 38. 結論與建議 ........................................................ 45 結論 ............................................................ 45 管理意涵及建議 .................................................. 45 研究限制與展望 .................................................. 46. 中文參考文獻 ............................................................ 47 英文參考文獻 ............................................................ 47 附錄一.................................................................. 48 附錄二.................................................................. 49 附錄三.................................................................. 50. v.
(8) 表目錄 表 1. 消費者購買行為模型比較表 ......................................... 16. 表 2. CDNOW 網站在 1997 年第一季之消費者交易總表 ......................... 18. 表 3. 購買片數及月份分佈表 ............................................. 25. 表 4. 規劃求解結果 ..................................................... 38. 表 5. 顧客重複購買機率表 ............................................... 38. 表 6. 重複購買片數機率表 ............................................... 39. 表 7. 一月到十二月單月平均絕對百分誤差 ................................. 41. 表 8. 累計銷售量預測平均絕對百分誤差 ................................... 44. vi.
(9) 圖目錄 圖 1. 一月份首次購買機率表 ............................................. 26. 圖 2. 規劃求解功能設定 ................................................. 27. 圖 3. 一月份購買機率規劃求解結果 ....................................... 28. 圖 4. 參數起始值及限制式 ............................................... 29. 圖 5. 顧客重複購買機率計算表 ........................................... 29. 圖 6. 重複購買片數機率表 ............................................... 30. 圖 7. 第一個月新客戶購買片數機率總表 ................................... 31. 圖 8. 第一、二月新客戶購買片數機率總表 ................................. 32. 圖 9. 全體顧客購買片數機率總表 ......................................... 33. 圖 10. 對數概似函數數值表 ............................................... 34. 圖 11. EXCEL 規劃求解設定圖 .............................................. 35. 圖 12. 三十個月期望值總表 ............................................... 36. 圖 13. 銷售預測值 ....................................................... 37. 圖 14. 重複購買機率圖 ................................................... 39. 圖 15. 單次交易購買數量分佈 ............................................. 40. 圖 16. 每月銷售數量比較圖 ............................................... 41. 圖 17. 每月重複銷售預測圖 ............................................... 42. 圖 18. 累計銷售總數比較圖 ............................................... 43. 圖 19. 累計銷售量預測與線性預測比較圖 ................................... 44. vii.
(10) 一、 緒 論 1.1. 研究背景 自從網際網路開放商業用途以來,由於網路上各項應用的快速發展,. 使得上網人口迅速增加,根據資策會「我國網際網路用戶數調查」(資策會 2007)指出,目前台灣地區的電腦普及率(以戶數算)已經達到 79%,經常 上網人口也達到 979 萬人,家庭連線上網普及率達 71.7%,全國曾經使用 過網際網路之人口數約為 1,452 萬人,而使用的服務中仍是以「瀏覽資訊」 及「收發 E-Mail」最為普遍。但近幾年來,網路的應用除了瀏覽資訊、收 發電子郵件、即時通訊和線上遊戲外,電子商務的市場也快速成長,透過 網路購物及拍賣的消費行為大幅增加。根據「蕃薯藤 2005 網路大調查」結 果顯示,網路購物平均單次消費金額,由於網拍、網購行為逐漸興起,平 均單次消費金額由 2001 年的 1,059 元,升高到 2005 年的 3,530 元,象徵 網路購物市場具有相當大的潛力。由資策會的資料預估顯示,2007 年底的 台灣地區電子商務規模將達到 2200 億元的規模,可見電子商務的商機無限。 近年來由於電子商務中企業對消費者(B2C)市場的競爭激烈,企業為 了獲取更多的利益,無不想努力開拓新客戶並留住既有客戶。然而因為網 路世界的便利、即時及無地域性的特性,消費者在資訊取得成本及交易成 本降低的同時,消費者對企業的忠誠度也隨之大幅下降,客戶流失率節節 升高。企業因此投入大量資源希望能瞭解顧客並建立良好關係,提高顧客 滿意度及忠誠 度 , 使得顧客關係管理(Customer Relationship management, CRM )及關 係 行 銷 (Relationship Marketing)的重要性與日俱增,成為近 年來企業管理的主要課題。 由於電子商務網站的客戶大多屬於非合約性(Non-contractual)客 戶,常常無法判斷客戶流失情形,客戶消費後可能沒多久就再次消費,也 可能永遠不再購買,無法利用一般經驗來預測消費者行為。企業希望藉由 營運中產生之大 量 客 戶 交 易 資 料 ,從資料中找出有用之消費者行為資 訊,作為判斷或預測顧客戶價值的依據。 1.
(11) 1.2. 研究目的 顧客價值分析主要分成顧客消費行為之隨機模型及顧客價值分析模型兩. 種。針對顧客消費行為的分析,很多學者利用不同的機率模型來掌握顧客的 消費行為,其主要的研究方法是在假設之行為機率函數之下,針對個別顧客 依照過去的交易記錄去預測其購買行為。Fader 與 Hardie(2001)根據美國 線上光碟銷售網站 CDNOW 的客戶交易資料,建立一個機率模型來預測該 網站消費者的重複購買行為。該模型在客戶流失行為無法觀測的情況下, 能夠準確的描述客戶重複購買行為並預測未來銷售情形。 本研究之主旨乃在引用該模型,利用台灣某一線上光碟銷售網站的實 際交易資料,來加以驗證該模型的預測能力,探討該企業客戶的消費者行 為,並希望能夠預測客戶的未來價值,做為企業經營管理時之參考依據。 本研究目的歸納如下: z 利用台灣地區電子商務業者的實際交易資料,透過理論建立銷售預 測模型,用以預測該公司未來銷售情形,作為該公司未來行銷決 策之參考。 z 透過實際資料來驗證 Fader 與 Hardie 機率模型的準確性及適用 性,並與一般常用預測方法加以比較,提供其他企業在預測重複 購買行為之參考。 z 根據該公司的交易資料,分析消費者的組成構面及消費行為,提出 分析結果及建議,作為該公司未來行銷決策之參考。 1.3. 研究對象與範圍 本研究範圍主要是針對台灣某一線上光碟銷售網站 2006 年 1 月到 2007. 年 2 月共 2853 筆交易資料,該公司透過網路銷售多媒體光碟片,無實質店 面通路,研究對象為該時間內消費之 1341 位顧客,顧客註冊後即可消費, 無需支付加入費用。. 2.
(12) 1.4. 研究流程 本研究流程主要架構分為 3 大部分,架構如下: 第一部份:包含研究動機與目的、文獻探討整理。文獻探討主要針對 本研究主題收集國外相關文獻資料,並針對電子商務、消 費者行為、重複購買及預測模型等重點加以整理分析。 第二部份:包括研究方法、理論架構、模型建立、參數計算及資料分 析。 第三部份:包含分析結果、研究結論、管理意涵、研究限制及未來建 議。. 3.
(13) 二、 文獻探討 由於本研究議題在探討電子商務中,分析客戶的消費行為來預測未來 的重複購買行為,作為行銷及經營之參考。因此,文獻探討將分成兩部分: 第一部份針對電子商務的發展、網路商店的發展、網路行銷等重點加以回 顧。第二部份針對客戶關係管理、消費行為及預測模型等方面進行相關文 獻的說明與回顧,藉以歸納現有研究對於銷售預測模型的研究成果,作為 本研究選擇預測模型之依據。 2.1. 電子商務 所謂「電子商務」 (Electronic Commerce, EC)乃是透過電腦網路進行. 商業活動的方式。包括商品與服務交易、金融匯兌、網路廣告或提供娛樂 節目,可用來了解組織、銷售者以及消費者的需求,同時可以改善商品或 服務的品質,並且加快服務傳遞的時間。 (張紹勳,2000) 近年來網路上的電子商務大概以分成 B2B(企業對企業)、B2C(企業 對消費者) 、C2C(消費者對消費者)三類,B2B 的電子商務大多基於降低 成本、提高效率及資訊整合之目的,而 C2C 主要是提供更多管道及資訊透 明的優點。這兩者的消費者重複購買行為分別屬於高和低的兩個極端。而 B2C 的電子商務則是指網路購物(Internet shopping) ,屬於網路行銷的一部 份,透過網際網路高互動的特性,提供企業在線上進行互動行銷,做為一 個和消費者直接溝通的管道,同時,企業除了可以線上提供商品、服務給 消費者,甚至付款、售後服務都可以透過網際網路進行。 2.2. 網路購物 Hoffman and Novak (1996)將網路購物定義為網路行銷的一部份,網際網. 路互動的特性,解釋為行銷者與消費者兩方持續進行雙向溝通。可以提供企 業在線上進行互動行銷,做為一個和消費者溝通的管道,同時,企業在網際 網路上也可以提供商品、服務給消費者。學者並將網際網路具有的互動特 4.
(14) 性,定義為互動式家中購物(Interactive Home Shopping, HIS),提出互動 式購物有兩個構面,為回應時間與回應情境,而「家中」僅在於指出消費 者可以在商店以外的地方進行交易,互動式家中購物係指買賣雙方在商店 以外的地方交易時,在回應時間與回應情境之間的互動。(Alba、Lynch、 Weitz、Janiszewski、Lutz、Wood 1997) ,而網路購物的概念就是由互動 式家中購物所衍生而來。 2.3. 網路商店 網路商店是指在網際網路上,將商品型錄與資訊,以平面或多媒體的. 方式陳列,供不特定的消費者經由電腦、手機進行線上商品瀏覽以及購買 的系統。與一般商店最大的差別就在於即時、虛擬化的服務。消費者可以 透過全天候、即時、互動的方式瀏覽商店展出的商品資訊。由於虛擬化, 店家可以不受限制的展出所有商品,而消費者可以不受打擾的選購商品及 比價後再訂購。由於網路商店進入的門檻包括有形的資金、店面、人力都. 比一般實體商店較低,所以網際網路上網路商店發展快速。雖然進入的 門檻較低,但是市場競爭也更激烈,要如何吸引新客戶,獲得客戶的首 次交易並留住客戶重複購買,這都是十分重要的課題,由於網路本身具 有低成本、便捷、迅速通訊、無遠弗屆的全球連線、多媒體傳輸資料,以 及豐富的資訊資源等多項特質,這些特質提供了一個可以用來進行廣告、 行銷、物品銷售及資訊服務等活動既低成本又快速的管道,同時不會因時 間與空間的藩籬而受到阻礙及干擾(張紹勳 2000),網路行銷的角色也越形 重要。 2.4. 網路行銷 Kalakota 與 Whinston(1996)所提出規劃互動式網路行銷的一般步驟. 為:(1)辨別以及區隔潛在消費者族群。(2)建立促銷、廣告文宣及教育學習 所需的資源。(3)將資訊資源呈現給消費者。(4) 與消費族群對話。(5)向消 費者學習經驗。(6)提供線上消費者服務。而由於網路世界的便利、隨時及 無地域性的特性,使得客戶的消費行為更難掌握及預測。因此如何預測客 戶的消費行為便成為網路行銷的重要課題。 5.
(15) 2.5. 客戶關係管理 已故的管理大師彼得杜拉克在談到客戶關係時提到: 『企業經營的真諦. 在於獲得並且能夠留住客戶』。企業成功經營的關鍵在於重視顧客的需求, 提供滿足客戶需求的產品及服務,運用有效的客戶關係管理來確保顧客獲 得高滿意度,增加客戶重複購買的機率。在目前的客戶關係管理領域,已 經有相當多的研究成果。對企業來説,客戶的資產就是企業重要的無形資 產,客戶對企業並非絕對忠誠的,如何留住客戶變成了企業生存的重要課 題。如同 80/20 經營法則所描述的,企業 80%的獲利來自於 20%的客戶, 如何找出這些 20%的客戶就是客戶關係管理最重要的使命。很多的公司僅 依據客戶消費的金額來將客戶分類,認為買得多的客戶就是最重要的客 戶,然而難免以偏蓋全,並未真正掌握到客戶得消費行為背後的意義。 當企業在收集客戶的消費行為資訊時,都會碰到客戶不願意提供額外 資訊的情形,雖然可以透過獎勵的方式(如獎品、優惠等)來得到客戶的 回應,但是也無法保證客戶回答之正確性。因此透過問卷、意見調查得來 的資料價值有限。因此,為了得到客戶消費行為的背後意義及更貼近企業 所要的客戶想法,客戶關係管理發展出許多分析及預測的模型,針對客戶 的消費行為來加以分類,提供客戶未來價值的預測而提供企業在客戶管理 上的參考。 2.6. 消費行為分析 在傳統行銷相關文獻中其實對顧客購買行為的研究已經有相當久的時. 間,包括利用客戶終生價值(CLV, Customer Lifetime Value)來追蹤及理解 客戶行為,還有以顧客歷史交易資料中的購買時間(Recently)、購買頻率 (Frequency)及購買金額(Monetary)為分析依據之 RFM 模型被廣泛應用於資 料庫行銷中,作為分析出客戶的購買習慣而將客戶分類的方法。這些消費 行為分析模型只是簡單分析客戶行為,利用客戶的同質性為前提,對客戶 未來之消費行為有個整體預測,並無法計算出個別客戶的活躍情形及個別 交易行為的預測。而客戶行為的另外一個重要領域就是利用企業原本就有 的交易資料,如客戶交易的頻率、最後一次交易時間等,應用不同的機率 6.
(16) 分配來掌握顧客購買行為的變化,直接計算出每位客戶的活躍度及交易次 數,利用這些動態模型,可以隨著時間及客戶消費行為變化直接反映在預 測指標上。這些模型通常都是利用 Poisson 或指數分配捕捉顧客購買時間以 及次數,再利用 Gamma 分配捕捉顧客的異質性,這方面的重要研究成果包 括 Schmittlein、Morrison 和 Colombo(1987)所提出的 Pareto/NBD 模型就 是結合了負二項分配以及 Pareto 分配推導顧客的存活機率以及期望交易次 數。還有 Fader、Hardie 和 Lee (2003) 在 Pareto/NBD 模型的基礎假設上加 以改進後提出的 BG/NBD 模型,及 Colombo 與 Jiang (1999)提出利用負二項 分配捕捉顧客購買時間以及 Gamma-Gamma 混合型模型捕捉購買金額的分 布的 NBD/GG 模型,這些都是在消費行為分析中十分重要的機率模型,本 研究將逐一介紹這些模型的基本假設及重要結果。 2.7. RFM 分析模型 Hughes(1994)利用顧客過去的交易記錄中最近購買時間(Recently)、. 購買頻率(Frequency)及購買金額(Monetary)三個屬性,提出一個用來進行顧 客價值衡量的分析模型,並依據這三項屬性第一個英文字母簡稱為 RFM 模 型。 1. 最近購買時間(Recently):最近購買時間是計算最後一次購買到現 在之時間差距,差距越小表示顧客購買產品的時間距現在越近。Hughes 發 現購買某產品之時間距現時愈近的顧客有較高的重複購買比率。因為最近 購買過產品的顧客對公司有較高的印象,所以有較高的可能會重複購買。 若最近購買日期離現時愈遠,隨著時間之拉長,該顧客之持續購買慾會降 低,代表此顧客可能會流失的機率增加。 2.購買頻率(Frequency) :購買頻率是指顧客在一段期間內,例如一季、 一個月,甚至一個星期中購買產品的次數,次數越高也就是頻率越高。購 買記錄中若購買某產品之頻率愈高,表示該顧客對此產品有較高的熱衷程 度,重複購買之機率亦較高。這裡不見的一定要是購買次數,只要能衡量 顧客與企業接觸或交易的頻率都可以做為衡量屬性,例如電信客戶的門號 通話次數、信用卡使用者的刷卡次數等。 7.
(17) 3.購買金額(Monetary):購買金額是指顧客在一段期間之內,購買產 品的總金額。代表著對此產品之興趣指標,亦可以當作對公司之實質金錢 貢獻度。某顧客對某產品消費愈多的金額,代表該顧客曾大量購買此產品, 暗示顧客對此商品的需求較高,重複購買的可能性也較高。 一般企業的顧客交易資料庫中都可以萃取出這些資訊,企業可以依據 顧客的購買記錄算出每位顧客可能對公司的終身價值,透過顧客終身價值 的計算判斷及預測顧客的重要性,針對不同價值的顧客進行不同的資 源分 配,以及採取不同的行銷策略。作法通常為將客戶依照三個屬性分別由高 到低分組後,加以組合可以得到不同特性的客戶組合,例如分別對最近購 買時間、購買頻率及購買總金額從大到小排列,各劃分成為兩等級後加以 組合便得八組,再依據不同等級分別給予不同的分數,加總後可以得到各 組的分數高低。分數越高代表顧客對某產品之忠誠度愈高,亦即該顧客下 次持續購買該商品之機率愈大,公司可以針對不同分數的顧客採取差異化 的行銷策略。 RFM 分析模型具有可適用於各個行業的特性,且計算邏輯簡單,可以 在不需專屬資訊系統輔助下更簡單、更快速地進行顧客分析。因此在企業 界已使用一段很長時間,從一開始用於分析單價較低、相互間有互補性且 需要重複購買的特性的消費性商品,不斷演進及發展,適用範圍已經擴大 到服務業,包跨電信業者及金融業者用以監測客戶消費行為變動及防範重 要客戶流失的應用。 但 RFM 分析模型也存在幾個重要問題:一是 RFM 模型中的三項屬性的 重要性差異,Hughes 認為 RFM 模型中的三項屬性的重要性是一樣的,因而 對於 RFM 此三項屬性並沒有給予不同的權重。但實際上不同產業對個別 RFM 屬性有不同的敏感性,而如何決定個別分數比重是一個重要問題。例 如某些產業對 F 屬性有很好的區隔能力,但其他產業可能對 R 屬性有較佳 的區隔能力,甚至不同的產品就有不同的比重。而 RFM 分析模型無法因應 對 RFM 屬性敏感程度不同的組合,提供單一的區隔指標而加以比較。而且 其中購買頻率 F 與購買金額 M 兩個變量間存在共線性,因為當購買頻率增 加,金額也相對增加。此外 RFM 分析模型不具有預測能力,僅適合根據顧 8.
(18) 客過去的歷史交易資料來區隔顧客。但也有分組後群組過多的問題,假使 每項屬性分成三級,組合起來就有 27 組,將難以對每組客戶消費特性做準 確的描述。 2.8. NBD 負二項式模型 Ehrenberg (1959)所提出的負二項 (Negative Binomial Distribution, NBD). 模型是最具代表性的消費者購買行為預測模型,負二項模型主要是結合 Poisson 分配以及 Gamma 分配而成的混合型模型(Mixture Model),而將顧客 購買頻率表示為: Γ(w + f ) ⎛ α ⎞ ⎛ 1 ⎞ PNBD [ F = f | α , w] = ⎜ ⎟ ⎜ ⎟ Γ ( w) f ! ⎝ α + 1 ⎠ ⎝ α + 1 ⎠ w. f. 這個模型也成為後來許多探討顧客購買行為之文獻的基礎, 2.9. Pareto/NBD 模型(SMC 模型) Schmittlein、Morrison 和 Colombo(1987)建立一個以機率模型來估計. 個別客戶的活躍性機率及預測購買次數的模型,該模型以三人姓氏第一個 字命名為 SMC 模型。該模型定義客戶仍有購買力時為活躍(Active),如果 客戶跑掉不再購買流失稱之為流失(dropout) ,Pareto/NBD 模型只需要利用 客戶過去購買記錄中的兩個資訊:最近購買時間(R)及購買頻率(F) 。客 戶從時間 0 觀察到時間 T 的這段期間購買次數為 x,而最後一次購買時間為 tx,因此 0<tx<T,因此關於這個客戶的交易資訊為 X=(x,tx,T)。 SMC 模型建立於五個假設: 假設一:當個別顧客為活躍時,在長度 t 的時間內,其交易量為以交易 率λ的 Poisson 分配。 P [ X = x | λ ,τ > T ] = e. − λT. ( λT ). x. ; x = 0,1, 2.... x! E [ X | λ ,τ > T ] = λ T , Var [ X | λ ,τ > T ] = λ T. 假設二:不同顧客之間交易率 λ 之差異利用形狀參數γ、比例參數α的 Gamma 分配來表示。γ值代表客戶間交易率差異的指標,γ 9.
(19) 值越大則交易率的差異越大,反之亦然。. αγ λ γ −1 e − α λ ; λ , γ , α > 0 g (λ | γ , α ) = Γ (γ ) 假設三:各顧客有個無法觀測的生存時間長度τ為流失率(dropout rate) μ的指數(Exponential)分配。 f (τ | μ ) = μ e − μτ ; τ > 0 E [τ | μ ] =. 1. Var [τ | μ ] =. μ. 1. μ2. 假設四:不同顧客之間流失率μ的差異利用形狀參數 s、比例參數β的 Gamma 分配來表示。s 值代表客戶間流失率差異的指標,s 值 越大則流失率的差異越大,反之亦然。. h( μ | s, β ) =. β2 Γ( S ). μ s −1e− βμ ; μ > 0, β > 0. 假設五:交易率λ與流失率μ相互獨立。 假設一、二的購買事件模型是根據 NBD 模型而來, P [ X = x | γ , α ,τ > T ] = C. r. x + γ −1 x. x. ⎛ α ⎞ ⎛ T ⎞ ⎜ ⎟ ⎜ ⎟ ; x = 0,1, 2.... ⎝α +T ⎠ ⎝α +T ⎠. 假設三、四的時間間隔模型則是根據第二種 Pareto 分配(Exponential Gamma 混合) 而來, s⎛ β ⎞ f (τ | s, β ) = ⎜⎜ ⎟ β ⎝ ( β + τ ) ⎟⎠ E (τ | s, β ) =. β s −1. s +1. , τ > 0;. , s >1. 因此上述購買事件模型結合時間間隔模型的 SMC 模型也稱為 Pareto/NBD 模型,四個參數γ、s、α、β。 經由該模型能夠推導出: (1)顧客在時間 T 內購買次數期望值為. 10.
(20) ⎡ ⎛ β ⎞ s −1 ⎤ E[ X | γ , α , s, β , T ] = ⎢1 − ⎥ α ( s − 1) ⎢⎣ ⎜⎝ β + T ⎟⎠ ⎥⎦. γβ. (2)單一客戶在時間 T 內的活躍機率根據為α、β的關係有三種情形,假 定 t 為最近一次交易時間: 情況 1:當α>β則: P[τ > T | γ , s, α > β , X = x, t , T ] s ⎡ ⎛ α + T ⎞γ + x ⎛ β + T ⎞ s ⎤ ⎪⎫ s ⎪⎧ ⎛ β +T ⎞ = ⎨1 + − F a , b ; c ; z ( t ) F a , b ; c ; z ( T ) ( ) ( ) ⎢⎜ ⎥ ⎬ 1 1 1 1 1 1 1 1 ⎟ ⎜ ⎟ ⎜ ⎟ ⎝α +T ⎠ ⎥⎦ ⎪⎭ ⎪⎩ γ + x + s ⎢⎣⎝ α + t ⎠ ⎝ α + t ⎠. −1. 其中 a1 = γ + x + s;. b1 = s + 1;. c1 = γ + x + s + 1; z1 ( y ) =. α −β α+y. 情況 2:當α<β則: P[τ > T | γ , s, α < β , X = x, t , T ] s ⎧⎪ ⎡⎛ α + T ⎞γ + x ⎛ β + T ⎞ s ⎤ ⎫⎪ ⎛α +T ⎞ s F a , b ; c ; z ( t ) F a , b ; c ; z ( T ) = ⎨1 + − ⎢⎜ ⎥⎬ ( ) ( ) 2 2 2 2 2 2 2 2 ⎟ ⎟ ⎜ ⎜ ⎟ ⎝ β +T ⎠ ⎥⎦ ⎪⎭ ⎪⎩ γ + x + s ⎢⎣⎝ β + t ⎠ ⎝ α + t ⎠. −1. 其中 a2 = γ + x + s;. b2 = γ + x;. c2 = γ + x + s + 1; z2 ( y ) =. β −α β+y. 上面兩公式中的 F ( a, b; c; z (t ) ) 為 Gauss hypergeometric function。 情況 3:當α=β則: ⎧⎪ ⎡⎛ α + T ⎞γ + x + s ⎤ ⎫⎪ s − 1⎥ ⎬ P[τ > T | γ , s, α = β , X = x, t , T ] = ⎨1 + ⎢⎜ ⎟ ⎦⎥ ⎭⎪ ⎩⎪ γ + x + s ⎣⎢⎝ α + t ⎠. −1. *. (3)顧客在時間 T 後 T 時間內發生的交易次數期望值為 E ⎣⎡ X * γ , α , s, β , X = x, t , T , T * ⎦⎤ = E ⎣⎡ X * γ + x, α + T , s, β + T , T * ⎦⎤ × P ⎣⎡τ > T γ , α , s, β , X = x, t , T ⎦⎤. SMC 模型能夠準確的根據顧客過去的消費行為預測未來消費行為,透 過模型能夠計算出顧客活躍度、在未來的消費頻率及某段時間內達到一定 交易次數的可能性,如果計算出個別顧客的活躍度後,將其機率相加,便 11.
(21) 可以得出具有活躍性客戶的人數預測值,作為判斷企業客戶維持率的指 標。在應用上,如何找出四個參數γ、s、α、β是個重要關鍵,本模型的 計算方式十分複雜繁瑣,尤其是需要求出參數值之最佳解,才能應用於生 存率、期望購買次數的預測的。 Schmittlein、Morrison 和 Colombo 提出模型時是使用三步計算法(3step method) ,並詳細介紹求得參數的複雜過程。之後 Schmittlein 與 Peterson (1994)提出了將三步計算法加以改進後的二步計算法(2- step method), 簡化了計算過程,且比原有三步計算法有較佳的準確度,但是計算依然十 分複雜,而且無論是三步計算法或加以改進後的二步計算法,都涉及時間 選取的問題,需要大量的反覆計算來找出最佳解,使得實際應用時非常不 方便。 2.10. NBD+GG 模型. 本隨機模型結合 Ehrenberg(1959) 所提出之負二項分配模型及 Colombo 和 Jiang(1999)提出之 Gamma-Gamma 混合型模型,建立顧客每期購買頻率 及購買金額之機率分配假設,並利用 Gamma 分配來捕捉顧客之異質性,用 以描述顧客之購買行為。以此隨機模型之六主要假設為: 假設一:假設顧客購買頻率和購買金額兩個不同行為是互相獨立,不具 有相關性。因此這兩個行為機率函數的參數互相獨立。 假設二:假設顧客的購買狀態移轉行為符合馬可夫鏈的假設,這表示顧 客下一期購買狀態發生的機率只和上一期的購買狀態有關。 假設三:假設個別顧客購買頻率 f 為卜松分配(Poisson Distribution),則 以單位時間平均購買次數為 λ 時,單位時間內購買次數為 f 的 機率為: Pf [ F = f | λ ] = e − λ. λf f!. λ >0. 假設四:考慮顧客間的異質性,故假設個別顧客單位時間內平均購買 次數 λ 為 Gamma 分配:. 12.
(22) g λ (λ | w, α ) =. αw Γ( w). λ w−1e −αλ. w > 0, α > 0. 假設五:因為購買金額不可能為負值,並不適合用常態分配來捕捉,因 此利用 Gamma 分配更具彈性且符合購買金額不為負數的特 性,假設個別顧客發生購買行為之各期平均單次購買金額 m 為 的 Gamma 分配,即: g m ( m | u ,θ ) =. θu. Γ (u ). mu −1e −θ m. u > 0,θ > 0. 假設六:由於顧客各期平均單次購買金額之 Gamma 分配的平均值為 u / θ,為了考慮顧客的異質性,假設此 Gamma 分配的平均值 u / θ隨著不同顧客而變動,因此將 u 定義為常數值,利用θ改 變而表示每位顧客購買金額行為之不同,故假設顧客平均單次 購買金額的 Gamma 分配之參數θ符合另一個 Gamma 分配: g (θ | v,φ ) =. φv. Γ (v). φ v−1e −φθ. v>0,φ >0. 由假設三及假設四可推導出顧客購買頻率的機率為負二項分配 PNBD [ F = f | α , w] =. Γ(w + f ) ⎛ α ⎞ ⎛ 1 ⎞ ⎜ ⎟ ⎜ ⎟ Γ ( w) f ! ⎝ α + 1 ⎠ ⎝ α + 1 ⎠ w. f. 根據假設五及假設六可推導出顧客各期間平均單次購買金額的機率密度函 數為 Gamma-Gamma 混合型函數: Γ (u + v ) ⎛ m ⎞ ⎛ φ ⎞ 1 g G −G ( m | u , v , φ ) = ⎜ ⎟ ⎜ ⎟ Γ (u ) Γ (v ) ⎝ φ + m ⎠ ⎝ φ + m ⎠ m u. 2.11. v. BG/NBD 模型. 由於 SMC 模型計算上的複雜性,大幅限制了在應用上的實用性。於是 Fader、Hardie 與 Lee( 2003)對 Pareto/NBD 模型進行改進,藉由基本假 設上的小幅變動,而得到了一個新模型。這個模型與 Pareto/NBD 唯一的差 別在對於客戶何時或如何流失的假設不同。Pareto/NBD 模型假設客戶的流 失可以發生在任何時間點,於實際交易情形無關。但 Fader 等人認為客戶的 流失應該緊接在購買行為之後,於是利用一個 Beta-geometric 模型來描述這 個情形,這個模型也就稱為 BG/NBD 模型。 13.
(23) BG/NBD 建立於五個基本假設上,其中前兩個關於交易模型的假設與 Pareto/NBD 模型的假設一樣,這裡關於活躍、流失、觀察時間 T 定義也與 Pareto/NBD 模型的相同: 假設一:當個別顧客為活躍時,單一客戶的交易量為以交易率λ的 Poisson 分配。也就是說交易的時間間隔為以交易率λ的指數 分配:. (. ). f t j t j −1 ; λ = λ e. (. − λ t j −t j −1. ). t j > t j −1 ≥ 0. ,. 假設二:不同顧客交易率之異質性為形狀參數γ、比例參數α的 Gamma 分配。其機率密度函數為:. α γ λ γ −1e −αλ f (λ | γ , α ) = Γ (γ ). ,λ > 0. γ值代表顧客間交易率差異的指標,γ值越大則交易率的差異越大,反之 亦然。 假設三:每次交易後,顧客的流失機率為 p,因此顧客在交易序列之中 流失的流失點為幾何分配,其機率質量函數為: P ( 顧客在第j次交易後流失 ) = p (1 − p ). j −1. j = 1 , 2 , 3,....... ,. 假設四:顧客間流失機率 p 的異質性為一個 Beta 分配,其機率密度函 數為: p a−1 (1 − p ) f ( p a , b) = B ( a , b). b −1. 0 ≤ p ≤1. ,. 其中 B(a,b)為 Beta 函數,可以用 Gamma 函數表示成為 B ( a, b ) = Γ ( a ) Γ ( b ) / Γ ( a + b ). 。. 假設五:在不同客戶之間,交易率λ與流失機率 p 相互獨立。 基於上面的假設,透過 BG/NBD 模型推導可以得到: (1) 交易歷史為(X=x,tx,T)之顧客的似然率函數為:. 14.
(24) B ( a, b + x ) Γ ( γ + x ) α γ B ( a, b ) Γ ( γ ) (α + T )γ + x. L ( γ , α , a, b | X = x, tx, T ) =. +δ x >0. B ( a + 1, b + x − 1) Γ ( γ + x ) α γ B ( a, b ) Γ ( γ ) (α + t x )γ + x. 為了求出 BG/NBD 中四個重要參數(γ,α, a, b),可以利用最大似然 率法(Maximum Likelihood) ,假設有 N 個顧客,其中顧客 i 於時間 (0, Ti ] 內 有 X i = xi 交易量,而最後一次交易時間為 t x ,則這群顧客的對數似然率函數 (log-likelihood function)為: N. [(. LL (γ , α , a, b ) = ∑ ln L γ , α , a, b X i = xi , t xi , Ti i =1. )]. 透過數學計算求最大值可得到重要參數(γ,α,a ,b)的值。. (2) 在時間 t 內交易次數為 x 的機率函數 P(X(t))為 B ( a, b + x ) Γ ( γ + x ) ) ⎛ α ⎞ ⎛ t ⎞ P ( X ( t ) = x | γ , α , a, b ) = ⎜ ⎟ ⎜ ⎟ B ( a, b ) Γ ( γ ) x ! ⎝ α + t ⎠ ⎝ α + t ⎠ γ. +δ x >0. x. j B(a + 1, b + x − 1) ⎡ ⎛ α ⎞ ⎪⎧ x −1 Γ ( γ + j ) ⎛ t ⎞ ⎪⎫⎤ ⎢1 − ⎜ ⎟ ⎨∑ ⎜ ⎟ ⎬⎥ B ( a, b ) ⎢⎣ ⎝ α + t ⎠ ⎩⎪ j =0 Γ ( γ ) j ! ⎝ α + t ⎠ ⎭⎪⎥⎦. 當 x>0, δ x >0 = 1,而當 x≦0, δ x >0 = 0。 (3)在時間長度為 t 內單一顧客的交易次數期望值 E(X(t)): γ. a + b −1 ⎡ ⎛ α ⎞ E ( X ( t ) γ , α , a, b ) = ⎢1 − ⎜ ⎟ a − 1 ⎣⎢ ⎝ α + t ⎠. 2. t ⎛ F1 ⎜ γ , b; a + b − 1; α +t ⎝. ⎞⎤ ⎟⎥ ⎠ ⎦⎥. 其中 2 F1 ( i ) 為 Gauss hypergeometric function,必須利用最大似然率法求 出參數值後,可以藉由多項式序列或利用 Microsoft 的 Excel 軟體來簡單計 算出 Gauss hypergeometric function。 (4)根據顧客過去的交易資訊(X=x,tx,T) 預測在未來時間 t 內之交易次數期 望值為: E (Y (t ) X = x, t x , T , γ , α , a, b ). =. a + b + x −1 ⎡ ⎛ α + T ⎞ ⎟ ⎢1 − ⎜ a −1 ⎢⎣ ⎝ α + T + t ⎠. γ +x 2. t ⎛ F1 ⎜ γ + x, b + x; a + b + x − 1; α +T +t ⎝. a ⎛α +T ⎞ ⎜ ⎟ 1 + δ x >0 b + x − 1 ⎜⎝ α + t x ⎟⎠. γ +x. 15. ⎞⎤ ⎟⎥ ⎠⎥⎦.
(25) BG/NBD 模型只是將客戶流失模型由指數分配轉換成幾何分配,卻大 幅簡化了計算過程。經過實用驗證後,證明 BG/NBD 與 Pareto/NBD 模型預 測顧客未來的消費行為的適用性及預測能力,兩者的效力並無差別。然而. Pareto/NBD 的複雜計算加上存在最佳解選擇的問題,使得 BG/NBD 容易計 算的特性更適合實際應用。企業只要將顧客歷史交易資料中的交易次數、 最後一次交易時間及交易時間長度輸入 Excel 試算表,應用最大似然率法透 過規劃求解功能便可以輕鬆、準確地計算出 BG/NBD 模型的四個重要參數 值,求出相關期望值及預測,進而作為客戶關係管理的重要參考依據。 2.12. 本章小結. 總結上面的結論,目前的研究對於消費者購買行為的預測,主要都是 利用機率分佈的方式來達成,本研究將各模型加以整理得到下表。 表 1 消費者購買行為模型比較表 模型. 年代. 學者. RFM. 1994. Hughes. NBD. 1959. Ehrenberg Schmittlein. SMC 1987. 、Morrison. (NBD/Pareto) 和 Colombo Colombo、 NBD/GG. 1999 Jiang. BG/NBD. 2003. 模型特點(主要參數) 最近購買時間(R)、購買頻率(F) 、購買金額(M) 交易次數模型:Poisson-Gamma 分配 (Gamma 分配參數為α、w) 交易次數模型:Poisson-Gamma 分配 (Gamma 分配參數為γ、s) 時間間隔模型:Exponential-Gamma 分配 (Gamma 分配參數為α、β) 交易次數模型:Poisson-Gamma 分配 (Gamma 分配參數為 w、α) 交易金額模型:Gamma-Gamma 分配 (Gamma 分配參數為 u、v、 φ ). 交易次數模型:Poisson-Gamma 分配 Fader 、 (Gamma 分配參數為γ、α) 時間間隔模型:Beta-Gamma 分配 Hardie 、Lee (Gamma 分配參數為 a、b) (資料來源:本研究整理). 16. 預測能力 無 交易次數. 交易次數 流失情形. 交易次數 交易金額. 交易次數 流失情形.
(26) 三、 研究方法 3.1. 研究假設. Fader 與 Hardie (2001)針對美國線上光碟片銷售網站 CDNOW 提出預 測顧客消費行為之動態機率模型,主要概念是在購買發生後即假設消費行 為改變及建立流失機率,以 Geometric 分佈來決定消費者的初次購買行為, 建立銷售預測模型,並利用美國線上光碟片銷售網站 CDNOW 的實際交易 資料於 Microsoft Excel 上建立完整計算模型,輕易的求得重要相關參數值, 並用以預測客戶重複購買行為。 由於該模型使用的資料也是線上光碟銷售之交易資料,加上分析方法 簡單,無須專業的分析工具,因此我們選擇利用該模型於分析台灣某線上 光碟銷售網站的實際交易資料,藉以驗證該模型的預測能力,並預測客戶 的重複購買行為,做為該企業經營管理時之參考依據。. Fader 與 Hardie 提出的預測模型,結合初次購買模型及重複購買行為模 型,共有下面五個基本假設: 建立初次購買模型的基本假設: 假設一:每位客戶第一次購買片數為以 qT 為參數的 Geometric 分配 假設二:不同顧客的 qT 為 Beta 分配。 建立重複購買行為模型的基本假設: 假設三:每位客戶不買的機率為一個時間相關的機率分配。 假設四:客戶重複購買的片數為以 q 為參數的 Geometric 分配。 R. 假設五:不同顧客的 q 為 Beta 分配。 R. 其中假設二及假設五的 qT、qR 互相獨立。. 17.
(27) 3.2. 模型建立. Fader 與 Hardie 利用 CDNOW 網站在 1997 年第一季之銷售資料為基 礎,整理出十二週的消費者交易總表如下, 表 2. CDNOW 網站在 1997 年第一季之消費者交易總表 週. 購買數量. 1. 0. 2. 3. 4. 5. 1478. 3033. 4763. 6608. 6. 7. 8. 9. 10. 11. 12. 8616. 10829. 12716. 14698. 16774. 18881. 20902. 1. 750. 852. 984. 1066. 1237. 1262. 1204. 1278. 1397. 1444. 1387. 1148. 2. 383. 387. 456. 484. 566. 649. 592. 606. 644. 659. 677. 663. 3. 191. 214. 270. 267. 293. 320. 302. 343. 365. 374. 355. 367. 4. 95. 120. 114. 161. 163. 196. 156. 195. 179. 187. 199. 182. 5. 55. 72. 68. 89. 96. 96. 80. 100. 95. 118. 94. 120. 6. 36. 40. 42. 40. 51. 54. 65. 45. 75. 71. 72. 54. 7. 18. 12. 27. 30. 36. 40. 39. 31. 41. 37. 30. 43. 8. 12. 15. 9. 21. 19. 21. 20. 24. 23. 29. 24. 32. 9. 9. 9. 8. 9. 21. 14. 21. 8. 14. 9. 12. 16. 25. 17. 27. 32. 36. 55. 39. 35. 48. 42. 50. 43. 總銷售量. 3627. 3857. 4512. 5054. 5843. 6456. 5906. 6077. 6757. 6848. 6770. 6781. 新增人數. 1574. 1642. 1822. 1924. 2164. 2197. 2024. 2034. 2198. 2165. 2037. 1789. 總客戶數. 1574. 3216. 5038. 6962. 9126. 11323. 13347. 15381. 17579. 19744. 21781. 23570. 10+. 資料來源:Fader, and Hardie, "Forecasting Repeat Sales at CDNOW: A Case Study,". 我們先以實際例子來推導我們的模型,在第一週,將新增的 1574 位顧 客依據購買片數加以分成一片到十片以上共十組,計算出各組人數。 而在第二週,有 1574 個顧客消費,其中有 1478 個為第一週顧客在本 週沒有買(購買數量為 0 片)的顧客,因此有 1574-1478=96 個在第一週購 買過的舊顧客重複購買。也就是說第二週購買光碟片數 x 的客戶可能是新 客戶也可能是第一週的舊客戶,因此在第二週購買 x 片光碟機率可以表示 為第二週新顧客買 x 片的機率和第一週的舊新顧客於第二週買 x 片的機率之 加權平均,即: P (第二週買x片)=w 2 × P (第二週新顧客買x片)+w 1 × P (第一週舊顧客買x片). 而其權數 W1 、W2 由分別於第一週及第二週的新顧客數決定: w2 =. 第二週新增顧客數 1642 = 一、二週顧客數和 1642 + 1574. w1 = 18. 第一週加入顧客數 1574 = 一、二週顧客數和 1642 + 1574.
(28) 以 P (T2 = x ) 表示新顧客於第二週買 x 片的機率,P( R2|1 = x) 為第一週加入 的顧客於第二週買 x 片的機率,則所有顧客在第二週購買 x 片的機率 P( X 2 = x) 為: P ( X 2 = x) =. 1642 1574 × P(T2 = x) + × P( R2|1 = x) 1574 + 1642 1574 + 1642. 同理可推在第三週購買 x 片光碟機率為第三週加入之新顧客買 x 片的機 率加上第一週、第二週加入的舊顧客分別於第三週買 x 片的機率之加權平 均,即:. P (第三週買x片)= w3 × P (第三週新會員買x片)+w2 × P(第二週舊會員買x片)+w1 × P(第一週舊會員買x片) 而其權數 W1、W2、W3 分別由第一週、第二週、第三週加入的顧客數決定: 第一週加入顧客數 1574 = 前三週總顧客數 1574 + 1642 + 1822 第二週加入顧客數 1642 w2 = = 前三週總顧客數 1574 + 1642 + 1822 第三週新加入顧客數 1822 w3 = = 前三週總顧客數 1574 + 1642 + 1822. w1 =. 以 P (T3 = x ) 表示新顧客於第三週買 x 片的機率,P( R3|1 = x) 為第一週加入 的顧客於第三週買 x 片的機率,P( R3|2 = x) 為第二週加入的顧客於第三週買 x 片的機率,則所有顧客在第三週購買 x 片的機率 P( X 3 = x) 為: P( X = x) = 3 1822 1642 1574 × P(T = x) + × P( R = x) + × P ( R = x) 3 3|2 3|1 1574 +1642 +1822 1574 +1642 +1822 1574 +1642 +1822. 根據上面的例子,可得到顧客在第 w 週購買 x 片機率 P( X w = x) 的通式為: P( X w = x) =. 1. ⎡ n P(T = x ) + w∑−1 n P( R = x) ⎤ × w i w|i w ⎢ w ⎥⎦ i =1 ∑ ni ⎣. (1). i =1. ni 代表第 i 週新加入的顧客數,nw 代表第 w 週新加入的顧客數,P (Tw = x ) 代表新會員在第 w 週買 x 片的機率,而 P ( Rw|i = x) 為在第 i 週消費之新顧客在 第 w 週買 x 片的機率。(1)式為本研究模型的核心,其權重的部份可以由 19.
(29) 每週新增加的使用者計算求得,而最困難的部份是在首次購買片數的機率 P (Tw = x ) 、及重複購買片數的機率 P ( Rw|i = x ) 如何決定,因此必須根據研究假. 設來分別推導出這兩個機率的模型。 3.3. 建立首次購買片數機率模型 基於假設一,令變數 Tw 代表在 w 週購買的片數,此時 Tw 為大於或等於. 0 之整數,則每位顧客購買片數機率 P (Tw = x | qT ) 為以 qT 為參數的 Geometric 分配,其機率密度函數為. ⎧ qT (1 − qT ) x −1 , x = 1, 2, 3...; 0 < qT < 1 P ( Tw = x | qT ) = ⎨ ,x =0 ⎩ 0 根據假設二,不同顧客間 qT 為以αT、βT 為參數之 Beta 分配,其機率密度 函數(PDF)為:. g (qT ) =. 1 α -1 β -1 qT T (1- qT ) T ,0 < qT < 1;α , β > 0 B(αT , βT ) T. T. 結合兩式得到顧客首次購買片數機率 P (Tw = x | qT ) 的如下 P (Tw = x ) =. ∫ P (T 1. w. 0. = x | qT )g ( qT ) dqT. ⎧ B (α T + 1, βT + x − 1) , x = 1, 2, 3... ⎪ B (α T + 1, β T ) =⎨ ⎪ 0 ,x=0 ⎩. (2). 稱之為 Shifted beta-geometric distribution。而顧客首次購買片數期望值為 E (Tw ) =. 3.4. αT + βT − 1. ( 3). αT − 1. 建立重複購買的機率模型 根據假設三,顧客不買的機率是會隨時間改變。令 π w|i 代表在第 i 週第. 一次購買的顧客,在第 w 週(w>i)不買的機率分配為: δ. π w|i = 1 − γ ( w − i ) , w > i 當δ<0,代表隨著時間增加,流失的機率增加,代表不買的人會越來 20.
(30) 越多。當然δ也可能大於 0,代表重複購買的人隨時間越來越多的可能性。 這裡所指的“不買“並非表示顧客永遠流失,只是表示顧客當時決定不 買,將來還是可能繼續購買。 根據假設四,在第 i 週第一次購買的顧客,在第 w 週(w>i)客戶重 複購買的片數 R w|i 可以表示為參數 qR 的 Geometric 分配,其機率質量函數為: P ( Rw|i = x | qR ) = qR (1 − qR ). x. x = 0,1,… ; 0 < qR < 1. 而其中 qR 依據假設五可以表示為以αR、βR 為參數之 Beta 分配,其機率密 度函數為:. g ( qR ) =. 1 α -1 β -1 qR R (1- qR ) R ,0 < qR < 1;α , β > 0 B(α R , β R ) R. R. 這裡與首次購買片數機率模型有點不同:首次購買模型沒有買 0 片的 機率,因為既然是首次購買,此時只有買一片以上,而沒有買 0 片的情形。 依據上面假設可以得到在顧客重複購買片數 Rw|i 的機率分配 P( Rw|i = x) 為. P ( R w |i = x ) = δ x = 0 π + (1 − π = δ x = 0π. w |i. 1. w |i ) ∫ P ( R w |i = x | q R ) g ( q R ) d q R 0. w |i. + (1 − π. w |i. )×. B ( α R + 1, β R + x ) B (α R , β R ). 其中 x=0δx=0 為 1,否則為 0。而重複購買片數的期望值為 βR E ( Rw|i ) = γ ( w − i )δ . α R −1. (4). ( 5). 至此已經完成整個預測模型的建立,其中參數共有六個:αT、βT、γ、 δ、αR、βR。 3.5. 參數計算 有了完整模型,接下來便必須找出如何求出參數值,這裡我們利用最. 大似然率法透過求下面的對數似然率函數 LL 而求出六個參數值:. 21.
(31) 根據定義 LL=(每週各組購買人數*每週各組機率之對數值)之總和 根據表 2 及先前模型,可以發現第一週都是首次購買,因此沒有買 0 片的機率,且第十組之機率為 1-(購買 1~9 片的機率總和),而第二週以 後第十組之機率為 1-(購買 0~9 片的機率總和) ,因此 LL 可以用數學式表 示為: 9. L L = ∑ m 1 x ln x =1. (. 9. ⎡⎣ P (T1 = x )⎤⎦. + m 1• − ∑ m x =1 1 x 12. + ∑. w=2. (. {. ). ln ⎡ 1 − ∑ P T1 = x 9. ⎣. x =1. (. )⎤⎦. 9. ( 6). ∑ m w x ln [ P ( X w = x )]. x=0. 9. + m w• − ∑ m wx x=0. ). ln ⎡ 1 − ∑ P 9. ⎣. x=0. ( X w = x )⎤⎦. }. 其中 mwx 表示在第 w 週買 x 片的人數,mw˙表示表 2 中第 w 週的總客戶 數。而要計算(6)式必須處理顧客每週購買片數機率(1)式中的 P( X w = x) , 也就是要處理(2)式及(4)式中的 Beta 函數,為簡化計算,可以利用數 學技巧: P(Tw = x) =. P (Tw = x) P (Tw = x − 1) P(Tw = x − 1). 將(2)式代入 P(Tw = x) P(Tw = x − 1) 中,Beta 函數消去後得到顧客首次購買片 數機率 P (Tw = x ) 簡單公式:. ⎧ ⎪0 , x =0 ⎪ ⎪ αT P (Tw = x ) = ⎨ , x =1 (7) + α β T T ⎪ ⎪ βT + x − 2 ⎪α + β + x −1 P (Tw = x −1), x ≥ 2 ⎩ T T 同樣方式可以把(4)式簡化計算後得顧客重複購買片數機率 P( Rw|i = x) 的簡 單公式:. 22.
(32) P ( Rw|i. βR ⎧ δ 1− γ ( w − i ) ( ), x =0 ⎪ αR +βR ⎪ αRβR ⎪ δ , x =1 = x ) = ⎨γ ( w − i ) (α R + β R )(α R + β R +1) ⎪ ⎪ β R + x −1 x≥2 ⎪ α + β + x P ( Rw|i = x −1), ⎩ R R. ( 8). 將簡化後的(7)式及(8)式帶入(1)式便可以計算出每週各組購買 片數,也就可以計算出(6)式所需要的對數概似函數式 LL,利用最大似 然率法而求出六個參數值。雖然其中要計算的數目很多,但是透過 Excel 的剪貼與複製,去重複計算每個項目將十分簡單。 3.6. 銷售預測 求出六個參數值後,得到(3)式的首次購買片數期望值 E (Tw ) 及(5). 式的重複購買片數期望值 E ( Rw|i ) ,便可以計算出客戶在第 w 週總購買量 Nw 的預測值為. ( ). E Nw. ⎧n E (T ) + w∑−1 n E ( R ) ⎪ w w i =1 i w|i =⎨ 12 ⎪ ∑ ni E ( Rw|i ) , ⎩i =1. ,. w ≤ 12,. ( 9) w > 12,. 代入已知的六個參數即可求得銷售數量的預測值。 3.7. 本章小結 本章詳細介紹了 Fader 與 Hardie 提出的預測模型,從模型的基本假設、. 模型建立過程方法、到模型中參數的求解方法做完整的說明,作為我們實 際分析資料時的理論依據。. 23.
(33) 四、 資料分析 本研究使用資料庫為某線上銷售動畫及影音光碟公司之 2006 年 1 月到. 2007 年 2 月的完整歷史交易資料,為本研究完成時能夠取得之完整資料。 總共有 1341 位消費者,交易筆數共 2853 筆。原始資料包含客戶 ID、消費 日期時間、消費金額、郵遞區號、單筆訂購片數等資料。 本研究只用到客戶 ID、消費日期時間及單筆訂購片數的資料。使用者. ID 用來作為辨認新舊客戶及重複消費之依據,消費日期時間的取其中的月 份,將資料分成 2006 年 1 月到 2006 年 12 月共 2396 筆交易及 2007 年 1、2 月份共 457 筆交易兩部分,利用前者建立模型及求出相關參數,並利用後 者加以驗證。 4.1. 建立購買次數分配表 由於本研究的資料沒有 CDNOW 交易資料的龐大,因此不用週為單位. 而改用月份為單位計算,將 2006 年全年資料依據月份分成 12 個月,並統 計每位消費者每月購買片數,由於購買片數超過 10 片以上的交易次數大約 佔全部交易次數的百分之九,為增加分析之準確性,因此將購買片數分為. 20 組,依據每月數量分成 1-19 片及購買 20 片以上的 20+共 20 組,使得第 20 組之交易數僅佔全部交易的百分之一。 經由統計及整理後得到表 3,其中單月購買人數為當月新增購買人數加 上重複購買人數:. 24.
(34) 表 3 購買片數及月份分佈表 月份 數量. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 總計. 0. 0. 78. 215. 290. 409. 511. 598. 694. 767. 842. 905. 914. 1. 19. 44. 44. 52. 45. 48. 56. 63. 42. 35. 47. 62. 557. 2. 13. 36. 42. 49. 32. 37. 34. 34. 38. 42. 40. 48. 445. 3. 15. 34. 21. 41. 27. 39. 26. 32. 24. 27. 32. 32. 350. 4. 16. 23. 20. 20. 28. 32. 20. 25. 23. 25. 17. 36. 285. 5. 11. 16. 8. 14. 15. 17. 20. 21. 18. 15. 24. 27. 206. 6. 4. 12. 6. 16. 20. 11. 11. 11. 19. 10. 9. 20. 149. 7. 4. 5. 8. 5. 3. 3. 13. 9. 13. 10. 9. 11. 92. 8. 4. 4. 4. 4. 7. 4. 9. 7. 6. 6. 2. 10. 64. 9. 2. 3. 1. 4. 3. 5. 5. 2. 4. 2. 7. 5. 43. 10. 4. 3. 6. 3. 1. 3. 2. 2. 2. 6. 5. 6. 43. 11. 3. 3. 4. 2. 1. 2. 5. 2. 4. 1. 1. 4. 32. 12. 1. 3. 2. 2. 3. 0. 2. 3. 1. 4. 3. 2. 30. 13. 1. 4. 3. 0. 2. 1. 1. 0. 3. 2. 1. 4. 22. 14. 1. 1. 0. 3. 0. 2. 1. 1. 3. 4. 0. 1. 17. 15. 0. 0. 3. 1. 2. 1. 4. 0. 0. 1. 0. 2. 14. 16. 0. 1. 1. 0. 1. 1. 0. 0. 0. 5. 0. 0. 9. 17. 0. 0. 0. 1. 0. 1. 0. 0. 2. 1. 0. 0. 5. 18. 0. 0. 1. 0. 0. 0. 1. 0. 1. 0. 1. 0. 4. 19. 0. 0. 0. 0. 0. 0. 2. 0. 1. 0. 0. 0. 3. 20+. 0. 1. 0. 1. 1. 2. 3. 3. 3. 5. 1. 6. 26. 總銷售量. 423. 757. 690. 792. 750. 797. 958. 787. 949. 984. 755. 1199. 單月購買人數. 98. 193. 174. 218. 191. 209. 215. 215. 207. 201. 199. 276. 新增購買人數. 98. 173. 118. 119. 92. 120. 93. 96. 65. 69. 61. 86. 重複購買人數. 0. 20. 56. 99. 99. 89. 122. 119. 142. 132. 138. 190. 全部購買人數. 98. 271. 389. 508. 600. 720. 813. 909. 974. 1043. 1104. 1190. (資料來源:本研究整理). 現在將要逐步在 Excel 上建立完整之計算模型,為了詳細介紹建立過 程,因此先以 1 月份為例,建立單月計算模型,稍後再推導出完整計算模 型。. 25.
(35) 4.2. 建立第一個月份首次購買的模型 先根據首次購買機率公式(7),可以得知一月首次購買機率 P(T1 = x) 購. 買 0 片的機率為 0,購買一片的機率為 αT / αT + βT ,為了不使 Excel 計算出現 錯誤訊息(如#NUM 或#DIV/0!) ,先給予 α T 、 βT 一個起始值,由於定 義限制 α T 、 βT >0,故先設兩值都為 1,分別儲存為 B1 及 B2 格。而購買 一片機率 P(T1 = 1) = αT / (αT + βT ) 可以藉由儲存格 C5 計算得到 1/2=0.5。. βT + x − 2 P(T = x − 1) α T + βT + x − 1 1 因此當 x=2 時,計算公式即為 P(T1 = 2) = βT + 2 − 2 P(T1 = 1) α T + βT + 2 − 1. 購買二片以上的機率為: P(T1 = x) =. 在由於 P(T1 = 1) 已經算出於 C5 格中,因此 EXCEL 中可以將 P(T1 = 2) 利. 用計算式求出於儲存格 C6 中。同理可得購買片數 3 到 19 片的機率(儲存 格 C7 到 C23),而購買 20 片以上的機率(儲存格 C24)為 1-(購買 0~19 片的機率總和)。至此,我們已經利用 EXCEL 將一月份購買 x 片數之機率 算出。現將購買 x 片之人數(儲存格 B5 到 B24)乘上該購買 x 片機率(儲 存格 C5 到 C24)之對數可得到 D5 到 D24 格之個別對數概似值,總和放在 儲存格 D2。. 圖 1 一月份首次購買機率表 26.
(36) 為了求出參數 α T 、 βT ,我們希望透過改變 α T 、 βT 能夠找出使對數概 似函數成為最大化值的結果,故利用使用 Excel 中的規劃求解功能,目標儲 存格為儲存格 D2,變數儲存格為 α T 、 βT 之儲存格 B1、B2。. 圖 2 規劃求解功能設定. 經過計算後有一解,而此時的αT、βT 及期望值 E(T1)如下: αT=2134661511 ;βT=7108427795 E(T1)=4.33. 27.
(37) 為了檢驗這個模型的適用性,我們利用卡方檢定(Chi-Square test)檢 驗,公式為 χ. 2. [n1x − E (n1x )]2 。 = ∑ E (n1x ) x =1 20 +. 首先算出期望的交易人數 E (n1x ) ,將一月份總購買人數 98 乘上各購買 片數機率 P(T1 = x) ,計算於儲存格 E5 到 E24 之中,其個別 Chi-square 值為 儲存格 F5 到 F24,總和為 χ 2 為儲存格 F25,可以看到 χ 2 =12.7 小於 5%的顯 著水準下 χ 2 (17) 的臨界值 27.59,證明這份資料符合 Shifted Beta-Geometric 分配。. 圖 3. 一月份購買機率規劃求解結果. 28.
(38) 4.3. 建立完整模型 要於 EXCEL 中建立完整模型,首先要假設模型中的六個重要參數:. 分別為代表首次購買 qT 之 Beta 分配參數αT 與βT、重複購買 qR 之 Beta 分 配參數αR 與βR 及客戶流失之指數分配參數γ與δ。先假設這些起使值於 儲存格 B2 到 B7 中,其中αT、βT、γ、αR、αR 不能為負數,因此設定 限制值為極小的正數(如 0.00001)於儲存格 C2 到 C6:. 圖 4 參數起始值及限制式. 要建立(1)式中的 P( X w = x) 計算式,不難看出(1)式其實就是在 w 週購買 x 片機率的加權平均。因此先要分別建立一月到十二月的顧客購買 片數的機率表。 先從一月份開始,要建立一張在第一個月首次購買的顧客購買片數及 這些顧客在後續十一個月中重複購買片數的機率表。首先找出在一月份購 買的會員在二月到十二月間成為“重複購買會員”的機率,根據假設三可 以得到顧客重複購買機率為一時間相關函數 γ ( w − 1 ). δ. 別計算於儲存格 D90 到 N90。. 圖 5. 顧客重複購買機率計算表 29. ,因此依照公式分.
(39) 有了每月重複購買機率後,接下來必須要知道顧客每月重複購買片數 的機率,根據顧客重複購買片數機率 P( R = x) 為. ⎧ αR , ⎪ + α β ⎪ R R P ( R = x | 可能的重複購買者) = ⎨ ⎪ ( β R + x −1) P ( R = x −1) ⎪ (α + β + x ) ⎩ R R. x =0. x ≥1. 計算出重複購買 x 片的機率 P( R = x) ,分別為儲存格 D94 到 D113 格, 同樣的其中購買 20 片以上的機率(儲存格 D114)為 1─(購買 0~19 片的 機率總和)。. 圖 6 重複購買片數機率表. 30.
(40) 將先前得到的一月份首次購買機率複製到第一個月會員購買機率總表. (圖 7)儲存格 C120 到 C139,為了更容易理解計算過程將圖 5 中顧客重複購 買機率及圖 6 中重複購買片數機率分別複製到圖 7 的儲存格 D117 到 N117 及儲存格 A119 到 A139。 第一個月客戶在第二個月重複購買片數的機率為: (在第二個月重複購 買機率)x(重複購買片數機率)。因此第二個月的重複購買片數之機率為 儲存格 D117 分別乘上儲存格 A120 到 A139 可以得到儲存格 D120 到 N139 之個別機率。而客戶不買(流失)之機率(儲存格 D118)為 1─(購買 1 到 20+片之機率總和) 。同理可計算出第三個月到第十二的月的個別機率 (儲存格 E119 到 N139) ,即得到第一個月新客戶購買片數機率總表。. 圖 7. 第一個月新客戶購買片數機率總表. 31.
(41) 接下來,要計算出第二個月新客戶購買片數機率總表,由於模型及原 理都相同,第二月份個別機率的只是將 1 月份的個別機率“延後”1 個月, 因此我們將第一個月新客戶購買片數機率總表的第一個月到第十一個月的 機率複製後貼到第二個月新客戶購買片數機率總表的第二個月到第十二個 月機率,如圖 8 所示。. 圖 8 第一、二月新客戶購買片數機率總表 32.
(42) 依此類推,便得到第三月到第十二月的機率總表。至此,十二張每月 新客戶購買片數機率總表便全部完成。接下來便可以由式(1)計算全體顧 客購買片數機率 P( X w = x) 得到這段期間全體顧客購買片數機率總表(圖 9) 。. 圖 9 全體顧客購買片數機率總表. 33.
(43) 4.4. 計算參數值. 而有了這總表後將個別機率取對數乘上實際交易人數得到個別對數概似數 。由於組數增加為 20 組,因此 LL 值表(儲存格 C42 到 N62 格)(圖 10) 的公式改寫如下,並將計算後的對數概似函數 LL 為儲存格 F2 。. ( )⎤⎦. 19. LL = ∑ m ln ⎡ P T = x ⎣ 1 x =1 1x. (. ). + m − ∑ m1x ln ⎡1− ∑ P T1 = x 1• x =1 ⎣ x =1 12. + ∑. 19. {. (. )⎤⎦. 19. ∑ mwx ln[ P ( X w = x )]. w= 2 x = 0. (. 19. ). + mw• − ∑ mwx ln ⎡1− ∑ P X w = x 19. x =0. 19. ⎣. x =0. (. }. )⎤⎦. 圖 10 對數概似函數數值表 34.
(44) 使用 Excel 的規劃求解功能計算對數概似函數最大值,目標格為 LL 之 儲存格 F2,方法為最大值,這次我們必須指定限制式為儲存格 C2 到 C6(圖. 11),進行規劃求解:. 圖 11 EXCEL 規劃求解設定圖. 計算速度很快,一般性能的電腦大約幾秒鐘即可求得一個最佳解。我 們可以用第一次找到的解作為起始值再次執行規劃求解找最佳值,檢查該 結果是否穩定,直到不再變動為止。. 35.
(45) 4.5. 建立預測模型 假設需要預測 2006 年一月起三十個月的銷售情形,於另一張試算表中. 將先前求出之參數值置於儲存格 B2 到 B7 中,先考慮第一個月的情形,客 戶在第一個月購買片數預測值可以利用(3)式求出於儲存格 C12,而後這 些客戶在第二到第三十的月的重複購買預測值可以利用(5)式求出於儲存 格 C13 到 C41。再來觀察,在第二個月加入的新顧客購買的期望值與第一 個月的購買期望值相同,只是晚一個月購買而已,因此將儲存格 C12 到 C40 複製於儲存格 D13 到 D41 即可。同理可得所有十二個月的客戶在觀察區間 的三十個月期望值總表(圖 12) 。. 圖 12 三十個月期望值總表 36.
(46) 最後,利用(9)式可以計算出每月銷售的預測值,只需利用 Excel 中 的函數 SUMPRODUCT,即可以將每月新顧客數與每月期望值相乘之後加 總,即得銷售預測值於儲存格 D12 到 D41(圖 13) ,至此已建立整個銷售 預測模型。(詳細預測值請見附件一). 圖 13 銷售預測值. 37.
(47) 4.6. 分析結果 根據重複執行規劃求解發現,計算結果並不會因為起始值的不同而有. 不同的解,因此本研究先前假設的起始值並無不妥。規劃求解找出之穩定 的最佳值後,得到參數值為下表,其中δ<0 表示隨時間增加,重複購買人 數減少,而首次購買期望值利用(3)式得到首次購買片數為 3.77 片。 表 4 規劃求解結果 變數. αT. 值. 62166.96. βT. αR. βR. 172145.1 9.716096 29.98394 (資料來源:本研究結果). 根據假設三之時間相關函數 γ ( w − 1 ). δ. γ. δ. 0.302316. -0.28408. 可以得到顧客重複購買機率如. 下表,當顧客購買後,隔月會重複購買的機率為 30.2%,相當不錯,而在一 年後還會購買的機率將近 15%。 表 5 顧客重複購買機率表 月 購買間隔. 1. 2. 3. 4. 5. 6. 重複購買機率. 30.2%. 24.8%. 22.1%. 20.4%. 19.1%. 18.2%. 購買間隔. 7. 8. 9. 10. 11. 12. 15.3%. 14.9%. 重複購買機率. 17.4% 16.7% 16.2% 15.7% (資料來源:本研究結果). 38.
(48) 重複購買機率圖 35.0%. 重 複. 重複購買機率. 30.0%. 購 買 機 率. 25.0%. 20.0%. 15.0%. 10.0%. 5.0%. 0.0% 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 時間間隔(單位:月). 圖 14 重複購買機率圖. 如果將表 5 作成圖表,分別利用線性回歸方法找出前三個月下降趨勢 線及穩定趨勢線後,可以發現在購買後第四個月為關鍵期,如果在這時間 點針對客戶提供行銷活動,將能夠發揮最大的行銷效益。 由(4)式得到的重複購買片數機率表可知,即使在可能重複購買的客 戶中,還是有 24.5%的人最後還是沒有購買。 表 6 重複購買片數機率表 重複購買數量 機率. 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 24.5% 18.0% 13.4% 10.0% 7.6% 5.8% 4.4% 3.4% 2.6% 2.1% 1.6%. 重複購買數量. 11. 12. 13. 機率. 1.3%. 1.0%. 0.8%. 14. 15. 16. 17. 18. 19. 20+. 0.6% 0.5% 0.4% 0.3% 0.3% 0.2% 1.1%. 同時我們利用卡方檢定(Chi-Square test)來檢驗這個完整模型的配適 度。將每個月總購買人數分別乘上全體顧客購買片數機率總表,得到模型 預測的第一至十二月銷售預測表(請見附件二),利用公式計算其個別. Chi-square 值(請見附件三) 。全部相加後可以得到 χ =260.34 小於 5%的顯 2. 2 著水準下 χ (233) 的臨界值 269.61,證明預測模型適合本研究資料。. 39.
(49) 交易數. 每筆交易購買數量 600. 500. 400. 實際交易. 300. 模型預測. 200. 100. 0 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 購買片數. 圖 15 單次交易購買數量分佈. 根據單次購買數量分佈情形,可以發現模型預測購買人數隨著單次購 買片數增加而逐步遞減,這是模型採用 Beta-Geometric 分配得到的結果。而 對應實際銷售情形可以發現單次購買數量符合大致符合 Beta-Geometric 分 配,較值得注意的部分在於單次購買一片及七到九片的次數低於模型預 測,而購買三到六片的次數又高於模型預測,推測可能因素為交易成本造 成之差距,因為消費者購買商品時除了要支付該光碟的購買成本外,還要 支付運費成本,商品單價平均為 300 元,單次交易未滿 900 元時須加上運 費 80 元,如果只買一片光碟則運費相當於單片光碟購買成本的四分之一, 因此購買一片的購買次數少於模型預測。而由於購買金額滿 900 元即免加 運費之優惠,可以發現單次購買數量超過 3 片(約 900 元)時,客戶的購 買行為受行銷因素鼓勵,使得購買次數高於模型預測。至於到了七片以上 時,金額大約超過 2000 元,購買行為又趨向保守,可能 2000 元為該公司 顧客在網路購物時的一個心理門檻。. 40.
(50) 銷 1200 售 量 1000. 每月銷售數量比較圖 總銷售量. 實線:實際值 虛線:模型預測. 800. 600. 重複購買銷售量 400. 200. 新顧客購買銷售量 0 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12 月份. 圖 16 每月銷售數量比較圖. 該網站平均每月交易人數為 204 人,其中新顧客為 96 人,重覆購買的 顧客為 108 人。由圖中可以看出來,新顧客的交易量有下滑的趨勢,表示 新客戶的加入有減緩之趨勢。而舊客戶的銷售量呈現穩定成長,根據顧客 重複購買機率計算結果,顯示新顧客在消費後,隔月會回來重複購買的比 率為 30%。比較模型預測及實際銷售數字可以發現,模型能夠良好掌握實 際交易量的變化,提供穩定的趨勢預測。另外發現實際銷售情形在二、七、 十二月的銷售量由較大成長,推測原因應該與該網站之主要客戶群為學生 及上班族,銷售額增加與寒、暑假及聖誕節假期有關。透過計算一月到十 二月總銷售量之平均絕對百分誤差 MPAE 結果如下表: 表 7 一月到十二月單月平均絕對百分誤差 總銷售量預 重複購買銷售量預 新顧客購買銷售量預 測 測 測 模型預測 MAPE. 9.16%. 13.7%. 8.35%. MAPE 值均小於 20%,預測績效優良,尤其是針對新客戶購買量的預 測能力。 41.
(51) 1000 銷 900 售 量 800. 每月重複銷售預測圖. 700 600 500 400. 實際銷售量. 300. Linear Projection. 200. 模型預測值. 100 0 06/1 06/2 06/3 06/4 06/5 06/6 06/7 06/8 06/9 06/10 06/11 06/12 07/1 07/2 07/3 07/4 月份. 圖 17 每月重複銷售預測圖. 將模型預測之每月會員購買數量按月統計後與實際銷售加以比較,其 中由於模型只是利用觀測期間(2006 年全年)的交易來預測現有的客戶未 來之交易情形,因此 2007/1 月到 2007/2 月的部分只計算在 2006 年曾經消 費之客戶重複購買的數量,可發現模型預測十分接近現實交易情形,能夠 準確預測舊客戶在觀測期之後的的交易量。一般企業通常利用最後一個月 的銷售值來保守預測未來的銷售量不變(圖中虛線部分) ,由圖形可以看出 當時間增加時,這個方法會與現實有極大的誤差。. 42.
(52) 銷售量. 累計銷售總數比較圖. 模型預測. 實際數量. 12000. 10000. 8000. 6000. 4000. 2000. 0 06/1. 06/2. 06/3. 06/4. 06/5. 06/6. 圖 18. 06/7. 06/8. 06/9. 06/10. 06/11. 06/12. 07/1. 07/2. 07/3. 月. 累計銷售總數比較圖. 由於每月銷售數量容易因為銷售淡旺季因素而波動較大,較難掌握銷 售趨勢,故將每月銷售量加以累計,來比較累計銷售量的預測情形。由圖 中可以看出來在累計銷售量方面,研究模型與實際交易資料十分吻合,代 表本研究模型對於預測未來銷售情形能夠充分掌握變化。另外模型預測值 大多略高於實際銷售量,因此可以將模型的預測值作為未來銷售量預測的 上限參考值,提供企業訂定未來銷售目標的參考依據。. 43.
(53) 銷售量. 累計銷售總數預測. 15500. 模型預測. 14500. 實際數量. 線性迴歸. 13500. 12500. 11500. 10500. 9500. 8500 06/11. 06/12. 07/1. 07/2. 07/3. 07/4. 07/5. 07/6. 07/7. 07/8. 月. 圖 19 累計銷售量預測與線性預測比較圖. 現將前十二個月累積銷售量做線性迴歸預測與本研究模型及實際資料 加以比較,為了容易觀察預測結果,我們將圖 17 中右半部分放大於圖 18, 可以發現預測模型大致上符合實際交易情形之變動,可以發現在 2007 年 1 月及 2 月,本研究模型比線性迴歸預測更能掌握實際銷售變化情形。 由於本研究資料只有兩個月的交易資料用來驗證,無法看出長時間下 線性預測法的差異,但利用先前提到實際累計銷售量大多稍低於模型預測 值,因此由模型預測值可以看出隨時間增加,線性預測與實際交易情形應 會有更大的誤差。除了透過圖形比較預測優劣外,可以計算本研究模型與 線性模型之平均絕對百分誤差 MPAE 結果如表 7,可以看出本研究模型預 測能力皆優於線性迴歸預測方法。 表 8 累計銷售量預測平均絕對百分誤差 前 12 個月 MAPE 第 13、14 月 MAPE. 全部 14 個月 MAPE. 線性模型. 7.76%. 1.35%. 6.85%. 本研究模型. 3.11%. 1.26%. 2.84%. 44.
數據
相關文件
無論是一般企業,或是電商、零售、餐飲、旅遊等各產業,乃至 校園社團及系務經營,都需要建立完善管理制度。因此,我們鼓 勵團隊由下述七項
分署 崑山科技大學 私立 技專校院 財務金融 財富管理與行銷學程 136 雲嘉南. 分署 大同技術學院 私立 技專校院
一、為籌劃辦理水族養殖技術士技能檢定以配合國內水族業蓬勃之發展,及相關行業
1、 網路管理與通信技術整合實務、機電控制、網拍多媒體行銷及物流從業人員
商業競爭力:2020 年瑞士洛桑國際管理學院(IMD)世界競 爭力排名(World Competitiveness ranking)將比利時列為 63 個受評比經濟體中之第
從小到大都在台中唸書,大學就讀 ○○ 大學國貿系,學習國際貿易方面的專業知識。後
國立臺北教育大學教育經營與管理學系設有文教法律碩士班及原住民文
市場學原理 電子商貿概論 營運管理學 商業財務學 專題習作. 選修單元(專修會計及財務) 計算機化會計系統