貝氏統計於選擇式聯合分析法之個人與市場
區隔參數之推論
A Bayesian Approach to the Inference of Individual and
Segment Level Parameters in Choice-Based Conjoint
Analysis
劉秀雯
1Hsiu-Wen Liu
任立中
2Lichung Jen
林育理
3Yu-Li Lin
東吳大學企業管理學系 台灣大學國際企業學系 南台科技大學企業管理系
1
Department of Business Administration, Soochow University,
2Department of
International Business, National Taiwan University, and
3Department of Business
Administration, Southern Taiwan University of Science and Technology
(Received October 8, 2008; Final Version November 5, 2010)
摘要:傳統的選擇式聯合分析法主要針對整體市場的偏好參數做推論,無法準確的針對個人層 次的參數做推論。層級貝氏的方法可有效推論個人層次參數,因其模式結合整體與個人偏好的 資訊,並以整體資訊作為先驗分配以輔助個人層次參數的推論。然而,我們認為若進一步以區 隔的資訊作為先驗分配,應可再提升參數的準確率。基於此觀點,本研究提出設定消費者異質 性偏好服從具有潛藏區隔特性的混合常態分配模型,改進過去層級貝氏方法對消費者異質性服 從常態分配假設的限制。同時,並提出此模型的市場區隔方法。因此,本研究模型主要優點為 可從一次的分析中,產生個人層次偏好係數、市場區隔層次偏好係數,以及市場區隔大小的資 訊。最後本研究以旅遊產品為例,說明此模型在選擇式聯合分析法的應用。 關鍵詞: 市場區隔、層級貝氏統計、選擇式聯合分析法
本文之通訊作者為劉秀雯,e-mail: [email protected]。 作者感謝國科會計畫經費贊助 (NSC97-2410-H-218 -001),並衷心感謝兩位匿名審查委員之細心斧正及寶 貴意見。 管 理 與 系 統 第十九卷 第四期 民國一○一年十月 673-699 頁
Journal of Management & Systems Vol. 19, No. 4, October 2012
Abstract: Doing choice-based conjoint analysis, it is a typical approach to estimate part-worths at
the aggregate level. However, hierarchical Bayes approach could overcome the limit. The Bayesian approach integrates the aggregate level parth-worths as prior information to adjust the individual level part-worths and thus individual level part-worths could be inferenced more precisely. Theoretically, the precision of individual level part-worths could be improved if the segment level part-worths are used as prior information. In view of the above reason, a hierarchical Bayes choice model with mixture of normals prior is proposed to improve the prior for the inferenc of individual part-worths. The proposed model overcomes the limits of traiditional Bayesian approaches because the traiditional approach could not provide both segment and individual levels part-worths in a conjoint analysis. In this paper, the authors illustrate how multivariate mixture of normals model could improve the understanding of those latent segments hidden in the data. Specifically, the model provides a solution for the understanding of individual preference and identifies consumer segments in an analysis. With an application to a travel service conjoint study, we show how this modeling approach could help us to uncover individual and segment levels parameters in a choice-based conjoint analysis.
Keywords: Market Segmentation, Hierarchical Bays Inference, Choice-based Conjoint Analysis
1.
緒論
如何針對消費者需求的異質性做市場區隔,以發展相對應的行銷策略,一直是行銷領域非 常重視的主題,尤其是應用於新產品開發的聯合分析法。聯合分析法可用來分析產品的屬性特 質如何影響消費者購買決策問題,因此對於廠商在新產品或服務提供的屬性開發相關決策,能 提供顧客導向的策略方案建議。聯合分析法的發展也隨著電腦與統計技術的進步,在近十多年 來有了長足的發展。尤其是選擇式聯合分析法 (choice-based conjoint analysis) 已逐漸被認定為 聯合分析法的最佳選擇 (Desarbo et al., 1995)。因為相較於傳統的聯合分析法,選擇式聯合分析 法讓受訪者從幾個選擇方案中選擇一個他最喜歡的方案,而不是要求消費者將所有的可能方案 做評分或排序,因此較能模擬消費者真實的購買情境。同時,聯合分析法在參數的推論方面亦 有許多進展,其中以可推論市場區隔參數的潛藏區隔模式 (latent class model),以及可推論個 人化參數的層級貝氏模式 (hierarchical Bayes model) 為兩大主流。雖然潛藏區隔模式具有發現 市場區隔的優點,卻無法產生穩定的個人化參數推論;而層級貝氏模式具有穩定的個人化參數
貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 675
推論,卻無法產生市場區隔化的參數。如何整合上述兩種方法,使模式能同時具有「潛藏區隔 模式」能掌握市場區隔結構的優點,以及「層級貝氏模式」能有效推論個人化參數結構的優點, 卻能同時避免上述兩種模式的缺點,為本研究的主要動機。
過 去 的 層 級 貝 氏 模 式 在 個 人 化 參 數 的 推 論 上 一 般 都 假 設 消 費 者 異 質 性 (consumer heterogeneity) 為多維常態分配 (multivariate normal distribution),然而常態分配的假設卻有一些 限制: (1) 在聯合分析法中,欲估計的參數整體分配無法在事前由研究資料得知,因此更一般化 的分配而不是特定的分配較佳。(2) 常態分配的特性使模式不易發現不對稱分配或多峰分配的 現象。因此,若能以更一般化的分配假設將可改進層級貝氏模式對消費者異質性服從常態分配 假設的限制。雖然 Allenby et al. (1998) 曾提出以貝氏混合常態分配的模式 (mixture of normal distribution) 來配適消費者的偏好分配,改進上述以常態分配來配適消費者偏好的缺點。但其 目的是以更彈性的假設來推論參數的整體分配而不是用於探討偏好之市場區隔,其主要的原因 是此模型在馬可夫鏈蒙地卡羅 (Markov chain Monte Carlo; MCMC) 方法的後驗分配上可能存 在編碼移轉的問題,例如在 r 次的吉普斯抽樣 (Gibbs Sampling) 可能將第 1, 2, 3 區隔的人分別 編碼為 1, 2, 3,但是在 r+1 次可能會變成 1, 3, 2。因此,要彙整所有後驗分配的市場區隔資訊 實際上不可得。因此,針對混合常態分配的編碼移轉的問題,本研究欲研究出一套最佳化的方 法以彙整市場區隔資訊。 基於上述原因,作者提出設定消費者異質性偏好服從具有區隔特性的混合常態分配的選擇 式聯合分析法,改進過去層級貝氏模式對消費者異質性服從整體市場常態分配假設的限制。值 得一提的是,層級貝氏的推論方式結合整體市場與個人偏好的資訊,以整體資訊作為先驗分配 輔助個人化參數的推論。因此,若能將整體的資訊改進為以市場區隔的資訊作為先驗分配,理 論上可進一步提升參數推論的準確率。 本研究所提出的分析層級貝氏混合多維常態模式的市場區隔方法,探討其在聯合分析法中 市場區隔的領域之實用性,主要的研究目的可歸納為三點: (1) 結合潛藏區隔模式與層級貝氏的優點,提供了一套兼具「發掘消費者偏好結構之市場區隔」 與「瞭解消費者個人化的偏好結構」特性的模式。 (2) 改進過去層級貝氏模式假設消費者異質性為常態分配的限制,以更一般化的混合常態分配 來配適未知的消費者異質性偏好的整體分配。 (3) 針對混合常態分配的編碼移轉的問題,本研究提出一套最佳化的方法,用以彙整市場區隔 資訊。 首先,作者將聯合分析中與市場區隔相關的文獻做一回顧。其次說明本研究的統計模式, 接著透過一個選擇式聯合分析法的實證研究驗證本模式的成效,最後為研究結果的討論與未來 研究建議的說明。
2. 文獻探討
聯合分析法可用以瞭解消費者對產品屬性的效用,是行銷領域瞭解市場偏好的重要方法, 自從 Green and Rao (1971) 提出後,許多學者不斷提出新的方法,主要的目的有二:(1 ) 改進 參數估計的方法,提升模型的正確預測能力 (Allenby and Ginter, 1995; Ogawa, 1987 等)。(2) 提 升市場區隔的決策品質 (Desarbo et al., 1995; Green, 1977; Moriarty and Venkatesan, 1978; Ogawa, 1987 等) 。然而此兩目的並不衝突,研究者經常以滿足上述條件為目標 (Currim, 1981; Ogawa, 1987)。因此,作者首先將針對聯合分析法中,與參數估計相關的市場區隔方法做一回 顧與比較,其次針對出本研究所提出的方法在聯合分析方法的理論定位做一說明。
2.1 聯合分析之市場區隔方法回顧
市場區隔方法的分類:市場區隔依「事前」或「事後」區隔以及「描述性」或「預測性」 之特性可分為四種方法:(1) 事前描述性區隔;(2) 事前預測性區隔;(3) 事後描述性區隔;(4) 事後預測性區隔 (Wedel and Kamakura, 2000)。Wedel and Kamakura (2000) 認為事後預測性的 市場區隔對行銷人員是最具效力的方法。此乃因事前區隔方法的缺點是管理者很難在事前決定 對其產品市場而言有意義的市場區隔準則。事後區隔則根據分析的結果做討論,可反應在同一 個區隔的消費者對某些看法或行為具有相同傾向。而描述性區隔方法的缺點是區隔的結果只能 描述市場狀態,無法用來預測行為意圖。預測性的區隔方法則考慮自變數和依變數的關係,因 此區隔的結果比較能用來預測消費者實際的購買偏好與行為。聯合分析法在市場區隔的發展扮 演非常關鍵性的角色,因為聯合分析法的特性可協助廠商瞭解與進行事後預測性的市場區隔。 Green (1977) 即提出聯合分析法可協助廠商進行更好的市場區隔決策,而此種基於產品屬性偏 好的區隔方法又被稱為利益區隔。組成區隔法與兩階段法:Green (1977) 以及 Green and DeSarbo (1979) 提出組成區隔法 (componential segmentation),代表聯合分析法的新延伸,其特性是結合產品分析與顧客特質的 正交排列,考慮產品的屬性組合與消費者特性的組合對產品評價的交互作用以辨認市場區隔, 亦即以產品利益和顧客特質分析市場區隔。其中,消費者的特性大多是根據其個人背景變項作 為市場作區隔的基礎。因此,此方法能分辨區隔的有效性大量依賴於區隔變數的資訊,然而個 人背景變項在區隔市場的能力上成效卻有限。另一些學者則提出兩階段法改進事前區隔的缺點 (Currim, 1981; Hauser and Urban, 1977; Moriarty and Venkatesan, 1978),目的在找出對於屬性效 用具有同質性的市場區隔。其方法是請受訪者評估每種方案購買的可能機率,然後個別的分析 每位受訪者對屬性的重視程度 (或成份效用值),接著再根據重視程度進行分群,接著再進行一 次個別分析,此種市場區隔的方法是基於消費者對屬性偏好的相似性來區隔。Moore (1980) 比 較過上述兩種方式後發現兩階段法優於組成區隔法。然而兩階段法的第一階段的有效性仍然備
貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 677
受質疑,因為這些資訊可能是建立在有偏誤的個人化參數的推論上。
預測區隔方法與逐步分群法:Ogawa (1987) 以及 Kamakura (1988) 提出層級預測區隔方 法 (hierarchical predictive segmentation approach)。此方法的特性是將消費者分群,使整個模式 在市場區隔中的正確預測率最大化。Kamakura (1988) 亦證明此法在區隔的正確預測機率優於 兩階段法。然而此法的缺點在於先前一階段的錯誤分群會影響到整個模型的估計結果。另外, 模式有參數限制的問題,經常因自由度不夠使參數無法被估計出來。因此,DeSarbo et al. (1989) 提出逐步分群迴歸 (clusterwise regression analysis) 的方法來改進上述的問題。逐步分群迴歸其 原理為根據前一次估計的消費者偏好結構將相似的消費者分群,然後重新估計一次每個人的偏 好結構,反複上述步驟,直到模式的預測正確性無法再提昇為止。然而,此方法屬於實務上的 一個解決方法,其缺點是並非經由良好的統計理論來推論參數,因此較不具備良好的統計特 性,在學術上的應用亦較少。 模糊逐步分群迴歸法與潛藏區隔模式:上述的方法除 DeSarbo et al. (1989) 之外,皆不容 許市場區隔有重疊的特性,也就是區隔間具有完全互斥性,換句話說,某一個人屬於 A 群的機 率 100%,其屬於另一 B 群的機率為 0%。然而,隨著市場區隔理論與方法的發展,容許市場 區隔有重疊特性的模式逐漸被認定為較佳的方法,因為與實際市場的狀況較接近 (Arabie et al., 1981)。且 Kamakura (1988) 亦指出非重疊性的市場區隔模式可能減低區隔的預測正確率。因 此,Wedel and Steenkamp (1989) 提出使用模糊逐步分群迴歸法 (fuzzy clusterwise regression analysis) 法,將消費者分屬於不同區隔的資訊以機率的方式來表示。雖然模糊的方法提供了一 套有利的方法,但缺點是研究者需要主觀的設定一些模糊權重的參數,因此不具有良好的統計 特性。此外,參數的解經常為局部最佳解,不一定為全局最佳解。隨後 Kamakura et al. (1994) 致力於發展潛藏區隔模式 (latent class model)。上述方法的特性是在一次的參數估計中,可得 到不同偏好市場區隔的的資訊,並且容許區隔具有重疊的資訊。然而此方法也有兩個關鍵性的 缺點 (1) 假設同一區隔內消費者偏好具同質性,故被評價為是較不符合實際情況的假設。(2) 參數的解不一定是最佳解,因受限於局部最小值的影響。
層級貝氏個人化參數推論法:Allenby and Ginter (1995) 首次將層級貝氏模式應用於聯合分 析法個人偏好參數之推論,此法基於貝氏統計的原理有效結合整體市場與個人偏好的資訊,並 以整體市場資訊作為先驗分配以輔助個人化參數的推論。此方法被認為較具有穩健的個人化參 數估計的能力,許多研究證實層級貝氏模式具備穩健的個人化參數估計的能力 (林婷鈴等,民 96; 任立中等,民 95; 任立中等,民 96; Allenby and Ginter, 1995; Allenby et al., 2004)。Allenby and Ginter (1995) 將層級貝氏模式與潛藏區隔模式的正確預測率做一比較,發現層級貝氏模式的預 測正確性優於潛藏區隔模式。由於層級貝氏可得到個人化的偏好結構,使一對一行銷成為可行 的方法 (即一人區隔)。廠商可根據顧客個人化的偏好提供產品推薦,有效提升其經營與獲利能
力 (Rossi and Allenby, 2003)。 表 1 為作者根據上述幾個關鍵的市場區隔特性,將學者所提出聯合分析法之參數估計方法 做一綜合比較。這些關鍵特性分別為:(1) 應用於選擇式聯合分析法、(2) 基於統計推論的特 性、(3) 容許集群間具有重疊的特性、(4) 可推論個人化的偏好參數,以及(5) 同時推論個人化 與市場區隔參數。而選擇式的聯合分析法因其較能模擬消費者真實的購買情境的特性,故被列 為一個良好的特性。早期的學者多是針對排序性或評分性的聯合分析法提出推論市場區隔偏好 參數的方法 (Green, 1977; Green and DeSarbo, 1979),而近期學者則多是以選擇式聯合分析法為 主 (Kamakura and Russa, 1989)。Allenby and Ginter (1995) 與 Allenby et al. (1998) 提出的層級 貝氏法主要在個人化參數的推論,故不具市場區隔的特性。另外,在個人化參數的推論方面, 在傳統的聯合分析法中,迴歸分析被應用於針對每一個個人的資料做一次迴歸分析,因此雖可 得出個人化的參數,但其所估計的參數預測能力較差。相對的,層級貝氏的統計推論方法被認 為較具較佳的個人化參數估計的能力 (Allenby and Ginter, 1995; Allenby et al., 1998; Jen et al., 2009)。
2.2 本研究在聯合分析方法的定位與討論
從上述文獻回顧可知學者不斷提出新的方法目的在 (1) 改進參數估計的方法,提升模型的 正確預測能力。(2) 提升市場區隔決策資訊品質。前者的發展至目前以層級貝氏的參數估計法 為最佳代表,後者則以潛藏區隔模式為最佳代表,本研究試圖整合此兩種方法的優點。首先, 本研究所之統計模式承襲層級貝氏方法的優點,故可提升模型在推論個人化偏好參數的正確預 測能力。其次,本研究使用混合常態分配來配適整體消費者偏好的分配,並提出能選擇最適編 碼資訊的市場區隔法,因此可以同時推論個人化與市場區隔層次的參數,且由於混合常態的特 性,本研究所提出的模型亦具有容許區隔重疊的特性。本研究所提出之層級貝氏模式可同時符 合表一所有條件的特性。值得一提的是,在理論上,本研究的貝氏統計模式具有非常良好的統 計特性,在對個人的參數推論上,是以具有以相似偏好結構的人們作為其先驗分配,因此可強 化對個人的參數估計。亦即當個體的參數資訊不足時,將以同一區隔內群體的訊息作為先驗分 配來強化對個體參數的估計,有別於過去以整體市場資訊作為先驗分配的層級貝氏統計方法。 因此,本研究的模式不但在理論上提供了一套更優於過去的方法。策略上,此模式提供更豐富 的資訊以協助管理者進行市場區隔決策的預測與分析。表 1 聯合分析之市場區隔方法比較 代表性研究 方法名稱 應用於選 擇式 聯合分析 法 具備良好 統計 推論特性 的方 法 容許集群 間具 有重疊的 特性 可推論個 人化 的偏好參 數 同時推論 個人 化與市場 區隔 參數
Green (1977); Green and DeSarbo (1979) 組成區隔法 Hauser and Urban (1977); Moriarty and
Venkatesan (1978); Currim (1981)
兩階段法
Regression conjoint analysis + clustering
Ogawa 1987; Kamakura (1988) 層級預測區隔法
DeSarbo et al. (1989) 逐步分群迴歸
Wedel and Steenkamp (1989) 模糊逐步分群迴歸 Kamakura and Russa (1989) 逐步間斷選擇模式 Kamakura et al. (1994) 潛藏區隔模式
Allenby and Ginter (1995) 層級貝氏模式常態異質性假設 Allenby et al. (1998) 層級貝氏模式混合常態異質性 假設 本研究 層級貝氏選擇式聯合分析法的 市場區隔模型 資料來源:本研究整理 貝氏統計 於選擇 式聯合分 析法之 個人與市 場區隔 參數之推 論 679
3. 模式
3.1 模式說明
本研究之目的在於以混合常態模式作為層級貝氏邏輯模式 (hierarchical Bayes Logit model) 之消費者異質性偏好分配之假設,並提出混合常態模式之市場區隔的方法。在以下的內容中, 作者將依序說明此統計模式之理論基礎、參數的推論方法以及取得市場區隔資訊的方法。
根據隨機效用模型 (random utility model),假設某一位消費者在面對 J 個不同選擇時,他
是選擇對他而言效用最高的一個選擇。以 Uj表示消費者對 j 的效用是高於所有其他的選擇。若 將 Uj 區分為可被研究者觀察到的效用 Vj,以及不可觀察到的效用
j兩個成份。則 Uj = Vj +
j。則消費者選擇 j 的機率可表示為 (1)式 Pr(y j X, ) =P(Uj Uc for all ) c c1,..., J c j = P(c(V Vj- c)+j for all ) c = ( ) ... ( , ) c c j j c Vj Vc f d d
(1)假設
1…
j服從極值分配 (Type I extreme value distribution) 亦即( )
exp(
j)
j
F
e
。 且令Vj xj,其中x 代表 j 產品的屬性編碼 (模式之解釋變數)。j 代表屬性之偏好係數, 則 (1)式可改寫成 (2)式,而 (2)式又稱為邏輯模式 (Logit Model)。 1 exp( ) Pr( , ) exp( ) j i J m i m x y j X x
(2) 選擇式聯合分析常引用邏輯模式來表示消費者 i 在面對許多選擇中選擇某一產品的機率。 現在假設有 n 個受訪者 i = 1, 2,.., n,每個受訪者面對 S 組不同的產品購買情境 s = 1, 2,.., S。每 個模擬的購買情境有 J 個選擇。則 (2) 式可更精細的寫成 (3) 式。 1 exp( ) Pr( , ) exp( ) isj i is is i J ism i m x y j X x
(3) (3)式中X
is代表消費者 i 在第 s 次的選擇組合中所面對的 J 個不同選擇之產品屬性組合, isj x 則更精準的表示消費者 i 在第 s 次的選擇組合中之第 j 個產品的屬性 (為統計模式中的解釋 變數)。Pr(yis j Xis,i)表示在給定此消費者 i 的偏好結構 ( ),以及其所面對第 s 次的選擇i 情境下 (X
is),會選擇 j 產品的機率。yis代表第 i 個消費者,在第 s 個購買情境的選擇 (yis=1, 2,.., J)。 代表消費者 i 的偏好結構 (i = 1, 2,.., n),為模式需推論的參數,也就是個人化的偏好i貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 681 結構,在聯合分析法中亦稱為成份效用值 (part-worth)。 透過層級貝氏的參數推論方法,可協助我們推論出個人化的參數偏好結構。(4)式之 ( i Data) 為消費者 i 之個人化的偏好結構參數之後驗分配,根據貝氏統計的理論,對個人化 參數的後驗分配之推論是結合個人選擇資料的資訊 i(Datai) 與群體的先驗資訊 p( i) 的結果。若個人化參數的資訊不穩定時 (變異較大時),可藉由結合群體的資訊產生較佳的結 果 。 因 此 , 若 能 事 先 將 相 似 的 消 費 者 分 群 , 以 此 集 群 的 消 費 者 的 資 訊 作 為 先 驗 資 訊 ( i) ~ ( k, k) p N (若消費者 i 屬於第 k 個市場區隔), 為第 k 個區隔內所有樣本偏好結構之k 平均數,k為第 k 個區隔內所有樣本偏好結構之共變異數矩陣),則相對於以所有樣本的資訊 作為先驗資訊如p(i) ~N( , )( 為所有樣本偏好結構之平均數, 為所有樣本偏好結構 之共變異數矩陣),理論上將可因為較佳的先驗資訊而產生較佳的後驗分配之推論。 1 1 ( ) ( ) ( ) Pr( , ) ( ) isj i i i i S J is is i i s j Data Data p y j X p
(4) 在 (4)式中 S1 J1Pr( , )isj s j yis j Xis i
代表第 i 個消費者所有產品選擇的聯合機率分配。 是一個指標變數,isj 為 1 若消費者 i 在第 s 次的選擇中,選擇 j 產品。isj 為 0 若選非isj
j 產品。舉例來說,若消費者 i 在第 s 次的選擇中,從三個可能選擇中選擇了第 2 個產品則 =1,is2 1 is = =0,is3 J1Pr( , )isj j yis j Xis i
值如 (5)式所列 1Pr( , ) isj J j yis j Xis i
1 2 3 2 3 3 3 3 1 1 1 1 0 1 0 1exp( ) exp( ) exp( ) exp( ) exp( ) . exp( ) . exp( ) exp( )
is i is i is i is i ism i ism i ism i ism i m m m m x x x x x x x x (5) 本 研 究 的 目 的 則 在 運 用 層 級 貝 氏 方 法 來 推 論 個 人 化 與偏好之市場區隔化的參數i k , 。更具體來說,本研究以混合多維常態分配來配適消費者偏好結構的特性。若消費者偏k 好以三個常態分配所組成的混合常態來配適,則這三個常態分配則代表了三個市場區隔的偏好 資訊,為使觀念易於理解,本文命名省略多維概念。多維則是因為模式對於產品屬性的偏好是 一次推論多個屬性偏好,故稱之為偏好結構。運用多維常態分配來代表市場區隔資訊的原因 是,因為在同一個多維常態分配中之消費者具有相似的偏好結構,可符合行銷中市場區隔的定 義。若有 K 個市場區隔時,消費者 i 的個人化參數結構 可能來自其中一個多維常態母體。i 例如假設研究者以兩個多維常態來配適消費者異質性偏好結構時模式時,消費者 i 可能來自第 一個多維常態母體或來自第二個多維常態母體。i ~ (N 或 1, )1 i ~ (N 。若消費2, )2 者 i 來自第一個常態母體時,indi=1。i ~ (N 。故以 (6) 式來表示消費者異質性服從1, )1
混合常態分配,以ind 類別標籤來代表他所來自的多維常態母體i (indi=1, …, K)。 ~ ( i, ) i i N ind ind (6) 此外,模式中相關參數之先驗分配可採用貝氏統計中自然共軛之機率分配設定,故將模式 中其他相關參數之先驗分配作如下的設定。因ind 所代表的類別標籤為名目變數i indi=1, …, K,其自然共軛之先驗機率分配服從多項式分配,如 (7)式所示indi ~ Multinomial( 。其中i) i 代表消費者 i 來自 K 個多維常態母體的機率 ( i= i1, i2,., )。(8) 式之 為 K 個機率值,代ik 表每個多維常態母體相對大小的資訊,可用來反應每個市場區隔大小的資訊,其自然共軛之先 驗分配服從 Dirichlet( ) 分配。(9) 式之 為第 k 個多維常態的平均數,其自然共軛先驗機率為k 常態分配 ~ ( , 1) k N k a 。 為整體樣本偏好的平均數,a 1 為一個先驗參數 (prior), 為k 第 k 個多維常態分配的共變異矩陣,其自然共軛先驗分配為 Inverse-Wishart 分配,如 (10) 式 所示 k ~IW v V( ,0 0)。其中 v V0, 0 為一個先驗資訊 1。 ~ Multinomial( ) i i ind ~ Dirichlet( ) 1 ~ ( , ) k N k a 0 0 ~ ( , ) k IW v V (7) (8) (9) (10) 值得一提的是,在貝氏統計中,使用自然共軛先驗 (natural conjugate prior) 分配具有方便
推論的好處。舉例來說,如 (11) 式所列,在貝氏迴歸模式中,其欲推論的參數 之概似函數 (Data) 服從常態分配,若假設其先驗分配 ( )p 服從常態分配,則其後驗分配 ( Data)亦 服從常態分配。然而,當研究者依其研究目的認為該模式之先驗分配服從混合常態分配時,則 (10) 式之 ( Data)將服從一未知的分配。在過去統計計算能力未發達的時候研究者將無法推 論出 ( Data)的值,但今日已可透過 Metrolis-Hasting 的抽樣方法來推論。 ( Data) (Data ) p( ) (11)
3.2 參數的推論方法
根據貝氏統計之理論,欲推論參數的後驗機率分配可從此分配中抽出無數次的值所形成之 分配來代表。若此後驗分配符從已知的分配則可用吉普斯抽樣方法 (上述利用自然共軛先驗分 配所形成之後驗分配的參數indi,
i,
k ),若不符從已知的分配 (如 k ( i Data) ) 可使用Metrolis-Hasting 的抽樣方法 (Chib and Greenberg, 1995),上述兩種方法皆屬於廣義的 MCMC
1
其中貝氏推論之混合常態模式的理論有興趣的讀者請參考 Rossi et al. (2005) 一書之 3.9 節,或 Allenby et al. (1998) 之研究。
貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 683
(Markov chain Monte Carlo) 的方法。故欲推論上述模式的所有參數必需要運用到吉普斯抽樣和 Metrolis-Hasting 兩種方法,詳細的參數推論方法請參見附錄二。作者並以模擬的資料與參數來 探測此模式所推論之參數與真實設定參數的差異來評估模式的優劣,結果發現模式回估參數的 能力良好2。
3.3 取得市場區隔資訊
從後驗分配之每一次吉普斯抽樣中,我們可以得到個體是屬於哪一個區隔的編碼資訊 i ind ,我們可以用這些編碼資訊來建立每一回抽樣中受訪者的相似矩陣[ r] ij n n a ,其中 r ij a 代表 第 r 次吉普斯抽樣之相似矩陣內的元素3,此相似矩陣為 n 行與 n 列的矩陣,n 代表總人數。 作者以每一回吉普斯抽樣之相似矩陣內元素總平均值來代表對此模式之相似矩陣的最終推 論,我們稱此矩陣為「後驗平均之相似矩陣」並以 [ ]aij n n 代表此矩陣內的每一個元素, / R r ij r ij a a R,R 為扣除 burn in 階段後之吉普斯抽樣總次數。作者認為可比較每一回吉普斯抽 樣的相似矩陣,找出最接近後驗平均之相似矩陣的那一次吉普斯抽樣的編碼資訊來代表消費者 所屬之市場區隔的編碼資訊。 作者提出三種比較兩個矩陣相似性的方法,第一種是選取兩矩陣相減之總和絕對誤差值最 小的方法。第二種是兩矩陣相減之總和平方誤差值最小的方法,第三種是根據兩個矩陣的總變 異最小的方法。請參考 (12) 至 (14)式。f a
ijr, aij
為損失函數 (loss function)。 r ij a 代表第r 次吉普斯抽樣之相似矩陣內的元素。 a 代表後驗分配平均值之相似矩陣內的元素。ij a 代表ijr 第 r 次吉普斯抽樣之相似矩陣內的元素之總平均 ( 2 / r n n r ij i j ij a a n )。a 代表後驗分配平均值ij 之相似矩陣內的元素之總平均 ( 2 / n n i j aij n )。故方法一與方法二之函數代表某一次的吉普斯 抽樣之相似矩陣內的元素與後驗分配平均值之相似矩陣內的元素之差異,二者皆有取差異總和 最小之意。而方法三之函數則有取某一次的吉普斯抽樣之相似矩陣內的元素與後驗分配平均值 之相似矩陣內的元素的變異總和最小之用意。 評估方法 I: min
1 1 Loss , | | 1,..., n n r r ij ij ij ij i j f a a a a r R
(12) 評估方法 II: min
2 1 1 Loss , ( ) 1,..., n n r r ij ij ij ij i j f a a a a r R
(13) 評估方法 III: min
2 1 1 Loss , ( ) 1,..., n n r r r ij ij ij ij ij ij i j f a a a a a a r R
(14) 經過模擬資料與實際資料的測試,發現方法 I 與方法 II 的所選出的最能代表後驗相似矩陣2 有興趣的讀者可向作者索取模擬的結果。 3 文中第 r 次抽樣指的是 MCMC 方法扣除 burn in 階段後之第 r 次抽樣。
的第 r 回吉普斯抽樣完全相同,代表此兩方法的區隔結果完全相同。作者從許多次的模擬資料 均發現,方法 I 與方法 II 的區隔資訊的參數回復能力比方法 III 好,由於方法 I 最為省時且回 覆參數的能力最佳,因此,本研究將使用方法 I 做為市場區隔參數之推論方法。透過前述之方 法,我們得以取得每一位受訪者所屬市場區隔的資訊。
4. 實證研究
本研究透過聯合分析法,驗證本文所提模式在同時推論消費者個人與區隔偏好之可行性。4.1 進行步驟
以泰國旅遊產品為例,作者先與旅行業者討論,並蒐集各大網站、雜誌資訊,以彙整出重 要的屬性,初步得到六個屬性:價位、旅行天數、餐飲內容、航空公司、住宿等級、旅遊平安 險內容。接著設計出第一個階段的紙本問卷並進行市場調查,以確認這些屬性是消費者旅遊時 所重視的屬性項目。在確認重要的產品屬性後,接著進行聯合分析法的實驗設計,然後邀請受 訪者進行研究聯合分析實驗,並以電腦問卷方式進行聯合分析法的資料蒐集。最後,運用層級 貝式混合常態分配來分析消費者的區隔資訊與個人化的偏好結構。4.2 聯合分析法之實驗設計
在問卷的設計上,本研究採取呈現產品完整屬性 (full profile) 的方式,將四個不同的產品 呈現在受訪者的面前,讓受訪者可以從當中選擇一個。此種聯合分析法即稱為選擇式的聯合分 析法。本研究利用 Sawtooth 之聯合分析軟體的實驗設計,每位受訪者需回答 10 個題數,每個 題數中受訪者被要求從四個選擇當中,點選一個他最喜歡的選擇,其中包含「以上皆不喜歡」 的選項。為比較不同模式的差異,本研究將所提出的模式與總和邏輯模式做比較。在總和邏輯 模式中,會估計出一組成份效用值參數以代表整體市場平均之偏好結構。相對應的,在本研究 的模型中,每位受訪者個人化的成份效用值參數皆可經由本研究的模式推論出。4.3 樣本
本研究在南部地區各大旅行社邀請受訪者參與實驗。受訪者需符合曾有出國旅遊經驗、年 滿 21 歲以上且有經濟能力的條件。結果共有 287 位受訪者參與並完成實驗。關於樣本的資訊 描述如下:男性佔 40.8%、女性 59.2%。已婚佔 28.6%。21-30 歲、31-40 歲以及 41 歲以上分 別為 49.1%、39.4% 以及 11.5%。個人平均年薪在 30 萬以下、31-50 萬、51 萬-100 萬以及 101 萬以上分別佔 26.1%、39.0%、28.9% 以及 5.9%。貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 685
4.4 資料蒐集
資料的蒐集分成兩個階段:第一個階段決定聯合分析法產品的重要屬性與水準。第二階段 蒐集聯合分析的資料。第一階段的前測問卷共有 100 位受訪者填答,回收有效問卷 73 份,使 我們確認價位、天數、餐飲、航空公司、住宿與保險理賠金額等的確是消費者認為重要的屬性, 重要程度在 100 分的評價上的平均分數皆在 76 分以上,其中價位 79.32 分,天數 76.71 分,飲 食 86.30 分,航空公司 84.52 分,住宿 93.56 分,旅遊保險 99.45 分。在第二階段的聯合分析實 驗則是邀請前來旅行業者公司內的顧客參與實驗,完成資料的蒐集。共有 287 位受訪者完成填 答。每位填答者完成 10 個選擇題目 (參見附錄一)。本研究將前 8 筆資料作為消費者偏好模型 的建立,留最 2 筆測試模型樣本外的預測能力。因此,共用 2296 (287 x 8) 筆資訊建立模型, 保留 574 (287 x 2) 筆做模型預測。5. 結果與討論
5.1 模式配適度
表 2 為模式的估計結果。模式 1 為不考慮消費者異質性的總和邏輯模式 (aggregate Logit model)。模式 2 為考慮消費者異質性服從混合多維常態分配的模式。本研究將分別比較消費者 的異質性為一個至四個多維常態分配的情況。模式 1 是透過最大概似法得出的結果。層級貝式 混合多維常態聯合分析模式則是透過 MCMC 的方法推論相關的參數。模式 1 的結果顯示,其 衡量模式概似函數的邊際機率值為 -2165,運用層級貝氏模式且考慮消費者異質性模式的結果 使對數概似函數的值大幅提昇,代表本研究所提出的模式以及所估計的參數能反應受訪者的選 擇行為的機率較高。其中,以考慮四個多維常態的值最大,其次為兩個多維常態的情況。另外, MAD 的值代表模式所預測的選擇與真實選擇的誤差,其質愈小愈好。從樣本內的 MAD 值來 看,總和邏輯模式的值為 0.429,然而本研究所提出的模式使的預測誤差的情況大幅縮小4,MAD 值均在 0.006 以下,以考慮兩個多維常態來配適消費者異質性偏好的情況為例,在所有 287 位 受訪者,共 2296 次樣本內的選擇資料中,有 2284 筆資料是完全預測正確。此結果顯示本研究 模式樣本內的配適程度非常的好。在樣本外的預測方面,總和邏輯模式的 MAD 值為 0.531 最 差。考慮混合兩個或三個多維常態的模式樣本外的 MAD 則幾乎沒有什麼差異。綜合上述的結 果以及本研究想探究潛藏之市場區隔的目的,研究者選擇以混合兩個多維常態來反應消費者的 異質性偏好結構。原因如下 (1) 此模式在樣本內與樣本外的預測能力良好,與三個多維常態的 情況不分軒輊,但兩的多維常態模式的概似函數機率值較大,顯示兩個多維常態的模式較三個4 根據每位受訪者之後驗分配平均值來代表每個人的偏好結構
表 2 模式配適度
樣 本 內 預 測
模 式 log-likelihood MAD2 MAD
模式 1: 總和邏輯模式 (Logit Model) -2165.201 0.429 0.531 模式 2: 層級貝式混合多維常態聯合分析模型 消費者異質性為 1 個多維常態 -722.4081 0.006 0.517 消費者異質性為 2 個多維常態 -543.748 0.004 0.497 消費者異質性為 3 個多維常態 -591.562 0.003 0.495 消費者異質性為 4 個多維常態 -499.347 0.003 0.517
1 為 Log marginal density 衡量模式概似函數的邊際機率 (值愈大的模式較佳) ,在貝式模式中,使用 Newton and Raftery 所提出的透過 GHK 與 importance sampling 的方法來估計。
2 MAD (Mean absolute difference) 衡量實際資料與預測資料誤差的指標 (值愈小的模式較佳),在本 研究中每個選擇為四選一,因此隨機預測應該有 0.25 的正確機率,也就是 0.75 的 MAD。 多維常態的模式佳。(2) 實際比較三個多維常態的情況時,發現其中一個多維常態的人數很少。 若從兩個多維常態的資料來看,其人數比為 64.3% 比 35.7%,符合本研究想探究具有代表性的 市場區隔資訊。因此,後續部份的討論將以層級貝式混合多維常態聯合分析模型之消費者異質 性為兩個多維常態的結果。
5.2 區隔之參數估計結果
此模式優點是同時可獲得市場區隔的資訊以及受訪者個體個人化偏好的資訊。在此我們先 呈現區隔偏好的結果。表 3 為層級貝式混合多維常態聯合分析模型之消費者異質性為兩個多維 常態模式的結果 (該表使用了本研究提出之區隔方法 I)。該結果顯示,消費者泰國旅遊的偏好 結構整體而言有兩個偏好區隔,這兩個區隔分別包含了 64.3% 與 35.7% 的消費者。第一個區 隔的人數較多,從他們的偏好的平均值顯示出此區隔的消費者最重視的屬性是住宿,尤其是五 星級飯店,相對於民宿的選擇,五星級飯店的偏好高出 9.225,對四星級飯店的評價高出民宿 4.950。在價位上,相對於 20000 元以上的套裝行程。比較偏好價位在 10000 元-15000 元之間 ( =4.678),其次為 15000 元-20000 元之間 ( =4.004),對於 10000 以下的套裝行程的偏好為 2.116 ( =2.116)。對於所搭乘的飛機,相對於其他航空公司的偏好,長榮航空最高 ( =4.376), 其次是華航 ( =2.499)。對於飲食方面,比較偏好有提供餐飲,至於是自助餐或合菜的偏好則 沒有太大的差異。在保費方面,相對於 800 萬的旅遊平安險,此區隔的受訪者最不喜歡 100 萬 的旅遊平安險 ( =-3.198),其次為 200 萬 ( =-1.805)。該第一區隔整體來說,對旅遊的天數 較不重視。相對的,第二個區隔的資訊顯示,他們對於旅遊的天數最為重視,而且相對於七天 六夜的旅程,他們較偏好六天五夜 ( =4.335),其次為五天四夜 ( =4.132),再其次為四天三貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 687 表 3 區隔之參數估計結果 屬 性 水 準 係數 第 1 個相似偏好群體 第 2 個相似偏好群體 平均數 標準差1 平均數 標準差 價 位 10000 元以下 1 2.116 3.419 -0.672 5.752 10001~15000 元 2 4.687 5.444 0.354 3.172 15001~20000 元 3 4.004 3.314 1.287 3.775 20001 元以上
--
天 數 四天三夜 4 -1.511 3.286 2.559 2.948 五天四夜 5 -0.959 2.635 4.132 3.300 六天五夜 6 -0.986 2.842 4.335 2.914 七天六夜--
飲 食 自助餐 7 3.278 4.541 0.683 2.118 合菜 8 3.390 4.388 0.496 3.526 自理--
搭乘飛機 泰航 9 -0.069 3.373 -0.697 1.558 華航 10 2.499 2.183 -1.996 2.538 長榮 11 4.376 5.665 2.737 2.745 其他航空公司--
住 宿 五星級飯店 12 9.225 4.503 1.353 2.245 四星級飯店 13 4.950 2.489 1.371 1.986 民宿--
旅遊平安險 100 萬 14 -3.198 2.481 -1.687 3.142 200 萬 15 -1.805 4.741 -1.586 2.458 300 萬 16 0.174 2.500 -0.754 5.414 500 萬 1~
17 -0.460 1.073 -0.134 2.889 800 萬--
區隔人數佔市場比例 0.643 0.357 -- 虛擬變數之省略變數 1 區隔係數之標準差,其數值反應同一區隔消費者對該偏好異質性的大小 夜。相較於其他航空公司,他們對長榮航空有較高的偏好 ( =2.737),對於華航的偏好係數是 負的 ( =-1.996)。對於餐飲以及旅遊平安保險方面,較不重視。 第二個區隔的消費者對旅遊業者來說,可能是一個容易被忽視,卻可能是高獲利的市場區 隔。因第二區隔的消費者價格敏感度相對較低,也比較不在乎是否為高級飯店或是否提供餐 飲,亦沒有特別重視國內或國外航空公司,而此區隔人數亦佔了三成多,算是相當值得注意的 比例。相對的,第一個區隔的消費者特別重視五星級飯店所提供的價值。旅行業者若想針對此區隔的消費者行銷,可專注在與高級飯店的合作與宣傳內容,有提供餐飲的旅遊行程、國內航 空公司尤其是長榮航空亦是第一區隔所特別偏愛的。 在考慮兩個群體平均值的差異後,我們應該更精細的思考同一個群體內的看法相似性的程 度。此資訊可由表 3 的標準差來討論,其數值反應同一區隔消費者對該偏好異質性的相對大小。 為使讀者有更清楚的輪廓,本研究以兩個區隔各自的邊際機率分配來呈現其偏好分配的情況 (請見圖 1)。在此 17 個圖形中,黑色線的分配較大,為第一個市場區隔偏好的邊際分配。灰色 線的區隔較小,反應的是第二個市場區隔偏好的邊際分配。此圖之橫軸代表的是消費者對產品 屬性偏好的大小,縱軸代表邊際機率。從此圖形中,我們可以觀察到此兩個群體在某些屬性的 水準偏好具有相似性,有些則具有差異性。例如:圖 1 的第 2 個圖即代表消費者對於價格在 『10000-15000 元』產品屬性的偏好結構之兩個市場區隔的分配情況。大於 0 以上的值代表對 於此產品屬性的偏好為正值,小於 0 代表對此產品屬性的偏好為負值。此圖中第二個區隔的消 費者 (灰色線) 的偏好分配呈現一個對稱於 0 的常態分配,因此,從圖形中可看出約有一半喜 歡、一半不喜歡此產品屬性。而第一個區隔為黑色的常態分配,大於 0 以上的人較多,因此第 一個區隔的人相對於第二個區隔的人重視此產品屬性。 在圖 2 的黑色線條為整體市場偏好的邊際分配情況,為混合常態後驗分配的平均值,可反 應整體市場的偏好結構。為了區別本研究的層級貝氏混合兩個常態異質性模式與一個常態異質 性偏好邊際分配之差異。作者將一個常態異質性的情況以灰色的線條來表示。此圖顯示消費者 異質性分配並不完全呈現常態分配。在此圖中可觀察到消費者的偏好呈現不對稱分配的特質, 而在五星級與四星級飯店上更呈現了雙峰的特質。顯示層級貝氏混合常態模式較能發掘資料中 所隱藏的消費者異質性偏好分配之結構。整體而言,研究者認為此模式不但能瞭解消費者偏好 的異質性,也可以瞭解消費者偏好在不同區隔的相似或差異性。因此,相對於其他模式提供了 較豐富的資訊供管理者參考。
5.3 個人化參數的推論與空間圖分析
透過迴歸分析法,我們以個人化的參數的估計結果為應變數,探討受訪者個人的背景變項 與其對旅遊產品屬性偏好的關連性。結果發現,個人背景變項對對旅遊產品屬性偏好差異的解 釋能力很低。所有 17 個迴歸分析中,個人背景變項只有對 10000 以下的套裝行程的模式具有 顯著的解釋能力。因此,表 4 只列出對價位在 10000 以下的套裝行程的偏好之迴歸分析之結果。 此表顯示相對於未婚者,已婚者比較不喜歡此屬性水準。相對於年薪 50 萬以上的受訪者,年 薪在 30 萬以下的受訪者較喜歡價位在 10000 以下的套裝行程。整體而言,我們發現個人背景 變項對其偏好結構的解釋能力很低。 此外,作者使用個人背景資訊為自變數,受訪者所屬區隔的資訊編碼為應變數,以邏輯斯價位: 10000 元以下 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 價位:10001-15000 元 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 價位:15001-20000 元 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 四天三夜 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 五天四夜 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 六天五夜 機 率密度 -20 -10 0 10 20 0.0 0 0.04 0.08 0 .12 吃到飽 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 合菜 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 泰國航空 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 中華航空 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 長榮航空 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 飯店:五星級 機率 密度 -20 -10 0 10 20 0.00 0.04 0.0 8 0.12 飯店:四星級 機率 密度 -20 -10 0 10 20 0.00 0 .04 0.0 8 0.12 保額:一百萬 機率 密度 -20 -10 0 10 20 0.00 0 .04 0.0 8 0.12 保額:200萬 機率 密度 -20 -10 0 10 20 0.00 0 .04 0.0 8 0.12 保額:300萬 機率 密度 -20 -10 0 10 20 0.00 0 .04 0.0 8 0.12 保額500萬 機率 密度 -20 -10 0 10 20 0.00 0. 10 0.20 註:黑色線為第一個市場區隔的偏好,灰色線為第二個市場區隔的偏好
圖 1 兩個市場區隔偏好的邊際分配之比較
貝氏統計 於選擇 式聯合分 析法之 個人與市 場區隔 參數之推 論 689價位: 10000 元以下 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 價位:10001-15000 元 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 價位:15001-20000 元 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 四天三夜 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 五天四夜 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 六天五夜 機率密度 -20 -10 0 10 20 0.00 0 .05 0 .10 0 .1 5 吃到飽 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 合菜 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 泰國航空 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 中華航空 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 長榮航空 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 飯店:五星級 機 率密度 -20 -10 0 10 20 0. 00 0 .05 0. 10 0. 15 飯店:四星級 機率密度 -20 -10 0 10 20 0.0 0 0.0 5 0.10 0 .15 保額:一百萬 機率密度 -20 -10 0 10 20 0.0 0 0.0 5 0.10 0 .15 保額:200萬 機率密度 -20 -10 0 10 20 0.0 0 0.0 5 0.10 0 .15 保額:300萬 機率密度 -20 -10 0 10 20 0.0 0 0.0 5 0.10 0 .15 保額500萬 機率密度 -20 -10 0 10 20 0 .00 0. 1 0 0. 2 0 註:黑色線為層級貝氏混合兩個常態異質性的邊際分配(本研究模式),灰色線為層級貝氏常態異質性的邊際分配 圖 2 層級貝氏兩個混合常態異質性與一個常態異質性偏好邊際分配之比較 管理與系統
貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 691 表 4 對價位在 10000 以下的套裝行程的偏好1之迴歸分析 應變數:對價位在 10000 以下的套裝行程的偏好1 係數 標準差 t 值 顯著水準 常數項 1.84 0.93 1.98 0.05 男性 0.74 0.50 1.47 0.14 已婚 -1.25 0.66 -1.90 0.06 20-30 歲 0.44 0.96 0.46 0.64 30-40 歲 0.82 0.86 0.95 0.34 年薪 30 萬以下 1.52 0.72 2.13 0.03 年薪 30-50 萬 0.19 0.61 0.32 0.75 F-Value 2.97 0.08
R
2 0.04 迴歸 (Logistic Regression) 模型來估計,希望能找出能區隔兩個市場的變數,結果顯示模式的預 測的正確率與隨機猜測沒有什麼差異。這些資訊均顯示,若旅遊業者以個人背景變項作為市場 區隔的方法,對消費者選擇產品的預測能力將是有限的,故建議旅遊業者應採用本研究模型的 方法來探討旅遊市場的利益區隔與消費者的異質性偏好。 圖 3 顯示受訪者對套裝旅遊產品偏好之空間分析圖,圖中的 1 標籤編碼代表第一個群體的 受訪者,2 標籤編碼代表第二個群體的受訪者。產品的屬性水準也呈現在此圖中。從此圖,我們 可以看出第二群的受訪者比較注重天數的屬性,與第一群的受訪者有明顯的偏好差異。此圖顯 示出兩個特點,第一,兩個群體的受訪者偏好在偏好的空間構面上,有明顯的分佈上的差異。 第二,消費者的偏好不論在群間或群內都存在著異質性,故具偏好異質性的模式較能反應實際 的情況。5.4 本研究方法在市場區隔的特質討論
從市場區隔的分析方法中,本研究方法具有下列的良好特質:(1) 容許集群間具有重疊的特 性,故更具彈性也更符合實際情況。因此,我們可以的觀察到在某些屬性的水準上,不同區隔 的消費者的看法是很相似或是具有差異性。(2) 容許同一區隔內的消費者具有異質性。良好的模 型應該要允許同一區隔內的消費者具有異質性。此模型不但考慮區隔內的消費者具有異質性之 特質,亦可以直接推論出每一個消費者個人化的偏好結構。(3) 屬於「事後的區隔」 (4) 屬於「預 測性的市場區隔」。本文的方法是屬於預測性的市場區隔,乃根據消費者的選擇行為,推論其偏 好結構與市場區隔資訊,因此結果較能用來預測消費者實際的購買偏好與行為,此區隔方法又 稱為利益區隔,被認為是較佳的市場區隔方法。(5) 兼具「瞭解消費者個人化的偏好結構」與「發 掘潛在消費者偏好結構之市場區隔」的特性。本研究的消費者異質性模式為混合多維常態模型,3 2 1 0 -1 -2 2 1 0 -1 -2 500萬旅遊險 300萬旅遊險 200萬旅遊險 100萬旅遊險 四星級飯店 五星級飯店 長榮 華航 泰航 合菜 自助餐 六天五夜 五天四夜 四天三夜 15001~20000元 10001~15000元 10000元以下 1 2 2 1 11 1 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 1 1 2 2 1 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 1 2 1 1 1 2 2 2 1 1 1 1 2 1 1 1 2 1 2 1 1 1 1 1 1 2 2 1 1 1 2 2 2 1 1 1 1 1 2 1 2 1 2 2 1 1 2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2 1 2 1 1 1 1 2 1 1 1 2 1 1 2 1 1 1 1 1 1 2 1 2 1 2 2 2 2 1 1 2 1 2 2 2 1 1 2 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 2 1 2 2 1 1 2 1 2 1 1 1 1 2 3 2 1 0 -1 -2 2 1 0 -1 -2 500萬旅遊險 300萬旅遊險 200萬旅遊險 100萬旅遊險 四星級飯店 五星級飯店 長榮 華航 泰航 合菜 自助餐 六天五夜 五天四夜 四天三夜 15001~20000元 10001~15000元 10000元以下 1 2 2 1 11 1 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 1 1 2 2 1 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 1 2 1 1 1 2 2 2 1 1 1 1 2 1 1 1 2 1 2 1 1 1 1 1 1 2 2 1 1 1 2 2 2 1 1 1 1 1 2 1 2 1 2 2 1 1 2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2 1 2 1 1 1 1 2 1 1 1 2 1 1 2 1 1 1 1 1 1 2 1 2 1 2 2 2 2 1 1 2 1 2 2 2 1 1 2 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 2 1 2 2 1 1 2 1 2 1 1 1 1 2 3 2 1 0 -1 -2 2 1 0 -1 -2 500萬旅遊險 300萬旅遊險 200萬旅遊險 100萬旅遊險 四星級飯店 五星級飯店 長榮 華航 泰航 合菜 自助餐 六天五夜 五天四夜 四天三夜 15001~20000元 10001~15000元 10000元以下 1 2 2 1 11 1 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 1 1 2 2 1 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 1 2 1 1 1 2 2 2 1 1 1 1 2 1 1 1 2 1 2 1 1 1 1 1 1 2 2 1 1 1 2 2 2 1 1 1 1 1 2 1 2 1 2 2 1 1 2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2 1 2 1 1 1 1 2 1 1 1 2 1 1 2 1 1 1 1 1 1 2 1 2 1 2 2 2 2 1 1 2 1 2 2 2 1 1 2 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 2 1 2 2 1 1 2 1 2 1 1 1 1 2 3 2 1 0 -1 -2 2 1 0 -1 -2 500萬旅遊險 300萬旅遊險 200萬旅遊險 100萬旅遊險 四星級飯店 五星級飯店 長榮 華航 泰航 合菜 自助餐 六天五夜 五天四夜 四天三夜 15001~20000元 10001~15000元 10000元以下 1 2 2 1 11 1 2 2 2 2 2 2 2 2 2 1 2 1 2 2 2 2 1 1 1 2 2 1 1 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2 2 2 1 2 1 1 1 2 2 2 1 1 1 1 2 1 1 1 2 1 2 1 1 1 1 1 1 2 2 1 1 1 2 2 2 1 1 1 1 1 2 1 2 1 2 2 1 1 2 2 1 2 2 2 2 1 2 1 1 1 1 1 1 2 1 2 1 1 1 1 2 1 1 1 2 1 1 2 1 1 1 1 1 1 2 1 2 1 2 2 2 2 1 1 2 1 2 2 2 1 1 2 1 1 1 1 2 1 2 1 1 1 1 1 1 1 1 1 2 1 2 2 1 1 2 1 2 1 1 1 1 2 圖 3 受訪者對套裝旅遊產品偏好之空間分析圖 因此可觀察到同一區隔的人,在跨許多不同屬性/水準上的偏好狀態。(6) 運用統計分析的原理, 建立分析模型。故研究者可根據此模型預測新產品組合對個體的效用、對市場區隔的效用、以 及整體市場的效用:亦可根據不同產品組合對個體的效用進行新產品市場佔有率模擬分析。綜 上所述,本研究的方法具有許多良好的市場區隔特性,在協助行銷經理人發展市場區隔的行銷 策略上是有幫助的。
6. 結論與後續研究建議
作者提出層級貝氏選擇式聯合分析法的市場區隔模型,此方法有兩個特點。首先,此層級 貝氏的模型以市場區隔的資訊做為個人偏好的先驗分配,而非過去貝氏模型以整體市場資訊作 為先驗分配。其次,我們提出一套針對混合常態分配模型的市場區隔的方法,改進過去層級貝 氏模型只能針對個人的參數作推論而無法有效推論市場區隔參數的缺點。不同於過去兩階段分 析的方法,此模式是在一次的統計估計中,同時推論個人化參數的估計與區隔的訊息,且以市 場區隔的群體的資訊輔助個人的參數估計,因此在理論與實務上皆具有良好的統計模式特性。貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 693 本研究以旅遊產品為例,說明所提出之方法可協助廠商提升新產品或服務的決策品質。本 研究的受訪者皆具有旅遊經驗,因此,相較於常用的學生樣本,本研究較具有預測效度。然而, 本研究亦有一些研究限制。首先,本研究是在假設觀光行程都一樣的情況下請消費者對所提供 的套裝組合做選擇。然而旅遊觀光景點的規劃對旅遊的意願也有影響,因此,建議有興趣的廠 商可利用此方法,再針對旅遊景點作分析。這些資訊的蒐集與分析,將可協助廠商更深入瞭解 顧客。其次,未來的研究方面,可加強探討區隔數選擇的問題。一般而言,所選擇的區隔數越 多,樣本內的配適情況會更好。如在本研究中,當設定四個常態來配適消費者的異質性時,其 樣本內的配適情況最佳,但樣本外的預測能力 MAD 卻降低。由於此模式兼具異質性參數的推論 與區隔資訊的推論的用意,作者建議研究者可將焦點放在較具有代表性的區隔上較佳,作者建 議亦可透過知覺圖的方法圖示區隔資訊的決策 (如圖 3)。未來的研究亦可針對區隔數做分析, 例如: (1) 發展統計上的判斷指標。(2) 發展能自行判斷市場區隔數的統計模式 (3) 發展可協助 研究者判斷的其他圖示方法等。本研究的目的在提出一用於聯合分析法的統計模式,且此模式 可同時探討市場區隔以及個人化偏好結構的特性。在本研究中,我們發現此模式的應用情況良 好,例如可協助發現兩個具有相似偏好結構的市場區隔,以及推論個人化偏好參數。然而市場 的情況非常多元,在極端的情況下,有時可能無法發現具有相似偏好結構的區隔。雖然我們的 模式能配適各種情況的資料。然而,實際的市場區隔情況有待行銷人去分析與發掘。我們希望 未來有更多的研究資料分析,測試此模式的應用性。
附錄 A:選擇式聯合分析法問卷
如果您要安排一個泰國旅遊行程,請從以下四個方案中點選您比較喜歡的選擇: 泰國航空 中華航空 長榮航空 其他航空公司 六天五夜 七天六夜 四天三夜 五天四夜 不含餐飲 自助餐式 合菜式 自助餐式 民宿 四星級飯店 四星級飯店 五星級飯店 500 萬旅遊平安險 300 萬旅遊平安險 100 萬旅遊平安險 800 萬旅遊平安險 15001~20000 元 20001 元以上 10001~15000 元 10000 元以下 附註:其他沒有列入的內容都相同 附圖一 選擇式聯合分析法電腦問卷附錄 B:層級貝式混合多維常態聯合分析模式的參數的估計方法
有 N 個受訪者 (i=1,…, N),S 次的選擇組合 (s=1,…, S),消費者的異質性服從混合 K 個多 維常態分配。則欲估計的個人化參數 的後驗機率分配可以 (A-1) 式來表示。 i ( i Data)i(Datai)p(i) 1 1 Pr( , ) ( ) isj S J is is i i s j y j X p
(A-1) ~ ( i, ) i i N ind ind (A-2) ~ Multinomial( ) i i ind (A-3) ~ Dirichlet( ) (A-4) 1 ~ ( , ) k N k a (A-5) 0 0 ~ ( , ) k IW v V (A-6) (A-1) 式中 ( i Data) 為消費者 i 之個人化的偏好結構係數之後驗分配,根據貝氏統計理 論,對個人化參數的後驗分配之推論乃結合個人選擇的資訊i(Datai)與群體的先驗資訊 ( i) p 。X
is為消費者 i 在第 s 次的選擇組合中所面對的產品屬性組合。yis代表第 i 個消費者, 在第 s 個購買情境的選擇yis=1, 2,.., J,s=1,2,..., S。Pr(yis j Xis,i) 表個人選擇的資訊,即消 費者 i 在第 s 次的選擇組合中選則 j 產品的機率。 為 1 若消費者 i 在第 s 次的選擇中,選擇 jisj 產品。 為 0 若選非 j 產品。(A-2) 式為先驗機率isj p( 的分配假設。本文假設消費者的i) 參i 數的先驗機率p( 服從混合常態分配i) ~ ( i, ) i i N ind ind 。該式表示消費者 i 的個人化參數i 可能來自其中一個多維常態母體,以indi來代表他所來自的多維常態母體 (indi=1, …, K)。 另外,模式中相關參數之先驗分配可根據貝氏定理之自然共軛分配設定如下:indi名目變 數,其先驗服從多項式分配。indi ~ Multinomial( ,i) 代表消費者 i 來自 K 個多維常態母體i 的機率 ( i= i1, i2,., )。(A-3) 式中ik 代表每個市場區隔的機率值的資訊,其先驗服從i Dirichlet( ) 分配。多維常態的平均數 先驗為常態分配k k ~N( , k a1)。第 k 個多維常態 分 配 的 共 變 異 矩 陣k 之 先 驗 分 配 服 從 Inverse-Wishart 分 配 , 以k ~IW v V( ,0 0) 表 示 。 , , 1 a ,v0 ,V0 為 資 訊 。 如 在 混 合 兩 個 常 態 的 情 況 下 , d 為 的 維 度 ,i =(5,5), 1 a =0.01,v0=d+3,。V0=v0diag
1d d 。
0 d1。 MCMC 的過程包含反覆下列四個步驟以推估模式的參數。 起始值 0 , {k0,k0} ,
i0 步驟 1 ind1|0 , {k0,k0} ,
i0 步驟 2 1| ind1貝氏統計於選擇式聯合分析法之個人與市場區隔參數之推論 695 步驟 3 {k1,k1} | ind1 =1, 2,.., k K 步驟 4
i1 |y X indi, i, i1,k1, k1 以 代表每個市場區隔的機率大小的資訊,上標 0 代表第 0 次的 MCMC 抽樣,也就是一0 個起始值。給定 0 0 0 0 , { k , k } , 等起始值,我們可以抽樣出每一個個體是屬於的哪一個多維 常態母體的資訊 1 ind ,其中 1 1 ( ,...., N)ind ind ind 表示在第一次 MCMC 抽樣中,標示每一個受訪
者分別是屬於哪一個區隔的資訊。上標 1 代表第 1 次的 MCMC 抽樣,給定 1 ind 我們可以得知每 個群體大小,故可得到 。同時,給定1 1 ind ,亦可以推估每個多維常態的平均數與共變異資訊。 然後給定 1 1 1 , , , , i i k k k y X ind 使我們可以推估 1 i 的資訊,並以此反覆抽樣達適當次數。以上每個 步驟說明如下: 步驟 1: 抽出個體所屬的多維常態母體的編碼值 indi 給定 的資訊, = 1, 2,., 為每個市場區隔機率大小的資訊 (其值可經由步驟 2 不斷更K 新)。i為個體 i 分別屬於 K 個多維常態母體機率之後驗分配i= i1, i2,.,iK。i=1,…,N。每個受 訪者屬於哪一個多維常態母體indi可從 Multinomial (i) 分配中隨機抽出一個值。其值的計算 由 (A-8) 式而來。f( i | k,k)為個體 i 評估其屬於第 k 個多維常態母體的邊際機率概似函數。 ik 的值需除以其正規化常數 (Normalizing constant),即個體 i 評估其在 K 個多維常態母體的概 似函數的總和,才可使 K1 1 k ik
。ind ~ Multinomial(i i) i= i1, i2,.,iK (A-7)
1 ( | , ) ( | , ) k i k k ik K k i k k k f f
k1, 2....,K (A-8) 步驟 2: 抽出反應每個多維常態母體相對大小的機率 為 K 個機率值,代表每個多維常態母體相對大小的,可用來反應每個市場區隔資訊的大 小。 後驗分配為 Dirichlet(1,....K),k值可從 (A-10) 得到。 為k k先驗資訊。 ~ D irichlet ( ) (A-9) 1 ( ) n k i k i I ind k
(A-10) 步驟 3: 抽出每個多維常態母體的平均數與共變異矩陣 {k,k} 當知道每個消費者分屬於不同多常態母體資訊後indi,將可用此資訊將同一區隔之消費者集合起來,然後運用貝氏 SUR (Seemingly Unrelated Regression) 模型 (Rossi et al., 2005) 的方法
可輕易得出每個多維常態母體的平均數與共變異矩陣 {k,k} 的推論。在 (A-11) 式中,Bk是 屬於 k 多維常態母體的偏好參數, 為 1 的向量。 是欲估計的平均數向量。k 誤差共變數矩 陣。又因為假設 ~ ( , 1) k N k a 0 0 ~ ( , ) k IW v V (A-5, A-6),經由推導後可得出k k的後驗
分配為 (A-12) 與 (A-13) 式。 + k k k B k ~N(0,k) k=1,…, K (A-11) 0 0 | , , , ~ ( , 1 / ( ) ) k k k k k k u B a N I a (A-12) 0 0 0 | , , ~ ( , ) k B v Gk o IW v I Vk SS (A-13) 其中 n1 (ind ) k i i I
I k ,SS(Bkk) (Bkk), 1 0 0 ( ) ( ), ( / ) k Ik a Ik k a k Bk Ik , o o v V , a0 為{k,k} 的先驗資訊。 步驟 4: 抽出個人化參數
i 已知y X indi, i, i,k, k的資訊,則 的後驗分配為 (A-14) 式 i ( i is, , rest) is X y i(i Xis,yis)p(i) 1 1 Pr( , ) isj S J is is i s j y j X
.
1
exp ( ) ( ) i i ii ind ind i ind
1 exp( ) Pr( , ) exp( ) isj i is is i J ism i m x y j X x
(A-14) 上式之x 表示消費者 i 在第 s 次的選擇組合中之第 j 個產品的屬性。(A-14) 式並不服從任isj 何一個已知的分配形式,因此我們以高斯隨機漫步的 Metropolis-Hasting 的抽樣方法來抽出 i (i=1,2,….,N),方法如下: 起始狀態 old i 隨機抽樣 1 , ~ N(0, H ) candidate old i i i i i , 1 2 i i H scaling 令 min 1, (
icandidate) / ( iold)
在 的機率下, new candidate i i , 其它 inew iold 對 N 個體依序抽樣 i=1,2,….,N (A-15) ( icandidate) , ( iold)為 candidate i 和 old i 的後驗機率分配,即 (A-1) 式。i決定隨機漫步值 的變動量。作者對隨機漫步的變動量作如下的設定: 1 ~ (0, ) i N Hi , 1 i H 的值影響隨機漫步 值的變動幅度。其值設定為 1 2 i i
H scaling 。據 Roberts and Rosenthal (2001) 的看法,scaling
設 定 為scaling2.93 / d (d 為 的 維 度 ) 可 使 Metrolis-Hasting 方 法 得 到 良 好 的 結 果 ,i 1 1 (Hessian ) indi i i 代表對消費者 i 偏好之變異的近似推論。其資訊來源有二:Hessiani以及 1 indi ,Hessiani為 *( , ) i i Xis yis 的 Hessian 矩陣 (A-16)。 *( , ) i i Xis yis 是 個體偏好參數之概i 似函數的一個近似推論 (A-17),用以協助我們決定 1 i H 。 1 indi 表該次 MCMC 抽樣中,消費者 i 所屬區隔的共變異矩陣,有代表 i 偏好變異矩陣之先驗之意,若消費者 i 屬第 k 個區隔,則 1 indi = 1 k