• 沒有找到結果。

貝氏方法應用於連鎖商店銷售額預測 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "貝氏方法應用於連鎖商店銷售額預測 - 政大學術集成"

Copied!
47
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院統計研究所 碩士論文 Department of Statistics College of CommerceCollege of Electrical National Chengchi University Master Thesis. 政 治 大. 貝氏方法應用於連鎖商店銷售額預測 立. ‧. ‧ 國. 學. Application of Bayesian Method for Chain Store Sales Prediction. y. Nat. er. io. sit. 謝家銘. n. a l Jia-Ming Xie i v n Ch U engchi. 指導教授:翁久幸 博士 Advisor:Chui-Hsing Weng, Ph.D.. 中華民國 108 年 3 月 March, 2018. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(2) 誌謝. 首先感謝老師在這兩年間對我的教導,每次討論皆能得到適時的指導與方向 指引,謝謝老師每次討論前都會關心我的近況,讓我在延畢的日子心情不會那麼糟。 還有要感謝研究室的夥伴們,褚哥、佩雯、崇傑、姜神、芃彣、培軒、博威、沈妤 芳,每天看到大家待在研究室的安心感,讓我研究所生涯快樂不少,每天約吃午晚 餐一大堆人浩浩蕩蕩的去吃飯,每天待研究室到十點多,有時討論各自近況也討論 統計上的問題,那個學習氛圍我永生難忘。最後要感謝的是我的家人,退伍後還讓. 政 治 大. 我再重考一年,研究所延畢這半年多也沒多給我壓力,真的很感謝大家。. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 1. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(3) 中文摘要. 連鎖銷售商店動輒上百家分店,商店銷售額的預測是重要的目的,一般是以個 別分店的銷售資料,找出統計模型,對個別分店的銷售額做預測是一種簡單的方法, 然而,因為這些分店之間可能有某些相似性,若能找到一個可以同時運用多個店家 資料的統計模型,可能有機會改進模型的預測能力與模型係數的適切性,有助商家 因應節日及進行促銷時的行銷策略。本論文使用回歸分析對銷售資料進行預測,對 不同店家的銷售額所做的回歸分析的參數,用貝氏方法來做進一步的處理,透過將. 政 治 大 尋找較合理的參數,其次則是探討迴歸係數縮減下模型預測能力的表現。 立. 多家店家的回歸係數縮減(shrinkage),以達到較合理的參數,此方法的主要目的是. 本研究發現在多家分店的原始迴歸係數相當接近時,使用貝氏方法的改進空. ‧ 國. 學. 間有限,其中階層貝氏方法能夠將若干家商店資訊納入,能對迴歸係數產生較大的 縮減,因此有機會改進預測能力,而 James-Stein 估計並沒有參考多家商店資訊,. ‧. 因此對於迴歸係數產生較小的縮減,故其預測能力並無太大改進。. n. al. er. io. sit. y. Nat. 關鍵字:貝氏方法、Shrinkage、Gibbs sampler、James-Stein 估計. Ch. engchi. i n U. v. 2. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(4) ABSTRACT The prediction of sales is important. It is common to do regression analysis to predict sales for a store using its own data. However, for a chain with hundreds of stores, it may be possible to improve prediction accuracy and obtain more reasonable regression coefficients by combining data from different stores. We propose to achieve these goals by using two shrinkage methods: hierarchical Bayesian method and James-Stein estimator. We found that the shrinkage methods yield limited improvement when the regression coefficients in separate models are rather close. Moreover, the hierarchical method. 治 政 incorporated data from different stores and improve 大 predictions, while James-Stein 立 estimator did not improve much.. ‧ 國. 學. Key words:Baysian method、Shrinkage、Gibbs sampler、James-Stein estimate. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 3. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(5) 目錄 誌謝.............................................................................................................................. 1 中文摘要 ...................................................................................................................... 2 ABSTRACT ................................................................................................................. 3 CONTENTS ................................................................................................................... LIST OF FIGURES ...................................................................................................... 6 LIST OF TABLES ........................................................................................................ 7 Chapter 1. 政 治 大. 緒論 ....................................................................................................... 8. 立. 研究背景 .................................................................................................... 8. 1.2. 研究目的 .................................................................................................... 8. 1.3. 研究架構 .................................................................................................... 9. ‧. ‧ 國. 學. 1.1. 文獻探討 ............................................................................................. 10. Chapter 3. 研究方法 ............................................................................................. 12. al. er. io. sit. y. Nat. Chapter 2. v. Shrinkage 估計 ...................................................................................... 12. 3.2. 馬可夫蒙地卡羅(Markove chain Monte Carlo) ........................................ 14. Chapter 4. n. 3.1. Ch. engchi. i n U. 實證分析 ............................................................................................. 19. 4.1. 數據模擬 .................................................................................................. 19. 4.2. Rossmann Store 資料集 .......................................................................... 23. 4.3. 實驗結果 .................................................................................................. 26. Chapter 5. 結論 ..................................................................................................... 44. 5.1. 結論 ......................................................................................................... 44. 5.2. 後續探討 .................................................................................................. 45 4. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(6) 文獻參考 .................................................................................................................... 46. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 5. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(7) LIST OF FIGURES. 圖 4.1.1. 12 chain-brand 𝑃𝑅𝑡 之係數 ....................................................................P.22. 圖 4.1.2. 12 chain-brand 𝐷𝐷𝑡−1 之係數 ................................................................P.22. 圖 4.2.1. 不同 StoreType 在 DayOfWeek 下之顧客平均銷售額 ..........................P.25. 圖 4.2.2. 不同 StoreType 在 DayOfWeek 下之總銷售額 ......................................P.25. 圖 4.2.3. 不同 StoreType 在 DayOfWeek 下之總顧客數 ......................................P.25. 圖 4.3.1. 各 StoreType 在 DOW1 至 DOW6 之總銷售額 .....................................P.27. 圖 4.3.2. Store Type A 去除 DOW7 在各 DOW 之總銷售額...............................P.27. 圖 4.3.3. Store Type A 保留 DOW7 在各 DOW 之總銷售額...............................P.27. 圖 4.3.4. Store 142 之 ACF ...................................................................................P.29. 圖 4.3.5. Store 142 之 PACF .................................................................................P.30. 圖 4.3.6. Store 142 之原銷售額與經 Box-Cox 轉換 ............................................P.30. 圖 4.3.7. Store 142 之原銷售額 ...........................................................................P.30. 圖 4.3.8. Shrinkage:Gibbs 與 Shrinkage:JS 後的 Promo coefficient ......................P.39. 圖 4.3.9. Shrinkage:Gibbs 與 Shrinkage:JS 後的 Dayofweek6 coefficient .............P.39. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4.3.10 Shrinkage:Gibbs 與 Shrinkage:JS 後的 Schoolhoilday coefficient ..........P.39 圖 4.3.11 各種方法在的 142 家分店預測 42 期的銷售額 ....................................P.42. 6. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(8) LIST OF TABLES. 表 4.1.1. 變數描述. ...............................................................................................P.19. 表 4.1.2. 迴歸係數 ................................................................................................P.20. 表 4.1.3. Gibbs sampler 之迴歸係數. ....................................................................P.21. 表 4.2.1. 各 StoreType 店家數目. ........................................................................P.23. 表 4.2.2. 各 StoreType 之總銷售額、總顧客人次、單筆平均消費....................P.23. 表 4.2.3. StoreType 在不同 DayOfWeek 之總銷售額、總顧客人次、單筆平均消費.. 立. 政 治 大. ...............................................................................................................P.24. ‧ 國. 學. Store Type A 之店家 Box-Cox 轉換 (𝜆2 = 10). ......................................P.28. 表 4.3.2. Store Type A 之迴歸係數、Shrinkage:Gibbs、Shrinkage:J-S. ...............P.32. 表 4.3.2. (續)Store Type A 之迴歸係數、Shrinkage:Gibbs、Shrinkage:J-S .........P.34. 表 4.3.3. Store Type A 之變數 P-value. .................................................................P.37. 表 4.3.4. StoreType A 的 MSE 在 Shrinkage:Gibbs、Shrinkage:J-S、OLS、common. ‧. 表 4.3.1. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. model、Shrinkage:J-S one step ahead 模型表現比較.............................P.40 表 4.3.5. Σ、R 在不同尺度下各分店與總體 MSE 與 OLS 比值. .......................P.42. 7. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(9) 緒論. Chapter 1. 1.1. 研究背景 在目前全球化的世界,企業迅速於世界各地設立據點,也拜近代科技發達,對. 於實體連鎖店家各方面商品之銷售資訊收集越來越齊全,因此對於店家銷售額之 預測為一大助力。. 政 治 大 體連鎖店,Dirk Rossmann GmbH 為德國第二大家連鎖藥品店,成立於 1972 年,其 立 本研究對象為德國連鎖藥品店 Dirk Rossmann GmbH 在歐洲超過 3790 家的實. ‧ 國. 學. 在德國之主要競爭對手為 dm-drogerie markt,為了提升實體連鎖店之營業額,我們 可以預測每日銷售額與推測促銷行為之效果,以達到有效的調整人力資源的分配。. ‧. 然而不同連鎖店對於促銷行為之效果並不一致,因而造成每日銷售額之預測. y. Nat. er. io. sit. 產生落差,如低估促銷行為之效果,代表當日銷售額超乎預期,可能會有低估進貨 量造成商品售罄,另一方面人力資源分配低估,因而有可能對於銷售人員工作量負. al. n. v i n Ch 擔增加,進而影響消費者之服務品質;反之,代表當日銷售額低於預期,可能造成 engchi U 人力資源浪費。. 1.2. 研究目的 本研究旨在應用馬可夫蒙地卡羅方法於迴歸模型上,其中使用 Gibbs sampler 方法,並討論在哪些參數設定下,如何來達到更穩定的迴歸係數,並且能夠達 到更佳的預測能力。. 8. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(10) 1.3. 研究架構 第二章為文獻探討,主要探討在行銷學裡對於商店來說,影響商店銷售額的重. 要變數,並進一步討論此領域裡貝氏方法的相關應用。第三章為研究方法,分別列 舉 Shrinkage 估計與馬可夫蒙地卡羅方法,最後也列出我們使用的評判收斂方法。 第四章為實證分析,首先模擬資料以驗證研究方法,再來是介紹使用的資料集,最 後是實驗結果。第五章為結論,首先列出我們對實驗結果的觀察,再來是探討我們. 政 治 大. 在研究方法的設定問題與資料面的討論。. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 9. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(11) Chapter 2. 文獻探討. 在行銷學相關領域裡已有提出許多不同的模型來計算促銷行為的效果與價格 訂定的效果(例如:Blattberg & Wisniewski 1987,1988;Frank & Massy 1965; Guadagni & Little 1983; Kumar & Leone 1988),在許多不同的模型裡皆要將與促銷相關的變 數考慮進去,例如:價格之折扣數、價格導向的廣告、某樣商品在店內的展示;而 競爭對手的相關資訊也需要考慮,例如:競爭對手的價格、競爭對手的促銷行為;. 政 治 大. 對於自身過往促銷行為也必須考慮,例如對於民生用品來說,此次的促銷行為可能. 立. 會導致消費者延後再次消費的情形,參考 Blattberg, Eppen, & Lieberman(1981) 和. ‧ 國. 學. Neslin, Henderson, & Quelch(1985)。. ‧. Blattberg & George(1991)考慮價格與促銷對於銷售額的回歸模型,配適許多不. Nat. sit. y. 同分店的回歸模型,為了解決迴歸係數正負符號不一致的問題,他們採用階層回歸. n. al. er. io. 模型(Hierarchical models),假設迴歸係數之平均數服從常態分配、共變異矩陣之反. i n U. v. 矩陣服從 Wishart distribution、回歸模型之變異數服從 Inverse Gamma distribution,. Ch. engchi. 而透過此階層模型設計,能夠改善係數差距過大、修正係數正負符號與直覺不符的 問題,而在最後並拿此縮減後的係數做預測發現在 MSE 下,預測能力比迴歸係數 還好,亦即 MSE 較回歸模型小,作者稱此結果為”windfall profit”;而 McCulloch & Rossi(1999)提出對於某些資料下,一般的階層模型仍然無法解決迴歸係數正負符號 與直覺不符的問題,於是基於 Blattberg & George(1991)的階層模型,對迴歸係數之 分配與迴歸係數的平均數、共變異矩陣之分配提出修改,透過將迴歸係數之先驗分 配修改為截短常態分配,在平均數相較變異數大的情況下,此分配會遠離原點,此 種變數範圍設定可以反映出某些變數在大部分情況下皆非零,僅在少部分情況在 10. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(12) 零附近。然而此設計的缺點在於後驗分配並非共軛分配,並且還要多計算截短常數 (Truncation Constant),在於計算上較困難。最後將縮減過後的迴歸係數應用在製造 商對於不同零售業之促銷預算分配上,將製造商的利益極大化。 貝氏方法中對於先驗分配的設置也是一大重點,一般對於先驗分配的設定為 較 平 坦 的 機率分布,常見對於共變異矩陣的先驗分配假設為 Inverse-Wishart distribution,Barnard, McCulloch & Meng(2000)將共變異矩陣分解為標準差與相關 係數矩陣,稱此分解方法為 separation strategy,因為共變異矩陣之先驗分配之參數. 政 治 大. 設定較困難,因此透過此方法改為對標準差之先驗分配做設定,常見對於標準差之. 立. 先驗分配設定為 Inverse chi-squared distribution,而在低自由度的情況,Inverse chi-. ‧ 國. 學. squared distribution 在尾端的表現無法處理,所以此處設定為常態對數分配。. ‧. 階層回歸模型在統計領域中有很多文獻討論,有關於階層模型相關討論可以. n. al. er. io. sit. y. Nat. 參考 Lindley 與 Smith(1972)以及 Berger(1985)。. Ch. engchi. i n U. v. 11. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(13) Chapter 3. 3.1. 研究方法. Shrinkage 估計 在回歸模型的應用中,我們會對某些預測變數與反應變數之關係有預先的合. 理猜測,例如: 在商店之促銷行為對於營業額應有正向影響,故對此促銷行為之迴 歸係數猜測應為正號。然而,給定一組資料,我們可能會對於某一預測變數之迴歸. 政 治 大 一個可能的解決方式是透過若干組資料納入,而將迴歸係數估計之間的差距收縮, 立 係數估計產生懷疑,例如:迴歸係數正負符號與直覺不符、迴歸係數間差距過大。. ‧ 國. 學. 相對原始回歸模型,此收縮後的迴歸係數通常會在不同資料下能達到較一致的表 現。即便這些預測變數在不同資料可能無相關,也可以達到縮減不同迴歸模型之迴. ‧. 歸係數差距,以減低對迴歸係數之錯誤估計之風險。. y. Nat. al. er. io. sit. 欲估計一個參數 𝜃,假設資料 X 分配服從𝑁𝑝 (𝜃, 𝐼𝑝 ),𝜃 為 p 維,James 與 Stein. n. (1961) 提出一個 𝜃 的參數估計𝛿𝑐 ,c 為對於 𝜃 的合理猜測,比方 c = 𝑋̅ 𝐽𝑝 ,. Ch. engchi. i n U. v. 𝐽𝑝 = (1,1, … ,1)𝑇 ,為 p 維向量,在 p ≥ 3,且損失函數為 (1). L(𝜃, 𝛿𝑐 ) = ‖𝜃 − 𝛿𝑐 ‖2 此時參數估計 𝛿𝑐 為 𝛿𝑐 = X −. 𝑝−2 (X − 𝑐 ) ‖X − 𝑐 ‖2. (2). ,此時的參數估計 𝛿𝑐 之風險比 X 還小,也就是𝐸𝜃 (𝐿(𝜃, 𝛿𝑐 )) < 𝐸𝜃 (𝐿(𝜃, X))。此參 數估計有另一種更一般的表示法 𝛿𝑐,𝑟 = X −. 𝑟(𝑝 − 2 ) (X − 𝑐) ‖X − 𝑐 ‖2. (3). 12. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(14) 參考 Jun Shao (1999)定理 4.15,在 p ≥ 3, 0 < r < 2且損失函數為式子(2)下之風 險皆比 X 還小。以上方法可以進一步推廣到𝑁𝑝 (𝜃, 𝜎 2 𝐷),其中 D 為已知正定矩陣, 且𝜎 2 > 0為已知,則 James-Stein estimator 為 𝛿̃𝑐 = X −. 𝑟 (𝑝 − 2)𝜎 2 (X − 𝑐)𝐷−1 ‖(X − 𝑐)𝐷−1 ‖2. (4). 若 𝜎 2 > 0 為未知,假設存在一個統計量 𝑆02 與 X 互相獨立且 𝑆02 𝜎 2 服從卡方 分配,則 James-Stein estimator 為 𝛿̃𝑐 = X −. 立. (𝑝 − 2)𝜎̂ 2 (X − 𝑐)𝐷−1 ‖(X − 𝑐)𝐷−1 ‖2. 政 治 大. (5). ‧ 國. 學. 式(5)可以應用於線性回歸模型舉例,Y = (𝑌1 , … , 𝑌𝑛 ),𝜀 = (𝜀1 , … , 𝜀𝑛 ), 𝑋 =. ‧. (𝑋1 , … , 𝑋𝑛 )𝑇,X 為 n × p 矩陣,X 為 full rank,p ≥ 3,β = (β1 , … , β𝑝 ),Y = β𝑋 𝑇 +. sit. y. Nat. 𝜀,假設 𝜀~𝑁𝑛 (0, 𝜎 2 𝐼𝑛 ),且 𝜎 2 > 0 為未知,最大概似估計𝛽̂ ~𝑁𝑝 (𝛽, 𝜎 2 𝐷),D =. al. n. 估計為. er. io. 2 2 (𝑋 𝑇 𝑋)−1 ,𝑆02 = 𝑆𝑆𝑅 = ‖𝑌 − 𝛽̂ 𝑋 𝑇 ‖ 與 𝛽̂ 獨立;𝑆02 /𝜎 2 服從 𝜒𝑛−𝑝 ,則此 shrinkage. 𝛽̂ −. Ch. e n g c ĥ i. (𝑝 − 2)𝜎̂ 2. 2 ‖(𝛽̂ − 𝑐)𝑋 𝑇 𝑋‖. i n U. v. (𝛽 − 𝑐)𝑋 𝑇 𝑋. (6). ̂2 = SSR/(n − p + 2) 。若將 未知 c 以估計量 𝛽̅ 𝐽𝑝 代替,其中 𝛽̅ = 𝑝−1 ∑𝑝 β𝑖 𝜎 𝑖=1 且 𝐽𝑝 = (1,1, … ,1)𝑇 ,為 p 維向量,則此 shrinkage 估計為 𝛽̂ −. (𝑝 − 3)𝜎̂ 2 2. ‖(𝛽̂ − 𝛽̅ 𝐽𝑝 )𝑋 𝑇 𝑋‖. (𝛽̂ − 𝛽̅ 𝐽𝑝 )𝑋 𝑇 𝑋. (7). 在p ≥ 4,且損失函數為式子(2)的情況下,這些估計量的風險皆比 𝛽̂ 小。 以上描述之 shrinkage 估計皆屬於經驗貝氏(empirical Bayes),該方法假設參數 13. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(15) 亦服從某分配並參考由實際資料所得到的參數估計,以加權平均的方式來估計此 參數,在適當的模型假設下,此方法能夠得到較小的風險也達到縮減估計量的效果。 在貝氏方法中還有階層貝氏,此方法亦假設參數服從某分配,將分配的先驗參數與 實際資料整合,以後驗分配抽取樣本以來改進對參數的估計, 階層貝氏方法會在 3.2 節裡介紹。. 3.2. 階層迴歸模型. 政 治 大. 階層貝氏方法假設參數亦服從某分配,而將參數之先驗分配與資料整合得到. 立. 後驗分配,並以此後驗分配對此參數進行估計,而階層貝氏的優點是在假若某些母. ‧ 國. 學. 體資料來源較少,此時的參數估計並不穩定,透過階層模型的設計可以將來自其他. ‧. 母體的資訊融合,以達到較穩定的參數估計。. sit. y. Nat. 在階層貝氏中常常會遇到對於後驗分配直接抽取的困難,因此使用 MCMC 方. io. n. al. er. 法來近似後驗分配, 而 Gibbs sampler 為 MCMC 的一種特例,其好處在於每次抽. i n U. v. 取的樣本皆被採用,並不會發生抽取浪費的情況,可以改進樣本抽取的效率。. Ch. engchi. 在高維度的機率分配上有許多問題,例如:計算高維度的積分、非常見的高維 度機率分配抽樣問題、高維度機率分配的極值問題,解決這類的問題最常見的方法 即是馬可夫蒙地卡羅(Markov chain Monte Carlo)。在未知分配的高維度機率函數裡 常常會碰到樣本抽取的問題,但在高維度下求得邊際函數是相當複雜,而這時可退 而求其次選擇建立欲抽樣的變數之條件機率函數,並將抽取樣本更新至條件機率 函數,因此馬可夫蒙地卡羅抽取的樣本是有相關性的。 Gibbs sampler 是 一 種 由 聯 合 後 驗 分 配 (joint posterior distribution) 並 依 照 full conditional distribution 去抽取樣本。 14. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(16) Gibbs sampler 抽樣步驟: 1. 給定機率分布P(𝑥1 , 𝑥2 , ⋯ , 𝑥𝑛 )與起始值(𝑥10 , 𝑥20 , ⋯ , 𝑥𝑛0 ) 2. 在給定(𝑥20 , ⋯ , 𝑥𝑛0 )先抽取𝑥11 ,亦即從P(𝑥1 |𝑥20 , ⋯ , 𝑥𝑛0 )抽取出𝑥11 3. 在給定(𝑥11 , 𝑥30 , ⋯ , 𝑥𝑛0 )抽取𝑥21 ,亦即從P(𝑥2 |𝑥11 , 𝑥30 , ⋯ , 𝑥𝑛0 )抽取出𝑥21 4. 以上動作依照每個維度抽取樣本點 5.. 1~4 動作重複抽取 N 次直到收斂。 以線性回歸模型舉例,Y 𝑖 = (𝑌1𝑖 , … , 𝑌𝑛𝑖 ),𝜀 𝑖 = (𝜀1𝑖 , … , 𝜀𝑛𝑖 ), 𝑋 𝑖 = (𝑋1𝑖 , … , 𝑋𝑛𝑖 )𝑇 ,. 政 治 大. 𝑋 𝑖 為 n × J 矩陣,βi = vec(β1𝑖 , … , β𝑖𝐽 ) ,θi = vec(θ1𝑖 , … , θ𝐽𝑖 ),若θ1 = θ2 = ⋯ = θp =. 立. γ,γ 為 J 維向量,因此 θ 也可以用矩陣乘積來表示θ = Wγ,i = 1,2,…,p,p 代表. ‧ 國. 學. ′. 有 p 組回歸資料,n 代表每組各 n 筆觀測值,假設母體資料 Y 𝑖 = βi 𝑋 𝑖 + 𝜀 𝑖 ,其. ‧. 中 𝜀 𝑖 ~𝑁𝑛 (0, 𝜎 2 𝐼𝑛 ),. al. y. sit. io. v ) i ( θ = Wγ ,W 為 pJ×J, Prior γ~N n J η, Υ Ch U engchi. n. Prior distribution. ν νλ. Prior σ2 : σ2 ~IG(2 , 2 ). er. Nat. Prior β𝑖 : βi |θi , Σ~NJ (θi , Σ). (8). Σ −1 ~Wishart J ((ρR)−1 , ρ) Likelihood :. 𝑇 β̂i |βi , σ2 ~NJ (βi , σ2 (𝑋 𝑖 𝑋 𝑖 )−1 ). (9). Posterior distribution P(β, σ2 , θ, Σ −1 |X),其中β = (β1 , … , βp ),X = (X1 , … , 𝑋 p ),式 子(8)先驗分配的超參數(hyperparameter)需要先設定,這部分我們在 4.3 節再進一步 說明。 由於 Posterior joint distribution 難以理解是屬於哪種分配,因此退而求其次以 Gibbs sampler 近似。 15. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(17) 以下是 Gibbs sampler 方法: 1. Posterior θ|β̂, β, σ2 , Σ P(θ|β̂, β, σ2 , Σ) ∝ P(θ, 𝛽̂ , β, 𝜎 2 , Σ) ∝ P(𝛽̂ |β, 𝜎 2 )P(β|θ, Σ)P(θ) ∝. −1. 1. 1. - (θ-wη) 𝑇 (𝑤𝛶𝑤𝑇 ) − (β−θ)𝑇 Σ∗ (β−θ) 𝑒 2 e2 𝑝 𝑝𝐽 (√2𝜋) |Σ| 2. 1. ∝ 𝑒 −2. (√2𝜋). 𝑝𝐽. (𝜃−𝜇𝜃)𝑇 [Σ∗−1 𝛽+(𝑤 𝑇 𝛶𝑤). (θ-wη) 1. |𝑤 𝑇 𝛶𝑤|2. −1. ](𝜃−𝜇𝜃 ). −1. 政 治 大. Where, 𝜇𝜃 = [Σ∗ −1 + (𝑤 𝑇 𝛶𝑤)−1 ] [Σ∗ −1 𝛽 + (𝑤 𝑇 𝛶𝑤)−1 𝑤η]. 立. Σ∗ = 𝑑𝑖𝑎𝑔(Σ, … , Σ). ‧ 國. 學. Thus,. −1. θ|β̂, β, σ2 , Σ ~𝑁𝑝𝐽 (𝜇𝜃 , [Σ∗ −1 + (𝑤 𝑇 𝛶𝑤)−1 ] ). ‧. Nat. sit. y. 2. Posterior σ2 |β̂, β, θ, Σ. n. al. er. io. P(σ2 |β̂, β, θ, Σ) ∝ P(𝛽̂ |β, 𝜎 2 )P(𝜎 2 ). Ch. 1 1𝑇 1 𝑋 𝑋 𝜎2 ⋮. ∝. (10). 0. 0. 𝑇 1 ̂ − (𝛽 −β) ( 𝑒 2. ⋯. ⋱. ⋯. 𝑇. 0. engchi ⋮ 1 𝑃𝑇 𝑃 𝑋 𝑋 2 ̂ −β) 𝜎 ) (𝛽. 1 −1 2. 2 𝑖 𝑖 ∏𝑃 𝑖=1|𝜎 (𝑋 𝑋 ). 𝜈. i n U 𝜈. v. 1 2. (𝜎 2 )−2−1 𝑒 −𝜎2 𝜈𝜆. |. 𝑝𝐽 − 1 (1[∑𝑝 (𝛽 ̂𝑖 −𝛽𝑖 )𝑇 (𝑋 𝑖 𝑇 𝑋 𝑖 )(𝛽 ̂𝑖 −𝛽𝑖 )]+ 2 ) 𝜈𝜆 𝜎 2 2 𝑖=1. ∝ (𝜎 2 )−2−1− 2 𝑒 Thus,. −1. 𝑝. 𝜈 𝑝𝐽 1 2 ̂𝑖 − 𝛽 𝑖 )𝑇 (𝑋 𝑖 𝑇 𝑋 𝑖 ) (𝛽̂𝑖 − 𝛽 𝑖 )] + ] ) σ2 |β̂, β, θ, Σ ~IG (α = + , λ = [ [∑(𝛽 2 2 2 𝜈𝜆. (11). 𝑖=1. 3. Posterior Σ −1 | β̂, β, σ2 , θ 16. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(18) P(Σ −1 | β̂, β, σ2 , θ) ∝ P(β̂|β, σ2 )P(β|θ, Σ −1 )P(Σ −1 ) 1. ∝. 𝑒 −2(𝛽−𝜃). 𝑇 Σ−1 (𝛽−𝜃) ∗. |Σ −1 |. 𝑝. 𝑝−𝐽−1 1 − 𝑡𝑟(𝜌𝑅Σ−1) 2 𝑒 2. 𝑝𝐽 𝐽 𝜌 2 2 |(𝜌𝑅)−1 |2 𝛤𝐽 (2). |Σ|2. 𝑇 1 𝑝 𝜌−𝐽−1 𝑝 − [(∑𝑖=1(𝛽 𝑖 −𝜃𝑖 )(𝛽𝑖 −𝜃𝑖 ) )+𝜌𝑅]−1 2 𝑒 2. ∝ |Σ −1 |2 + Thus,. 𝑇 𝑝 Σ −1 | β̂, β, σ2 , θ ~𝑊𝐽 ([(∑𝑖=1(𝛽 𝑖 − 𝜃 𝑖 )(𝛽 𝑖 − 𝜃 𝑖 ) ) + 𝜌𝑅]. −1. , 𝜌 + 𝑝). (12). 政 治 大. 4. Posterior 𝛽 𝑖 |𝛽̂𝑖 , σ2 , θ, Σ. 立. 𝐽. 𝐽 −1 2 𝑖 𝑋) |. |Σ|2. 𝑖 −1 (σ−2 𝑋 𝑖 𝑇 𝑋 𝑖 𝛽 ̂𝑖 +Σ−1 𝜃𝑖 )]. io. 𝑇. 𝐷𝑖 [𝛽𝑖 −𝐷𝑖. n. al. 𝑖 𝑇 Σ−1 (𝛽 𝑖 −𝜃𝑖 ). 𝑖. −1. 𝑇. y. 𝑖. 1. 𝑒 −2(𝛽 −𝜃 ). ̂𝑖 +Σ−1𝜃𝑖 )] (σ−2 𝑋 𝑖 𝑋 𝑖 𝛽. sit. Nat 1. ∝ 𝑒 −2[𝛽 −𝐷. ̂𝑖 −𝛽𝑖 ) (𝛽. ‧. |𝜎 2 (𝑋. 𝑖𝑇. −1. er. ∝. 𝑒. −1 𝑇 𝑇 1 ̂𝑖 − (𝛽 −𝛽𝑖 ) [σ2(𝑋 𝑖 𝑋 𝑖 ) ] 2. 學. ‧ 國. P(𝛽 𝑖 |𝛽̂𝑖 , σ2 , θ𝑖 , Σ) ∝ P(𝛽̂𝑖 |𝛽 𝑖 , σ2 )P(𝛽 𝑖 |θ𝑖 , Σ). Ch. i n U. v. −1 𝑇 −1 𝛽 |𝛽̂𝑖 , σ2 , θ, Σ ~ 𝑁𝐽 (𝐷𝑖 (σ−2 𝑋 𝑖 𝑋 𝑖 𝛽̂𝑖 + Σ −1 𝜃 𝑖 ), 𝐷𝑖 ) 𝑖. engchi 𝑖. −2. 𝑖𝑇. 𝑖. Where 𝐷 = σ 𝑋 𝑋 + Σ. (13). −1. 檢驗序列收斂必須檢查序列之間是否有融合(mixing)與序列是否達到平穩 (stationarity),最常見的方法是將每個序列分為前後兩個部分,捨棄掉前半部分, 並將後半部序列再分成兩個序列,再來計算序列間的變異數與序列內的變異數, 並以序列內變異數與序列間變異數來估計參數是否有達到收斂。 假設參數𝜃𝑖𝑗 i = 1, … , n; j = 1, … , m,m 代表序列個數,n 代表抽取經過捨棄. 17. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(19) 與再分裂成兩部分之次數。 序列間變異數 B 𝑚. 𝑛. 𝑚. 𝑗=1. 𝑖=1. 𝑗=1. 𝑛 1 1 B = ∑(𝜃.𝑗̅ − 𝜃..̅ )2 , 且𝜃̅.𝑗 = ∑ 𝜃𝑖𝑗 , 𝜃..̅ = ∑ 𝜃.𝑗̅ 𝑚−1 𝑛 𝑚 序列內變異數 W 𝑚. 𝑛. 𝑗=1. 𝑖=1. 1 1 2 W = ∑ 𝑠𝑗2 , 𝑠𝑗2 = ∑(𝜃𝑖𝑗 − 𝜃.𝑗̅ ) 𝑚 𝑛−1. 因此可以估計 var(θ|y),. 立. 政 治 大. ‧ 國. 𝑛−1 1 W+ B 𝑛 𝑛. 學. 𝑣𝑎𝑟 ̂ + (𝜃 |𝑦) =. rstan 套件中 monitor 函數其中一項指標用來判斷 MCMC 是否收斂,. ‧. Rhat(𝑅̂),是用來判斷所有經過 MCMC 之序列必須收斂至同樣的行為,當 Rhat(𝑅̂ ). y. Nat. n 當 n→ ∞, 𝑅̂ → 1. 𝑣𝑎𝑟 ̂ + (𝜃 |𝑦 ) 𝑅̂ = √ 𝑊. Ch. engchi. er. io. al. sit. 大於 1.1 時,則代表序列並沒有達到收斂。. i n U. v. 18. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(20) 實證分析. Chapter 4. 數據模擬. 4.1. 此處回歸模型依據 Robert C. Blattberg and Edward I. Gorege(1991)所探討之三 家連鎖店在四種品牌的每周銷售額情況。 回歸模型為:. 政 治 大 + 𝛽 𝑆𝐿 立+ 𝜀 ,𝜀 ~N(0,1). 𝑆𝐿𝑡 = 𝛽1 + 𝛽2 𝑃𝑅𝑡 + 𝛽3 𝐷𝐷𝑡 + 𝛽4 𝐷𝐷𝑡−1 + 𝛽5 𝐴𝐷𝑡 + 𝛽6 𝐷𝑃𝑡 + 𝛽7 𝐹𝐿𝑡 + 𝛽8 𝐶𝐷𝑡 9. 𝑡−1. 𝑡. 𝑡. ‧ 國. 學. 其中某些變數對於𝑆𝐿𝑡 有預期正向或負向效果,譬如: 𝑃𝑅𝑡 、𝐶𝐷𝑡 預期對𝑆𝐿𝑡 有 負向效果,故此迴歸係數應為負號; 𝐷𝐷𝑡、𝐴𝐷𝑡、𝐷𝑃𝑡 等行銷行為預期對𝑆𝐿𝑡 有正向. ‧. Nat. n. al. 變數類型. er. 變數描述. 𝑆𝐿𝑡. 在 t 期間內銷售額取對數. Ch. engchi. 在 t 期間內相對價格(一般價除以 𝑃𝑅𝑡. sit. 表 4.1.1 變數描述. io. 變數名稱. y. 效果,故此迴歸係數應為正號。. 競爭對手平均價). i n U. v. 變數範圍. 連續型. 0 < 𝑆𝐿𝑡 < ∞. 連續型. 0 < 𝑃𝑅𝑡. 𝐷𝐷𝑡. 在 t 期間內之折扣. 連續型. 0 < 𝐷𝐷𝑡 < 1. 𝐴𝐷𝑡. 在 t 期間內連鎖店實施廣告比例. 連續型. 0 < 𝐴𝐷𝑡 < 1. 連續型. 0 < 𝐷𝑃𝑡 < 1. 在 t 期間內連鎖店上架此商品比 𝐷𝑃𝑡. 例. 1 : 促銷最後一周. 𝐹𝐿𝑡. 是否為促銷最後一周. 類別型. CDt. 在 t 期間內競爭品牌之最高折扣. 連續型. 0 < 𝐶𝐷𝑡 < 1. 𝐷𝐷𝑡−1. 在 t 期間內之折扣. 連續型. 0 < 𝐷𝐷𝑡−1 < 1. 0 : 非促銷最後一周. 19. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(21) 表 4.1.2 迴歸係數 Chain -brand. 𝛽1 (Inter. 𝛽2. 𝛽3. (𝑃𝑅𝑡 ). 𝛽4. 𝛽5. (𝐷𝐷𝑡 ) (𝑆𝐿𝑡−1 ) (𝐴𝐷𝑡 ). 𝛽6. 𝛽7. 𝛽8. 𝛽9. (𝐷𝑃𝑡 ). (𝐹𝐿𝑡 ). (CDt ). (𝑆𝐿𝑡−1 ). cept) 1-1. 7.75. 4.37. 7.29. -0.18 -0.138. 0.93 -0.567. -0.92. 0.103. 1-2. 8.28. 0.34. 5.51. -1.47. 0.129. 0.87. 0.43. -0.61. 0.139. 1-3. 7.24. -2.57. 6.2. -0.47. 0.14. 1.35 -0.891. -0.63. 0.127. 1-4. 7.91. 1.21. 8.43. -4.38. 0.156. 0.1 -0.648. -0.98. 0.413. 2-1. 6.04. -2.99. 4.79. -1.29. 0.537. -0.4. -1.53. 0.264. 2-2. 7.35. -4.32. 4.92. -0.103. -0.97. 0.102. 2-3. 5.38. -3.24. 0.102. -0.95. 0.413. 2-4. 6.89. -4.59. 立2.87. 0.208. -0.51. 0.149. 3-1. 7.56. 3-2. 7.78. 3-3. 7.17. 3-4. 8.15. 0.77. 0.369 0.52 政1.45 治 -2.29 0.452 大 1.07 0.672. -17.5. 6.49. -1.89. 0.163. 0.59 -0.462. -1.01. 0.37. 8.33. 2.37. -0.98. 0.128. 1.65. -1.33. 0.206. -13.7. 7.19. -2.03. -0.56. 1.1 -0.184. -1.1. 0.272. -1.24. 7.01. -0.47 -0.298. 0.98 -0.638. -1.14. 0.082. 0.7. 0.023. sit. Nat. y. ‧. ‧ 國. 0.9. 學. 4. io. al. er. 本次數據模擬依據 Robert C. Blattberg and Edward I. Gorege(1991)之應變變數. v. n. 與反應變數之資料型態產生模擬資料,如表 4.1.1,其中以上界為 8 下界為 1 之均. Ch. engchi. i n U. 勻連續函數隨機生成𝑆𝐿𝑡−1 第 1 筆資料,第 1 筆𝑆𝐿𝑡 為依照回歸模型生成,第 2 筆 𝑆𝐿𝑡−1 為第 1 筆𝑆𝐿𝑡 ,第 2 筆𝑆𝐿𝑡 亦依照回歸模型生成,以此類推生成 100 筆𝑆𝐿𝑡−1 、 𝑆𝐿𝑡 ;𝑃𝑅𝑡 以上界為 1 下界為 0 之均勻連續函數隨機生成 100 筆;以上界為 1 下界 為 0 之均勻連續函數隨機生成 101 筆,𝐷𝐷𝑡 為第 2 至第 101 筆,𝐷𝐷𝑡−1 為第 1 至第 100 筆;𝐴𝐷𝑡 、𝐷𝑃𝑡 為隨機抽取 100 筆範圍為 0、1; 𝐹𝐿𝑡 為隨機生成 100 筆 0 或 1 之樣本;CDt 以上界為 1 下界為 0 之均勻連續函數隨機生成 100 筆。 表 4.1.2 中共有三家連鎖店 Chain 與四種品牌(brand),1-1 代表第一家連鎖店 的第一個品牌,其他以此類推。由表 4.1.2 觀察可得知在 1-1、1-2、1-4、3-2 處之 20. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(22) 𝑃𝑅𝑡 係數符號與預期相反,且在 3-1、3-2、3-3 處之係數符號有過大的情形;在 22、2-4 處之𝐷𝐷𝑡−1 係數符號為正號與預期相反。 本次模擬數據依照表 4.1.1 中描述之變數型態與迴歸係數對每一組 Chain-brand 隨機生成 100 筆資料,由生成資料估計出迴歸係數,以此估計係數進行 3.3 節 Gibbs sampler 抽取 20,000 次,並將後 10,000 次取平均得出表 4.1.2 之迴歸係數。 表 4.1.3 Gibbs sampler 之迴歸係數 𝛽3. (𝑃𝑅𝑡 ). 𝛽5. 1-2 1-3. 7.43. 1-4. 7.48. 2-1. 7.12. 2-2. 7.24. 2-3. 7.15. Nat. 2-4. 7.54. -3.12. 3-1. 6.8. -3.12. 3-2. 7.44. -2.64. 5.29 -1.346 -0.058 4 5.77 -0.942 0.178. 3-3. 6.8. -3.31. 5.52 -1.188. 3-4. 7.26. -2.91. 5.85 -0.957. 𝑡. 𝛽7. 𝛽8. 𝛽9. (𝐹𝐿𝑡 ). (CDt ). (𝑆𝐿𝑡−1 ). -0.215 -0.909. 0.403. 0.180. 0.766 -0.273. -0.93. 0.359. -2.96. 5.86 -0.909. 0.931 -0.286 -0.942. -2.89. 5.61 -1.055. 0.081 2 0.052 8. 0.161 5 0.491 5. -2.84. 5.52 -1.143. 0.071. 0.811 -0.431 -0.983. -3.05. 5.6 -1.116. 0.015 3. 0.808 -0.402 -1.007. -3.02. 5.35 -1.174. 0.190 8 0.284 2. 0.817 -0.149 -0.947. n. 5.6 -1.144. Ch. engchi 0.066. 0.825 -0.577 -1.179. ‧. io. al. 學. -1.197. ‧ 國. -2.86. 立5.78 5.64. 𝛽6. ) 政 治 (𝐷𝑃 大 -1.128 0.158 0.725. (𝐷𝐷𝑡 ) (𝑆𝐿𝑡−1 ) (𝐴𝐷𝑡 ). 7.36 cept) 7.32. 1-1. -2.76. 𝛽4. y. -brand (Inter. 𝛽2. sit. 𝛽1. 1.02 -0.183 -0.867. er. Chain. i n U. v. 0.616 -0.395 -1.182 0.846 -0.206 -1.014. 0.087 1 0.190 8 0.086 1 0.096 4 0.013 6 0.465 5. 0.791 -0.407 -1.292 -0.074 5 0.84 -0.463 -1.065 0.273. 0.182 4 表 4.1.3 為經由 Gibbs sampler 得出的迴歸係數,可發現 1-1、1-2、1-4、3-2 處 4 9. 之𝑃𝑅𝑡 係數符號有修正為正號,且在 3-1、3-2、3-3 處也有縮小過大之係數符號;在 2-2、2-4 處之𝐷𝐷𝑡−1 係數符號也有修正成負號,故經由 Gibbs sampler 後,不同回 歸模型之係數可以修正。. 21. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(23) 圖 4.1.1 12 chain-brand 𝑃𝑅𝑡 之係數. 立. 政 治 大. ‧. ‧ 國. 學. 圖 4.1.2 12 chain-brand 𝐷𝐷𝑡−1 之係數. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 22. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(24) Rossmann Store 資料集. 4.2. 本研究之資料來源為 Kaggle 網路資料競賽平台 Rossmann Store Sales 提供之 資料,Rossmann Store 為德國藥妝連鎖商店,其超過三千家連鎖店遍佈在七個歐洲 國家,本次競賽 Rossmann Store 提供其中 1115 家位於德國之分店各 942 天資料與 180 家各 758 天資料之訓練資料,銷售日期為 2013-01-01 至 2015-07-31,其中 180 家缺少 2014-07-01 至 2014-12-31 期間之資料,並且提供測試資料日期為 2015-0801 至 2015-09-17,本次實驗以完整資料之 934 家分店作分析。. 政 治 大. 提供之資料裡有預先將連鎖店分成四個種類(StoreType),在此先分析此四種種. 立. B. C. 602. 17. 148. D 348. io. sit. y. ‧. A. Nat. 店數. 表 4.2.1 各 StoreType 店家數目. 學. StoreType. ‧ 國. 類的差異。. n. al. er. 表 4.2.2 各 StoreType 之總銷售額、總顧客人次、單筆平均消費. Ch. e總顧客人次 ngchi. i n U. v. StoreType. 總銷售額. 單筆平均消費. A. 3.17e+09. 3.64e+08. 8.71. B. 1.59e+08. 3.15e+07. 5.06. C. 7.83e+08. 9.21e+07. 8.50. D. 1.77e+09. 1.57e+08. 11.25. 由表 4.2.2 可以看出 A、D 之總銷售額與總顧客數皆較 B、C 多,但 D 之顧客 平均銷售額較 A 高;A、C 之平均銷售額相近,但 C 之總銷售額與總顧客數較少 是因為 A 的總店數較 C 多;B、C 之總銷售額與總顧客數接較 A、D 少,但 B 之 顧客平均銷售額較 C 少。 23. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(25) 表 4.2.3 StoreType 在不同 DayOfWeek 之總銷售額、總顧客人次、單筆平均消費 DayOfWeek. 總銷售額. 總顧客人次. 單筆平均消費. StoreType. 1. 6.22E+08. 67891993. 9.16. A. 2. 5.70E+08. 64911231. 8.78. A. 3. 5.26E+08. 60910191. 8.64. A. 4. 4.99E+08. 58535057. 8.53. A. 5. 5.26E+08. 61149906. 8.6. A. 6. 4.19E+08. 49702279. 8.43. A. 7. 3.20E+06. 440777. 7.27. A. 1. 2.45E+07. 4700613. 5.21. B. 2. 2.27E+07. 4482942. 3. 2.23E+07. 立4451273. 4. 2.28E+07. 5. 政 治5.06 大. B. 4553486. 5. B. 2.39E+07. 4858005. 4.92. 6. 1.77E+07. 3785376. 4.69. 7. 2.54E+07. 4633926. 5.48. 1. 1.47E+08. 16481650. 8.95. 2. 1.33E+08. 15499890. 8.58. 3. 1.25E+08. 14773842. 8.46. 4. 1.20E+08. B. C. er. io. sit. B. y. B. ‧. Nat. a l 14293444 v i 8.38 n Ch i U engch 1.30E+08 15444200 8.42 n. 5. ‧ 國. B. 學. 5.01. C C C C. 6. 1.28E+08. 15636679. 8.18. C. 7. 0.00E+00. 0. NaN. C. 1. 3.36E+08. 28600756. 11.76. D. 2. 2.95E+08. 25954000. 11.36. D. 3. 2.81E+08. 24982336. 11.25. D. 4. 2.69E+08. 24350951. 11.06. D. 5. 3.01E+08. 26932709. 11.17. D. 6. 2.82E+08. 25979520. 10.85. D. 7. 9.75E+05. 104723. 9.31. D. 24. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(26) 圖 4.2.1 不同 StoreType 在 DayOfWeek 下之顧客平均銷售額. 立. 政 治 大. ‧. ‧ 國. 學. 圖 4.2.2(左下)不同 StoreType 在 DayOfWeek 下之總銷售額 圖 4.2.3(右下)不同 StoreType 在 DayOfWeek 下之總顧客數. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 由圖 4.2.1 可知僅 StoreType C 在 DayOfWeek 7 並無顧客平均銷售額之值,因 為無銷售行為,;由圖 4.2.2、4.2.3 StoreType A、D 在 DayOfWeek 7 之總銷售額與 總顧客數表現皆較其他日差;而 StoreType B 在 DayOfWeek 7 之總銷售額與總顧客 數表現皆與其他日相較略增。在經過分析後發現在 StoreType A、C、D 裡部份店家 於 DayOfWeek 7 有休息日的情況,所以才造成當日總銷售額下滑的情況,參考圖 4.2.3。 25. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(27) 4.3. 實驗結果. 4.3.1. 回歸模型. 本論文欲討論由回歸模型去做銷售額的預測。以下為原始回歸模型: 𝑆𝐿𝑡 = 𝛽0 + 𝛽1 𝑆𝐿𝑡−1 + 𝛽2 𝑆𝐿𝑡−2 + 𝛽3 𝑆𝐿𝑡−3 + 𝛽4 𝑆𝐿𝑡−4 + 𝛽5 𝑆𝐿𝑡−5 + 𝛽6 𝑆𝐿𝑡−6 + 𝛽7 𝑆𝐿𝑡−7 + 𝛽8 𝑃𝑟𝑜𝑚𝑜𝑡 + 𝛽9 𝑆𝑐ℎ𝑡 + 𝛽10 𝑆𝑡𝑎𝑡𝑒. 𝑎𝑡 + 𝛽11 𝑆𝑡𝑎𝑡𝑒. 𝑏𝑡 + 𝛽12 𝑆𝑡𝑎𝑡𝑒. 𝑐𝑡 + 𝛽13 𝐷𝑂𝑊2𝑡 + 𝛽14 𝐷𝑂𝑊3𝑡 + 𝛽15 𝐷𝑂𝑊4𝑡 + 𝛽16 𝐷𝑂𝑊5𝑡 + 𝛽17 𝐷𝑂𝑊6𝑡 + 𝛽18 𝐷𝑂𝑊7𝑡 + 𝜀𝑡 ,𝜀𝑡 ~N(0, σ2 ). 政 治 大. 𝑆𝐿𝑡−𝑖 : 第 t 天的前 i 天營業日的銷售額,i = 1,…,7. 立. 𝑃𝑟𝑜𝑚𝑜𝑡 : 第 t 天是否有促銷活動. ‧ 國. 學. 𝑆𝑐ℎ𝑡 :第 t 天學校是否有放假. ‧. 𝑆𝑡𝑎𝑡𝑒. 𝑎𝑡 :第 t 天是否為國定假日. sit. y. Nat. 𝑆𝑡𝑎𝑡𝑒. 𝑏𝑡 :第 t 天是否為復活節. n. al. er. io. 𝑆𝑡𝑎𝑡𝑒. 𝑐𝑡 : 第 t 天是否為聖誕節 𝐷𝑂𝑊2𝑡 :第 t 天是否為星期二 𝐷𝑂𝑊3𝑡 :第 t 天是否為星期三. Ch. engchi. i n U. v. 𝐷𝑂𝑊4𝑡 :第 t 天是否為星期四 𝐷𝑂𝑊5𝑡 :第 t 天是否為星期五 𝐷𝑂𝑊6𝑡 :第 t 天是否為星期六 𝐷𝑂𝑊7𝑡 :第 t 天是否為星期日. 26. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(28) 圖 4.3.1 各 StoreType 在 DOW1 至 DOW6 之總銷售額. 圖 4.3.2 Store Type A 去除 DOW7 在各 DOW 之總銷售額. 立. 政 治 大. ‧. ‧ 國. 學 sit. y. Nat. n. al. er. io. 圖 4.3.3 Store Type A 保留 DOW7 在各 DOW 之總銷售額. Ch. engchi. i n U. v. 首先選擇 Store Type A 店家,Store Type A 共有 602 家分店,我們先把每家分 店之零銷售額當日資訊刪除,經過刪除後發現有 589 家分店的 DOW7 變數皆被刪 去,僅剩 13 家分店還有 DOW7 資訊,由圖 4.3.2 與圖 4.3.3 看到不管是否去除 DOW7 變數,在 Store Type A 這類型的分店中,我們可以看到在不同星期中銷售額 27. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(29) 也有明顯的不同,因此星期的變數對於銷售額是有影響的。為了考慮較多家分店的 資訊,我們選擇分店數較多的情況來做模型,故以下我們的模型為去除了 DOW7 變數。將零銷售額之日期刪除後,𝑆𝑡𝑎𝑡𝑒. 𝑎𝑡 、𝑆𝑡𝑎𝑡𝑒. 𝑏𝑡 、𝑆𝑡𝑎𝑡𝑒. 𝑐𝑡 的資訊皆被刪除, 因此這些變數也必須刪除。 因為原始銷售額資料呈現右偏,因此經過 Box-Cox 轉換,轉換式子如下, (𝑥+𝜆2 )𝜆1 −1 𝜆1. y={. ,𝜆1 ≠ 0. ,x 為轉換前的銷售額,y 為轉換後的銷售額。. log(𝑥 + 𝜆2 ) ,𝜆1 = 0. 政 治 大. 在常態性檢定完後還需檢定該分店之銷售額分布是否為單峰,經由 Jarque-. 立. Bera tests 檢驗服從常態分配之分店共有 87 家,最後還要做正規化動作將銷售額. ‧ 國. 學. 除以銷售額之標準差當作最終迴歸分析所使用之銷售額。. sit. y. Nat. 表 4.3.1 為 30 家分店 Box-Cox 轉換相關數據。. ‧. 在此我們隨機選擇分店中的 30 家,資料日期為此前 650 筆來做分析模型,下. io 𝜆1. 142. 0.539. 167. 0.221. 168. 轉換後平均 轉換後標準 a l P-value v i 差 n Ch engchi U. n. store. er. 表 4.3.1 Store Type A 之店家 Box-Cox 轉換 (𝜆2 = 10) R-adjust. 0.677. 172.101. 21.842. 0.613. 0.068. 29.225. 2.587. 0.765. 0.081. 0.346. 13.009. 0.619. 0.765. 176. 0.085. 0.173. 12.512. 0.690. 0.788. 195. 0.417. 0.282. 111.807. 11.064. 0.6. 206. 0.096. 0.929. 13.917. 0.691. 0.745. 219. 0.989. 0.103. 2907.084. 752.779. 0.72. 265. 0.281. 0.058. 34.834. 3.893. 0.805. 285. 0.191. 0.082. 21.464. 1.137. 0.702. 315. 0.534. 0.805. 159.012. 24.009. 0.741. 328. 0.753. 0.139. 734.547. 151.466. 0.73. 331. 0.158. 0.755. 18.676. 1.095. 0.705. 364. 0.535. 0.676. 165.789. 28.861. 0.742. 383. 0.125. 0.071. 19.056. 0.540. 0.631. 384. 0.133. 0.811. 17.519. 1.102. 0.772. 28. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(30) 389. 0.394. 0.929. 93.780. 8.607. 0.74. 391. 0.296. 0.836. 39.866. 4.451. 0.789. 395. 0.444. 0.900. 86.541. 10.146. 0.697. 396. 0.382. 0.999. 85.249. 11.519. 0.763. 403. 0.393. 0.783. 81.579. 8.129. 0.735. 404. 0.384. 0.237. 64.138. 7.821. 0.771. 432. 1.108. 0.926. 27182.75. 6597.323. 0.77. 435. 0.099. 1.000. 12.345. 0.600. 0.637. 446. 0.445. 0.069. 95.284. 15.000. 0.773. 448. 0.120. 0.456. 16.253. 0.786. 0.738. 460. 0.524. 0.528. 137.384. 30.550. 0.793. 473. 0.028. 0.127. 9.131. 0.394. 0.705. 510. 0.364. 0.912. 69.636. 7.502. 0.705. 530. 0.248. 0.186. 28.202. 3.281. 0.784. 544. 0.055. 0.282. 12.501. 0.491. 0.706. 政 治 大. 立圖 4.3.4 Store 142 之 ACF. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 29. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(31) 圖 4.3.5 Store 142 之 PAC. 政 治 大. 圖 4.3.6 Store 142 之原銷售額與經 Box-Cox 轉換之. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4.3.7 Store 142 之原銷售額. 30. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(32) 下圖為整個流程圖. Data. Remove zero sales. Box-Cox transformatio n. Divided by its standard deviation. Estimate Model parameters. Predict. Inverse BoxCox transform. Mean Squared Error. Jarque-Bera tests. Mulitplied by its standard deviation. 治 政 大 以下回歸模型為 Store Type A 之模型: 立 ‧ 國. 學. 𝑆𝐿𝑡 = 𝛽0 + 𝛽1 𝑆𝐿𝑡−1 + 𝛽2 𝑆𝐿𝑡−2 + 𝛽3 𝑆𝐿𝑡−3 + 𝛽4 𝑆𝐿𝑡−4 + 𝛽5 𝑆𝐿𝑡−5 + 𝛽6 𝑆𝐿𝑡−6 + 𝛽7 𝑆𝐿𝑡−7 + 𝛽8 𝑃𝑟𝑜𝑚𝑜𝑡 + 𝛽9 𝑆𝑐ℎ𝑡 + 𝛽10 𝐷𝑂𝑊2𝑡 + 𝛽11 𝐷𝑂𝑊3𝑡. ‧. + 𝛽12 𝐷𝑂𝑊4𝑡 + 𝛽13 𝐷𝑂𝑊5𝑡 + 𝛽14 𝐷𝑂𝑊6𝑡 + 𝜀𝑡 ,𝜀𝑡 ~N(0, σ2 ). sit. y. Nat. 在 Gibbs sampler 部份我們需要對先驗分配的參數做初始的設定,需要的參數參考. n. R=.0001*. [. al. er. io. 式子(8),設定 𝜈 = 2,𝜆 = 1,𝜌 = 15, 𝛶 = 𝐼(15∗30)×(15∗30) ,. Ch. 1 0. 𝐶𝑜𝑣(𝑆𝐿𝑡−1 , 𝑆𝐿𝑡−1 ). …. 𝐶𝑜𝑣(𝑆𝐿𝑡−1 , 𝑆𝐿𝑡−7 ). ⋮. ⋮. ⋱. ⋮. ⋮. 𝐶𝑜𝑣(𝑆𝐿𝑡−7 , 𝑆𝐿𝑡−1 ). …. 𝐶𝑜𝑣(𝑆𝐿𝑡−7 , 𝑆𝐿𝑡−7 ). 0 ⋮ 0. 0. 0 ⋮ 0. ⋯ 0. ⋯ ⋱ ⋯. 0 ⋮ 0. i n U. i eng 0 ch ⋮ ⋮ 0. 𝑉𝑎𝑟(𝑃𝑟𝑜𝑚𝑜𝑡 ). 0. 0 0 ⋮ 0. 𝑉𝑎𝑟(𝑆𝑐ℎ𝑡 ). 0 ⋮ 0. v. ⋯ ⋯ ⋱ ⋯ 0 0. 0 0 ⋮ 0 0 0. ⋯ ⋯. 𝐶𝑜𝑣(𝐷𝑂𝑊2𝑡 , 𝐷𝑂𝑊2𝑡 ). …. 𝐶𝑜𝑣(𝐷𝑂𝑊2𝑡 , 𝐷𝑂𝑊6𝑡 ). ⋮. ⋱. ⋮. 𝐶𝑜𝑣(𝐷𝑂𝑊6𝑡 , 𝐷𝑂𝑊2𝑡 ). …. 𝐶𝑜𝑣(𝐷𝑂𝑊6𝑡 , 𝐷𝑂𝑊6𝑡 )]. 而需要的起始值設定 Σ = 𝐼15×15, η 假設四個初始值,其中兩組分別為將各店家 之迴歸係數取中間值、平均值,與兩組以標準常態分配隨機生成,最後 η 的初始 值選取以最後的預測能力最佳者作為依據,這裡我們選擇平均值。. 31. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(33) 本次實驗的 Gibbs sampler 將重複抽取式子(10)~式子(13)10000 次,並將式子 (13) β𝑖 抽取的前 5000 次捨棄,僅留後 5000 次的抽取樣本並將之取平均當作 Shrinkage:Gibbs 之係數。而本次四個初始值 η 的抽取序列,其序列的收斂 Rhat(𝑅̂ ) 小於 1.1,因此 Gibbs sampler 抽取序列有達到收斂。最後我們將 Shrinkage:Gibbs、 Shrinkage:J-S 的迴歸係數計算後拿來做預測,每家分店皆一次直接預測 42 期銷售 額,而評判期預測能力的方法為 Mean Squared Error(MSE)。 表 4.3.2 Store Type A 之迴歸係數、Shrinkage:Gibbs、Shrinkage:J-S. 142. 5.819. 167. 6.094. 168. 265 285. 𝑆𝐿𝑡−6. 𝑆𝐿𝑡−7. 0.055. 0.012. -0.059. -0.006. 0.084. 0.377. 0.094. -0.092. -0.047. -0.001. 0.022. 0.178. 12.65. 0.308. 0.049. -0.068. -0.034. 0.032. 0.008. 0.138. 13.714. 0.294. 0.066. -0.057. -0.044. -0.036. -0.055. 0.134. 6.869. 0.386. -0.094. -0.007. 0.064. -0.16. 0.043. 0.073. 7.891. 0.464. 0.057. -0.047. -0.029. 0.053. 0.012. 0.146. 3.367. 0.196. 0.098. -0.04. -0.055. 0.003. 0.02. 0.092. 7.949. 0.23. 0.016. -0.077. -0.065. 0.022. -0.032. 0.1. 5.804. 0.413. 0.088. -0.084. 0.026. -0.059. 0.101. 0.162. 0.493. 0.123. -0.026. 0.005. -0.016. -0.009. 0.064. 0.267. 0.046. -0.054. -0.046. 0. -0.033. 0.099. 0.12. -0.02. -0.071. -0.007. 0.039. 0.13. 0.195. 0.011. -0.052. -0.052. 0.07. 0.125. 立. io. 315. 3.7. 328. 4.295. 331. 8.254. 364. 1.694. 0.541. 383. 18.063. 0.351. 0.115. -0.133. 0.09. -0.106. 0.032. 0.14. 384. 6.59. 0.411. 0.164. -0.058. -0.051. 0.003. 0.015. 0.183. 389. 5.458. 0.376. 0.104. -0.104. 0.047. -0.065. 0.046. 0.176. 391. 6.997. 0.367. 0.044. -0.041. -0.025. -0.052. -0.058. 0.113. 395. 5.083. 0.344. 0.096. 0.043. -0.052. -0.024. -0.011. 0.111. 396. 4.773. 0.339. 0.164. -0.043. -0.081. -0.006. 0.021. 0.106. 403. 6.935. 0.289. 0.096. -0.038. -0.035. -0.043. -0.003. 0.124. 404. 4.916. 0.402. 0.135. 0.024. -0.046. 0.006. -0.082. 0.093. 432. 3.003. 0.286. 0.093. -0.075. 0.012. -0.038. 0.061. 0.123. 435. 14.713. 0.128. 0.06. 0.036. -0.067. -0.008. 0.042. 0.123. 446. 5.832. 0.215. -0.002. -0.055. -0.037. 0.014. -0.041. 0.086. 448. 13.835. 0.316. 0.045. -0.055. -0.022. -0.01. -0.029. 0.128. al. n. OLS. 𝑆𝐿𝑡−5. -0.059. y. 219. 𝑆𝐿𝑡−4. ‧. 206. 𝑆𝐿𝑡−3. sit. 195. 0.354. 𝑆𝐿𝑡−2. 學. 176. 政 治 大. 𝑆𝐿𝑡−1. er. Intercept. Nat. Store. ‧ 國. Method. Ch. 0.382. engchi. i n U. v. 32. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(34) 460. 3.824. 0.263. 0.062. -0.06. -0.086. 0.015. -0.002. 0.147. 473. 14.431. 0.414. -0.084. 0.061. -0.054. -0.008. -0.058. 0.14. 510. 6.304. 0.3. 0.094. 0.034. -0.094. -0.021. -0.047. 0.143. 530. 0.783. 0.352. 0.222. 0.026. 0.079. -0.019. -0.063. 0.311. 544. 18.321. 0.263. 0.037. -0.131. 0.016. -0.016. -0.006. 0.144. 142. 7.274. 0.291. -0.066. 0.005. 0.02. -0.097. -0.027. 0.056. 167. 7.379. 0.346. 0.069. -0.099. -0.048. -0.014. 0.022. 0.132. 168. 7.748. 0.343. 0.095. -0.064. -0.003. 0.063. 0.06. 0.169. 176. 7.803. 0.309. 0.116. -0.032. -0.032. 0.014. 0.067. 0.174. 195. 7.665. 0.395. -0.087. 0.026. 0.046. -0.14. -0.031. 0.063. 206. 7.705. 0.413. 0.071. -0.008. -0.058. 0.066. 0.033. 0.141. 219. 5.783. 0.165. -0.018. -0.105. -0.088. -0.11. -0.103. -0.012. 265. 7.674. 0.231. 0.028. -0.068. -0.07. 0.016. -0.013. 0.094. 285. 7.742. 0.325. 0.03. 0.046. 0.02. 0.014. 0.156. -0.003. 315. 6.383. 0.058. -0.06. -0.042. -0.069. -0.034. -0.02. 328. 6.442. 0.191. -0.039. -0.081. -0.073. -0.069. -0.109. 0.012. 331. 7.69. 0.349. 0.137. -0.033. -0.052. 0.012. 0.064. 0.122. 4.671. 0.501. 0.038. 0.001. -0.086. -0.132. -0.036. 0.075. 7.814. 0.458. 0.174. -0.143. 0.113. -0.06. -0.001. 0.222. 7.498. 0.308. 0.114. -0.013. -0.062. 0.027. 0.142. 7.286. 0.312. 0.072. -0.079. 0.013. ‧. 0.067. -0.044. 0.002. 0.121. 7.412. 0.284. 0.034. -0.042. -0.038. y. -0.043. -0.003. 0.074. 7.193. 0.282. 0.033. 0.008. -0.045. -0.058. -0.033. 0.065. 0.264. 0.065. -0.038. er. -0.008. -0.024. 0.023. 0.249. 0.08. -0.046. -0.016. -0.055. 0.004. 0.106. -0.063. 0.009. -0.085. 0.037. 396. 6.961. 403. 7.513. 404. 7.026. 0.327. 432. 5.572. 0.205. 435. 7.909. 446. 391. io. 395. Nat. 389. n. al. Ch. engchi. sit. 384 Shrinkage:Gibbs. ‧ 國. 383. 0.346. 學. 364. 立. 政 治 大. -0.106. i n U. v. 0.069. -0.045. -0.006. -0.125. -0.042. -0.101. -0.07. -0.019. 0.226. 0.104. 0.037. -0.029. 0.035. 0.099. 0.178. 7.178. 0.216. -0.039. -0.074. -0.061. -0.034. -0.064. 0.033. 448. 7.897. 0.341. 0.121. -0.042. -0.005. 0.003. 0.058. 0.18. 460. 6.318. 0.152. -0.048. -0.083. -0.099. -0.076. -0.109. 0.031. 473. 7.948. 0.437. -0.002. 0.083. -0.049. 0.014. 0.004. 0.202. 510. 7.37. 0.257. 0.089. -0.003. -0.082. -0.052. -0.042. 0.118. 530. 4.974. 0.401. 0.052. -0.035. 0.071. -0.014. -0.284. 0.28. 544. 7.778. 0.372. 0.104. -0.071. 0.021. 0.019. 0.061. 0.218. 142. 5.819. 0.354. -0.059. 0.055. 0.012. -0.059. -0.006. 0.084. 167. 6.094. 0.377. 0.094. -0.092. -0.046. -0.001. 0.022. 0.178. 168. 12.65. 0.308. 0.049. -0.068. -0.034. 0.032. 0.008. 0.138. 176. 13.714. 0.294. 0.066. -0.057. -0.044. -0.036. -0.055. 0.134. Shrinkage:J-S. 33. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(35) 195. 6.869. 0.386. -0.094. -0.007. 0.064. -0.16. 0.043. 0.074. 206. 7.891. 0.464. 0.057. -0.047. -0.029. 0.053. 0.012. 0.146. 219. 3.367. 0.196. 0.098. -0.04. -0.055. 0.003. 0.02. 0.092. 265. 7.949. 0.23. 0.016. -0.077. -0.065. 0.022. -0.032. 0.1. 285. 5.804. 0.413. 0.088. -0.084. 0.026. -0.059. 0.101. 0.162. 315. 3.7. 0.493. 0.124. -0.026. 0.005. -0.016. -0.009. 0.064. 328. 4.295. 0.267. 0.046. -0.054. -0.046. 0. -0.033. 0.099. 331. 8.254. 0.382. 0.12. -0.02. -0.071. -0.007. 0.039. 0.13. 364. 1.694. 0.541. 0.195. 0.011. -0.052. -0.052. 0.07. 0.125. 383. 18.063. 0.351. 0.115. -0.133. 0.09. -0.106. 0.032. 0.14. 384. 6.59. 0.411. 0.164. -0.058. -0.051. 0.003. 0.015. 0.183. 389. 5.458. 0.376. 0.104. -0.104. 0.047. -0.065. 0.046. 0.176. 391. 6.997. 0.367. 0.044. -0.041. -0.025. -0.052. -0.058. 0.113. 395. 5.083. 0.344. 0.096. 0.043. -0.052. -0.024. -0.011. 0.111. 396. 4.773. 0.164. -0.043. -0.081. -0.006. 0.021. 0.106. 403. 6.935. 0.289. 0.096. -0.038. -0.035. -0.043. -0.003. 0.124. 404. 4.916. 0.402. 0.135. 0.024. -0.046. 0.006. -0.082. 0.093. 3.003. 0.286. 0.093. -0.075. 0.012. -0.038. 0.061. 0.123. 14.713. 0.128. 0.06. 0.036. -0.067. -0.008. 0.042. 0.123. 5.832. 0.215. -0.002. -0.055. -0.037. 0.014. 0.086. 13.835. 0.316. 0.045. -0.055. -0.022. ‧. -0.041. -0.01. -0.029. 0.128. 3.824. 0.263. 0.062. -0.06. -0.086. y. 0.015. -0.002. 0.147. 14.431. 0.414. -0.084. 0.061. -0.054. -0.008. -0.058. 0.14. 0.3. 0.094. 0.034. er. -0.021. -0.047. 0.143. 0.352. 0.222. 0.026. 0.079. -0.019. -0.063. 0.311. 0.016. -0.016. -0.006. 0.144. 510. 6.304. 530. 0.783. 544. 18.321. 460. io. 473. Nat. 448. n. al. Ch. 0.263. engchi 0.037. -0.131. sit. 446. ‧ 國. 435. 0.339. 學. 432. 立. 政 治 大. -0.094. i n U. v. (續)表 4.3.2 Store Type A 之迴歸係數、Shrinkage:Gibbs、Shrinkage:J-S Method. OLS. Store. 𝑃𝑟𝑜𝑚𝑜𝑡. 𝑆𝑐ℎ𝑡. 𝐷𝑂𝑊2𝑡. 𝐷𝑂𝑊3𝑡. 𝐷𝑂𝑊4𝑡. 𝐷𝑂𝑊5𝑡. 𝐷𝑂𝑊6𝑡. 142. 0.682. 0.025. -1.512. -1.254. -1.481. -0.975. -2.362. 167. 0.947. 0.012. -1.031. -1.485. -1.404. -1.285. -2.175. 168. 1.03. 0.083. -1.265. -1.361. -1.37. -1.095. -2.199. 176. 0.814. -0.03. -1.341. -1.65. -1.435. -1.36. -2.671. 195. 1.115. 0.063. -0.773. -0.695. -0.768. -0.358. 0.154. 206. 0.725. -0.031. -1.4. -1.66. -1.079. -1.336. -2.341. 219. 0.837. -0.07. -0.861. -1.293. -1.317. -0.937. -2.182. 265. 0.991. 0.017. -1.207. -1.394. -1.251. -1.113. -2.348. 285. 0.994. -0.051. -0.23. 0.187. 0.016. 0.663. 1.696. 315. 0.397. 0.092. -1.537. -1.693. -1.359. -1.304. -2.998. 34. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(36) 328. 0.812. 0.079. -1.104. -1.327. -1.356. -0.981. -2.385. 331. 0.76. -0.06. -1.299. -1.515. -1.404. -1.378. -2.281. 364. 0.377. 0.049. -0.625. -1.267. -1.014. -0.829. -1.965. 383. 1.119. -0.149. -1.095. -0.987. -0.273. -0.553. -0.035. 384. 0.622. -0.063. -1.392. -2.188. -1.418. -1.706. -2.805. 389. 0.908. -0.178. -1.269. -1.745. -1.263. -1.412. -2.056. 391. 0.647. 0.071. -1.368. -1.79. -1.425. -1.184. -2.888. 395. 0.636. 0.011. -1.037. -1.334. -1.298. -0.838. -2.514. 396. 0.639. -0.016. -1.077. -1.759. -1.214. -1.508. -2.633. 403. 0.83. -0.031. -1.106. -1.417. -1.4. -0.955. -2.335. 404. 0.505. -0.072. -1.068. -1.279. -1.455. -1.387. -2.664. 432. 0.907. -0.054. -1.131. -1.443. -1.245. -1.358. -2.121. 435. 0.978. -0.146. -0.858. -0.991. -1.352. -0.95. -1.87. 446. 0.976. 0.012. -0.982. -1.191. -1.137. -0.839. -2.239. 448. 0.84. -1.298. -1.449. -1.416. -0.88. -2.494. 460. 0.922. 0.055. -1.103. -1.649. -1.262. -1.123. -2.479. 473. 0.888. 0.037. -1.396. -1.355. -1.07. -1.184. -2.179. 0.756. 0.084. -1.139. -1.175. -1.516. -0.881. -2.397. 0.357. 0.224. -0.242. -0.381. -0.244. -0.214. -0.009. 1.092. -0.105. -1.106. -1.6. -1.148. 0.697. 0.017. -1.304. -1.21. -1.246. 0.92. Nat. 0.023. -0.972. -1.324. -1.26. 1.062. 0.06. -1.232. -1.38. -0.031. -1.186. -1.486. 0.006. -1.039. -1.022. 0.948. 195. 0.87. 206. 0.769. -0.031. 219. 0.679. -0.055. 265. 0.959. 285. al. Ch. engchi. -0.923. -2.176. y. 176. n. Shrinkage:Gibbs. io. 168. -1.789. -1.138. -2.044. -1.298. -1.063. -2.13. -1.304. -1.201. -2.284. -1.078. -0.712. -0.532. -1.045. -1.173. -2.155. sit. 167. -1.31. er. 142. ‧ 國. 544. ‧. 530. 0.023. 學. 510. 立. 政 治 大. Un. iv. -1.225. -1.489. -0.985. -1.308. -1.305. -1.072. -2.357. -0.002. -1.102. -1.312. -1.191. -1.05. -2.202. 0.891. -0.065. -0.822. -0.757. -0.875. -0.33. 0.404. 315. 0.501. 0.153. -1.154. -1.372. -1.119. -1.029. -2.471. 328. 0.771. 0.052. -1.035. -1.202. -1.239. -0.953. -2.312. 331. 0.801. -0.056. -1.134. -1.419. -1.239. -1.229. -2.135. 364. 0.314. 0.075. -0.971. -1.414. -1.187. -1.035. -2.216. 383. 0.935. -0.094. -1.355. -1.257. -0.543. -0.811. -0.641. 384. 0.775. -0.068. -1.051. -1.63. -1.132. -1.275. -2.246. 389. 0.905. -0.16. -1.042. -1.481. -1.149. -1.171. -1.952. 391. 0.803. 0.064. -1.083. -1.459. -1.227. -0.953. -2.386. 395. 0.683. 0.008. -1.025. -1.293. -1.202. -0.857. -2.324. 396. 0.684. 0.008. -0.949. -1.435. -1.027. -1.178. -2.336. 35. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(37) 403. 0.864. -0.013. -1.023. -1.332. -1.252. -0.913. -2.155. 404. 0.65. -0.104. -0.997. -1.219. -1.249. -1.184. -2.364. 432. 0.735. -0.09. -1.051. -1.318. -1.137. -1.27. -2.193. 435. 0.974. -0.052. -1.025. -1.204. -1.418. -1.03. -1.953. 446. 0.915. 0.012. -1.014. -1.187. -1.109. -0.922. -2.196. 448. 0.913. 0.026. -1.224. -1.474. -1.345. -0.902. -2.287. 460. 0.831. 0.056. -1.021. -1.376. -1.091. -1.029. -2.339. 473. 0.919. 0.01. -1.273. -1.355. -1.095. -1.165. -2.108. 510. 0.769. 0.073. -1.03. -1.18. -1.346. -0.853. -2.215. 530. 0.333. 0.486. -0.831. -0.873. -0.761. -0.719. -0.772. 544. 1.026. -0.053. -1.239. -1.671. -1.303. -1.338. -1.86. 142. 0.682. 0.025. -1.512. -1.254. -1.481. -0.975. -2.362. 167. 0.947. 0.012. 168. 1.03. 0.083. 176. 0.814. 195. 1.115. -1.095. -2.199. -1.341. -1.65. -1.435. -1.36. -2.671. 0.063. -0.773. -0.695. -0.768. -0.358. 0.154. 0.725. -0.031. -1.4. -1.66. -1.079. -1.336. -2.341. 0.837. -0.07. -0.861. -1.293. -1.317. -0.937. -2.182. 0.991. 0.017. -1.207. -1.394. -1.251. -1.113. -2.348. 0.994. -0.051. -0.23. 0.187. 0.016. 0.397. 0.092. -1.537. -1.693. -1.359. 0.812. 0.079. -1.104. -1.327. -1.356. 0.76. -0.06. -1.299. -1.515. 0.049. -0.625. -1.267. -0.149. -1.095. -0.987. -0.03. 364. 0.377. 383. 1.119. 384. 0.622. -0.063. 389. 0.908. -0.178. 391. 0.647. 395. al. Ch. engchi. 0.663. 1.696. -1.304. -2.998. y. 立. n. Shrinkage:J-S. -1.37. io. 331. -1.361. -0.981. -2.385. -1.404. -1.378. -2.281. -1.014. -0.829. -1.965. -0.273. -0.553. -0.035. -1.418. -1.706. -2.805. sit. 328. -1.265. Nat. 315. -2.175. er. 285. -1.285. ‧. 265. -1.404. ‧ 國. 219. -1.485. 學. 206. 政 治 大 -1.031. Un. iv. -1.392. -2.188. -1.269. -1.745. -1.263. -1.412. -2.056. 0.071. -1.368. -1.79. -1.425. -1.184. -2.888. 0.636. 0.011. -1.037. -1.334. -1.298. -0.838. -2.514. 396. 0.639. -0.016. -1.077. -1.759. -1.214. -1.508. -2.633. 403. 0.83. -0.031. -1.106. -1.417. -1.4. -0.955. -2.335. 404. 0.505. -0.072. -1.068. -1.279. -1.455. -1.387. -2.664. 432. 0.907. -0.054. -1.131. -1.443. -1.245. -1.358. -2.121. 435. 0.978. -0.146. -0.858. -0.991. -1.352. -0.95. -1.87. 446. 0.976. 0.012. -0.982. -1.191. -1.137. -0.839. -2.239. 448. 0.84. 0.023. -1.298. -1.449. -1.416. -0.88. -2.494. 460. 0.922. 0.055. -1.103. -1.649. -1.262. -1.123. -2.479. 473. 0.888. 0.037. -1.396. -1.355. -1.07. -1.184. -2.179. 510. 0.756. 0.084. -1.139. -1.175. -1.516. -0.881. -2.397. 36. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(38) 530. 0.357. 0.224. -0.242. -0.381. -0.244. -0.214. -0.009. 544. 1.092. -0.105. -1.106. -1.6. -1.148. -1.31. -1.789. 表 4.3.3 Store Type A 之變數 P-value 𝑆𝐿𝑡−2. 𝑆𝐿𝑡−3. 𝑆𝐿𝑡−4. 𝑆𝐿𝑡−5. 𝑆𝐿𝑡−6. 𝑆𝐿𝑡−7. Intercept. 142. 0. 0. 0.116. 0.116. 0.702. 0.064. 0.854. 0.006. 167. 0. 0. 0.007. 0.007. 0.131. 0.963. 0.485. 0. 168. 0. 0. 0.136. 0.029. 0.223. 0.261. 0.791. 0. 176. 0. 0. 0.045. 0.065. 0.102. 0.176. 0.046. 0. 195. 0. 0. 0.022. 0.852. 0.094. 0. 0.291. 0.039. 206. 0. 0. 0.121. 0.179. 0.351. 0.078. 0.696. 0. 219. 0. 0. 0.004. 0.223. 0.061. 0.92. 0.501. 0.001. 265. 0. 0. 0.611. 0.01. 0.012. 0.394. 0.226. 0. 285. 0. 0. 0.033. 0.039. 0.504. 0.134. 0.01. 0. 315. 0. 0. 0.001. 0.468. 0.869. 0.616. 0.779. 0.024. 328. 0. 0. 0.102. 0.119. 0.993. 0.255. 0. 331. 0. 0. 0.001. 0.587. 0.03. 0.825. 0.218. 0. 364. 0. 0. 0. 0.786. 0.17. 0.153. 0.042. 0. 383. 0. 0. 0.003. 0. 0.014. 0.005. 0.413. 0. 384. 0. 0. 0. 0.087. 0.092. 0.929. 0.614. 0. 389. 0. 0. 0.004. 0.003. 0.147. 0.049. 0.157. 0. 391. 0. 0. 0.192. 0.19. 0.35. 0.046. 0.03. 0. 395. 0. 0. 0.009. 0.216. 0.102. 0.449. 0.717. 0. 396. 0. Nat. 𝑆𝐿𝑡−1. Store. 0. 0. 0.2. 0.007. 0.841. 0.471. 0. 403. 0. 0. 0.005. 0.246. 0.232. 0.147. 0.928. 0. 404. 0. 0. 0. 0.459. 0.11. iv. 0.839. 0.002. 0. 432. 0. 0. 0.006. 0.209. 0.039. 0. 435. 0. 0.001. 0.09. 446. 0. 0. 448. 0. 460. n. Ch. engchi. sit. y. ‧. io. al. 學. ‧ 國. 0.179. er. 立. 政 治 大. Un. 0.019. 0.68. 0.285. 0.034. 0.793. 0.197. 0. 0.959. 0.075. 0.172. 0.613. 0.143. 0.001. 0. 0.194. 0.095. 0.456. 0.723. 0.322. 0. 0. 0. 0.049. 0.044. 0.001. 0.579. 0.948. 0. 473. 0. 0. 0.024. 0.079. 0.088. 0.782. 0.063. 0. 510. 0. 0. 0.008. 0.323. 0.002. 0.502. 0.133. 0. 530. 0. 0. 0. 0.611. 0.114. 0.698. 0.183. 0. 544. 0. 0. 0.294. 0. 0.615. 0.616. 0.862. 0. (續)表 4.3.3 Store Type A 之變數 P-value Store. Intercept. 142. 0. 𝑆𝐿𝑡−1 0.712. 𝑆𝐿𝑡−2 0. 𝑆𝐿𝑡−3 0. 𝑆𝐿𝑡−4 0. 𝑆𝐿𝑡−5 0. 𝑆𝐿𝑡−6 0. 𝑆𝐿𝑡−7 142. 37. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(39) 0. 0.801. 0. 0. 0. 0. 0. 167. 168. 0. 0.11. 0. 0. 0. 0. 0. 168. 176. 0. 0.532. 0. 0. 0. 0. 0. 176. 195. 0. 0.36. 0. 0. 0. 0. 0.147. 195. 206. 0. 0.549. 0. 0. 0. 0. 0. 206. 219. 0. 0.212. 0. 0. 0. 0. 0. 219. 265. 0. 0.72. 0. 0. 0. 0. 0. 265. 285. 0. 0.328. 0.012. 0.084. 0.883. 0. 0. 285. 315. 0. 0.096. 0. 0. 0. 0. 0. 315. 328. 0. 0.15. 0. 0. 0. 0. 0. 328. 331. 0. 0.296. 0. 0. 0. 0. 0. 331. 364. 0. 0.359. 0. 0. 0. 0. 0. 364. 383. 0. 0.012. 0. 0. 0.003. 0. 0.734. 383. 384. 0. 0.197. 0. 0. 0. 0. 0. 384. 389. 0. 0.001. 0. 0. 0. 0. 0. 389. 391. 0. 0.151. 0. 0. 0. 0. 0. 391. 395. 0. 0.847. 0. 0. 0. 0. 0. 395. 396. 0. 0.741. 0. 0. 0. 0. 0. 396. 403. 0. 0.564. 0. 0. 0. 0. 0. 403. 404. 0. 0.145. 0. 0. 0. 0. 0. 404. 432. 0. 0.26. 0. 0. 0. 0. 0. 432. 435. 0. 0.026. 0. 0. 0. 0. 0. 435. 446. 0. 0.812. 0. 0. 0. 0. 0. 446. 448. 0. 0.675. 0. 0. 0. 0. 0. 448. 460. 0. 0.231. 0. 0. 0. 0. 460. 0. 0.519. 0. 0. iv. 0. 473. al. 0. 0. 473. 510. 0. 0.144. 0. 0. 0. 510. 530. 0. 0. 0.002. 544. 0. 0.059. 0. io. n. Ch. engchi. y. sit. Nat. 0. ‧. ‧ 國. 立. er. 政 治 大. 學. 167. Un. 0. 0. 0. 0. 0.003. 0.908. 530. 0. 0. 0. 0. 544. 38. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(40) 圖 4.3.8 Shrinkage:Gibbs 與 Shrinkage:JS 後的 Promo coefficient. 政 治 大. 圖 4.3.9 Shrinkage:Gibbs 與 Shrinkage:JS 後的 Dayofweek6 coefficient. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i n U. v. 圖 4.3.10 Shrinkage:Gibbs 與 Shrinkage:JS 後的 Schoolholiday coefficient. engchi. 39. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(41) 表 4.3.4 StoreType A 的 MSE 在 Shrinkage:Gibbs、Shrinkage:J-S、OLS、 common model、Shrinkage:J-S one step ahead 模型表現比較 S/O. J-S/O. C/O. 0.99. 1.31. 10.20. 1390.16. comm 4726.71 onmodel 9863.66. 1.00. 1.42. 7.10. 1230.39. 1062.34. 7822.55. 1.07. 1.16. 7.36. J-S one step2.706 ahead 2.431/ O 2.637. 839.82. 952.54. 735.70. 5369.38. 1.14. 1.29. 7.30. 3.057. 195. 1460.37. 1871.87. 1380.61. 11289.13. 1.06. 1.36. 8.18. 1.832. 206. 1527.62. 1894.79. 1494.98. 8356.47. 1.02. 1.27. 5.59. 2.129. 219. 376.09. 400.96. 371.10. 3291.00. 1.01. 1.08. 8.87. 2.956. 265. 701.25. 827.79. 697.93. 5152.95. 1.00. 1.19. 7.38. 2.923. 285. 883.80. 908.21. 724.02. 315. 618.24. 1098.42. 609.56. 328. 519.54. 635.89. 331. 662.83. 949.12. 364. 567.05. 383. 3078.62. 384. 1840.82. 389. 1478.17. 391. 902.17. 395. 438.92. 396. 1699.50. Nat. Shrink 608.40 age:JS 1975.47. OLS. 167. Shrink 458.17 age:Gi bbs 1387.39. 168. 1140.97. 176. 403. 780.42. 995.80. 404. 765.82. 1192.84. 432. 1792.83. 1625.79. 435. 352.72. 340.66. 343.11. 446. 628.26. 683.58. 448. 1123.89. 460. 463.35. 1.25. 7.81. 1.928. 4386.10. 1.01. 1.80. 7.20. 2.474. 4614.31. 1.01. 1.23. 8.95. 3.031. 669.65. 5673.33. 0.99. 1.42. 8.47. 2.605. 1080.73. 579.94. 5184.02. 0.98. 1.86. 8.94. 2.688. 2340.89. 1505.27. 17557.53. 2.05. 1.56. 11.66. 1.839. 2349.80. 1751.14. 10152.87. 1.05. 1.34. 5.80. 2.382. 1782.76. 1424.34. 11717.55. 1.04. 1.25. 2.043. 1392.00. 886.00. 6268.06. 1.02. 1.57. ‧. 8.23 7.07. 2.917. 659.06. 421.24. 4082.69. 1.04. 1.56. y. 9.69. 2.87. 2445.35. 1613.19. 10800.19. 1.05. 1.52. 6.69. 2.646. 781.33. 7557.53. 1.00. 1.27. er. 9.67. 2.885. 697.38. 5653.44. 1.10. 1.71. 8.11. 2.811. 1.20. 9.05. 2.301. 立. 515.40. io. n. al. Ch. 1351.84. engchi. sit. 1.22. 學. 政 治 大 5654.66. ‧ 國. 142. i n U. v. 12240.21. 1.33. 3277.07. 1.03. 0.99. 9.55. 2.905. 638.01. 5066.64. 0.98. 1.07. 7.94. 3.21. 1399.06. 1126.42. 8926.36. 1.00. 1.24. 7.92. 2.635. 682.70. 744.14. 632.02. 3826.75. 1.08. 1.18. 6.05. 2.912. 473. 480.34. 676.29. 438.58. 3601.99. 1.10. 1.54. 8.21. 2.836. 510. 955.61. 1391.86. 968.19. 8119.49. 0.99. 1.44. 8.39. 2.828. 530. 626.20. 696.77. 612.09. 3554.83. 1.02. 1.14. 5.81. 2.378. 544. 2115.66. 2107.49. 1886.92. 13520.25. 1.12. 1.12. 7.17. 2.405. Total. 1197.94. 1380.14. 1026.92. 8043.84. 1.17. 1.34. 7.83. 2.435. 表 4.3.4 之 S O 代表 Shrinkage:Gibbs 之 MSE 與 OLS 之 MSE 的比值,C O 代 表 common model 之 MSE 與 OLS 之 MSE 的比值,J-S O 代表 Shrinkage:J-S 之 40. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(42) MSE 與 OLS 之 MSE 的比值,J-S one step ahead O 代表 J-S one step ahead 之 MSE 與 OLS 之 MSE 的比值。 以迴歸係數來看,由表 4.3.2 顯示 Shrinkage:J-S 相較於迴歸係數並沒有太大 的縮減情況,而 Shrinkage:Gibbs 相較於迴歸係數有較大的變動,有部分迴歸係 數能夠有縮減的情形,然而也有部分迴歸係數會有發散的情況。由圖 4.3.8 來看 𝑃𝑟𝑜𝑚𝑜𝑡迴歸係數皆為正的情況,Shrinkage:Gibbs 能夠將此變數之迴歸係數在近一 步縮減。圖 4.3.9 可以看到在𝐷𝑂𝑊6𝑡的迴歸係數大部分分店皆為負數,有少部分. 政 治 大. 分店的迴歸係數為正號,經過 Shrinkage:Gibbs 後此正號的部分有縮減至負號的情. 立. 況。圖 4.3.10 可以看到 Schoolholiday 迴歸係數有正有負的情況,經過. ‧ 國. 學. Shrinkage:Gibbs 後並沒有產生縮減的情況,並且有一家分店有發散的情形。. ‧. 另外,將表 4.3.2 搭配表 4.3.3 的 P-value 來看,在表 4.3.3 裡,某變數若有較. sit. y. Nat. 多店家之 P-value 達到顯著(ex: Intercept、𝑃𝑟𝑜𝑚𝑜𝑡、𝐷𝑂𝑊2𝑡、𝐷𝑂𝑊3𝑡、𝐷𝑂𝑊4𝑡、. io. al. er. 𝐷𝑂𝑊5𝑡、𝐷𝑂𝑊6𝑡),則該變數經過 Shrinkage:Gibbs 後皆有縮減的現象,例如:變數. v. n. 𝐷𝑂𝑊3𝑡、𝐷𝑂𝑊4𝑡、𝐷𝑂𝑊5𝑡中第 285 店家的係數分別由 0.187 縮減至-0.757、0.016. Ch. engchi. i n U. 縮減至-0.875、0.663 縮減至-0.33,有將係數改進至與其他店家之正負號相同的情 形;變數𝐷𝑂𝑊6𝑡中第 195、第 383、第 530 店家的係數分別由 0.154 縮減至0.532、-0.035 縮減至-0.641、-0.009 縮減至-0.772。 以整體預測能力來看,由表 4.3.4 可以看到 common model 的 MSE 為最差 的,而經過 Shrinkage:Gibbs、Shrinkage:J-S 後的 MSE 表現與 OLS 相比皆變差, 而 Shrinkage:J-S 其預測能力比 Shrinkage:Gibbs 還差。以個別店家的預測力來看, 第 142、167、331、364、403、446、448、510 店家經過 Shrinkage:Gibbs 的預測 能力比 OLS 與 Shrinkage:J-S 好,而其他的店家經過 Shrinkage:Gibbs 的預測能力 41. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(43) 皆比 OLS 差,與 Shrinkage:J-S 相比,預測能力有較好的情況;Shrinkage:J-S 在 所有店家中預測能力更皆變差。而 J-S one step ahead 在整體與各個分店看下來, 其預測能力皆變更差,且比 Shrinkage:J-S 還差。 圖 4.3.11 Shrinkage:Gibbs 、Shrinkage:JS、OLS 預測 42 期與原始資料表. 政 治 大. 立. ‧. ‧ 國. 學. 10−4. 100. 104. 100. Ch. 142. 0.966. 0.980. 0.968. 0.965. 0.989. 167. 1.002. 1.001. 1.019. 1.004. 168. 1.078. 1.072. 1.099. 176. 1.110. 1.128. 195. 1.058. 206. 104. 10−4. engchi. sit. y. al. 10−4. 100. i n U 100. 104. er. 10−4. n. Σ. io. 10−8. R. Nat. 4.3.5 Σ、R 在不同尺度下各分店與總體 MSE 與 OLS 比值. v 104. 10−4. 100. 104. 0.982. 0.969. 0.992. 0.991. 1.194. 1.344. 1.077. 0.998. 1.002. 0.998. 0.989. 0.977. 1.023. 1.187. 1.103. 1.082. 1.074. 1.079. 1.058. 1.090. 1.079. 1.562. 1.524. 1.462. 1.139. 1.100. 1.142. 1.125. 1.101. 1.090. 1.081. 0.958. 1.141. 0.893. 1.056. 1.061. 1.068. 1.058. 1.053. 1.025. 1.035. 1.010. 1.260. 1.091. 1.295. 1.034. 1.022. 1.027. 1.029. 1.022. 1.014. 1.016. 1.004. 1.034. 1.318. 1.248. 1.239. 219. 1.030. 1.036. 1.042. 1.032. 1.013. 1.049. 1.047. 1.056. 1.043. 1.347. 1.295. 1.315. 265. 0.995. 1.003. 0.999. 0.985. 1.005. 0.981. 0.984. 1.002. 0.995. 1.040. 1.129. 1.208. 285. 1.209. 1.209. 1.220. 1.210. 1.221. 1.212. 1.080. 1.067. 1.060. 1.124. 1.139. 1.091. 315. 1.015. 1.017. 1.026. 1.013. 1.014. 1.016. 0.993. 1.003. 0.996. 1.035. 1.190. 1.127. 328. 1.026. 1.025. 1.006. 1.014. 1.008. 0.996. 0.979. 0.989. 0.976. 1.267. 1.095. 1.092. 331. 0.984. 0.985. 1.000. 0.994. 0.990. 0.990. 1.014. 0.993. 1.008. 1.652. 1.554. 1.589. 42. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(44) 364. 0.975. 0.976. 0.987. 0.965. 0.978. 0.982. 1.035. 1.021. 1.014. 1.547. 1.497. 1.460. 383. 2.061. 2.095. 2.002. 2.039. 2.045. 2.086. 2.169. 2.149. 2.107. 11.689. 11.688. 11.688. 384. 1.054. 1.050. 1.052. 1.057. 1.051. 1.064. 1.037. 1.054. 1.040. 1.171. 1.191. 1.230. 389. 1.032. 1.033. 1.038. 1.027. 1.038. 1.041. 1.043. 1.043. 1.052. 1.265. 1.178. 1.284. 391. 1.014. 1.034. 1.015. 1.009. 1.018. 1.002. 1.012. 1.007. 1.001. 1.114. 1.319. 1.020. 395. 1.034. 1.014. 1.023. 1.040. 1.042. 1.024. 1.032. 1.031. 1.032. 1.050. 1.155. 1.242. 396. 1.064. 1.053. 1.054. 1.066. 1.054. 1.055. 1.029. 1.048. 1.022. 1.135. 1.275. 1.093. 403. 0.990. 0.987. 1.001. 0.997. 0.999. 0.997. 0.997. 0.990. 0.984. 1.350. 1.543. 1.366. 404. 1.072. 1.084. 1.100. 1.085. 1.098. 1.102. 1.115. 1.082. 1.107. 1.190. 1.191. 1.367. 432. 1.344. 1.332. 1.351. 1.336. 1.326. 1.343. 1.412. 1.427. 1.432. 1.782. 1.430. 1.654. 435. 1.032. 1.035. 1.030. 1.025. 1.028. 1.016. 1.010. 1.020. 1.044. 1.464. 1.497. 1.241. 446. 1.000. 0.972. 0.967. 0.976. 0.985. 0.989. 0.993. 0.975. 0.981. 1.294. 1.554. 1.498. 448. 1.013. 1.000. 1.022. 1.031. 0.998. 1.010. 1.014. 1.002. 1.003. 0.921. 1.003. 0.977. 460. 1.065. 1.064. 1.070. 1.083. 1.080. 1.077. 1.094. 1.096. 1.086. 1.155. 1.258. 1.301. 473. 1.089. 1.092. 1.090. 1.110. 1.095. 1.089. 1.091. 1.099. 1.083. 2.290. 2.207. 2.147. 510. 0.974. 0.974. 0.980. 0.983. 0.987. 0.995. 0.989. 0.970. 0.984. 學. 1.153. 1.353. 1.186. 530. 1.007. 1.029. 1.006. 1.047. 1.023. 1.029. 1.143. 1.087. 1.137. 1.234. 1.504. 1.417. 544. 1.113. 1.110. 1.132. 1.118. 1.121. 1.111. 1.098. 1.079. 1.103. 4.085. 4.199. 4.028. Total. 1.169. 1.171. 1.167. 1.168. 1.167. 1.172. 1.180. 1.177. 1.172. 3.603. 3.619. 3.594. ‧. ‧ 國. 立. 政 治 大. sit. y. Nat. n. al. er. io. 以整體 MSE 來看,當 R 的尺度在 104 時,其比值最大,其次為 100,尺度為. i n U. v. 10−8、10−4 並無太大差別。以個別店家來看,當 R 的尺度在 104 時,MSE 比值小. Ch. engchi. 於 1 的分店比例較其他尺度低,尺度為 100、10−8、10−4 無太大差別,可以理解 為在(13)式子裡,當 R 設定的越大,Σ−1 的平均會越小,則 Σ 會越大,則(14)式子 裡的𝛽𝑖的共變異矩陣異越大,此時𝛽𝑖抽取出來的平均迴歸係數則會離給定的先驗迴 歸係數 η 太遠,越不準確的迴歸係數預測的能力當然也無法更好。而關於 Σ 初始 值的尺度設定,在 104、100、10−4 此三種尺度的設定下看不出來在 MSE 比值的 好壞差異。. 43. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(45) Chapter 5. 5.1. 結論. 結論 Shrinkage:Gibbs 在不同參數設定下對於迴歸係數的 Shrinkage 程度不同,參數. 𝜈、𝜆、𝜌、Σ、𝛶 、R 的設定,其中𝜌 設定與回歸參數個數相同,此設定會使 Wishart distribution 帶有最少的資訊; 𝜈、𝜆 設定以使得 gamma distribution 帶有最少資訊;. 政 治 大 亦有提到關於迴歸係數之共變異矩陣Σ對於迴歸係數縮減的關係,假如對Σ設定較 立. 而關於Σ、R 的設定皆與迴歸係數的變異程度有關,在 McCulloch & Rossi(1999)中. ‧. ‧ 國. 會較分散。. 學. 小的數,則迴歸係數會縮減到給定的迴歸係數先驗分配平均數𝜂;反之,迴歸係數. Shrinkage:J-S 的好處是期計算較快,但是係數與 MSE 改進的幅度較小;而. y. Nat. er. io. 的改善。. sit. Shrinkage:Gibbs 需要花費較長的計算時間,但是係數與 MSE 有機會得到較大幅度. al. n. v i n Ch 而本次實驗結果看來,在迴歸係數方面,Shrinkage:Gibbs 對於 OLS 的 P-value engchi U. 顯著較多店家的變數之係數會有縮減的情況,而 Shrinkage:J-S 的係數幾乎沒有太 大變化。在預測能力方面,不管是經由 Shrinkage:Gibbs 或者 Shrinkage:J-S 其 MSE 的改進皆不明顯,Shrinkage:Gibbs 可能原因是各個店家的迴歸係數皆太相近,彼此 沒有足夠的額外資訊來改進自身的預測能力,而 Shrinkage:J-S 的原因則是因為其 並沒有借用到其他店家資料,因此其改善空間並不大,然而因為 Shrinkage:Gibbs 有 有借用 到其他 店家資料 ,所以相較 Shrinkage:J-S 有改進預測能力。關於模 型本身的超參數設定問題,本次實驗亦有探討與共變異數矩陣有關的超參數設定, 44. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(46) 由結果來看僅知道當共變異矩陣之先驗分配參數 R 設定過大時,則此時經 Shrinkage:Gibbs 的預測能力會較差。而 J-S one step ahead 的方法在各店家與整體 來看期預測能力皆比所有的方法還差,原因在原本的 Shrinkage:J-S 的預測能力就 已經不好,因此再使用 one step ahead 並不會改進只會更差。. 5.2. 後續探討 本論文我們皆以 Shrinkage:Gibbs、Shrinkage:J-S 與 OLS 之間的模型預測能力. 做比較,若單看迴歸模型是否還有其他重要變數是此資料集未能提供的還有待改. 政 治 大. 進空間,或者此迴歸模型是否是一個好的模型,可能皆為改進空間。而本研究實驗. 立. 中僅對 StoreTypeA 的店家來做分析,若能增加 StoreTypeB、StoreTypeC、StoreTypeD. ‧ 國. 學. 的資料,讓更多元的資料納入,看到對於迴歸係數的影響。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 45. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(47) 文獻參考. [1]. Jun Shao, Mathematical Statistics, 1999. [2]. Robert C. Blattberg and Edward I. George,1991, Shrinkage Estimation of Price and Promotional Elasticities: Seemingly Unrelated Equations. [3]. Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari, and Donald B.Rubin 2013, Bayesian Data Analysis, Third Edition. [4]. Donald B. Rubin 1980, Using Empirical Bayes Techniques in the Law School Validity Studies. 立. Andrew McCallum, Ronald Rosenfeld, Tom Mitchell, Andrew Y. Ng, Improving. 學. ‧ 國. [5]. 政 治 大. Text Classification by Shrinkage in a Hierarchy of Classes. John Barnard, Robert McCulloch and Xiao-Li Meng 1999, Modeling Covariance. ‧. Matrices in Terms of standard deviations and correlations, with application to. io. sit. y. Nat. shrinkage. n. al. er. [6]. Ch. engchi. i n U. v. 46. DOI:10.6814/THE.NCCU.STAT.004.2019.B03.

(48)

參考文獻

相關文件

自瑞士政府採行限制與封鎖措施期間近 33,000 家商店暫時 關門,造成零售業之失業登記人數急劇上升。2 月至 5 月零 售業失業登記人數增加

在商業現代化進程中,連鎖化、大型化、資訊化的趨勢不斷演進,門市服務業發展 也從單店經營到多店經營以至連鎖經營的層次,以

從思維的基本成分方面對數學思維進行分類, 有數學形象思維; 數學邏輯思維; 數學直覺 思維三大類。 在認識數學規律、 解決數學問題的過程中,

— 牛頓, 1643 – 1727 — Euler 關於這個級數的求和方法非常有創意是一個數學系學生應該具備的常識, 但事與願 違。 我在求學的階段並不知道這段有趣的歷史,

2-1-1 複變數的概念.

然而,由於美中貿易衝突未完全化解,中國大陸經濟成長 走緩,加上英國脫歐前景未明,影響全球投資信心,仍不利全 球經濟成長,多數經濟預測機構預估 2019

三階導數也就是加速度的變化率 s′′′ = (s′′)′ = a′ ,也常被稱為 jerk (“猛推”,中文並不常用這類的字,僅以英文敘述). 此時這個 jerk

對於給定的一個 x 值,經過某一對應方式後得到「唯一」的 y 值,這種對應方式我們稱 為函數,其中 x 是自變數,y 是應變數。. 而在表