歐美地區對台灣之旅遊需求預測
*
ܘᆂᓜ
**
ă
ౘݴӮ
***
收稿日期:2010 年 1 月 15 日 接受日期:2010 年 3 月 3 日*
作者感謝兩位匿名審查人的評論和建議。方嘉閩和高美菁的打字、資料蒐集和 登錄協助,一併致謝。**
臺灣大學國家發展研究所副教授。電話:3366-3326。MAIL: [email protected]。***
臺灣大學國家發展研究所碩士。摘 要
回顧歷年來之來台旅客,雖皆以亞洲旅客居多,但有鑒於美、 加及歐洲地區亦是來台旅遊之新興市場,同時也為我國在觀光客倍 增計畫中努力拓展來台旅遊之目標市場,故本篇研究將以美國、加 拿大和歐洲為研究對象,採用交通部觀光局所公佈的 1971 年 1 月 至 2008 年12 月之旅客入境人數年、季和月資料,分別對此三個地區建立簡單線性迴歸模型(linear trend)、Holt-Winters 趨勢的季節
性加法預測模型、自我迴歸自我迴歸移動平均模型(autoregressive
autoregressive moving average)、季節性與非季節性自我迴歸整合移
動平均模型(seasonal-nonseasonal autoregressive integrated moving
average)和部分整合自我迴歸移動平均模型(fractionally integrated
autoregressive moving average)等五種模型,進行樣本內的預測,並
使用平均絕對百分比誤差和均方根誤差統計量檢驗不同預測模型之 預測能力。SARS(嚴重急性呼吸系統綜合症)爆發於 2003年3月 初,如果因為這一事件產生一個結構突破,在假設整個期間是一個 常數參數結構下得到的預測結果將受到懷疑。因此本文最後將作一 項帶有結構破壞的單根檢驗之時間序列分析。 關鍵詞:旅遊、單根檢驗、預測、平均絕對百分比誤差
壹、研究動機與目的
世界觀光組織(World Tourism Organization;WTO)發佈最新資 料顯示,2008 年全球仍有許多動亂不安的事件,然而在金融海嘯的 影響下,全年全球國際觀光遊客人次仍超乎預期,達到 9 億 2,400 萬 人次,較 2007 年成長 2%; 亞太地區 2008 年到訪旅客人次約為 1 億 8,800 萬人次,與 2007 年相較成長 1.6%。台灣位於亞太地區的樞紐, 具有先天上的地理優勢,更應掌握此全球主流旅遊觀光市場的移轉時 機。根據世界旅遊及觀光委員會(World Travel & Tourism Council; WTTC 2009)的報告,2008 年全球旅遊產業提供約 2 億 2,500 萬個 相關工作機會,占總就業的 9.3%;國際旅遊收入達到 9,440 億元, 與 2007 年相較成長 1.8%。綜合上述,觀光產業不但能增加外匯,也 能提供就業機會;而台灣在外部競爭模式改變,內部經濟結構尚未完 全轉型、失業率居高不下的情況下,全力拓展觀光已是刻不容緩。 為了掌握時機將台灣打造成最具有競爭力的國家,我國政府亦將 發展觀光旅遊訂為「挑戰 2008:國家發展重點計畫」之一項重要項 目,並在 2002 年 8 月啟動「觀光客倍增計劃」,希望將台灣打造成 為「觀光之島」。另外行政院也在 2009 年通過一項觀光拔尖領航方 案,增加旅客來台觀光的計畫,在該計畫下 300 億新台幣預算將應用 於發展台灣成為東亞主要旅遊中心,每年增加吸引 160 萬外國旅客, 並將 2012 年目標人次訂為 550 萬。因此,在這些目標之中,對未來 之來台觀光旅遊人數的需求預測就顯得極為重要,而如何建立一套系 統化的研究方法以客觀推估未來旅客人次就構成了本研究的動機之 一。其次,觀察歷年來之來台旅客,雖皆以亞洲為主要來台旅遊的市 場,然而在發展國際觀光之時,任何地區皆有可能是來台旅遊之潛在 市場,而美國、加拿大和歐洲地區除了具有發展潛力外,亦是我國觀
光局努力拓展來台旅遊之目標市場。另外,針對這些地區之來台旅遊 人數的需求預測也將有助於觀光資源之配置與投資,因此,掌握不同 市場之旅遊人次脈動以供相關部門做為決策依據就構成了本研究的動 機之二。本研究將以美國、加拿大和歐洲為研究對象,採用交通部觀 光局所公佈的 1971 年 1 月至 2008 年 12 月之旅客入境人數年、季和 月資料,分別對此三個地區建立五種時間序列模型,進行樣本內的預 測,並使用平均絕對百分比誤差和均方根誤差統計量檢驗不同預測模 型之預測能力,以選取美、加和歐洲各自之最適預測模型。如此方能 彌補國內關於來台旅遊需求預測研究文獻之不足,並期望預測結果能 提供相關單位和業者做為觀光政策或觀光行銷策略制定和實施的參 考。
貳、文獻探討
國外旅遊需求預測的實證研究文獻為數相當龐大,約略可分為採 用迴歸分析的和純時間數列分析。在應用迴歸方面,Leob (1982) 探 究實質所得、匯率和相對價格對旅遊輸出的影響。Uysal and Crompton (1985) 評述質化方法和量化方法並建議應用兩種方法的組合會產生 較準確的預測。Malenberg and Van Soest (1996) 應用橫切面資科分析 荷蘭家庭的年旅遊支出。Kulendran and King (1997) 比較用於預測美 國、日本、英國和紐西蘭到澳洲的季旅遊流量的預測模型,結論是誤 差修正模型(error correction model)表現不如時間序列模型。Law and Au (1999) 是第一位應用類神經網絡預測日本到香港的旅客人數。 Song and Witt (2006) 應用向量自動迴歸模型預測到澳門的旅客人 數。Athanasopoulos and Hyndman (2008) 應用帶有外生變數的變動狀 態空間模型(innovation state space model)預測澳洲國內旅遊需求。旅遊資料比較 Box-Jenkins 方法和指數平滑預測法。Choy (1984) 應 用時間序列迴歸預測旅客抵達亞太地區來檢驗預測技術的準確度。 Martin and Witt (1989) 評估英、美、法和德國的境外旅遊預測表現, 其結論是簡算法 I 產生最準確的一年期預測。Chan (1993) 應用若干 個預測模型探討國際旅客抵達新加坡的數字,其發現波動性時間序列 非線性迴歸模型(sine wave nonlinear regression model)比簡算法 I、 簡算法 II、簡單線性和 ARIMA (2,1,2) 模型較優。Lim and McAleer (2002) 在模型選擇和執行預測之前,透過單根和季節單根檢定,分 析國際旅遊時間序列是否穩定,繼而應用 Box-Jenkins ARIMA 模型 估計香港、馬來西亞和新加坡抵達澳洲的旅客人數。Gil-Alina (2005) 應用季節性部份整合方法於抵達紐西蘭旅客次數的預測上;該文發現 季節性模型在預測表現上勝過非季節性模型。Chen and Wang (2007) 應用支援向量迴歸方法(support vector regression)於中國的季旅遊 需求上,實證研究顯示支援向量迴歸超越類神經網路和 ARIMA 的表 現。Wang, Song, Witt and Wu (2007) 探討旅遊預測的組合是否能產生 較準確的預測。Chu (2009) 應用 ARMA 為基礎的模型於亞太地區九 個國家的旅客人次的預測﹔實證研究顯示 ARMA 為基礎的模型將 MAPE 值保持在 10 以下。 回顧國內過去針對來台旅客為研究主題之文獻,大多是對總體來 台旅客人數進行研究,對各別來台客源市場的旅遊需求預測之探討則 大多侷限在日本,而過去雖有對美國和歐洲來台旅客進行需求預測的 研究(如:時巧煒(1994)以簡算法、時間趨勢模型、指數平滑法、 轉移函數、計量經濟模型、自我相關整合移動平均模型建立和評估美 國和歐洲來台旅客需求預測模型,發現兩個地區皆以時間趨勢模型的 預測能力最好;江麗文(1995)以計量經濟模型建立美國來台旅客需 求模型;施瑞賢(2003)則替美國和歐洲以觀光為目之來台觀光者建 構自我相關整合移動平均模型),但卻沒有利用各種不同的時間序列
模型(尤其是自我迴歸自我迴歸移動平均模型和部分整合自我迴歸移 動平均模型)建立預測模式並加以評估其預測能力之研究。除此以外, 關於加拿大地區,國內則尚未有學者針對這個市場之來台旅遊需求進 行預測。故本研究以美國、加拿大和歐洲地區之來台旅客為研究對象, 採用簡單線性迴歸模型(Linear Trend)、Holt-Winters 趨勢的季節性 加 法 預 測 模 型 、 自 我 迴 歸 自 我 迴 歸 移 動 平 均 模 型 ( autoregressive autoregressive moving average, ARARMA 或 ARAR)、季節性與非季 節性自我迴歸整合移動平均模型(seasonal-nonseasonal autoregressive integrated moving average, ARIMA 或 SARIMA)和部分整合自我迴歸 移動平均模型(fractionally integrated autoregressive moving average, ARFIMA)等五種不同之時間序列模型,針對這三個來台市場建構此 五種預測模型,並就各模型加以評估其預測能力,以選取美、加和歐 洲各自之最適預測模型。文章結構安排如下:第一節為研究動機與目 的,第二節為文獻探討,第三節為模型設計,第四節為資料來源與模 型預測能力分析,第五節為單根檢定,第六節為討論與建議。
參、模型設計
一、簡單線性迴歸模型
(
Simple Linear Regression Model
)
簡單線性迴規模型認為序列 {Ft, t=1,2,…,n}在每一期都會以固定
的絕對數量成長,此模型以時間 t 做為模型中的自變數,再將對應之
各期之入境人數作為因變數Ft;並且假定實際的入境人數變化可以利
用線性迴歸方程式表示入境人數發展的趨勢。因此,使用最小平方法 (Least Squares Method)可求得一個迴歸方程式:
t t α βt ε
其中,Ft表示入境人數,在本研究中則表示在第t 期入境台灣人數之 觀察值。t 表示時間變量;α、β 為迴歸式中待估計的參數。其次,因 為此模型不包含季節調整的功能,所以在進行模型參數估計之前,本 研究將先就原始序列 {Ft, t=1,2,…,n} 進行乘積的移動平均之季節調整 以得到 12 月(四季)之季節指數和一個新變數(YSA),再利用此 一新變數(YSA)代替原迴歸式的應變量 Ft 建立迴歸模型。並且, 在以此迴歸模型進行預測時,需將所得到之相對應的各個對應值分別 乘以進行季節調整後所得到的季節指數,才能得到最後的預測值。如 果殘差項εt有自相關,有幾種估計方法可以產生比最小平方法更有效
(more efficient)的估計值(Cochrane and Orcutt, 1949;Hildreth and Lu, 1960;Durbin, 1960;Prais and Winsten, 1954;Magnus, 1978)。因為 這些估計方法結果沒有太大的差異,本文應用 Cochrane-Orcutt 重複 法修正自相關問題。
二、自我迴歸自我迴歸移動平均模型(
ARARMA
或
ARAR
)
Parzen (1982) 建議一個 Box-Jenkins 方法的延續模型,稱其為 ARARMA 或 ARAR,這是一項二階段評估程序;第一階段先將資料 用於配適一個長期滯後自動迴歸模型(long-lag autoregressive model):t s t t t F F F~ = −α − +ε (2) 其中 s 為季節期數(用在月資料時,s=12),之後將第一階段估計產 生的殘差項配適一個 ARMA 模型。這裡所用的 ARAR 運算法是以配 適 AR 子集代替 ARMA 配適步驟,進行配適時趨向於配適比較高階 的 AR 過程。例如:對著名的航空公司資料(airline data),Box-Jenkins 建議一個帶有 4 個估計參數的 ARIMA(0,1,1)×(0,1,1)12 模型,Parzen 則應用F~t =Ft −1.0248Ft−12作為長期記憶轉換為短期記憶的式子,隨 後是帶有 13 個參數的 AR 濾波(filter)之短期記憶系列。詳細模型
可以參考 Parzen (1982)。
三、季節性與非季節性自我迴歸整合移動平均模型
(
ARIMA and SARIMA
)
ARIMA 模型是由 Box-Jenkins (1976) 所設立的,此模型結構基 本上包含了自我相關、移動平均及差分三個部份。其中差分過程主要 是在將非穩定過程轉換成穩定的序列,而執行差分的次數則需視差分 多少次始能將此非穩定過程轉換成穩定過程而定。其基本模式為:
( )(
)
d t q( )
t p B −B F =θ B ε φ 1 (3) 其中p 表示自我相關階數,q 表示移動平均階數,d 則表示差分次數。 除此以外,φ(B) 為自我迴歸運算符號,θ(B) 為移動平均運算符號, 而 B 為後移運算符號;而此模式穩定的條件為φ(B)=0 之根必須落在 單位圓之外,且θ(B)=0 之根必須落在單位圓之外。 同時 ARIMA 模 型需要經過模型鑑定(model identification)、參數估計(parameter estimation)、診斷查驗(diagnostic checking)等三個步驟方能確立。 (SARIMA)為 ARIMA 模型進一步演化之預測模型,當時間序列具 有週期性的規則變化時,需以季節性差分運算方式將季節因素消除, 再配適 ARIMA 模式即成為季節性與非季節性自我整合移動平均模 型。模式可記為 ARIMA(p,d,q)(P,D,Q)s,其中 P 為季節自我相關階 數,Q 是季節移動平均階數,D 則為季節差分階數, s 是季節週期長 度。其基本模式如下:( )
P( )
s d sD t q( )
Q( )
s t p Β Φ Β ∇ ∇ F =θ Β Θ B ε φ (4) 其中 Φp(BS) 為季節性的 P 階自我相關運算符號,ΘQ (BS) 為季節性 的 Q 階移動平均運算符號,∇d∇Ds 為差分及週期 s 之季節差分的運 算符號,故此種模型又被稱為相乘季節型之自我相關整合移動平均模型 (Multiplicative Models)。ARIMA 和 SARIMA 的預測表現在各 類的時間序列裡皆甚穩定且非常準確,往往很難擊敗(Granger and Engle, 1987)。詳細模型可以參考 Box-Jenkins (1970)。
四、
Holt-Winters
趨勢的季節性加法預測模型
此 模 型 是 簡 單 指 數 平 滑 法 的 一 般 化 版 本 ( Holt 1957; Winters 1961)。時間序列{F 是以下列形式存在:t} t t t tT
S
W
F
=
+
+
(5) 其中T 、t S 和t W 代表趨勢、季節和非規則因素。以t G 作為時間點 tt 的趨勢斜率。為了預測未來值,趨勢、季節因子和趨勢斜率必須應用 觀察值估計。設Tˆ 、t Sˆ 和t Gˆ 為t T 、t S 和t G 的估計值,在 Holt-Winterst 方法中,這些估計值是透過下列三個平滑方程式獲得: ), ˆ ˆ )( 1 ( ) ˆ ( ˆ 1 1 1 1 − − + − − + − = t t p t t t F S T G T λ λ (6) , ˆ ) 1 ( ) ˆ ˆ ( ˆ 1 2 1 2 − − + − − = t t t t T T G G λ λ (7) , ˆ ) 1 ( ) ˆ ( ˆ 3 1 3 t t p t F T S S =λ − + −λ − (8) 其中λ1、λ2和λ3是介於 0 與 1 之間的平滑參數。然後再把三個平滑 結果用一個預測公式結合起來,進行預測。其模型為: ) ( ˆ ˆ ˆ ˆ h j p n n n h t T hG S F+ = + + − + (9) (9) 式中 j(h) 是整數使得1≤ j(h)≤ p,p代表季節期的正整數。Holt-Winters 方法的預測表現在若干實証研究皆有討論(Makridakis et al., 1984),其預測表現在各類的時間序列裡皆甚穩定且合理地準確。詳 細模型可以參考 Holt (1957) 和 Winters (1961)。
五、部分整合自我迴歸移動平均模型(
ARFIMA
)
時間序列有一重要的特性就是記憶性(memory),此記憶性是 指時間序列中本期的觀察值會受前一期的觀察值影響所顯現出的特 性。Box and Jenkins (1970) 針對非定態序列提供一個解決模型,即整 合自我迴歸移動平均(ARIMA): t q t d p B B F θ B ε φ ( )(1− ) = ( ) (3’)
其d 是整合級數(integrated order)且限定為整數。Granger and Joyeux
(1980) 和 Hosking (1981) 分別獨立地提出部分整合自我迴歸移動平
均(Fractional Integrated Autoregressive Moving Average, ARFIMA (p, d,
q))模型,其中 d 可為任意實數,可用來解決具有高持續特性的時間
序列模型。當 d<0.5 時,(3’) 式為一恆定過程,且可化為無窮期移動
平均多項式。而若 d>−0.5,該式為一可逆過程,且可化為無窮期自
我迴歸多項式。因此當部分差分參數介於 0.5 及−0.5 之間時,該模型
為恆定且可逆,其中,若 0<d<0.5,則稱時間序列有緩長記憶;若 −0.5<d<0,則稱過程具有中等記憶(intermediate memory)(Chung and Baillie, 1993)。Hosking (1981) 解釋所謂長期記憶(long memory) 現象,即為伴隨時間的增加自我相關係數遞減的速度會比自我迴歸移 動平均模式來的緩慢,此即為 ARFIMA 模式之特性。而 ARFIMA 模 式現已被廣泛地用來分析存在長期記憶現象的時間序列資料。 其譜密度函數(spectral density)為 d i i i e e e f 2 2 2 2 1 ) ( ) ( 2 ) ( − − − − − = λ λ λ φ θ π σ λ (10) 方程式 (10)右側的第一項是 ARMA 模式的譜密度函數,第二項是長
期記憶的譜密度函數。估計 ARFIMA 的方法可以歸類為時域(time domain)和頻域(frequency domain);前者包括確切最大慨似估計 法(exact maximum likelihood)和準最大慨似估計法(quasi maximum likelihood),這類估計方法可以參考 Granger and Joyeux (1980)、Sowell (1992) 和 Beran (1994) 等 。在頻域下包括 Whittle 估計方法和半參 數估計方法(semi-parametric methods),這類方法可以參考 Fox and Taqqu (1986) 、 Dahlhaus (1989) 、 Giraitis and Surgailis (1990) 和 Robinson (1995) 等。應用最大概似法估計需要承受龐大的運算負擔, 而對一個對數概似函數的 whittle 近似值L 取最大化相對比較容易,w 其定義如下: ∑ +∑ + + = − − j j j j j n w g g I n n L ln ( ) ) ( ) ( ln 2 ) 2 ln( ) ln( 2 2 ω ω ω σ σ π (11) 其中I 為序列的週期圖(periodogram),n σ2g/(2π)(= f) 為 ARFIMA 的譜密度函數, j
∑
為非零博立葉頻率ωj =2πj/n∈(−π,π]的總和。詳 細模型可以參考 Chung and Baillie (1993) 和 Baillie (1996)。肆、資料來源與模型預測能力分析
本研究所採用的資料為依據交通部觀光局所公佈之「觀光月報」 中的「來台旅客居住地分析」統計表,並以此表所統計之居住地為美 國、加拿大及歐洲地區的來台旅客入境人數年、季和月資料進行分析。 資料範圍為 1971 年 1 月至 2008 年 12 月。其次,為了測試預測之準 確性,本研究針對美國、加拿大及歐洲皆僅以 1971 年 1 月至 2006 年 12 月來台旅客人數年、季和月資料進行此五種時間序列模型之模型 分析,並分別對美、加及歐洲就這五種不同的預測模型預測其於 2007 年 1 月至 2008 年 12 月之來台旅客預測值,共計 2 筆(8 筆季和 24 筆月資料)預測值,然後再與 3 個地區各自之樣本內的實際值比較,如 此方能進一步進行模型有效性之相關分析,以選取最適之預測模型。 經由模型預測出來的數值,與未來實際發生所得的數值不可能完 全一致,這其間必定有偏差存在,這些偏差稱之為預測誤差。而一般 衡量模型預測能力之優劣就是利用預測誤差的大小來判斷。將這些預 測值所產生之預測誤差加以比較,即可從中選取各來台市場之最適預 測模型。 由於旅遊需求預測的相關文獻中大多以平均絕對百分比誤 差 ( MAPE) 和 均 方 根 誤 差 ( RMSE ) 作 為 衡 量 預 測 能 力 的 指 標 (Makridakis et al., 1984),故在本研究中,將取 MAPE 和 RMSE 作 為判斷何種時間序列模型為最佳預測模型的衡量工具。其計算方程式 如下: MAPE 1 ˆ 100 1 × ∑ − = + + = K N N t t t t F F F K (12) RMSE = ∑+ − + = K N N t t t F F K 1 2 ) ˆ ( 1 (13) 其中,F 代表實際值,t Fˆ 代表預測值,K 代表預測的次數。由 MAPEt
和 RMSE 所表示的意義來看,若是 MAPE 和 RMSE 統計量之值越小, 表示利用該模型進行預測後所產生的預測誤差將越小。 根據上一節所敘述之 MAPE 和 RMSE 公式加以計算,可以得到 之前所分析之五個不同的預測模型在美國、加拿大和歐洲等三個地 區,其各自不同模型下的 MAPE 和 RMSE 統計量之值(表 1 至表 6)。 其中,預測表現最佳的模型所計算的 MAPE 和 RMSE 值以粗體字顯 示。 由表 1 和表 2 可以發現,在年預測上,從粗體字可以證實非季 節性自我相關整合移動平均模型(ARIMA)的預測表現最佳(年資 料沒有季節問題,因此這裡使用 ARIMA 而不用 SARIMA),亦即其 所產生之 MAPE 和 RMSE 最小,並且其 MAPE 值小於 10,表示此
模型產生高度準確(highly accurate)的預測(Lewis, 1982)。其實, 就美國、加拿大和歐洲而言,ARIMA 的 MAPE 值皆小於 2,顯示模 型預測出來的數值,與實際發生所得的數值偏差非常小。在歐洲旅客 的預測表現上,ARFIMA 和 Linear Trend 緊跟在 ARIMA 之後;而另 兩種預測模型 ARAR 和 Holt-Winters 的表現比較不出色。Linear Trend 和 Holt-Winters 在預測加拿大旅客人次的表現僅次於 ARIMA;另外 ARFIMA 預測所產生的 MAPE 值亦維持在 2 上下。至於美國,除了 ARIMA 表現亮麗外,ARFIMA 和 ARAR 的預測表現亦在可接受的範 圍以內。至於從 RMSE 指標觀察,除了歐洲的 2 年期預測輸給 ARFIMA 外,ARIMA 仍然保持最好的預測模型地位,這點可以從粗 體數字確認。 ܑ 1ā࡚ăΐለ߷гડЧሀݭ̝ MAPE ͧྵܑĞѐྤफ़ğ 國家∕模型 1 年期 2 年期 ለā߷ Linear Trend 1.82 2.82 Holt-Winters ARAR 3.615.53 5.47 3.29 ARIMA 0.96 1.77 ARFIMA 1.25 1.86 ΐो̂ Linear Trend 1.97 2.14 Holt-Winters ARAR 1.304.18 1.83 10.00 ARIMA ARFIMA 0.382.24 0.54 2.05 ࡚ā઼ Linear Trend 4.91 8.91 Holt-Winters 2.91 6.31 ARAR 3.66 4.94 ARIMA 1.06 1.41 ARFIMA 1.52 4.42
ܑ 2ā࡚ăΐለ߷гડЧሀݭ̝ RMSE ͧྵܑĞѐྤफ़ğ 國家∕模型 1 年期 2 年期 ለā߷ Linear Trend 3,387 5,923 Holt-Winters ARAR 10,3286,735 11,455 7,456 ARIMA 1,784 3,890 ARFIMA 2,332 3,886 ΐो̂ Linear Trend 1,131 1,268 Holt-Winters ARAR 2,393742 1,137 6,950 ARIMA ARFIMA 1,281219 332 1,205 ࡚ā઼ Linear Trend 19,557 38,027 Holt-Winters 11,563 28,005 ARAR 14,559 19,911 ARIMA 3,994 5,682 ARFIMA 6,051 20,503 從表 3 和表 4 明顯可以看出,在季旅遊人次的預測上,幾乎所有 的 MAPE 值仍然維持在 10 以下,即此五種模型仍然有能力產生高度 準確的預測。SARIMA 的表現已經不具領導地位,繼而興起的是 ARFIMA 預測模型。從粗體數字觀察之,ARFIMA 在預測歐洲的 2 和 4 季、美國的 6 和 8 季的來台旅客人次上表現最好;另外在預測加拿 大的 2、4、6 和 8 季的來台旅客人次上表現也超越其它四種預測模型。 ARAR 和 Holt-Winters 是表現僅次於 ARFIMA 的兩種預測模型。同樣 的結論亦可以從觀察 RMSE 指標而獲得。最後,月旅客人次的預測結 果顯示在表 5 和表 6。從 MAPE 指標觀察,ARFIMA 和 SARIMA 在 預測能力上平分秋色,ARAR 則緊追在後,接下來是 Holt-Winters 和 Linear Trend。RMSE 指標則顯示 ARFIMA 比 SARIMA 有更好的表現。
ܑ 3ā࡚ăΐለ߷гડЧሀݭ̝ MAPE ͧྵܑĞ؞ྤफ़ğ MAPE 值 國家∕模型 2 季 4 季 6 季 8 季 ለā߷ Linear Trend 5.85 8.54 9.07 10.90 Holt-Winters 3.14 2.70 3.86 4.51 ARAR 3.01 2.37 1.83 2.05 SARIMA ARFIMA 3.692.68 4.28 1.89 6.18 3.11 6.38 3.23 ΐो̂ Linear Trend 9.58 8.18 7.69 7.91 Holt-Winters 4.33 4.19 4.59 5.41 ARAR 6.77 6.66 8.07 9.08 SARIMA ARFIMA 4.612.97 3.64 2.49 4.28 3.21 4.58 3.47 ࡚ā઼ Linear Trend 4.55 6.11 6.54 9.54 Holt-Winters 3.84 3.53 3.51 5.97 ARAR 9.98 5.51 5.33 9.18 SARIMA 5.23 4.57 4.63 7.02 ARFIMA 4.65 4.07 3.29 5.28 ܑ 4ā࡚ăΐለ߷гડЧሀݭ̝ RMSE ͧྵܑĞ؞ྤफ़ğ RMSE 值 國家/模型 2 季 4 季 6 季 8 季 ለā߷ Linear Trend 13,192 4,839 4,453 6,446 Holt-Winters 1,747 1,550 2,231 2,534 ARAR 1,808 1,429 1,187 1,267 SARIMA ARFIMA 1,7431,429 2,425 1,132 3,587 2,196 3,561 2,105 ΐो̂ Linear Trend 1,428 1,342 1,268 1,388 Holt-Winters 599 609 686 845 ARAR 940 962 1,235 1,414 SARIMA ARFIMA 636532 551 435 653 599 708 625 ࡚ā઼ Linear Trend 4,785 6,444 7,521 11,039 Holt-Winters 3,739 3,603 3,562 7,143 ARAR 11,859 8,422 7,442 11,850 SARIMA 5,276 4,729 4,799 8,008 ARFIMA 4,913 4,269 3,633 6,275
ܑ 5ā࡚ăΐለ߷гડЧሀݭ̝ MAPE ͧྵܑĞ͡ྤफ़ğ MAPE 值 國家∕模型 6 個月 12 個月 18 個月 24 個月 ለā߷ Linear Trend 9.72 9.77 9.79 16.78 Holt-Winters 5.37 4.68 6.09 5.78 ARAR 5.58 4.40 4.63 4.38 SARIMA ARFIMA 3.623.03 4.36 3.81 5.11 4.38 5.16 4.49 ΐो̂ Linear Trend 13.32 13.41 13.07 12.99 Holt-Winters 13.40 10.38 10.49 10.09 ARAR 8.35 8.36 8.38 8.60 SARIMA ARFIMA 9.199.17 8.10 7.93 7.56 7.78 7.26 6.61 ࡚ā઼ Linear Trend 9.82 11.10 10.67 12.78 Holt-Winters 12.60 16.09 16.31 19.73 ARAR 6.88 5.88 7.72 9.17 SARIMA 7.74 5.52 5.41 6.26 ARFIMA 9.58 6.01 6.89 8.15 ܑ 6ā࡚ăΐለ߷гડЧሀݭ̝ RMSE ͧྵܑĞ͡ྤफ़ğ RMSE 值 國家∕模型 6 個月 12 個月 18 個月 24 個月 ለā߷ Linear Trend 2,527 3,130 3,214 3,492 Holt-Winters 1,283 1,107 1,458 1,342 ARAR 1,146 975 1,009 937 SARIMA ARFIMA 734621 905 809 1,056 912 1,043 926 ΐो̂ Linear Trend 668 761 693 814 Holt-Winters 630 527 547 544 ARAR 493 483 497 498 SARIMA ARFIMA 516525 497 489 473 464 447 409 ࡚ā઼ Linear Trend 3,550 4,018 3,987 4,762 Holt-Winters 5,001 6,096 6,142 7,250 ARAR 2,777 2,329 2,885 3,327 SARIMA 3,008 2,295 2,169 2,412 ARFIMA 3,618 2,666 2,958 3,254
從表 1 至表 6 可以看出,年旅客人次預測比季旅客人次預測準確, 而季旅客預測又比月旅客人次預測準確,這是因為一年裡的季(月) 預測誤差之間有相互抵消的效應(就如同產業預測比個別公司預測更 準確)。其次,表 1 至表 6 也呈現一種現象,即出現在第 2 年期(第 8 季和第 24 個月)的預測能力評估指標(MAPE 或 RMSE)皆稍微 偏高,這是因為 2008 年全球經歷了金融海嘯,某種程度上影響到美、 加和歐洲,對台灣旅遊需求,這項衝擊尤其在第 8 季和第 24 個月更 為明顯。另外,儘管 Linear Trend 在季和月旅客預測上不如其它四種 預測模型,但是在年旅客人次預測上,與其它四種模型的差異並不大。 概括地說,經過 MAPE 和 RMSE 的分析後,在這兩項預測能力指標 的架構下,在年預測上,以 ARIMA 的表現最好。至於季和月預測, 則以 ARFIMA 的表現最佳。
伍、單根檢定
SARS(嚴重急性呼吸系統綜合症)爆發於 2003 年 3 月初,如果 因為這一事件產生一個結構破壞(structural break),在假設整個期 間是一個常數參數結構下得到的預測結果將受到懷疑。因此本文最後 將作一項帶有結構破壞的單根檢定之時間序列分析。帶有結構破壞的 一項單根檢定的計量程序,牽涉到將樣本拆分成兩部份,然後應用 Dickey-Fuller 檢定於每一部分樣本(Dickey and Fuller, 1979)。這種 程序導致每一個迴歸結果自由度遞減的難題。因此寧可用整組樣本做 單獨一次檢定。然而,運用傳統的單根檢定如 ADF 或 Phillips and Perron 的 Z 檢定常產生檢定力較低的問題(Phillips and Perron, 1988)。而 且,當出現結構破壞時,Dickey-Fuller 和 Phillips-Perron 檢定偏向於 不拒絕單根。本文將應用 Perron (1989) 所提出的帶有結構破壞的單 根檢定。在此架構下,可以檢定單根過程中水平(level)的一次上升(下降)之虛無假設對著趨勢平穩過程中截距(intercept)的一次改 變之對立假設(對美國而言,其對立假設是趨勢平穩過程中截距和斜 率的一次改變)。其迴歸模型如下: 加拿大和歐洲: = + + + + +∑ + = − − k i i t i t t L P t a D D a t a f f f 1 1 1 2 2 1 0 α α β Δ ε (14) 美國: = + + + + + +∑ + = − − k i i t i t t T L P t a D D D a t a f f f 1 1 1 2 3 2 1 0 α α α β Δ ε (15) 其中,DP(2003)=1,否則為 0 DL =DT =0,若t <2003 且DL =1、 DT = 若t t≥2003 在方程式 (14) 和 (15) 裡,D 代表一個跳動虛擬變量(pulse dummyP
variable)D 代表一個水平虛擬變量(level dummy variable),L D 代T
表一個斜率虛擬變量(slope dummy variable)。 f 表示旅客人次的對t
數值,滯後期(k 值)是應用βk係數的 t 檢定來決定。SARS 事件爆 發以後,美國旅遊序列的斜率有所改變,因此,另外估計带斜率虛擬 變量的方程式 (15)。對 (14) 式而言,虛無假設是a0=0、a2=0、 1 1 = a 和α1=0,對立假設是a0≠0、a2≠0、a1<1和α1≠0。對 (15) 式而言,虛無假設是a0 =0、a2 =0、a1=1和α3=0,對立假設是 0 0 ≠ a 、a2 ≠0、a1<1、α1≠0和α3≠0。迴歸估計結果如表 7 和 8: ܑ 7āѣඕၹᗼ۞ಏॲᑭរඕڍ 國 家 λ T k a0 α1 α2 a2 a1 加拿大 0.87 38 2 3.39 -0.332 0.084 0.017 0.632 (3.82) (-4.26) (1.83) (2.82) (-6.22)*** 歐 洲 0.87 38 0 2.85 -0.304 0.003 0.012 0.733 (2.56) (-3.44) (0.53) (1.74) (-6.71)*** 說明:(1) 適當的 t 值表示在的括號內;***、** 和 * 分別是 1%、2.5% 和 5% 的顯著水準。 (2)λ 值代表發生結構破壞之前的樣本相對於總樣本之比率。 (3) 檢定 a1=1 的 Perron t 統計量臨界值是:λ=0.80 分別是 -4.33(1% 的顯著水準)、 -3.99(2.5% 的顯著水準)和 -3.75(5% 的顯著水準),λ=0.90 分別是 -4.27(1% 的顯著水準)、-3.97(2.5% 的顯著水準)和 -3.69(5% 的顯著水準),本文樣 本是 38,λ=0.87。
ܑ 8āѣඕၹᗼ۞ಏॲᑭរඕڍ 國 家 λ T k a0 α1 α2 α3 a2 a1 美 國 0.87 38 0 5.41 -0.469 2.02 -0.057 0.019 0.533 (3.53) (-4.27) (2.40) (-2.43) (3.44) (-4.00)** 說明:(1) 適當的 t 值表示在的括號內;***、** 和 * 分別是 1%、2.5% 和 5% 的顯著水準。 (2)λ值代表發生結構破壞之前的樣本相對於總樣本之比率。 (3) 檢定 a1=1 的 Perron t 統計量臨界值是:λ=0.80 分別是 -4.70(1% 的顯著水準)、 -4.31(2.5% 的顯著水準)和 -4.04(5% 的顯著水準),λ=0.90 分別是 -4.41(1% 的顯著水準)、-4.10(2.5% 的顯著水準)和 -3.80(5% 的顯著水準),本文樣 本是 38,λ=0.87。 表 7 和 8 的最後一欄明顯地顯示單根假設的支持度是不足的; 所有a 估計值皆與 1 顯著不同。對所有國家,我們可以在 5% 或較好1 的水平下拒絕單根。我們可以在 1% 的水平下拒絕加拿大和歐洲的旅 遊序列;也可以在 5% 的水平下拒絕美國的旅遊序列。表 7 顯示,加 拿大和歐洲的常數項(a )、破壞後常數虛擬變量(0 α1)和趨勢(a )2 的估計係數都顯著的。表 8 顯示,美國的常數項(a )、破壞後常0 數虛擬變量(α1)、破壞後斜率虛擬變量(α3)和趨勢(a )的估2 計係數都顯著的。綜合上述,從各項點估計值結果觀察,似乎比較傾 向不拒絕數列帶有結構破壞的趨勢平穩的對立假設。資料似乎支持 美、加和歐洲的旅遊序列是趨勢平穩的,儘管有 SARS 事件促使一次 的結構破壞。以上檢定結果也可以支持 2007~2008 年之間的資料結 構與特性與建立模型的資料之間是沒有顯著差異的。如此,本文前面 所作預測的結果是可靠的。
陸、討論與建議
本文以美國、加拿大和歐洲三個市場之入境旅客人次作為研究對 象,採用五種時間序列模型進行分析。首先,對三個來台市場建立不同的預測模型,並進行樣本內的預測。然後,以 MAPE 和 RMSE 統 計量來分析三個地區在不同模型下的預測誤差,藉此選擇美國、加拿 大 和 歐 洲 地 區 各 自 之 最 佳 預 測 模 型 。 為 了 預 測 工 作 達 到 可 靠 性 (reliability),本文使用年,季和月資料執行預測。在經過這些項目 的分析後,發現三個來台市場在年資料方面 ARIMA 模型的預測能力 最佳; 在季和月資料方面,則 ARFIMA 模型的預測能力最好。因此, 建議相關單位及旅遊業者從事旅遊預測時可以應用此兩種模式。 臺灣在 2003 年爆發 SARS 事件,使實證所用的資料可能產生結 構破壞,為了預測結果不受到懷疑,本文也做一項帶有結構破壞的單 根檢定之時間序列分析;檢定結果顯示不拒絕數列帶有結構破壞的趨 勢穩定的對立假設,也因此確認本文所作預測的結果是可靠的。另外, 本文研究結果也證實年預測比季預測和月預測更準確,因此建議間接 應用年預測去推算季和月預測,這個過程需要借用穩定可靠的旅遊相 關資訊,這個工作也是我們將來努力的方向。
參考文獻
中華民國交通部觀光局(1971~2008)。《台灣地區觀光統計月報》。 台北:交通部觀光局。 中華民國交通部觀光局(2001)。《交通部觀光局成立三十週年特刊》。 台北:交通部觀光局。 中華民國交通部觀光局(2001)。《觀光政策白皮書》。台北:交通 部觀光局。 中華民國交通部觀光局(2002)。《觀光客倍增計畫》。台北:交通 部觀光局。 中華民國行政院(2009)。《六大新興產業發展規劃—觀光拔尖領航 方案》。台北:交通部觀光局。 江麗文(1995)。《來華旅客需求計量經濟模式之研究》。台北:中 國文化大學觀光事業研究所碩士論文。 施瑞賢(2003)。《來華觀光旅客人數需求預測之研究》。台中:朝 陽科技大學休閒事業管理研究所碩士論文。 時巧煒(1994)。《來華觀光旅客需求預測模式建立之研究》。台北: 政治大學統計學研究所碩士論文。Athanasopoulos, G. & Hyndman, R., 2008. Modeling and forecasting Australia domestic tourism. Tourism Management, 29, 19-31.
Baillie, R. T., 1996. Long memory processes and fractional integration in econometrics, Journal of Econometrics, 73, 5-59.
Beran, J., 1994. On a class of M-estimators for Gaussian long-memory models. Biometrika, 81(4), 755-766.
Box, G. E. P., & Jenkins, G. M., 1970. Time series Analysis: forecasting
Chen, K. & Wang, C., 2007. Support vector regression with genetic algorithms in forecasting tourism demand. Tourism Management, 28, 515-526.
Chan, Y. M., 1993. Forecasting tourism: a sine wave time series regression approach. Journal of Travel Research, 32, 58-60.
Choy, D. L., 1984. Forecasting tourism revisited. Tourism Management, 5, 171-176.
Chu, F. L., 2009. Forecasting tourism demand with ARMA-based methods.
Tourism Management, 30, 740-751.
Chung, C. F. & Baillie, R. T., 1993. Small sample bias in conditional sum-of-squares estimators of fractionally integrated ARMA methods.
Empirical Economics, 18, 791-806.
Cochrane, D. & Orcutt, G. H., 1949. Application of least squares regressions to relationships containing autocorrelated error terms.
Journal of American Statistical Association, 44, 32-61.
Crouch, I. G., 1994. The study of international tourism demand: A survey of practice. Journal of Travel Research, 32, 41-55.
Crouch, G. I., Schultz, L., & Valerio, P., 1992. Marketing international tourism to Australia: A regression analysis. Tourism Management, 13, 196-208.
Dahlhaus, R., 1989. Efficient parameter estimation for self-similar processes. Annals of Statistics 17, 1749-66.
Dickey, D. & Fuller, W., 1979. Distribution of the estimates for autoregressive time series with a unit root. Journal of American
Statistical Association, 74, 427-431.
Durbin, J., 1960. Estimation of parameters in time series regression models. Journal of Royal Statistical Society, Series B, 22, 139-153.
Fox, R., & Taqqu, M. S., 1986. Large sample properties of parameter estimates for strongly dependent stationary Gaussian time series.
Annals of Statistics 14, 517-532.
Geurts, M. & Ibrahim I. B., 1975. Comparing the Box-Jenkins approach with the exponentially smoothed forecasting model: Application to Hawaii tourists. Journal of Marketing Research, 12, 182-188.
Gil-Alana, L. A., 2005. Modeling international monthly arrivals using seasonal univariate long-memory processes. Tourism Management, 26, 867-878.
Giraitis, L. & Surgailis, D., 1990. A central limit theorem for quadratic forms in strongly dependent linear variables and its application to asymptotical normality of Whittle's estimate. Probability Theory
Related Fields, 86(1), 87-104.
Granger, C. W. J., Joyeux, R., 1980. An introduction to long-memory time series models and fractional differencing. Journal of Time Series
Analysis, 1, 15-39.
Granger, C, W. J. & Engle, R. F., 1987. Econometric forecasting: A brief survey of current and future techniques. In K. Land & S. Schneider (eds.), Forecasting in the Social and Natural Sciences, pp. 117-140. Dordrecht: D. Reidel Publishing.
Hildreth, C. & Lu, J. Y., 1960. Demand relations with autocorrelated disturbances. Technical Bulletin 276, Michigan State University Agricultural Station.
Holt, C. C., 1957. Forecasting seasonals and trends by exponentially
weighted moving averages, Pittsburgh PA: Carnegie Institute of
Technology.
Kulendran, N. & King M. L., 1997. Forecasting international quarterly tourist flows using error-correction and time-series models. International
Journal of Forecasting, 13, 319-327.
Leob, P. D., 1982. International travel to the United States: An econometric evaluation. Annals of Tourism Research, 9, 7-20.
Lewis, C. D., 1982. Industrial and business forecasting methods. London: Butterworths.
Lim, C., & McAleer, M., 2002. Time series forecasts of international travel demand for Australia. Tourism Management, 23, 389-396. Magnus, J. R., 1978. Maximum likelihood estimation of the GLS model
with unknown parameters in the disturbance covariance matrix.
Journal of Econometrics, 7, 305-306.
Makridakis, S., Anderson, A., Carbone, R., Fildes, R., Hibon, M., Lewandowske, R., Newton, J., Parzen, E. (Eds.), 1984. The accuracy
of major forecasting procedure. New York: John Wiley.
Martin, C. A. & Witt, S. F., 1989. Forecasting tourism demand: A comparison of the accuracy of several quantitative methods.
International Journal of Forecasting, 5, 7-19.
Malenberg, B., & Van Soest, A., 1996. Parametric and semiparametric modeling of vacation expenditures. Journal of Applied econometrics, 11, 59-76.
Parzen, E., 1982. ARARMA models for time series analysis and forecasting. Journal of Forecasting, 1, 67-82.
Perron, P., 1989. The great crash, the oil price shock and the unit root hypothesis. Econometrica, 57, 1361-1401.
Phillips, P. & Perron, P., 1988. Testing for a unit root in time series regression. Biometrica, 75, 335-346.
Prais, S. J. & Winsten, C. B., 1954. Trend estimators and serial correlation.
Cowles commission Discussion Paper No. 383, Chicago.
Robinson, P. M., 1995. Gaussian semiparametric estimation of long range dependence. Ann. Statist., 23(5): 1630-1661.
Song, H. & Witt, S. F., 2006. Forecasting international tourist flows to Macau. Tourism Management, 27, 214-224.
Sowell, F., 1992. Maximum likelihood estimation of stationary univariate fractionally integrated time series models. Journal of Econometrics, 53, 165-188.
Uysal, M. & Crompton, J., 1985. An overview of approaches used to forecast tourism demand. Journal of Travel Research, 23, 7-15. Winters, P. R., 1960. Forecasting Sales by Exponentially Weighted
Moving Averages, Management Science, 6: 324-342.
Wong, K. F., Song, H., Witt, S. F. & Wu, D., 2007. Tourism forecasting: To combine or not to combine. Tourism Management, 28(4), 1068-1078. World Tourism Organization website: http://www.world-tourism.org World Travel & Tourism Council website: http://www.wttc.org
Forecasting Tourism Demand for Taiwan
from the US, Canada and Europe
Fong-Lin Chu & Yi-Chun Chen
Abstract
This paper examines five time-series forecasting models and fits them to the datasets of yearly, quarterly and monthly visitor arrivals in Taiwan from the United States, Canada and Europe. We then use the resulting estimated models to make ‘out-of-sample’ forecasts over the next 2 years (8 quarters and 24 months). We find that forecasts generated using the autoregressive integrated moving average and fractionally integrated autoregressive moving average models provide more accurate forecasts than those from other models when judged on the basis of mean absolute percentage errors and root mean square errors criteria. If there has been a structure break because of SARS outbreak in early march 2003, the result obtained by assuming a constant parameter structure during the entire period will be suspect. An analysis of the time series, including unit root tests with structural break is carried out as well.
Keywords: Tourism, forecast, unit roots test, mean absolute percentage errors.