第三章 研究設計
第三節 資料分析方法
為觀察境外移入登革熱病例數的趨勢,並建立預測模型,且進一步與東南亞旅遊人 數進行探討,採取時間數列分析法。
一、 模型鑑定
模型之建立首先需將收集到的資料(觀測值Zt),依據時間的順序畫成圖形,觀察 圖形變化情形,先觀察其波動情形,如果波動太大則需要做資料的轉換。
時間數列分析的基本假設是平穩型的時間數列,所謂平穩型的時間數列,表示該數 列不會隨著時間的變化而改變其統計特性。若此數列對固定均值上下隨機波動是非平穩 型數列,必須給予適當的差分(difference),轉化為平穩型時間數列,假設經過第d次 的差分後得到平穩型數列,通常d > 0。
計算自我相關函數(Autocorrelation Function, ACF)與偏自我相關函數(Partial Autocorrelation Function, PACF),以求得初步的ARIMA模型的階數(p,q)。ACF為變數間 的相關程度,MA(q)模型中,ACF截斷的期數即為q值,當ACF圖形沒有很快消失(切 斷)時,顯示該數列不是平穩型數列,必須對數列取差分,直到圖形呈現很快消失(切 斷)。平穩型數列平均值E(Zt) = μ,變異數為 ,Zt與Zt+k(相隔k個時期)
之自我互變異數,以γk表示,
γk = Cov(Zt, Zt+k) = {( ( )}
Zt與Zt+k相隔k個時期之自我相關係數,以 表示,
註:平穩型數列 , ,若將 當作時間位差k知函數
38
則稱之ACF;因理論 與 均未知,所以要收集時間數列來估計其值,則 之估計為
,K=1,2,3…,其中 , 為此數列之平均值,且
在AR(p)模型中,PACF為切斷的期數即為p值,Zt與Zt+k相隔k個時期之偏自我 相關係數(PACF),以ψkk當作時間位差k之函數,則稱為偏自我相關係數。{ψkk K=1,2,3…}
為不同時間位差之偏自我相關系數之集合。
延伸的自我相關函數(Extended Autocorrelation Function, EACF)圖形診斷,含「0」
之三角形區域之頂點位置落在(p,q)點以進行初步判斷,如有季節因素存在,則考慮使用 季節性ARIMA模型(seasonal ARIMA model)進行分析。
取得ARIMA(p,d,q)中的值,可初步判斷數列屬於何種模型。基本模型之形式為
,是經過AR(p)、MA(q)差分結合而成ARMA模型,再經過d
次差分可得ARIMA模型。
二、 模型估計與檢定
當一般數列被鑑定為某種型態之模型後,利用統計算出期未知參數的估計值,並且 利用檢定方法檢定所得模型與數據的配合是否適當,是否可準確的代表所觀察的現象及 模型合乎精簡原則,若模型不適當就必須重新鑑定、估計參數及檢定步驟。
模型篩選依據為:(1)殘差數列必須符合白噪音(white noise)之假設(以Ljung-Box test進行白噪音檢定);(2)R-squared愈高愈好;(3)RMSE以及SC愈小愈好
模型偵測的主要工具是殘差(residuals),依前述所建立的模型須再進行白噪音檢 定,白噪音過程是一種最簡單的平穩型時間數列,在沒有隨機變數at,須符合(1)固定
39
平均值,即E(at)=μa,對所有t;通常假設其值為0;(2)變異數為固定常數,即
,對所有t;(3)自我共變異數亦等於0,即 ,對所有
k≠0(林茂文,2006)。本研究採用Ljung-Box檢定法,其方程式為
其中T為樣本數,k為滯後期數,m為最大落後期數。其虛無假設為殘差數列等於 白噪音,如果拒絕該虛無假設,則表示該數列不穩定,反之,若接受虛無假設,則表示 該數列為平穩型數列。
模型選取準則採用RMSE及SC (Schwarz Criterion, 1978)準則,表示為:
針對同一時間數列,帶入不同的模型及參數估計值,以RMSE值或SC值最小的作 為最適模型。
模型適配性之檢定方法可利用殘差的時間數列圖,殘差項數列必須符合常態(隨機 性質)且互相獨立的假設,也就是假設為白噪音(white noise)數列。若檢定的結果不 是白噪音,則表示此模型不適合且必須加以修正;若檢定的結果是白噪音,則表示此模 型的殘差數列,應為互相獨立的常態分布,支持所選取之模型適合。
三、 預測
預測效度指標將採用平均平方預測誤(mean square prediction error, MSPE),將誤差取 平方值加總的平均值,越小越好。
四、 VAR模型
40
向量自我迴歸,在於以動態的觀念,把所有可能的經濟變數均納入模型中,再經由 參數估計來推論變數間彼此的關係。
在VAR模型設定中,如果所選取的落後期數過長,其所得的估計結果會缺乏效率,
反之,選取的落後期數過短,其所得的估計結果易產生偏差,故本研究之VAR之落後期 數選取方式採用AIC(Akaike’s information criterion, 1974)準則及SC(Schwarz Criterion,
1978)準則,選擇標準以AIC與SC值越小越好,表示為:
五、 Granger因果分析
Granger對於因果關係的定義,主要是以變數間預測能力的強弱來決定,當某個變
數為解釋變數時的解釋能力最佳,則該變數即為因,被解釋變數為果。
假設要研究X與Y之間的因果關係,可建立下列迴歸模式:
欲檢定Y對X有Granger因果關係,其虛無假設與對立假設為:
H0: βj = 0, j=1,2,…,q H1: βj≠0, j=1,2,…,q
若拒絕虛無假設,則表示Y過去的訊息對於X有顯著得解釋能力,同理,檢定γk=0,
41
若X過去的訊息對於Y有顯著得解釋能力,如果兩項檢定均顯著,表示X與Y存在回 饋(feedback)效果。
上述研究方法之繪圖與統計部分,使用套裝軟體R 2.9.1、SPSS 17.0來執行。R軟 體為開放原始碼的統計分析軟體,是由Ross Ihaka與Robert Fentlman從S-plus(為一商 用統計軟體)所研發出來的R系統,主要功能為統計分析與繪圖,但其統計分析不同於 SPSS操作模型,必須使用程式語言。