資料分析方法

第三章研究設計

第三節資料分析方法

為觀察境外移入登革熱病例數的趨勢，並建立預測模型，且進一步與東南亞旅遊人數進行探討，採取時間數列分析法。

一、模型鑑定

模型之建立首先需將收集到的資料（觀測值Zt），依據時間的順序畫成圖形，觀察圖形變化情形，先觀察其波動情形，如果波動太大則需要做資料的轉換。

時間數列分析的基本假設是平穩型的時間數列，所謂平穩型的時間數列，表示該數列不會隨著時間的變化而改變其統計特性。若此數列對固定均值上下隨機波動是非平穩型數列，必須給予適當的差分（difference），轉化為平穩型時間數列，假設經過第d次的差分後得到平穩型數列，通常d > 0。

計算自我相關函數（Autocorrelation Function, ACF）與偏自我相關函數（Partial Autocorrelation Function, PACF），以求得初步的ARIMA模型的階數(p,q)。ACF為變數間的相關程度，MA(q)模型中，ACF截斷的期數即為q值，當ACF圖形沒有很快消失（切斷）時，顯示該數列不是平穩型數列，必須對數列取差分，直到圖形呈現很快消失（切斷）。平穩型數列平均值E(Zt) = μ，變異數為，Zt與Zt+k（相隔k個時期）

之自我互變異數，以γk表示，

γk = Cov(Zt, Zt+k) = {( ( )}

Zt與Zt+k相隔k個時期之自我相關係數，以表示，

註：平穩型數列，，若將當作時間位差k知函數

則稱之ACF；因理論與均未知，所以要收集時間數列來估計其值，則之估計為

，K=1,2,3…，其中，為此數列之平均值，且

在AR(p)模型中，PACF為切斷的期數即為p值，Zt與Zt+k相隔k個時期之偏自我相關係數（PACF），以ψkk當作時間位差k之函數，則稱為偏自我相關係數。{ψkk K=1,2,3…}

為不同時間位差之偏自我相關系數之集合。

延伸的自我相關函數（Extended Autocorrelation Function, EACF）圖形診斷，含「0」

之三角形區域之頂點位置落在(p,q)點以進行初步判斷，如有季節因素存在，則考慮使用季節性ARIMA模型（seasonal ARIMA model）進行分析。

取得ARIMA(p,d,q)中的值，可初步判斷數列屬於何種模型。基本模型之形式為

，是經過AR(p)、MA(q)差分結合而成ARMA模型，再經過d

次差分可得ARIMA模型。

二、模型估計與檢定

當一般數列被鑑定為某種型態之模型後，利用統計算出期未知參數的估計值，並且利用檢定方法檢定所得模型與數據的配合是否適當，是否可準確的代表所觀察的現象及模型合乎精簡原則，若模型不適當就必須重新鑑定、估計參數及檢定步驟。

模型篩選依據為：(1)殘差數列必須符合白噪音（white noise）之假設（以Ljung-Box test進行白噪音檢定）；(2)R-squared愈高愈好；(3)RMSE以及SC愈小愈好

模型偵測的主要工具是殘差（residuals），依前述所建立的模型須再進行白噪音檢定，白噪音過程是一種最簡單的平穩型時間數列，在沒有隨機變數at，須符合（1）固定

平均值，即E(at)=μa，對所有t；通常假設其值為0；（2）變異數為固定常數，即

，對所有t；（3）自我共變異數亦等於0，即，對所有

k≠0（林茂文，2006）。本研究採用Ljung-Box檢定法，其方程式為

其中T為樣本數，k為滯後期數，m為最大落後期數。其虛無假設為殘差數列等於白噪音，如果拒絕該虛無假設，則表示該數列不穩定，反之，若接受虛無假設，則表示該數列為平穩型數列。

模型選取準則採用RMSE及SC (Schwarz Criterion, 1978)準則，表示為：

針對同一時間數列，帶入不同的模型及參數估計值，以RMSE值或SC值最小的作為最適模型。

模型適配性之檢定方法可利用殘差的時間數列圖，殘差項數列必須符合常態（隨機性質）且互相獨立的假設，也就是假設為白噪音（white noise）數列。若檢定的結果不是白噪音，則表示此模型不適合且必須加以修正；若檢定的結果是白噪音，則表示此模型的殘差數列，應為互相獨立的常態分布，支持所選取之模型適合。

三、預測

預測效度指標將採用平均平方預測誤(mean square prediction error, MSPE)，將誤差取平方值加總的平均值，越小越好。

四、 VAR模型

向量自我迴歸，在於以動態的觀念，把所有可能的經濟變數均納入模型中，再經由參數估計來推論變數間彼此的關係。

在VAR模型設定中，如果所選取的落後期數過長，其所得的估計結果會缺乏效率，

反之，選取的落後期數過短，其所得的估計結果易產生偏差，故本研究之VAR之落後期數選取方式採用AIC（Akaike’s information criterion, 1974）準則及SC（Schwarz Criterion,

1978）準則，選擇標準以AIC與SC值越小越好，表示為：

五、 Granger因果分析

Granger對於因果關係的定義，主要是以變數間預測能力的強弱來決定，當某個變

數為解釋變數時的解釋能力最佳，則該變數即為因，被解釋變數為果。

假設要研究X與Y之間的因果關係，可建立下列迴歸模式：

欲檢定Y對X有Granger因果關係，其虛無假設與對立假設為：

H0: βj = 0, j=1,2,…,q H1: βj≠0, j=1,2,…,q

若拒絕虛無假設，則表示Y過去的訊息對於X有顯著得解釋能力，同理，檢定γk=0，

若X過去的訊息對於Y有顯著得解釋能力，如果兩項檢定均顯著，表示X與Y存在回饋（feedback）效果。

上述研究方法之繪圖與統計部分，使用套裝軟體R 2.9.1、SPSS 17.0來執行。R軟體為開放原始碼的統計分析軟體，是由Ross Ihaka與Robert Fentlman從S-plus（為一商用統計軟體）所研發出來的R系統，主要功能為統計分析與繪圖，但其統計分析不同於 SPSS操作模型，必須使用程式語言。

在文檔中 PDF 國立台北護理學院旅遊健康研究所 National Taipei College of Nursing (頁 44-48)

第三章 研究設計

第三節 資料分析方法

第三章研究設計

第三節資料分析方法