• 沒有找到結果。

時間序列是指一組隨著時間而記錄下來的觀測值,對時間序列之研究,稱為 時間序列分析。時間序列的資料往往不能以迴歸分析的方法來建立模型加以分 析,因為迴歸分析主要強調不同變數之間的關係模式,想要建立的是因果模型;

而時間序列中之各觀測值間通常都存在相關性,時間相隔越短之兩觀測值,其相 關性越大,時間序列並不滿足所謂『各觀測值為獨立』的必要假設。

GPS 高程差資料型態為隨時間連續觀察所累積之數值資料,欲經由過去時間 的數值變化趨勢來預測未來數值可能的變化,藉由時間序列單變量以及多變量分 析來進行預測模式。多變量分析是將地層下陷監測井所得之地層縮量、雨量資料 及地下水位量三種變數數列納入考量,使用 ME、MSE、MAE、MAPE、MPE 四項指標來評估模式。

4-1 時間序列組成成分

為分析時間序列資料的模式或趨勢,通常須先了解時間序列資料的組合成份 (component)。通常將時間序列寫成 ,其中 t=0,1,2…為下標代表時間;並 以時間為橫軸,將各時間點的觀測值描繪出,如此或可大略瞭解該變數隨著時間 而變動的趨勢。一般視時間序列由長期趨勢(long-term trend)、季節變動(seasonal variation)、週期變動(cyclical fluctuation)及不規則變動(irregular fluctuation),四成 份所構成。

} {

y

t

(1)不規則變動(irregular fluctuation)

不規則變動(也稱 white noise)是在時間序列中將長期趨勢,季節變動以及 循環變動等成份隔離後,所剩下隨機狀況的部份。一般而言,長期趨勢,季節變 動以及循環變動皆受到規則性因素的影響,而只有不規則因素是屬於隨機性的,

其發生原因為﹕自然災害、人為的意外因素、天氣突然改變以及巨大變化等。

(2)季節性變動(seasonal variation)

季節變動是一種週期性變動,對 GPS 高程差而言週期為半年,每週期皆會 有循環性的變動產生,周而復始,呈現重複性之行為的序列,通常與自然的氣候 季節有關。

(3)長期趨勢(long-term trend)加週期變動(cyclical fluctuation)

時間序列依時間進行而逐漸增加或減少的長期變化之趨勢,在一較長的時間 內,呈現出遞減的趨向,相當穩定會隨時間呈現一個趨勢,在此趨勢為一線性 (linear)。

循環變動是一種圍繞趨勢線上下波動的情形如鐘擺般地循環變動,主要包含 四個階段:上升或擴張(expansion)、高峰(peak)、下降或衰退(recession)、谷底 (trough)。循環變動的週期大約二至十五年,其變動的原因甚多,而且週期的長 短與幅度亦不一致。

分析時間序列的初步工作,係將時間序列繪製歷史資料曲線圖(圖 4-1),根 據圖形觀察出單一時間序列的變動情況,亦可知多種時間序列變動的相互關係。

除了根據歷史資料圖可概略了解時間序列之變動情況外,尚可根據時間序列之四 種成份的不同結合方式,而提出了所謂的相加模型與相乘模型來進一步地分析時 間序列。茲將此二種模型簡略說明如下﹕

(1) 相加模型

假定時間序列係基於四種成份相加而成的。相加模型中,各成份彼此間互相 獨立,無交互影響﹔亦即長期趨勢並不影響季節變動。若以 Y 表示時間序列,

則其方程式為﹕

Y=T+S+C+R (4-1)

T:長期趨勢(long-term trend);

S:季節變動(seasonal variation);

C:週期變動(cyclical fluctuation);

R:不規則變動(irregular fluctuation)。

(2) 相乘模型

假定時間序列係基於四種成份相乘之結果。相乘模型中,各成份之間明顯地 存在相互依賴的關係,即假定季節變動與週期變動為長期趨勢的函數。如以方程 式來表示此模型,即為﹕

R S C T

Y = × × × (4-2)

平穩時間序列

未來值

未來值 未來值

線性趨勢之時間序列

線性趨勢與季節性之時間序列

時間序列數值

Time

圖 4-1 時間序列成分

4-2 時間序列預測模式

自我迴歸整合移動平均模式(AutoRegression Integrated Moving Average, ARIMA)乃為 Box&Jenkins(1976)所提出的,主要方法是對歷史資料分析,檢 視其自相關與偏自相關等特性,應用三階段模式建構過程,配適一個最佳的模 式,以進行資料分析與預測。自我迴歸整合移動平均模式(ARIMA)在各類型 的時間數列走勢當中,以穩定型的時間數列(stationary time series)較常見也較為 容易分析。一般對穩定型時間數列的定義為:若一時間數列 ,其 、

三者皆為不受時間 t 影響的常數,則稱 為一穩定型時 間數列。所謂 Box&Jenkins 預測方法,就是根據穩定型時間數列。

}

( )

ARIMA(1,0,0)=AR(1) ARIMA(0,0,1)=MA(1) ARIMA(1,1,1)=ARMA(1,1)

ARIMA 模式經由 p、d、q 三個引子來描述,藉由 p、d、q 的變化,可產生

其中

MA(q)亦可用後退運算子(B)表示之:

Y

t

= (1

−θ1

B

−θ2

B

2

...

−θ

qBq)e

t (4-19)

若將(1−θ1

B

−θ2

B

2

...

−θq

B

q

)以隱函數

θ

(B)表示,

(4-19)式可改寫為:

Y

t

=

θ

(B)e

t (4-20)

4.2.3 ARIMA(p,d,q)模式

單純的自我迴歸(AR)模式及單純的移動平均(MA)模式,二者所描述的時間 序列各具特色,但是真實世界中,研究者面臨時間序列往往無法僅用單純的 AR 或單純的 MA 模式加以描述,必須混合二者模式,才有較高的配適度。此種混合 模式稱為自我迴歸混合移動平均模式(ARMA,Auto Regression mixed Moving Average)。如同 AR 與 MA 模式,ARMA 之一般模式,係以 ARMA(p,q)表示。理 論上,p、q 二值可設定為任意非負整數,但實務上以 0、1、2 最為常見。

ARMA(p,q)模式是由 AR(p)混合 MA(q)而成,統計模式如下:

Y

t

=

φ1

Y

t1

+

φ2

Y

t2

p

Y

tp

+e

t−θ1

e

t1−θ2

e

t2

−θq

e

tq (4-21)

運用後退運算子(B)表示 ARMA(p,q),則上式可改寫如下:

(1

−φ1

B

−φ2

B

2

−φp

B

p

)Y

t

=(1

−θ1

B

−θ2

B

2

−θq

B

q

)e

t (4-22)

上式中,左式為 AR 之 B 多項式,右式為 MA 之 B 多項式。這兩個多項式 除參數不一樣外(φ與θ),其他型式完全一樣,參數之符號亦皆為負號。

ARIMA 模式與 ARMA 模式間最大不同,在於 ARIMA 將差分引入模式,以 處理非平穩序列。差分乃藉由差分運算子(∇, Differencing Operator)進行計算,原 理是將當期數值與前期數值相減。差分之階數(d)愈高,計算式將愈形複雜。

d=(∇∇…∇),即差分d階,d=1,2,…;

Yt−i=落差i期之數值。

差分運算對 ARIMA 模式非常重要,可以使非平穩序列轉為平穩序列,以適 用 ARMA 模式繼續分析。

因此,ARIMA 模式之建立,經常需要先將原始序列進行差分,使之成為平 穩序列。差分 d 階後再配上 ARMA(p,q)模式,即形成 ARIMA (p,d,q)模式。

綜上所述,ARIMA (p,d,q)模式可開列如下:

( ) [ ] ( )

t

4-2.4 ARIMA (p,d,q)×(P,D,Q)S 季節性自我迴歸整合移動平均模式 (Seasonal AutoRegression Integrated Moving Average, SARIMA)

季節性差分與連續性差分之目的均在消除趨勢。季節性差分乃對季節性跨距 s(Seasonal Span),差分 D 階,常見之跨距有 4、7、12、24,分別適用之資料 為季資料、日資料、月資料、小時資料,遇季節性資料,可將季節性差分與連續

基本上 SARIMA 模式的引子會與連續性模式引子產生相乘關係,此種關係 可以相乘性 ARIMA 模式加以說明。亦即:

( ) ( )

B Φ BS

[

dDsYt

]

( ) ( )

B Θ BS et

φ µ (4-24)

其中

Yt=第 t 期觀察值;

d=連續性差分階數;

D=季節性差分階數;

s=季節性跨距;

µ=差分後均值;

p=連續性自我迴歸階數;

q=連續性移動平均階數;

P=季節性自我迴歸階數;

Q=季節性移動平均階數;

φ12,…,φp=連續性自我迴歸參數;

θ12,…,θq=連續性移動平均參數;

Φ12,…, ΦP=季節性自我迴歸參數 Θ12,…,ΘQ=季節性移動平均參數;

et=第 t 期誤差項,假定遵循 NID( 0,σ2 ) 。

此一模式稱為季節性模式,指模式中,AR 部分由連續性之φ(B)及季節性之 Φ(BS)相乘而得;MA 部分則由 φ(B)及 Φ(BS)相乘而得。相乘性模式以 ARIMA (p,d,q)×(P,D,Q)S 模式表示之。其中,(p,d,q)乃連續性 ARIMA 之引子;(P,D,Q)S 為季節性 ARIMA 之引子(周文賢)。

4-3 時間序列分析之建立

建立時間序列模式之方法主要分為四個步驟:(1)模式辨認(Model Identification)(2)對未知參數作有效的估計(Efficient Estimation)(3)預測產 生(4)診斷性檢查(Model Checking)-若有必要回到(1)模式辨認階段重做

(圖 4-2)。

在模型辨認階段的首要工作即判定 ARIMA(p,d,q)的階數。一個資料數列 如果並非平穩型(nonstationary),則需整合(intergrated)利用差分方法使數列 成為平穩型(stationary)。可利用數列的自我相關函數(ACF)來判定數列是否 為平穩型。如數列為非平穩型,其 ACF 會維持許多期的正相關,且 ACF 的值通 常是很緩慢的遞減到 0。若模型僅為 AR 或是 MA 過程,則可利用樣本的 ACF 及樣本的偏自我相關 PACF(partial autocorrelation function)來作為判定 p 與 q 階數的工具,判別的標準如表 4-2。其中截斷的意義為樣本的 ACF 與 PACF 僅 僅只有少數幾階顯著,而通常是以兩倍的標準差做為判斷顯著的依據。

以上方法只適用於單純的 MA 或 AR,如果 p 與 q 的階數均不為 0,即混合 模型時,則無法適用。另外,ACF 與 PACF 僅適用於平穩型的時間數列。

表 4-1 七種 ARMA 模式的特徵

模式 理論上的 ACF 理論上的 PACF

白干擾 全為零 全為零

AR(1)

呈指數遞減或正負相間 遞減的形式

落差一期後消失

AR(2)

呈指數遞減或正負相間

遞減的形式

落差二期後消失

MA(1) 落差一期後消失

呈指數遞減或正負相間 遞減的形式

MA(2) 落差二期後消失

呈指數遞減或正負相間 遞減的形式

ARMA(1,1)

呈指數遞減或正負相間 遞減的形式

呈指數遞減或正負相間 遞減的形式

ARMA(p,q)

q-p 期後漸漸消失 p-q 期後漸漸消失

模式辨認

預測產生

合格 模式診斷

( p, d, q )

CLS, MLE 參數估計

ACF, PACF 趨勢圖

提報結果 時間序列

圖 4-2 預測流程圖(林靖等,2005)

4-4 預測評估分析

建構模型的最後一步就是要檢定估計出的模型是否符合兩項前提:(1)模型 是否符合我們的假設前提?(2)模型是否能解釋資料的趨勢?

第一項的答案就是要檢定當初在建立 ARIMA 模型時所建立的最基本假設,

也就是誤差項 數列必須符合常態且互相獨立的假設,也就是假設為”白噪音”

(white noise)數列。若檢定的結果為否,則表示此模型不適合且必須加以修正;

若檢定的結果為是,則表示此模型的殘差數列應為互相獨立的常態分布。檢定的 ME、MSE、MAE、MAPE、MPE 四項為主:

(1) 平均誤差(Mean Error, ME)

(3) 平均絕對誤差(Mean Absolute Error, MAE)

n

(4) 平均絕對百分比誤差率(Mean Absolute Percentage Error, MAPE)

n

MAPE 主要在衡量模式中未被解釋部份之百分比,MAPE 之值越小,表示模 式正確預測能力越強,預測模式估計結果與歷史資料吻合精確度越大。Lewis

(1982)依據 MAPE 值之大小,將模式預測能力分為四種等級,如表 4-3 所示,

當 MAPE 小於 10%時,表示模型之預測能力優良。

表 4-2 MAPE 預測能力之等級

MAPE 值 預測能力

<10% 高精確度

10%~20% 良好

20%~50% 合理

>50% 不正確

(5) 百分比誤差(Mean Percentage Error, MPE)

( )

% 100 ˆ

1 ×

=

=

n Y

Y Y MPE

n

t t

t t

(4-29 ) 其中

Y =實際值;

t t=預測值;n=觀察數目。

相關文件