第二章 文獻探討
2.6 時間序列分析
時間序列(Time Series)資料的分析概念,早在 1920 年代就由 Yule 提出[29] ,直到 1970 年始由 Box 與 Jenkins 兩位教授大力推廣並發展出自 我迴歸與移動平均的整合模式,(Autoregressive integrated moving average model, ARIMA)[18] 。時間序列(又稱時間數列)是一種以時間先後依序 收集而來的資料型態,因此在時間序列的資料中,解釋變數為時間(
t
),反應變數(
x
t)(或稱觀測值)則是隨時間而改變的變數,也就是研究中 的預測變數。與迴歸分析最大的不同在於,迴歸分析中的反應變數,可能 受到不同的解釋變數的影響,而時間序列則假設反應變數只受到時間改變 的影響,而不會受到其他解釋變數的影響。時間序列的概念是,根據過去的歷史資料,找出觀測值依時間而變化 的型態(Pattern),再對於未來時間點的觀測值進行預測(Forecasting),
相較於其他分析方法,時間序列分析的優點是只要有過去歷史資料,不須
再考慮其他變數即可進行預測;缺點是當觀測值並非單純的依循時間而變 化,仍有其他變數造成影響時,預測會變得較不準確。
2.6.1 時間序列之平穩性與獨立性檢定
具有時間序列的資料可視為一隨機過程,進行分析前必須先判斷資料
是否為平穩型(Stationary),且各期殘差之間為獨立,方能進行後續分析。1. 判斷時間序列是否平穩
在平穩型時間序列資料中,觀測值對於外在的衝擊僅具暫時性的影響,
受到短暫的波動干擾後又會返回其平均值,而非平穩型(Non-Stationary)
資料所受之外在衝擊對於時間序列會有累積的效果,使觀測值逐漸偏離平 均值,必須經由差分轉換變為平穩型時間序列,欲判斷時間序列是否為平 穩型態,可使用單根檢定(Unit-root Test),以下介紹目前常見單根檢定:
(1)D-F 檢定(Dickey-Fuller Test)
Dickey與Fuller [20]所提出的單根檢定法,稱之為D-F檢定,依照有無
檢定表[20],當檢定統計量的值大於臨界值,表示無法拒絕虛無假設,即 該模式存有單根現象,屬於不平穩模式。
(2)ADF 檢定(Augmented Dickey-Fuller Test)
Said 與 Dickey[28]延伸 Dickey-Fuller 之模型,將檢定之假設限制條件 放寬,發展另一套單根檢定,由於 Dickey-Fuller 檢定方法僅針對 AR(1)模 式,實際上反應變數可能呈現較高階的自我迴歸 AR(p),故 Said 與 Dickey 提出適用於高階自我迴歸 AR(p) 模式之 ADF 檢定,透過迴歸式中增加反 應變數落後項,消除殘差項的序列相關(serial correlation),使殘差恢復為 白噪音,而可以使用檢定統計量表,ADF 檢定之模型如下:
(3)P-P 檢定(Philips-Perron Test)
Phillips 與 Perron [27]為解決 D-F 檢定誤差可能存在序列相關,與變異 數異質性的問題,放寬了 D-F 檢定方法的基本假設(即變異數具有同質性)
而發展出 P-P 檢定法。
P-P 檢定之模型如下:
t 1
Y
t
Y a t t
再利用無母數(non-parametric)方法針對 D-F 值進行調整轉換以得到 P-P 值,而 P-P 統計量之臨界值與 D-F 統計量的臨界值相同。
2. 殘差獨立性檢定
分析時間序列資料前,必須先判斷資料是否具有順序上的相關性,
可由D-W檢定(Durbin Watson Test)檢查殘差項是否存有自我相關特性,
若各期殘差之間存在自我相關,則顯示時間序列中各期並非獨立,觀測值
時間數列依時間進行,而逐漸增加或減少的長期性變化趨勢,一般以 T 表示,如圖 2-14(a)所示
2. 季節變動(Seasonality variation)
季節變動係指一年中,呈現固定週期的規則變動。季節變動又稱作季 節性,若觀測值在每年的某些固定時段,呈現比其他時段來的大或小,極 有可能存在季節性。例如零售業常見的所謂大月、小月等名詞,就是代表 銷售量可能存在有季節性。一般以 S 表示,如圖 2-14(b)所示。
3. 循環變動(Cyclical variation)
沿著長期趨勢線,每隔一段時間作周而復始的上下變動。循環變動亦 為一週期性變動,其週期短則二至三年,長也有可能十至二十年,每次循 環所歷經的週期長短並不固定,且波動幅度亦不一致。一般以 C 表示,如 圖 2-14(c)所示。
4. 不規則變動(Irregular movement)
時間序列在去除趨勢、季節與循環等變動成份後,仍可能存在一些不 規則或偶然的變動,概念上類似線性模型中除去模型效應後,所剩餘的誤 差部分。因此,一般皆將不規則變動視為一種殘差項來處理。一般而言,
長期趨勢、季節變動及循環變動皆受到規則性因素的影響,只有不規則變 動是隨機的,因此也稱作隨機變動(Random variation),也由於不規則變 動的隨機性,使得它難以衡量及預測。一般以 I 表示,如圖 2-14(d)所示。
(a) 長期趨勢 (b) 季節變動
(c) 循環變動 (d) 不規則變動
2.6.3 時間序列之成份分析
成份分析的目的在於分離各種影響時間序列的因子,以便了解各成份 對於時間序列影響的程度,理論上分析的順序並無固定的先後次序,然而 為求方便起見,一般大多都按照長期趨勢、季節變動、循環變動的順序進 行分析。
1. 長期趨勢
長期趨勢是最容易判斷的影響成份,可使用的分析方法有:
(1)隨手畫法
又稱塗鴉法,以觀察的方式畫出一條可能的趨勢線 (2)移動平均法
以前 k 期的平均作為下一期的預測值,稱作 k 其移動平均法 (3)數學曲線適配法
利用數學函數適配資料,包括線性、多次拋物線、指數等函數 2. 季節變動
季節變動可經由簡單平均法或移動平均法(Moving average, MA)計算 出季節因子,在後續的分析中,便可運用季節因子對於預測進行季節性的 調整。
3. 循環變動
某些經濟方面的指標常具有循環變動的成份,然而當循環的週期長,
而資料蒐集所涵蓋的時間卻太短,就容易忽略循環變動。分析循環變動的 方法包括:自我迴歸模式(Autoregressive, AR)模型、移動平均模型、以 及結合前述兩者的 ARIMA 模型。
4. 不規則變動
時間序列中,長期趨勢、季節變動與循環變動皆屬於系統性的概念,
可用數學方式或模型解釋,然而不規則變動屬於非系統性的部份,造成不 規則變動的因素很多,且發生的時間可能很短,例如地震、海嘯或聖嬰現 象等,這些無法預期的因素會造成時間序列短暫的異常變化,且無法透過
數學方法去解釋或預測,但去除前述三項因子所剩餘的殘差,正常情況下 應呈現隨機性,因此不規則變動可用來檢驗模式的正確性。
2.6.4 時間序列成份之組合模型
將時間序列的成份依序分離,得出成份因子後,再將成份組合成最終 的預測模型,常見的模型有:
1. 加法模型
假設時間數列是由四種成分相加所形成的,在加法模型中,各成份彼 此相互獨立,無交互影響;若以
x
t 表示時間數列,則其數學方程式為:t t t t
t
T S C I
x
(2-4) 2. 乘法模型假設時間數列係基於四種成分相乘之結果,在乘法模型中,各成分之 間明顯地存在相互依存的關係,以數學方程式可表示為:
t t t t
t
T S C I
x
(2-5) 一般而言,在時間數列分析中,乘法模型的假設會比較符合實際情況,因為成份之間完全獨立的情況較為少見,各種成份之間多少都存有相互依 存的關係,故選擇使用乘法模型的相關研究較為普遍[16]。
2.6.5 時間序列分析之相關應用
時間數列分析的概念提出以來,各領域的相關應用不勝枚舉,其中最 普遍的應用在於經濟、金融等資料分析,由於本研究將運用時間序列分析 於地表日照量的預測,因此僅針對運用時間序列在氣候及太陽能領域的相 關研究進行文獻回顧。
Wilks[30]在研究溫室效應對於北美洲農作物生長的影響時,以降雨 量及溫度為觀測值,使用時間序列分析建立預測模型,建立自1850年以來 的氣溫資料,證實了地球暖化的現象。Gordon 與 R eddy[22]使用AR模型,
建立逐時的地表水平面日照量預測模型。Beyer等人[19]以移動平均法推估
佳模組尺寸。Markvart等人[26]延續了Beyer等人對於地表日照量進行時間 序列預測的研究,更進一步以氣候因素當作限制式,以線性規劃求得系統 模組尺寸的最佳解。Zaharim等人[31]認為進行太陽能發電系統相關研究前,
必須先分析地表日照量資料,因此使用了Box-Jenkins以及ARMR模型進行 地表日照量的預測,並進行模型評估。