第三章 研究設計
第四節 實證研究方法
一、相關分析
相 關 分 析 是 衡 量 兩 變 數 間 的 線 性 關 係 。 以 皮 爾 森 相 關 係 (Person's Correlation Coefficient )ρ -求 兩 變 數 的 相 關 程 度。皮爾森相關係數ρ的定義如下:
y x
xy
σ σ ρ = σ
其中 -1<ρ<1,正負符號表示表示相關的方向(斜率),正相 關表示線性的斜率為正,負相關表示線性相關的斜率為負。
二、常態分配檢定
時間數列是否為常態分配檢定,利用 Jarque and Bera 統計 檢定,其計算式如下:
JB= ⎥
⎦
⎢ ⎤
⎣
⎡ −
+ 24
) 3 ( 6
2
2 K
n S ~Xα2(2)
非常態分配 H
常態分配 H
: :
1 0
其中,N:觀察值數量 K:峰態
S:偏態
當 JB>Xα2(2)時,則拒絕虛無假設,序列為非常態分配。
三、單根檢定
在 時 間 序 列 裡 , 大 多 的 變 數 為 非 定 態 數 列 。 Granger and Newbold(1974)指 出 如 果 迴 歸 式 的 自 變 數 為 非 定 態 , 直 接 進 行 迴 歸分析,將產生假性迴歸關係,使得估計結果不具意義。因此在 採用時間序列的資料作分析前,必須保證資料為定態序列。單根 檢定主要的目的在於確定變數的時間序列的整合級次,用以判定 時間序列的定態性質。
3.1 ADF[Augmented Dickey-Fuller]單根檢定
在 DF 檢定法之中假設εt為白噪音,然後迴歸殘差項常會有 顯 著 的 自 我 相 關 現 象 , 即 具 有 豐 富 的 時 間 相 依 異 質 性 , 使 得 DF 檢定的範圍受到限制,其檢定能力也受到質疑。Dickey 與 Fuller
【40】將 DF 檢定法的三個檢定模型重置加入應變數(Yt)之落後 期 , 即 考 慮 變 數 (ΔYt)的 自 我 相 關 的 問 題 來 對 時 間 序 列 資 料 (Yt) 進行單根檢定。其模型為:
∑
= −− + Δ +
=
Δ k
i
t t i t
t Y Y
Y
1
1
1 ρ ε
β
∑
= −− + Δ +
+
=
Δ k
i
t t i t
t Y Y
Y
1
1
1 ρ ε
β α
∑
= −− + Δ +
+ +
=
Δ k
i
t t i t
t T Y Y
Y
1
1
1 ρ ε
β γ α
k 為最適落後期,使誤差項εt趨於白噪音。
假設檢定為:
0
0:β =
H [存在單根,為非定態]
0
1:β ≠
H [不存在單根,為定態]
若檢定結果顯示,變數的時間序列非定態,則可對等號兩邊 取其差分,以差分形態再做一次單根檢定。
3.2 PP[Phillips-Perron]單根檢定法
在 ADF 檢定法中,雖然已將殘差具有序列相關的問題考慮進 去,但是能仍有可能存在異質性的問題,因此 Phillips 與 Perron
【57】提出以函數化中央極限定理之非參數法來修正殘差項可能 產生序列相關及異質性的問題。利用迴歸 AR(1)模型所得到的殘 差值來修正 Dickey-Fuller 檢定法之 t 統計量,並將模式擴充至 包含漂浮項及趨勢項的模型,這和 Dickey-Fuller(1979)所得到 的極限分配相同。Pillip 依據 Dickey-Fuller 所設定的模型如 下:
模型 1: yt =μ* +γ*yt−1 +εt*
模型 2: yt μ β
(
t T)
γ~yt ε~t2
~ ~
1 + +
− +
= −
* 0 :γ
H [有單根]
ˆ 1
1:γ =
H [無單根]
其檢定統計量分別為:
(
1 1)
2 1/22 2 2
1 1
* 1
*) ( / ) (1/2 )( )[ ]
(t = S S t − S S −S T−
∑
y− −y− −Z a u T a T T u t
) )(
3 4 / ( ) / ( )
(t~a Su ST1 t~a T3 D1y/2ST1 ST21 Su
Z = − −
其中:ta*、ta~為一般的 t 統計量,T 為樣本的個數。
Dy =det(yTy)為解釋變數的行列式值。
Su2為δ2的一般估計式,
∑
=
−
∞
= → T
t t
T T E u
1 2 1
2 lim ( )
δ 。
ST21為δ2的一般估計式,δ2 =limT→∞T−1E(ST2),
∑
=
= T
t t
T u
S
1
。
落後期數之選取:
單根檢定需要決定一個最適的落後期,以修正殘差項的自我 相關問題,使殘差項為白噪音形式。由於加入太多落後期數,將 使得拒絕虛無假設之檢定能力下降;但若加入太少落後期數,模 式將無法完全修正由移動平均項所造成臨界值放大的缺點;究竟 要加入多少落後期數,則可用 AIC 準則來判斷,選擇 AIC 最小者 為最適落後期。
在作時間序列定態檢定與用 VAR 模型分析時,此時時間數列 落後期數的選擇就佔有重要的地位,不同的落後期數會影響最後 的分析結果。因此落後期數的選定就相當的重要,AIC 值是模型 最適變數的重要參考值,判斷方法乃是選取各個模型中 AIC 值最 小的。
AIC(Akaike Information Criterion)準則。Akaike【28】
(1969)提出 AIC 準則,選取的方法為 AIC 愈小之 P 愈佳。其 定義為:
N k
AIC Ni 2
ˆ ) log(
2
+
=
∑
ε其中N為樣本數。
εˆi為殘差項的估計值。
k為參數的個數。
四、ARIMA模型:
Box&Jenkins【32】(1976)提出一套時間序列分析方法,稱 為 自 我 迴 歸 整 合 移 動 平 均 模 型 (Autoregressive Integrated Moving Average Model;ARIMA)。自我迴歸-AR(p)模式,主要是 指 變 數 ( Xt)除 了 受 誤 差 項 影 響 外 , 還 受 變 數 前 期 ( Xt−1、 Xt−2、
−3
Xt 、…)所影響。移動平均-MA(q)模式是指變數(Xt)受變數前期 的誤差項(εt−1、εt−2、εt−3、…)所影響。若變數(Xt)受變數前期以 及 誤 差 項 前 期 影 響 的 話 , 則 模 式 為 ARMA(p,q)模 式 。 在 配 適 時 間 序 列 模 型 時 , 一 般 的 作 法 是 當 序 列 不 平 穩 或 有 趨 勢 (trend)時 , 先 對 其 取 差 分 直 到 序 列 平 穩 , 接 著 才 以 ARMA(p,q)模 型 來 配 適 序 列,則可稱此模型為ARIMA(p,d,q),d為所需差分次數。AR(p)、
MA(q)、ARMA(p,q)模型可表式如下:
AR(p)模型:
t p t p t
t
t X X X
X =α0 +α1 −1 +α2 −2 +...+α − +ε MA(q)模型:
q t q t
t t
t
Xt =μ +ε −β1ε −1 −β2ε −2 −β3ε −3 −...−β ε − ARMA(p,q)模型:
q t q t
t t
p t p t
t
t X X X
X =α0 +α1 −1 +α2 −2 +...+α − +ε −β1ε −1 −β2ε −2 −...−β ε −
根據Box-Jenkins方法論,建構ARIMA模型流程圖如下:
1、模型認定(Identification of the model)
第 一 個 步 驟 先 判 定 資 訊 為 何 種 模 式 , 也 就 是 決 定 p、 d、 q分 別是多少。首先先確定差分的階次d,當序列資料呈現不平穩時,
則對資料進行差分直到序列呈現穩定為止。而決定最適ARMA(p,q) 模 型 是 利 用 自 我 相 關 函 數 (ACF)圖 與 偏 自 我 相 關 函 數 (PACF)圖 , 來判斷模式中AR(p)與MA(q)的階次。
2、參數估計(Parameter estimation of chosen model)
在 決 定 p、 d、 q的 序 次 後 , 接 下 來 就 是 估 計 參 數 值 , 由 於 時 間序列的模式並非為線性,因此不能利用一般的最小平方法來估 計模式中的參數,必須使用非線性估計法反覆的求解過程來估計 模式中的參數。
3、診斷檢定(Diagnostic checking) 模型認定
參數估計
診斷檢定
預測
是
否
在估計時間序列模型的參數後,接下來是診斷這種設定是否 適合,檢查殘差項(εt)是否仍有序列相關的問題,也就是檢定是 否 符 合 白 噪 音 , 假 如 符 合 白 噪 音 則 判 定 此 時 的 模 式 為 適 當 的 模 式 。 估 計 ARCH與 GARCH模 型 前 , 必 須 確 定 殘 差 項 是 否 具 有 序 列 相 關 , 本 文 藉 由 Ljung-Box Q統 計 量 檢 定 有 無 自 我 相 關 。 此 外 , 在 對模型做估計前,必須先檢定時間序列資料是否具有ARCH效果,
再進行模型估計,藉由ARCH LM檢定來判斷是否存在ARCH效果。
模型檢定:
Ljung-Box Q檢定:
Ljung-Box的純白噪音檢定(pure white noise test),簡稱 Q統 計 量 , 是 用 來 檢 定 時 間 序 列 資 料 是 否 具 有 序 列 相 關 及 異 質 變 異數的情形,模型如下:
∑
=+
= k
k
T k
T Q
2
ˆ2
) 2
( γ
H0:殘差項平方(εt2)無自我相關
H1:殘差項平方(εt2)有自我相關 其中:T為觀察值個數
γˆk2為εˆk樣本自我相關係數
當拒絕虛無假設,表示此時間序列資料有序列相關。
LM test (Lagrange multiplier):
Lagrange Multiplier(LM) 檢 定 是 由 Engle【 41】 (1984)所 提出,利用所求得之殘差平方項之迴歸方程式作檢定,迴歸式如
下:
t p t p t
t
t α α ε α ε α ε ν
ε2 = 0 + 1 2−1+ 2 2−2 +...+ 2− + 0
...
: 1 2
0 = = = p =
H α α α [無ARCH效果]
H1:α1至αp不全為零 [有ARCH效果]
根據上述的樣本數與判定係數R2,求出TR2的值,而TR2近似於 卡方分配,所以當TR2 >x2(p)時,則拒絕需無假設,可證明時間序 列模型之殘差項變異數不齊一,具有異質性。
4.預測(Forecasting)
在完成適當模式後,即可利用模式進行預測分析。
五、ARCH、GARCH、TGARCH、EGARCH 模型
過 去 傳 統 的 計 量 模 型 與 時 間 序 列 模 型 都 是 假 設 殘 差 變 異 數 固定,也就是誤差項不會隨著時間的改變而改變,但事實上許多 金 融 性 的 資 產 之 時 間 序 列 大 多 存 在 波 動 叢 聚 ( volatility clustering)的現象,例如股價大幅波動後往往下一期會伴隨大 幅度的波動,而股價小幅度波動後亦會伴隨著小幅度的波動,代 表時間序列的變異數會隨著時間而改變。對於變異數異質性的現 象 , Engle(1982) 提 出 了 自 我 迴 歸 條 件 異 質 變 異 數 模 型 (Autoregressive Conditional Heteroscedasticity Model ,ARCH 模型),模型中時間序列資料之條件變異數具有隨時 間改變的現象。而 Bollerslev(1986)將 ARCH 模型加以擴充,將 過去的殘差項及過去的變異數納入條件變異數方程式中,成為一 般 化 自 我 迴 歸 模 型 條 件 異 質 變 異 數 模 型 (Generalized
Autoregressive Conditional Heteroscedasticity Model,GARCH)。
一 般 GARCH 模 型 皆 假 定 新 訊 息 所 造 成 的 波 動 反 應 是 對 稱 的 , 即 表 示 不 論 訊 息 的 好 壞 , 對 於 市 場 的 好 壞 都 具 有 相 同 的 影 響。而傳統之 ARCH(p)模型或 GARCH(p,q)並不能掌握波動性的不 對稱性效果,為反應出前期正、負報酬訊息對本期股價報酬變異 數 可 能 產 生 的 不 對 稱 性 影 響 , 因 此 許 多 學 者 開 始 發 展 不 對 稱 GARCH 模型來捕捉這些現象。接下來將分別對 ARCH、GARCH、TGACH 不對稱性模型分別做介紹:
5.1、對稱型條件異質變異數模型 (一)ARCH 模型
Engle【42】(1982)所提出ARCH(Autoregressive Conditional Heteroskedasticity)模 型 , 其 考 慮 到 條 件 變 異 數 隨 時 間 經 過 而 變動的特性,將ht設為Yt的條件變異數,使受到前q期誤差項平方 之影響,因而能適切地描寫出市場報酬率波動的狀態,並可以成 功 的 掌 握 到 時 間 序 列 的 趨 勢 , 進 而 提 昇 估 計 效 率 , 其 ARCH(q)模 型架構為:
t t
t X b
Y = +ε ) , 0 (
1 ~ t
t
t Ω− N h
ε
∑
= −+
= p
i
i t i
t C
h
1 2
0 α ε
其中:εt為模型之殘差項
−1
Ωt 表示t−1期為止所有可利用之資訊。
ht表示條件變異數,會受過去q期誤差項的干擾 (二)GARCH模型
Bollerslve 【 34 】 (1986) 修 正 ARCH 模 型 的 條 件 變 異 數 方 程 式,根據傳統的ARMA模型使條件變異數符合ARMA過程,即受自我 迴歸影響亦受移動平均影響;也就是說使條件變異數不僅受前期 預 測 誤 差 平 方 項 的 影 響 , 也 受 其 條 件 變 異 數 的 影 響 , 而 形 成 了 GARCH模型。而當βj =0時,則回到Engle之ARCH模型。
模型如下:
t t
t X b
Y = +ε ) , 0 (
1 ~ t
t
t Ω− N h
ε
∑ ∑
= − + = −
+
= q
j
p
i
i t i i
t j
t C h
h
1 1
2
0 β αε
其中:εt為模型之殘差項
−1
Ωt 表示到t−1期為止所有可利用之資訊
ht為Yt的條件變異數,其受到前 p期誤差項平方與前q期條 件變異數影響
5.2、不對稱型條件異質變異數模型 TGARCH模型:
為 了 要 反 應 波 動 的 不 對 稱 與 資 訊 度 偏 誤 效 果 等 行 為 特 性 , TGARCH模型的設定方式,是運用虛擬變數的方法,將訊息對波動 的影響,區分為好消息對波動的影響及壞消息對波動的影響,使
模 型 得 以 同 時 偵 測 不 同 程 度 的 好 (壞 )消 息 對 波 動 的 影 響 效 果 與 不對稱效果。
TGARCH糢型是由Zakoian【66】(1990)、Glosten,Jaganathan and Runkle【48】(1993)所提出。TGARCH 條件變異數的設定為:
2 1 1
2 1 2
1 − − −
− + +
+
= t t t t
t d
h ω αε γε βσ
其中,若εt−1<0時,γ >0;反之,dt−1=0
模 型 中 虛 擬 變 數 值 (d) 的 設 定 , 表 示 在 有 好 的 消 息 (εt−1>0) 時 , 會 有α 的 衝 擊 效 果 ; 而 在 壞 的 訊 息 (εt−1 <0)發 生 時 , 其 衝 擊 效果成為α +γ 。若γ >0,代表槓桿效果存在(leverage effect);
若γ ≠0, 表 示 消 息 的 衝 擊 為 不 對 稱 。 藉 由 模 型 中 虛 擬 變 數 (dt−1) 的設定,使得εt−1的效果產生不同的影響力。
EGARCH 模型:
EGRACH 模型是由 Nelson【56】(1991)所提出的,其條件變異數 為:
∑
∑
= −−
−
−
= −
⎟⎟
⎟
⎠
⎞
⎜⎜
⎜
⎝
⎛
⎥⎥
⎦
⎤
⎢⎢
⎣ + ⎡
⎥⎥
⎦
⎤
⎢⎢
⎣
⎡ −
+ +
= q
j t j
j t j j
t j t j p
i
i t
t h h h
h
1
1 1
1
) 2 log(
)
log( ε
δ π α
α ε β
ω
其中,εt:表示t期的殘差項
ht: 報酬率的條件變異數
當α1>0 時,若δ =0時,表示不對稱效果不存在,同規模的 正 向 報 酬 衝 擊 與 負 向 的 報 酬 衝 擊 具 有 相 同 的 效 果 , 而 若−1<δ <0
時,表示不論正或負的報酬衝擊對波動性的效果均為正,但是負 向報酬衝擊的增加效果較大,當δ <−1時,表示正的報酬衝擊對波
動性的效果為負,負向報酬衝擊對於報酬波動性效果為正,即只 要δ <0就存在不對稱效果。
本文在對股市加權股價波動性與解釋變數之波動性方面,擬 用 GARCH、 TGARCH與 EGARCH模 型 來 配 置 , 並 依 所 建 立 的 模 型 估 計 條件變異數。
六、向量自我迴歸模型 (Vector Autoregression Model;VAR) Sim【 60】 (1980)提 出 向 量 自 我 迴 歸 , 他 認 為 先 驗 理 論 所 建 立的結構化計量模型,認定上會有困難。在此模型不須在多個變 數間的因果關係未明之前進行內外生變數的假設,此分析方法是 根據資料本身的特性進行研究,首先將研究的指數變數放於模型 中,在此模型所有變數皆視為內生變數且不事先假設先驗理論基 礎來決定變數間的關係。VAR 模型是以一組迴歸表示出各變數間 彼此的互動關係,而迴歸方程式的自變數是由所有變數的落後項 所組成,並認為變數的落遲項涵蓋了所有相關的訊息。
VAR 的模型可用下式表示:
∑
= − + += M
i
t i t i t
t AY
Y
0
ε α
0 ) (ut = E
∑
≠= 0
)
(utut' u E
s t u
u
E( t s')= ,0 ≠
其中,Yt =(y1t...ymt)為(m×1)變數,m為模型內所討論的變數 at為(m×1)的常數項
Ai為(m×m)的係數矩陣,為變數 M 階落遲項變數 Yt−i為(m×1)之 M 階落遲項變數
εt為結構干預項,為(m×1)的一期純白噪音誤差過程的預 測誤差,是無法解釋的部份,可視為隨機衝擊項或是創新 E(ut)=0表示各期誤差為序列無關
∑
≠= 0
) (utut' u
E 為一對角化的共異矩陣
VAR 模型發展出三種重要的應用模型,因果關係檢定、衝擊 反應分析模式以及預測誤差變異數分解。
6.1 Granger 因果關係檢定
根據 Granger【46】(1969) 所定義的因果關係,若額外加入 一個訊息變數 X 可以解釋更多的變數 Y,並可以降低變數 Y 的條 件變異數,這個現象稱為變數 X 為變數 Y 的因(X cause Y),如 果情形相反,則變數 Y 為變數 X 的因;若上述兩種情形都存在,
則表示 X、Y 之間有回餽關係;或兩變數不存在任何關係,則稱 X、
Y 兩變數為獨立關係。
若 Xt、Yt表示兩個定態序列,x 為 Xt序列過去值的集合,y 為 Yt序列過去值的集合;xa代表 X 變數自第 1 期到第 t 期所有 可得到的資訊之集合,ya代表 Y 變數自第 1 期到第 t 期所有可得 資訊的集合。
1.因果關係
若VAR(Yt y,x)<VAR(Yt y);表示 在 解 釋 Yt 時 若 加 入 Yt 的 過 去 值 後,再加入 Xt的過去值,將會降低誤差,則稱 Xt影響 Yt。