實證研究方法

第三章研究設計

第四節實證研究方法

一、相關分析

相關分析是衡量兩變數間的線性關係。以皮爾森相關係 (Person＇s Correlation Coefficient )ρ -求兩變數的相關程度。皮爾森相關係數ρ的定義如下:

y x

σ σ ρ = σ

其中 -1<ρ<1，正負符號表示表示相關的方向(斜率)，正相關表示線性的斜率為正，負相關表示線性相關的斜率為負。

二、常態分配檢定

時間數列是否為常態分配檢定，利用 Jarque and Bera 統計檢定，其計算式如下:

JB= _⎥

⎦

⎢ ⎤

⎣

⎡ −

+ 24

) 3 ( 6

2 K

n S ~X_α²(2)

非常態分配 H

常態分配 H

: :

1 0

其中，N:觀察值數量 K:峰態

S:偏態

當 JB>X_α²(2)時，則拒絕虛無假設，序列為非常態分配。

三、單根檢定

在時間序列裡，大多的變數為非定態數列。 Granger and Newbold(1974)指出如果迴歸式的自變數為非定態，直接進行迴歸分析，將產生假性迴歸關係，使得估計結果不具意義。因此在採用時間序列的資料作分析前，必須保證資料為定態序列。單根檢定主要的目的在於確定變數的時間序列的整合級次，用以判定時間序列的定態性質。

3.1 ADF[Augmented Dickey-Fuller]單根檢定

在 DF 檢定法之中假設ε_t為白噪音，然後迴歸殘差項常會有顯著的自我相關現象，即具有豐富的時間相依異質性，使得 DF 檢定的範圍受到限制，其檢定能力也受到質疑。Dickey 與 Fuller

【40】將 DF 檢定法的三個檢定模型重置加入應變數(Y_t)之落後期，即考慮變數 (ΔY_t)的自我相關的問題來對時間序列資料 (Y_t) 進行單根檢定。其模型為:

∑

= −

− + Δ +

Δ ^k

t t i t

t Y Y

1 ρ ε

∑

= −

− + Δ +

Δ ^k

t t i t

t Y Y

1 ρ ε

β α

∑

= −

− + Δ +

+ +

Δ ^k

t t i t

t T Y Y

1 ρ ε

β γ α

k 為最適落後期，使誤差項ε_t趨於白噪音。

假設檢定為:

0:β =

H [存在單根，為非定態]

1:β ≠

H [不存在單根，為定態]

若檢定結果顯示，變數的時間序列非定態，則可對等號兩邊取其差分，以差分形態再做一次單根檢定。

3.2 PP[Phillips-Perron]單根檢定法

在 ADF 檢定法中，雖然已將殘差具有序列相關的問題考慮進去，但是能仍有可能存在異質性的問題，因此 Phillips 與 Perron

【57】提出以函數化中央極限定理之非參數法來修正殘差項可能產生序列相關及異質性的問題。利用迴歸 AR(1)模型所得到的殘差值來修正 Dickey-Fuller 檢定法之 t 統計量，並將模式擴充至包含漂浮項及趨勢項的模型，這和 Dickey-Fuller(1979)所得到的極限分配相同。Pillip 依據 Dickey-Fuller 所設定的模型如下:

模型 1: y_t =μ^* +γ^*y_t₋₁ +ε_t^*

模型 2: yt μ β

(

t T

)

γ^~yt ε^~t

~ ~

1 + +

− +

= ₋

* 0 :γ

H [有單根]

ˆ 1

1:γ =

H [無單根]

其檢定統計量分別為:

(

₁ ₁

)

² ¹^/²

2 2 2

1 1

* 1

*) ( / ) (1/2 )( )[ ]

(^t ⁼ ^S ^S ^t ⁻ ^S ^S ⁻^S ^T⁻

∑

^y₋ ⁻^y₋ ⁻

Z _a _u _T _a _T _T _u _t

) )(

3 4 / ( ) / ( )

(t^~_a S_u S_T₁ t^~_a T³ D¹_y^/²S_T₁ S_T²₁ S_u

Z = − −

其中:t_a^*、t_a^~為一般的 t 統計量，T 為樣本的個數。

D_y =det(y^Ty)為解釋變數的行列式值。

S_u²為δ²的一般估計式，

∑

−

∞

= → ^T

t t

T T E u

1 2 1

2 lim ( )

δ 。

S_T²₁為δ²的一般估計式，δ² =lim_T_→_∞T⁻¹E(S_T²)，

∑

= ^T

t t

T u

。

落後期數之選取:

單根檢定需要決定一個最適的落後期，以修正殘差項的自我相關問題，使殘差項為白噪音形式。由於加入太多落後期數，將使得拒絕虛無假設之檢定能力下降；但若加入太少落後期數，模式將無法完全修正由移動平均項所造成臨界值放大的缺點；究竟要加入多少落後期數，則可用 AIC 準則來判斷，選擇 AIC 最小者為最適落後期。

在作時間序列定態檢定與用 VAR 模型分析時，此時時間數列落後期數的選擇就佔有重要的地位，不同的落後期數會影響最後的分析結果。因此落後期數的選定就相當的重要，AIC 值是模型最適變數的重要參考值，判斷方法乃是選取各個模型中 AIC 值最小的。

AIC（Akaike Information Criterion）準則。Akaike【28】

（1969）提出 AIC 準則，選取的方法為 AIC 愈小之 P 愈佳。其定義為：

N k

AIC Nⁱ 2

ˆ ) log(

∑

^ε

其中N為樣本數。

εˆi為殘差項的估計值。

k為參數的個數。

四、ARIMA模型:

Box＆Jenkins【32】(1976)提出一套時間序列分析方法，稱為自我迴歸整合移動平均模型 (Autoregressive Integrated Moving Average Model；ARIMA)。自我迴歸-AR(p)模式，主要是指變數 ( X_t)除了受誤差項影響外，還受變數前期 ( X_t₋₁、 X_t₋₂、

−3

Xt 、…)所影響。移動平均-MA(q)模式是指變數(X_t)受變數前期的誤差項(ε_t₋₁、ε_t₋₂、ε_t₋₃、…)所影響。若變數(X_t)受變數前期以及誤差項前期影響的話，則模式為 ARMA(p,q)模式。在配適時間序列模型時，一般的作法是當序列不平穩或有趨勢 (trend)時，先對其取差分直到序列平穩，接著才以 ARMA(p,q)模型來配適序列，則可稱此模型為ARIMA(p,d,q)，d為所需差分次數。AR(p)、

MA(q)、ARMA(p,q)模型可表式如下:

AR(p)模型:

t p t p t

t X X X

X =α₀ +α₁ ₋₁ +α₂ ₋₂ +...+α ₋ +ε MA(q)模型:

q t q t

t t

Xt =μ +ε −β₁ε ₋₁ −β₂ε ₋₂ −β₃ε ₋₃ −...−β ε ₋ ARMA(p,q)模型:

q t q t

t t

p t p t

t X X X

X =α₀ +α₁ ₋₁ +α₂ ₋₂ +...+α ₋ +ε −β₁ε ₋₁ −β₂ε ₋₂ −...−β ε ₋

根據Box-Jenkins方法論，建構ARIMA模型流程圖如下:

1、模型認定(Identification of the model)

第一個步驟先判定資訊為何種模式，也就是決定 p、 d、 q分別是多少。首先先確定差分的階次d，當序列資料呈現不平穩時，

則對資料進行差分直到序列呈現穩定為止。而決定最適ARMA(p,q) 模型是利用自我相關函數 (ACF)圖與偏自我相關函數 (PACF)圖，來判斷模式中AR(p)與MA(q)的階次。

2、參數估計(Parameter estimation of chosen model)

在決定 p、 d、 q的序次後，接下來就是估計參數值，由於時間序列的模式並非為線性，因此不能利用一般的最小平方法來估計模式中的參數，必須使用非線性估計法反覆的求解過程來估計模式中的參數。

3、診斷檢定(Diagnostic checking) 模型認定

參數估計

診斷檢定

預測

是

否

在估計時間序列模型的參數後，接下來是診斷這種設定是否適合，檢查殘差項(ε_t)是否仍有序列相關的問題，也就是檢定是否符合白噪音，假如符合白噪音則判定此時的模式為適當的模式。估計 ARCH與 GARCH模型前，必須確定殘差項是否具有序列相關，本文藉由 Ljung-Box Q統計量檢定有無自我相關。此外，在對模型做估計前，必須先檢定時間序列資料是否具有ARCH效果，

再進行模型估計，藉由ARCH LM檢定來判斷是否存在ARCH效果。

模型檢定:

Ljung-Box Q檢定:

Ljung-Box的純白噪音檢定(pure white noise test)，簡稱 Q統計量，是用來檢定時間序列資料是否具有序列相關及異質變異數的情形，模型如下:

∑

= ^k

T k

T Q

ˆ2

) 2

( γ

H0:殘差項平方(ε_t²)無自我相關

H1:殘差項平方(ε_t²)有自我相關其中:T為觀察值個數

γ^ˆ_k²為ε^ˆ_k樣本自我相關係數

當拒絕虛無假設，表示此時間序列資料有序列相關。

LM test (Lagrange multiplier):

Lagrange Multiplier(LM) 檢定是由 Engle【 41】 (1984)所提出，利用所求得之殘差平方項之迴歸方程式作檢定，迴歸式如

下:

t p t p t

t α α ε α ε α ε ν

ε² = ₀ + ₁ ²₋₁+ ₂ ²₋₂ +...+ ²₋ + 0

...

: ₁ ₂

0 = = = _p =

H α α α [無ARCH效果]

H1:α₁至α_p不全為零 [有ARCH效果]

根據上述的樣本數與判定係數R²，求出TR²的值，而TR²近似於卡方分配，所以當TR² >x²(p)時，則拒絕需無假設，可證明時間序列模型之殘差項變異數不齊一，具有異質性。

4.預測(Forecasting)

在完成適當模式後，即可利用模式進行預測分析。

五、ARCH、GARCH、TGARCH、EGARCH 模型

過去傳統的計量模型與時間序列模型都是假設殘差變異數固定，也就是誤差項不會隨著時間的改變而改變，但事實上許多金融性的資產之時間序列大多存在波動叢聚（ volatility clustering）的現象，例如股價大幅波動後往往下一期會伴隨大幅度的波動，而股價小幅度波動後亦會伴隨著小幅度的波動，代表時間序列的變異數會隨著時間而改變。對於變異數異質性的現象， Engle(1982) 提出了自我迴歸條件異質變異數模型 (Autoregressive Conditional Heteroscedasticity Model ,ARCH 模型)，模型中時間序列資料之條件變異數具有隨時間改變的現象。而 Bollerslev(1986)將 ARCH 模型加以擴充，將過去的殘差項及過去的變異數納入條件變異數方程式中，成為一般化自我迴歸模型條件異質變異數模型 (Generalized

Autoregressive Conditional Heteroscedasticity Model,GARCH)。

一般 GARCH 模型皆假定新訊息所造成的波動反應是對稱的，即表示不論訊息的好壞，對於市場的好壞都具有相同的影響。而傳統之 ARCH(p)模型或 GARCH(p,q)並不能掌握波動性的不對稱性效果，為反應出前期正、負報酬訊息對本期股價報酬變異數可能產生的不對稱性影響，因此許多學者開始發展不對稱 GARCH 模型來捕捉這些現象。接下來將分別對 ARCH、GARCH、TGACH 不對稱性模型分別做介紹：

5.1、對稱型條件異質變異數模型 (一)ARCH 模型

Engle【42】(1982)所提出ARCH(Autoregressive Conditional Heteroskedasticity)模型，其考慮到條件變異數隨時間經過而變動的特性，將h_t設為Y_t的條件變異數，使受到前q期誤差項平方之影響，因而能適切地描寫出市場報酬率波動的狀態，並可以成功的掌握到時間序列的趨勢，進而提昇估計效率，其 ARCH(q)模型架構為:

t t

t X b

Y = +ε ) , 0 (

1 ~ t

t Ω₋ N h

∑

= −

= ^p

i t i

t C

1 2

0 α ε

其中：ε_t為模型之殘差項

−1

Ω_t 表示t−1期為止所有可利用之資訊。

h_t表示條件變異數，會受過去q期誤差項的干擾 (二)GARCH模型

Bollerslve 【 34 】 (1986) 修正 ARCH 模型的條件變異數方程式，根據傳統的ARMA模型使條件變異數符合ARMA過程，即受自我迴歸影響亦受移動平均影響；也就是說使條件變異數不僅受前期預測誤差平方項的影響，也受其條件變異數的影響，而形成了 GARCH模型。而當β_j =0時，則回到Engle之ARCH模型。

模型如下:

t t

t X b

Y = +ε ) , 0 (

1 ~ t

t Ω₋ N h

∑ ∑

= − + = −

= ^q

i t i i

t j

t C h

1 1

0 β αε

其中：ε_t為模型之殘差項

−1

Ω_t 表示到t−1期為止所有可利用之資訊

ht為Y_t的條件變異數，其受到前 p期誤差項平方與前q期條件變異數影響

5.2、不對稱型條件異質變異數模型 TGARCH模型:

為了要反應波動的不對稱與資訊度偏誤效果等行為特性， TGARCH模型的設定方式，是運用虛擬變數的方法，將訊息對波動的影響，區分為好消息對波動的影響及壞消息對波動的影響，使

模型得以同時偵測不同程度的好 (壞 )消息對波動的影響效果與不對稱效果。

TGARCH糢型是由Zakoian【66】(1990)、Glosten,Jaganathan and Runkle【48】(1993)所提出。TGARCH 條件變異數的設定為:

2 1 1

2 1 2

1 − − −

− + +

= _t _t _t _t

t d

h ω αε γε βσ

其中，若ε_t₋₁<0時，γ >0;反之，d_t₋₁=0

模型中虛擬變數值 (d) 的設定，表示在有好的消息 (ε_t₋₁>0) 時，會有α 的衝擊效果；而在壞的訊息 (ε_t₋₁ <0)發生時，其衝擊效果成為α +γ 。若γ >0，代表槓桿效果存在(leverage effect)；

若γ ≠0，表示消息的衝擊為不對稱。藉由模型中虛擬變數 (d_t₋₁) 的設定，使得ε_t₋₁的效果產生不同的影響力。

EGARCH 模型:

EGRACH 模型是由 Nelson【56】(1991)所提出的，其條件變異數為:

∑

= −

−

= −

⎟⎟

⎟

⎠

⎞

⎜⎜

⎜

⎝

⎛

⎥⎥

⎦

⎤

⎢⎢

⎣ + ⎡

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡ −

+ +

= ^q

j t j

j t j j

t j t j p

i t

t h h h

1 1

) 2 log(

)

log( ε

δ π α

α ε β

其中，ε_t:表示t期的殘差項

h_t: 報酬率的條件變異數

當α₁＞0 時，若δ =0時，表示不對稱效果不存在，同規模的正向報酬衝擊與負向的報酬衝擊具有相同的效果，而若−1<δ <0

時，表示不論正或負的報酬衝擊對波動性的效果均為正，但是負向報酬衝擊的增加效果較大，當δ <−1時，表示正的報酬衝擊對波

動性的效果為負，負向報酬衝擊對於報酬波動性效果為正，即只要δ <0就存在不對稱效果。

本文在對股市加權股價波動性與解釋變數之波動性方面，擬用 GARCH、 TGARCH與 EGARCH模型來配置，並依所建立的模型估計條件變異數。

六、向量自我迴歸模型 (Vector Autoregression Model;VAR) Sim【 60】 (1980)提出向量自我迴歸，他認為先驗理論所建立的結構化計量模型，認定上會有困難。在此模型不須在多個變數間的因果關係未明之前進行內外生變數的假設，此分析方法是根據資料本身的特性進行研究，首先將研究的指數變數放於模型中，在此模型所有變數皆視為內生變數且不事先假設先驗理論基礎來決定變數間的關係。VAR 模型是以一組迴歸表示出各變數間彼此的互動關係，而迴歸方程式的自變數是由所有變數的落後項所組成，並認為變數的落遲項涵蓋了所有相關的訊息。

VAR 的模型可用下式表示:

∑

= − + +

= ^M

t i t i t

t AY

ε α

0 ) (u_t = E

∑

^≠

= 0

)

(u_tu_t^' _u E

s t u

E( _t _s^')= ,0 ≠

其中，Y_t =(y₁_t...y_mt)為(m×1)變數，m為模型內所討論的變數 a_t為(m×1)的常數項

A_i為(m×m)的係數矩陣，為變數 M 階落遲項變數 Y_t₋_i為(m×1)之 M 階落遲項變數

εt為結構干預項，為(m×1)的一期純白噪音誤差過程的預測誤差，是無法解釋的部份，可視為隨機衝擊項或是創新 E(u_t)=0表示各期誤差為序列無關

∑

^≠

= 0

) (u_tu_t^' _u

E 為一對角化的共異矩陣

VAR 模型發展出三種重要的應用模型，因果關係檢定、衝擊反應分析模式以及預測誤差變異數分解。

6.1 Granger 因果關係檢定

根據 Granger【46】(1969) 所定義的因果關係，若額外加入一個訊息變數 X 可以解釋更多的變數 Y，並可以降低變數 Y 的條件變異數，這個現象稱為變數 X 為變數 Y 的因(X cause Y)，如果情形相反，則變數 Y 為變數 X 的因；若上述兩種情形都存在，

則表示 X、Y 之間有回餽關係；或兩變數不存在任何關係，則稱 X、

Y 兩變數為獨立關係。

若 Xt、Yt表示兩個定態序列，x 為 Xt序列過去值的集合，y 為 Y^t序列過去值的集合；ｘ^ａ代表 X 變數自第 1 期到第 t 期所有可得到的資訊之集合，y^a代表 Y 變數自第 1 期到第 t 期所有可得資訊的集合。

1.因果關係

若VAR(Y_t y,x)<VAR(Y_t y);表示在解釋 Yt 時若加入 Yt 的過去值後，再加入 X^t的過去值，將會降低誤差，則稱 X^t影響 Y^t。

在文檔中中華大學 (頁 57-74)

第三章 研究設計

第四節 實證研究方法

∑

∑

∑

(

)

(

)

∑

∑

∑

∑

∑

∑

∑ ∑

∑

∑

∑

∑

∑

第三章研究設計

第四節實證研究方法