• 沒有找到結果。

時間序列分析 –

N/A
N/A
Protected

Academic year: 2022

Share "時間序列分析 –"

Copied!
77
0
0

加載中.... (立即查看全文)

全文

(1)

時間序列分析

– 總體經濟與財務金融之應用

蒙地卡羅模擬 與Bootstrap

陳旭昇

2013.12

(2)

2 蒙地卡羅模擬的應用

3 樣本重抽法與Bootstrap

4 Bootstrap偏誤與標準差

5 Bootstrap信賴區間

6 Bootstrap P-values (假設檢定)

7 迴歸模型的Bootstrap

8 Bootstrapping長期追蹤調查資料

9 蒙地卡羅模擬與Bootstrap的實例應用

(3)

蒙地卡羅模擬

蒙地卡羅模擬

假設{xi}n

i=1為隨機抽樣自母體分配F的隨機樣本資料。 令 Tn = Tn(x1, . . . , xn, θ)

為我們有興趣的統計量,其中θ為母體未知參數,且一般而言我們假設θ 足以代表母體分配的所有特徵。 因此, Tn 的實際抽樣分配為

Gn(τ, F) = P(Tn ≤ τ∣F).

(4)

蒙地卡羅模擬

由於F (或是說θ)未知,Gn也是未知。 甚至於在某些情況下,即 使F已知,我們也未必能夠推導出Gn分配。

而蒙地卡羅模擬就是在研究者自己選擇的F,利用數值模擬 (numerical simulation)來計算Gn(τ, F),因此,你可以把執行蒙地 卡羅模擬的研究人員想像成造物者,透過不同的環境設定(選擇的 不同的F ),觀察並記錄萬物的運作。 茲簡述蒙地卡羅模擬應用在統 計學(計量經濟學)的執行方式如下。

(5)

蒙地卡羅模擬

蒙地卡羅模擬

定義(蒙地卡羅模擬())

4 重複B次步驟23,一般來說, B為很大的數字如B= 1000或是B= 5000等。

令第b次抽樣得到的統計量以Tnb表示,根據B次的反覆計算(亦即樣本大小為 B),我們得到了Tnb的實證分配函數(empirical distribution function, EDF),

Gˆn(τ) = 1 B

B b=1

1(Tnb≤ τ), 其中1(⋅)為指標函數(indicator function),

1(Tnb≤ τ) = { 1, if Tnb≤ τ 0, if Tnb> τ

(6)

蒙地卡羅模擬

定義(蒙地卡羅模擬)

1 研究者選擇θ以及樣本大小n以建構一個虛擬的資料生成過程(data generating process, DGP)

2 利用電腦的隨機變數產生器(亂數產生器, random number generater)θ所代 表的分配F中抽出一組隨機樣本{xi}ni=1。 更明確地說,應該是擬真亂數產生器

(pseudo random number generater)因為所有的亂數產生器都是 「幾可亂真」

的程式。

3 由這組虛擬樣本計算統計量Tn= Tn(x1, . . . , xn, θ).

(7)

蒙地卡羅模擬

蒙地卡羅模擬

應用蒙地卡羅模擬的理論基礎為 「統計學基本定理」(fundamental theorem of statistics, FTS)。 亦即,我們知道

Gn(τ) = P(Tn ≤ τ) = E(1(Tn ≤ τ)), 則根據WLLN,

n(τ) = 1 B

B

b=1

1(Tnb≤ τ)Ð→ E(1(Tp n ≤ τ)) = Gn(τ).

也就是說,在給定某資料生成過程下我們抽出一組隨機樣本並計算統計 量Tnb,重複B次後,我們會得到Tnb的實證分配函數Gˆn(τ),FTS告 訴我們此實證分配函數Gˆn(τ)機率收斂到該資料生成過程下的統計量

(8)

蒙地卡羅模擬

性質(隨機變數產生器)

在做電腦模擬時,我們會設定隨機變數產生器的起始值,其目的是為了讓別人可以重製 我們的模擬結果。 舉例來說,EViews以及GAUSS,我們使用以下指令,

RNDSEED 123587

RATS,我們用

SEED 123587

(9)

蒙地卡羅模擬的應用

蒙地卡羅模擬的應用

蒙地卡羅模擬在計量經濟學中的主要應用在於評估統計推論程序的表 現好壞,譬如估計式與檢定量的表現。 而統計推論程序的表現一般而言 決定於樣本大小n以及真正的資料生成過程F,舉例來說,我們可以透過 蒙地卡羅模擬來檢視一個檢定量的 「檢定大小」(size)以及 「檢定力」

(power)。 此外,我們也可以用蒙地卡羅模擬來近似估計式的小樣本分配,

建構其標準差以及區間估計式。

(10)

模擬 AR(1) 係數 OLS 估計式的小樣本偏誤

考慮以下的DGP:

yt= c + ϕyt−1+et,

其中eti.i.d. N(0, 1).以起始值y0 = 0並遞迴地(recursively)製造模擬 資料{yt}nt=1。 將樣本大小設定為150,然後丟棄掉前50個資料點以降 低起始值的影響。 給定此樣本大小為100的模擬資料,OLS估計一個 AR(1)模型,重複以上所述步驟1000,就會得到1000ϕ,ˆϕˆ的抽 樣分配 。

(11)

蒙地卡羅模擬的應用

模擬 AR(1) 係數 OLS 估計式的小樣本偏誤

DGP,設定c= 0.1,且考慮以下不同的真實ϕ: ϕ= 0.50, 0.90, 0.95, 0.99以及1.0.1報告了估計值ϕˆ小於真實ϕ值的機率(亦即, 1000個ϕˆ中有多少比率使得ϕˆ< ϕ)。 可以很清楚地由表中看出, ˆϕ在小 樣本中存在向下偏誤(downward biase),且此小樣本向下偏誤隨著真實 的ϕ趨近於1而越來越嚴重。

(12)

模擬 AR(1) 係數 OLS 估計式的小樣本偏誤

:模擬小樣本向下偏誤 ϕ E( ˆϕ) P( ˆϕ < ϕ) 0.99 0.94 93.5%

0.95 0.90 83.1%

0.90 0.86 74.5%

0.50 0.47 58.9%

(13)

蒙地卡羅模擬的應用

模擬 AR(1) 係數 OLS 估計式的小樣本偏誤

:實證分配函數= 0.99)

0.66 0.72 0.78 0.84 0.90 0.96 1.02

0.0 1.6 3.2 4.8 6.4 8.0 9.6 11.2

(14)

模擬 t 檢定的實證檢定力與檢定大小

考慮以下簡單的迴歸模型,

yt = α + βxt+ et.

當樣本夠大時,在虛無假設H0∶ β = 0成立下, t比率(t-ratio)的極限分 配為標準常態,

t= βˆ SE( ˆβ)

Ð→ N(0, 1).d

(15)

蒙地卡羅模擬的應用

模擬 t 檢定的實證檢定力與檢定大小

在此應用中,將檢視迴歸係數的t檢定量的實證檢定力(empirical power)與實證檢定大小(empirical size)。

1 在虛無假設H0∶ β = 0成立下, DGP為 yt= 2.5 + et, 其中et服從自由度為3student-t分配。

2 在對立假設H1成立下,

yt= 2.5 + βxt+ et,

其中簡單設定xt∼ N(0, 1)。 我們考慮對立假設下的β值有β= 0.1, 0.5, 1.0以及 。

(16)

模擬 t 檢定的實證檢定力與檢定大小

接下來,我們執行顯著水準為5%的假設檢定。 「檢定大小」(size)的定義 為

P(∣t∣ > 1.96 ∣ H0為真), 而 「檢定力」(power)的定義為

P(∣t∣ > 1.96 ∣ H1為真).

(17)

蒙地卡羅模擬的應用

模擬 t 檢定的實證檢定力與檢定大小

我們也可以計算 「調整檢定大小後之檢定力」(size-adjusted power)。 利 用虛無假設H0 ∶ β = 0成立下的DGP,我們可以找出臨界值(critical value, cv), t使得

P(∣t∣ > t∣ H0為真) = 0.05.

則 「調整檢定大小後之檢定力」 定義為

P(∣t∣ > t∣ H1為真).

(18)

模擬 t 檢定的實證檢定力與檢定大小

下表報告了當樣本大小為25,不同的β所對應的檢定大小,真實5%

臨界值,檢定力以及調整檢定大小後之檢定力。 模擬次數為1000次。 我 們不難發現,隨著真實的β距離零越遠,實證檢定力就越大。

:模擬t檢定的實證檢定力與檢定大小

β Size True 5% cv (t) Power Size-adjusted Power

0.1 0.060 2.045 0.082 0.067

0.5 0.060 2.045 0.648 0.615

1.0 0.060 2.045 0.993 0.991

0.5 0.060 2.045 0.632 0.595

(19)

蒙地卡羅模擬的應用

模擬 t 檢定的實證檢定力與檢定大小

我們也可以檢視樣本大小如何影響t檢定的實證檢定力與檢定大小。 在

下表中,我們考慮β= 0.1於對立假設中。 顯然地,實證檢定力隨著樣本

變大而變大。

:模擬樣本大小的影響

Sample Size Size True 5% cv (t) Power Size-adjusted Power

25 0.060 2.045 0.082 0.067

50 0.052 1.966 0.099 0.099

100 0.059 2.060 0.156 0.132

1000 0.059 2.005 0.900 0.889

(20)

樣本重抽法

傳統的計量經濟學在做統計推論時,必須仰賴實際抽樣分配或是大 樣本漸近分配。

樣本重抽法(resampling method)則是一個與實際抽樣分配或是 大樣本漸近分配完全迥異的做法,其統計推論的基礎,來自 「原有樣 本的重複抽樣」。

樣本重抽法與蒙地卡羅模擬的關係十分密切,都是借助模擬來建構 一個人造的體系。 其主要的不同處在於,蒙地卡羅模擬所製造出來 的資料可以抽樣自完全虛擬的DGP,而樣本重抽法的模擬必須根據 實際資料重抽。

(21)

樣本重抽法與Bootstrap

樣本重抽法與 Bootstrap

樣本重抽法的優點如下。

1 較少假設。 舉例來說,樣本重抽法不需假設DGP的分配為常態或是 其他特定分配。

2 較為精確。 一般而言,在大多數的情況下,樣本重抽法的統計推論較 傳統大樣本漸近理論來的精確。

3 較易操作。 樣本重抽法在大多數的情況下都可以使用,你不必辛苦 地尋找樞紐統計量(pivotal statistics)。 此外,傳統大樣本漸近理論

需要Delta Method來處理非線性函數,而樣本重抽法可以輕易地

應用到各種不同設定如非線性函數。

(22)

樣本重抽法種類

樣本重抽法中,有以下四種最為重要:

1 隨機檢定(randomization test),又稱排列檢定(permutation test);

2 交互驗證法(cross-validation);

3 Jackknife重抽法;

4 Bootstrap重抽法。

其中又以Bootstrap重抽法為計量經濟學中應用最廣的樣本重抽法。

(23)

樣本重抽法與Bootstrap

Bootstrap 簡介

Bootstrap重抽法是由Bradley Efron所提出。 這個單字原意是指一 種靴子後面的小環帶,拉著可以讓自己方便脫下靴子,而不需他人幫

,因此bootstrap引申為由原有樣本不斷重複抽樣後得到許多新

樣本。

信賴區間,假設檢定以及標準差在傳統的統計學中必須應用實際抽 樣分配或是大樣本漸近分配。 然而,在許多情況下,我們無法推導出 實際抽樣分配,而樣本數又不足以讓我們應用漸近理論。

bootstrap想法為,把手頭擁有的這組樣本視為母體,然後根據這個

虛擬母體重複多次抽樣進而得到bootstrap分配。 接下來的統計推 論則不再使用抽樣分配,而是以bootstrap分配取代之。

(24)

Bootstrap 簡介

在正式介紹bootstrap之前,我們先呈現一個利用大樣本漸近分配來做 統計推論時,結果未盡理想之例子。考慮以下的迴歸模型,

{yi, x1i, x2i}ni=1

yi= β0+x1iβ1+x2iβ2+ei, ( x1i

x2i ) ∼ N(0, I2), ei∼ N(0, 32), β0= 0, β1= 1, β2= 0.5, n=300.我們感興趣的參數為

θ= β1

β2

.

因此, θ的真實參數值為θ0= 2

(25)

樣本重抽法與Bootstrap

Bootstrap 簡介

θ的估計式為

θˆ= βˆ1

βˆ2

. 根據Delta Method,

t( ˆθ) = θ − θˆ Sn( ˆθ)

Ð→ N(0, 1)d

(26)

Bootstrap 簡介

其中

Sn(ˆθ) =

n−1( ˆHβV ˆˆHβ), Hˆβ=

⎜⎜ 0 1/ ˆβ2

− ˆβ1/ ˆβ22

⎟⎟

,

Vˆ為變異數-共變數矩陣的估計式,

Vˆ = [1

n

i

xixi]

−1

[1

n

i

xixieˆ2i] [1

n

i

xixi]

−1

.

(27)

樣本重抽法與Bootstrap

Bootstrap 簡介

以重複10000的模擬建構t( ˆθ)在虛無假設下的實際抽樣分配,

t( ˆθ)的實際抽樣分配與標準常態分配一起畫在圖中。

顯然地,兩者的差異極大,實際抽樣分配具有長左尾(skewed)而非 對稱(asymmetric)。 犯型I誤差的機率為

P(∣t∣ > 1.96) = 0.084 = 8.4%,實證檢定大小(empirical size)大於 5%,即以大樣本漸近分配來做統計推論會造成 「過度拒絕」 的現象。

事實上,這個模擬分析告訴我們即使樣本數增加到n= 300,以大樣 本漸近分配來做統計推論的表現依然很差。 The bootstrap對此問 題提供一種解決之法。

(28)

Bootstrap 簡介

:t(ˆθ)的實際抽樣分配(實線)與大樣本極限分配(虛線, N(0, 1))

-8 -6 -4 -2 0 2 4

0.0 0.1 0.2 0.3 0.4 0.5 0.6

(29)

樣本重抽法與Bootstrap

Bootstrap 定義

假設資料{xi}n

i=1來自未知的分配F,且令 Tn = Tn(x1, . . . , xn, F)

為我們有興趣的統計量。 在大部分的情況下,該統計量又可寫成 Tn= Tn(x1, . . . , xn, θ).

舉例來說,

Tn = ˆθ, (估計式) Tn = ˆθ − θ, (偏誤) Tn =( ˆθ−θ)

S( ˆθ) , (t-統計量)

(30)

Bootstrap 定義

由於參數θF的函數,

θ= θ(F), 因此,

Tn= Tn(x1, . . . , xn, θ) = Tn(x1, . . . , xn, θ(F)) = Tn(x1, . . . , xn, F).

給定資料抽樣自分配F,

Gn(τ, F) = P(Tn≤ τ∣F)

Tn的實際抽樣分配函數。 Tn 取決於{xi}n

i=1以及θ,則其抽樣分配 G(⋅)取決於F 以及θ,然而θ= θ(F),G(⋅)透過兩個管道受到F影響: {xi}ni=1以及θ

(31)

樣本重抽法與Bootstrap

Bootstrap 定義

1 理想上, Tn的統計推論應該根據實際抽樣分配函數, Gn(τ, F).

然而,由於一般來說F 未知,實務上是不可能知道實際抽樣分配函 數。

2 傳統的大樣本理論就是利用G(τ, F) = limn→∞Gn(τ, F)來近似 Gn(τ, F)函數。 當G(τ, F) = G(τ)F 無關,我們就稱Tn為漸 近樞紐統計量(asymptotically pivotal statistics),並且以極限分配 G(τ)做為統計推論的基礎。 然而,在大多數的應用中,漸近樞紐統 計量並不存在。 此外,就算漸近樞紐統計量存在,其大樣本近似也可 能表現不盡理想。

(32)

Bootstrap 定義

Efron (1979)提出一種不同於漸近理論的近似方式: the bootstrap。

Bootstrap最迷人的地方就在於我們可以盡情地使用它,而不需擔

心統計量Tn有多複雜,也不必辛苦地應用Delta method,皓首窮究 於繁瑣的計算中。 Tn不需要存在任何一個已知的極限分配。

Bootstrap的做法是,首先找出F 的一致估計式, Fn,然後將Fn代入 Gn(τ, F)函數並得到

Gn(τ) = Gn(τ, Fn)

做為Gn(τ, F)的估計式。 我們將Gn(τ)稱做bootstrap分配,Tn 的統計推論就是根據Gn(τ)bootstrap分配。

(33)

樣本重抽法與Bootstrap

Bootstrap 定義

由於

F(x) = P(xi ≤ x) = E(1(xi ≤ x)),

則根據類比原則(analogy principle), F(x)的類比估計式(analog estimator)為實證分配函數(empirical distribution function, EDF),

Fn(x) = 1 n

n

i=1

1(xi ≤ x).

根據WLLN,對於任意x,

Fn(x)Ð→ F(x),pF的一致估計式。

(34)

Bootstrap 定義

給定一些技術性的條件,我們可以得到

n→∞limGn(τ) = Gn(τ, F) 以及

n→∞lim Gn(τ) = G(τ, F)

也就是說, bootstrap分配函數, Gn(τ)在樣本夠大時,會趨近於Tn 的實際抽樣分配函數Gn(τ, F)。 此外,由於我們知道當樣本很大時, Tn的極限分配為G(τ, F) = limn→∞Gn(τ, F),因此,當樣本很大 時, bootstrap分配, Gn(τ)也會趨近於Tn 的極限分配, G(τ, F)

(35)

樣本重抽法與Bootstrap

模擬 Bootstrap 分配

步驟1:以抽出放回(draw with replacement)的方式,從樣本 {xi}ni=1抽出一組bootstrap樣本(bootstrap sample),以{x

i}ni=1表 示之。 注意到相同的樣本點可能會被抽到一次以上,而有的樣本點 可能沒被抽到。

步驟2:利用這組bootstrap樣本計算bootstrap的統計量 Tn= Tn(x1, . . . , xn, Fn),

一般來說, Tn 之所以是F的函數,係透過參數θ,因此,我們又可將 bootstrap統計量寫成

Tn= Tn(x1, . . . , xn, θn),

(36)

模擬 Bootstrap 分配

步驟3:重複步驟1與步驟2B,得到Bbootstrap統計量 Tnb, b= 1, 2, . . . , B.

因此, T

nb 的實證分配函數(EDF)為 Gˆn(τ) = 1

B

B

b=1

1(Tnb ≤ τ).

B →∞,

n(τ)Ð→ Gp n(τ).

這樣的做法稱做無母數bootstrap (nonparametric bootstrap)。 理由在 於,我們在做重抽時,沒有使用任何母體參數的資訊。 一般而言,我們要 求很大的B,B= 1000或是B= 5000

(37)

樣本重抽法與Bootstrap

無母數 Bootstrap 的實際執行方式

以下說明實務上如何對樣本{x1, x2, . . . , xn}執行無母數bootstrap的重抽。

1 首先,我們從均等分配(uniform distribution), U[0, 1]抽出n個隨機變數 i}ni=1

2 對於每一個υi,計算

κi= round(0.4 + υi×n) 其中round代表取到最接近的整數。 因此, κi∈ [1, n].

3 令第ibootstrap樣本, xi 為第κix樣本點。

(38)

無母數 Bootstrap 的實際執行方式

舉例來說,給定n= 10,原有樣本{xi}10

i=1

{x1, x2, x3, x4, x5, x6, x7, x8, x9, x10}.

假設抽出來的υi

0.631, 0.277, 0.745, 0.202, 0.914, 0.136, 0.851, 0.878, 0.120, 0.00

κi 等於

7, 3, 8, 3, 10, 2, 9, 9, 2, 1

(39)

樣本重抽法與Bootstrap

無母數 Bootstrap 的實際執行方式

因此, bootstrap樣本{x

i}10i=1

{x1, x2 x3, x4, x5, x6, x7, x8, x9, x10}

= {x7, x3, x8, x3, x10, x2, x9, x9, x2, x1}

顯然地,如前所述,原來樣本點會在bootstrap樣本中出現一次以上(如 x2, x3以及x9),或是完全沒被選到(x4, x5以及x6)

(40)

Bootstrap 偏誤

估計式θˆ的偏誤(bias)定義成

ωn = E( ˆθ− θ).

如果我們令統計量Tn(θ) = ˆθ− θ,則偏誤可以寫成 ωn= E[Tn(θ)] = ∫ τdGn(τ, F).

(41)

Bootstrap偏誤與標準差

Bootstrap 偏誤

而對應的bootstrap估計式與統計量為

θˆ= ˆθ(x1, . . . , xn), 以及

Tn = ˆθ− ˆθ.

因此, bootstrap偏誤(bootstrap bias)為 ωn = ∫ τdGn(τ),

(42)

Bootstrap 偏誤

ω

n的模擬估計式(simulation estimator)為

ωˆn= 1 B

B b=1

Tnb

= 1 B

B b=1

(ˆθb− ˆθ)

= (1 B

B b=1

θˆb) − ˆθ

= ˆθ− ˆθ.

(43)

Bootstrap偏誤與標準差

Bootstrap 偏誤

給定θˆ為偏誤估計式,θ的不偏估計式為 θ¨= ˆθ − ωn, 使得

E(¨θ) = E(ˆθ) − E(ωn),

= E(ˆθ) − ωn,

= E(ˆθ) − E(ˆθ − θ),

= E(ˆθ) − [E(ˆθ) − θ],

= θ.

(44)

Bootstrap 偏誤

因此,偏誤修正(bias-adjusted)的bootstrap估計式為 θ¨= ˆθ− ˆωn

= ˆθ− (ˆθ− ˆθ)

= 2 ˆθ− ˆθ.

簡單地說,我們可以透過bootstrap估計偏誤,然後建構出偏誤修正的 bootstrap估計式。

(45)

Bootstrap偏誤與標準差

Bootstrap 標準差

Tn = ˆθ,則其變異數為

Vn = Var(ˆθ)

= Var(Tn)

= E(Tn− E[Tn])2. 在bootstrap分配中,Tn= ˆθ,則其變異數為

Vn= E(Tn− E(Tn))2.

(46)

Bootstrap 標準差

因此, V

n 的模擬估計式(亦即bootstrap變異數)為 Vˆn= 1

B

B b=1

(ˆθb − ˆθ)2.

bootstrap標準差就是

n.

(47)

Bootstrap偏誤與標準差

Bootstrap 標準差

在早期的文獻中,許多人應用bootstrap的目的是找出bootstrap標準 差,進而從事信賴區間的建構。 弔詭的是,這些研究在建構信賴區間時, 還是使用傳統大樣本分配,唯一不同的只是用bootstrap標準差替換掉 傳統的標準差。 這樣的做法相當奇怪,因為,使用bootstrap的原因就是 來自我們不信任極限分配!如果bootstrap的目的是統計推論(例如建 構信賴區間),何不直接建構bootstrap信賴區間?

(48)

Bootstrap 信賴區間

Tn的實際抽樣分配為

Gn(τ, F).

α= Gn(qn(α, F), F),

我們稱qn(α, F)α%的分量函數(quantile function)。 同理,

bootstrap分配中的分量函數為

qn(α) = qn(α, Fn).

給定Tn = ˆθ為我們有興趣的統計量,則樣本中有100⋅ (1 − α)%的比例, θˆ被以下區間所包含:

[qn

2) , qn(1 − α 2)] .

(49)

Bootstrap信賴區間

Bootstrap 信賴區間

以上的區間提供我們建構bootstrap信賴區間的靈感。 亦即, Efron提出 以下的bootstrap信賴區間

CI =[qn

2) , qn(1 − α 2)] .

一般來說,我們稱此區間為百分位信賴區間(percentile confidence interval)。 而實務上CI的模擬估計式為

CÎ=[ˆqn

2) , ˆqn(1 − α 2)] ,

(50)

Bootstrap 信賴區間

其中qˆn(⋅)為bootstrap統計量{Tn1, . . . , TnB }的樣本分量(sample quantile)。 也就是說,我們透過模擬得到bootstrap統計量,

{Tn1, . . . , TnB },將它們由小排到大,然後找出第T

nb做為分量

qn(α)的模擬估計式。 舉例來說,1000次的重複抽樣中(B= 1000), 95%的百分位信賴區間就是第25位以及第975位的T

nb(排序後)

(51)

Bootstrap信賴區間

Bootstrap 信賴區間

百分位信賴區間的缺點在於不夠精確(not accurate),舉例來說, 95%百 分位信賴區間的實際覆蓋機率事實上不到95%,然而,由於百分位信賴 區間CÎ建構程序簡單,從而成為實證研究中,最常使用的一種

bootstrap信賴區間。

(52)

單尾檢定

我們想要在顯著水準為α之下檢定底下的假設,

{ H0 θ= θ0 H1 θ> θ0

Tn(θ) = θ − θˆ S(ˆθ)

為我們感興趣的統計量。 傳統的大樣本檢定為找出一個臨界值c使得 P(Tn0) > c) = α,

則根據Tn0)的虛無分配(一般來說是N(0, 1)), c = qn(1 − α)。

(53)

Bootstrap P-values (假設檢定)

單尾檢定

bootstrap檢定的步驟則是先模擬

Tn = θˆ− ˆθ S(ˆθ),

bootstrap分配,其中S(ˆθ)θˆbootstrap標準差。 接下來,找 出bootstrap臨界值qn(1 − α)使得

P(Tn > qn(1 − α)) = α, 且拒絕域為

RR= {拒絕H0, Tn0) > qn(1 − α)}.

(54)

單尾檢定

此外,我們也可以計算bootstrap p-value:

p= 1 B

B b=1

1(Tnb > Tn0)).

亦即,BT

nb,有多少比例的T

nb大於Tn0)

(55)

Bootstrap P-values (假設檢定)

雙尾檢定

我們想要在顯著水準為α之下檢定底下的假設,

{ H0 θ= θ0 H1 θ≠ θ0

Tn= θ − θˆ S(ˆθ)

為我們感興趣的統計量。

(56)

雙尾檢定

如同單尾檢定的例子,我們模擬

Tn = θˆ− ˆθ S(ˆθ). 的bootstrap分配。 接著將∣T

nb∣由小排到大,然找出100⋅ (1 − α)%的分 量函數, qn(1 − α),則拒絕域為

RR ={拒絕H0, 當∣Tn0)∣ > qn(1 − α)}.

而bootstrap p-value為 p = 1

B

B b=1

1(∣Tnb∣ > ∣Tn0)∣).

(57)

迴歸模型的Bootstrap

迴 歸模型的 Bootstrap

考慮以下的迴歸模型,

yt= βxt+ εt (1)

εti.i.d. (0, σ2).

假設我們想要檢定的虛無假設為

H0 ∶ β = β0.

將無母數bootstrap應用在迴歸模型有 「不具效率」 之虞,原因在於,

們所擁有的資訊比過去多:我們多了一個迴歸模型來說明 yx之間的 關係。 因此,對於迴歸模型的bootstrap,建議採用 「殘差

bootstrap」(residual bootstrap),茲將其執行步驟說明如下。

(58)

殘差 Bootstrap

步驟1:估計迴歸模型並得到估計式, ˆβ, ˆσ,以及殘差 εˆ={ˆε1, . . . , ˆεT}。

步驟2:以底下任一模擬方法得到bootstrap殘差(bootstrap residuals), ε={ˆε1, . . . , ˆεT},

1 無母數法:{ˆε1, . . . , ˆεT}重抽(抽出放回),

2 母數法:自分配N(0, ˆσ2)抽出ε

(59)

迴歸模型的Bootstrap

殘差 Bootstrap

步驟3:迴歸模型的解釋變數xbootstrap樣本, xt 可以來自

1 無母數bootstrap,

2 母數bootstrap,

3 直接設定xt = xt.

步驟4:考慮以下兩種模擬方式以得到ybootstrap樣本, yt S1 ∶ yt = ˆβxt + εt

S2 ∶ yt = β0xt + εt

(60)

殘差 Bootstrap

步驟5:考慮以下兩種t檢定量,

T1∶ Tn = βˆ− ˆβ S(ˆθ) T2∶ Tn = βˆ− β0

S(ˆθ)

因此,有四種不同的組合可以用來從事bootstrap檢定: [S1, S2] × [T1, T2].

(61)

迴歸模型的Bootstrap

殘差 Bootstrap

注意到如果解釋變數為前期的被解釋變數,譬如說, yt = βyt−1+ εt,

yt 必須以遞迴的方式(recursively)製造出來。 而起始值y0可以是yt 的均值,或是由yt的實證分配抽出。 一般來說,我們會製造T+ R個 bootstrap樣本,然後丟棄掉前R,以降低起始值的影響。

(62)

殘差 Bootstrap

1 S1× T1的組合符合Hall and Wilson法則(Hall and Wilson rule)。 所謂的Hall and Wilson法則就是在建構任何與bootstrap有關的 樣本,估計式,或是統計量,永遠以參數估計式替代掉真實參數,在我 們的例子中,就是以β (ˆ 參數估計式)替代β0(真實參數)

2 VanGiersbergen and Kiviet(1993)根據AR(1)模型的蒙地卡羅模擬 分析發現,在小樣本時,使用S2× T2的組合勝過S1× T1,不過在大樣 本時兩者沒有差別。 此外,他們建議不要使用S1× T2或是S2× T1 這兩種組合。 簡單地說,在時間序列分析應用bootstrap,文獻上 傾向於建議 「不遵循」Hall and Wilson法則。

(63)

迴歸模型的Bootstrap

殘差 Bootstrap

3 MacKinnon(2002), MacKinnon(2006)建議對於先對殘差做 「重 校」(rescale),

¨εt≡( T T− k)

1/2

ˆεt.

然後bootstrap殘差ε再由ε¨中重抽。 「重校」 的目的在於使得

bootstrap殘差與誤差項ε具有相同的變異數。

4 注意到我們在步驟4中使用了參數的資訊( ˆβ或是β0),即使我們在 步驟2與步驟3中採用的是無母數法,嚴格來說,這樣的殘差 bootstrap應該稱為半母數殘差bootstrap (semi-parametric residual bootstrap)。 不過一般來說,只要步驟2與步驟3中採用的 是無母數法,就會稱做無母數殘差bootstrap

(64)

殘差 Bootstrap

5 至於步驟2與步驟3中採用的是母數法時,無庸置疑地應稱做母數 殘差bootstrap

6 最後要說明的是,在步驟1,我們的殘差是來自 未受限制 的迴歸 模型估計,亦即,我們在估計式(1),並未加入β= β0的限制。 然 而, MacKinnon(2006)說明當xt= yt−1AR(1)係數接近1,如果樣 本數較少,則建議利用加入限制的迴歸模型估計後得到的殘差來做 重複抽樣,不過在樣本大時,使用未受限制殘差或是受限制殘差的結 果相差不大。

(65)

Bootstrapping長期追蹤調查資料

Bootstrapping 長期追蹤調查資料

長期追蹤資料(panel data)係指資料同時具有時間序列(time series)與 橫斷面(cross section)資料的形式,在長期追蹤資料中,個體個別殘差之 間往往具有同期的相關性(cross-sectional dependence of the

contemporaneous residuals)。 文獻中發現,如果我們忽略了這種相關 性,在統計推論上會造成極大的型I誤差機率(substantial size

distortion).

(66)

Bootstrapping 長期追蹤調查資料

Maddala and Wu(1999)建議一種bootstrap的程序,可以保留殘 差之間同期相關性的結構,做為上述問題的解決方法之一。

考慮以下的長期追蹤資料迴歸模型,

yit= αi+ βixit+ εit. 其中i= 1, . . . , N, t = 1, . . . , T.

(67)

Bootstrapping長期追蹤調查資料

Bootstrapping 長期追蹤調查資料

令迴歸殘差為

εˆ1= (ˆε11, ˆε21, . . . , ˆεN1) εˆ2= (ˆε12, ˆε22, . . . , ˆεN2) εˆ3= (ˆε13, ˆε23, . . . , ˆεN3)

εˆT= (ˆε1T, ˆε2T, . . . , ˆεN T)

(68)

Bootstrapping 長期追蹤調查資料

則某一組可能的bootstrap樣本為

ˆε1 = (ˆε17, ˆε27, . . . , ˆεN7) ˆε2 = (ˆε14, ˆε24, . . . , ˆεN4) ˆε3 = (ˆε19, ˆε29, . . . , ˆεN9)

ˆεT = (ˆε13, ˆε23, . . . , ˆεN3)

依此類推, bootstrap樣本將會保留原來殘差之間同期相關性的結構。

(69)

蒙地卡羅模擬與Bootstrap的實例應用

實例 I: AR(1) 係數的 Bootstrap 偏誤修正估計式

在第13.2.1節中提過, OLSAR(1)係數估計具有小樣本向下偏誤(參見 表1)。 在此,利用bootstrap建構偏誤修正的bootstrap估計式

(bias-corrected bootstrap estimator)。 資料生成過程如同第13.2.1節 的應用I,而誤差修正的bootstrap估計式為

ϕ¨= 2 ˆϕ− ˆϕ.

(70)

實例 I: AR(1) 係數的 Bootstrap 偏誤修正估計式

:給定真實參數值ϕ= 0.99時的實證密度函數: ˆϕ (實線)以及ϕ˜(虛線)

0.66 0.72 0.78 0.84 0.90 0.96 1.02 1.08

0 2 4 6 8 10 12

上圖畫出了未修正偏誤的估計式( ˆϕ)以及偏誤修正的估計式( ¨ϕ)的實證 密度函數(empirical density functions),真實參數設定為ϕ= 0.99,注意 到E( ˆϕ) = 0.94而E( ¨ϕ) = 0.98,亦即改善了小樣本向下偏誤。

(71)

蒙地卡羅模擬與Bootstrap的實例應用

VAR 衝 擊反應函數的信賴區間 : (A) 蒙地卡羅法

1 給定Φˆ1, . . . , ˆΦpVAR係數估計式

2

ϕ=

⎡⎢⎢⎢

⎢⎢⎢⎢

⎢⎣

ϕ(1) ϕ(2)

ϕ(k)

⎤⎥⎥⎥

⎥⎥⎥⎥

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶⎥⎦

k2p×1

其中

ϕ(i)=

⎡⎢⎢⎢

⎢⎢⎢⎢

⎢⎣

1的第i) 2的第i)

p的第i)

⎤⎥⎥⎥

⎥⎥⎥⎥

´¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¸¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¶⎥⎦

k p×1

(72)

VAR 衝 擊反應函數的信賴區間 : (A) 蒙地卡羅法

3N( ˆϕ, ˆΣ ⊗ ˆQ−1)分配抽出k2p× 1的向量,其中, Σˆ = 1

TΣˆεtεˆt

εˆt = yt− ˆΦ1yt−1− ⋯ − ˆΦpyt−p

Qˆ = xx T

(73)

蒙地卡羅模擬與Bootstrap的實例應用

VAR 衝 擊反應函數的信賴區間 : (A) 蒙地卡羅法

4 將此向量以ϕ(1)表示

5 利用ϕ(1)建構A(1)

6 利用A(1)計算Ψs(1)(A(1), ˆC)

7 再抽一次得到ϕ(2), A(2)and Ψs(2)

(74)

VAR 衝 擊反應函數的信賴區間 : (A) 蒙地卡羅法

8 重複多次(10000)後得到Ψs(1), Ψs(2),...Ψs(10000)

9s(1), Ψs(2), ...Ψs(10000)]由小排到大,然後挑選第500位及第 9501位的Ψs

10 分別將它們以ΨsL與ΨsU 表示之。 則sL, ΨsU]就稱做衝擊反應函數 95%的蒙地卡羅模擬信賴區間

(75)

蒙地卡羅模擬與Bootstrap的實例應用

VAR 衝 擊反應函數的信賴區間 : (B) Bootstrap 法

1 估計VAR得到係數估計式Φˆ1, ˆΦ2, . . . , ˆΦp以及殘差{ˆε1, ˆε2, . . . , ˆεT}

2 建構bootstrap殘差{ˆε1, ˆε2, . . . , ˆεT}

3 給定起始值{y0, y−1, y−2... y−p+1},建構bootstrap樣本 yt = ˆΦ1yt−1+ ⋯ + ˆΦpyt−p+ εt

4 利用bootstrap樣本估計VAR與建構衝擊反應函數Ψs

(76)

VAR 衝 擊反應函數的信賴區間 : (B) Bootstrap 法

5 重複步驟2到步驟4多次(10000),並得到Ψs∗(1), Ψs∗(2),...,Ψs∗(10000)

6s∗(1), Ψs∗(2), . . . , Ψs∗(10000)]由小排到大,然後挑選第500位及第 9501位的Ψs

7 分別將它們以Ψs∗L與Ψ∗U 表示之。 則s∗L, Ψs∗U]就稱做衝擊反應 函數95%bootstrap信賴區間

(77)

蒙地卡羅模擬與Bootstrap的實例應用

蒙地卡羅法 v.s Bootstrap 法

在定態VAR模型中,蒙地卡羅法與Bootstrap法在大樣本的表現均 佳,然而,它們的小樣本性質令人堪慮。 尤其是VAR係數估計存在小 樣本向下偏誤的問題,導致其信賴區間的建構也出問題。

Kilian(1998)提出一種改善的方法,此方法在第一階段先以

bootstrap修正小樣本偏誤後,再以bootstrap建構信賴區間。

參考文獻

相關文件

[r]

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

我低着頭做算術習題,心裏卻翻騰得厲害,耳朵裏只聽見永瑛洗衣

演講辭格式 稱謂 稱謂:對在場人士的6. 稱呼。要注意稱謂的

[r]

部首位置 在左 在右 在上 在下 在內

(‘Integrating Mental Health Into Primary Care: A Global Perspective’)的