• 沒有找到結果。

相依資料的條件獨立檢定 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "相依資料的條件獨立檢定 - 政大學術集成"

Copied!
52
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系 博士學位論文. 相依資料的條件獨立檢定. 治 A conditional政 independence test for 大 立 dependent data ‧. ‧ 國. 學 er. io. sit. y. Nat. al. n. v i n Ch engchi U 指導教授:黃子銘 博士 研究生:鄭宇翔 撰. 中華民國一百零二年六月.

(2) 謝辭 能夠完成博士的求學生涯,首先感謝家人的全力支持,因為有你們的支持,才能使我無 後顧之憂的完成學業。本論文能夠順利完成,首先感謝我的指導老師黃子銘老師,他總. 政 治 大 才有此篇論文的產生。另外也感謝口試委員陳素雲老師、杜憶萍老師、廖四郎老師及翁 立 是不厭其煩的和我討論研究主題上的相關問題,並給我許多統計專業及寫作上的建議,. ‧ 國. 更完整。. 學. 久幸老師在口試時提出的意見與建議。加入諸位老師的寶貴意見後,方才使論文的內容. ‧. 接著,十分感謝博士班期間教導過我的許多老師,因為老師們認真的教學,使我受 益良多。也感謝研究室一起奮鬥的同學們,因為有你們的陪伴與鼓勵,使我的博士班生. y. Nat. sit. 涯更加順利。最後,感謝許多持續關心我的朋友及老師們,特別感謝銀慶剛老師在此階. n. al. er. io. 段給我的諸多建議及支持。. Ch. engchi. i. i n U. v. 鄭宇翔 謹誌於 政治大學統計學系.

(3) 摘要. 在一個考慮多個變數的問題中,變數間是否為條件獨立常是人們關心的議 題 。Huang[10]曾 提 出 一 個 適 用 於IID資 料 的 條 件 獨 立 檢 定 方 法 , 此 論 文 將 說 明 此. 政 治 大 離散時的條件獨立檢定。本文證實藉由適當修正Huang的檢定統計量,則可解決上述資 立. 統計量亦適用於α-mixing資料的條件獨立檢定問題。另外本論文亦將考慮當條件變數為. 料型態的條件獨立檢定問題,另外文中亦會提供此修正統計量在條件獨立下的收斂性. ‧ 國. 學. 質。最後我們將利用模擬研究及實際資料分析來說明上述方法的表現。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. ii. i n U. v.

(4) Abstract. Testing independence between variables is an important issue in statistics. Hunag[10] proposed a conditional independence test for IID data in 2010. In this thesis work,. 政 治 大 This result has been published and is stated in this. we have shown that Huang’s test statistic can be used for testing conditional inde-. 立. pendence for α-mixing data.. thesis. In this thesis, we also consider the problem of tesing conditional indepen-. ‧ 國. 學. dence using a modified version of Huang’s test statistic when the given variable is. ‧. discrete. We establish the asymptotic property of this statistic under conditional independence. In addition, we conduct simulation studies to investigate the perfor-. y. Nat. n. al. er. io. sit. mance of the proposed tests. Real data applications are also provided.. Ch. engchi. iii. i n U. v.

(5) 目錄. 1 簡介. 1. 政 治 大 獨立性檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 立. 2 文獻探討. 2.2. 條件獨立檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4 8. 學. 3 研究方法. ‧ 國. 2.1. 4. 11. ‧. 非線性條件相關及其近似 . . . . . . . . . . . . . . . . . . . . . . . . . . 11. 3.2. 非線性條件相關的估計及Huang之檢定統計量 . . . . . . . . . . . . . . . 13. 3.3. 相依資料之條件獨立檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . 14. 3.4. Z為離散隨機變數 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17. n. al. er. io. sit. y. Nat. 3.1. 4 模擬研究. Ch. engchi. i n U. v. 22. 4.1. 第一部分模擬研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22. 4.2. 第二部分模擬研究 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26. 5 資料分析. 32. iv.

(6) 6 證明. 35. 6.1. LEMMA 1證明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35. 6.2. THEOREM 2證明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37. 6.3. THEOREM 3證明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. v. i n U. v.

(7) 表目錄. 4.1. 第一部分模擬分析之型一誤差或檢定力結果. . . . . . . . . . . . . . . . . 27. 4.2. 第二部分模擬分析之型一誤差或檢定力結果. . . . . . . . . . . . . . . . . 31. 學 ‧. io. sit. y. Nat. n. al. er. 5.2. ‧ 國. 5.1. 治 政 匯率與進出口物價關係之檢定p值結果 . . . 大 . . . . . . . . . . . . . . . . 立 已知匯率升降時之進出口物價與匯率關係檢定p值結果 . . . . . . . . . . .. Ch. engchi. vi. i n U. v. 33 34.

(8) 1 簡介. 在一個牽涉多個變數的問題中,變數間的相關性常是我們關心的議題,因為若能找出獨 立於其他部分的變數,則不須考慮這些獨立變數對其餘部分的影響,使分析問題較為簡. 政 治 大 力的變數。以下舉例說明,假設我們觀察到X, Y 和Z三個變數,且認為可用X與Z兩變 立. 單。條件獨立檢定可視為已知部分資訊下的獨立性檢定,因此也可以用來找出不具影響. 數來解釋Y 變數,則很自然會以下面的迴歸模型來描述此三變數的關係:. ‧ 國. 學 Y = f (X, Z) + ,. ‧. 其中為均數為0的誤差項。若在給定Z變數的情形下,X和Y 變數是獨立的,則上述模型. n. al. er. io. Y = f ∗ (Z) + ,. sit. y. Nat. 可改寫成. i n U. v. 亦即簡化後的模型只須考慮Y 與Z兩變數的關係,使此問題較為單純。 在上例中,為了. Ch. engchi. 判斷在給定Z下,X和Y 變數是否符合條件獨立,一個常用的方法正是使用條件獨立檢 定。由此可知條件獨立檢定具有變數選取與精簡模型的功能,所以具有應用上的價值。 當(X, Y, Z)的觀察值為IID時,可於文獻中找到一些關於這類資料型態的條件獨 立檢定之研究,如Linton和Gozalo[13]基於廣義經驗分配所得之檢定;Li等[12]所得 的Gridden χ2 檢定及Huang[10]基於最大非線性條件相關(maximal nonlinear conditional correlation)所推演之檢定方法等。上述方法用於檢定IID資料下的條件獨立情況. 1.

(9) 均展現出令人滿意的效果,但若將其直接使用於分析某些經濟財務資料卻未必完全適 用,例如金融商品的價格、股票成交量或失業率等資料。探究上述方法不適用的原因在 於許多經濟財務資料是按照時間發生順序來紀錄搜集,因此時間相近的資料間會存在相 依的特性,自然與前述幾個檢定方法假設資料為IID不符合。 基於上述原因,學者開始關心相依資料之條件相關問題,並建立可用於相依資料 之條件獨立檢定。此外有學者也指出經濟領域常用的Granger相關性檢定其實正是條件 獨立檢定(見Su和White[18][19], Bouezmarni等[2], Florens和Mouchart[8]及Florens和 Fougere[7]),這也是另一個促使學界開始研究相依資料的條件獨立檢定之原因。 目. 政 治 大 含[19]及[18]基於虛無假設和一般情況下條件分配或特徵函數的差距所建立出檢定方法; 立. 前文獻中可找到一些可處理觀察值(X, Y, Z)為相依情形下的條件獨立檢定方法,包. 後續[2]則利用了連結分配(copula density)在條件獨立與相關情形下的差距推導出一個檢. ‧ 國. 學. 定方法。我們將會在本論文的第二章介紹上述方法。. ‧. 本論文將嘗試對[10]所提出的檢定方法進行延伸。[10]利用最大非線性條件相關 來測量兩變數間的條件相關程度,並使用數個最大非線性相關估計量的線性組合建. y. Nat. sit. 構出一個統計量,進而發展出一個可判斷IID資料是否條件獨立的檢定方法。本論. n. al. er. io. 文主要分成兩部分。在第一部分中,我們將[10]在IID資料所得之條件獨立檢定延伸. i n U. v. 至當觀察資料符合α-mixing型態的狀況;第二部分則是討論已知變數為離散的情形. Ch. engchi. 下。我們將證實當已知變數Z為連續時,基於IID資料所得之統計量亦適用於當觀察 值(X, Y, Z)為α-mixing情形,另外若已知變數為離散時,我們將提供適當的統計量。針 對上述兩種情形,本論文均會提供其收斂性質。由於第一部分的內容業已發表於期刊 中(Cheng和Huang[3]),因此第一部分的內容僅提供一些主要結果,而本論文主要是針 對第二部分內容來進行討論。. 2.

(10) 本論文之主要結構如下。第二章將回顧相關性分析中一些檢定方法,其中包含獨立 性檢定與條件獨立檢定。在第三章中將提供Huang的統計量在α-mixing資料下的相關結 果及探討當已知變數為離散時的相關議題。 爲了測試上述兩種延伸之檢定方法的效果, 在本論文的第四章及第五章將提供模擬分析及實際資料分析的結果。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 3. i n U. v.

(11) 2 文獻探討 由第一章內容可知相關性分析的研究中包含了獨立性檢定及條件獨立檢定,為了更清楚 描述相關性分析,在本章中將分別簡述數種已見於文獻的獨立性檢定及條件獨立檢定方. 政 治 大. 法。. 立. 2.1 獨 立 性 檢 定. ‧ 國. 學. 若我們想判斷X與Y 是否為二獨立的變數,可透過收集樣本{(Xi , Yi )}ni=1 並執行虛無假設. ‧. 為. H0 : X⊥Y. y. Nat. io. sit. 的獨立性檢定來得之,其中⊥代表兩變數獨立。以下將針對變數X及Y 具有不同的資料. n. al. er. 型態時簡介三種不同的檢定方法。. i n U. v. 兩變數X = (X1 , . . . , Xp )T 與Y = (Y1 , . . . , Yq )T 是服從多維度常態分布的隨機變數 且對應維度分別為p及q,即. Ch. engchi. (X1 , . . . , Xp , Y1 , . . . , Yq )T ∼ Np+q (µT , Σ), 其中µ為平均數向量且. . .  ΣXX ΣXY  Σ=  ΣY X ΣY Y. 4.

(12) 為共變異數矩陣。若我們關心此二變數間的相關性,但由於X和Y 可能均為多變量 的隨機向量,無法藉由計算X和Y 的Pearson相關係數來測量其相關性的強弱,這時 則可使用Hotelling[9]所提出的典型相關分析(canonical analysis)來進行分析。在典型 相關分析中使用一組係數λ1 , . . . , λr 來描述X與Y 的相關性,其中r = min(p, q)且λ1 ≥ λ2 ≥ · · · ≥ λr . 上 述λ1 , . . . , λr 稱 為 典 型 相 關 係 數 , 其 定 義 如 下 。 給 定 向 量a及b, 令X ∗ = aT X及Y ∗ = bT Y ,考慮以下最大化問題: max Cov(X ∗ , Y ∗ ) a,b. s.t. V ar(X ∗ ) = 1 且 V ar(Y ∗ ) = 1.. 政 治 大 若上述問題a與b之解分別為a 及b 時,令 X = a X及Y 立 1. ∗ 1. 1. ∗ 1. T 1. = bT1 Y ,即可得典型相關. ‧ 國. 學. 係數λ1 = Cov(X1∗ , Y1∗ ). 接著可依序求得典型相關係數λ2 , . . . , λr ,其詳細過程如下。 當i = 2, . . . , r時,典型相關係數λi = Cov(Xi∗ , Yi∗ ),其中Xi∗ = aTi X及Yi∗ = bTi Y ,. ‧. 而ai 與bi 則透過以下最大化問題求得:. y. n. al. sit. io. s.t. V ar(X ∗ ) = 1 且 V ar(Y ∗ ) = 1,. er. a,b. Nat. max Cov(X ∗ , Y ∗ ). i n U. v. Cov(X ∗ , Xj∗ ) = 0 且 Cov(Y ∗ , Yj∗ ) = 0 其中 j = 1, . . . , i − 1.. Ch. engchi. 上述典型相關係數λ1 , . . . , λr 之值大小即反應了變數X與Y 的相關性強弱。基於上述方 法,在一個判斷變數X與Y 是否獨立的問題中,等價於考慮一個虛無假設為 H0 : λ1 = λ2 = · · · = λr = 0 ˆ 2 )來進行檢定,其中λ ˆ 1 ,. . .,λ ˆ r 為樣本典型 ˆ = Πri=1 (1 − λ 的檢定。此問題可利用統計量Λ i ˆ 相關係數。Kshirsagar[11]提到上述Λ為Wilks的Λ統計量[20],同時亦提到當虛無假設成. 5.

(13) 立下 ˆ ∼ χ2 , Tn = −(n − 1 − (p + q + 1)/2) log Λ pq 其中χ2pq 為自由度為pq的卡方分布。 當變數X與Y 均為離散型隨機變數時,我們常會使用Pearson卡方獨立性檢定來檢 定此二變數是否獨立,在此簡述此檢定方法如下。若x1 , . . . , xp 及y1 , . . . , yq 分別是變 數X及Y 可能的出現值,且定義nij 為X出現值為xi 且Y 出現yj 的樣本次數,即 nij =. n X. I(Xk = xi , Yk = yj ), i = 1, . . . , p 且 j = 1, . . . , q.. k=1. 政 治 大 立r = n 其中 i = 1, . . . , p. 令. q X. i. ij. cj =. p X. 學. 且. ‧ 國. j=1. nij 其中 j = 1, . . . , q.. ‧. i=1. Nat. y. 為了判斷變數X與Y 是否獨立,卡方獨立性檢定考慮以下虛無假設:. n. er. io. al. 其Pearson卡方檢定統計量為. sit. H0 : X⊥Y,. C h X X (e − nU) n i T =en gchi , e p. q. ij. 2 n. ij. v. 2. ij. i=1 j=1. 其中 eij =. ri cj . n. 上述檢定統計量可見Pearson[16]。當虛無假設成立下,Tn2 趨近一自由度(p − 1)(q − 1)的 卡方分布(可見Fienberg[6])。. 6.

(14) 上述典型相關分析或Pearson相關係數所考慮的相關性是兩變數間的線性相關程度, 接下來的方法則考慮了變數間的一般相關性。若X與Y 為兩個具有連續分布的隨機變 數,Dauxois和Nkiet[4]提出非線性典型相關係數(nonlinear canonical coefficient)來測 量此二隨機變數的相關性,在此首先介紹非線性典型相關係數的概念。非線性典型相關 係數的定義為  ρi = E fi (X)gi (Y ) , i = 0, 1, . . . , 其中fi 和gi 可利用以下步驟依序來求得。 首先,令f0 和g0 為以下最大化問題之解:  max E f (X)g(Y ). 政 治 大 s.t. E f (X) = 1 且 E g (Y ) = 1. 立. f,g. 2. 2. ‧ 國. 學.  由 柯 西 不 等 式 可 知 , 當f = g = 1時 上 述 期 望 值E f (X)g(Y ) 可 得 最 大 值1, 亦 即f0 = 1 = g0 且ρ0 = 1. 當i ≥ 1時, (fi , gi )則為下述最大化問題(f, g)的解:. ‧.  max E f (X)g(Y ) f,g. y. Nat. n. al. Ch. er. io.   E f (X) = 0, E g(Y ) = 0,. sit.   s.t. E f 2 (X) = 1, E g 2 (Y ) = 1,. i n U. v.   E f (X)fj (X) = 0, E g(Y )gj (Y ) = 0,. engchi. 當 j = 0, . . . , i − 1.. 由於ρ0 = 1並未提供兩變數間相關性的任何訊息,因此我們只關心ρ1 , ρ2 , . . .之值的 大小,而其值大小即反應了變數間相關性的強弱。 [4]提出可將ρ = (ρ1 , ρ2 , . . .)組合 成r(ρ)作為相關性度量,其中函數r滿足 r(ρ) = 0 ⇔ ρ1 = ρ2 = · · · = 0. 7.

(15) 且 若 對 所 有 的i, 若0 ≤ ρi ≤ ρ∗i , 則 r(ρ1 , ρ2 , . . .) ≤ r(ρ∗1 , ρ∗2 , . . .). [4]進 一 步 提 出 基 於r(ˆ ρ)的獨立性檢定,其中ˆ ρ為ρ的估計量。. 2.2 條 件 獨 立 檢 定 在已知變數Z之下,若考慮變數X與Y 是否獨立,即為一個具有以下虛無假設的條件獨立 檢定: H0 : X⊥Y |Z, 其中⊥代表兩變數獨立。 在實際資料分析中,為了確定變數X與Y 是否具有條件獨立的. 政 治 大 章可知,有的檢定方法僅可用IID資料,但有的已考慮觀察資料為相依的情形。在本節將 立. 特性,我們會收集樣本資料{(Xi , Yi , Zi )}ni=1 並配合適當的檢定方法來進行檢定。由第一. ‧ 國. 學. 分別簡述幾種適用於IID及相依資料的條件獨立檢定方法。. 一個和條件相關有關的度量是偏相關係數(partial correlation coefficient),而偏相. ρXY.Z = Corr(X − aZ, Y − bZ),. sit. y. Nat. io. n. al. i n U. Cov(X − aZ, Z) = 0. Ch. engchi. er. 其中Corr(X1 , X2 )代表X1 與X2 的相關係數,而a與b滿足. 及. ‧. 關係數定義為. v. Cov(Y − bZ, Z) = 0. 由上述定義可知,偏相關係數ρXY.Z 是用來測量X及Y 去除Z的影響後的線性相關程度。 若(X, Y, Z)服從常態分配,則檢定以下虛無假設: H0 : ρXY.Z = 0,. 8. (2.1).

(16) 實 際 上 正 是 檢 定 已 知Z之 下 ,X和Y 是 否 為 條 件 獨 立 。 針 對(2.1)的 檢 定 問 題 , 若 定 義ˆ ρXY.Z 是ρXY.Z 的樣本估計量(sample partial correlation),則在虛無假設成立下, √ ρˆXY.Z n − 3 p 1 − ρˆ2XY.Z 趨近於一自由度為n − 3的t分配。以上結果可見Banks等[5]。 [19]提 出 一 個 資 料 型 態 為β-mixing下 的 條 件 獨 立 檢 定 方 法 。 此 方 法 的 主 要 概 念是基於在條件獨立下X|(Y, Z)與X|Z應該有相同分配,亦即fX,Z (x, z)fY,Z (y, z)與 fX,Y,Z (x, y, z)fZ (z)應 該 是 相 同 的 , 其 中fX,Z , fY,Z 及 fX,Y,Z 分 別 為(X, Z), (Y, Z)及. 政 治 大. (X, Y, Z)的聯合機率密度函數。利用Hellinger距離的概念,其考慮一個條件相關度量 s !2 Z fX,Z (x, z)fY,Z (y, z) w(x, y, z)dF (x, y, z), Γ= 1− fX,Y,Z (x, y, z)fZ (z). 立. ‧ 國. 學. 其中F 為(X, Y, Z)的聯合累積分配函數,而w則為一非負之權重函數。當條件獨立成立. ‧. ˆ 時,條件相關度量Γ = 0. 若使用經驗累積分配函數及核估計來估計Γ, 則可得到估計量Γ, ˆ 此二學者證明在虛無假設成立時Γ趨近於一常態分配。另外,[18]也提出另一個條件獨立. y. Nat. sit. 檢定方法。不同於前述方法,此方法是利用條件獨立與一般情形下的條件特徵函數的差. n. al. er. io. 異來建構一統計量,亦即利用φX|(Y,Z) 與φX|Z 的差異來建構相關性度量,其中φ代表特徵 函數。. Ch. engchi. i n U. v. [2]提 出 一 可 處 理 資 料 型 態 為β-mixing的 條 件 獨 立 檢 定 , 其 方 法 是 基 於copula density在條件獨立與一般狀況的差異,在此敘述其概念如下。令cX,Y,Z 為(X, Y, Z)的 copula density, 則  fX,Y,Z (x, y, z) = fX (x)fY (y)fZ (z)cX,Y,Z FX (x), FY (y), FZ (z) , 其中fX , fY 及fZ 為變數X, Y 及Y 的機率密度函數,而FX , FY 及FZ 為其對應的累積分配. 9.

(17) 函數。令cX,Z 及cY,Z 分別為(X, Z)及(Y, Z)的copula density, 在條件獨立成立時,因為    cX,Y,Z FX (x), FY (y), FZ (z) = cX,Z FX (x), FZ (z) cY,Z FY (y), FZ (z) , 所以此三位學者基於上式提出了條件相關性度量 s !2 Z cX,Z (x, z)cY,Z (y, z) 1− H= dC(x, y, z), cX,Y,Z (x, y, z) 其中C為(X, Y, Z)的copula函數。接著作者使用經驗累積分配函數(empirical cumulative distribution function)、經驗copula及Bernstein density copula來估計H得到估計 ˆ 同時並證實在條件獨立的情形下,H趨近於一常態分配。 ˆ 量H,. 治 政 大 後續[10]使用最大非線性條件相關來測量兩隨機變數間的條件相關程度,同時於其研 立 究中亦提供一檢定統計量來進行條件相關的檢定,此部分的內容將於本研究第三章中被 ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 詳細討論。. Ch. engchi. 10. i n U. v.

(18) 3 研究方法 若有三變數X, Y 及Z之下,本研究考慮虛無假設為 H0 : X⊥Y |Z. 政 治 大. 的條件獨立檢定。前章中已敘述一些有關的研究,其中又依處理IID資料或mixing型. 立. 態 資 料 可 分 成 兩 大 類 。 本 論 文 將 延 伸[10]在IID資 料 下 提 出 的 條 件 檢 定 方 法 至 資 料. ‧ 國. 學. 為α-mixing情況及當Z為離散變數的情形。因此本章首先介紹[10]所提的最大非線性條 件相關的概念及其估計,並提供其於IID樣本下所提出的檢定統計量。接著將敘述當. ‧. 資料為α-mixing情況下,Huang的檢定統計量之對應收斂結果,此部分更詳細的討論. Nat. sit. y. 可見[3]。最後本研究將考慮條件變數為離散情形時的條件獨立檢定問題。我們將修. al. n. 收斂結果。. er. io. 改Huang的檢定統計量使其適用於變數Z為離散的狀況,本章將描述此統計量的形式及. Ch. 3.1 非 線 性 條 件 相 關 及 其 近 似e n g c h i. i n U. v. 在考慮給定Z之下,為了測量X與Y 變數之間的相關性,[10]延伸[4]所提出之非線性典型 相關係數而發展出最大非線性條件相關,藉由最大非線性條件相關,可測量兩變數間的 條件相關程度。 首先將最大非線性條件相關ρ1 (X, Y |Z)之定義陳述於下:  ρ1 (X, Y |Z) = sup E f (X, Z)g(Y, Z)|Z , f,g∈S0. 11. (3.1).

(19) 其中S0 為滿足條件  E f 2 (X, Z)|Z = I. . {E f 2 (X,Z)|Z >0}.  E g 2 (Y, Z)|Z = I. . {E g 2 (Y,Z)|Z >0}. ,. ,. 及   E f (X, Z)|Z = E g(Y, Z)|Z = 0 下之(f, g)之集合。 為了近似及求解的需要,[10]將最大化問題(3.1)中的(f, g)之求解空 間由S0 轉換成S0,p,q 集合,此S0,p,q 收集S0 集合中的(f, g),其中f 可用{φp,i : 1 ≤ i ≤ p}生. 政 治 大. 成,而g可用{ϕq,j : 1 ≤ j ≤ q}生成,當中之p及q為基底函數個數。若基底函數符合一. 立. 學. ‧ 國. 些假設條件,則可將(3.1)式的問題換成求解.  ρp,q (Z) = max E f (X, Z)g(Y, Z)|Z . f,g∈S0,p,q. (3.2). ‧. 上述的假設條件包含基底函數可生成常數函數及基底函數具備一些近似性. al. n. max a,b. s.t.. er. io. sit. y. Nat. 質 , 其 敘 述 可 見 本 文 第3.3節 中 之 條 件(S0). 接 著 其 考 慮 求 解(3.2)式 , 若ρp,q (Z) =  E f1 (X, Z)g1 (Y, Z)|Z ,則f1 (X, Z)及g1 (Y, Z)可由以下最大化問題求得之: aT Σφ,ψ,p,q (Z)b. v i n CahΣ (Z)a = 1 = bUΣ (Z)b. engchi T. T. φ,p. (3.3). ψ,q. 其中 . . . Σφ,p (Z) = E φp,i (X)φp,j (X)|Z − E φp,i (X)|Z E φp,j (X)|Z. . , p×p.     Σψ,q (Z) = E ψq,i (Y )ψq,j (Y )|Z − E ψq,i (Y )|Z E ψq,j (Y )|Z , q×q     Σφ,ψ,p,q (Z) = E φp,i (X)ψq,j (Y )|Z − E φp,i (X)|Z E ψq,j (Y )|Z . p×q. 12.

(20) 於求得a與b後,令 p X. f1 (X, Z) =.   a1,j (Z) φp,j (X) − E φp,j (X)|Z. j=1. 及 g1 (Y, Z) =. q X.   b1,k (Z) ψq,k (X) − E ψq,k (Y )|Z ,. k=1.  則可得ρp,q (Z) = E f1 (X, Z)g1 (Y, Z)|Z . [10]亦證明當p, q足夠大時,ρp,q (Z)是ρ1 (X, Y |Z) 的一個良好近似量。. 3.2 非 線 性 條 件 相 關 的 估 計 及 Huang之 之檢 定 統 計 量. 政 治 大. 在 上 節 的 內 容 中 , 我 們 已 敘 述 了ρp,q (Z)的 定 義 , 在 此 將 接 著 討 論ρp,q (z)的 估 計. 立. 量ˆ ρp,q (z), 其 中z是Z中 的 特 定 點 , 又Z為Z變 數 之 範 圍 。 而Huang的 檢 定 統 計 量. ‧ 國. 學. 也 正 是 由 幾 個ˆ ρp,q (z)的 加 權 加 總 而 來 。 由3.1節 的 介 紹 可 知 ,ρp,q (z)可 由Σφ,p (z), Σψ,q (z)及Σφ,ψ,p,q (z)決 定 , 若 估 計Σφ,p (z), Σψ,q (z)及Σφ,ψ,p,q (z) 中 之 每 一 個 條 件 期 望. ‧. ˆ φ,p (z), Σ ˆ ψ,q (z)及Σ ˆ φ,ψ,p,q (z), 並進一步可得對應的ρp,q (z)之估計量ˆ 值,則可得Σ ρp,q (z).. Nat. sit Pn. n. al. er. io. 亦即使用. y. 在[10]的研究中,其使用核估計(kernel estimator)來估計上述三矩陣中的每一個元素,  g(X , Y )k (Z − z)/h t t 0 t t=1  Pn t=1 k0 (Zt − z)/h. Ch. engchi U. v ni. (3.4).  來估計E g(X, Y )|Z = z ,其中k0 為核函數(kernel function)而h為bandwidth. 在分別 得到上述三矩陣之估計後,進一步得到ˆ ρp,q (z). 當p, q為固定時,我們也使用ˆ ρ(z)來表 示ˆ ρp,q (z). 當資料(X, Y, Z)為IID時,[10]提出用來檢定虛無假設H0 : ρ1 (X, Y |Z) = 0之檢定統 計量為 d. nh cK. nZ X. fˆZ (zk )ˆ ρ2p,q (zk ),. k=1. 13.

(21) 其中d為Z之維度,z1 , . . ., znZ 是Z中的特定計算點,而 Z cK = 1/. k02 (s)ds,. 且 n  1 X ˆ fZ (·) = k0 (Zt − ·)/h d nh t=1. (3.5). 為fZ (·):Z之機率密度函數之核估計。當n趨近於無窮大時,這邊的p, q趨近於無窮大。 由上式可以發現,此統計量是由數個特定計算點所得的ˆ ρ2p,q (z1 ), . . . , ρˆ2p,q (znZ )加權平均而 來,而對應的權重則是和計算點發生的機率有關。另外其並證明此檢定統計量收斂至一 個特定分配。. 立. 政 治 大. 3.3 相 依 資 料 之 條 件 獨 立 檢 定. ‧ 國. 學. 上述統計量是考慮當觀察資料為IID時所提出的,在此我們將Huang的檢定方法延伸至資. ‧. 料具有α-mixing的情形。在給定適當條件下,可以發現Huang的檢定統計量是適用於檢 定α-mixing資料的條件獨立狀況,同時在此亦提供統計量在此資料型態下之收斂性質。. y. Nat. sit. 此部分之更詳細論述及證明可見[3]。. n. al. er. io. 在定義一過程{Mt }是符合α-mixing前,我們先定義α-mixing係數如下: 若{Mt }為. i n U. v. 一個平穩過程,且Fab 代表由{Mt : a ≤ t ≤ b}所生成之σ體,則{Mt }之s期α-mixing係 數α(s)定義為. Ch. engchi. . t ∞ sup |P (A ∩ B) − P (A)P (B)| : −∞ < t < ∞, A ∈ F−∞ , B ∈ Ft+s . 若當s趨近於無窮大時,α(s)趨近於0,則稱{Mt }為一符合α-mixing的過程。 當資料(Xt , Yt , Zt )為α-mixing的情形時,為了使Huang之統計量適用於此種資料型 態的條件獨立檢定,[3]給定了以下(S0)–(S6)七個假設,其中除了(S1)以外,其餘條件. 14.

(22) 在[10]的假設條件成立時均成立。在此將[3]中之假設條件(S0)–(S6)的詳細內容引述於 下。 (S0) 基底函數φp,1 , . . . , φp,p 和ψq,1 , . . . , ψq,q 有界,同時存在基底函數θr,1 , . . . , θr,r ,使得 對所有平方可積的α(X, Z)及β(Y, Z)函數,下面兩式成立: !2 X. α(X, Z) −. lim inf E. p,r→∞ a(i,k). a(i, k)φp,i (X)θr,k (Z). = 0,. 1≤i≤p,1≤k≤r. !2 X. β(Y, Z) −. lim inf E. q,r→∞ b(j,k). b(j, k)ψq,j (Y )θr,k (Z). = 0.. 1≤j≤q,1≤k≤r. 政 治 大. (S1) 令d1 , d2 及d分別為Xt , Yt 及Zt 的維度,且{(Xt , Yt , Zt ) ∈ Rd1 +d2 +d , t ≥ 0}是一個. 立. α-mixing的平穩過程,其α-mixing係數α(τ ) = O(τ −(1+) ),其中 > max(1, d/2).. ‧ 國. 學. (S2) 令X , Y及Z分 別 為 變 數X、Y 及Z的 範 圍 , 又Z 0 為Z的 內 點 所 形 成 之 開 子 集. ‧. 合 。 給 定Z = z時 , 在 測 度µ之 下 ,(X, Y )的 條 件 密 度 函 數f (x, y|z)存 在 。 另 外f (x, y|z)和 fZ (z)對z二次可微分。. y. Nat. io. sit. (S3) 存在一個定義於X × Y之函數h(x, y)使得. n. al. er.

(23)

(24)

(25) 

(26) 

(27) ∂2

(28)

(29)

(30) ∂ f (x, y|z)

(31)

(32) , max

(33)

(34) f (x, y|z)

(35)

(36) ≤ h(x, y), sup max |f (x, y|z)|, max

(37)

(38) 1≤i,j≤d ∂zi ∂zj 1≤i≤d ∂zi z∈Z 0. Ch. 且 h(x, y)dµ(x, y) < ∞. R. engchi. i n U. v. (S4) 存在常數c0 和c1 使得

(39)

(40)

(41)

(42)  

(43)

(44)

(45) ∂2

(46)

(47)

(48)

(49) sup max |fZ (z)|, max

(50) fZ (z)

(51) , max

(52) fZ (z)

(53)

(54) ≤ c0 1≤i≤d ∂zi 1≤i,j≤d ∂zi ∂zj z∈Z 0 且supz∈Z 0. 1 fZ (z). ≤ c1 .. 15.

(55) (S5) 令k ∗ 是 定 義 於R1 上 之 核 函 數 , 其 中k ∗ ≥ 0, supv k ∗ (v) < ∞, R ∗ R R vk (v)dv = 0, v(k ∗ (v))2 dv = 0及 v 2 k ∗ (v)dv < ∞. 又. R. k ∗ (v)dv = 1,. k0 (v1 , v2 , . . . , vd ) = k ∗ (v1 )k ∗ (v2 ) · · · k ∗ (vd ) 是Rd 上的核函數。 (S6) 當 n → ∞時,bandwidth h → 0, nhd → ∞, 且nhd+4 → 0. 在上述假設條件中,條件(S0)為基底函數的近似性質要求,(S1)為α-mixing係數的限 制,而(S2)–(S4)為關於(X, Y )|Z = z的條件密度函數及Z的密度函數之限制。另外,條. 政 治 大 在 以 上 的 假 設 成 立立 時 ,[3]中 的THEOREM 1提 供 了ˆ ρ具 有 一 致 性 的 結 果 ,. 件(S5)及(S6)為核函數及其bandwidth的限制條件。. ‧ 國. 學. 而THEOREM 2中 則 提 供 了 條 件 獨 立 成 立 時 檢 定 統 計 量 的 分 布 , 我 們 將 此 二 結 果 整理於下述之THEOREM 1中。. ‧. THEOREM 1. 假 設 條 件 (S0)–(S6)成 成 立 且 基 底 函 數 φ 1 , . . . , φ p 及 ψ1 , . . . , ψ q 均 為 線 性. er. io. sit. y. Nat. 獨立。令 z1 , . . ., zk 是 Z 0 中 之 k個 個計 算 點 , 則 下 兩 式 成 立 :   k X 2 1 2 2 4 ρˆ (zi ) − ρp,q (zi ) = Op +h d nh i=1. al. n. 及 k X. C hX efn(zg)ρc h(zi) fˆ (z )ˆ ρ (z ) − k. Z. i=1. i. 2. i. Z. i. 2 p,q. i. i ! n U. v. 2. = Op. i=1. .  1 4 +h . nhd. 若已知Z之 之下 , X和 和Y 是 條 件 獨 立 的 , 則 當 n趨 趨近 於 無 窮 大 時 , k k X nhd X ˆ D 2 fZ (zi )ˆ ρ (zi ) → λi , σ1d i=1 i=1. 其 中 σ1 =. R. 2 k ∗ (v) dv而 而λ1 , . . . , λk 和 CC T 矩 陣 之 最 大 特 徵 根 有 相 同 分 配 且 彼 此 獨. 立,又C是 是一 個 維 度 為 (p − 1) × (q − 1)且 且每 個 元 素 均 為 IID的 的N (0, 1)變 變數 之 矩 陣 。. 16.

(56) 由上述結果可知,當考慮虛無假設H0 : ρ1 (X, Y |Z) = 0且顯著水準為α之檢定問題 時,我們拒絕H0 當下式成立: k nhd X ˆ ∗ fZ (zi )ˆ ρ2 (zi ) ≥ F1−α , σ1d i=1. 其中F ∗ 是. Pk. i=1. (3.6). ∗ λi 的累積分配函數且F1−α 為F ∗ 之(1 − α)分位點。. 3.4 Z為 為離 散 隨 機 變 數 在之前的內容中,均在變數Z為連續隨機變數的假設下進行討論,接下來我們將進一步 討論若Z為離散隨機變數時,如何修正Huang的統計量來處理條件獨立檢定問題。在此. 政 治 大. 將之前的討論過程修改如下。令z1 , . . . , zk 為變數Z之可能出現值且p(·) ≡ P (Z = ·)為隨. 立. 機變數Z的機率質量函數,則前述之(3.5)及(3.4)將調整為. Nat. g(X , Y )I(Zt = t=1 Pn t t t=1 I(Zt = z). z). ,. (3.7). (3.8). y. Pn. ‧. ‧ 國. 1X I(Zt = ·) n t=1. 學. 及. n. pˆ(·) =. io. sit. 亦即使用(3.7)及(3.8)來估計p(·)及(3.3)中矩陣每一個元素:E(g(X, Y )|Z = z),其中I為. al. er. 指標函數。以下LEMMA 1將討論(3.8)的聯合近似分配,而其證明請見第五章。. n. v i n LEMMA 1. 假 設 (X , Y , Z ), 是平 穩 的 α-mixing過 過程 且 其 α-mixing係 係 C(Xh , Y , Z ), . . .是 engchi U 1. 1. 1. 2. 2. 2. 數α(τ ) = O(τ −5 ), , 其 中 Z1 取 值 於 Z = {z1 , . . . , zk }, 且 p(·)為 為其機率質量函數。假. 設g1 , . . . , gm 為 m個 個定 義 於 X × Y上 上的 有 界 函 數 , 且 Pn Pn gj (Xt , Yt )I(Zt = zi ) gj (Xt , Yt )I(Zt = zi ) t=1P gˆj (zi ) = = t=1 n nˆ p(zi ) t=1 I(Zt = zi ) 為E(gj (X, Y )|Z = zi )的 的估 計 量 , 其 中 I為 為指 標 函 數 。 定 義 uj,t = gj (Xt , Yt ) − E(gj (X, Y )|Z = Zt ),. 17.

(57) σj2 (zi ) = cjj (zi ) = E(u2j,1 |Z1 = zi ) 及 j < j ∗.. cjj ∗ (zi ) = E(uj,1 uj ∗ ,1 |Z1 = zi ), 令 Dj,n (zi ) =.  √  n gˆj (zi ) − E gj (X, Y )|Z = zi. 及 Dn = (D1,n (z1 ), . . . , Dm,n (z1 ), D1,n (z2 ), . . . , Dm,n (z2 ), . . . , D1,n (zk ), . . . , Dm,n (zk ))T .. 政 治 大. (1) 在 上 述 條 件 下 , 則. 立. D. Dn → Z ∗ = (Z1,1 , . . . , Zm,1 , . . . , Z1,k , . . . , Zm,k )T ,. ‧ 國. µ = (0, . . . , 0)T. .. mk×mk. er. io. sit. Nat. h i Σ = Cov(Zj,i , Zj ∗ ,i∗ ). y. ‧. 而. 學. 其 中 Z ∗ 為 一 有 均 數 向 量 µ及 及共 變 異 數 矩 陣 Σ之 之多 維 度 常 態 分 配 , 當 中. 上 述 之 Cov(Zj,i , Zj ∗ ,i∗ ) 分 成 以 下 幾 種 狀 況 , 分 別 敘 述 如 下 :. n. al. Ch. i n U. v. (a)當 當i = i , j = j 時 , Cov(Zj,i , Zj ∗ ,i∗ )為 為  ∞   X 2 2 σj (zi )p(zi ) + 2 E uj,1 uj,1+k I(Z1 = zi )I(Z1+k = zi ) / p(zi ) ; ∗. ∗. engchi. k=1. (b)當 當i = i , j 6= j 時 , Cov(Zj,i , Zj ∗ ,i∗ )為 為  ∞  X cjj ∗ (zi )p(zi )+ E uj,1 uj ∗ ,1+k I(Z1 = zi )I(Z1+k = zi ) ∗. ∗. k=1. +uj ∗ ,1 uj,1+k I(Z1 = zi )I(Z1+k. 18.  2 = zi ) / p(zi ) ;.

(58) (c)當 當i 6= i∗ , j = j ∗ 時 , Cov(Zj,i , Zj ∗ ,i∗ )為 為  ∞  X E uj,1 uj,1+k I(Z1 = zi )I(Z1+k = zi∗ ) k=1. + I(Z1 = zi∗ )I(Z1+k.    = zi ) / p(zi )p(zi∗ ) ;. (d)當 當i 6= i∗ , j 6= j ∗ 時 , Cov(Zj,i , Zj ∗ ,i∗ )為 為 ∞  X E uj,1 uj ∗ ,1+k I(Z1 = zi )I(Z1+k = zi∗ ) k=1.    + uj ∗ ,1 uj,1+k I(Z1 = zi∗ )I(Z1+k = zi ) / p(zi )p(zi∗ ) .. 治 政 (2) 若 (X , Y , Z ), . . . , (X , Y , Z )為 為獨 立 且 同 分 配大 的隨機變數, 則 立 1. 1. 1. n. n. n. D. ‧ 國. 學. Dn → Z ∗ = (Z1,1 , . . . , Zm,1 , . . . , Z1,k , . . . , Zm,k )T ,. 其 中 Z ∗ 為 一 有 均 數 向 量 µ及 及 共 變 異 數 矩 陣 Σ∗ 之 多 維 度 常 態 分 配 , 當 中. ‧. n. al. h i Σ∗ = Cov(Zj,i , Zj ∗ ,i∗ ). Ch. 上 述 之 Cov(Zj,i , Zj ∗ ,i∗ )為 為. engchi U. Cov(Zj,i , Zj ∗ ,i∗ ) =. er. io. sit. y. Nat. 而. µ = (0, . . . , 0)T. v ni. .. mk×mk.    σj2 (zi )/p(zi ) 若 i = i∗ , j = j ∗ ;        cjj ∗ (zi )/p(zi ) 若 i = i∗ , j 6= j ∗ ; 若 i 6= i∗ , j = j ∗ ;.   0        0. 若 i 6= i∗ , j 6= j ∗ .. 19.

(59) 對照於[3]的研究,其文中之LEMMA 1也考慮E(gj (X, Y )|Z = z)的估計之分配收 斂性質,但其假設Z為連續型變數,因此對每一個E(gj (X, Y )|Z = z)使用了核估計作 為估計量。在[3]的假設中,(S2)–(S4)保證E(gj (X, Y )|Z = z)是z的平滑函數,因此加 上(S5)及(S6)的限制時,可推導出E(gj (X, Y )|Z = z)的核估計之分配收斂性質。至於本 文的LEMMA 1假設Z為離散型變數,因此不需要(S2)–(S6)的假設條件。 接 下 來 的 定 理 是 考 慮ˆ ρ2 (z)的 收 斂 性 質 。 在 敘 述 定 理 前 , 我 們 先 回 顧 此 估 計 量 的 求 法 。 令{φl (X): 1 ≤ l ≤ p} 及 {ψm∗ (Y ): 1 ≤ m∗ ≤ q}為 事 先 選 取 之 基 底 函 數,當z ∈ {z1 , . . . , zk }時,取上述g1 (X, Y ), . . . , gm (X, Y )為{φl (X)φl0 (X) : 1 ≤ l, l0 ≤. 政 治 大 函數。接著利用(3.8)得到估計後再依(3.3)則可得ˆ ρ (z). 立. p}、{ψm∗ (Y )ψm0 (Y ) : 1 ≤ m∗ , m0 ≤ q}及{φl (X)ψm∗ (Y ): 1 ≤ l ≤ p, 1 ≤ m∗ ≤ q}等 2. 在Z為連續變數時,[10]及[3]要求基底函數符合條件(S0),但當Z為離散變數且取值. ‧ 國. 學. 於{z1 , . . . , zk }時,(S0)可化簡為以下(S0*)條件。. ‧. (S0*) 基底函數φp,1 , . . . , φp,p 和ψq,1 , . . . , ψq,q 有界,同時對所有平方可積的α(X)及β(Y ),. sit.  2 a(i)φp,i (X) |Z = z = 0, z = z1 , . . . , zk ;. 1≤i≤p. n. al. X. er. α(X) −. io. lim inf E. p→∞ a(i). . y. Nat. 下述兩式成立:. lim inf E. q→∞ b(j). . Ch. β(Y ) −. X. i n U. v.  2 b(j)ψq,j (Y ) |Z = z = 0, z = z1 , . . . , zk .. engchi. 1≤j≤q. 下面定理將提供有關於ˆ ρ2 (z)的描述。 THEOREM 2. 假 設 (X1 , Y1 , Z1 ), (X2 , Y2 , Z2 ), . . .是 是平 穩 的 α-mixing過 過程 , 且 此 過 程 的α-mixing係 係數 α(τ ) = O(τ −5 ). 若 條 件 (S0*)成 成立 , 則 以 下 性 質 成 立 : (1). Pk. i=1. 2 ρˆ2 (zi ) − ρ2p,q (zi ) = Op. 1 n. . ;. 20.

(60) (2). P. k i=1. pˆ(zi )ˆ ρ2 (zi ) −. Pk. 2 i=1 p(zi )ρp,q (zi ). 2. = Op. 1 n. . .. 另外若(X1 , Y1 , Z1 ), . . . , (Xn , Yn , Zn )為 為IID的 的隨 機 變 數 , 此 二 結 果 亦 成 立 。 若已知變數Z之下,X和Y 是條件獨立的變數。我們將考慮此情況下. Pk. i=1. pˆ(zi )ˆ ρ2 (zi )的. 收斂性質,並將其結果陳述於下面定理。另外其證明可見第五章。 THEOREM 3. 假 設 條 件 (S0*)成 成立 且 (X1 , Y1 , Z1 ), . . . , (Xn , Yn , Zn )為 為IID. 令 C是 是一 個 維 度 為 (p − 1) × (q − 1)的 的矩 陣 , 其 中 所 有 元 素 為 IID的 的N (0, 1)變 變數 。 若 在 已 知 Z之 之 下,X和 和Y 是 條 件 獨 立 的 , 則 以 下 收 斂 結 果 成 立 :. 立. n. 治X 政 pˆ(z )ˆ ρ (z ) → 大 λ,. k X. k. i. 2. D. i. i=1. i. i=1. ‧ 國. 學. 其中λ1 , . . . , λk 彼 此 獨 立 並 和 CC T 之 最 大 特 徵 根 有 相 同 分 配 。. 基於THEOREM 3的結果,我們考慮一虛無假設為下的條件獨立檢定:. ‧. H0 : X⊥Y |Z,. y. Nat. sit. n. al. er. io. P ∗ ρ2 (zi ) ≥ F1−α , 則我們拒絕虛無假設,其 在 顯 著 水 準 為α下 , 若 發 現n ki=1 pˆ(zi )ˆ P ∗ 是 ki=1 λi 分配的(1 − α)分位點。 中F1−α P ρ2 (zi ) 當(Xt , Yt , Zt )為α-mixing時,若已知Z之下X和Y 是條件獨立,則n ki=1 pˆ(zi )ˆ. Ch. engchi. i n U. 仍會分配收斂至一極限分配,但此分配形式較為複雜。. 21. v.

(61) 4 模擬研究 爲了要觀察前述方法的表現,本章將執行數值模擬並提供相關結果。此模擬研究分成兩 部分,第一部分將檢查前述檢定方法在變數Z為離散情況下的表現。在此模擬中我們將. 政 治 大 法在變數Z為離散情況下的表現外,並可藉此觀察選擇不同基底函數對此檢定方法的影 立. 模擬數種不同的IID資料並分別使用兩種不同的基底函數來進行分析,除了可觀察此方. ‧ 國. 學. 響。第二部分的模擬研究,則是延續[3]中之小樣本資料的模擬研究。. 4.1 第 一 部 分 模 擬 研 究. ‧. 首先敘述第一部分模擬研究的相關細節。在此模擬程序中,我們生成Data 1–Data 10共. y. Nat. sit. 十組不同類型的資料來進行分析,其中Data 1–Data 6等六組符合條件獨立的資料用來. n. al. er. io. 檢驗此檢定方法在型一誤差上的表現,而Data 7–Data 10等四組具有條件相關的資料則. i n U. v. 用來觀察其檢定力的大小。在有條件相關的四組資料中,Data 7及Data 9是考慮在已. Ch. engchi. 知Z之下,(X, Y )有線性相關的狀況,另外為了檢查此方法在其他形式相關資料上的表 現,於Data 8及Data 10中使用了copula函數來生成具其他類型相關的隨機變數。在此 介紹使用copula函數來描述兩隨機變數(X, Y )的概念。 若FX , FY 分別為隨機變數X及Y 的累積分配函數,且(X, Y )的聯合累積分配函數. 22.

(62) 為FX,Y . 令C(u, v) = FX,Y (FX−1 (u), FY−1 (v)),則C為一個copula函數,且 FX,Y (x, y) =P (X ≤ x, Y ≤ y) =P (FX (X) ≤ FX (x), FY (Y ) ≤ FY (y)) =C(FX (x), FY (y)). 由上式可知copula函數C本質上是FX (X)與FY (Y )的聯合累積分配函數,而(X, Y )的聯 合分配可分別使用X及Y 的邊際累積分配函數及一個相關結構函數來描述。文獻中有許 多常用的copula函數(可見Nelsen[14]),不同的copula函數可用來描述不同的相關性結. 治 政 大 度。在Data 8及Data 10資料生成過程中,我們使用了Ali-Mikhail-Haq copula: 立 uv. 構。常用的一些copula函數通常帶有參數θ,而不同的參數θ則對應至不同的相關性強. ‧ 國. 1 − θ(1 − u)(1 − v). ,. 學. C(u, v; θ) =. (4.1). 其中θ ∈ [−1, 1]. 若θ 6= 0時,在已知Zi = z的情形下,透過此copula函數可模擬出具有. ‧. 非線性相關之(Xi , Yi )值。接下來將詳細敘述模擬資料的生成過程及使用此檢定方法的一. y. sit. io. n. al. er. 生成資料過程. Nat. 些參數設定。. i n U. v. 透 過 下 述 的 資 料 生 成 過 程 , 我 們 將 會 模 擬 出(Xi , Yi , Zi ) : i = 1, . . . , n, 並 假. Ch. engchi. 設(Xi , Yi , Zi )的 分 布 和(X, Y, Z)的 分 布 相 同 。 在Data 1–Data 6的 生 成 過 程 中 , 用 到了N (0, 1)、LN (0, 1)及自由度3的t分布(t(3)),爲了方便描述以下分別以f1 , f2 及f3 表 示其機率密度函數,而以fX,Y |Z=z 代表已知Z = z時,(X, Y )的條件分布之機率密度函 數。詳細生成資料的過程如下: • Data 1 Z ∼ Ber(p),且fX,Y |Z=z (x, y) = f1 (x)f1 (y) ,當z = 0, 1.. 23.

(63) • Data 2 Z ∼ Ber(p),且fX,Y |Z=z (x, y) = f2 (x)f2 (y) ,當z = 0, 1. • Data 3 Z ∼ Ber(p),且fX,Y |Z=z (x, y) = f3 (x)f3 (y) ,當z = 0, 1. • Data 4    p1 若 z = 1,    P (Z = z) = p2 若 z = 2, 且fX,Y |Z=z (x, y) = f1 (x)f1 (y) ,當z =      1 − p1 − p2 若 z = 3. 1, 2, 3.. 立. • Data 5. 政 治 大. ‧ 國. 學. Z的分配與Data 4相同,且fX,Y |Z=z (x, y) = f2 (x)f2 (y), 當z = 1, 2, 3.. ‧. • Data 6. Nat. sit. v. . n. al. er. io. • Data 7. y. Z的分配與Data 4相同,且fX,Y |Z=z (x, y) = f3 (x)f3 (y) ,當z = 1, 2, 3.. Ch. i n U.  Z ∼ Ber(p), 且(X, Y )|Z = z ∼ N2 (0, Σ),其中Σ = . engchi. . 1. 0.65z  . 0.65z 1. • Data 8 Z ∼ Ber(p),C是X和Y 的copula函數。C(u, v; θ)定義於(4.1),其中X, Y 為標準    −0.6 若 z = 0, 常態分配,而 θ =   0.9 若 z = 1.. 24.

(64) • Data 9 Z的分配與Data 4相同,且(X, Y )|Z = z ∼ N2 (0, Σ),其中   1 0.25(z − 1)   Σ= . 0.25(z − 1) 1 • Data 10 Z的 分 配 與Data 4相 同 ,C是X和Y 的copula函 數 。C(u, v; θ)定 義 於(4.1), 其    0 若 z = 1,    中X, Y 為 t(3)分配,而 θ = 0.6 若 z = 2      0.9 若 z = 3.. 立. ‧ 國. 學. 基底函數及個數. 政 治 大. 本文所討論的方法中會使用基底函數來近似隨機變數X與Y 的一般函數,因此在實際使. ‧. 用時必須先選擇適當的基底函數及基底個數,方能進行後續分析。為了分析的方便,在. y. Nat. 模擬分析中,X與Y 的觀察值將透過各自的經驗累積分布函數轉換至[0, 1], 因此這裡考慮. er. io. sit. 定義在[0, 1]上的基底函數。在此模擬分析中將使用兩種不同的基底函數,進而比較其對 應檢定結果的表現,至於基底個數則均選擇為3個。兩種基底函數分別敘述如下:. n. al. • 階梯函數. Ch. engchi. i n U. v.  i−1 i  φi (x) = I x ∈ [ , ) , i = 1, 2, 3. 3 3 且  i−1 i  ψi (y) = I y ∈ [ , ) , i = 1, 2, 3. 3 3 其中I為指標函數。. 25.

(65) • B-spline基底函數 考慮內部節點(knot)在0.5,邊界節點在0及1,階數(order)為2的標準B-spline基底 函數(定義可見Schumaker[17]之定義4.19.)。 模擬結果 在樣本數足夠大的情形下,可直接使用定理3所得的近似分配來決定拒絕域並進行檢定, 其結果展示於表 4.1,表中結果為5000次實驗所得的平均值。觀察Data 1–Data 6等六 筆符合條件獨立資料的結果,利用模擬資料所得的型一誤差值均能有效控制在0.05附 近,此結果不會因為條件變數Z的分配不同或使用不同的基底函數而有明顯差異。接著. 政 治 大. 由Data 7–Data 10的結果來觀察檢定力,可以發現當樣本數大於300時,大部分資料的. 立. 檢定力結果均能大於0.7,只有當樣本數較小、觀察樣本資料中條件獨立(或弱相關)的樣. ‧ 國. 學. 本比例較高且又使用階梯函數的基底函數此三情況一同發生時,此方法才會呈現較低的 檢定力。舉例來說,觀察當樣本數為300時、使用階梯函數為基底函數來檢定Data 7的. ‧. 模擬結果,可以發現其檢定力僅有0.5012,但這結果並不令人意外,因為在觀察的樣本. sit. y. Nat. 中,只有平均約30個資料是有線性相關的(相關係數為0.65),而剩下大多數的樣本則是. er. io. 獨立的。但這種檢定力較低的情形隨著樣本數增大或使用B-spline函數為基底函數進行. al. 分析會被改善。另外比較兩種基底函數對此檢定方法的影響,發現若使用較平滑的基底. n. v i n Ch 函數來進行分析,則會得到較佳的檢定力,同時亦能有效控制型一誤差的水準。綜觀第 engchi U. 一部分的模擬結果,個人認為此檢定方法由型一誤差或檢定力的角度來觀察均可得到令 人滿意的結果。. 4.2 第 二 部 分 模 擬 研 究 在此部分的模擬研究中,我們考慮了樣本數較小時的條件獨立檢定問題。當樣本數較小. 26.

(66) Data 1 Data 2 Data 3 Data 4 Data 5 Data 6. Data 7. Data 8. Data 9. n = 300 0.0512 0.0468 0.0458 0.0454 0.0498 0.0448 0.0480 0.0482 0.0418 0.0454 0.0508 0.0506 0.5012 0.9904 0.9998 1 1 0.6108 0.8666 0.9650 0.9912 0.9986 0.6650 0.9024 0.9822 0.9954 0.6608 0.8378 0.9418 0.9818. 政 治 大. B-spline函數 n = 1000 n = 500 0.0474 0.0544 0.0468 0.0474 0.0490 0.0504 0.0522 0.0486 0.0502 0.0482 0.0462 0.0484 0.0522 0.0468 0.0494 0.0478 0.0482 0.0470 0.0482 0.0450 0.0422 0.0452 0.0506 0.0458 0.9998 0.9522 1 1 1 1 1 1 1 1 1 0.9630 1 0.9990 1 1 1 1 1 1 1 0.9866 1 1 1 1 1 1 1 0.9794 1 0.9998 1 1 1 1. n = 300 0.0510 0.0420 0.0436 0.0416 0.0478 0.0414 0.0460 0.0438 0.0450 0.0456 0.0462 0.0496 0.7032 0.9996 1 1 1 0.7742 0.9704 0.9964 0.9998 1 0.8596 0.9842 1 1 0.8224 0.9596 0.9926 0.9992. Nat. y. ‧. Data 10. ‧ 國. 立. 階梯函數 n = 500 0.0490 0.0504 0.0476 0.0472 0.0510 0.0452 0.0472 0.0508 0.0516 0.0522 0.0510 0.0452 0.8182 1 1 1 1 0.8720 0.9882 0.9992 1 1 0.9184 0.9966 0.9998 1 0.9152 0.9856 0.9988 1. 學. p = 0.5 p = 0.1 p = 0.5 p = 0.1 p = 0.5 p = 0.1 (p1, p2) = (1/3, 1/3) (p1, p2) = (1/2, 1/4) (p1, p2) = (1/3, 1/3) (p1, p2) = (1/2, 1/4) (p1, p2) = (1/3, 1/3) (p1, p2) = (1/2, 1/4) p = 0.1 p = 0.3 p = 0.5 p = 0.7 p = 0.9 p = 0.1 p = 0.3 p = 0.5 p = 0.7 p = 0.9 (p1, p2) = (0.2, 0.7) (p1, p2) = (0.2, 0.5) (p1, p2) = (0.2, 0.3) (p1, p2) = (0.2, 0.1) (p1, p2) = (0.2, 0.7) (p1, p2) = (0.2, 0.5) (p1, p2) = (0.2, 0.3) (p1, p2) = (0.2, 0.1). n = 1000 0.0536 0.0480 0.0476 0.0514 0.0480 0.0492 0.0508 0.0494 0.0492 0.0502 0.0516 0.0516 0.9956 1 1 1 1 0.9968 1 1 1 1 1 1 1 1 0.9988 1 1 1. er. io. sit. 表 4.1: 第一部分模擬分析之型一誤差或檢定力結果.. 時,基於大樣本條件下所得近似分配和利用條件獨立樣本所得的統計量分配有相當的. al. n. v i n 差距,因此在進行小樣本資料的檢定時,不能直接使用近似分配所得的拒絕域來進行 Ch engchi U 決策。爲了使其條件獨立檢定適用於小樣本資料,所以[3]利用模擬的方式來決定拒絕. 域,亦即針對每一組樣本{(Xt , Yt , Zt )}nt=1 ,使用Paparoditis和Politis[15]所提出之local bootstrap來重新生成符合條件獨立情形之樣本{(Xt∗ , Yt∗ , Zt∗ )}nt=1 ,藉由計算這些樣本 的統計量可得符合虛無假設時統計量的分配,進而可決定對應之拒絕域。 上述利用模擬 方法得到小樣本資料臨界值的方法,在[18],[19],[2]和[10]的研究中均有使用。. 27.

(67) 在此簡介local bootstrap方法如下。若已有樣本{(Xt , Yt , Zt )}nt=1 下,透過以下兩步 驟可生成n組符合條件獨立的樣本{(Xt∗ , Yt∗ , Zt∗ )}nt=1 . (a) 計算Z的經驗累積分布函數FˆZ , 其中 n. 1X FˆZ (z) = I(−∞,Zt ] (z). n t=1 由上述經驗分配抽樣生成(Z1∗ , Z2∗ , . . . , Zn∗ )樣本。 (b) 當1 ≤ t ≤ n時 , 分 別 計 算X|Z = Zt∗ 及Y |Z = Zt∗ 的 條 件 經 驗 累 積 分 布 函 數FˆX|Z=Zt∗ 及FˆY |Z=Zt∗ ,其中. P ((Z − Z )/b)I 政 Pk治 大− Z )/b) k ((Z n t=1. FˆX|Z=Zt∗ (x) =. 立. FˆY |Z=Zt∗ (y) =. ∗ t. n t=1. Pn. ∗. (−∞,Xt ] (x). t ∗ t. t. k ∗ ((Z ∗ − Zt )/b)I(−∞,Yt ] (y) Pn t ∗ . ∗ t=1 k ((Zt − Zt )/b). 學. ‧ 國. 及. ∗. t=1. ‧. 由 上 述 兩 個 經 驗 分 配 , 分 別 獨 立 抽 樣 生 成Xt∗ 及Yt∗ 樣 本 。 其 中k ∗ 與b分 別 為 bootstrap kernel及bandwidth.. sit. y. Nat. [3]利用前述方法進行小樣本資料的模擬研究,其結果顯示若資料為小樣本且符合條. io. n. al. er. 件獨立時,使用上述方法可得到合理的型一誤差。但此方法使用於某些不符合條件獨立. Ch. i n U. v. 的資料時,其檢定力較不令人滿意。因此在第二部分的模擬分析中,我們將使用[3]模擬. engchi. 分析中的Data 5–Data 7、Data 9和Data 10並利用[3]的方法來執行模擬分析(上述資料 原使用於[19])。上述五組資料在樣本數較小時,使用階梯函數為基底函數進行分析,所 得的檢定力結果較差,所以此模擬將選擇與[3]不同的基底函數且在相同參數設定下重新 進行模擬研究,藉此觀察其結果的變化。另外為了確定上述的基底改變不會使型一誤差 過大,此模擬亦會使用[3]模擬分析中的Data 1–Data 4(上述資料原使用於[19])及[3]模擬 分析中的Data 11及Data 12來執行分析。首先將資料生成過程及參數設定敘述如下:. 28.

(68) 生成資料過程 下述的資料生成過程,每個資料將會模擬出n個樣本(Xt , Yt , Zt ),其中t = 1, . . . , n, 又1,t , 2,t 及3,t 代表獨立且服從N (0, 1)的隨機變數。此資料生成過程同[19]及[3]。 • Data 1 (Xt , Yt , Zt ) = (1,t , 2,t , 3,t ). • Data 2 Xt = 0.5Xt−1 + 1,t , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 . • Data 3. p. h1,t , Yt = 2,t. p. ‧. Xt = 1,t. 學. • Data 4. 立. p 2 0.01 + 0.5Xt−1 , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 .. ‧ 國. Xt = 1,t. 政 治 大. 2 h2,t , Zt = Xt−1 , h1,t = 0.01 + 0.9h1,t−1 + 0.05Xt−1 且. y. sit. n. al. er. io. • Data 5. Nat. 2 h2,t = 0.01 + 0.9h2,t−1 + 0.05Yt−1 .. i n U. v. Xt = 0.5Xt−1 + 0.5Yt + 1,t , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 . • Data 6. Ch. engchi. Xt = 0.5Xt−1 + 0.5Yt2 + 1,t , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 . • Data 7 Xt = 0.5Xt−1 Yt + 1,t , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 .. 29.

(69) • Data 9 Xt = 1,t. 2 + 0.25Yt2 , Yt = 0.5Yt−1 + 2,t 且 Zt = Xt−1 . 0.01 + 0.5Xt−1. p. • Data 10 Xt = 1,t. p p 2 h1,t , Yt = 2,t h2,t , Zt = Xt−1 , h1,t = 0.01 + 0.1h1,t−1 + 0.4Xt−1 +. 0.5Yt2 且 h2,t = 0.01 + 0.9h2,t−1 + 0.5Yt2 . • Data 11 (Xt , Yt , Zt ) = (∗1,t , ∗2,t , ∗3,t ), 其中 ∗1,t , ∗2,t , ∗3,t 為IID的LN (0, 1).. 政 治 大. • Data 12. 立. Xt = ∗1,t ∗1,t−1 , Yt = ∗2,t ∗2,t−1 且 Zt = Xt−1 , 其中 ∗1,t , ∗2,t 為IID的LN (0, 1).. ‧ 國. ‧. • 基底函數. 學. 參數設定. al. n 且. i−1 i  φi (x) = I x ∈ [ , ) , i = 1, . . . , 5. 5 5. er. io. sit. y. Nat. (1)階梯函數. . Ch. e n g c h i. i n U. v. i−1 i  ψi (y) = I y ∈ [ , ) , i = 1, . . . , 5. 5 5 其中I為指標函數。 (2)B-spline基底函數 考慮內部節點在0.5,邊界節點在0及1,階數(order)為3的標準B-spline基底函 數(定義可見Schumaker[17]之定義4.19.)。. 30.

(70) • Kernel bandwidth:n−0.25 . • Bootstrap kernel:k ∗ 為標準常態分配的機率密度函數。 • Bootstrap bandwidth:b = n−0.2 . • 計算點zi :{0.2, 0.4, 0.6, 0.8}. 模擬結果 在上述的資料生成過程及參數設定下,我們對樣本數為100的資料進行分析,其中利 用1000次local bootstrap的樣本來決定拒絕域。模擬結果展示於表 4.2,表中型一誤差. 政 治 大. 或檢定力的結果是3000次實驗的平均值。由結果可發現,若此方法配合適當且較為平滑. 立. Data 2. Data 3. Data 4. Data 11. 0.0493 0.0497. 0.0497 0.0480. 0.0530 0.0480. 0.0470 0.0487. 0.0527 0.0467. Data 5. Data 6. Data 7. Data 9. Data 10. 0.7430 0.9273. 0.7090 0.9840. 0.3903 0.6647. 0.5943 0.9420. sit. io. 階梯函數 B-spline函數. al. y. 0.3130 0.7770. er. Nat. Data 1. ‧. 階梯函數 B-spline函數. 學. 小。. ‧ 國. 的基底函數,則在檢定力的表現上會有較佳的表現,同時亦能有效控制型一誤差的大. n. v i n Ch 表 4.2: 第二部分模擬分析之型一誤差或檢定力結果. engchi U. 31. Data 12 0.0493 0.0527.

(71) 5 資料分析. 在此部分將分析台灣進出口物價與匯率(美元/台幣)之間的關係。我們將使用1981年1月 至2013年5月的月資料來進行分析,其中匯率資料取自於中華民國中央銀行全球資訊. 政 治 大 述方法與Granger因果關係檢定去執行分析,藉以探討兩種物價與匯率之間是否有關係 立 網,而進出口物價資料取自於中華民國行政院主計總處全球資訊網。我們將分別利用前. ‧ 國. 學. 存在,並比較兩種檢定方法的差異。. 在進行分析之前,首先對進口物價、出口物價及匯率資料進行對數轉換與一次差. ‧. 分,再利用Augmented Dickey-Fuller檢定確認經過一次差分後,所得到的三數列為穩 定,而接下來的分析過程將利用將此三穩定數列來執行。以下將以Ptim , Ptex 及Et 分別表. y. Nat. sit. 示此三穩定數列中轉換後的進口物價、出口物價及匯率之第t期資料。. n. al. er. io. 本分析的第一個目的是希望探討匯率和物價間是否有預測關係的存在,並分別使用. i n U. v. 線性Granger因果檢定(Test LIN)與本文提出的方法(Test 1)來進行檢定,在此首先敘述. Ch. engchi. 兩方法對應的模型及虛無假設。若我們關心時間t − 1之匯率是否會影響時間t之進口物 價,在線性Granger因果檢定中,模型可寫為 im im , E(Ptim |Pt−1 , Et−1 ) = aEt−1 + bPt−1. 且對應之虛無假設為 H0 : a = 0.. 32. (5.1).

(72) 若拒絕上述虛無假設,則表示匯率對進口物價有影響能力。另外,對應於Test 1的獨立 性檢定之虛無假設則是 im . H0 : Ptim ⊥ Et−1 |Pt−1. (5.2). 接著我們將兩種方法之檢定結果展示於表 5.1,其中匯率 6⇒進口表示(5.1)或(5.2)成立, 亦即表示匯率對進口物價沒有影響能力,而表中其他符號的定義類似。由表中之結果發 現,兩種檢定方法均顯示匯率會影響進口物價,但匯率影響出口物價的關係上,Test 1證實了此關係存在,而Test LIN則未發現此關係。另外,在物價影響匯率的關係上, 兩種檢定方法亦呈現不同的結果。. 進口物價 6⇒ 匯率 0.0501 0.0034. 表 5.1: 匯率與進出口物價關係之檢定p值結果. ‧. ‧ 國. 立. 6⇒ 匯率 政 治 出口物價 0.0238 大0.1274. 匯率 6⇒ 出口物價 0.2725 0 匯率 6⇒ 進口物價 0.0012 0.0448. 學. H0 Test LIN Test 1 H0 Test LIN Test 1. sit. y. Nat. 上述的Test 1證實匯率具有預測物價的能力,本分析的第二個目的是希望探討若已. io. er. 知匯率為升或降的資訊下,匯率是否和物價獨立,亦即是否只要知道匯率為漲或跌的資. al. 訊已足夠能力預測物價,而漲跌幅度並不重要。在此部分的分析過程中,將使用本文所. n. v i n Ch 討論的方法在已知匯率為上升、已知匯率為下降及已知匯率為漲或跌時分開檢定。表 engchi U. 5.2為此分析的檢定結果,其結果顯示若只知匯率為漲或跌時,匯率漲跌幅度和出口物價. 並不獨立,亦即匯率漲跌資訊並不足以解釋出口物價,出口物價會受到匯率漲跌幅度的 影響。至於在進口物價方面,只有當匯率下降時,其匯率值才會對進口物價有影響,而 其餘兩種狀況則只要知道匯率漲跌資訊則足夠解釋進口物價。. 33.

(73) H0 匯率上升 匯率下降. 匯率 ⊥ 出口物價 0.0002 0.0024 0.0016. 匯率 ⊥ 進口物價 0.3932 0.0238 0.1498. 表 5.2: 已知匯率升降時之進出口物價與匯率關係檢定p值結果. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 34. i n U. v.

(74) 6 證明 6.1 LEMMA 1證 證明 爲了簡化證明的過程,在此僅考慮i = 1, 2及j = 1, 2的情形。令. 政X u治 ηˆ (z ) = I(Z =大 z ), n. 立. j. i. j,t. t. i. t=1. 因為. ‧ 國. 學. n   X E(gj (X, Y )|Z = Zt ) − E(gj (X, Y )|Z = zi ) I(Zt = zi ) = 0, t=1. ‧. 則. y. sit. p. Nat.   p(zi ). gˆj (zi ) − E gj (X, Y )|Z = zi = ηˆj (zi )/ˆ. er. al. n. 2。. io. 由於ˆ p(zi ) → p(zi )並配合LEMMA 2的結果,即完成此證明。 接著我們敘述LEMMA. Ch. engchi. i n U. v. LEMMA 2. 假 設 LEMMA 1(1)的 的條 件 成 立 , 以 下 收 斂 結 果 成 立 。    ηˆ1 (z1 )      η ˆ (z )  √ 2 1  D  → Z ∼ N4 (µ, Σ1 ), Zn ≡ n     ηˆ1 (z2 )      ηˆ2 (z2 ). 35.

(75) 其中,µ = (0, 0, 0, 0)T 而 Σ1 = [σij ]1≤i,j≤4 . 上 述 之 σij 定 義 如 下 : σjj =. σj2 (z1 )p(z1 ). +2. ∞ X. E(uj,1 uj,1+k I(Z1 = z1 )I(Z1+k = z1 )) 當 j = 1, 2;. k=1. σjj =. 2 σj−2 (z2 )p(z2 ). +2. ∞ X. E(uj−2,1 uj−2,1+k I(Z1 = z2 )I(Z1+k = z2 )) 當 j = 3, 4;. k=1. σ12 = σ21 = c12 (z1 )p(z1 ) +. ∞   X  E u1,1 u2,1+k + u2,1 u1,1+k I(Z1 = z1 )I(Z1+k = z1 ) ; k=1. σ34 = σ43. ∞   X  = c12 (z2 )p(z2 ) + E u1,1 u2,1+k + u2,1 u1,1+k I(Z1 = z2 )I(Z1+k = z2 ) ; k=1. σ13 = σ31 =. 立. k=1. ∞   X E u1,1 u2,1+k I(Z1 = z1 )I(Z1+k = z2 )+u2,1 u1,1+k I(Z1 = z2 )I(Z1+k = z1 ) ; =. ‧ 國. 學. σ14 = σ41. 政 治 大. ∞   X E u1,1 u1,1+k I(Z1 = z1 )I(Z1+k = z2 )+u1,1 u1,1+k I(Z1 = z2 )I(Z1+k = z1 ) ;. k=1. σ23 = σ32. ∞   X E u2,1 u1,1+k I(Z1 = z1 )I(Z1+k = z2 )+u1,1 u2,1+k I(Z1 = z2 )I(Z1+k = z1 ) ; =. ‧. k=1. y. sit. k=1. Nat. σ24 = σ42. ∞   X = E u2,1 u2,1+k I(Z1 = z1 )I(Z1+k = z2 )+u2,1 u2,1+k I(Z1 = z2 )I(Z1+k = z1 ) .. n. al. er. io. 另外,若 條 件 和 LEMMA 1(2)相 相同 時 , 則. 其中. D. i n U. Zn → Z ∗ ∼ N4 (µ, Σ∗1 ),. Ch. engchi. v. .  σ12 (z1 )p(z1 ). c12 (z1 )p(z1 ) 0 0    0 0  c12 (z1 )p(z1 ) σ22 (z1 )p(z1 ) ∗ Σ1 =    0 0 σ12 (z2 )p(z2 ) c12 (z2 )p(z2 )   0 0 c12 (z2 )p(z2 ) σ22 (z2 )p(z2 ). 36.     .    .

(76) [LEMMA 2證明] 由Cram´ er-Wold Theorem可知,爲了證明此多維度分配的收斂情形,我們必須驗證 對任意向量c = (c1 , c2 , c3 , c4 )T ,下式的收斂結果成立 D. cT Zn → cT Z. 令 Zn,t = c1 u1,t I(Zt = z1 ) + c2 u2,t I(Zt = z1 ) + c3 u1,t I(Zt = z2 ) + c4 u2,t I(Zt = z2 ), 則cT Zn =. √1 n. Pn. t=1. Zn,t 。 若LEMMA 1(1)的條件成立,由Billingsely[1]書中的Theorem. 27.4,並令 4 X. 立. σ2 =. 政 治X 大 c σ +2 ccσ , 2 i ii. i=1. ‧ 國. 學. D. i j ij. i<j,{i,j}∈{1,2,3,4}. 即可得cT Zn → N (0, σ 2 ),亦即得到LEMMA 2的結果。另外若LEMMA 1(2)的條件成 立時,令. ‧. er. io. D. sit. Nat. + 2c1 c2 c12 (z1 )p(z1 ) + 2c3 c4 c12 (z2 )p(z2 ),. y. σ∗2 =p(z1 )(c21 σ12 (z1 ) + c22 σ22 (z1 )) + p(z2 )(c23 σ12 (z2 ) + c24 σ22 (z2 )). 則由中央極限定理可得cT Zn → N (0, σ∗2 )並得到LEMMA 2第二部分的結果。. n. al. 6.2 THEOREM 2證 證明. Ch. engchi. i n U. v. 因為證明過程和Z為連續的情形下類似,所以此處主要提供當Z為離散時收斂速度的差 異,而更詳細的證明過程可見[10]或[3]的研究。 此證明採用Huang論文中的證明方法。在其證明過程為了計算的需要,我們會將原 ∗ 基底函數利用線性轉換成為滿足下列條件(a)–(d)之新基底函數{φ∗l : 1 ≤ l ≤ p}及{ψm ∗:. 1 ≤ m∗ ≤ q},此種轉換並不會影響ˆ ρ2 (z)之值。. 37.

(77) (a) φ∗1 = 1 = ψ1∗ ; (b) V11 (z) ≡ (E(φ∗l (X)φ∗l0 (X)|Z = z) : 1 ≤ l, l0 ≤ p)是維度為p × p之單位矩陣; ∗ ∗ ∗ 0 (c) V22 (z) ≡ (E(ψm ∗ (Y )ψm0 (Y )|Z = z) : 1 ≤ m , m ≤ q)是維度為q × q之單位矩陣; ∗ ∗ (d) V12 (z) ≡ (E(φ∗l (X)ψm ≤ q) ≡ (V12 (z))T , ∗ (Y )|Z = z): 1 ≤ l ≤ p, 1 ≤ m ∗ 當l 6= m∗ 時,其中元素E(φ∗l (X)ψm ∗ (Y )|Z = z)之值為零。. 令. . .  V11 (z) V12 (z)  V ∗ (z) =  . V21 (z) V22 (z). 政 治 ˆ大 若V (z)中的每一個元素用其估計量來取代,即可得V (z). 若令g , . . . , g 立 ∗. ∗. 1. m為. φ∗l (X)φ∗l0 (X) :. m0 ≤ q, 則根據LEMMA 1可得. io. n. al. 其中U11 , U12 , U21 及U22. y. Nat. 接著我們討論ˆ ρ2 (Z)及ρ2p,q (Z)的差距。令 . sit. i=1. 1 k Vˆ ∗ (zi ) − V ∗ (zi ) k2 = Op . n. .  U11 U12  U = , U21 U22. er. k X. ‧. ‧ 國. 學. ∗ ∗ ∗ ∗ ∗ 1 ≤ l ≤ l0 ≤ p, φ∗l (X)ψm ∗ (Y ) : 1 ≤ l ≤ p, 1 ≤ m ≤ q, ψm∗ (Y )ψm0 (Y ) : 1 ≤ m ≤. iv. (6.1). n U 分別為維度是p × p, en g pc×hq,i q × p及q × q的矩陣。 令. Ch. −1 −1 g(U, a) = U1,2 U2,2 U2,1 U1,1 − U1,1 aaT ,. (6.2). 2 2 及α∗ = (1, 0, . . . , 0)T 為一維度為p × 1的向量。 則 ρˆ(z) 和 ρp,q (z) 是g(Vˆ ∗ (z), α∗ ) 及 g(V ∗ (z), α∗ )的最大特徵值,且 k X i=1.   1 kg(V (zi ), α ) − g(V (zi ), α )k = Op . n ˆ∗. ∗. ∗. 38. ∗. 2.

(78) 當1 ≤ i ≤ k時,因為 |ˆ ρ2 (zi ) − ρ2p,q (zi )| ≤ kg(Vˆ ∗ (zi ), α∗ ) − g(V ∗ (zi ), α∗ )k 及 k X.   1 (ˆ p(zi ) − p(zi )) = Op , n i=1 2. 我們可得 k X. 2. ρˆ (zi ) −. 2 ρ2p,q (zi ). i=1.   1 = Op n. 及 k X. pˆ(zi )ˆ ρ2 (zi ) −. i=1. (z ) 政p(z )ρ 治 大 i. 2 p,q. i. i=1. k X. 立 X (ˆ p(z ) − p(z ))ˆ ρ (z ) + p(z )(ˆ ρ (z ) − ρ. !2. k. i. i. 2. i. i. i=1. 2. i. 2 p,q (zi )). 學. ‧ 國. =. !2. k X. i=1.   1 . = Op n. ‧. 6.3 THEOREM 3證 證明.  np(zi ) Vˆ ∗ (zi ) − V ∗ (zi ) , 其. io. er. p. sit. y. Nat. 此 證 明 採 用Huang論 文 中 的 證 明 方 法 。 令Yi =. D. 中Vˆ ∗ 和V ∗ 之 定 義 同 前 。 由LEMMA 1可 知 ,(Y1 , . . . , Yk ) → (N1∗ , . . . , Nk∗ ), 其 中 每. al. n. v i n 一N 是一個平均數為0而變異數為1之常態矩陣。利用Skorohod’s定理,我們可知存在隨 Ch engchi U 機矩陣T 及W ,使得T ∼ Y ,W ∼ N 且T → W ,上述之A ∼ B表示A和B有相同 i. i. 1,i. i. i. 1,i. as. ∗ i. i. 1,i. 分配。令W2,i = Ti − W1,i ,則 Ti W1,i + W2,i Yi Vˆ ∗ (zi ) = p + V ∗ (zi ) ∼ p + V ∗ (zi ) = V ∗ (zi ) + p . np(zi ) np(zi ) np(zi ) 對(6.1)的U 矩陣,定義gr,s (U ) = Urs , 1 ≤ r, s ≤ 2. 又當1 ≤ i ≤ k時,令 V˜i = V ∗ (zi ) + (np(zi ))−1/2 (W1,i + W2,i ),. 39.

(79) 則V˜i ∼ Vˆ ∗ (zi ). 令 A1 (zi ) = g(V˜i , α∗ )g1,1 (V˜i ) 且˜ ρ20 (zi )為A1 (zi )(V˜i ))−1 的最大特徵值, ρ(zi ))2 . 其中g定義於(6.2), 則˜ ρ20 (zi ) ∼ (ˆ 接 著 重 新 表 示A1 (zi ). 若1 ≤ r, s ≤ 2, 1 ≤ i ≤ k時 , 令 4r,s,i = gr,s (V˜i ) − gr,s (V ∗ (zi )), 則 k X 2 X 2 X i=1 r=1.   1 k4r,s,i k = Op , n s=1 2. 且 A1 (zi ) =g(V˜i , α∗ )g1,1 (V˜i ). 政 治 大 (V (z ))4 + 4 g (V (z )) + 4 立. =g1,2 (V ∗ (zi ))(g2,2 (V˜i ))−1 g2,1 (V ∗ (zi )) − g1,1 (V˜i )α∗ (α∗ )T g1,1 (V˜i ) + g1,2. ∗. i. 2,1,i. ∗. 1,2,i 2,1. i. 1,2,i 42,1,i. ‧. ‧ 國. 其中. 學. − g1,2 (V ∗ (zi ))42,2,i 42,1,i − 41,2,i 42,2,i g2,1 (V ∗ (zi )) + R1,i ,. R1,i =41,2,i ((g2,2 (V˜k ))−1 − Iq )42,1,i. y. Nat. io. sit. + g1,2 (V ∗ (zi ))((g2,2 (V˜i ))−1 − Iq + 42,2,i )42,1,i. er. + 41,2,i ((g2,2 (V˜i ))−1 − Iq + 42,2,i )g2,1 (V ∗ (zi )),. n. al. i n C 且I 表示維度q × q的單位矩陣。由於可找到B 使得 U h e n g c和D i h   q. i. i. T  1 Bi  ˜ g2,2 (Vi ) =  , Bi Di. 40. v.

(80) 所以 A1 (zi ) =BiT ((Di − Bi BiT )−1 − Iq−1 )Bi J + g1,2 (V ∗ (zi ))(42,2,i )2 g2,1 (V ∗ (zi )) − 41,1,i g1,2 (V ∗ (zi ))g2,1 (V ∗ (zi ))41,1,i + 41,2,i 42,1,i − g1,2 (V ∗ (zi ))42,2,i 42,1,i − 41,2,i 42,2,i g2,1 (V ∗ (zi )) + R1,i , 其中J = α∗ (α∗ )T . 令 A2 (zi ) =g1,2 (V ∗ (zi ))(g2,2 (W1,i ))2 g2,1 (V ∗ (zi )) − g1,1 (W1,i )g1,2 (V ∗ (zi ))g2,1 (V ∗ (zi ))g1,1 (W1,i ) + g1,2 (W1,i )g2,1 (W1,i ). 政 治 大. − g1,2 (V ∗ (zi ))g2,2 (W1,i )g2,1 (W1,i ) − g1,2 (W1,i )g2,2 (W1,i )g2,1 (V ∗ (zi )),. 立. A1 (zi ) =. 學. A2 (zi ) + R1,i + R2,i , np(zi ). (6.3). ‧. 其中. ‧ 國. 則. sit. y. Nat. R2,i =BiT ((Di − Bi BiT )−1 − Iq−1 )Bi J. io. al. er. − (nhd fZ (zi )/κd )−1 A2 (zi ) + g1,2 (V ∗ (zi ))(42,2,i )2 g2,1 (V ∗ (zi )). n. − 41,1,i g1,2 (V ∗ (zi ))g2,1 (V ∗ (zi ))41,1,i + 41,2,i 42,1,i. Ch. engchi. i n U. v. . . − g1,2 (V ∗ (zi ))42,2,i 42,1,i − 41,2,i 42,2,i g2,1 (V ∗ (zi )) 且 k X. 2. 2. (kR1,i k + kR2,i k ) = op. i=1. 在條件獨立的情形下, k X i=1. Pk. i=1. 1 n2. .. (6.4). kA2 (zi )k2 = Op (1), 所以 2. kA1 (zi )k = Op. . 1 n2. .  + op. 41. 1 n2. .  = Op. 1 n2. .

(81) 且 k X. kA1 (zi )(g1,1 (V˜i ))−1 − A1 (zi )k2 =. i=1. k X.  kA1 (zi ) (g1,1 (V˜i ))−1 − I k2 = Op. i=1. .  1 . n3 (6.5). 另外,A1 (zi )(V˜i ))−1 的最大特徵值˜ ρ20 (zi )與A2 (zi )最大的特徵值λ0,i 之差異符合下式: k X. (np(zi )˜ ρ20 (zi ) − λ0,i )2 = op (1).. i=1. 令(˜ pi , ρ˜(zi ), λi ) : 1 ≤ i ≤ k為滿足(C1)及(C2)的隨機向量: (C1) {(˜ pi , ρ˜(zi )): 1 ≤ i ≤ k}與{(ˆ p(zi ), ρˆ(zi )): 1 ≤ i ≤ k}有相同的聯合分配; (C2) {(˜ ρ(zi ), λi ) : 1 ≤ i ≤ P k}與{(˜ ρ0 (zi ), λ0,i ) : 1 ≤ i ≤ k}有相同的聯合分配。 因為n ki=1 (ˆ ρ(zi ))2 = Op (1), 所以. 政 治 大. 立. 可得. i=1. i=1. io. i=1. n. al. . = Op (1)Op. 及. Ch. 1 √ n. (ˆ p(zi ) − p(zi ))2. i=1   1 = Op √ n. y. !1/2. sit. (ˆ ρ(zi ))2. k X. er. Nat. =n. k X. ‧. ‧ 國. 學.

(82)

(83) k k

(84) X

(85) X

(86)

(87) pˆ(zi )(ˆ ρ(zi ))2 − n p(zi )(ˆ ρ(zi ))2

(88)

(89) n

(90)

(91) i=1 i=1 !1/2 k k X X ≤n (ˆ p(zi ) − p(zi ))2 (ˆ ρ(zi ))2. engchi. i n U. v.

(92) k

(93)   k

(94) X

(95) X 1

(96)

(97) 2 p˜i (˜ ρ(zi )) − λi

(98) ≤ Op √ + op (1) = op (1).

(99) n

(100)

(101) n i=1. i=1. 同時我們完成此證明。. 42.

(102) 參考文獻 [1] Patrick Billingsley. Probability and Measure. John Wiley & Sons, New York, 1995.. 政 治 大 nonparametric copula based test for conditional independence with applications 立. [2] Taoufik Bouezmarni, Jeroen V. K. Rombouts, and Abderrahim Taamouti. A. ‧ 國. 學. to Granger causality. Working papers, Departamento de Econom´ıa Universidad Carlos III de Madrid, 2009.. ‧. [3] Yu-Hsiang Cheng and Tzee-Ming Huang. A conditional independence test for. io. er. variate Analysis, 107:210–226, 2012.. sit. y. Nat. dependent data based on maximal conditional correlation. Journal of Multi-. al. v i n independence tests. TheC Annals h e nof gStatistics, c h i U26(4):1254–1278, 1998. n. [4] Jacques Dauxois and Guy Martial Nkiet. Nonlinear canonical analysis and. [5] David L. Banks (ed.), Campbell B. Read (ed.), and Samuel Kotz (ed.). Encyclopedia of Statistical Sciences (9 Vols. Plus Supplement), Volume S. John Wiley & Sons, 1989. [6] Stephen E. Fienberg. The Analysis of Cross-classified Categorical Data. MIT Press, 1980.. 43.

(103) [7] J. P. Florens and Denis Fougere. Noncausality in continuous time. Econometrica, 64(5):1195–1212, 1996. [8] J. P. Florens and M. Mouchart.. A note on noncausality.. Econometrica,. 50(3):583–591, 1982. [9] Harold Hotelling. Relations between two sets of variates. Biometrika, 28:321– 377, 1936. [10] Tzee-Ming Huang. Testing conditional independence using maximal nonlinear. 政 治 大. conditional correlation. The Annals of Statistics, 38(4):2047–2091, 2010.. 立. [11] Anant M. Kshirsagar. Multivariate Analysis. Marcel Dekker, Inc., New York,. ‧ 國. 學. 1972.. [12] Lexin Li, R. Dennis Cook, and Christopher J. Nachtsheim. Model-free vari-. ‧. able selection. Journal of the Royal Statistical Society, Series B: Statistical. Nat. io. sit. y. Methodology, 67(2):285–299, 2005.. n. al. er. [13] Oliver Bruce Linton and Pedro Gozalo. Conditional independence restrictions:. i n U. v. Testing and estimation. Cowles Foundation Discussion Papers 1140, Cowles. Ch. engchi. Foundation, Yale University, 1996.. [14] Roger B. Nelsen. An Introduction to Copulas. Springer, New York, 2006. [15] Efstathios Paparoditis and Dimitris N. Politis. The local bootstrap for kernel estimators under general dependence conditions. Annals of the Institute of Statistical Mathematics, 52(1):139–159, 2000.. 44.

(104) [16] Karl Pearson. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philosophical Magazine Series 5, 50(302):157–175, 1900. [17] Larry L. Schumaker. Spline Functions: Basic Theory. Wiley-Interscience, New York, 1981. [18] Liangjun Su and Halbert White. A consistent characteristic function-based test. 政 治 大 [19] Liangjun Su and Halbert White. A nonparametric Hellinger metric test for 立 for conditional independence. Journal of Econometrics, 141:807–834, 2007.. conditional independence. Econometric Theory, 24(4):829–864, 2008.. ‧ 國. 學. [20] S. S. Wilks. Certain generalizations in the analysis of variance. Biometrika,. ‧. 24:471–494, 1932.. n. er. io. sit. y. Nat. al. Ch. engchi. 45. i n U. v.

(105)

數據

表 4.2: 第二部分模擬分析之型一誤差或檢定力結果.

參考文獻

相關文件

The hashCode method for a given class can be used to test for object equality and object inequality for that class. The hashCode method is used by the java.util.SortedSet

 With new ICE trains crossi ng Europe at speeds of up to 300 km/h, sound and vib ration levels in the trains ar e an important issue.  Hilliges/Mehrmann/Mehl(2 004) first

If the bootstrap distribution of a statistic shows a normal shape and small bias, we can get a confidence interval for the parameter by using the boot- strap standard error and

In this paper, we have shown that how to construct complementarity functions for the circular cone complementarity problem, and have proposed four classes of merit func- tions for

Hence, we have shown the S-duality at the Poisson level for a D3-brane in R-R and NS-NS backgrounds.... Hence, we have shown the S-duality at the Poisson level for a D3-brane in R-R

At least one can show that such operators  has real eigenvalues for W 0 .   Æ OK. we  did it... For the Virasoro

If we want to test the strong connectivity of a digraph, our randomized algorithm for testing digraphs with an H-free k-induced subgraph can help us determine which tester should

For a directed graphical model, we need to specify the conditional probability distribution (CPD) at each node.. • If the variables are discrete, it can be represented as a