• 沒有找到結果。

一些不完全條件模型之相容性檢驗

N/A
N/A
Protected

Academic year: 2021

Share "一些不完全條件模型之相容性檢驗"

Copied!
28
0
0

加載中.... (立即查看全文)

全文

(1)

國立高雄大學統計學研究所

碩士論文

Compatibility checking for

some non-full conditional models

一些不完全條件模型之相容性檢驗

研究生:盧韋傑 撰

指導教授:郭錕霖 博士

(2)
(3)

謝辭

首先,我要特別感謝我的指導教授郭錕霖博士,才能使我完成此篇碩士論文, 再來,感謝蘇志成副教授和黃士峰所長,在百忙之中撥空擔任我的口試委員,並 且提供許多寶貴的意見,讓我的論文更加完善。 回想剛從大學畢業的我,在不確定未來人生道路的情況下,我選擇就讀研究 所,起初來到統計所這個大家庭的時候,我對這裡的一切感到陌生,謝謝所上在 新生入學的時候,都會舉辦一個新生座談會,讓剛進來就讀統計所的我,對於未 來碩士班的生活,能夠有個初步的了解並且更快的進入狀況。 在我就讀統計所的這段期間,感謝所上每一位老師對於我的教導與關心,在 這裡讓我學到了許多的專業知識,同時我也開始學著去思考我所遇到的問題,以 及該如何去解決問題的能力,更重要的是,我懂得要更善用自己的時間,在對的 時間,做對的事。在此,我想額外特別感謝黃文璋教授,謝謝黃文璋教授對於所 上的貢獻,在我撰寫論文的這段過程中,黃老師有時會關心我的論文進度,並要 我好好的加油,這對我來說是種莫大的鼓勵。 轉眼間,我的碩士班生涯也即將告一段落,很感謝蘭屏姐、學長姐、同班同 學和學弟妹,謝謝你們在這段時間內對我的幫忙與照顧,然而在這些日子中的點 點滴滴,終將成為我懷念的回憶之一。感謝在我一路以來的求學過程中,曾幫助 過我的人,也感謝自己並沒有在遇到困難的時候選擇放棄,對於即將面臨到人生 的下一個階段,我會秉持這樣的精神繼續往前邁進。 最後,我想感謝我的家人,在我讀大學以及研究所的這段期間,雖然我一直 都是在外讀書,待在家裡的時間並不多,但是家人一直都很支持我,很謝謝你們 對我的包容,讓我在求學過程中能無後顧之憂,在我完成碩士論文的這一刻,願 將這份成就,與你們分享。 盧韋傑 謹致 中華民國 106 年 01 月

(4)

Compatibility checking

for some non-full conditional models

By

Wei-Chieh Lu

Advisor

Kun-Lin Kuo

Institute of Statistics,

National University of Kaohsiung

Kaohsiung, Taiwan 811 R.O.C.

(5)

i

目錄

中文摘要... ii 英文摘要... iii 第一章 緒論... 1 第二章 完全條件模型之相容性檢驗 ... 2 第三章 不完全條件模型之相容性檢驗 ... 4 3.1. 方法的起源 ... 4 3.2. PCGS 與取樣順序的選擇 ... 7 3.3. 針對條件 pdf 的單樣本檢定 ... 9 3.4. 不完全條件模型之相容性檢驗的流程圖 ... 11 第四章 實例操作... 12 第五章 結論... 18 參考文獻... 20

(6)

ii

一些不完全條件模型之相容性檢驗

學生: 盧韋傑 國立高雄大學統計學研究所 指導教授:郭錕霖 博士 國立高雄大學統計學研究所 摘要 若一條件分佈的條件變數與非條件變數之聯集為所有變數的集合,則我們稱此條 件分佈為完全條件分佈,其餘則稱不完全條件分佈,在本研究中,邊際分佈亦稱 為不完全條件分佈。若一條件模型包含不完全條件分佈,則我們稱為不完全條件 模型。給定一條件模型,若存在一聯合分佈可同時產生模型裡的所有條件分佈, 則我們稱此條件模型是相容的。在過去的研究中,多半都是探討完全條件模型的 相容性檢驗,本研究試圖提出不完全條件模型的相容性檢驗方法,此方法由於使 用到吉氏取樣,因此我們只能對部分的不完全條件模型進行檢驗。 關鍵字:吉氏取樣、相容性、條件模型

(7)

iii

Compatibility checking

for some non-full conditional models

Wei-Chieh Lu (盧韋傑)

Institute of Statistics, National University of Kaohsiung

Advisor: Dr. Kun-Lin Kuo (郭錕霖博士)

Institute of Statistics, National University of Kaohsiung

ABSTRACT

A conditional distribution is a full conditional distribution if the union of its conditioning and conditioned variables is the set of all variables. Others are called non-full conditional distributions. In this study, a marginal distribution is also called non-full conditional distribution. If a conditional model contains at least one non-full conditional distribution, then we call the model as a non-full conditional model. A conditional model is said to be compatible if there exists a joint distribution whose conditional distributions match all the member in the model. In the literature, most studies focus on full conditional model and provide methods for checking compatibility. We first attempt to propose an approach for checking compatibility of non-full conditional models. Because this approach uses Gibbs sampling as a basic tool, we can only treat with some special non-full conditional models.

(8)

1

第一章 緒論

一般而言,建立條件分佈比建立聯合分佈來得容易(Arnold, Castillo and Sarabia, 2001)。考慮隨機向量(𝑋1, … , 𝑋𝑑),令𝐷 = {1, … , 𝑑},若𝐴為𝐷的子集,則 定義𝑋𝐴 = (𝑋𝑖: 𝑖 ∈ 𝐴)。例如,若𝐴 = {1,3,4},則𝑋𝐴 = (𝑋1, 𝑋3, 𝑋4)。同時,定義𝑓𝐴為 𝑋𝐴的機率密度函數(或機率質量函數,以下皆簡寫成 pdf)。若𝐴與𝐵為𝐷的互斥 (disjoint)子集,則定義𝑓𝐴|𝐵 = 𝑓𝐴∪𝐵/𝑓𝐵為𝑋𝐴|𝑋𝐵的條件 pdf。令𝐴̅為𝐴的餘集 (complement),則稱𝑓𝐴|𝐴̅為一完全條件 pdf(full conditional pdf),其他型式則稱 為不完全條件 pdf(non-full conditional pdf)。例如,設𝑑 = 4,則𝑓{1,3}|{2,4}為完全 條件 pdf,而𝑓{1,3}|{2}為不完全條件 pdf。今給定一條件模型{𝑓𝐴𝑖|𝐵𝑖: 1 ≤ 𝑖 ≤ 𝑚},若 每一個𝑓𝐴𝑖|𝐵𝑖皆為完全條件 pdf,則稱此模型為完全條件模型,反之則稱為不完全 條件模型。 設𝑓𝐷為(𝑋1, … , 𝑋𝑑)的聯合 pdf,則𝑓𝐴|𝐵皆可以從𝑓𝐷計算獲得,且是唯一的。然 而,若今給定一條件模型{𝑔𝐴𝑖|𝐵𝑖: 1 ≤ 𝑖 ≤ 𝑚},我們僅能知道每一個𝑔𝐴𝑖|𝐵𝑖都是條 件 pdf,但是否存在一𝑓𝐷可同時滿足𝑓𝐴𝑖|𝐵𝑖 = 𝑔𝐴𝑖|𝐵𝑖並不知曉,因此我們有以下的 定義:若存在至少一𝑓𝐷可同時滿足𝑓𝐴𝑖|𝐵𝑖 = 𝑔𝐴𝑖|𝐵𝑖,則稱{𝑔𝐴𝑖|𝐵𝑖: 1 ≤ 𝑖 ≤ 𝑚}是相容 的,反之則為不相容。於是開始有學者探討檢驗{𝑔𝐴𝑖|𝐵𝑖: 1 ≤ 𝑖 ≤ 𝑚}是否相容的方 法,然而,目前大部分的文獻僅能處理完全條件模型是否相容的議題,對於不完 全條件模型之相容性檢驗則沒有具體的方法,因此本研究將針對一部分的不完全 條件模型提出檢驗相容性的策略。 在第二章中,我們將簡短回顧完全條件模型之相容性檢驗的方法。在第三章 中,我們將敘明檢驗不完全條件模型之相容性所需要的理論,並將檢驗的步驟一 併說明。在第四章中,我們將透過一些範例說明我們的方法,這些範例包含離散 型與連續型的情況。本研究的結論將於第五章說明。

(9)

2

第二章 完全條件模型之相容性檢驗

在本章中,我們將回顧完全條件模型之相容性檢驗的方法,其主要的概念有 二,為了方便說明,我們考慮一個二維的完全條件模型{𝑔{1}|{2}, 𝑔{2}|{1}}。 概念一:使用相異條件分佈間的比值(ratio)資訊,建構邊際分佈 假設𝑓{1,2}是目標聯合 pdf 使得𝑓{1}|{2} = 𝑔{1}|{2}且𝑓{2}|{1}= 𝑔{2}|{1},於是我們可 得到一聯立方程組 𝑔{1}|{2}(𝑥1|𝑥2) 𝑔{2}|{1}(𝑥2|𝑥1)= 𝑓{1}(𝑥1) 𝑓{2}(𝑥2), (𝑥1, 𝑥2) ∈ 𝑆 其中𝑆 = {(𝑥1, 𝑥2): 𝑓{1,2}(𝑥1, 𝑥2) > 0},若能透過上面聯立方程組得到𝑓{1}與𝑓{2}的解, 此時{𝑔{1}|{2}, 𝑔{2}|{1}}是相容的,且𝑔{1}|{2}𝑓{2}或𝑔{2}|{1}𝑓{1}是其對應的聯合 pdf;有 時𝑓{1}與𝑓{2}的解並不唯一,這時{𝑔{1}|{2}, 𝑔{2}|{1}}仍是相容的,但有更多相異的聯 合 pdf 可以符合。基於上述概念,Arnold and Press (1989)、Arnold, Castillo and Sarabia (2001, 2002, 2004)、Tian and Tan (2003)、Tian et al. (2009)、Song et al. (2010)、Ng (2011)分別提出相異但類似的相容性檢驗方法。 概念二:使用相同條件分佈間的比值資訊,建構聯合分佈 假設𝑓{1,2}是目標聯合 pdf 使得𝑓{1}|{2} = 𝑔{1}|{2}且𝑓{2}|{1}= 𝑔{2}|{1},於是我們可 得到一聯立方程組 𝑔{1}|{2}(𝑡1|𝑥2) 𝑔{1}|{2}(𝑡2|𝑥2) = 𝑓{1,2}(𝑡1, 𝑥2) 𝑓{1,2}(𝑡2, 𝑥2), (𝑡1, 𝑥2), (𝑡2, 𝑥2) ∈ 𝑆 𝑔{2}|{1}(𝑠1|𝑥1) 𝑔{2}|{1}(𝑠2|𝑥1)= 𝑓{1,2}(𝑥1, 𝑠1) 𝑓{1,2}(𝑥1, 𝑠2), (𝑥1, 𝑠1), (𝑥1, 𝑠2) ∈ 𝑆 𝑔{1}|{2}(𝑡1|𝑠1)𝑔{1}|{2}(𝑡2|𝑠2) 𝑔{1}|{2}(𝑡1|𝑠2)𝑔{1}|{2}(𝑡2|𝑠1)= 𝑔{2}|{1}(𝑠1|𝑡1)𝑔{2}|{1}(𝑠2|𝑡2) 𝑔{2}|{1}(𝑠1|𝑡2)𝑔{2}|{1}(𝑠2|𝑡1)= 𝑓{1,2}(𝑡1, 𝑠1)𝑓{1,2}(𝑡2, 𝑠2) 𝑓{1,2}(𝑡1, 𝑠2)𝑓{1,2}(𝑡2, 𝑠1), (𝑡1, 𝑠1), (𝑡1, 𝑠2), (𝑡2, 𝑠1), (𝑡2, 𝑠2) ∈ 𝑆

(10)

3

若能透過上面聯立方程組得到𝑓{1,2}的解,此時{𝑔{1}|{2}, 𝑔{2}|{1}}是相容的,且𝑓{1,2}是 其對應的聯合 pdf;有時𝑓{1,2}的解並不唯一,這時{𝑔{1}|{2}, 𝑔{2}|{1}}仍是相容的, 但有更多相異的聯合 pdf 可以符合。基於上述概念,Slavkovic and Sullivant (2006)、 Ip and Wang (2009)、Chen (2010)、Wang and Kuo (2010)、Kuo and Wang (2011)、 Wang (2012)、Yao, Chen and Wang (2014)分別提出相異但類似的相容性檢驗方 法。

前述兩個概念顯然難以推廣至不完全條件模型,因此本文欲建構可行的方法 來處理不完全條件模型,當然,此法也應可應用在完全條件模型上。

(11)

4

第三章 不完全條件模型之相容性檢驗

在本章中,我們將敘明檢驗不完全條件模型之相容性所需要的理論,並將檢 驗的步驟一併說明。事實上,我們的方法亦適用完全條件模型。 給 定 一 條 件 模 型{𝑔𝐴𝑖|𝐵𝑖: 1 ≤ 𝑖 ≤ 𝑚} , 一 般 說 來 , 此 模 型 可 以 改 寫 成 {𝑔{𝑖}|𝐶𝑖: 1 ≤ 𝑖 ≤ 𝑑},在本章中,我們將用模型{𝑔{𝑖}|𝐶𝑖: 1 ≤ 𝑖 ≤ 𝑑}來進行討論。 3.1. 方法的起源 過去,在探討吉氏取樣(Gibbs sampling,以下簡寫為 GS)的文獻中,多半 都與如何改善收斂速度有關。近年,van Dyk and Park (2008)與 Park and van Dyk (2009)發現將條件模型中部分完全條件 pdf 置換成不完全條件 pdf 時,有助於改 善 GS 的收斂速度。

舉例來說,傳統的 GS 使用𝑀1 = {𝑓{1}|{2,3,4}, 𝑓{2}|{1,3,4}, 𝑓{3}|{1,2,4}, 𝑓{4}|{1,2,3}}透過 疊代的方式獲取近似𝑓{1,2,3,4}的樣本點,若𝑓{2}|{1,3}與𝑓{3}|{1,2}可被計算出且可進行 取樣時,van Dyk and Park (2008)證明𝑀2 = {𝑓{1}|{2,3,4}, 𝑓{2}|{1,3}, 𝑓{3}|{1,2}, 𝑓{4}|{1,2,3}} 亦可進行 GS,van Dyk and Park (2008)稱此取樣方法為 PCGS(partially collapsed Gibbs sampler)。值得注意的一點是,使用𝑀1時無須顧慮取樣順序,但使用𝑀2時, 則取樣順序卻關乎樣本點是否來自𝑓{1,2,3,4}。稍後我們舉一實例進行說明,說明之 前,我們得先了解 PCGS 是如何進行取樣。

van Dyk and Park (2008)提到取樣順序𝑥2 → 𝑥3 → 𝑥4 → 𝑥1對於𝑀2是合適的, 其疊代過程如下:令(𝑥1(0), 𝑥2(0), 𝑥3(0), 𝑥4(0))是任一初始向量,在第𝑡次疊代時,

𝑥2(𝑡)~𝑓{2}|{1,3}(𝑥2|𝑥1(𝑡−1), 𝑥3(𝑡−1)) 𝑥3(𝑡)~𝑓{3}|{1,2}(𝑥3|𝑥1(𝑡−1), 𝑥2(𝑡)) 𝑥4(𝑡)~𝑓{4}|{1,2,3}(𝑥4|𝑥1(𝑡−1), 𝑥2(𝑡), 𝑥3(𝑡))

(12)

5 可證明當𝑡 → ∞時,(𝑥1(𝑡), 𝑥2(𝑡), 𝑥3(𝑡), 𝑥4(𝑡))~𝑓{1,2,3,4}例1. 為方便說明取樣順序對 PCGS 的重要,我們先設定一目標聯合 pdf 為 𝑓{1,2,3,4},並考慮𝑀2 = {𝑓{1}|{2,3,4}, 𝑓{2}|{1,3}, 𝑓{3}|{1,2}, 𝑓{4}|{1,2,3}},由於共有 4 個變數,因此可能的取樣順序共有4! = 24種,所對應的平穩 pdf 之理論解 如下表,理論解之計算過程可參考第四章的例 3。 𝑥1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 𝑥2 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 𝑥3 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 𝑥4 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 𝒇{𝟏,𝟐,𝟑,𝟒} 0.013 0.026 0.304 0.024 0.051 0.062 0.077 0.082 0.096 0.057 0.032 0.025 0.039 0.037 0.012 0.063 𝑥1→ 𝑥2→ 𝑥3→ 𝑥4 0.013 0.026 0.304 0.024 0.051 0.062 0.077 0.082 0.096 0.057 0.032 0.025 0.039 0.037 0.012 0.063 𝑥1→ 𝑥2→ 𝑥4→ 𝑥3 0.035 0.041 0.294 0.027 0.029 0.049 0.078 0.081 0.073 0.045 0.034 0.023 0.060 0.054 0.009 0.068 𝑥1→ 𝑥3→ 𝑥2→ 𝑥4 0.013 0.026 0.304 0.024 0.051 0.062 0.077 0.082 0.096 0.057 0.032 0.025 0.039 0.037 0.012 0.063 𝑥1→ 𝑥3→ 𝑥4→ 𝑥2 0.069 0.037 0.213 0.027 0.058 0.068 0.058 0.100 0.029 0.060 0.089 0.035 0.024 0.048 0.023 0.070 𝑥1→ 𝑥4→ 𝑥2→ 𝑥3 0.072 0.048 0.212 0.030 0.060 0.054 0.056 0.088 0.029 0.052 0.085 0.027 0.024 0.061 0.023 0.079 𝑥1→ 𝑥4→ 𝑥3→ 𝑥2 0.075 0.048 0.230 0.028 0.050 0.060 0.050 0.087 0.023 0.049 0.072 0.029 0.031 0.057 0.030 0.083 𝑥2→ 𝑥1→ 𝑥3→ 𝑥4 0.012 0.030 0.271 0.029 0.047 0.071 0.069 0.097 0.089 0.065 0.029 0.030 0.036 0.042 0.011 0.075 𝑥2→ 𝑥1→ 𝑥4→ 𝑥3 0.035 0.045 0.269 0.031 0.029 0.054 0.071 0.093 0.064 0.052 0.031 0.026 0.053 0.061 0.008 0.078 𝑥2→ 𝑥3→ 𝑥1→ 𝑥4 0.011 0.034 0.259 0.033 0.055 0.066 0.074 0.090 0.080 0.075 0.027 0.034 0.042 0.039 0.012 0.069 𝑥2→ 𝑥3→ 𝑥4→ 𝑥1 0.013 0.026 0.304 0.024 0.051 0.062 0.077 0.082 0.096 0.057 0.032 0.025 0.039 0.037 0.012 0.063 𝑥2→ 𝑥4→ 𝑥1→ 𝑥3 0.035 0.040 0.301 0.027 0.029 0.048 0.080 0.079 0.074 0.043 0.035 0.022 0.061 0.051 0.009 0.066 𝑥2→ 𝑥4→ 𝑥3→ 𝑥1 0.026 0.051 0.298 0.024 0.035 0.043 0.077 0.082 0.074 0.044 0.032 0.025 0.058 0.055 0.012 0.064 𝑥3→ 𝑥1→ 𝑥2→ 𝑥4 0.013 0.028 0.293 0.026 0.052 0.062 0.079 0.082 0.093 0.062 0.031 0.027 0.040 0.037 0.012 0.063 𝑥3→ 𝑥1→ 𝑥4→ 𝑥2 0.066 0.042 0.204 0.025 0.065 0.063 0.064 0.093 0.026 0.069 0.081 0.041 0.027 0.044 0.027 0.065 𝑥3→ 𝑥2→ 𝑥1→ 𝑥4 0.010 0.034 0.267 0.031 0.053 0.064 0.073 0.094 0.076 0.075 0.028 0.032 0.041 0.038 0.011 0.072 𝑥3→ 𝑥2→ 𝑥4→ 𝑥1 0.013 0.026 0.304 0.024 0.051 0.062 0.077 0.082 0.096 0.057 0.032 0.025 0.039 0.037 0.012 0.063 𝑥3→ 𝑥4→ 𝑥1→ 𝑥2 0.078 0.031 0.239 0.019 0.064 0.058 0.064 0.086 0.031 0.052 0.097 0.030 0.026 0.041 0.025 0.059 𝑥3→ 𝑥4→ 𝑥2→ 𝑥1 0.035 0.071 0.218 0.017 0.057 0.069 0.076 0.081 0.055 0.033 0.069 0.054 0.036 0.035 0.015 0.078 𝑥4→ 𝑥1→ 𝑥2→ 𝑥3 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 0.625 𝑥4→ 𝑥1→ 𝑥3→ 𝑥2 0.082 0.042 0.254 0.025 0.055 0.052 0.054 0.076 0.027 0.041 0.082 0.024 0.035 0.047 0.035 0.070 𝑥4→ 𝑥2→ 𝑥1→ 𝑥3 0.051 0.064 0.232 0.025 0.042 0.076 0.062 0.074 0.050 0.031 0.067 0.033 0.042 0.037 0.018 0.099 𝑥4→ 𝑥2→ 𝑥3→ 𝑥1 0.040 0.080 0.224 0.018 0.053 0.064 0.070 0.074 0.051 0.030 0.063 0.049 0.044 0.042 0.016 0.085 𝑥4→ 𝑥3→ 𝑥1→ 𝑥2 0.080 0.047 0.244 0.028 0.057 0.051 0.056 0.074 0.026 0.043 0.080 0.026 0.036 0.049 0.035 0.071 𝑥4→ 𝑥3→ 𝑥2→ 𝑥1 0.041 0.082 0.239 0.019 0.050 0.060 0.066 0.071 0.045 0.027 0.057 0.044 0.045 0.042 0.018 0.095

(13)

6

由例 1 可知,有四種取樣順序能進行 PCGS 以獲得目標聯合 pdf 的樣本點, 除 了 van Dyk and Park (2008) 所 提 到 的 取 樣 順 序𝑥2 → 𝑥3 → 𝑥4 → 𝑥1, 還 有 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4、𝑥1 → 𝑥3 → 𝑥2 → 𝑥4、𝑥3 → 𝑥2 → 𝑥4 → 𝑥1,我們可以知道 PCGS 雖然比傳統的 GS 在條件 pdf 的選擇上更富彈性,但先決條件是必須知道哪一個 取樣順序所對應的平穩 pdf 是目標聯合 pdf,因此我們需要有一個理論的方法來 選取適當的取樣順序。 此外,我們也發現並非任何條件 pdf 的組合都可以進行 PCGS,簡例如下: 例2. 設目標聯合 pdf 為 (𝑥1, 𝑥2, 𝑥3) (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑓{1,2,3} 0.05 0.15 0.2 0.1 0.15 0.15 0.15 0.05 考慮一條件模型{𝑓{1}|{2,3}, 𝑓{2}|{1,3}, 𝑓{3}},由於有 3 個變數,因此共有3! = 6種取樣 順序,每一取樣順序所對應的平穩 pdf 之理論解如下表。 取樣順序 (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑥1 → 𝑥2 → 𝑥3 0.055 0.134 0.221 0.089 0.138 0.168 0.138 0.056 𝑥1 → 𝑥3 → 𝑥2 0.101 0.152 0.169 0.078 0.101 0.152 0.169 0.078 𝑥2 → 𝑥1 → 𝑥3 0.100 0.148 0.176 0.076 0.100 0.148 0.176 0.076 𝑥2 → 𝑥3 → 𝑥1 0.063 0.190 0.165 0.082 0.127 0.127 0.185 0.062 𝑥3 → 𝑥1 → 𝑥2 0.046 0.163 0.182 0.109 0.156 0.141 0.156 0.047 𝑥3 → 𝑥2 → 𝑥1 0.047 0.142 0.207 0.104 0.153 0.153 0.146 0.049 由例 2 可知,沒有一個取樣順序能進行 PCGS 以獲得目標聯合 pdf 的樣本點。綜 合例 1 與例 2 的說明,我們必須有一個定理來幫助我們查核給定的條件 pdf 是否 能進行 PCGS,同時該定理也需提供適當取樣順序的資訊,我們將在 3.2 節中賦 予這個定理。 讀者是否已經察覺本研究的問題與 PCGS 的關聯性呢?當給定一不完全條 件模型{𝑔{𝑖}|𝐶𝑖: 1 ≤ 𝑖 ≤ 𝑑}時,我們可以先使用 3.2 節的定理 3 檢查此條件模型是

(14)

7 否能進行 PCGS,若能,則透過適當的取樣順序,我們必能得到一聯合 pdf 𝑓{1,…,𝑑} 的訊息。接著,若{𝑔{𝑖}|𝐶𝑖: 1 ≤ 𝑖 ≤ 𝑑}是相容的,則必須有𝑓{𝑖}|𝐶𝑖 = 𝑔{𝑖}|𝐶𝑖,這就是 本研究的核心思維。然而,我們僅能在離散型的情況下獲得𝑓{1,…,𝑑}的封閉解,在 連續型的情形下,通常無法直接求得𝑓{1,…,𝑑},幸好我們可以透過 PCGS 取得𝑓{1,…,𝑑} 的樣本點,雖然樣本點可以無止盡地取得,也可利用一些方法建立經驗 pdf (empirical pdf),但在實務操作上,要檢查𝑓{𝑖}|𝐶𝑖 = 𝑔{𝑖}|𝐶𝑖也並非易事,因此我們 需要一個理論的方法幫助我們檢定這些樣本點可以符合任一個𝑔{𝑖}|𝐶𝑖。就我們所 知,沒有任何文獻提供檢定的方法,文獻中多半的方法是討論檢定樣本點是否來 自某一聯合 pdf,而沒有記載方法可以檢定樣本點是否吻合某一條件 pdf,因此 我們將在 3.3 節提出檢定的理論。 3.2. PCGS 與取樣順序的選擇 我們的方法是想透過 PCGS 所對應的平穩 pdf 來作為檢驗相容性的基礎,因 此適合我們方法的不完全條件模型就必須能進行 PCGS 且其對應的平穩 pdf 就是 目標的聯合 pdf。

Gelman and Speed (1993, 1999)對於相容的條件模型是否唯一對應一聯合 pdf 建立以下的充分條件。

引理 1. 給定𝑋 = (𝑋1, … , 𝑋𝑑)的條件模型ℳ,若存在𝑋的排序𝑌 = (𝑌1, … , 𝑌𝑑)使得 ℳ = {𝑝𝑖(𝑦𝑖|𝐵𝑖, 𝑦>𝑖): 𝐵𝑖 ⊆ {𝑦1, … , 𝑦𝑖−1}, 1 ≤ 𝑖 ≤ 𝑑},其中𝑦>𝑖 = {𝑦𝑖+1, … , 𝑦𝑑}, 則ℳ僅對應唯一的聯合 pdf。

然而,對於條件模型是否能基於 PCGS 得到目標聯合 pdf,Gelman and Speed 所 提 出 的 充 分 條 件 並 不 夠 。 以 例 2 來 說 , 給 定 條 件 模 型 ℳ = {𝑓(𝑥1|𝑥2, 𝑥3), 𝑓(𝑥2|𝑥1, 𝑥3), 𝑓(𝑥3)},令𝑦𝑖 = 𝑥𝑖,1 ≤ 𝑖 ≤ 3。此時𝐵1 = ∅, 𝐵2 = {𝑦1}, 𝐵3 = ∅,條件模型ℳ滿足引理 1 的條件,但是從例 2 的結果可知,並沒有 一個取樣順序能對應目標聯合 pdf。因此我們必須對𝐵𝑖加入一些限制,於是有以 下定理。

(15)

8 定理 2. 給定一相容的條件模型ℳ = {𝑓(𝑥𝑖|𝐵𝑖, 𝑥>𝑖): 𝐵𝑖 ⊆ {𝑥1, … , 𝑥𝑖−1}, 1 ≤ 𝑖 ≤ 𝑑}, 若∅ = 𝐵1 ⊆ 𝐵2 ⊆ ⋯ ⊆ 𝐵𝑑,則ℳ能以取樣順序𝑥𝑑 → 𝑥𝑑−1 → ⋯ → 𝑥1獲得目標 聯合 pdf 的樣本。 證明:取樣順序𝑥𝑑 → ⋯ → 𝑥1的轉移核(transition kernel)為 𝐾((𝑥1, … , 𝑥𝑑), (𝑥1∗, … , 𝑥𝑑∗)) = 𝑓(𝑥𝑑∗|𝐵𝑑)𝑓(𝑥𝑑−1∗ |𝐵𝑑−1, 𝑥𝑑∗) ⋯ 𝑓(𝑥1∗|𝑥>1∗ ) 因此我們有 ∫ 𝑓(𝑥1, … , 𝑥𝑑)𝐾((𝑥1, … , 𝑥𝑑), (𝑥1∗, … , 𝑥𝑑∗)) 𝑑𝑥𝑑⋯ 𝑑𝑥1 = ∫ 𝑓(𝑥1, … , 𝑥𝑑) 𝑓(𝑥𝑑|𝐵 𝑑)𝑓(𝑥𝑑−1∗ |𝐵𝑑−1, 𝑥𝑑∗) ⋯ 𝑓(𝑥1∗|𝑥>1∗ )𝑑𝑥𝑑⋯ 𝑑𝑥1 = ∫ 𝑓(𝐵𝑑)𝑓(𝑥𝑑|𝐵 𝑑)𝑓(𝑥𝑑−1∗ |𝐵𝑑−1, 𝑥𝑑∗) ⋯ 𝑓(𝑥1∗|𝑥>1∗ )𝑑𝐵𝑑 = ∫ 𝑓(𝐵𝑑, 𝑥𝑑) 𝑓(𝑥 𝑑−1∗ |𝐵𝑑−1, 𝑥𝑑∗) ⋯ 𝑓(𝑥1∗|𝑥>1∗ )𝑑𝐵𝑑 = ∫ 𝑓(𝐵𝑑−1, 𝑥𝑑) 𝑓(𝑥 𝑑−1∗ |𝐵𝑑−1, 𝑥𝑑∗) ⋯ 𝑓(𝑥1∗|𝑥>1∗ )𝑑𝐵𝑑−1 = ∫ 𝑓(𝐵𝑑−1, 𝑥≥𝑑−1) ⋯ 𝑓(𝑥 1∗|𝑥>1∗ )𝑑𝐵𝑑−1= ⋯ = ∫ 𝑓(𝐵2, 𝑥≥2)𝑓(𝑥 1∗|𝑥>1∗ ) 𝑑𝐵2 = 𝑓(𝑥≥2∗ )𝑓(𝑥1∗|𝑥>1∗ ) = 𝑓(𝑥1∗, … , 𝑥𝑑∗) 其中上述各等式成立的主要原因是∅ = 𝐵1 ⊆ 𝐵2 ⊆ ⋯ ⊆ 𝐵𝑑,因此𝑓(𝑥1, … , 𝑥𝑑)為所 對應的平穩 pdf。 ■ 定理 2 的取樣過程如下: 𝑥𝑑(𝑡) ~ 𝑓(𝑥𝑑|𝐵𝑑) 𝑥𝑑−1(𝑡) ~ 𝑓(𝑥𝑑−1|𝐵𝑑−1, 𝑥𝑑(𝑡)) 𝑥𝑑−2(𝑡) ~ 𝑓(𝑥𝑑−2|𝐵𝑑−2, 𝑥𝑑−1(𝑡) , 𝑥𝑑(𝑡)) ⋮ 𝑥2(𝑡) ~ 𝑓(𝑥2|𝐵2, 𝑥3(𝑡), … , 𝑥𝑑(𝑡)) 𝑥1(𝑡) ~ 𝑓(𝑥1|𝑥2(𝑡), … , 𝑥𝑑(𝑡)) 直 觀 的 意 義 為 取 樣 排 序 在 後 的 非 條 件 變 數 ( 以𝑥𝑑−2為 例 ), 其 條 件 變 數 (𝐵𝑑−2, 𝑥𝑑−1, 𝑥𝑑)的給值設定必須包含(i)排序在其之前的所有非條件變數的更新

(16)

9 值(𝑥𝑑−1(𝑡) , 𝑥𝑑(𝑡))與(ii)尚未更新的變數(𝐵𝑑−2)使用第𝑡 − 1次疊代的產出值。假 設𝑥𝑖 ∈ 𝐵𝑑−1但𝑥𝑖 ∉ 𝐵𝑑,在疊代的過程中,𝑥𝑑(𝑡)的產生與𝑥𝑖(𝑡−1)無關,但𝑥𝑑−1(𝑡) 的產 生卻與𝑥𝑖(𝑡−1)有關,這種現象導致 PCGS 的平穩 pdf 與目標聯合 pdf 不同。 以例 2 來說,由於𝐵1 = ∅, 𝐵2 = {𝑦1}, 𝐵3 = ∅,此時條件模型ℳ滿足引理 1, 但𝐵2 ⊈ 𝐵3,因此不滿足定理 2,於是我們看到所有的取樣順序所對應的平穩 pdf 皆與目標聯合 pdf 不同。 藉由定理 2 我們已知條件模型是否能基於 PCGS 獲取目標聯合 pdf 的充分條 件,但在實務操作時,我們該如何選取合適的取樣順序呢?下面定理 3 解決了這 個問題。 定理 3. 給定一條件模型{𝑓(𝑥𝑖|𝐶𝑖): 𝐶𝑖 ⊆ {𝑥1, … , 𝑥𝑖−1, 𝑥𝑖+1, … , 𝑥𝑑}, 1 ≤ 𝑖 ≤ 𝑑},若存 在一排序(𝑥𝑖1, … , 𝑥𝑖𝑑)使得 (i) 𝐶𝑖1 = {𝑥1, … , 𝑥𝑑}\{𝑥𝑖1},即條件模型中至少存在一完全條件 pdf; (ii) 𝐶𝑖𝑗 ⊆ {𝑥𝑖𝑗+1} ∪ 𝐶𝑖𝑗+1; 則取樣順序𝑥𝑖𝑑 → ⋯ → 𝑥𝑖1所對應的平穩 pdf 為目標聯合 pdf。 證明:藉由(i)跟(ii),我們可知𝐶𝑖𝑗 ⊇ {𝑥𝑖>𝑗}且𝑓(𝑥𝑖1|𝐶𝑖1)為一完全條件模型,因此 𝑓 (𝑥𝑖𝑗|𝐶𝑖𝑗) = 𝑓(𝑥𝑖𝑗|𝑥𝑖>𝑗, 𝐵𝑖𝑗), 其中𝐵𝑖𝑗 = 𝐶𝑖𝑗∖ 𝑥𝑖>𝑗 ⊆ ({𝑥𝑖𝑗+1} ∪ 𝐶𝑖𝑗+1) ∖ 𝑥𝑖>𝑗 = 𝐶𝑖𝑗+1 ∖ {𝑥𝑖𝑗+1} = 𝐵𝑖𝑗+1,滿足定理 2 的充分條件。 ■ 3.3. 針對條件 pdf 的單樣本檢定 在數理統計中記載著一個定理:若𝐹是隨機變數𝑋的累積分佈函數(以下簡 寫成 cdf),且𝐹是可逆的(invertible),則𝐹(𝑋)具有在[0,1]上的均勻分佈(uniformly distribution),此分佈我們記作𝒰[0,1]。這個定理可應用於檢定樣本點是否吻合𝐹, 假設我們有一樣本{𝑥1, … , 𝑥𝑛},經過𝐹轉換成{𝐹(𝑥1), … , 𝐹(𝑥𝑛)},接著使用單樣本

(17)

10 檢 定 的 方 法 , 如 Kolmogorov-Smirnov ( 縮 寫 成 KS ) 檢 定 法 , 來 檢 驗 {𝐹(𝑥1), … , 𝐹(𝑥𝑛)}是否來自𝒰[0,1],若檢定結果為拒絕,則表示樣本{𝑥1, … , 𝑥𝑛}不 能吻合𝐹。 我們的目標是想檢定樣本{(𝑥1𝑗, … , 𝑥𝑑𝑗): 1 ≤ 𝑗 ≤ 𝑛}是否吻合某一條件 pdf 𝑔{𝑖}|{𝑘1,𝑘2},初步的構想為:假定我們可以求得𝑔{𝑖}|{𝑘1,𝑘2}的條件 cdf 𝐺{𝑖}|{𝑘1,𝑘2},按 照前述的過程,我們計算{𝐺{𝑖}|{𝑘1,𝑘2}(𝑥𝑖𝑗|𝑥𝑘1𝑗, 𝑥𝑘2𝑗): 1 ≤ 𝑗 ≤ 𝑛},再用 KS 檢定法 來檢定{𝐺{𝑖}|{𝑘1,𝑘2}(𝑥𝑖𝑗|𝑥𝑘1𝑗, 𝑥𝑘2𝑗): 1 ≤ 𝑗 ≤ 𝑛}是否來自𝒰[0,1],若檢定結果為拒絕, 則表示樣本{(𝑥1𝑗, … , 𝑥𝑑𝑗): 1 ≤ 𝑗 ≤ 𝑛}不能吻合𝑔{𝑖}|{𝑘1,𝑘2}。 要實現這個構想,我們需要下面的定理。為了簡單起見,我們用二維的寫法 來陳述定理。 定理 4. 若𝐹𝑋1|𝑋2是隨機向量(𝑋1, 𝑋2)的條件 cdf,且𝐹𝑋1|𝑋2是可逆的,則𝐹𝑋1|𝑋2(𝑋1|𝑋2) 具有在[0,1]上的均勻分佈。 證明:令𝑌 = 𝐹𝑋1|𝑋2(𝑋1|𝑋2)為隨機向量(𝑋1, 𝑋2)的轉換,則我們有 𝐹𝑌(𝑦) = Pr(𝑌 ≤ 𝑦) = Pr(𝐹𝑋1|𝑋2(𝑋1|𝑋2) ≤ 𝑦) = ∫ Pr ((𝐹𝑋1|𝑋2(𝑋1|𝑥2) ≤ 𝑦)|𝑥2) 𝑓(𝑥2)𝑑𝑥2 𝑆2 = ∫ 𝑦 𝑓(𝑥2)𝑑𝑥2 𝑆2 = 𝑦 其中𝑓(𝑥2),𝑥2 ∈ 𝑆2,是𝑋2的 pdf。因此𝑌~𝒰[0,1]。 ■ 定理 4 可推廣至任何維度,對連續型的隨機向量,本定理提供一個適當的轉 換與𝒰[0,1]形成關係。原本要考驗一筆資料{(𝑥1𝑗, 𝑥2𝑗): 1 ≤ 𝑗 ≤ 𝑛}是否滿足某一條 件 cdf 𝐺{1}|{2},必須先從資料找到不同的𝑥2𝑗,再對每一𝑥2𝑗去找到對應的𝑥1𝑗,然 後進行 KS 檢定,然而在實務應用上,每一𝑥2𝑗所找到對應的𝑥1𝑗很有限,常常僅 有一個,因此無法有效地進行 KS 檢定。然而,定理 4 突破這樣的限制,可將所 有資料代入𝐺{1}|{2},並將這些值進行 KS 檢定,看看是否吻合𝒰[0,1]。顯然,這 樣的方式較符合實際應用。

(18)

11 3.4. 不完全條件模型之相容性檢驗的流程圖 {𝑔{𝑖}|𝐶𝑖: 1 ≤ 𝑖 ≤ 𝑑} 條件模型 使用定理 3 選取合適的取樣順 序,若沒有適合的,則流程結束。 連續型: 進 行 吉 式 取 樣 獲 得 樣 本,用定理 4 檢定樣本是 否滿足模型中每一個條 件 pdf 對應之 cdf。 離散型: 計算該取樣順序所對應 的平穩 pdf,再求得其條 件 pdf 是否滿足模型中 每一個條件 pdf。

(19)

12

第四章 實例操作

在本章中,我們將用實例對第三章的方法予與運用,包含離散型及連續型的 情況。 例3. 假設給定一條件模型{𝑔{1}|{2,3}, 𝑔{2}|{3}, 𝑔{3}|{1}},其中 (𝑥1, 𝑥2, 𝑥3) (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑔{1}|{2,3} 1/4 3/4 1/3 2/3 1/4 3/4 1/2 1/2 (𝑥2, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑔{2}|{3} 2/5 3/5 2/5 3/5 (𝑥1, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑔{3}|{1} 3/7 7/13 4/7 6/13 透 過 定 理 3 , 我 們 知 道 條 件 模 型{𝑔{1}|{2,3}, 𝑔{2}|{3}, 𝑔{3}|{1}} 可 使 用 取 樣 順 序 𝑥3 → 𝑥2 → 𝑥1來進行吉氏取樣,在本例中,由於是離散型的情況,我們可藉由下 面的計算獲得該取樣順序所對應的平穩 pdf(stationary pdf)。令𝑇1, 𝑇2, 𝑇3分別代 表基於𝑔{1}|{2,3}, 𝑔{2}|{3}, 𝑔{3}|{1}所對應的轉移矩陣(transition matrix),如下所示: 𝑇1 = ( 1/4 3/4 0 0 0 0 0 0 1/4 3/4 0 0 0 0 0 0 0 0 1/3 2/3 0 0 0 0 0 0 1/3 2/3 0 0 0 0 0 0 0 0 1/4 3/4 0 0 0 0 0 0 1/4 3/4 0 0 0 0 0 0 0 0 1/2 1/2 0 0 0 0 0 0 1/2 1/2) 𝑇2 = ( 2/5 0 3/5 0 0 0 0 0 0 2/5 0 3/5 0 0 0 0 2/5 0 3/5 0 0 0 0 0 0 2/5 0 3/5 0 0 0 0 0 0 0 0 2/5 0 3/5 0 0 0 0 0 0 2/5 0 3/5 0 0 0 0 2/5 0 3/5 0 0 0 0 0 0 2/5 0 3/5)

(20)

13 𝑇3 = ( 3/7 0 0 0 4/7 0 0 0 0 7/13 0 0 0 6/13 0 0 0 0 3/7 0 0 0 4/7 0 0 0 0 7/13 0 0 0 6/13 3/7 0 0 0 4/7 0 0 0 0 7/13 0 0 0 6/13 0 0 0 0 3/7 0 0 0 4/7 0 0 0 0 7/13 0 0 0 6/13) 取樣順序𝑥3 → 𝑥2 → 𝑥1所對應的轉移矩陣為𝑇3𝑇2𝑇1,因此所對應的平穩 pdf 為 (𝑥1, 𝑥2, 𝑥3) (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑓{1,2,3} 1/20 3/20 2/20 4/20 3/20 3/20 3/20 2/10 計算平穩 pdf 𝑓{1,2,3}的條件 pdf 𝑓{1}|{2,3}、𝑓{2}|{3}、𝑓{3}|{1}如下: (𝑥1, 𝑥2, 𝑥3) (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑓{1}|{2,3} 1/4 3/4 1/3 2/3 1/4 3/4 1/2 1/2 (𝑥2, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑓{2}|{3} 2/5 3/5 2/5 3/5 (𝑥1, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑓{3}|{1} 3/7 7/13 4/7 6/13 由 於𝑓{1}|{2,3} = 𝑔{1}|{2,3}、𝑓{2}|{3}= 𝑔{2}|{3}、𝑓{3}|{1} = 𝑔{3}|{1}, 因 此 條 件 模 型 {𝑔{1}|{2,3}, 𝑔{2}|{3}, 𝑔{3}|{1}}是相容的。 例4. 考 慮 例 3 的 條 件 模 型 , 但 改 變𝑔{2}|{3} 使 得 新 的 條 件 模 型 為 {𝑔{1}|{2,3}, 𝑔̈{2}|{3}, 𝑔{3}|{1}},其中𝑔̈{2}|{3}如下: (𝑥2, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑔̈{2}|{3} 1/5 4/5 2/5 3/5 取樣順序𝑥3 → 𝑥2 → 𝑥1所對應的平穩 pdf 為

(21)

14 (𝑥1, 𝑥2, 𝑥3) (0,0,0) (1,0,0) (0,1,0) (1,1,0) (0,0,1) (1,0,1) (0,1,1) (1,1,1) 𝑓{1,2,3} 135 5410 405 5410 720 5410 1440 5410 271 5410 813 5410 813 5410 813 5410 計算平穩 pdf 𝑓{1,2,3}的條件 pdf 𝑓{2}|{3}如下: (𝑥2, 𝑥3) (0,0) (1,0) (0,1) (1,1) 𝑓{2}|{3} 540 2700 2160 2700 1084 2710 1626 2710 由於𝑓{2}|{3}≠ 𝑔̈{2}|{3},因此條件模型{𝑔{1}|{2,3}, 𝑔̈{2}|{3}, 𝑔{3}|{1}}是不相容的。 例5. 假設給定一條件模型{𝑔{1}|{2,3,4}, 𝑔{2}|{3,4}, 𝑔{3}|{2,4}, 𝑔{4|1,2,3}},其中 𝑥1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 𝑥2 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 𝑥3 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 𝑥4 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 𝑔{1}|{2,3,4} 0.63 0.38 0.14 0.86 0.37 0.63 0.14 0.86 0.33 0.67 0.22 0.78 0.45 0.55 0.59 0.41 𝑥2 0 1 0 1 0 1 0 1 𝑥3 0 0 1 1 0 0 1 1 𝑥4 0 0 0 0 1 1 1 1 𝑔{2}|{3,4} 0.53 0.47 0.58 0.42 0.40 0.60 0.54 0.46 𝑥2 0 1 0 1 0 1 0 1 𝑥3 0 0 1 1 0 0 1 1 𝑥4 0 0 0 0 1 1 1 1 𝑔{3}|{2,4} 0.30 0.33 0.70 0.67 0.23 0.35 0.77 0.65 𝑥1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 𝑥2 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 𝑥3 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 𝑥4 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 𝑔{4}|{1,2,3} 0.71 0.43 0.33 0.46 0.44 0.52 0.17 0.63 0.29 0.57 0.67 0.54 0.56 0.48 0.83 0.37

(22)

15 透過定理 3,我們知道條件模型{𝑔{1}|{2,3,4}, 𝑔{2}|{3,4}, 𝑔{3}|{2,4}, 𝑔{4|1,2,3}}可使用取樣 順序𝑥2 → 𝑥3 → 𝑥1 → 𝑥4、𝑥3 → 𝑥2 → 𝑥1 → 𝑥4、𝑥4 → 𝑥2 → 𝑥3 → 𝑥1、𝑥4 → 𝑥3 → 𝑥2 → 𝑥1來進行吉氏取樣,在本例中,由於是離散型的情況,每一取樣順序所對應的平 穩 pdf 之理論解如下表。 𝑥1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 0 1 𝑥2 0 0 1 1 0 0 1 1 0 0 1 1 0 0 1 1 𝑥3 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 𝑥4 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 取樣順序: 𝑥2 → 𝑥3 → 𝑥1 → 𝑥4 𝑓{1,2,3,4} 0.05 0.03 0.01 0.06 0.07 0.12 0.02 0.12 0.02 0.04 0.02 0.07 0.09 0.11 0.10 0.07 取樣順序: 𝑥3 → 𝑥2 → 𝑥1 → 𝑥4 𝑓{1,2,3,4} 0.05 0.03 0.01 0.06 0.07 0.12 0.02 0.12 0.02 0.04 0.02 0.07 0.09 0.11 0.10 0.07 取樣順序: 𝑥4 → 𝑥2 → 𝑥3 → 𝑥1 𝑓{1,2,3,4} 0.05 0.03 0.01 0.06 0.07 0.12 0.02 0.12 0.02 0.04 0.02 0.07 0.09 0.11 0.10 0.07 取樣順序: 𝑥4 → 𝑥3 → 𝑥2 → 𝑥1 𝑓{1,2,3,4} 0.05 0.03 0.01 0.06 0.07 0.12 0.02 0.12 0.02 0.04 0.02 0.07 0.09 0.11 0.10 0.07 由上表可知,以上這四種取樣順序所對應的平穩 pdf 皆相同,由於𝑓{1}|{2,3,4}= 𝑔{1}|{2,3,4}、𝑓{2}|{3,4} = 𝑔{2}|{3,4}、𝑓{3}|{2,4}= 𝑔{3}|{2,4}、𝑓{4}|{1,2,3} = 𝑔{4}|{1,2,3},因此 條件模型{𝑔{1}|{2,3,4}, 𝑔{2}|{3,4}, 𝑔{3}|{2,4}, 𝑔{4|1,2,3}}是相容的。 例 6. 假設(𝑋1, 𝑋2, 𝑋3, 𝑋4)具有四維的常態分佈,其均數向量為(−1,2,5,10),共變 異數矩陣為 ( 1 1 1 1 1 3 2 3 1 2 2 2 1 3 2 4 ) 用此常態分佈建構一條件模型{𝑔{1}|{2,3,4}, 𝑔{2}|{1,3}, 𝑔{3}|{1,2}, 𝑔{4}|{1,2,3}},其中 𝑔{1}|{2,3,4}~𝑁 (−72+𝑥3 2 , 1 2), 𝑔{2}|{1,3}~𝑁(𝑥3− 3,1), 𝑔{3}|{1,2}~𝑁 ( 9 2+ 𝑥1 2 + 𝑥2 2 , 1 2), 𝑔{4}|{1,2,3}~𝑁(𝑥2+ 8,1) 透過定理 3,我們知道此條件模型可使用四種取樣順序𝑥3 → 𝑥2 → 𝑥4 → 𝑥1、

(23)

16 𝑥2 → 𝑥3 → 𝑥4 → 𝑥1、𝑥1 → 𝑥3 → 𝑥2 → 𝑥4、𝑥1 → 𝑥2 → 𝑥3 → 𝑥4來進行吉氏取樣, 然而要計算這些取樣順序所對應的平穩 pdf 並不容易,因此我們直接進行吉氏取 樣。對任一取樣順序,假定所產生的樣本為{(𝑥1𝑡, 𝑥2𝑡, 𝑥3𝑡, 𝑥4𝑡): 1 ≤ 𝑡 ≤ 𝑇}。在本 例中,我們產生𝑇 = 5000個樣本點,透過這些樣本點,我們計算樣本均數向量 與樣本共變異數矩陣,結果如下表: 取樣順序 樣本均數向量 樣本共變異數矩陣 𝑥3 → 𝑥2 → 𝑥4 → 𝑥1 (−0.995,2.013,4.999,9.991) ( 1.024 1.025 1.020 1.035 1.025 2.987 2.031 2.998 1.020 2.031 2.052 2.036 1.035 2.998 2.036 4.010 ) 𝑥2 → 𝑥3 → 𝑥4 → 𝑥1 (−0.992,1.974,4.990,9.978) ( 1.001 1.020 1.014 1.010 1.020 3.043 2.018 3.023 1.014 2.018 2.017 2.007 1.010 3.023 2.007 4.015 ) 𝑥1 → 𝑥3 → 𝑥2 → 𝑥4 (−1.007,1.999,5.000,9.992) ( 0.978 0.982 0.978 0.984 0.982 2.916 1.964 2.962 0.978 1.964 1.960 1.996 0.984 2.962 1.996 4.022 ) 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4 (−0.987,2.007,4.998,10.001) ( 1.050 1.061 1.044 1.049 1.061 3.073 2.056 3.043 1.044 2.056 2.034 2.039 1.049 3.043 2.039 4.017 ) 從上表約略可看出四種取樣順序所得到的樣本均數向量與樣本共變異數矩陣都 與原設定的均數向量與共變異數矩陣相近,然而現實的情況是我們並不知道目標 聯合分佈的資訊,只知{𝑔{1}|{2,3,4}, 𝑔{2}|{1,3}, 𝑔{3}|{1,2}, 𝑔{4}|{1,2,3}},因此暫不能透過 上表作任何結論。 由 於 條 件 模 型 裡 的 條 件 pdf 皆 為 常 態 pdf , 設 其 對 應 的 條 件 cdf 為 {𝐺{1}|{2,3,4}, 𝐺{2}|{1,3}, 𝐺{3}|{1,2}, 𝐺{4}|{1,2,3}},令 𝜋1𝑡 = 𝐺{1}|{2,3,4}(𝑥1𝑡|𝑥2𝑡, 𝑥3𝑡, 𝑥4𝑡) 𝜋2𝑡 = 𝐺{2}|{1,3}(𝑥2𝑡|𝑥1𝑡, 𝑥3𝑡) 𝜋3𝑡 = 𝐺{3}|{1,2}(𝑥3𝑡|𝑥1𝑡, 𝑥2𝑡) 𝜋4𝑡 = 𝐺{4}|{1,2,3}(𝑥4𝑡|𝑥1𝑡, 𝑥2𝑡, 𝑥3𝑡) 根據定理 4,{𝜋1𝑡}、{𝜋2𝑡}、{𝜋3𝑡}、{𝜋4𝑡}應該均具有 𝒰[0,1],我們使用 KS 檢定

(24)

17 來進行檢驗,下表列出每個檢驗的 p 值。 取樣順序 {𝜋1𝑡} {𝜋2𝑡} {𝜋3𝑡} {𝜋4𝑡} 𝑥3 → 𝑥2 → 𝑥4 → 𝑥1 0.714 0.327 0.338 0.208 𝑥2 → 𝑥3 → 𝑥4 → 𝑥1 0.345 0.501 0.932 0.503 𝑥1 → 𝑥3 → 𝑥2 → 𝑥4 0.381 0.683 0.783 0.950 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4 0.213 0.597 0.140 0.834 由上表可知,所有檢驗的結果皆不拒絕{𝜋1𝑡}、{𝜋2𝑡}、{𝜋3𝑡}、{𝜋4𝑡}均具有 𝒰[0,1], 也就是說,任一取樣順序的樣本均滿足{𝐺{1}|{2,3,4}, 𝐺{2}|{1,3}, 𝐺{3}|{1,2}, 𝐺{4}|{1,2,3}}, 因此我們有證據宣稱條件模型{𝑔{1}|{2,3,4}, 𝑔{2}|{1,3}, 𝑔{3}|{1,2}, 𝑔{4}|{1,2,3}}是相容的。 例 7. 考 慮 例 6 的 條 件 模 型 , 但 改 變𝑔{2}|{1,3}使 得 新 的 條 件 模 型 為 {𝑔{1}|{2,3,4}, 𝑔̈{2}|{1,3}, 𝑔{3}|{1,2}, 𝑔{4}|{1,2,3}} ,其中𝑔̈{2}|{1,3}~𝑁(𝑥3− 3,2)。重複例 6 的 步驟,我們得到下表: 取樣順序 {𝜋1𝑡} {𝜋2𝑡} {𝜋3𝑡} {𝜋4𝑡} 𝑥3 → 𝑥2 → 𝑥4 → 𝑥1 0.419 0.688 𝟏. 𝟒 × 𝟏𝟎−𝟏𝟓 0.713 𝑥2 → 𝑥3 → 𝑥4 → 𝑥1 0.660 𝟏. 𝟑 × 𝟏𝟎−𝟏𝟑 0.356 0.245 𝑥1 → 𝑥3 → 𝑥2 → 𝑥4 0.008 0.593 𝟔. 𝟓 × 𝟏𝟎−𝟐𝟏 0.788 𝑥1 → 𝑥2 → 𝑥3 → 𝑥4 0.011 𝟓. 𝟐 × 𝟏𝟎−𝟏𝟒 0.198 0.662 由上表可知,每一取樣順序中皆至少有一{𝜋𝑖𝑡}不具有𝒰[0,1],因此我們宣稱條件 模型{𝑔{1}|{2,3,4}, 𝑔̈{2}|{1,3}, 𝑔{3}|{1,2}, 𝑔{4}|{1,2,3}}是不相容的。

(25)

18

第五章 結論

完全條件模型之相容性的檢驗方法已趨於成熟,且累積諸多文獻可供參考應 用,其主要利用的概念在第二章已說明。然而要將這些概念推廣至不完全條件模 型上並不直觀,因此我們在這篇論文中首先提出可行的檢驗策略,見第三章的說 明。同時我們方法可應用於離散型以及連續型的情況,實例操作見第四章,從結 果可知我們的方法確實能夠檢驗部分不完全條件模型之相容性。 另一方面,傳統的吉氏取樣僅能在完全條件模型上執行,在本研究中,我們 的定理 3 說明吉氏取樣也能在一些不完全條件模型上進行。此外,取樣順序對於 不完全條件模型的吉氏取樣扮演極關鍵的角色,這一點是傳統吉氏取樣並不重視 的。 未來,有一些延伸的議題可以繼續討論,包括: (i) 不符合定理 3 的不完全條件模型如何進行取樣? (ii) 不符合定理 3 的不完全條件模型如何進行相容性檢驗? (iii) 定理 4 是否可以應用在複雜模型上來產生樣本? (iv) 結合引理 1 與定理 4,我們是否可以提出一個單筆高維度資料的適合度檢 定? 針對(iii),我們稍作說明。目前有一個已知的結果是假設隨機向量(𝑋1, … , 𝑋𝑑) 的一些條件 cdf 是知道的,如𝐹𝑋1, 𝐹𝑋2|𝑋1, 𝐹𝑋3|{𝑋1,𝑋2}, … , 𝐹𝑋𝑑|{𝑋1,…,𝑋𝑑−1},假設這些條 件 cdf 皆是可逆的,獨立生成𝑢𝑖 ~ 𝒰[0,1], 1 ≤ 𝑖 ≤ 𝑑,計算 𝑥1 = 𝐹𝑋−11 (𝑢 1) 𝑥2 = 𝐹𝑋2|𝑋1 −1 (𝑢 2|𝑥1) ⋮ 𝑥𝑑 = 𝐹𝑋−1𝑑|{𝑋1,…,𝑋𝑑−1}(𝑢 𝑑|𝑥1, … , 𝑥𝑑−1) 則(𝑥1, … , 𝑥𝑑)~(𝑋1, … , 𝑋𝑑)。如果給定其他條件 cdf 模型,同時假設所有條件 cdf 皆是可逆的,如何有一個過程可以產生(𝑋1, … , 𝑋𝑑)的樣本?相信這是一個有趣的 議題。

(26)

19 至於(iv),我們想檢定資料{(𝑥1𝑗, … , 𝑥𝑑𝑗): 1 ≤ 𝑗 ≤ 𝑛}是否來自某一分佈,經由 引理 1 我們可以找到一些條件 pdf 可以唯一決定我們想要檢定的分佈,若這些條 件 pdf 的條件 cdf 可以知道,再透過定理 4 對資料與每一條件 cdf 進行 KS 檢定, 若全部吻合𝒰[0,1],則我們應可宣稱資料{(𝑥1𝑗, … , 𝑥𝑑𝑗): 1 ≤ 𝑗 ≤ 𝑛}是來自我們假 設的分佈。相信這一作法應該比現有的高維度 KS 檢定方法更有效益。

(27)

20

參考文獻

Arnold, B. C., Castillo, E. and Sarabia, J. M. (2001). Conditionally specified distributions: an introduction (with discussions). Statistical Science, 16, 249-274. Arnold, B. C., Castillo, E. and Sarabia, J. M. (2002). Exact and near compatibility of

discrete conditional distributions. Computational Statistics and Data Analysis, 16, 231-252.

Arnold, B. C., Castillo, E. and Sarabia, J. M. (2004). Compatibility of partial or complete conditional probability specifications. Journal of Statistical Planning

and Inference, 123, 133-159.

Arnold, B. C. and Press, S. J. (1989). Compatible conditional distributions. Journal of

the American Statistical Association, 84, 52-156.

Chen, H. Y. (2010). Compatibility of conditionally specified models. Statistics and

Probability Letters, 80, 670-677.

Gelman, A. and Speed, T. P. (1993). Characterizing a joint probability distribution by conditionals. Journal of the Royal Statistical Society, Series B, 55, 185-188. Gelman, A. and Speed, T. P. (1999). Corrigendum: Characterizing a joint probability

distribution by conditionals. Journal of the Royal Statistical Society, Series B, 61, 483.

Ip, E. H. and Wang, Y. J. (2009). Canonical representation of conditionally specified multivariate discrete distributions. Journal of Multivariate Analysis, 100, 1282-1290.

Kuo, K.-L. and Wang, Y. J. (2011). A simple algorithm for checking compatibility among discrete conditional distributions. Computational Statistics and Data

(28)

21

Ng, K. W. (2011). Inversion of Bayes’ formula for events. In: Lovric, M. (Eds.),

International Encyclopedia of Statistical Science, pp. 690-695, Springer.

Park, T. and van Dyk, D. A. (2009). Partially collapsed Gibbs samplers: illustrations and applications. Journal of Computational and Graphical Statistics, 18, 283-305.

Slavkovic, A. B. and Sullivant, S. (2006). The space of compatible full conditionals is a unimodular toric variety. Journal of Symbolic Computation, 41, 196-209.

Song, C.-C., Li, L.-A., Chen, C.-H., Jiang, T. J. and Kuo, K.-L. (2010). Compatibility of finite discrete conditional distributions. Statistica Sinica, 20, 423-440.

Tian, G.-L. and Tan, M. (2003). Exact statistical solutions using the inverse Bayes formulae. Statistics and Probability Letters, 62, 305-315.

Tian, G., Tan, M., Ng, K. W. and Tang, M. (2009). A unified method for checking compatibility and uniqueness for finite discrete conditional distributions.

Communications in Statistics-Theory and Methods, 38, 115-129.

van Dyk, D. A. and Park, T. (2008). Partially collapsed Gibbs samplers: theory and methods. Journal of the American Statistical Association, 103, 790-796.

Wang, Y. J. (2012). Comparisons of three approaches for discrete conditional models.

Communications in Statistics-Simulation and Computation, 41, 32-43.

Wang, Y. J. and Kuo, K.-L. (2010). Compatibility of discrete conditional distributions with structural zeros. Journal of Multivariate Analysis, 101, 191-199.

Yao, Y.-C., Chen, S.-C. and Wang, S.-H. (2014). On compatibility of discrete full conditional distributions: a graphical representation approach. Journal of

參考文獻

相關文件

It has been well-known that, if △ABC is a plane triangle, then there exists a unique point P (known as the Fermat point of the triangle △ABC) in the same plane such that it

Keywords: Adaptive Lasso; Cross-validation; Curse of dimensionality; Multi-stage adaptive Lasso; Naive bootstrap; Oracle properties; Single-index; Pseudo least integrated

We are not aware of any existing methods for identifying constant parameters or covariates in the parametric component of a semiparametric model, although there exists an

In a nonparametric setting, we discuss identifiability of the conditional and un- conditional survival and hazard functions when the survival times are subject to dependent

From Remark 3.4, there exists a minimum kernel scale σ min , such that the correspondence produced by the HD model with the kernel scale σ ≥ σ min is the same as the correspondence

Now, nearly all of the current flows through wire S since it has a much lower resistance than the light bulb. The light bulb does not glow because the current flowing through it

O.K., let’s study chiral phase transition. Quark

(2007) demonstrated that the minimum β-aberration design tends to be Q B -optimal if there is more weight on linear effects and the prior information leads to a model of small size;