國 立 交 通 大 學
統計學研究所
碩 士 論 文
以兩個 Binomial 之和逼近 Poisson Binomial 分布
Sum of two binomial approximation to
poisson binomial distribution
研 究 生 :莊于億
指導教授 :彭南夫 博士
以兩個 Binomial 之和逼近 Poisson Binomial 分布
Sum of two binomial approximation to
poisson binomial distribution
研 究 生:莊于億
Student : Yu-Yi Chuang
指導教授:彭南夫
Advisor : Dr. Nan-Fu Peng
國 立 交 通 大 學
統計學研究所
碩 士 論 文
A Thesis
Submitted to Institute of Statistics College of Science
National Chiao Tung University In Partial Fulfillment of the Requirements
For the Degree of Master
In Statistics June 2011
Hsinchu, Taiwan, Republic of China
以兩個 Binomial 之和逼近 Poisson Binomial 分布
研究生:莊于億
指導教授:彭南夫 博士
國立交通大學統計學研究所
摘 要
我們使用兩個 Binomial 之和的分布去逼近 m 個獨立但不同分配
的 Bernoulli 相加分布(Poisoon Binomial 分布),其中兩個 Binomial
裡面的三個變數是利用讓前三階動差一致所得到的。由程式運算,得
知兩個 Binomial 之和比利用一個 Binomial 去逼近結果更精準,最後
討論其原因。
Sum of two binomial approximation to
poisson binomial distribution
Student : Yu-Yi Chuang
Advisor : Dr. Nan-Fu Peng
Institute of Statistics National Chiao Tung University
ABSTRACT
We approximate the distribution of the sum of m independent but
not necessarily identically distributed Bernoulli random variables using
the distribution of the sum of two binomials, where the three
parameters of two binomials are chosen to match the first three
moments. Operation by the program, we know the sum of two Binomials
is more accurate than one Binomial. Finally, we discuss the reason.
誌 謝
在研究所這兩年,跟著指導教授彭南夫老師做論文以及和同學們
討論問題,慢慢瞭解如何去研究一件事情。了解問題,接著蒐集資料,
然後思考解決。在這一系列的過程中,藉由跟著同學討論,學會如何
去蒐集資料並挑選哪些資料是有用處的,並且因為討論了解各種思考
的角度。以及在指導教授彭南夫老師的啟發下,了解到了面對一個問
題或數學式,先了解其各種數學意義,將有助於深入的思考問題。
相信學會了這兩種能力,對於我以後的生活會有很大的幫助,在
這邊感謝我的指導教授彭南夫老師以及一起討論問題的陳羽偉、宋瀚
宇等等同學們。
在課業以外,平常的球友也讓我學到了,如何思考去打好一場球,
或是一起去研究某件事,感謝平常的球友陳羽偉、宋瀚宇、林洋德、
林士傑、許為翔等等同學們。
最後感謝父母親的辛苦,讓我沒有顧慮的完成學業,在這邊由衷
的感謝你們。在此,將這篇論文獻給各位,謝謝你們。
于億 謹誌于
國立交通大學統計研究所
中華民國一百年六月
目錄
摘要... I ABSTRACT ... II 誌 謝... III 目錄...IV 圖表目錄...V 第一章 介紹... 1 (1)單一Binomial 一個參數法(Ehm(1991) 提出) ... 2(2)單一Binomial 兩個參數法(Barbour et al.(1992b, p.190)提出) ... 2
(3)單一Binomial 三個參數法(Peköz, Röllin, Čekanavičius, and Shwartz(2009) 提出) ... 2 第二章 主要方法... 3 (1)兩個Binomial 之和-兩個參數法 ... 3 (2)兩個Binomial 之和-三個參數法 ... 4 第三章 程式架構... 6 (1)給定p1~ pm ... 6 (2)計算確切 W 分布 ... 7 (3)計算逼近分布的機率質量函數 ... 7 (4)計算 W 分布與逼近分布之間的dTV、dloc以及dloc發生位置 ... 7 (5)將各種方法的dTV 、dloc 畫圖 ... 7 第四章 圖表分析... 8 結論一 單一Binomial 方法比較 ... 20 結論二 解釋跳動... 21 結論三 兩個Binomial 之和方法 ... 21 參考文獻... 22
圖表目錄
表 4.1 Uniform(0, ) b ... 8 表 4.2 Uniform a( ,1) ... 9 表 4.3 ( , ), 0.5 2 a b Uniform a b ... 10 表 4.4 2 ( , 0.05 ) Truncated Normal u ... 11 表 4.5 2 ( , 0.1 ) Truncated Normal u ... 12 表 4.6 2 ( , 0.3 ) Truncated Normal u ... 13 圖 4.1 Uniform(0, )b dTV ... 14 圖 4.2 Uniform a( ,1)dTV ... 14 圖 4.3 Uniform a b( , )dTV ... 15 圖 4.4 2 ( , 0.05 ) TV Truncated Normal u d ... 15 圖 4.5 2 ( , 0.1 ) TV Truncated Normal u d ... 16 圖 4.6 2 ( , 0.3 ) TV Truncated Normal u d ... 16 圖 4.7 Uniform(0, )b dloc ... 17 圖 4.8 Uniform a( ,1)dloc ... 17 圖 4.9 Uniform a b( , )dloc ... 18 圖 4.10 2 ( , 0.05 ) loc Truncated Normal u d ... 18 圖 4.11 2 ( , 0.1 ) loc Truncated Normal u d ... 19 圖 4.12 2 ( , 0.3 ) loc Truncated Normal u d ... 19第一章 介紹
m 個獨立且同分配的Bernoulli p( )隨機變數相加,我們知道它會變成一個 ( , )
Binomial m p 分布,其中 m 是一個正整數,p是一個機率值。而 m 個獨立但不
同分配的 Bernoulli 隨機變數X1 ~Ber p( 1), ,Xi ~Ber p( i), Xm ~Ber p( m)相加 所形成的隨機變數 1 m i i W X
,稱之為Poisson Binomial 分布,其中m 是一個正 整數,這是一個應用很廣的分布,可以參考 Pitman(1997)以及 Peköz, Röllin, Čekanavičius, and Shwartz(2009)。這兩者的差異在於Binomial m p( , )分布可以輕易得知其機率質量函數,給定一個 k , 0 k m,就可以得知
( ( , ) ) km k(1 )m k
P Binomial m p k C p p ,Poisson Binomial 分布卻不易得到其機率
質量函數,儘管使用了 Chen, Dempster, and Liu (1994)所提出的遞迴關係式。
1 1 1 1 , 0 (1.1) 1 1 , 0 n i i k i i p if k P W k P W k i T i if k k
1 1 i m j j j p T i p
其中 當 m 大到一個程度的時候,仍然沒有辦法使用電腦去運算出確切的 Poisson Binomial 分布。原因是因為,當m 大時,T i 也會跟著變大,使得在電
腦的運算中沒有辦法記憶這麼大的數,因此無法輕易得知Poisson Binomial 分布 的機率質量函數。 因此,退而求其次,我們尋找一個隨機變數去逼近Poisson Binomial 分布, 而這個隨機變數的機率質量函數是容易計算的。至今已經有人使用單一 poisson 去逼近,也有人使用單一 Binomial 去逼近,而在 Peköz, Röllin, Čekanavičius, and Shwartz(2009)指出使用單一 Binomial 去逼近Poisson Binomial 分布,結果會比使 用單一 poisson 幾乎都好。因此本篇論文也是針對 Binomial 分布繼續做延伸,跟 之前不同的地方在於,之前都是使用單一 Binomial 方法,而本篇論文使用的是兩 個 Binomial 之和所形成的分布去逼近。 在於第四章圖表分析可以清楚的看到本篇論文的方法優於過去的。 為了更清楚說明過去所使用單一 Binomial 方法跟本篇論文的方法之間的差 異,必須先定義兩個符號。 1 , 1, 2, m j j i i p j
( ) :高斯符號 取整數部分為了比較這些逼近方法的優劣,必須先定義所使用的距離測度。 令X Y, 為離散型隨機變數,則Total variation metric 定義為
1
( ), L(Y) = sup ( ) ( ) = 2 , A Borel set TV A i d L X P X A P Y A P X i P Y i
其中 而 Local metric 定義為
( ), L(Y) = sup
loc j d L X P X j P Y j 定義好了符號跟距離測度,現在我們開始進一步討論單一 Binomial 方法跟本 篇論文的方法。單一 Binomial 方法,根據參數多寡,可以分為三個。 (1)單一Binomial 一個參數法(Ehm(1991) 提出) ( , ) Binomial m p 其中p 1 m (2)單一Binomial 兩個參數法(Barbour et al.(1992b, p.190)提出)
( , ) Binomial n p 其中 2 1 1 2 , n p n
(3)單一Binomial 三個參數法(Peköz, Röllin, Čekanavičius, and Shwartz(2009)提出)
( , ) Binomial n p s 其中
* * * * * , n p s , n n p s s n (平移) 而
* 2 3 * 1 2 * * * 1 * * 1 2 , , 1 p n s n p p p 以上這三個方法的參數,是利用動差法解出,在第二章我們會實際運算動差 法,去解兩個 Binomial 之和法裡面所需要的參數。第二章 主要方法
兩個 Binomial 之和法 ,也根據參數多寡,分為兩個。 (1)兩個Binomial 之和-兩個參數法 令 ~ ( , 1) ( , 2) 2 2 m m Y Bin p Bin p 在這邊假設 m 皆為偶數(忽略其為奇數, 2 m 需要進位的問題)。 藉由第一、二階動差可得 1 1 2 1 2 1 1 2 2 2 2 2 2 m m EW EY p p m m VarW VarY p q p q 為了使Y逼近W 分布,所以令其動差相等,可得 1 1 2 1 2 1 1 2 2 2 2 2 2 m m p p m m p q p q 相減 1 1 2 2 2 2 1 2 (2.1) 2 2 (2.2) 2 2 m m p p m m p p 接著由(2.1)可知 1 1 2 2 p p m 代入(2.2)可得 2 2 1 1 2 2 2 2 2 2 0 m p p m m 利用一元二次方程式公式解可得 2 1 2 1 1 2 m p m m 2 1 2 1 2 2 m p m m 其中p1, p 可以對調,因為只差在公式解中的正負號,且原本2 1 2 ( , ) ( , ) 2 2 m m Bin p Bin p 的位置就可以對調。 由於這個方法假設在 m 為偶數,在 m 夠大時,不太影響結果,但若是當 m 小 時,建議使用接下來要說明的方法。(2)兩個Binomial 之和-三個參數法
令Z ~Bin n p( , 1)Bin m n p( , 2),其中A ~Bin n p( , 1), ~B Bin m n p( , 2)
藉由第一、二、三階動差可得 1 1 2 1 2 1 1 2 2 3 3 3 3 1 2 3 ( ) ( ) ( ) 3 2 ( ) ( ) ( ) EW EZ np m n p VarW VarZ np q m n p q E W EW E Z EZ E A EA E B EB
1
1 1
2
2 2 1- 2p np q 1- 2p np q 為了使Z逼近W 分布,所以令其動差相等,並且相減運算,可得 2 2 * * 3 3 * * * * * * 1 2 * * 1 2 * * 1 2 ( ) ( ) ( ) n p m n p n p m n p n p m n p 1 2 3 移項 2 * 2 2 * * 3 * 3 3 * * * * 1 2 * * 1 2 * 2 2 1 2 * 3 2 1 2 (2.3) mp n p p mp n p p mp n p p 其中 * * * 1 2 , , n p p 代表動差方程式解出來的參數,其中 * n 會是一個實數,之後 會將它做無條件捨去變為整數 n ,再調整為三個要使用的參數n p, , 1 p2。 由上式可知 3 2 * * 2 2 3 3 * * * * * 2 2 2 * * 1 2 1 2 1 2 mp mp mp p p p p p p 3 1 2 同乘(p1p2) 3 2 * * 2 2 * * * 2 2 2 * * * * 1 2 1 1 2 2 mp mp mp p p p p p p 3 2 1 交叉相乘 2 2 2 2 * * * * * * * * 1 1 1 2 1 2 2 * * * * 1 1 1 1 2 1 2 1 2 1 2 3 (2.4) (2.5) p p mp p p p p p mp p mp p 由(2.4)代入(2.5)可得 * * * * 2p1 2p2 1p p1 2 3 (2.6) 移項 * * 1 2 3 1 2 2 1 2 m p p m 代入(2.6) 2 * 1 2 3 * 1 2 3 1 2 1 2 2 3 2 2 1 2 1 2 0 m m p p m m 利用公式解即可得知 * * 1, 2 p p ,再代入(2.3)即可得到 * n 。接著是將 * n 變為整數 n 的過程。 令n n* 雖然要經過調整,但是我們仍然希望動差方程式仍然可以成立。 1 1 2 2 2 2 1 2 ( ) (2.7) ( ) (2.8) np m n p np m n p (2.7)*(2.7) - (m n- )*(2.8) 2 2 1 2 1 1 1 ( ) 2 0 nmp n p m n 利用公式解即可得知p1, p ,再代入2 (2.7)即可得到 n 。 以上解出兩個 Binomial 之和法所需要的參數,讀者可以自行練習如何求得單 一 Binomial 方法中的參數,其方法都一樣,練習求得這些參數,有助於讀者更深 一步的了解第四章結論的說明。 接下來第三章將會介紹本篇論文所寫程式的架構,並提供下載本篇論文的程 式。 下載連結: 全部檔案 http://www.nakido.com/79EADF913B6F277F162A69F731EC8D49F273AED5 執行檔 EXE http://www.nakido.com/6EAB8B2CC323BD2AB0CFE3AD5AD549B53F9B245A
需要注意的是,此程式是在 Microsoft visual studio 環境下編寫且呼叫 R,所 以必須安裝這兩個軟體才能順利執行。Microsoft visual studio 有些函數會跟其他 版本的 C 程式有些差異,建議在 Microsoft visual studio 環境下執行。
第三章 程式架構
整體架構可以分成以下幾個步驟。 (1)給定p1~ pm (2)計算確切W 分布 (3)計算逼近分布的機率質量函數 (4)計算W 分布與逼近分布之間的dTV、dloc以及dloc發生位置 (5)將各種方法的dTV、dloc畫圖 接下來照個各步驟一一介紹。 (1)給定p1~ pm 由於若是自行一個一個輸入自己要的值,會過於費時,所以這個程式提供了 兩種分布讓使用者自動給定p1~ pm的值。首先要注意的是在此程式中 m 預設為 30,理由是因為在下一個步驟計算W 分布時,當 m 過大時,會在運算中產生過 大的值,以致於電腦無法運算。 第一種分布是Uniform a b( , )分布,而它又以生成方式細分為三類。 第一類是預設a0,變動 b,且 0 b 1,接著將Uniform(0, )b 切成 31 等分, 而其中 30 個分割點就是我們的p1~ p30,簡單來說,就是採用分位數的觀念。舉 例:當 = 1 0.0909 11 b ,則 1 1 0.0909 0.0029 31 p , 2 0.0909 2 0.00586 31 p ,…, 30 0.0909 30 0.08797 31 p 。這樣便能給定一組p1~ pm,也就是給定了一個W 分 布,再利用以下步驟可以算出在這個W 分布下,各種逼近方法的dTV、dloc以及dloc 發生位置,但是我們想要討論的是,當不同的W 分布時,這些逼近方法的好壞 是否會發生改變。因此 b 需要變動,在這個第一類的Uniform生成方法就是將 b 在 (0,1)預設切成 11 等分,而其中 10 個分割點就是每次不同的 b 。這種給定方式, 可以讓我們觀察到,一開始p1 ~ p30集中在 0 附近,後來漸漸平均分散在(0,1)(也 就是W 分布圖形由平均值在左邊漸漸變到中間)。 第二類是預設b0,變動 a ,且 0 a 1,原理跟第一類相似,這種給定可 以觀察,一開始p1~ p30平均分散在(0,1),後來漸漸的集中在 1 附近(也就是W 分 布圖形由平均值在中間漸漸變成在右邊)。 第三類則是預設Uniform a b( , )的中心點永遠在 0.5,而a b, 則向兩邊散開,這 種給定可以觀察,一開始p1~ p30集中在 0.5 附近,後來漸漸的散開(也就是W 分 布的變異越來越大)。 第二種分布是 2 ( , ) Truncated Normal u sd 分布,在給定u sd, 的條件下,則 1~ 30 p p 跟Uniform的做法是一樣的,取出它的分位數當作我們的p1~ p30。接下 來要討論的是u sd, 要怎麼變動,首先在此程式 u 的變動是預設為在(0,1)切成 11 等分,而其中 10 個分割點就是每次不同的 u 。而 sd 則是使用者可以自行輸入。(2)計算確切 W 分布 利用遞迴關係式(1.1),即可生成。 (3)計算逼近分布的機率質量函數 單一 Binomial 方法可以直接在 R 裡面計算出。 兩個 Binomial 之和法利用下列公式 令C~Binomial n( d,pd)Binomial n p( ,e e) 其中D~Binomial n( d,pd),E~Binomial n p( ,e e) 則 ( ) ( ) ( - ) j i P C i P D j P E i j
,其中0 i m, 0 j i 即可算出。 (4)計算 W 分布與逼近分布之間的dTV、dloc以及dloc發生位置 令逼近分布為F,則程式會計算出 P W( i) P F( i) , i,有了這些資料 就可以計算
( ), L(F) =
1
2 TV i d L W P W i P F i
以及
( ), L(F) = sup
loc j d L W P W j P F j 還有dloc發生的位置(稱為 j )。 (5)將各種方法的dTV 、dloc 畫圖 此程式共比較了五種方法,單一 Binomial 一個參數法、單一 Binomial 兩個 參數法、單一 Binomial 三個參數法、兩個 Binomial 之和-兩個參數法以及兩個 Binomial 之和-三個參數法,最後將這五種方法所生成的dTV,dloc畫圖比較,在此 程式第六十行可以自行輸入想要哪一種圖 1. dTV 2. dloc。 接下來藉由這些圖表,可以明顯的發現兩個 Binomial 之和方法會比單一 Binomial 方法優異,除了這個結論以外尚可看出一些現象,下面第四章將會一個 一個的清楚說明。第四章 圖表分析
首先將所有要討論的圖表列出,表格部分以p1~ p30生成方式的不同分為六 個表格,圖部分則以 p1 ~ p30生成方式的不同以及dTV或dloc則分為(6*2)十二個圖。 表格和圖以及相關變數的說明,會在全部列出後再一起說明。 表 4.1 為第一種Uniform a b( , )分布,第一類預設a0 表 4.1 Uniform(0, ) b 單BIN1par p1 0.045455 0.090909 0.136364 0.181818 0.227273 0.272727 0.318182 0.363636 0.409091 0.454545 dTV1 0.003946 0.008186 0.012861 0.017845 0.023848 0.030434 0.039068 0.049112 0.059364 0.073962 dloc1 0.002612 0.004043 0.005335 0.00664 0.008684 0.010383 0.012643 0.015875 0.018936 0.02354 j1 0 3 4 6 7 8 10 11 12 14 單BIN2par n2* 22.86885 22.86885 22.86885 22.86885 22.86885 22.86885 22.86885 22.86885 22.86885 22.86885 n2 22 22 22 22 22 22 22 22 22 22 p2 0.061983 0.123967 0.18595 0.247934 0.309917 0.371901 0.433884 0.495868 0.557851 0.619835 dTV2 0.000592 0.001225 0.001977 0.003052 0.004175 0.005651 0.007582 0.010176 0.01374 0.018442 dloc2 0.000368 0.0006 0.000856 0.001164 0.001536 0.002045 0.002641 0.003646 0.004631 0.006962 j2 0 3 5 6 8 9 11 12 14 15 單BIN3par n3* 23.03957 23.20856 23.36916 23.51074 23.61658 23.66045 23.60171 23.37834 22.89879 22.03695 n3 23 23 23 23 23 23 23 23 22 22 s3* 0.000683 0.006221 0.024069 0.065924 0.150042 0.304825 0.574214 1.025435 1.758782 2.91621 s3 0 0 0 0 0 0 0 1 1 2 p3 0.059289 0.118577 0.177866 0.237154 0.296443 0.355731 0.41502 0.43083 0.512397 0.528926 dTV3 0.000197 0.000437 0.000785 0.001343 0.002036 0.002915 0.004368 0.001841 0.008257 0.004888 dloc3 0.000134 0.00024 0.00035 0.000539 0.000789 0.001075 0.00139 0.000494 0.002763 0.001672 j3 1 2 3 5 6 7 8 13 13 16 雙BIN2par p41 0.020072 0.040144 0.060216 0.080288 0.10036 0.120432 0.140504 0.160576 0.180648 0.20072 p42 0.070837 0.141674 0.212511 0.283348 0.354185 0.425022 0.49586 0.566697 0.637534 0.708371 dTV4 0.000003 0.000012 0.000028 0.000058 0.000103 0.000181 0.000306 0.000484 0.000786 0.001281 dloc4 0.000002 0.000004 0.000012 0.000023 0.000036 0.000064 0.000108 0.000168 0.000259 0.000463 j4 1 2 5 6 7 9 10 11 13 14 雙BIN3par n5* 15 15 15 15 15 15 15 15 15 15 n5 14 14 15 14 14 15 14 14 14 14 p51 0.018319 0.036639 0.060216 0.073278 0.091597 0.120432 0.128236 0.146556 0.164875 0.183195 p52 0.069198 0.138395 0.212511 0.276791 0.345989 0.425022 0.484384 0.553582 0.62278 0.691977 dTV5 0.000014 0.000042 0.000028 0.000161 0.000253 0.000181 0.000575 0.000859 0.001252 0.001829 dloc5 0.000012 0.000025 0.000012 0.000065 0.000091 0.000064 0.00018 0.000268 0.000391 0.000597 j5 1 2 5 4 5 9 11 12 10 15表 4.2 為第一種Uniform a b( , )分布,第二類預設b1 表 4.2 Uniform a( ,1) 單BIN1par p1 0.545455 0.590909 0.636364 0.681818 0.727273 0.772727 0.818182 0.863636 0.909091 0.954545 dTV1 0.073963 0.059364 0.049112 0.039068 0.030434 0.023848 0.017845 0.012861 0.008186 0.003946 dloc1 0.02354 0.018936 0.015875 0.012643 0.010383 0.008684 0.00664 0.005335 0.004043 0.002612 j1 16 18 19 20 22 23 24 26 27 30 單BIN2par n2* 24.65996 26.0993 27.22764 28.09228 28.73974 29.21201 29.54504 29.76858 29.90674 29.9788 n2 24 26 27 28 28 29 29 29 29 29 p2 0.681818 0.681818 0.707071 0.730519 0.779221 0.799373 0.846395 0.893417 0.940439 0.987461 dTV2 0.021354 0.015325 0.014362 0.012559 0.024804 0.012326 0.026148 0.050133 0.095724 0.346934 dloc2 0.007947 0.004853 0.005092 0.004135 0.009325 0.004567 0.010739 0.021323 0.058044 0.337999 j2 18 20 21 22 23 25 25 26 28 29 單BIN3par n3* 22.03695 22.89879 23.37834 23.60171 23.66045 23.61658 23.51074 23.36916 23.20856 23.03957 n3 22 22 23 23 23 23 23 23 23 23 s3* 5.046841 5.342425 5.596223 5.82408 6.03473 6.233381 6.423333 6.606776 6.785222 6.95975 s3 5 5 5 5 6 6 6 6 6 6 p3 0.516529 0.578512 0.612648 0.671937 0.687747 0.747036 0.806324 0.865613 0.924901 0.98419 dTV3 0.002677 0.0131 0.010226 0.022483 0.014639 0.023657 0.03577 0.056575 0.09887 0.347208 dloc3 0.000863 0.00421 0.003439 0.007816 0.004999 0.008484 0.014802 0.024898 0.058643 0.33758 j3 16 18 20 21 22 24 25 26 28 29 雙BIN2par p41 0.291629 0.362466 0.433303 0.50414 0.574978 0.645815 0.716652 0.787489 0.858326 0.929163 p42 0.79928 0.819352 0.839424 0.859496 0.879568 0.89964 0.919712 0.939784 0.959856 0.979928 dTV4 0.00128 0.000785 0.000485 0.000306 0.000181 0.000103 0.000058 0.000028 0.000012 0.000003 dloc4 0.000463 0.000259 0.000168 0.000108 0.000064 0.000036 0.000023 0.000012 0.000004 0.000002 j4 16 17 19 20 21 23 24 25 28 29 雙BIN3par n5* 15 15 15 15 15 15 15 15 15 15 n5 15 14 15 14 15 14 14 14 15 14 p51 0.291629 0.346694 0.433303 0.491873 0.574978 0.637052 0.709642 0.782231 0.858326 0.92741 p52 0.79928 0.804598 0.839424 0.84802 0.879568 0.891443 0.913155 0.934866 0.959856 0.978289 dTV5 0.00128 0.001185 0.000485 0.000512 0.000181 0.00021 0.00013 0.00007 0.000012 0.000012 dloc5 0.000463 0.00037 0.000168 0.000169 0.000064 0.000075 0.00005 0.000028 0.000004 0.000009 j5 16 18 19 21 21 24 25 26 28 29
表 4.3 為第一種Uniform a b( , )分布,第三類預設中心點0.5 表 4.3 ( , ), 0.5 2 a b Uniform a b 單BIN1par p1 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 dTV1 0.000645 0.002591 0.005871 0.010537 0.016668 0.024375 0.033796 0.045108 0.058537 0.074359 dloc1 0.000193 0.000777 0.001764 0.003178 0.005054 0.007441 0.010404 0.014031 0.018439 0.023787 j1 15 15 15 15 15 15 15 15 15 15 單BIN2par n2* 29.92289 29.6939 29.31996 28.81198 28.18417 27.45304 26.63642 25.75254 24.81914 23.85289 n2 29 29 29 28 28 27 26 25 24 23 p2 0.517241 0.517241 0.517241 0.535714 0.535714 0.555556 0.576923 0.6 0.625 0.652174 dTV2 0.007933 0.006053 0.003024 0.008002 0.003607 0.006481 0.009694 0.013094 0.016819 0.02108 dloc2 0.00232 0.001736 0.000927 0.002451 0.00113 0.002084 0.003246 0.004495 0.005923 0.007673 j2 15 15 16 16 17 16 16 16 16 16 單BIN3par n3* 29.92269 29.69075 29.30419 28.763 28.06718 27.21674 26.21168 25.05199 23.73767 22.26873 n3 29 29 29 28 28 27 26 25 23 22 s3* 0.038656 0.154625 0.347907 0.618502 0.966409 1.391629 1.894162 2.474007 3.131165 3.865636 s3 0 0 0 0 0 1 1 2 3 3 p3 0.517241 0.517241 0.517241 0.535714 0.535714 0.518519 0.538462 0.52 0.521739 0.545455 dTV3 0.007933 0.006053 0.003024 0.008002 0.003607 0.002265 0.004258 0.002406 0.006754 0.005593 dloc3 0.00232 0.001736 0.000927 0.002451 0.00113 0.000741 0.001445 0.000736 0.002058 0.002049 j3 15 15 16 16 17 17 17 18 16 17 雙BIN2par p41 0.474617 0.449235 0.423852 0.39847 0.373087 0.347705 0.322322 0.29694 0.271557 0.246175 p42 0.525383 0.550765 0.576148 0.60153 0.626913 0.652295 0.677678 0.70306 0.728443 0.753825 dTV4 0.000004 0.000005 0.000009 0.000019 0.000049 0.000108 0.000219 0.000411 0.000737 0.001278 dloc4 0 0.000001 0.000002 0.000006 0.000016 0.000036 0.000074 0.000141 0.000259 0.000461 j4 11 19 11 15 15 15 15 15 15 15 雙BIN3par n5* 15 15 15 15 15 15 15 15 15 15 n5 15 15 14 15 14 15 14 14 15 15 p51 0.474617 0.449235 0.418595 0.39847 0.364325 0.347705 0.310055 0.28292 0.271557 0.246175 p52 0.525383 0.550765 0.57123 0.60153 0.618716 0.652295 0.666202 0.689945 0.728443 0.753825 dTV5 0.000004 0.000005 0.000026 0.000019 0.000129 0.000108 0.000419 0.000696 0.000737 0.001278 dloc5 0 0.000001 0.000007 0.000006 0.000035 0.000036 0.000126 0.000219 0.000259 0.000461 j5 11 19 13 15 16 15 16 16 15 15
表 4.4 為第二種 2 ( , ) Truncated Normal u sd 分布,預設 sd 0.05 表 4.4 2 ( , 0.05 ) Truncated Normal u 單BIN1par p1 0.094315 0.181833 0.272727 0.363636 0.454545 0.545455 0.636364 0.727273 0.818167 0.905685 dTV1 0.005428 0.003443 0.002527 0.002219 0.00204 0.00204 0.002219 0.002527 0.003443 0.005428 dloc1 0.002691 0.001254 0.000849 0.000686 0.000604 0.000604 0.000686 0.000849 0.001254 0.002691 j1 3 6 8 11 14 16 19 22 24 27 單BIN2par n2* 24.96292 28.2627 29.20161 29.54561 29.7076 29.79634 29.8501 29.8851 29.90919 29.9345 n2 24 28 29 29 29 29 29 29 29 29 p2 0.117893 0.194821 0.282131 0.376175 0.470219 0.564264 0.658308 0.752351 0.84638 0.936916 dTV2 0.001184 0.000563 0.000676 0.002675 0.005123 0.008318 0.012977 0.02155 0.03854 0.095001 dloc2 0.000558 0.000202 0.000228 0.000806 0.001535 0.002503 0.003956 0.007159 0.015671 0.052312 j2 3 6 9 11 14 17 20 22 25 28 單BIN3par n3* 25.30308 28.5296 29.37869 29.6526 29.7458 29.7458 29.6526 29.37869 28.5296 25.30308 n3 25 28 29 29 29 29 29 29 28 25 s3* 0.005552 0.015934 0.031116 0.054626 0.093181 0.161018 0.292772 0.590199 1.454465 4.691373 s3 0 0 0 0 0 0 0 0 1 4 p3 0.113178 0.194821 0.282131 0.376175 0.470219 0.564264 0.658308 0.752351 0.840893 0.926822 dTV3 0.000306 0.000563 0.000676 0.002675 0.005123 0.008318 0.012977 0.02155 0.0401 0.097614 dloc3 0.000169 0.000202 0.000228 0.000806 0.001535 0.002503 0.003956 0.007159 0.016213 0.052514 j3 2 6 9 11 14 17 20 22 25 28 雙BIN2par p41 0.051948 0.136751 0.227631 0.31854 0.409449 0.500359 0.591268 0.682177 0.773085 0.863319 p42 0.136681 0.226915 0.317823 0.408732 0.499641 0.590551 0.68146 0.772369 0.863249 0.948052 dTV4 0.000026 0.000005 0.000003 0.000004 0.000003 0.000003 0.000004 0.000003 0.000005 0.000026 dloc4 0.000014 0.000001 0.000001 0.000001 0.000001 0.000001 0.000001 0.000001 0.000001 0.000014 j4 2 6 8 12 19 11 18 22 24 28 雙BIN3par n5* 16.04725 15.00574 15 15 15 15 15 15 14.99426 13.95276 n5 16 15 15 14 15 14 14 14 14 13 p51 0.054685 0.136751 0.227631 0.315427 0.409449 0.497246 0.588155 0.679064 0.769972 0.857237 p52 0.139606 0.226915 0.317823 0.405819 0.499641 0.587638 0.678547 0.769456 0.860337 0.942734 dTV5 0.00001 0.000005 0.000003 0.000007 0.000003 0.000007 0.000007 0.000007 0.000011 0.000019 dloc5 0.000004 0.000001 0.000001 0.000002 0.000001 0.000001 0.000002 0.000002 0.000004 0.000008 j5 4 6 8 12 19 14 21 23 25 28
表 4.5 為第二種 2 ( , ) Truncated Normal u sd 分布,預設 sd 0.1 表 4.5 2 ( , 0.1 ) Truncated Normal u 單BIN1par p1 0.121341 0.188629 0.273412 0.363666 0.454546 0.545454 0.636334 0.726588 0.811371 0.878659 dTV1 0.01225 0.011841 0.010057 0.008986 0.008244 0.008244 0.008986 0.010057 0.011841 0.01225 dloc1 0.005486 0.004538 0.003398 0.002794 0.002459 0.002459 0.002794 0.003398 0.004538 0.005486 j1 4 6 8 11 14 16 19 22 24 26 單BIN2par n2* 22.29754 24.96292 27.09185 28.2627 28.86363 29.20162 29.40955 29.55083 29.67635 29.80366 n2 22 24 27 28 28 29 29 29 29 29 p2 0.165465 0.235787 0.303791 0.389642 0.487013 0.564263 0.658277 0.751643 0.839349 0.908958 dTV2 0.000891 0.002901 0.001152 0.001736 0.006865 0.002739 0.007018 0.014129 0.029097 0.062593 dloc2 0.000396 0.001046 0.000353 0.000569 0.002082 0.000871 0.002261 0.004738 0.011863 0.031043 j2 5 6 10 12 14 18 20 23 25 27 單BIN3par n3* 22.92029 25.61069 27.63979 28.62355 28.98409 28.98409 28.62355 27.63979 25.61069 22.92029 n3 22 25 27 28 28 28 28 27 25 22 s3* 0.023628 0.057904 0.119836 0.216478 0.372401 0.643514 1.159973 2.240379 4.331407 7.056084 s3 0 0 0 0 0 0 1 2 4 7 p3 0.165465 0.226355 0.303791 0.389642 0.487013 0.584415 0.646072 0.733246 0.813645 0.87999 dTV3 0.000891 0.001031 0.001152 0.001736 0.006865 0.013969 0.010737 0.019636 0.036163 0.068283 dloc3 0.000396 0.000384 0.000353 0.000569 0.002082 0.004285 0.003278 0.006591 0.014073 0.033354 j3 5 5 10 12 14 17 20 22 25 27 雙BIN2par p41 0.050024 0.103897 0.183833 0.273502 0.364355 0.455264 0.54617 0.637009 0.726638 0.807342 p42 0.192658 0.273362 0.362991 0.45383 0.544736 0.635645 0.726498 0.816167 0.896103 0.949976 dTV4 0.000247 0.000096 0.000035 0.000024 0.000022 0.000022 0.000024 0.000035 0.000096 0.000247 dloc4 0.000114 0.000037 0.000012 0.000008 0.000007 0.000007 0.000008 0.000012 0.000037 0.000114 j4 3 4 9 11 14 16 19 21 26 27 雙BIN3par n5* 18.05782 16.04725 15.12776 15.00574 15.00011 14.99989 14.99426 14.87225 13.95276 11.94218 n5 18 16 15 15 15 14 14 14 13 11 p51 0.063111 0.109369 0.183833 0.273502 0.364355 0.449037 0.539945 0.630824 0.714475 0.78493 p52 0.208686 0.279213 0.362991 0.45383 0.544736 0.62982 0.720675 0.810382 0.885467 0.932923 dTV5 0.000042 0.000042 0.000035 0.000024 0.000022 0.000047 0.00005 0.000054 0.000073 0.000072 dloc5 0.00002 0.000016 0.000012 0.000008 0.000007 0.000013 0.000015 0.000017 0.000027 0.000032 j5 2 6 9 11 14 14 20 22 25 27
表 4.6 為第二種 2 ( , ) Truncated Normal u sd 分布,預設 sd 0.3 表 4.6 2 ( , 0.3 ) Truncated Normal u 單BIN1par p1 0.268564 0.310507 0.358802 0.41268 0.47043 0.52957 0.58732 0.641198 0.689493 0.731436 dTV1 0.043908 0.047242 0.052251 0.053512 0.056575 0.056575 0.053512 0.052251 0.047242 0.043908 dloc1 0.01549 0.015773 0.016857 0.016906 0.01778 0.01778 0.016906 0.016857 0.015773 0.01549 j1 8 9 11 12 14 16 18 19 21 22 單BIN2par n2* 20.78375 21.55283 22.43036 23.39591 24.4076 25.40635 26.33048 27.13279 27.791 28.3077 n2 20 21 22 23 24 25 26 27 27 28 p2 0.402846 0.443582 0.489276 0.538278 0.588037 0.635484 0.677677 0.712442 0.766103 0.783681 dTV2 0.008133 0.008012 0.009133 0.010145 0.01165 0.01325 0.013905 0.01313 0.026189 0.017005 dloc2 0.002938 0.002942 0.002983 0.003525 0.003997 0.004281 0.004773 0.004568 0.009823 0.006371 j2 9 11 12 14 16 18 19 21 22 23 單BIN3par n3* 22.05838 22.6591 23.20198 23.61798 23.84447 23.84447 23.61798 23.20198 22.6591 22.05838 n3 22 22 23 23 23 23 23 23 22 22 s3* 0.607597 0.903104 1.327856 1.906104 2.641957 3.51357 4.475913 5.470168 6.437797 7.334025 s3 0 0 1 1 2 3 4 5 6 7 p3 0.366224 0.423419 0.424525 0.4948 0.526648 0.560309 0.592156 0.618954 0.66749 0.679231 dTV3 0.010453 0.00791 0.003237 0.005433 0.008842 0.010989 0.010914 0.006969 0.018786 0.006087 dloc3 0.003736 0.00278 0.001207 0.001943 0.002923 0.003575 0.003477 0.002271 0.006452 0.002133 j3 8 8 10 14 15 17 18 20 21 23 雙BIN2par p41 0.089725 0.116117 0.150365 0.193425 0.245249 0.304389 0.368065 0.432761 0.495102 0.552596 p42 0.447404 0.504898 0.567239 0.631935 0.695611 0.754751 0.806575 0.849635 0.883883 0.910275 dTV4 0.002615 0.002548 0.002236 0.001622 0.001051 0.001051 0.001622 0.002236 0.002548 0.002615 dloc4 0.000832 0.000789 0.000702 0.000515 0.000342 0.000342 0.000515 0.000702 0.000789 0.000832 j4 6 8 9 10 15 15 20 21 22 24 雙BIN3par n5* 19.31145 18.58161 17.71298 16.70329 15.58214 14.41786 13.29671 12.28702 11.41839 10.68856 n5 19 18 17 16 15 14 13 12 11 10 p51 0.132488 0.151788 0.176529 0.207586 0.245249 0.288842 0.336592 0.385916 0.434014 0.478519 p52 0.503605 0.548586 0.597159 0.647074 0.695611 0.740207 0.779053 0.811386 0.837402 0.857894 dTV5 0.000635 0.000818 0.000982 0.001059 0.001051 0.001007 0.000914 0.00083 0.000747 0.000692 dloc5 0.000221 0.00029 0.000301 0.000361 0.000342 0.000345 0.000322 0.000287 0.000273 0.000261 j5 9 10 11 13 15 16 18 19 21 22
圖 4.1 為第一種Uniform a b( , )分布,第一類預設a0的dTV圖
圖 4.1 Uniform(0, )b dTV
圖 4.2 為第一種Uniform a b( , )分布,第二類預設b1的dTV圖
圖 4.3 為第一種Uniform a b( , )分布,第三類預設中心點=0.5 的dTV圖 圖 4.3 Uniform a b( , )dTV 圖 4.4 為第二種Truncated Normal u sd( , ^ 2)分布,預設sd0.05的dTV圖 圖 4.4 2 ( , 0.05 ) TV Truncated Normal u d
圖 4.5 為第二種 2 ( , ) Truncated Normal u sd 分布,預設 sd 0.1的dTV圖 圖 4.5 2 ( , 0.1 ) TV Truncated Normal u d 圖 4.6 為第二種Truncated Normal u sd( , ^ 2)分布,預設 sd0.3的dTV圖 圖 4.6 2 ( , 0.3 ) Truncated Normal u d
圖 4.7 為第一種Uniform a b( , )分布,第一類預設a0的dloc圖
圖 4.7 Uniform(0, )b dloc
圖 4.8 為第一種Uniform a b( , )分布,第二類預設b1的dloc圖
圖 4.9 為第一種Uniform a b( , )分布,第三類預設中心點=0.5 的dloc圖
圖 4.9 Uniform a b( , )dloc
圖 4.10 為第二種Truncated Normal u sd( , ^ 2)分布,預設 sd0.05的dloc圖
圖 4.10 2
( , 0.05 )
圖 4.11 為第二種Truncated Normal u sd( , ^ 2)分布,預設 sd0.1的dloc圖
圖 4.11 2
( , 0.1 ) loc
Truncated Normal u d
圖 4.12 為第二種Truncated Normal u sd( , ^ 2)分布,預設 sd0.3的dloc圖
圖 4.12 2
( , 0.3 ) loc
表格上參數說明,以各種方法分成五類。 (1)單 BIN1par(單一Binomial 一個參數法)底下的參數。 p1 :此法的機率值 (2)單 BIN2par(單一Binomial 兩個參數法)底下的參數。 n2* :經由動差方程式解出的 * n (實數) n2 :利用高斯符號將 * n 轉為整數 p2 :此法的機率值 (3)單 BIN3par(單一Binomial 三個參數法)底下的參數。 n3* :經由動差方程式解出的 * n (實數) n3 :利用高斯符號將 * n 轉為整數 s3* :經由動差方程式解出的 * s (實數) s3 :利用高斯符號將 * s 轉為整數 p3 :此法的機率值 (4)雙 BIN2par(兩個 Binomial 之和-兩個參數法)底下的參數。 p41 :第一個 Binomial 的機率值 p42 :第二個 Binomial 的機率值 (5)雙 BIN3par(兩個 Binomial 之和-三個參數法)底下的參數。 n5* :經由動差方程式解出的 * n (實數) n5 :利用高斯符號將 * n 轉為整數 p51 :對應 n5 的機率值 p52 :另一個 Binomial 的機率值
另外 dTVi, dloci, ji 分別代表各種方法的dTV, dloc, dloc的發生位置,1 i 5。 圖表上 y 軸說明,y 軸上顯示 d1 代表dTV圖,d2 代表dloc圖。 接下來藉由這些圖表,可以得到以下幾個結論。 結論一 單一Binomial 方法比較 我們可以知道,參數使用的越多大部分情形會逼近的越準確,理由是越多階 的動差一致,這樣便可以使得分布越像,但從圖 4.2, 4.4,4.5,4.8,4.10,4.11,這些 圖的後半段可以知道當p1~ p30都很接近 1 的時候,單一Binomial 兩個參數法和 單一Binomial 三個參數法誤差會快速的增加。原因是單一Binomial 兩個參數法 中的 n 和單一Binomial 三個參數法中的n 和 s 會使得定義域減縮。舉例,W 的定 義域是從 0 ~ 30,這時如果單一Binomial 兩個參數法中的n28,這會造成我們 放棄去逼近P W( 29)以及P W( 30),所以當P W( 29)+ (P W 30)大到不能忽略 的時候,就會造成很大的誤差。也就是圖 4.2, 4.4,4.5,4.8,4.10,4.11 所顯示出來的 現象。 這個結論告訴我們,單一Binomial 方法會根據不同的 p1 ~ p30而有所優缺。
結論二 解釋跳動 在所有圖中我們可以看到單一Binomial 一個參數法的誤差始終都是近乎平 滑的,但單一Binomial 兩個參數法、單一Binomial 兩個參數法的誤差卻是有些 很大的跳動,理由是因為參數取完高斯之後,會使得原本成立的動差方程式,產 生了偏差,以致於圖形的結構沒辦法達到原本應該有的一致。舉例,在單一 Binomial 兩個參數法中的 * n 和p*是利用一、二階動差方程式,但要轉成整數 n 和 p時,卻只用了一階動差方程式,這會導致二階動差方程式的偏差。我們可以看 表 4.2 的第六行單 BIN2par 中的 n2*=28.73974, n2=28, p2=0.779221 以及雙 BIN2par 的 p41=0.574978, p42=0.879568 得知1 15 ( 41p p42)21.81819, 2 15 ( 41^ 2p p42 ^ 2) 11.9352 ,依據一、二階動差方程式以下方程式應該 要滿足1n2p2, 2 n2
p2 2,但實際上n2p221.81819,
2 2 2 17.0012 n p ,很明顯的二階動差方程式已經有了很大的偏差,這會導致 單 BIN2par 誤差的增大,也就是圖 4.2 綠線中間突然突起的原因。 至於,兩個 Binomial 之和-三個參數法也會有這個問題,原理是一樣的。 由這個結論可以知道,增加參數可以使我們的精準度提升,但若我們選的參 數是需要經過調整為整數的,這又會導致精準度的變動。 結論三 兩個Binomial 之和方法 在所有圖中明顯的可以看出兩個Binomial 之和方法皆比單一Binomial 方 法的誤差還小。原因是因為參數較多所以較多階動差一致,以及結論一的理由, 不需要犧牲定義域。參考文獻
[1]Pitman, J.(1997) Probabilistic bounds on the coefficients of polynomial with only real zero. J. Combinatorial Theory A 77, 279-303. [2]Peköz, E. A., Röllin, A., Čekanavičius, V. and Shwartz, M.(2009) A three-parameter
binomial approximation. J.Appl. Prob. 46, 1073-1085. [3]Chen, X. H, Dempster, A. P., Liu, J. S. (1994). Weighted finite population sampling
to maximize entropy. Biometrika 81,3, 457-469. [4]Ehm, W.(1991) Binomial approximation to the poisson binomial distribution.
Statist. Prob. Lett. 11, 7-16 [5]Barbour, A. D., Holst, L. and Janson, S.(1992b) Poisson approxition(Oxford Stud.