• 沒有找到結果。

簡單順序假設波松母數較強檢力檢定研究- 兩兩母均數比例 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "簡單順序假設波松母數較強檢力檢定研究- 兩兩母均數比例 - 政大學術集成"

Copied!
41
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計學系研究所 碩士學位論文. 簡單順序假設波松母數較強檢力檢定研究兩兩母均數比例. 治Order Hypotheses about 政Simple More Powerful Tests for 大. 立. ‧. ‧ 國. 學. Poisson Parameters --- The ratios of the parameters. n. er. io. sit. y. Nat. al. Ch. engchi. 指導教授:劉惠美. 研究生:潘彥丞. i n U. v. 博士. 撰. 中華民國一百零六年六月.

(2) 摘要 Roger L. Berger (1996) “More Powerful Tests from Confidence Interval p Values”在檢定兩獨立二項分布時,先建立非條件檢定 z-test,找到非條件檢定之 p-value,以𝑝𝑧 表示,接著引用 Roger L. Berger and Dennis D. Boos (1994) “P Values Maximized Over a Confidence Set for the Nuisance Parameter”將最大化取值的界限 限制在信賴區間內,找到的信賴區間之 p-value (Confidence interval p-value),以𝑝𝑐 表示,欲針對非條件檢定建構較強檢定力之檢定,亦即檢定尺度依然小於 α 並. 政 治 大 絕域,等同於用𝑝 找到之拒絕域其檢定力至少較𝑝 為高,亦即 Berger (1996)引用 立. 且檢定力較強之檢定,結果發現以𝑝𝑧 ≤ 𝛼找到之拒絕域包含於用𝑝𝑐 ≤ 𝛼找到之拒 𝑐. 𝑧. ‧ 國. 學. Berger and Boos (1994)的方法,成功建構較非條件檢定還要強之檢定。 而本文將引用 Berger (1996)的方法將兩獨立波松分布進行套用,希望檢定兩. ‧. 波松分布之母均數比例,應用 Hon Keung Tony Ng and Man-Lai Tang (2005) ”. sit. y. Nat. Testing the equality of two Poisson means using the rate ratio”建立出非條件檢定. al. er. io. z-test,並且根據 Berger and Boos (1994)的方法,利用 Robert M. Price and Douglas. v. n. G. Bonett (2000) “Estimating the ratio of two Poisson rates”找到之信賴區間,建立. Ch. engchi. i n U. 信賴區間之 p-value,得出較非條件檢定還要強之檢定。 我們發現在進行實驗設計時,兩獨立波松分布之樣本數比例是很重要的變數, 它會影響我們找到之較強檢定力之檢定的表現,在廣泛的領域應用上,將此變數 控制為理想的值勢必可以達到提升實驗效率並且降低研究之成本。. 關鍵字:波松分布、信賴區間 p-value、較強檢定力檢定. I.

(3) Abstract In the problem of comparing two independent binomial populations , Roger L. Berger (1996) “More Powerful Tests from Confidence Interval p Values.” showed that the test based on the confidence interval p-value of Roger L. Berger and Dennis D. Boos (1994) “P Values Maximized Over a Confidence Set for the Nuisance Parameter.” often is uniformly more powerful than the standard unconditional test. In this article we consider the problem of comparing two independent poisson. 政 治 大 Testing the equality of two 立Poisson means using the rate ratio” , we construct the. population rates ratio. Based on the Hon Keung Tony Ng and Man-Lai Tang (2005) ”. ‧ 國. 學. standard unconditional z-test . Similarly, based on the Berger and Boos (1994),we use the confidence interval from Robert M. Price and Douglas G. Bonett (2000). ‧. “Estimating the ratio of two Poisson rates” to construct the confidence p-value. We. sit. y. Nat. show the confidence p-value is more powerful than the standard unconditional z-test.. n. al. er. io. The sample ratio of two independent poisson is an important variable, it controls. i n U. v. the influence of the more powerful test. In a wide range of applications , the control of. Ch. engchi. this variable to the ideal value is bound to achieve improved experimental efficiency and reduce the cost of the experiment.. Keyword : poisson distribution、confidence interval p-value、more powerful test. II.

(4) 目錄 摘要............................................................................................................................I Abstract ......................................................................................................................II 表目錄........................................................................................................................IV 圖目錄........................................................................................................................V 第一章. 緒論..........................................................................................................1. 第二章. 文獻探討..................................................................................................2. 第一節. 波松分布......................................................................................2. 第二節. 條件檢定......................................................................................3. 較強檢力檢定..............................................................................8. y. al. er. 研究方法..................................................................................................13. io. 第三章. p-value 之信賴區間求法.............................................................6. Nat. 第七節. ‧. 第六節. 交聯集檢定..................................................................................6. sit. 第五節. 概似比檢定..................................................................................5. 學. 第四節. ‧ 國. 第三節. 政 治 大 確實性檢定..................................................................................3 立. v. 建構波松非條件檢定..................................................................13. 第二節. 建構較強檢力檢定......................................................................15. 第四章. n. 第一節. Ch. engchi. i n U. 模擬分析..................................................................................................18. 第一節. 參數設定......................................................................................18. 第二節. 建立拒絕域資料集合..................................................................19. 第三節. 模擬分析顯著水準......................................................................22. 第四節. 模擬分析檢定力..........................................................................26. 第五章. 實證分析..................................................................................................30. 第六章. 結論與建議..............................................................................................34. 參考文獻....................................................................................................................35 III.

(5) 表目錄 表 2.1. 𝑍(𝑥, 𝑦)與𝑝𝑧 (𝑥, 𝑦)之比較...........................................................................11. 表 2.2. 𝑝𝐶 (𝑥, 𝑦)與𝑝𝑧 (𝑥, 𝑦)之比較 .........................................................................11. 表 3.1. d=0.5 時 𝑝𝑧 (𝑦1 , 𝑦2 )與𝑝𝐶 (𝑦1, 𝑦2 )之觀察 ..................................................16. 表 5.1. 𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之比較 ................................................30. 表 5.2. 𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之比較 ................................................33. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. IV. i n U. v.

(6) 圖目錄 圖 2.1. 拒絕域與額外增加之拒絕域....................................................................12. 圖 3.1. d=0.5, 𝑦1 , 𝑦2 : 0~40之拒絕域 ....................................................................17. 圖 4.1. 不同 d 值下之拒絕域圖(a) d =0.25 (b) d =0.5 (c) d =0.75 (d) d =1 (e) d =1.25 ..................................................................................................22. 圖 4.2. 不同𝜆值下模擬之顯著水準 vs. μ (a) λ =5 (b) λ =10 (c) λ =15 (d) λ =20 (e) λ =25 (f) λ =30 (g) λ =35(h) λ=40 ......................................................25. 圖 4.3. 不同𝜆值下模擬之檢定力 vs. μ (a) λ =5 (b) λ =10 (c) λ =15 (d) λ =20. 政 治 大 d=1.473, 𝑦 , 𝑦 : 0~60之拒絕域 ................................................................30 立 (e) λ =25 (f) λ =30 (g) λ =35 (h) λ =40 ......................................................28 2. d=0.401, 𝑦1 , 𝑦2 : 0~60之拒絕域 ................................................................33. 學. ‧. io. sit. y. Nat. n. al. er. 圖 5.2. 1. ‧ 國. 圖 5.1. Ch. engchi. V. i n U. v.

(7) 第一章. 緒論. 波松分布最早在 1838 年時由法國數學家 Siméon-Denis Poisson 發表,用來描 述單位時間內隨機事件發生的次數的機率分布,在日常生活中許多現象都能由波 松分布來描述,例如:餐廳每小時的顧客數量、每次紅綠燈之間的行人數量、網 站每分鐘的瀏覽量、商品每天的銷售量…等等,近來也被廣泛應用於許多領域上, 而學者們也做了諸多對於波松分布的分析,其中對於兩獨立事件的波松分布對我 們來說尤其感興趣,例如:A 餐廳每小時平均顧客數量是否大於 B 餐廳、信義. 政 治 大 均瀏覽量是否比 Yahoo 首頁來的多、商品每天在 A 超市的平均銷售量是否較 B 立 區每次紅綠燈之間的平均行人數量是否比西門町來的多、Google 首頁每分鐘平. ‧ 國. 學. 超市多…等等,針對此種問題的分析,已經有學者提出一些檢定方法,例如條件 檢定、確實性檢定、概似比檢定、非條件檢定…等等,各有其利弊,也令人好奇. ‧. 有沒有比這些更優秀的檢定。本文將針對非條件檢定做討論,Berger (1996)提出. sit. y. Nat. 了針對兩獨立二項分布之較強檢定力方法,我們將應用 Berger (1996)的方法試著. al. n. 較強檢定力檢定。. er. io. 將兩獨立二項分布推廣到兩獨立波松分布上,看能不能建構出兩獨立波松分布之. Ch. engchi. i n U. v. 本文第二章為文獻探討,將詳細介紹關於檢定波松分布之各個檢定方法,介 紹 Berger and Boos (1994)提出 p-value 之信賴區間求法,將參數限制在信賴區間 的方法取 p-value 之最大值,並且介紹 Berger (1996)如何提出非條件檢定 z-test, 利用 Berger and Boos (1994)提出 p-value 之信賴區間求法找到較強檢定力檢定。 第三章研究方法將引用 Berger (1996)提出的較強檢定力方法延伸至兩獨立波松 分布上,先建立非條件檢定,並且根據 p-value 之信賴區間求法找到較強檢定力 檢定。第四章為模擬分析,運用蒙地卡羅法模擬在不同參數條件下顯著水準及檢 定力的表現。第五章舉實例驗證我們建構之較強檢定力檢定。最後在第六章下結 論與建議。 1.

(8) 第二章. 文獻探討. 本章主要介紹學者針對波松分布檢定所提出的各個方法,以及當虛無假設表 示為參數的聯集時可以使用的交聯集檢定,與提升更好檢定力之較強檢力檢定。 第一節介紹波松分布 (Poisson distribution),第二節為條件檢定 (Conditional test), 第三節為 K.Krishnamoorthy and Jessica Thomson (2002) 提出的確實性檢定(Exact test),第四節為概似比檢定 (LRT test),第五節為交聯集檢定 (IUT test),第六節 為 Berger and Boos (1994)介紹的 p-value 之信賴區間求法 (Confidence interval. 政 治 大. p-value),第七節為 Berger (1996)提出的較強檢定力檢定 (More powerful test)。. 立 波松分布. ‧. ‧ 國. 學. 第一節. 波松分布被廣泛應用於諸多領域上,例如:農業、經濟學、生物學、醫學、. y. Nat. sit. 品質管理…等等,是用來描述單位時間內隨機事件發生的次數的機率分布,當事. n. al. er. io. 件 X 之平均發生次數為 λ 時可以用𝑋 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆)來表示,且其機率分布為. i n U. v. 𝜆𝑥 𝑒 −𝜆 , 𝑥 = 0,1,2, … , 𝜆 > 0 , 𝑥!. Ch. 𝑃(𝑋 = 𝑥|𝜆) =. engchi. 根據我們研究的要求,我們希望檢定兩獨立波松母均數,並且找到較強檢定力之 檢定,換句話說,假設𝑋 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆1 )、𝑌 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆2 ),我們希望檢定兩波 松母均數比例 𝐻0 :. 𝜆2 𝜆2 ≤ 1 𝑣𝑠. 𝐻1 : >1 , 𝜆1 𝜆1. 針對此檢定建構非條件檢定,並且找到較強檢定力檢定。我們會在第三章詳細介 紹建構較強檢定力檢定之方法。. 2.

(9) 第二節. 條件檢定. 條件檢定通常應用在檢定兩波松母體平均數上,假設𝑋11 , 𝑋12 , … , 𝑋1𝑛1 服從 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆1 )、𝑋21 , 𝑋22 , … , 𝑋2𝑛2 服從 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆2 ),且兩分配各自獨立,則根據波 𝑛. 𝑛. 2 1 松分布加法性質,𝑋1 = ∑𝑖=1 𝑋1𝑖 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 𝜆1 ) , 𝑋2 = ∑𝑗=1 𝑋2𝑗 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛2 𝜆2 ). 條件檢定就是根據(𝑋1 | 𝑋1 + 𝑋2 = 𝑘)的條件分布衍生而得。而此條件分布服從 𝜆1 𝜆1 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 (𝑘, 𝑝( )) , 𝑝 ( ) = 𝜆2 𝜆2. 政 治 大 𝜆. 在檢定. 立. 𝜆1 ≤ 𝑐 𝑣𝑠. 𝜆2. 𝐻1 ∶. 1. 𝜆2. > 𝑐,𝑐 > 0,. 學. ‧ 國. 𝐻0 ∶. 𝑛 𝜆 (𝑛1 ) ( 1 ) 𝜆 2 2 , 𝑛1 𝜆1 1 + (𝑛 ) ( ) 𝜆2 2. 的問題時,就能直接將𝜆1 ⁄𝜆2 用 c 取代算出 p-value 為 𝑘. ‧. 𝑘 𝑘−𝑖 𝑃(𝑋1 ≥ 𝑘1 |𝑘, 𝑝(𝑐)) = ∑ ( ) 𝑝(𝑐)𝑖 (1 − 𝑝(𝑐)) , 𝑖 𝑖=𝑘1. y. Nat. ∞. al. n. ∞. er. io. 而 Power 在對立假設成立時,可以由下式計算出來. sit. 並且在 p-value ≤ 𝛼時拒絕𝐻0 。. i n U. v. 𝑒 −𝑛1 𝜆1 (𝑛1 𝜆1 )𝑘1 𝑒 −𝑛2 𝜆2 (𝑛2 𝜆2 )𝑘2 I[𝑃(𝑋1 ≥ 𝑘1 |𝑘1 + 𝑘2 , 𝑝(𝜆1 ⁄𝜆2 )) ≤ 𝛼] 。 ∑ ∑ 𝑘1 ! 𝑘2 !. 𝑘1 =0 𝑘2 =0. 第三節. Ch. engchi. 確實性檢定. 本節介紹 K.Krishnamoorthy and Jessica Thomson (2002) 提出的確實性檢定。 假設𝑋11 , 𝑋12 , … , 𝑋1𝑛1 服從 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆1 )、𝑋21 , 𝑋22 , … , 𝑋2𝑛2 服從 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 (𝜆2 ),且 𝑛. 𝑛. 1 2 兩分配各自獨立。𝑋1 = ∑𝑖=1 𝑋1𝑖 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 𝜆1 ) , 𝑋2 = ∑𝑗=1 𝑋2𝑗 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛2 𝜆2 ),. 確實性檢定主要根據𝑋1⁄𝑛1 與𝑋2⁄𝑛2 之標準化差異衍生而來。 3.

(10) 𝑉𝑎𝑟(𝑋1 ⁄𝑛1 − 𝑋2⁄𝑛2 ) =. 𝜆1 𝜆2 + , 𝑛1 𝑛2. 其中𝑋1⁄𝑛1 與𝑋2⁄𝑛2 分別是𝜆1 、𝜆2 之不偏估計量,因此不偏之變異數估計量為 𝑉̂𝑋 =. 𝑋1 ⁄𝑛1 𝑋2⁄𝑛2 + 𝑛1 𝑛2. (2.3.1),. 在檢定 𝐻1 ∶ 𝜆1 − 𝜆2 > 𝑑 ,𝑑 > 0. 𝐻0 ∶ 𝜆1 − 𝜆2 ≤ 𝑑 𝑣𝑠.. 的問題時,使用此不偏變異估計量,得到樞紐量 𝑇𝑋1 ,𝑋2 =. 𝑋1⁄𝑛1 − 𝑋2⁄𝑛2 − 𝑑 √𝑉̂𝑋. ,. 治 政 𝑘 ⁄𝑛 − 𝑘 ⁄𝑛 − 𝑑 大, =. 給定觀測值為(𝑛1 , 𝑘1 , 𝑛2 , 𝑘2 )時,樞紐量之觀測值為. 立. 𝑇𝑘1 ,𝑘2. 1. 1. 2. 2. √𝑉̂𝑘. ‧ 國. 學. 其中𝑉̂𝑘 的定義與(2.3.1)相同並且將其中之𝑋1 , 𝑋2用𝑘1 , 𝑘2 取代,因此 p-value 為 𝑃(𝑇𝑋1 ,𝑋2 ≥ 𝑇𝑘1 ,𝑘2 |𝐻0 ),. ‧. 但是其中包含了未知參數𝜆2 ,因此使用𝜆2 之估計量𝜆̂2𝑘 來估計 p-value,. sit. y. Nat. 當虛無假設成立時,𝜆1 = 𝜆2 + 𝑑. n. al. er. io. 𝑋1 + 𝑋2 𝑛1 𝜆1 + 𝑛2 𝜆2 𝑑𝑛1 𝐸( )= = 𝜆2 + , 𝑛1 + 𝑛2 𝑛1 + 𝑛2 𝑛1 + 𝑛2 所以給定𝑘1 , 𝑘2 之後,得到. Ch. 𝜆̂2𝑘 =. engchi. i n U. v. 𝑑𝑛1 𝑘1 + 𝑘2 − 𝑛1 + 𝑛2 𝑛1 + 𝑛2. 作為𝜆2 之估計量。 有了𝜆̂2𝑘 ,p-value 𝑃(𝑇𝑋1 ,𝑋2 ≥ 𝑇𝑘1 ,𝑘2 |𝐻0 )就可以估計為 ∞. ∞. ∑ ∑ 𝑥1 =0 𝑥2 =0. ̂ 𝑒 −𝑛1 (𝜆2𝑘+𝑑) (𝑛1 (𝜆̂2𝑘 + 𝑑)). 𝑥1 !. 𝑥1. ̂. 𝑒 −𝑛2 𝜆2𝑘 (𝑛2 𝜆̂2𝑘 ) 𝑥2 !. 其中 I[.]為指標函數。並且在 p-value ≤ 𝛼時拒絕𝐻0 。. 4. 𝑥2. I[𝑇𝑋1 ,𝑋2 ≥ 𝑇𝑘1 ,𝑘2 ],.

(11) 而 Power 在對立假設成立時,可以由下式計算出來 ∞. ∞. 𝑒 −𝑛1 𝜆1 (𝑛1 𝜆1 )𝑘1 𝑒 −𝑛2 𝜆2 (𝑛2 𝜆2 )𝑘2 ∑ ∑ 𝑘1 ! 𝑘2 !. 𝑘1 =0 𝑘2 =0. ∞. ∞. ×I[∑ ∑. ̂ 𝑒 −𝑛1 (𝜆2𝑘+𝑑) (𝑛1 (𝜆̂2𝑘 + 𝑑)). 𝑥1. 𝑥1 !. 𝑥1 =0 𝑥2 =0. ̂. 𝑒 −𝑛2 𝜆2𝑘 (𝑛2 𝜆̂2𝑘 ) 𝑥2 !. 𝑥2. × I[𝑇𝑋1 ,𝑋2 ≥ 𝑇𝑘1 ,𝑘2 ] ≤ 𝛼] 。. 概似比檢定 立. 學. ‧ 國. 第四節. 政 治 大. 概似比檢定 (LRT test)被普遍應用在假設檢定上,是個找拒絕域的好方法。. ‧. 假設 X 為隨機向量服從未知參數 θ 之分布,令 Θ 表示可能的未知參數 θ 之集合,. y. sit er. io. 在檢定. Nat. 𝐿(θ|𝑥)表示給定觀測值 𝑋 = 𝑥 之概似函數。. n. aHl0: θ ∈ Θ0 vs. H1: θ ∈ Θc0 , i v n Ch U Θ0 為 Θ 之一子集,Θ𝑐0 為 Θ0 之補集。 engchi 概似比檢定統計量定義為 𝜆(𝑥) =. 𝑠𝑢𝑝𝜃∈𝛩0 𝐿(𝜃|𝑥) , 𝑠𝑢𝑝𝜃∈𝛩 𝐿(𝜃|𝑥). 對概似比檢定來說,當𝜆(𝑥)夠小時有足夠證據拒絕H0,換句話說,概似比檢定拒 絕域為 {𝑥: 𝜆(𝑥) < 𝑐},c 為一指定之常數。正規來說,為了使概似比檢定之檢定 尺度為 α,必須讓 𝑐 = 𝑐𝛼 且滿足 𝑠𝑢𝑝 𝑃𝜃 (𝜆(𝑥) < 𝑐𝛼 ) = 𝛼 ,. 𝜃∈𝛩0. 其中 α 為型 I 誤差發生機率。 5.

(12) 第五節. 交聯集檢定. 交聯集檢定 (IUT test)最早由 Lehmann (1952)提出,當虛無假設表示為參數 的聯集時可以使用交聯集檢定,也就是假設檢定如下型式 𝑘. 𝑘. H0 : θ ∈ ⋃ Θ𝑖 vs. H1 : θ ∈ ⋂ Θci , 𝑖=1. 𝑖=1. 令 𝑅𝑖 , 𝑖 = 1, … , 𝑘 表示為假設檢定 H0i : θ ∈ Θi vs. H1i : θ ∈ Θci. 政 治 大 都被拒絕時,才能拒絕 H : θ∈⋃ 立. 之拒絕域,則交聯集檢定對於 H0 vs. H1 之拒絕域為 𝑅 = ⋂𝑘𝑖=1 𝑅𝑖 ,也就是說, 當每一個 H0i : θ ∈ Θi. 𝑘 𝑖=1 Θ𝑖. 0. ‧ 國. 學. 若考慮此假設檢定. 。. H0 : Not H1 vs. H1 ∶ 𝜇1 < 𝜇2 < 𝜇3. ‧. 可以分解成兩個假設檢定. 𝜇3 𝜇3 ≤ 1 vs. H12 : > 1 , 𝜇2 𝜇2. n. al. y. H02 :. sit. io. 𝜇2 𝜇2 ≤ 1 vs. H11 : > 1 𝜇1 𝜇1. er. Nat. H01 :. Ch. 則 H0 = H01 ⋃ H02 、 H1 = H11 ⋂ H12,. engchi. i n U. v. 若對於 H0i 之拒絕域為 𝑅𝑖 , 𝑖 = 1,2 ,則根據交聯集檢定,H0 vs. H1 之拒絕域 R 建構在 𝑅1 ⋂ 𝑅2 之上 𝑅 = 𝑅1 ⋂ 𝑅2 。. 第六節. p-value 之信賴區間求法. 檢定多餘參數 𝜃 (Nuisance Parameter)的存在性一直都是複雜的課題,假設一 個沒有多餘參數的模型 X 服從機率分布 𝑃𝑣 ,𝑣 為唯一參數,希望檢定 6.

(13) H0 : 𝑣 = 𝑣0 且檢定統計量 𝑇 越大傾向於拒絕 H0 的情形下,給定觀測值 𝑇 = 𝑡 , 其 p-value 為 p = 𝑃𝑣 (𝑇 ≥ 𝑡)。若增加一個多餘參數 θ 到模型 X ,也就是 X 分配有 兩個參數𝑣與 θ,那麼檢定 H0 : 𝑣 = 𝑣0 就不是那麼簡單的事,因為參數 θ 是未知的, θ 變 動 p-value 就 會 跟 著 變 動 , 因 此 此 時 p-value 的 計 算 就 會 變 為 p = supθ 𝑃𝑣0 ,θ (𝑇 ≥ 𝑡)。 Berger and Boos (1994)舉出三種常見的 p-value 計算方式,以及截然不同的 信賴區間算法,當然這四種方法得出的 p-value 都是有效的 p-value (Valid p-value), 有效的 p-value 亦即: (2.6.1) , 政 治 大 為型一誤差機率,考慮任一檢定當p ≤ α 時拒絕虛無假設,則 立 𝑃(p ≤ α ) ≤ 𝛼 , ∀ 𝛼 ∈ [0,1]. 其中 α. 𝑃(reject null) = 𝑃(p ≤ α ) ≤ 𝛼 ,表示在虛無假設成立下拒絕虛無假設之機率要. ‧ 國. 學. 小於型一誤差之機率,滿足尺度為 α 之檢定定義,我們將所有滿足式子 (2.6.1). ‧. 之 p-value 定義為有效的 p-value。. y. Nat. Berger and Boos (1994)舉出的常見 p-value 計算方式中,第一種方法也是最直觀. er. io. sit. 的方法,在大部分的問題裡對於所有的 t 值,都能使supθ 達到特定的值θ0,而此 時 p-value 為p = 𝑃𝑣0 ,θ0 (𝑇 ≥ 𝑡),不過此種參數組合(𝑣0 , θ0 )被稱為最不利配置,. al. n. v i n 因為必須使用數值方法把所有Ct 值都測試過之後才能找到特定的supθ = θ0 hengchi U. 。. 第二種方法是找出參數 θ 之輔助統計量 𝑇 ,在虛無假設的條件下,其分布與參數. θ 無關,因此在算 p-value 時 𝑃𝑣0 ,θ (𝑇 ≥ 𝑡) 的值對於所有的 θ 都會相同,就能避 免 supθ 的計算過程了。 第三種方法是找出參數 θ 之充分統計量 𝑆 ,在虛無假設的條件下,任何其他的統 計量𝑇 給定充分統計量 𝑆 的條件分布都會與參數 θ 無關,因此 p-value 的計算變 成 p = 𝑃𝑣0 (𝑇 ≥ 𝑡 | 𝑆 = 𝑠) ,能夠避免 supθ 的計算過程。 然而這三種方法在許多情形下無法達成,例如 supθ 與 t 值有複雜的關聯,難以 計算;或者輔助統計量 𝑇太難找,無法計算;又或者找不到合適的充分統計量 𝑆 來 7.

(14) 建構條件分布,種種因素導致上面三種方法並不實用。因此 Berger and Boos (1994) 想出了不一樣的方法,來達到有效的 p-value,也就是信賴區間之 p-value 算法。 在虛無假設成立下,令𝐶𝛽 為多餘參數θ之1 − β 信賴區間,即 𝑃(θ ∈ 𝐶𝛽 ) ≥ 1 − β , 且 p(θ) 滿足式子(2.6.1),則在多餘參數θ下 p-value 之計算經由剛剛的介紹是根 據多餘參數取最大化,不過這裡的參數取最大化的過程被限制在信賴區間裡,亦 即: pβ = 𝑠𝑢𝑝 p(θ) + β , θ ∈𝐶𝛽. 再經由以下的證明過程中,我們會證明pβ 也會是一個有效的 p-value。因為當β > α. 政 治 大 ≤ α , θ ∈ 𝐶 ) + 𝑃(p ≤ α , θ. 時,已知pβ ≥ β 所以𝑃(pβ ≤ α) = 0 ≤ α,當β ≤ α時,假設未知θ值為θ0 ,. 立. 𝑃(pβ ≤ α) = 𝑃(pβ. 0. 𝛽. β. 0. ∈ 𝐶𝛽̅ ). ‧ 國. 學. ≤ 𝑃(p(θ0 ) + 𝛽 ≤ α , θ0 ∈ 𝐶𝛽 ) + 𝑃(θ0 ∈ 𝐶𝛽̅ ) ≤ 𝑃(p(θ0 ) ≤ 𝛼 − 𝛽) + 𝛽. ‧. ≤𝛼−𝛽+𝛽 =𝛼. sit. y. Nat. 其中第一個不等式成立是因為當θ0 ∈ 𝐶𝛽 ,𝑠𝑢𝑝θ ∈𝐶𝛽 p(θ) ≥ p(θ0 )。. al. er. io. 所以在任何情況下𝑃(pβ ≤ α) ≤ α,表示pβ 為有效的 p-value,因此新的有效的. v. n. p-value 就能經由信賴區間最大化而得,而檢定規則也就變成了當pβ ≤ α時拒絕. Ch. engchi. i n U. 虛無假設。由於pβ 永遠要比β來的大,所以實務上會把β取的相對小,Berger and Boos (1994)建議把 β 取 0.001 或者 0.0001 較合適。. 第七節. 較強檢力檢定. Berger (1996)介紹一種較強檢力的方法,運用信賴區間法找到之 p-value,在 原始的拒絕域中找到與之互斥的額外拒絕域,使得檢定力較原始的高並且檢定尺 度依然維持在顯著水準為 α 之情形下,因此是一個較強檢力的檢定。本節將詳 述 Berger (1996)介紹的方法,並將此方法應用至第三章研究方法。 8.

(15) 首先 Berger (1996)以兩個獨立二項分布為例,令 X、Y 為兩獨立二項分布之 隨機變數,樣本數與成功機率分別為 𝑚, 𝑛與 𝑝1 , 𝑝2 ,其機率密度函數各別為 𝑚! 𝑝1𝑥 (1 − 𝑝1 )𝑚−𝑥 , (𝑚 𝑥! − 𝑥)!. 𝑏(𝑥; 𝑚, 𝑝1 ) = 𝑏(𝑦; 𝑛, 𝑝2 ) =. 𝑥 = 0, … , 𝑚. 𝑛! 𝑦 𝑝2 (1 − 𝑝2 )𝑛−𝑦 , (𝑛 𝑦! − 𝑦)!. 𝑦 = 0, … , 𝑛 ,. 其中 (X, Y)之樣本空間為 Ω = {0, … , 𝑚} × {0, … , 𝑛}, 我們希望檢定 H0 : 𝑝1 = 𝑝2 vs. H1 : 𝑝1 < 𝑝2 , Berger (1996)針對非條件檢定做分析,使用由 Suissa and Shuster (1985) 與 Haber. 政 治 大. (1986)提出的非條件檢定 Z test,其檢定統計量為. 立. 𝑝 ̂ 2 − 𝑝̂1. √𝑝̂ (1 − 𝑝̂ )( 1 + 1) 𝑚 𝑛. ,. 學. ‧ 國. 𝑍(𝑥, 𝑦) =. ‧. 其中𝑝̂1 = 𝑥⁄𝑚 , 𝑝̂ 2 = 𝑦⁄𝑛 , 𝑝̂ 為虛無假設下 𝑝1 = 𝑝2 = 𝑝 之混合估計量,且 𝑝̂ = (𝑥 + 𝑦)⁄(𝑚 + 𝑛) ,則針對檢定使用統計量 Z 之 p-value 由先前的介紹我們. y. Nat. sit. 知道可以對多餘參數𝑝取最大化,其計算為. n. al. er. io. 𝑝𝑧 (𝑥, 𝑦) = sup 𝑃𝑝 (𝑍(𝑋, 𝑌) ≥ 𝑍(𝑥, 𝑦)) 0≤𝑝≤1. C= hsup ∑ 0≤𝑝≤1 e n(𝑎,𝑏)∈𝑅 hi g c(𝑥,𝑦). v i n 𝑏(𝑎; U 𝑚, 𝑝)𝑏(𝑏; 𝑛, 𝑝). 𝑧. 在 計 算 𝑃𝑝 (𝑍(𝑋, 𝑌) ≥ 𝑍(𝑥, 𝑦)) 時 我 們 需 要 蒐 集 集 合 𝑅𝑧 (𝑥, 𝑦) = {(𝑎, 𝑏): (𝑎, 𝑏) ∈ Ω 且 𝑍(𝑎, 𝑏) ≥ 𝑍(𝑥, 𝑦)},針對所有𝑍(𝑎, 𝑏) ≥ 𝑍(𝑥, 𝑦)之樣本點(𝑎, 𝑏)去計算波松密 度函數,並且根據多餘參數𝑝取最大化。在虛無假設成立下檢定統計量大於等於 其觀測值之最大機率即為 p-value 之標準定義,若檢定之顯著水準為 α,則對此 檢定之檢定規則為𝑝𝑧 ≤ 𝛼時拒絕虛無假設。前一節提到 Berger and Boos (1994)提 出新的計算 p-value 的方法,Berger (1996)引用此方法,在虛無假設成立下 𝑝1 = 𝑝2 = 𝑝為一多餘參數,令𝐶𝛽 (𝑥, 𝑦)為觀測值(𝑥, 𝑦)下 𝑝 之 100(1 − 𝛽)% 信賴 區間,引用 Clopper and Pearson(1934)建立在 𝑋 + 𝑌~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑚 + 𝑛 , 𝑝)上之信 9.

(16) 賴區間為 (𝑎 + 1)𝐹𝛽⁄2 , 2(𝑎+1),2(𝑏−𝑎) 𝑎 ≤𝑝≤ 𝑎 + (𝑏 − 𝑎 + 1)𝐹𝛽⁄2 , 2(𝑏−𝑎+1),2𝑎 𝑏 − 𝑎 + (𝑎 + 1)𝐹𝛽⁄2 , 2(𝑎+1),2(𝑏−𝑎) 其中𝑎 = 𝑥 + 𝑦 , 𝑏 = 𝑚 + 𝑛 , 𝐹𝛽⁄2 , 𝑎 ,. 𝑏為. F 分布之上100(𝛽 ⁄2)百分位數自由度為. a、b,由此信賴區間推出的 p-value 為 𝑝𝐶 (𝑥, 𝑦) =. sup 𝑝∈𝐶𝛽 (𝑥,𝑦). 𝑃𝑝 (𝑍(𝑋, 𝑌) ≥ 𝑍(𝑥, 𝑦)) + 𝛽. = ( sup. ∑. 𝑝∈𝐶𝛽 (𝑥,𝑦). 𝑏(𝑎; 𝑚, 𝑝)𝑏(𝑏; 𝑛, 𝑝)) + β. (𝑎,𝑏)∈𝑅𝑧 (𝑥,𝑦). 此時𝑅𝑧 (𝑥, 𝑦)之定義與𝑝𝑧 時相同。而𝑝𝐶 與𝑝𝑧 最大的差別就在於前者最大化的取值. 政 治 大. 範圍為多餘參數𝑝落在𝐶𝛽 (𝑥, 𝑦)的界限,而後者之取值範圍為0 ≤ 𝑝 ≤ 1,經由信. 立. 賴區間推出的 p-value 𝑝𝐶 不只計算較簡單,還能製造更有檢定力的檢定,下面定. ‧ 國. 學. 理說明了𝑝𝐶 是如何能成為較強檢定力之檢定:. ‧. 定理.. 對於所有樣本點(𝑥, 𝑦) ∈ Ω,若不存在樣本點(𝑥, 𝑦)使得. y. Nat. n. al. 亦滿足𝑝𝐶 (𝑥, 𝑦) ≤ 𝛼. er. io. 證明.. sit. α − β ≤ 𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼,則對於所有𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼之樣本點(𝑥, 𝑦). i n U. v. 因為不存在樣本點(𝑥, 𝑦)使得α − β ≤ 𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼,所以若. Ch. engchi. 𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼,則𝑝𝑧 (𝑥, 𝑦) ≤ α − β 亦成立, 𝑝𝐶 (𝑥, 𝑦) = ≤. sup 𝑝∈𝐶𝛽 (𝑥,𝑦). 𝑃𝑝 (𝑍(𝑋, 𝑌) ≥ 𝑍(𝑥, 𝑦)) + 𝛽. sup 𝑃𝑝 (𝑍(𝑋, 𝑌) ≥ 𝑍(𝑥, 𝑦)) + 𝛽. 0≤𝑝≤1. =. 𝑝𝑧 (𝑥, 𝑦) + 𝛽. ≤ (𝛼 − 𝛽) + 𝛽 = 𝛼 這個定理證明了當[α-β,α]之間不存在樣本點(𝑥, 𝑦)使得𝑝𝑧 (𝑥, 𝑦)落在此區間內的 話,我們可以說所有使𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼 的樣本點都能夠讓𝑝𝐶 (𝑥, 𝑦) ≤ 𝛼 ,所以用 𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼找到的拒絕域會包含於用𝑝𝐶 (𝑥, 𝑦) ≤ 𝛼找到的拒絕域。我們可以對 β 10.

(17) 取任意小的值使得定理必然成立,我們便能稱用𝑝𝐶 (𝑥, 𝑦) ≤ 𝛼找到的拒絕域其檢 定力至少較𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼的拒絕域檢定力高。 Berger (1996)舉了一個例子來演示𝑝𝐶 如何製造更有檢定力之檢定。假設顯著水準 α = 0.1,β =0.001,樣本數 𝑚 = 33, 𝑛 = 17,樣本點(𝑥, 𝑦) = (23,15)有不大於 α 之 最大 𝑝𝑧 (𝑥, 𝑦) = 0.0823 且 𝑍(23,15) = 1.454 ,換句話說,下一個樣本點(𝑥, 𝑦)其 𝑍(𝑥, 𝑦) ≤ 𝑍(23,15) 之 𝑝𝑧 (𝑥, 𝑦) ≥ α ,此現象正因為𝑍(𝑥, 𝑦)較小者其𝑅𝑧 (𝑥, 𝑦)會包 含 𝑍(𝑥, 𝑦)較大者之𝑅𝑧 (𝑥, 𝑦),因此𝑍(𝑥, 𝑦)越小者其𝑝𝑧 (𝑥, 𝑦)值將越大,下表簡單整 理幾個樣本點之𝑍(𝑥, 𝑦)與𝑝𝑧 (𝑥, 𝑦)的關係: 表 2.1 (23,15). 𝑍(𝑥, 𝑦). 1.454 0.0823. (3,4). 1.407. 1.401. 1.394. 0.1548. 0.1548. 𝑧. 1.399. 學. 𝑝𝑧 (𝑥, 𝑦). 立. ‧ 國. (𝑥, 𝑦). 𝑍(𝑥, 𝑦)與𝑝 (𝑥, 𝑦)之比較 政 治 大 (0,1) (26,16) (9,8). 0.1548. 0.1549. ‧. 發現 𝑝𝑧 (𝑥, 𝑦)值在樣本點(0,1)時急遽上升,然後隨著 𝑍(𝑥, 𝑦)值變小而緩慢上升,. Nat. 表示在計算𝑝𝑧 (𝑥, 𝑦)的 sup 過程中受到樣本點(0,1)的影響,使得𝑝𝑧 (𝑥, 𝑦)值急遽地. sit. y. 0≤𝑝≤1. n. al. er. io. 上升,導致往後的樣本點受到拖累,𝑝𝑧 (𝑥, 𝑦)皆大於 α,無法被加入為拒絕域。因. i n U. v. 此直觀認為如果撇除樣本點(0,1),或許能夠在之後的樣本點例如(26,16)、(9,8)…. Ch. engchi. 等等,找到可以加入拒絕域而不使顯著水準超過 α 的情況發生。 將表 2.1 加入𝑝𝐶 (𝑥, 𝑦)項來做比較,如下表所示: 表 2.2. 𝑝𝐶 (𝑥, 𝑦)與𝑝𝑧 (𝑥, 𝑦)之比較. (𝑥, 𝑦). (23,15). (0,1). (26,16). (9,8). (3,4). 𝑍(𝑥, 𝑦). 1.454. 1.407. 1.401. 1.399. 1.394. 𝑝𝑧 (𝑥, 𝑦). 0.0823. 0.1548. 0.1548. 0.1548. 0.1549. 𝑝𝐶 (𝑥, 𝑦). 0.0833. 0.1558. 0.0949. 0.0906. 0.1553. 在樣本點(23,15)時 𝑝𝑧 (𝑥, 𝑦) < 𝛼 ,下一個樣本點(0,1)其𝑝𝑧 (𝑥, 𝑦) > 𝛼 ,所以用 𝑝𝑧 (𝑥, 𝑦) < 𝛼 找到的拒絕域就是收集所有能使 𝑍(𝑥, 𝑦) ≥ 𝑍(23,15)的樣本點集合, 11.

(18) 透過前面提到的定理,發現[α-β,α]之間不存在樣本點(𝑥, 𝑦)使得𝑝𝑧 (𝑥, 𝑦)落在此 區間內,因此所有使𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼之樣本點都能使𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼。到這邊已經驗證 了𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼找到的拒絕域會包含𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼找到之拒絕域,接著我們針對其 他所有樣本空間中,使𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼的樣本點例如(26,16)、(9,8)加入進𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼 之拒絕域,結果發現除此兩點之外,還存在另一樣本點(21,14)其𝑝𝐶 (21,14) = 0.0956 ,發現加入這三個樣本點後𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼的拒絕域其顯著水準值為 0.0946 小於 α。因此 Berger (1996)舉的這個例子告訴我們,當我們將所有樣本空間的 𝑍(𝑥, 𝑦) 由 大 到 小 排 列 , 首 先 可 以 觀 察 到 𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼 之 拒 絕 域 會 包 含 於. 治 政 大 之拒絕域,便能成功地用𝑝 (𝑥, 𝑦) ≤ 𝛼的方法找到較強檢定力之檢定。 立. 𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼之拒絕域,其次針對其他使𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼之樣本點加入進𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼 𝐶. 下圖 2.1 灰點表示由樣本點𝑝𝑧 (𝑥, 𝑦) ≤ 𝛼構成之拒絕域,而灰點加紅點為經由. ‧ 國. 學. 𝑝𝐶 (𝑥, 𝑦) ≤ 𝛼找到的拒絕域點,由圖可以清楚的觀察出𝑝𝐶 (𝑥, 𝑦)的方法確實為較強. ‧. io. sit. y. Nat. n. al. er. 檢定力檢定。. 圖 2.1. Ch. engchi. i n U. v. 拒絕域與額外增加之拒絕域 12.

(19) 第三章. 研究方法. 在 2.7 節中我們介紹了 Berger (1996)提出的較強檢力檢定,其中說明了在兩 獨立二項分布中針對多餘參數的信賴區間取最大值,能夠得出較非條件檢定檢定 力還要強的檢定,在本章中我們將引用 Berger (1996)的想法,將分布從兩獨立二 項分布延伸到兩獨立波松分布,先建構波松非條件檢定,之後利用信賴區間求 p-value 的方法建構較強檢定力檢定,期望我們能經由相同的觀念找到較強檢定 力之檢定。. 立 建構波松非條件檢定. 學. ‧ 國. 第一節. 政 治 大. 𝜆1 , 𝜆2 ,𝑛1 , 𝑛2 分別表示各別的樣本數,則. Nat. y. ‧. 首先假設 𝑋11 … 𝑋1𝑛1 , 𝑋21 … 𝑋2𝑛2 為兩獨立波松分布之隨機變數,平均數為. sit. 𝑛1. 𝑌1 = ∑ 𝑋1𝑖 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 λ1 ) , 𝑦1 = 0,1,2,3, …. io. er. 𝑖=1. al. n. v i n 𝑌2 = ∑ 𝑋2𝑗 C ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛 h e n g c2λ2h) i, 𝑦2U= 0,1,2,3, … , 𝑗=1 𝑛2. 希望檢定兩波松母均數比例: 𝐻0 :. λ2 λ2 ≤ 1 𝑣𝑠. 𝐻1 ∶ >1 λ1 λ1. 根據 Ng and Tang (2005)針對兩波松母均數比例檢定之推導過程, λ̂1 =. 𝑦1 𝑦2 𝑦1 + 𝑦2 , λ̂2 = , 虛無假設成立下 λ̂1 = λ̂2 = , 𝑛2 𝑛1 + 𝑛2 𝑛1 𝑦2 𝑦1 令𝑇 = λ̂2 − λ̂1 = − 𝑛2 𝑛1 𝑉𝑎𝑟(𝑇) =. 13. λ2 λ1 + 𝑛2 𝑛1.

(20) 將λ2 , λ1 用. 1 1 𝑦1 + 𝑦2 𝑦1 + 𝑦2 帶入可以得到𝑉𝑎𝑟(𝑇)之估計式𝑆𝑇2 = ( + ) 𝑛2 𝑛1 𝑛1 + 𝑛2 𝑛1 + 𝑛2. 因此非條件檢定統計量: 𝑇 𝑍(𝑦1 , 𝑦2 ) = = 𝑆𝑇. 𝑦2 𝑦1 𝑦2 − 𝑦1 𝑑 𝑛2 − 𝑛1 = 1 1 𝑦 + 𝑦2 √(𝑦1 + 𝑦2 )𝑑 √( + ) 1 𝑛2 𝑛1 𝑛1 + 𝑛2. 其中𝑑 = 𝑛2 ⁄𝑛1 ,引用 Thode (1997)針對𝑛1 λ1 的估計,假設對立假設成立 𝐻1 ∶ λ2 ⁄λ1 = ρ > 1,為了達到 Power 為 1-β,且顯著水準為 α 的情形下, ρ 1 + 𝑑ρ ( + 1)(√ 𝑍 + 𝑍1−β )2 𝑑 𝑑 + ρ 1−α 𝑛1 λ1 = (ρ − 1)2. 其中𝑍1−α 𝜇. 政 治 大 為標準常態分布第(1 − α)上百分位數,令𝜇 = 立. ‧ 國. 𝑛1 λ1. 𝜇. = 𝑑ρ ⇒ ρ = 𝑑. 學. 將ρ = 𝑑 帶入,得到𝑛1 λ1 與𝜇之關係式. 𝑛2 λ2. 1+𝜇 𝜇 2 + 1)(√ 𝜇 𝑍1−α + 𝑍1−β ) 𝑑2 𝑑+ 𝑑 𝑛1 λ1 (𝜇) = 𝜇 ( − 1)2 𝑑. ‧. (. sit. y. Nat. n. al. er. io. 利用虛無假設下 λ1 = λ2 的性質,. Ch. 𝑛2 λ2 (𝜇) = 𝑛2 λ1 (𝜇) =. 𝑑(. i n U. v. 𝜇 1+𝜇 2 + 1)(√ 𝜇 𝑍1−α + 𝑍1−β ) 𝑑2 𝑑+ 𝑑 𝜇 ( − 1)2 𝑑. engchi. 所以針對統計量𝑍(𝑦1 , 𝑦2 )之 p-value 就可以如下式計算得出: 𝑝𝑧 (𝑦1 , 𝑦2 ) = sup 𝑃𝜇 (𝑍(𝑌1 , 𝑌2 ) ≥ 𝑍(𝑦1 , 𝑦2 )) 𝜇. = sup 𝜇. ∑ (𝑎,𝑏)∈𝑅𝑧 (𝑦1 ,𝑦2 ). 𝑒 −𝑛1 λ1 (𝜇) (𝑛1 λ1 (𝜇))𝑎 𝑒 −𝑛2 λ1 (𝜇) (𝑛2 λ1 (𝜇))𝑏 𝑎! 𝑏!. 𝑅𝑧 (𝑦1 , 𝑦2 ) = {(𝑎, 𝑏): (𝑎, 𝑏) ∈ Ω 且 𝑍(𝑎, 𝑏) ≥ 𝑍(𝑦1 , 𝑦2 )} , Ω 為(𝑦1 , 𝑦2 )之樣本空間。 由此我們建構了波松非條件檢定,檢定統計量為𝑍(𝑦1 , 𝑦2 ),此時的檢定規則為, 當𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼時拒絕虛無假設。在第二節將會針對此非條件檢定建構一個較強 14.

(21) 檢力之檢定。. 第二節. 建構較強檢力檢定. 在第一節我們建構了波松非條件檢定,針對𝜇值取最大化可以得到𝑝𝑧 (𝑦1 , 𝑦2 ) 𝑛 λ. 值,本節我們將引用 Price and Bonett (2000)對波松分布 𝜇 = 𝑛2 λ2 建構之信賴區間, 1 1. 來讓𝜇值取最大化的過程限制在此信賴區間內,以便我們得到𝑝𝑐 (𝑦1 , 𝑦2 )值,而此 信賴區間之上下界如下式. 政 治 大 √(𝑦 + 0.5)(𝑦 + 0.5) − 0.5𝑧 √𝑦 立 𝑦 + 0.5 − 0.25𝑧 2. 下界 = LB𝜇 =. 𝛽 ⁄2. 1. 1. 2. 2. + 𝑦1 −. 0.25𝑧𝛽2⁄2. 2 𝛽 ⁄2. ]. ‧ 國. 學. [. 上界 = UB𝜇 =. ‧. √(𝑦2 + 0.5)(𝑦1 + 0.5) + 0.5𝑧𝛽⁄2 √𝑦2 + 𝑦1 −. 2. 0.25𝑧𝛽2⁄2. 𝑦1 + 0.5 − 0.25𝑧𝛽2⁄2. y. Nat. [. ]. er. io. sit. 其中𝑃(𝑍 > 𝑧𝛽⁄2 ) = 𝛽 ⁄2,不同樣本點(𝑦1 , 𝑦2 )建構出不同的信賴區間,利用此信 賴區間,將原本 𝑝𝑧 (𝑦1 , 𝑦2 )針對𝜇取最大值改為限制在𝜇之上下界裡取最大值,因. n. al. Ch. 此針對統計量𝑍(𝑦1 , 𝑦2 )得到信賴區間 p-value 為 𝑝𝐶 (𝑦1 , 𝑦2 ) =. =(. sup. LB𝜇 ≤𝜇≤UB𝜇. sup. engchi. LB𝜇 ≤𝜇≤UB𝜇. ∑ (𝑎,𝑏)∈𝑅𝑧 (𝑦1 ,𝑦2 ). i n U. v. 𝑃𝜇 (𝑍(𝑌1 , 𝑌2 ) ≥ 𝑍(𝑦1 , 𝑦2 )) + 𝛽. 𝑒 −𝑛1 λ1 (𝜇) (𝑛1 λ1 (𝜇))𝑎 𝑒 −𝑛2 λ1 (𝜇) (𝑛2 λ1 (𝜇))𝑏 )+𝛽 𝑎! 𝑏!. 有了上述的理論推導,只要進行數值運算,給定樣本點(𝑦1 , 𝑦2 )就能算出其 𝑝𝑧 (𝑦1 , 𝑦2 )與𝑝𝐶 (𝑦1 , 𝑦2 ),並且𝑝𝐶 (𝑦1 , 𝑦2 )也滿足 2.6 節提到的有效的 p-value,因此 檢定規則變為,當𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼時拒絕虛無假設。對於所有使𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼的樣 本點組合(𝑦1 , 𝑦2 )即為非條件檢定之拒絕域,根據 2.7 節的定理我們只要將 β 取 任意小的值,就能保證對於所有使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的樣本點組合(𝑦1 , 𝑦2 )會包含非 15.

(22) 條件檢定之拒絕域,並且與非條件檢定之拒絕域互斥的拒絕域點即為新增加的拒 絕域,且其顯著水準仍然會≤α。 舉 一 個 例 子 來 說 明 𝑍(𝑦1 , 𝑦2 ) 、 𝑝𝑧 (𝑦1 , 𝑦2 ) 、 𝑝𝐶 (𝑦1 , 𝑦2 ) 的 關 係 , 假 設 (𝑦1 , 𝑦2 )取值為 0~40,亦即 𝑦1 = 0,1,2, … ,40、𝑦2 = 0,1,2, … ,40 取α = 0.05 、 β = 0.001 、 d = 0.5,樣本點(𝑦1 , 𝑦2 ) = (19,17)有不大於 α 之最大 𝑝𝑧 (𝑦1 , 𝑦2 ) = 0.0463,且𝑍(19,17) = 1.767767,下一組𝑍(𝑦1 , 𝑦2 )值小於𝑍(19,17)之 樣本點為(1,3),其𝑍(1,3) = 1.7676,而𝑝𝑧 (𝑦1 , 𝑦2 ) = 0.0595已經超過 α 了,其 𝑝𝐶 (𝑦1 , 𝑦2 ) = 0.0605,發現𝑝𝑧 (𝑦1 , 𝑦2 )受到樣本點(1,3)的影響急遽上升,若撇除樣. 政 治 大 超過 α 的情況發生,觀察以下樣本點如表 3.1: 立. 本點(1,3),可能在之後的樣本點例如(36,28)找到可以加入拒絕域而不使顯著水準. (36,28). (22,19). 1.767767. 1.7676. 1.7676. 1.7669. 0.0463. 0.0595. 0.0595. 0.0595. 0.0473. 0.0605. 0.0475. io. y. sit. 0.0477. er. 𝑝𝐶 (𝑦1 , 𝑦2 ). (1,3). Nat. 𝑝𝑧 (𝑦1 , 𝑦2 ). (19,17). ‧. 𝑍(𝑦1 , 𝑦2 ). d=0.5 時 𝑝𝑧 (𝑦1 , 𝑦2 )與𝑝𝐶 (𝑦1, 𝑦2 )之觀察. 學. (𝑦1 , 𝑦2 ). ‧ 國. 表 3.1. 在樣本點(19,17)時 𝑝𝑧 (𝑦1 , 𝑦2 ) < 𝛼 ,下一個樣本點(1,3)其𝑝𝑧 (𝑦1 , 𝑦2 ) > 𝛼,所以用. n. al. Ch. 𝑝𝑧 (𝑦1 , 𝑦2 ) < 𝛼 找到的拒絕域就是收集所有能使. engchi. iv n 𝑍(𝑦1 , 𝑦2 ) ≥ 𝑍(19,17)的樣本點 U. 集合,透過 2.7 節提到的定理,發現[α-β,α]之間不存在樣本點(𝑦1 , 𝑦2 )使得 𝑝𝑧 (𝑦1 , 𝑦2 )落在此區間內,因此所有使𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點都能使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼。到這邊也驗證了𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域會包含𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕 域,接著我們針對其他所有樣本空間中,使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的樣本點例如(36,28)、 (22,19)加入進𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼之拒絕域,當所有樣本點(𝑦1 , 𝑦2 )都經由此方法演算之 後,我們得到如下圖 3.1 之拒絕域,其中灰點為𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之拒絕域,灰點加 紅點為經由𝑝𝐶 (𝑦1 , 𝑦2 ) ≤ 𝛼 找到之拒絕域,. 16.

(23) 學. 圖 3.1. d=0.5, 𝑦1 , 𝑦2 : 0~40之拒絕域. Nat. y. ‧. ‧ 國. 立. 政 治 大. sit. 圖中也清楚的表示利用𝑝𝐶 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕域其檢定力較𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之. n. al. er. io. 拒絕域為高,接著驗證其顯著水準值,將所有拒絕域點(灰點加紅點)以集合 𝑅(𝑦1 , 𝑦2 )表示,再如下式計算顯著水準 sup 𝜇. ∑ (𝑎,𝑏)∈𝑅(𝑦1 ,𝑦2 ). Ch. engchi. i n U. v. 𝑒 −𝑛1 λ1 (𝜇) (𝑛1 λ1 (𝜇))𝑎 𝑒 −𝑛2 λ1(𝜇) (𝑛2 λ1 (𝜇))𝑏 𝑎! 𝑏!. 算出顯著水準值為 0.0463≤ α ,得到檢定尺度為 α 之較強檢定力檢定。. 17.

(24) 第四章. 模擬分析. 在本章我們希望藉由蒙地卡羅模擬的方式,根據不同的參數條件下去看經由 𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域以及𝑝𝐶 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域,其模擬之顯著水 準值以及模擬之檢定力的表現如何,是否能滿足我們的期待,也就是 𝑝𝐶 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域其顯著水準值小於 α 並且檢定力較𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找 到的拒絕域為高。. 第一節. 參數設定. 立. 政 治 大. ‧ 國. 學. 模 擬 兩 獨 立 波 松 分 布 , 其 中 𝑌1 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 𝜆1 )、𝑌2 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝑛2 𝜆2 ) , 令. ,只要給定𝑑𝜌𝜆的值,我們便能生成模擬的樣本(𝑦1 , 𝑦2 )。. Nat. y. ‧. 𝜆 = 𝑛1 𝜆1 則𝑛2 𝜆2 = 𝑑𝜌𝜆,所以分布可以表示為𝑌1 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝜆)、𝑌2 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝑑𝜌𝜆). sit. 在虛無假設成立的情況下我們令𝜌 = 1,取𝜆 = 5、10、 … 、40,因為𝜇 = 𝑑𝜌,. n. al. er. io. 此時𝜌=1,所以取𝑑 = 0.25、0.5、 … 、2時,𝜇 = 0.25、0.5、 … 、2。. i n U. v. 在對立假設成立的情況下我們令𝜌 = 2,取𝜆 = 5、10、 … 、40,因為𝜇 = 𝑑𝜌,. Ch. engchi. 此時𝜌=2,為了使𝜇 = 0.25、0.5、 … 、2,所以取𝑑 = 0.125、0.25、 … 、1。 給定參數值之後,經由 R-studio 軟體,利用蒙地卡羅法重複m = 105 次針對 不同的 d 以及 λ ,在給定虛無假設成立的條件下去計算落入拒絕域的樣本比例 即為模擬之顯著水準值;相反地,在給定對立假設成立的條件下去計算落入拒絕 域的樣本比例即為模擬之檢定力,用此兩個模擬之顯著水準及模擬之檢定力來驗 證我們第三章的結果。. 18.

(25) 第二節. 建立拒絕域資料集合. 模擬顯著水準及檢定力之前,必須先建立拒絕域資料集合,因為不同的 d 值會有不同的拒絕域,我們必須建立所有可能之 d 值的拒絕域,根據不同 d 值建 立的不同拒絕域我們稱為拒絕域資料集合,之後再根據不同的 d 值,給定虛無假 設或者對立假設的條件下去計算落入拒絕域的比例為何,藉此來計算模擬之顯著 水準值或者檢定力,所以每給一個 d 值就能模擬出一組顯著水準值以及檢定力。 根據𝑌1 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝜆)、𝑌2 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(𝑑𝜌𝜆),樣本值𝑦1 、𝑦2 的取值範圍可以從. 政 治 大 樣本空間會趨於無限大,這樣永遠都模擬不完,所以我們必須找到能代表整個樣 立. 0~∞,無限大這個值對我們的模擬會造成極大的阻礙,這表示我們所要模擬的. ‧ 國. 學. 本空間的值。所幸在給定我們設定的參數條件下𝑑𝜌𝜆最大值為 80,在𝑑𝜌𝜆 = 80的 情況下模擬出的觀測值 y 超過 120 的機率<10−6,因為出現機率非常低,幾乎不. ‧. 影響模擬之顯著水準及檢定力,所以我們將𝑦1 、𝑦2 取值範圍從0~120代表所有可. sit. y. Nat. 能之樣本空間,以方便計算。接著從樣本空間 Ω = {0, … ,120} × {0, … ,120}中找. al. er. io. 出所有使𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點(𝑦1 , 𝑦2 )即為我們非條件檢定之拒絕域;再尋找. v. n. 能夠使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點(𝑦1 , 𝑦2 )即為我們𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之拒絕域,灰點為. Ch. engchi. i n U. 𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點,灰點加紅點為𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點。不同的 d 值會有 不同的拒絕域,因此必須針對所有 d 值都建立一個拒絕域資料集合,以下我們取 部分 d 值來演示不同 d 值下拒絕域資料集合的變化情形,如下圖 4.1(a)~(e). 19.

(26) 立. ‧. ‧ 國. 學. (a). 政 治 大. n. er. io. sit. y. Nat. al. Ch. engchi. (b). 20. i n U. v.

(27) 立. 政 治 大. ‧ 國. 學. (c). ‧. n. er. io. sit. y. Nat. al. Ch. engchi. (d). 21. i n U. v.

(28) 立. ‧ 國. ‧. Nat. y. 不同 d 值下之拒絕域圖(a) d =0.25 (b) d =0.5 (c) d =0.75 (d) d =1 (e) d =1.25. n. er. io. al. sit. 圖 4.1. 學. (e). 政 治 大. i n U. v. 其中灰點為𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之非條件檢定拒絕域,而灰點加紅點為𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之. Ch. engchi. 樣本點,可以發現當 d =0.25 時紅點最多,隨著 d 值越高能夠增加的紅點越少, 當 d =1 時能增加的紅點只剩 1 點(84,107),當 d =1.25 時已經找不到能額外增加 的紅點。. 第三節. 模擬分析顯著水準. 在虛無假設成立的情況下計算模擬出的樣本點(𝑦1 , 𝑦2 )落在拒絕域的比例即 為模擬之顯著水準,其中拒絕域已經經由 4.2 節建立。此時𝜌 = 1,𝜇 = 𝑑,取 22.

(29) 𝑑 = 0.25、0.5、 … 、2 , 根 據 不 同 的 λ 分 析 模 擬 之 顯 著 水 準 的 表 現 , 取 𝜆 = 5、10、 … 、40,我們將模擬流程整理成如下步驟:. 1.. 給定重複次數m = 105 次. 2.. 先取𝜆 = 5. 3.. 根據 8 個不同的 d 值模擬出在 d 值下之樣本點(𝑦1 , 𝑦2 ),每個 d 值皆模擬 m 筆樣本點(𝑦1 , 𝑦2 ),𝑦1 = 𝑟𝑝𝑜𝑖𝑠(𝑚, 𝜆)、𝑦2 = 𝑟𝑝𝑜𝑖𝑠(𝑚, 𝑑𝜆). 4.. 由 4.2 節建立之不同 d 值之拒絕域資料集合,計算模擬值落入拒絕域的. 政 治 大 做 模擬之顯著水準 vs. μ 之圖 立. 比例,模擬出 8 組顯著水準值. 6.. 學. 7.. 重複步驟 2,將𝜆 = 10、15、 … 、40 依序帶入. ‧ 國. 5.. 得到 8 張 模擬之顯著水準 vs. μ 之圖. ‧. y. Nat. 如下圖(a)~(h),黑線表示𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之非條件檢定拒絕域模擬之顯著水準,而. n. er. io. al. sit. 紅線表示𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之拒絕域模擬之顯著水準. Ch. engchi. (b). (a) 23. i n U. v.

(30) 立. (c). 政 治 大 (d). ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. (e). (f). 24. i n U. v.

(31) 立. 學. 圖 4.2. ‧ 國. (g) (g). 政 治 大 (h). 不同𝜆值下模擬之顯著水準 vs. μ (a) λ =5 (b) λ =10 (c) λ =15 (d) λ =20. Nat. sit. y. ‧. (e) λ =25 (f) λ =30 (g) λ =35 (h) λ =40. n. al. er. io. 結果顯示模擬之顯著水準皆小於 α,而且黑線包含於紅線內,表示. i n U. v. 𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之非條件檢定拒絕域包含於𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的拒絕域。另外當 λ 值越. Ch. engchi. 大時,顯著水準越穩定趨近於 α ,而且在 λ≥20 之後紅線與黑線才有明顯的區分, 這個現象可以由圖 4.1 解釋,圖 4.1 顯示新增之拒絕域(紅點)集中於𝑦1 ≥ 20、 𝑦2 ≥ 20處,因為 λ≤20 時模擬出的樣本值≥20 的機率相對較低,所以在 λ≤20 時 還沒有明顯的黑線與紅線區分;當 λ>20 之後模擬出的樣本值>20 的機率也會相 對較高,因此開始出現黑線與紅線的區分。而這個區分大約在 μ=1 時消失,也是 因為圖 4.1 顯示當 d≥1 時幾乎找不到能夠新增加的拒絕域,因此在 μ≥1 的部分紅 線與黑線幾乎是重合的狀態,找不到黑線與紅線區分的情形。. 25.

(32) 第四節. 模擬分析檢定力. 在對立假設成立的情況下計算模擬出的樣本點(𝑦1 , 𝑦2 )落在拒絕域的比例即 為模擬之檢定力,如上節相同,拒絕域已經經由 4.2 節建立。此時令𝜌 = 2,𝜇 = 2𝑑, 取 𝑑 = 0.125、0.25、 … 、1 , 根 據 不 同 的 λ 分 析 模 擬 之 檢 定 力 的表 現 , 取 𝜆 = 5、10、 … 、40,如同上節的部分,我們將模擬流程整理成如下步驟:. 1. 2. 3.. 給定重複次數m = 105 次. 政 治 大 根據 8 個不同的立 d 值模擬出在 d 值下之樣本點(𝑦 , 𝑦 ),每個 d 值皆模擬 先取𝜆 = 5. 1. 2. ‧ 國. 4.. 學. m 筆樣本點(𝑦1 , 𝑦2 ),𝑦1 = 𝑟𝑝𝑜𝑖𝑠(𝑚, 𝜆)、𝑦2 = 𝑟𝑝𝑜𝑖𝑠(𝑚, 𝑑𝜆) 由不同 d 值之拒絕域資料集合,計算模擬值落入拒絕域的比例,模擬出. ‧. 8 組檢定力. 做 模擬之檢定力 vs. μ 之圖. 6.. 重複步驟 2,將𝜆 = 10、15、 … 、40 依序帶入. 7.. 得到 8 張 模擬之檢定力 vs. μ 之圖. n. Ch. engchi. sit. er. io. al. y. Nat. 5.. i n U. v. 如下圖(a)~(h),黑線表示𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之非條件檢定拒絕域模擬之檢定力,而紅 線表示𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的拒絕域模擬之檢定力. 26.

(33) (a). 立. 政 治(b) 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. (c). (d). 27. i n U. v.

(34) (e). 立. 政 治(f) 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. (h). (g). 圖 4.3. 不同𝜆值下模擬之檢定力 vs. μ (a) λ =5 (b) λ =10 (c) λ =15 (d) λ =20 (e) λ =25 (f) λ =30 (g) λ =35 (h) λ =40. 28.

(35) 結果顯示黑線皆包含於紅線內,表示𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之非條件檢定檢定力小於 𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的拒絕域之檢定力,𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之拒絕域確實為較強檢定力之檢 定。另外當 λ 值越大時,檢定力越穩定趨近於 1 ,而且在 λ≥20 之後紅線與黑線 才有明顯的區分,這個現象與前一節介紹的一樣,而這個區分大約在 μ=1.5 時消 失,因為μ = 2𝑑,此時 d=0.75,與前一節介紹時一樣,也是因為圖 4.1 顯示當 d≥1 時幾乎找不到能夠新增加的拒絕域,因此在 μ≥1.5 的部分紅線與黑線幾乎是重合 的狀態。 經由蒙地卡羅模擬重複次數m = 105 之後,我們發現一些重要的觀念,首先. 政 治 大 言,d 值越大所能找到的紅點越少,這顯示所能找到額外增加拒絕域的情形越難, 立 是 d 值與拒絕域的關係,不同的 d 值會有不同的拒絕域,而對兩獨立波松分布而. 當 d 值 落 在 0.25~0.75 之 間 最 能 看 出 利 用 𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼 找 到 之 拒 絕 域 與. ‧ 國. 學. 𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕域的差別。再來是藉由模擬顯著水準以及模擬檢定力的. ‧. 結果,再次驗證了𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕域檢定力較𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕. y. Nat. 域檢定力高,並且顯著水準值皆不超過 α,這與我們的期望相同,我們所建構之. n. al. er. io. sit. 較強檢定力檢定不只顯著水準≤α,其檢定力也較非條件檢定之檢定力為高。. Ch. engchi. 29. i n U. v.

(36) 第五章. 實證分析. 本章將利用二份實務上的例子,比較其在非條件檢定下之檢定力表現,以及 運用我們在第三節提到的較強檢定力檢定方法,建構較強檢定力檢定。 擷取 Ng and Tang (2005)中提及一份乳癌研究,針對兩族群的女性進行分析, 其中一群為在治療肺結核時有使用 X 光檢查者;另外一群為在治療肺結核時無 使用 X 光檢查者,想知道是否有使用 X 光檢查者罹患乳癌的比例較無使用 X 光 檢查者罹患乳癌比例為高。其中使用 X 光檢查者有 28010 人,罹患乳癌者有 41. 政 治 大 光檢查者罹患乳癌的比例;λ 立 表示使用 X 光檢查者罹患乳癌的比例,我們希望. 人;無使用 X 光檢查者有 19017 人,罹患乳癌者有 15 人。假設λ1 表示無使用 X. λ2 λ2 ≤ 1 𝑣𝑠. 𝐻1 ∶ >1 λ1 λ1. Nat. sit. 𝑋11 、𝑋12 、 … 、𝑋1𝑛1 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ1 ). y. ‧. 假設. 𝐻0 :. 學. 檢定. ‧ 國. 2. n. al. er. io. 𝑋21 、𝑋22 、 … 、𝑋2𝑛2 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ2 ). 其中𝑛1 = 19017 、 𝑛2 = 28010,所以令 𝑛1. Ch. engchi. i n U. v. 𝑌1 = ∑ 𝑋1𝑖 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 λ1 ) , 𝑦1 = 0,1,2,3, … 𝑖=1 𝑛2. 𝑌2 = ∑ 𝑋2𝑗 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛2 λ2 ) , 𝑦2 = 0,1,2,3, … 𝑗=1. 取顯著水準 α =0.05,β =0.001,𝑑 = 𝑛2 ⁄𝑛1 = 1.473 ,實證的樣本點(𝑦1 , 𝑦2 ) = (15,41)針對此𝑑值在 4.3 節討論的結果,我們可以預想到此拒絕域勢必找不到紅 點,利用𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之方法建立相對應的非條件檢定拒絕域如下圖 5.1 之灰點. 30.

(37) 圖 5.1. 學. ‧ 國. 立. 政 治 大 d=1.473, 𝑦1 , 𝑦2 : 0~60之拒絕域. 由於 d=1.473,跟預想中的相同,找不到任何紅點,找不到能夠額外增加的拒絕. ‧. Nat. 𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之比較. i v(19,44) n U. (10,27). 1.6625. 1.662. 0.04875. 0.0488. 0.0489. 0.04975. 0.0498. 0.0499. n. al. er. io. 表 5.1. sit. 由下表 5.1 觀察𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之關係:. (𝑦1 , 𝑦2 ). (15,41). 𝑍(𝑦1 , 𝑦2 ). 2.082. 𝑝𝑧 (𝑦1 , 𝑦2 ). 0.0181. 𝑝𝑐 (𝑦1 , 𝑦2 ). 0.0191. y. 域,由此組數據建構之較強檢定力檢定,其檢定力與非條件檢定相同。我們可以. Ch …. (7,21). e n g c1.665 hi. 在𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ α之下最大的𝑝𝑧 (𝑦1 , 𝑦2 )發生在樣本點(10,27),經由 2.7 節提到的定 理,發現[α-β,α]之間不存在樣本點(𝑦1 , 𝑦2 )使得𝑝𝑧 (𝑦1 , 𝑦2 )落在此區間內,因此所 有使𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點都能使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼,在這個例子說明了𝑝𝑐 之檢定力 與𝑝𝑧 相同。而我們實證的樣本點(15,41)其 𝑝𝑧 (𝑦1 , 𝑦2 ) = 0.0181確實小於 α ,因此 拒絕虛無假設,表示有足夠證據說明有使用 X 光檢查者罹患乳癌的比例較無使 用 X 光檢查者罹患乳癌比例為高。 31.

(38) 第二個例子是美國交通違規事件的一萬筆資料中(取自網站 Data.gov),收集 所有交通違規事件中,男性與女性酒駕的次數,想知道是否女性酒駕的比例較男 性酒駕比例為高。其中男性 7137 起交通違規事件中酒駕次數為 10 次;女性 2863 起交通違規事件中酒駕次數為 9 次。假設λ1 表示男性酒駕的比例;λ2 表示女性酒 駕的比例,我們希望檢定 𝐻0 :. λ2 λ2 ≤ 1 𝑣𝑠. 𝐻1 ∶ >1 λ1 λ1. 假設 𝑋11 、𝑋12 、 … 、𝑋1𝑛1 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ1 ). 政 治 大 = 2863,所以令 立. 𝑋21 、𝑋22 、 … 、𝑋2𝑛2 ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ2 ). 𝑛1. 學. ‧ 國. 其中𝑛1 = 7137、 𝑛2. 𝑌1 = ∑ 𝑋1𝑖 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛1 λ1 ) , 𝑦1 = 0,1,2,3, … 𝑖=1. ‧. 𝑛2. 𝑌2 = ∑ 𝑋2𝑗 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛2 λ2 ) , 𝑦2 = 0,1,2,3, …. Nat. sit. y. 𝑗=1. al. er. io. 取顯著水準 α =0.05,β =0.001,𝑑 = 𝑛2 ⁄𝑛1 = 0.401 ,實證的樣本點(𝑦1 , 𝑦2 ) =. v. n. (10,9),因為 d 值落在 0.25~0.75 之間,經由 4.3 節討論的結果,當 d 值落在此區. Ch. engchi. i n U. 間內會有較好的效率,我們可以預想到此拒絕域會有紅點的出現,如下圖 5.2 所 示,𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找到之拒絕域用灰點表示,𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼之拒絕域用灰點+紅 點來表示,. 32.

(39) 圖 5.2. 學. ‧ 國. 立. 政 治 大 d=0.401, 𝑦1 , 𝑦2 : 0~60之拒絕域. 如同預期的一樣,𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域比𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼找到的拒絕域還多. ‧. 𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之比較. n. al. er. io. 表 5.2 (𝑦1 , 𝑦2 ). (10,9). 𝑍(𝑦1 , 𝑦2 ). 1.807. 𝑝𝑧 (𝑦1 , 𝑦2 ). 0.045. 𝑝𝑐 (𝑦1 , 𝑦2 ). 0.046. sit. Nat. 察其𝑍(𝑦1 , 𝑦2 )、𝑝𝑧 (𝑦1 , 𝑦2 )、𝑝𝑐 (𝑦1 , 𝑦2 )之關係:. y. 了 8 個紅點,因此𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼方法實為較強檢定力檢定,接著由下表 5.2 來觀. Ch …. (60,35). e n g c1.7707 hi. i v(32,21) n U. (7,7). 1.7704. 1.769. 0.04828. 0.0483. 0.051. 0.04928. 0.0493. 0.052. 在𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ α之下最大的𝑝𝑧 (𝑦1 , 𝑦2 )發生在樣本點(32,21),經由 2.7 節提到的定 理,發現[α-β,α]之間不存在樣本點(𝑦1 , 𝑦2 )使得𝑝𝑧 (𝑦1 , 𝑦2 )落在此區間內,因此所 有使𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼之樣本點都能使𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼,另外將所有𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的樣 本點集合起來會發現多了 8 個紅點,說明𝑝𝑐 為較強檢定力檢定。而我們實證的樣 本點(10,9)其 𝑝𝑧 (𝑦1 , 𝑦2 ) = 0.045確實小於 α ,因此拒絕虛無假設,表示有足夠證 據說明女性酒駕的比例較男性酒駕比例為高。 33.

(40) 第六章. 結論與建議. 本文主要應用 Berger and Boos (1994)的觀念,證明了信賴區間 p-value 方法 (Confidence interval p-value) 𝑝𝑐 (𝑥, 𝑦)的 有效性,接 著引進 Berger (1996) 運用 𝑝𝑐 (𝑥, 𝑦) ≤ 𝛼建構出比非條件檢定檢定力強的檢定方法,Berger (1996)使用的例子 為兩獨立之二項分布,我們希望能夠使用相同原理,在兩獨立波松分布上也能找 到較非條件檢定檢定力強的檢定。在我們建構了波松非條件檢定𝑝𝑧 (𝑦1 , 𝑦2 ) ≤ 𝛼的 方法以及較強檢定力檢定𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的方法之後,發現由非條件檢定找到的拒. 政 治 大 斥的部分即為新增加的拒絕域 立 ,說明了用𝑝 (𝑦 , 𝑦 ) ≤ 𝛼找到的拒絕域其檢定力至. 絕域會包含於𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的拒絕域,而𝑝𝑐 (𝑦1 , 𝑦2 ) ≤ 𝛼的拒絕域與非條件檢定互 𝑐. 1. 2. ‧ 國. 學. 少比非條件檢定大,因此我們成功應用 Berger (1996)的方法,在兩獨立波松分布 上也找到了較強檢定力之檢定。之後透過第四節模擬分析以及第五節實證分析的. ‧. 結果,驗證建構出之較強檢定力檢定不僅檢定尺度為 α ,並且檢定力還較非條. sit. y. Nat. 件檢定強。. al. er. io. 波松分布適合應用於生物學、醫學、藥學領域上,有了較強檢定力之檢定應. v. n. 用於實務方面,想必能夠使研究成本降低、提升不少效率,以我們的實驗結果來. Ch. engchi. i n U. 看,如何控制 d 值是最重要的一部分,d 值也就是兩獨立波松分布其樣本數的比 例,當 d 值≥1.25 時較難出現能夠新增加的拒絕域,而 d 值介於 0.25~0.75 間可以 發現能夠新增加拒絕域的比例明顯較多,因此建議讀者日後若有興趣進行實驗設 計時,可以將 d 值取在 0.25~0.75 之間效率會最佳,如此使用較強檢定力檢定會 較非條件檢定為優,得到的實驗結論也會更加精準有說服力。. 34.

(41) 參考文獻 1.. Clopper, C. J., and Pearson, E. S. (1934). “The use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial”. Biometrika, 26, 404-413.. 2.. Haber,M. (1986). “An Exact Unconditional Test for the 2×2 Comparative Trial”. Psychological Bullein, 99, 129-132. 3.. Hon Keung Tony Ng and Man-Lai Tang (2005). ” Testing the equality of two Poisson means using the rate ratio”. Statistics in Medicine, 24, 955-965.. 4.. K.Krishnamoorthy and Jessica Thomson (2002). “A more powerful test for. 政 治 大. comparing two Poisson means”. Journal of Statistical Planning and Inference,. 立. 119, 23-35.. Lehmann, EL (1952), “Testing multiparameter hypotheses”. The Annals of. ‧ 國. 學. 5.. Mathematical Statistics, 541-552.. ‧. 6.. Roger L. Berger and Dennis D. Boos (1994). “P Values Maximized Over a. sit. y. Nat. Confidence Set for the Nuisance Parameter”. Journal of the American Statistical. al. Ch. engchi. Values”. The American Statistician, 50, 314-318 8.. v. Roger L. Berger (1996). “More Powerful Tests from Confidence Interval p. n. 7.. er. io. Association, 89, 1012-1016.. i n U. Robert M. Price and Douglas G. Bonett (2000). “Estimating the ratio of two Poisson rates”. Computational Statistics & Data Analysis, 34,345-356.. 9.. Suissa, S., and Shuster,J. J. (1985). “Exact Unconditional Sample Sizes for the 2×2 Binomial Trial”. Journal of the Royal Statistical Society,Ser. A,148,317-327.. 10. Thode HC. (1997). “Power and sample size requirements for tests of differences between two Poisson rates”. The Statisticain, 46, 227-230. 11. Data.gov , 美 國 交 通 違 規 事 件 , 上 網 日 期 2017 年 6 月 15 日 , 檢 自 : https://catalog.data.gov/dataset/traffic-violations-56dda 35.

(42)

參考文獻

相關文件

當接收到一密文(ciphertext)為「YBIR」 ,而且知道它是將明文(plaintext)的英文字母所對應 之次序數字(如 A 的字母次序數字為 1,B 次序數字為

在工程科學及測量輪胎壓力所使用的壓力單位為每平方 英吋磅(pounds per square inch),簡稱 psi。..  利用表 13.1 的數據,以P

以下簡單介紹魔術三角形: 如圖 1, 若三角形每邊有 三個數且數字和都是定值, 稱為 3 階 (傳統) 魔術三角形; 如圖 2, 若每邊有三 個數且較大兩數和減最小數的差都是定值, 稱為

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

整數數量乘以分數, 理解為將整數(例如: 9個) 數量按分母(例如: 3)均分, 並按分子(例如: 1) 取多少份,

明龍計算一題兩個數相加的數學題目,不小心算成了相減,所得到的答

第三十九條 術科測試應 檢人進入術科測試試場 時,應出示准考證、術 科測試通知單、身分證 明文件及自備工具接受 監評人員檢查,未規定