• 沒有找到結果。

簡單順序假設波松母數較強檢定力檢定研究 -兩兩母均數差 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "簡單順序假設波松母數較強檢定力檢定研究 -兩兩母均數差 - 政大學術集成"

Copied!
47
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學統計(學)系研究所 碩士學位論文. 簡單順序假設波松母數較強檢定力檢定研究. 政 治 大 立-兩兩母均數差. ‧. ‧ 國. 學. More Powerful Tests for Simple Order Hypotheses in Poisson Distributions -The differences of the parameters. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:劉惠美博士 研究生:孫煜凱撰. 中華民國壹佰零陸年陸月 I.

(2) 摘 要 波松分配(Poisson Distribution)常用在單位時間或是區間內,計算對有興 趣之某隨機事件次數(或是已知事件之頻率),例如:速食餐廳的單位時間來客 數,又或是每段期間內,某天然災害的發生次數,可以表示為某一特定事件X服 從波松分配,若λ為單位事件發生次數或是平均次數,我們稱λ為此波松分配之 母數,記作Poisson(λ),其中λ ∈ ℜ。. 政 治 大 述:令𝐗 = {(𝐗 , 𝐗 )}為一集合,其中𝐗 為𝑋 , 𝑋 , … , 𝑋 立. 今天我們若想要探討由兩個服從不同波松分配抽取的隨機變數,如下列所 𝟏. 𝟐. 𝒊. 56. 57. 59: ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛. 𝜆5 , 𝑖 =. ‧ 國. 學. 1,2。欲探討兩波松分配之均數是否相同或相差小於某個常數 d 時,考慮以下檢 定𝐻E :𝜆7 − 𝜆6 ≤ 𝑑與𝐻6 : 𝜆7 − 𝜆6 > 𝑑,對於此問題可以使用的檢定方法有. ‧. Przyborwski 和 Wilenski(1940)提出的條件檢定(Conditional test,C-test)或. y. Nat. io. sit. K.Krishnamoorthy 與 Jessica Thomson(2002)提出的精確性檢定(Exact test,E-. er. test),其中的精確性檢定為一個非條件檢定(Unconditional Test);. al. n. v i n K.Krishnamoorthy 與 Jessica Thomson p-value 皆小 C h 比較條件檢定與精確性檢定的 engchi U. 於α,而精確性檢定的檢定力不亞於條件檢定,因此精確性檢定比條件檢定更適 合上面所述之假設問題。 Roger L.Berger(1996)提出一個以信賴區間的 p-value 所建立的較強力檢 定,而目前只用於檢定兩二項分配(Binomial Distribution)的機率參數 p 是否 相同為例,然而 Berger 在文中提到,較強力檢定比非條件檢定有更好的檢定 力,而且要求的計算時間較少,可以提升檢定的效率。 本篇論文我們希望在固定α 與 d 時檢定𝐻E :𝜆7 − 𝜆6 ≤ 𝑑的問題,建立一個. 兩波松分配均數顯著水準為α的較強力檢定。. II.

(3) 利用 Roger L.Berger 與 Dennis D.Boos(1994)提出以信賴區間的 p-value 方 法,建立波松分配兩兩母均數差的較強力檢定;研究發現此較強力檢定與精確 性檢定的 p-value 皆小於α,然而我們的檢定的檢定力皆不亞於精確性檢定所計 算得出的檢定力,然而其α及虛無假設皆需要善加考慮以本篇研究來看,當檢定 為單尾檢定時,若α < 0.01,我們的較強力檢定沒有辦法找到比精確性檢定更 好地拒絕域,換言之,此時較強力檢定與精確性檢定的檢定力將會相等。. 關鍵詞:波松分配、條件檢定、精確性檢定、較強力檢定、信賴區間、蒙地卡. 羅法。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. III. i n U. v.

(4) Abstract Poisson Distribution is used to calculate the probability of a certain phenomenon which attracted by researcher. If we want to test two random variable in an experiment. Therefore,let 𝐗 = {(X6 , X7 )} be independent samples ,respectively ,from Poisson distribution ,also 𝑋56 , 𝑋57 , … , 𝑋59: ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝜆5 , 𝑖 = 1,2.. 政 治 大 − 𝜆 ≤ 𝑑 𝑣𝑠 𝐻 : 𝜆 − 𝜆 > 𝑑. The problem of interest here is to test:. 立. 𝐻E :𝜆7. ‧ 國 7. 9U 5T6 𝑋75. 9S 5T6 𝑋65. 7. 6. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛6 𝜆6 )、. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑛7 𝜆7 ) ,where α、𝜆、d be fixed.. ‧. 𝒀𝟐 =. 6. 學. 6. ,where 0 < α < ,and let 𝒀𝟏 =. 6. sit. y. Nat. In this problem of hypothesis testing about two Poisson means is addressed by. io. al. er. the conditional test.However ,the exact method of testing based on the test statistic. n. considered in K.Krishnamoorthy,Jessica Thomson(2002) also commonly used.. Ch. i n U. v. e n g cgive h ia new way to calculate. Roger L.Berger ,Dennis D.Boos(1994). p-value,which replace the old method ,called it a valid p-value .In 1996, Roger L.Berger used the new way to propose a new test for two parameter of binomial distribution which is more powerful than exact test. In the other hand, Roger L.Berger also explain the unconditional test is more suitable than the conditional test. In this paper,we propose a new method for two parameter of Poisson distribution which revise from Roger L.Berger’s method. The result we obtain that our new test is really get a much bigger rejection region.. IV.

(5) We found when the fixed α increasing ,the set of more powerful test increasing, and when the fixed power increasing ,the required sample size decreasing.. Keywords: Poisson Distribution ,Conditional Test ,Exact Test ,More Powerful Test, Confidence Set ,Monte Carlo Method.. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. V. i n U. v.

(6) 目次 摘 要 .............................................................................................................................II. ABSTRACT................................................................................................................ IV 第一章. 緒論 .............................................................................................................. 5. 第二章. 文獻探討 ...................................................................................................... 8. 政 治 大. 2.1 條件檢定 ........................................................................................................... 8. 立. 2.2 精確性(未給定條件)檢定 ......................................................................... 10. ‧ 國. 學. 2.3 有效的 P-VALUE .............................................................................................. 12. 研究方法 .................................................................................................... 18. sit. y. Nat. 第三章. ‧. 2.4 較強力檢定 ..................................................................................................... 13. n. al. er. io. 3.1 波松母數精確性檢定 ..................................................................................... 18. v. 3.2 波松母數較強力檢定 ..................................................................................... 20 第四章. Ch. engchi. i n U. 模擬分析比較 ............................................................................................ 24. 4.1 參數設定 ......................................................................................................... 24 4.2 兩波松母數的精確性檢定與較強力檢定建構拒絕域 ................................. 24 4.3 模擬之𝐋𝐞𝐯𝐞𝐥 − 𝛂檢定 ................................................................................... 29 4.4 模擬之檢定力 ................................................................................................. 33 第五章. 實例分析 .................................................................................................... 35. 5.1 三葉草種子 ..................................................................................................... 35 5.2 輪船零件 ......................................................................................................... 40. 1.

(7) 第六章. 結論與建議 ................................................................................................ 41. 參考文獻...................................................................................................................... 42. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i n U. v.

(8) 表次 表 2.1. α = 0.1下,𝑝\ u, v 與𝑝_ u, v 的比較 ................................................. 15. 表 3.1. α = 0.05下,αa 𝜆; 𝑥1 , 𝑥2 與Z u, v 的比較 ........................................ 22. 表 5.1. 𝑍 𝑦6 , 𝑦7 與𝑝g 𝑦6 , 𝑦7 之比較 ................................................................. 37. 表 5.2. 給定α = 0.05、不同檢定力下比較兩個檢定所需要的樣本數 ......... 40. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 3. i n U. v.

(9) 圖目錄 圖 2.1 α = 0.1下,𝑝h u, v 與𝑝a u, v 的拒絕域............................................... 16 圖 2.2 α = 0.1下的𝑍 21,14 ............................................................................. 16 圖 2.3 𝑝h u, v 與𝑝a u, v 的 p-value ................................................................... 17 圖 3.1 𝑝h 𝑥6 , 𝑥7 與𝑝a 𝑥6 , 𝑥7 的拒絕域 ............................................................ 23 圖 3.2 𝑝h 𝑥6 , 𝑥7 、𝑝a 𝑥6 , 𝑥7 與二項分配條件檢定的 p-value ....................... 23 圖 4.1 Level-α、d = 0下的拒絕域 ................................................................... 25. 政 治 大 精確檢定與較強力檢定之 p-value 比較 ................................................ 29 立. 圖 4.2 Level-α = 0.05、d ≠ 0下的拒絕域....................................................... 27 圖 4.3. ‧ 國. 學. 圖 4.4 α = 0.05、d = 0、𝜆1 = 25、35、45下的檢力 .................................. 33 圖 5.1 d=0, 𝑦1, 𝑦2: 0~100之拒絕域 ............................................................... 37. ‧. 圖 5.2 α = 0.05,d=0, 𝑦1, 𝑦2: 0~100之 p-value ........................................... 38. y. Nat. n. al. er. io. sit. 圖 5.3 α = 0.05,d=0,檢定力變化 ................................................................ 38. Ch. engchi. 4. i n U. v.

(10) 第一章 緒論 波松分配應用在許多農業學、生態學、生物學、藥學、商業行為、工業與 品質管理各方面中,可以在許多實際上的研究或實際例子看到,如:若想比較 兩家速食餐廳(麥當勞、肯德基)在 1 個小時內的平均來客數是否相等以比較 是否消費者對於不同速食品牌的喜愛是否有差異,或是流行病學研究常認為某 一事件的發生次數近似波松分配,有一特定的比率假設。. 政 治 大 X,而期望 X 發生的次數(頻率)為λ(即E X = λ),因此我們稱X服從一個均 立 假設研究者在一段單位區間或一段時間內觀察到某特定事件、個數,計為. ‧ 國. no p qr s!. , x = 0,1,2, … , λ > 0,. ‧. P X=xλ =. 學. 數為λ的波松分配,其機率密度函數可表示為以下:. sit. y. Nat. 亦可以稱X~Poisson(λ),X ≥ 0,λ為此機率密度函數的參數。. io. er. 若今天我們觀察到兩筆分別從不同均數的波松分配抽取的隨機變數,令為. n. a𝑋66l , 𝑋67, … , 𝑋69 ~Poisson λ6 ,i v C , … , 𝑋 ~PoissonUλ n, 𝑋76 , 𝑋77h e n79g c h i 7 S. U. 則我們想要知道兩個波松分配的均數是否相同或是相差多少,因此我們可以給 定一假設𝐻E :𝜆7 − 𝜆6 ≤ 𝑑 𝑣𝑠 𝐻6 : 𝜆7 − 𝜆6 > 𝑑,其中𝑑是相差的數,為一正實 數,或是假設𝐻E :. vS vU. ≤ 𝑐 𝑣𝑠 𝐻6 :. vS vU. > 𝑐比較兩波松分配均數的比例;我們先把. 兩隨機變數分別作加總,得 𝑋6 =. 9S 5T6 𝑋6x. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 n6 λ6 ,. 𝑋7 =. 9U yT6 𝑋7y. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(n7 λ7 ),. 6. 對任意的0 < α < ,我們希望利用𝑋6 與𝑋7 來檢定是否均數相同。 7. 5.

(11) 對於這類問題的方法有 Przyborwski 和 Wilenski(1940)的條件檢定,𝑋6 給定 v. 𝑋6 + 𝑋7 的條件下為一個二項分配,而其成功的機率為 S 的函數,𝐻E 的假設上需 vU. 要利用概似比檢定(Likelihood Ratio Test,LRT)建立拒絕域以計算 p-value 與檢 定力。 而另一種檢定的方式是由 K.Krishnamoorthy 與 Jessica Thomson(2002)修 改由 Storer 與 Kim(1990)提出對於兩二項分配的非條件檢定,讓我們可以建 立一個對兩波松分配的非條件檢定,在此稱為精確性檢定。. 政 治 大 發現,在固定顯著水準α下,精確性檢定的 p-value 大於條件檢定的 p-value,且 立 K.Krishnamoorthy 與 Jessica Thomson(2002)比較條件檢定與精確性檢定. ‧ 國. 學. 更接近顯著水準α,而精確性檢定的檢定力比條件檢定要來得高,因此我們認為 精確性檢定在處理兩波松均數的問題時比條件檢定更來得適合,而這個結果對. ‧. 於我們來說並不是非常意外,因為 Roger L.Berger(1996)對於處理兩二項分配的. y. Nat. io. sit. 成功機率問題時,也說到非條件的檢定會比條件檢定來得更加合適。. er. Roger L.Berger 與 Dennis D.Boos(1994)提出了固定特定信賴區間. al. n. v i n (Confidence Set)的方式計算 Cp-value,且把對於任意統計量小於顯著水準α的 hengchi U. p-value 稱為一個有效的 p-value(Valid p-value),而 Roger L.Berger(1996)檢定兩 個二項分配的成功機率是否相等時,比較非條件檢定與新提出的檢定發現,兩 者的 p-value 都是有效的,而後者的檢定其檢定力有較好的表現,因此我們稱這 個新提出來的檢定為一個較強力檢定(More Powerful Test,MP-test)。 我們回到一開始的問題是為了要檢定兩個波松母數的均數是否相同,精確 性檢定比條件檢定好,然而目前尚未建構一個對於上述問題的較強力檢定,因 此我們希望以 K.Krishnamoorthy 與 Jessica Thomson 建構的精確性檢定上,利用 Roger L.Berger 與 Dennis D.Boos 的固定特定信賴區間,建構一個較強力檢定。. 6.

(12) 而之後每章的重點:第二章為文獻探討,將整理條件檢定、非條件檢定與 精確性檢定的建構方式與如何計算 p-value、檢定力,同時探討 Roger L.Berger 與 Dennis D.Boos(1994)定義的信賴區間與有效的 p-value,並以 Roger L.Berger (1996)對於兩二項分配成功機率是否相同為例;第三章為研究方法,我們提 出一個以檢定兩個波松分配均數的較強力檢定;第四章為模擬分析,我們利用 精確性檢定及第三章的較強力檢定建立拒絕域,並給定不同的α值與 d 下計算 p-value 與檢定力;第五章分別舉例 Przyborowski 與 Wilenski(1940)考慮兩袋三 葉草種子與 Shiue 與 Bain(1982)考慮某個影響輪船速度上的零件;第六章為 結論與建議。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 7. i n U. v.

(13) 第二章 文獻探討 本章主要介紹檢定兩波松分配均數是否相等的方法。第一節是 Przyborwski 和 Wilenski(1940)提出的條件檢定,再利用蓋似比檢定計算與虛無假設相對應的 拒絕域;第二節是 K.Krishnamoorthy 與 Jessica Thomson(2002)提出的檢定兩 波松分配均數的精確性檢定;第三節是 Roger L.Berger 與 Dennis D.Boos(1994) 定義有效的 p-value,以及如何計算特定的信賴區間;第四節為 Roger L.Berger. 政 治 大. (1996)給定的信賴區間下建立的最強力檢定。. 立. 2.1 條件檢定. ‧ 國. 學. Przyborwski 和 Wilenski(1940)提出的條件檢定常用在檢定兩波松分配均數. ‧. 是否相同的問題。假設X66 , … , X69S 與X76 , … , X79U 分別為從兩波松分配抽取的隨. n. al. Ch. sit. 9S 5T6 𝑋65. ~Poisson(𝑛6 λ6 )、X7 =. ~Poisson(𝑛7 λ7 ),. er. 9S 5T6 𝑋65. io. X6 =. y. Nat. 機變數,令. i n U. 我們可以推導出當給定x6 + x7 = 𝑘,得到. engchi. v. n. X6 |x6 + x7 = 𝑘~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑘, 𝑝( S )), nU. n. 其中𝑘是給定次數,而𝑝( S )為(n6 , n7 , λ6 , λ7 )的聯合函數,表示為 nU. 𝑝. nS nU. =. • r ( S )( S ) •U. rU. • r 6‚( S )( S ) •U. ,. rU. 因此我們可以由二項分配計算拒絕域,再找概似函數後使其極大化,如 L X6 |x6 + x7 = k, p = C‡ˆS p‡S (1 − p)ˆ‰‡S , ‘. ‘. •. •. Sup‹ 𝐿 X6 = x6 |x6 + y7 = 𝑘, 𝑝 = 𝐶••S ( S )‘S (1 − S )•‰‘S , 其中,L(.)為二項分配的概似函數,接著計算概似比檢定:. 8.

(14) Sup‹’ 𝐿 = . 𝐶••S 𝑝E ‘S (1 − 𝑝E )•‰‘S , 𝑖𝑓 𝑝E <. λ x6 =. ‘. ‘. • ‘S ,. •. •. •. 𝐶••S ( S )‘S (1 − S )•‰‘S , 𝑖𝑓𝑝E ≥. ”•–—’ ˜ ”•–— ˜. ‘S. ™’ šS (6‰™’ )›qšS. =. š š ( S )šS (6‰ S )›qšS › ›. , 𝑖𝑓 𝑝E <. ‘S. • , ‘S. 1 , 𝑖𝑓𝑝E ≥. •. 當𝑝E 𝑘 < x6 時, 𝜆 𝑥6 < 1;𝑝E 𝑘 ≥ x6 時 𝜆 𝑦 = 1,故𝜆 𝑥6 隨著𝑥6 增加而遞減, 𝜆 𝑥6 對𝑥6 是遞減函數,此為一個右尾檢定,當大於某一常數時拒絕虛無假設; 當給定觀察值(𝑛6 , k6 , 𝑛7 , k 7 )後, p-value 可表示為下: n. • 5 5T•S 𝑝. P X6 ≥ 𝑘6 k, 𝑝( S ) =. (1 − 𝑝) 政 治 大 nU. nS nU. nS nU. =1. nS nU. ≤ 𝛼,. 立 > 𝑐,其中c ≠ 1;若c = 1時,而檢定規則可以變為 H6 :. vs. nS nU. ≠ 1 → HE : λ6 ≤ λ7. 學. HE :. ≤ 𝑐與H6 :. H6 : λ6 ≠ λ7 ,. vs. ‧. ‧ 國. 為檢定HE :. •‰5. p-value 則可表示為:. Nat. n. n. y. 2×min {P X6 ≥ 𝑘6 k, 𝑝( S ) , P X6 ≤ 𝑘6 k, 𝑝( S ) }, nU. io. sit. nU. n. al. ¤ ˆS TE. er. 為了計算檢定力的大小,對立假設為真下我們可以進一步表示檢定力為. v i n C h 𝐼(P X6 ≥ 𝑘6Uk = 𝑘6 + 𝑘7, p engchi. p q¢S £S 9S vS ›S p q¢U £U 9U vU ›U ¤ •U TE •S ! •U !. vS vU. ≤ 𝛼),. 其中 I(.)為指標函數。 n. 若為檢定HE : λ7 − λ6 ≥ 𝑑,𝑑為一常數,則可以將𝑝( S )改寫成𝑝(λ6 )的函 nU. 數,當HE 下: λ7 − λ6 = 𝑑 → λ7 = 𝑑 + λ6 代入𝑝. nS nU n. 得𝑝 λ6 =. 將𝑝 λ6 代入計算 p-value 與檢定力的公式中𝑝( S )即可。 nU. 9. • r ( S )( S ) •U. rS ¦§. , • r 6‚( S )( S ) •U. rS ¦§.

(15) 2.2. 精確性(未給定條件)檢定. 此節主要探討由 K.Krishnamoorthy 與 Jessica Thomson(2002)修正 Storer 與 Kim(1990)提出兩二項分配的非條件檢定,提出檢定兩波松分配均數的精 確性檢定,此檢定不用給定條件。 若虛無假設與對立假設為: HE : λ7 − λ6 ≤ 𝑑. 9S 5T6 𝑋65. ~Poisson(𝑛6 λ6 )、X7 =. ‡. 與 U 差異的變異數如下. 9S. 與. 𝑉𝑎𝑟. ‡U. 9U. ‡U 9S. −. ‡S. =. 9U. nU. +. 9S. nS 9U. ,. 的不偏估計量,因此上式可以改成為. ‧. ‡S. 而其中λ6 與λ7 為. 立. 7 7. 學. ‧ 國. 9U. ~Poisson(𝑛 λ )下檢定,建立 治 政 大. Nat. V• =. «S ¢S. 9S. +. «U ¢U. 9U. y. ‡S 9S. 9S 5T6 𝑋65. ,. io. sit. 在X6 =. H6 : HE : λ7 − λ6 > 𝑑,. vs. n. al. er. 我們將表示檢定統計量為. C hT• ,• = e n g c® h,i «U «S ‰ ‰¢U ¢S. S. U. ¯. i n U. v. 在給定觀察值(𝑛6 , k6 , 𝑛7 , k 7 )後,可改成 °U °S ‰ ‰¢U ¢S. T•S ,•U =. ®¯. ,. 為臨界值,其p − value = P(𝑇•S ,•U ≥ 𝑇•S ,•U |𝐻E )。 為計算𝑇•S ,•U 在𝐻E 為真時,其中原來的λ6 與λ7 需要做進一步的調整;這裡 引用 Liddell(1978)與 Storer、Kim(1990)提出當HE 為真下,帶入λ7 =λ6 +d, E. •S ‚•U 9S ‚9U. =. 9S vS ‚9U vU 9S ‚9U. 10. = 𝜆6 +. -9U 9S ‚9U. ,.

(16) 且k6 、k 7 為𝑋6 、𝑋7 的不偏估計量,可以改為 λ6• =. ˆS ‚•U 9S ‚9U. −. -9U 9S ‚9U. ,. 所以λ6• 為一估計𝜆6 的估計量,在HE 為真下,λ7• = λ6• + 𝑑,原式 p − value = P(𝑇•S ,•U ≥ 𝑇•S ,•U |𝐻E )可以經由下式計算: ¤ sS TE. oS oU p q¢S rS› 9S nS› p q¢U rS› ¦§ 9S nS› ‚-. ¤ sU TE. sS !. sU !. 𝐼 𝑇•S ,•U ≥ 𝑇•S ,•U ,. I(.)為指標函數,而計算上式檢定力,在H6 為真下,我們將上式改為 ¤. ¤. •S TE •U TE ¤. ¤. ‰9S nS›. 𝑛6 λ6•. sS. 𝑒 ‰9U. 𝑥6 ! ×𝐼 𝑇•S ,•U ≥ 𝑇•S ,•U ≤ 𝛼],. nS. nU. < 𝑐,可在HE 為真下,當. nS. io. λ7• = λ6• ×𝑐,. al. n. ¤ sU TE. = 𝑐 → λ7 = λ6 ×𝑐代入得到. y. nU. Ch. sU. sit. ≥ 𝑐與H6 :. 𝑛6 λ6• + 𝑑 𝑥7 !. 將λ6• 與λ7• 帶入計算 p-value: ¤ sS TE. nS› ‚-. er. ‧ 國. 立 𝑒. Nat. nS. •U. ‧. nU. 𝑒 ‰9U vU 𝑛7 𝜆7 𝑘7 !. 政 治 大. sS TE sU TE. 為檢定HE :. •S. 學. ×I[. 𝑒 ‰9S vS 𝑛6 𝜆6 𝑘6 !. engchi. i n U. v. oS oU p q¢S rS› 9S nS› p q¢U rS› ¦§ 9S nS› ×¹. sS !. sU !. 𝐼 𝑇•S ,•U ≥ 𝑇•S ,•U ,. 與檢定力 ¤. ¤. •S TE •U TE ¤. ¤. ×I[ sS TE sU TE. 𝑒 ‰9S vS 𝑛6 𝜆6 𝑘6 !. 𝑒 ‰9S. nS›. •S. 𝑛6 λ6•. 𝑒 ‰9U vU 𝑛7 𝜆7 𝑘7 ! sS. 𝑒 ‰9U. nS› ×¹. 𝑥6 !. 𝑛6 λ6• ×𝑐 𝑥7 !. ×𝐼 𝑇•S ,•U ≥ 𝑇•S ,•U ≤ 𝛼]。. •U. 11. sU.

(17) 2.3. 有效的 p-value. 此節主要探討以 Roger L.Berger 與 Dennis D. Boos(1994)提出的特定信賴區 間,以及定義何為「有效的 p-value」。 假設某隨機變數 X 服從某一分配𝑃º (𝑣),當檢定分配參數是否為某一常數 時,如𝐻E : 𝑣 = 𝑣E ,可以帶入觀察值𝑣E 計算 p-value,如p − value = 𝑃º’ (𝑇 ≥ 𝑡); 然而若假設 X 服從某一分配𝑃º,¼ (𝑣, 𝜃),對參數檢定𝐻E : 𝑣 = 𝑣E 時就顯得複雜許 多,因為在未給定參數𝜃之形成的拒絕域為二維平面甚至多維以上,研究者為. 治 政 𝑃 (𝑇 ≥ 𝑡)(Example by 計算 P 值與α之間大小關係,希望p − value = 𝑠𝑢𝑝 大 立 ¿ º’ ,¿. ‧ 國. 學. Bickel 與 Doksum,1977,pp.171-172),而 Roger L.Berger 與 Dennis D. Boos 稱這. 類問題中的參數𝜃為一個多餘參數(Nuisance Parameter) ,上式 p-value 不一定. ‧. 容易計算,我們可以代入θÁ˜Â 或是給定充分統計量下與𝜃無關求出;若𝐻E 下計. y. sit. io. P(p − value ≤ α) ≤ α, ∀α ∈ [0,1],. n. al. er. Nat. 算出來的 p-value 滿足. i n U. v. 代表以此方式計算出的 p-value 其為一個顯著水準為α的檢定,因此稱此為一個 有效的 P 值。. Ch. engchi. 12.

(18) 2.4. 較強力檢定. Roger L.Berger 與 Dennis D.Boos(1994)提出有效的 P 值,因此參數的選 擇是非常重要的,然而θÁ˜Â 不一定是個好選擇,可能難以計算以及無法找到給 定的充分統計量使統計量與𝜃無關,為了解決我們所找出的檢定一定是有效 的,我們希望找出某𝜃讓 p-value 是最大的,而直覺想法是把𝜃的值域代進 𝑃º’ ,¿ (𝑇 ≥ 𝑡)計算,固定α下,最大的 p-value 可表示為: 𝑝g t = 𝑠𝑢𝑝¿∈‹ 𝑃¿ (𝑇 ≥ 𝑡).. 治 政 大 Roger L.Berger 與 Dennis D.Boos(1994)改善上述的方法,以此計算有效 立 ‧ 國. 學. 的 p-value,意指在𝐻E 為真下,改善後的拒絕域會比原來的好,以下我們將先詳 述介紹改善的方法與引理,最再舉 Roger L.Berger(1996)的例子,比較較強力. ‧. 檢定與精確性檢定的差別。. n. al. er. io. 𝑝Å = 𝑠𝑢𝑝¿∈hÇ 𝑝 𝜃 + 𝛽,. sit. y. Nat. 我們先令在虛無假設下𝐶Å 為一 100(1 − 𝛽)%的信賴區間,且. i n U. v. 此𝑝Å 是計算所有𝜃 ∈ 𝐶Å 下最大的 p-value,上式𝑝Å 恆大於𝛽,而選擇𝛽值須格外小. Ch. engchi. 心,可根據 Roger L.Berger 與 Dennis D.Boos(1996)的建議取之;而𝑝Å 亦是一 個在顯著水準為α的檢定,可根據以下的引理: 假設𝑝 𝜃 為一個顯著水準為α的檢定,且𝐶Å 滿足𝑃(𝜃 ∈ 𝐶Å ) ≥ 1 − 𝛽,在𝐻E 下,𝑝Å = 𝑠𝑢𝑝¿∈hÇ 𝑝 𝜃 + 𝛽亦為一個顯著水準為α的檢定。 證明:. P 𝑝Å ≤ 𝛼 = 𝑃 𝑝Å ≤ 𝛼, 𝜃E ∈ 𝐶Å + 𝑃 𝑝Å ≤ 𝛼, 𝜃E ∈ CÅ ≤ 𝑃 p θE + β ≤ α, 𝜃E ∈ 𝐶Å + 𝑃 𝜃E ∈ CÅ ≤ 𝑃 p θE ≤ α − β + 𝛽 ≤ α − β + β = α。. 13.

(19) 以下以 Roger L.Berger(1996)的例子,更能清楚了解如何建構較強力檢 定。假設隨機變數U~Binomial(33, 𝑝Ë )與 V~Binomial(17, 𝑝º ),檢定: 𝐻E : 𝑝Ë = 𝑝º. 𝐻6 : 𝑝Ë < 𝑝º ,. vs. 我們希望找到一個α = 0.1的檢定,使用 Suissa(1985)與 Haber(1986)定義的 Z 作為檢定統計量,其 p-value 為: 𝑝g u, v = 𝑠𝑢𝑝™∈[E,6] 𝑃™ 𝑍 U, V ≥ 𝑍 u, v = 𝑠𝑢𝑝™∈[E,6]. (Í,Î)∈ÏÐ (Ñ,®) 𝐵𝑖nomial(𝑎; 33, 𝑝) ×𝐵𝑖nomial(𝑏; 17, 𝑝),. 上式中在虛無假設下 Z u, v. 立. 治 政 大= = ,其中,p ™Ó ‰™Ô. S S Õ ¢. ™(6‰™)( ‚ ). Ë‚º Ö‚9. ,. ‧ 國. 學. 檢定規則若𝑍 U, V ≥ 𝑍 u, v = 𝑍×TE.6 ,則拒絕𝐻E ;由𝑝g u, v 所建構的拒絕域 為兩二項分配的精確性檢定,再計算不同 p,找出最大的𝑝g u, v ,而 Roger. ‧. L.Berger 與 Dennis D.Boos 將𝑝g u, v 式改為𝑝¹ u, v :. y. Nat. er. io. (Í,Î)∈ÏÐ (•,Ø) 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑎; 𝑚, 𝑝) ×𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(𝑏; 𝑛, 𝑝). al. n. = 𝑠𝑢𝑝™∈hÇ (Ë,º). + β,. sit. 𝑝_ u, v = 𝑠𝑢𝑝™∈hÇ (Ë,º) 𝑃™ 𝑍 U, V ≥ 𝑍 u, v. Ch. engchi U. v ni. + β,. 其中𝑝¹ u, v 與𝑝g u, v 的差別是 p 的選取上, 𝑝¹ u, v 中的 𝑝 ∈ 𝐶Å (𝑥, 𝑦)為𝐻E : 𝑝Ë = 𝑝º = 𝑝下,X + Y~Binomial(m + n, p)中 Clopper 與 Pearson(1934)所定義的 p 的信賴區間,Roger L.Berger 近一步利用累積的二項分配轉換為 Beta 之累積 分配函數再轉換為 F 分配得到: (Ú‚6)Û. Ú Í‚(Ή͂6)Û. U ÜqݦS ,UÝ,. Ç U. ≤𝑝≤. Ή͂(Í‚6)Û. 其中,a = x + y,b = m + n,Fà,á,Ç 為100 1 − U. 𝛽 = 0.001。. 14. U ݦS ,U(ÜqÝ),. Å 7. Ç U. U ÜqݦS ,UÝ,. Ç U. ,. %下之Fà,á 百分位數,.

(20) 表 2.1 分別是𝑝\ u, v 與𝑝_ u, v 計算出來的部份結果,檢定統計量為 𝑍 u, v ;以𝑝a u, v 來看,對於 0<p<1 下,代表以𝑍 23,15 為α = 0.1的臨界值, 對於𝑝g u, v = 𝑠𝑢𝑝™∈(E,6) 𝑃™ 𝑍 U, V ≥ 𝑍 23,15. = 0.0823,無論 p 帶多少進去. 都是小於𝑍×TE.6 ,因此𝑝g U, V 為以𝑝g 23,15 建立的拒絕域,如圖 2.1 黑點的集 合;然而 0.0823 與 0.1 間是否還是有拒絕域可以繼續增加為我們感興趣的問 題,為此引進 Roger L.Berger 與 Dennis D.Boos(1994)的較強力檢定。 在這個問題當中此檢定為一個右尾檢定,表 2.1 是𝑝g u, v 找到的點,而 Roger L.Berger 以 Z(23,15)為基準向左方找上一個點,如表 2.1 中的. 治 政 大 0.1,然而 Z(0,1)=1.407,並計算在𝑝 ∈ 𝐶 (0,1)中,𝑝 是否小於顯著水準 立 Å. _. ‧ 國. 學. 𝑝_ 0,1 = 0.1558,因此我們不將這點納入較強力檢定的拒絕域,以此類推到當 Z(21,14)=1.368 時,雖然𝑝ä 21,14 = 0.153,卻僅發生在 p= 0.03 時(見圖 2.2. ‧. 黑線的最高點對應到的 p),但若是我們單只計算 99.99%下 p 的信賴區間,觀察. sit. y. Nat. 此點是否能夠納入較強力檢定的拒絕域,我們將 a=21+14、b=33+17、β =. n. al. er. io. 0.001帶入 p 的信賴區間公式,結果p ∈ (0.459,0.881) (見圖 2.2 中綠色實線分別. i n U. v. 為p = 0.459 與 p = 0.881),且𝑝h u, v = 0.0946 + 0.001 = 0.0956 < 0.1,因此 此點可被加進新的拒絕域。. Ch. engchi. 表 2.1 𝛂 = 𝟎. 𝟏下,𝒑𝐙 𝐮, 𝐯 與𝒑𝐂 𝐮, 𝐯 的比較. u, v. (23,15). (0,1). (26,16). (9,8). (3,4). (21,14). 𝑍 u, v. 1.454. 1.407. 1.401. 1.399. 1.394. 1.368. 𝑝\ u, v. 0.0823. 0.1548. 0.1549. 0.153. 0.153. 0.153. 𝑝_ u, v. 0.0833. 0.1558. 0.0949. 0.0906. 0.1553. 0.0956. 圖 2.1 中,黑色圓圈是𝑝\ u, v 所找到的拒絕域,而紅色的叉叉是𝑝_ u, v 額 外所找拒絕域,正字號是𝑍 23,15 ≤ 𝑍 u, v ≤ 𝑍 21,14 中,給定 p 的信賴區間. 15.

(21) 下𝑝_ u, v > 0.1的點,無法被加進𝑝_ u, v ;最後黑色圓圈加上紅色的叉叉為 𝑝_ u, v 找到所有較強力檢定的拒絕域;在𝐻E : 𝑝Ë = 𝑝º ,與𝐻6 : 𝑝Ë < 𝑝º 下,拒絕域 為以𝑝_ u, v 下形成上三角形。 圖 2.1 𝛂 = 𝟎. 𝟏下,𝒑𝑪 𝐮, 𝐯 與𝒑𝒁 𝐮, 𝐯 的拒絕域. 立. 政 治 大. ‧. ‧ 國. 學 y. sit. io. n. al. er. Nat. 圖 2.2 𝛂 = 𝟎. 𝟏下的𝒁 𝟐𝟏, 𝟏𝟒. Ch. engchi. i n U. v. 註:紅線為α = 0.1,以下為有效的 p-value;藍線為α − β = 0.1 − 0.001,以下 為較強力檢定的 p-value。. 16.

(22) 圖 2.3 分別是𝑝_ u, v 與𝑝_ u, v 的點計算 p-value,因為我們的拒絕域納入更 多的點,而且根據上述的引理,較強力檢定不只是一個顯著水準為α的檢定,其 p-value 亦是有效的,另外我們檢定力也增加。 圖 2.3 𝒑𝑪 𝐮, 𝐯 與𝒑𝒁 𝐮, 𝐯 的 p-value. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 17. i n U. v.

(23) 第三章. 研究方法. 此節我們將說明如何建立波松母數兩兩母均數差之較強力檢定。根據第二 章第二節,先建立一個兩波松母數的精確性檢定,假設 𝐻E :𝜆7 − 𝜆6 ≤ 𝑑 𝑣𝑠 𝐻6 : 𝜆7 − 𝜆6 > 𝑑, 然候利用 Roger L.Berger 與 Dennis D.Boos(1994)𝑝h u, v 與𝑝a u, v 的定義, 找出可以增加的拒絕域計算 p-value、檢定力;然而對於波松母數的較強力檢定. 政 治 大 Thomson 的精確性檢定找出拒絕域,第二節我們將修改精確性檢定並提出對於 立. 問題時,尚有許多問題需要解決。第一節我們以 K.Krishnamoorthy 與 Jessica. ‧ 國. 學. 兩波松母數的較強力檢定。. Nat. y. ‧. 3.1 波松母數精確性檢定. io. sit. 此節我們利用 K.Krishnamoorthy 與 Jessica Thomson 的精確性檢定;假設有. er. 兩組從波松母數抽取之隨機變數,如:. al. n. v i n 𝑋66 , 𝑋67 , … , 𝑋69 ~Poisson C h λ6 與𝑋76, 𝑋77, …U, 𝑋79 ~Poisson λ7 , engchi S. 我們令. 𝑋6 =. 9S 5T6 𝑋65. U. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 n6 λ6 、𝑋7 =. 9U yT6 𝑋7y. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(n7 λ7 ),. 為檢定: 𝐻E :𝜆7 − 𝜆6 ≤ 𝑑 𝑣𝑠 𝐻6 : 𝜆7 − 𝜆6 > 𝑑, 我們的檢定統計量為:. Z x6 , x 7 =. šU šS ‰ ‰ï •U •S. ®«. ~N(0,1) ,其中V• =. 18. šS ¢S. 9S. +. šU ¢U. 9U. ,.

(24) 此時我們想要找到一個有效的 p-value,在𝐻E 下,修正 Suissa(1985)與 Haber(1986)對 p-value 的定義可表示為:. 𝑝g 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v∈‹ 𝑃v 𝑍 𝑋6 , 𝑋7 ≥ 𝑍 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v∈‹. (Í,Î)∈ÏÐ (sS ,sU ) 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑎, 𝜆) ×𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑏, 𝜆. + 𝑑),. 其中,𝜆 ∈ ℜ‚ , 𝑅𝑍 𝑥1 , 𝑥2 = {(a, b) ∈ 𝒳}且 Z(a, b) ≥ Z(𝑥1 , 𝑥2 );此時,. 𝑝g 𝑥6 , 𝑥7 為此組資料中可以被找到最大的拒絕域,而檢定規則為: Reject 𝐻E ⟺ 𝑝g 𝑥1 , 𝑥2 ≤ 𝛼, 稱此為一個顯著水準為𝛼的檢定。而不同𝜆下的 p-value 則表示為: ¤. 政 治 大 𝑛 𝜆+𝑑 𝑛 𝜆 𝑒. 𝑒 ‰9S 𝜆 6 𝑥6 !. 立. ‧ 國. 𝑥7 !. ×𝐼(Z(𝑋6 , 𝑋7 ) ≥ Z(𝑥6 , 𝑥7 )),. ‧. Nat. io. •S TE •U TE. •S. 𝑒 ‰9U vU 𝑛7 𝜆7 𝑘7 !. ¤. S. S. U. sS TE sU TE. ×𝐼(Z(𝑋6 , 𝑋7 ) ≥ Z(𝑥6 , 𝑥7 )) ≤ 𝛼], 上述式子可以計算精確性檢定的 p-value 與檢定力。. •U. a l ‰9 𝜆 s ‰9 𝜆‚- i v 𝑛7 𝜆 + 𝑑 𝑒 C 𝑛6 𝜆 𝑒 h𝑥6e! n g c h i U𝑥7n!. n. ×I[. 𝑒 ‰9S vS 𝑛6 𝜆6 𝑘6 !. er. ¤. ¤. y. 而檢定力的計算為:. ¤. sU. 7. 學. sS TE sU TE. ‰9U 𝜆‚-. sS. sit. ¤. 19. sU.

(25) 3.2 波松母數較強力檢定 此節我們將延續上節所建構的精確性檢定,利用 Roger L.Berger 與 Dennis D.Boos(1994)年的特定信賴區間與有效的 p-value,來建構對兩波松母數的較強 力檢定。 首先我們利用𝑝g 𝑥6 , 𝑥7 找到顯著水準大小為𝛼的檢定,而比較不同的是這 裡我們將上節令𝑝a 𝑥6 , 𝑥7 改成𝑝h 𝑥6 , 𝑥7 ,因此 𝑝h 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v∈hÇ (sS ,sU ) 𝑃™ 𝑍 𝑋6 , 𝑋7 ≥ 𝑍 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v∈hÇ (sS ,sU ). +β. 政 治 大 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑎, 𝜆) ×𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑏, 𝜆 + 𝑑). 立. (Í,Î)∈Ïö (sS ,sU ). + β,. ‧ 國. 學. 其中,𝜆 ∈ 𝐶Å (𝑥6 , 𝑥7 )下,我們先計算當給定的(𝑥6 , 𝑥7 )下的信賴區間,我們藉由 第二章第二節中,Liddel(1978)與 Storer 與 Kim(1990)提出虛無假設為真下,我. io. al. 9S vS ‚9U vU 9S ‚9U. = 𝜆6 +. -9U 9S ‚9U. n. 而x6 、x7 為𝑋6 、𝑋7 的不偏估計量,因此可以改為:. Ch. ,. sit. =. 9S ‚9U. er. Nat. •S ‚•U. E. y. ‧. 們可以帶入λ7 =λ6 +d,因此. i n U. v. -9 e9‘n‚s − h i , ‚9g c9 ‚9. λ6• =. S. U. S. U. U. S. U. 而變異數為: •S ‚•U. Var. 9S ‚9U. 9S 5T6 𝑋65. 其中變異數是因為𝑋6 = 𝑋7 =. 9U yT6 𝑋7y. =. 9S vS ‚9U vU (9S ‚9U )U. =. vS (9S ‚9U ). +. (9S ‚9U )U. ,. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 n6 λ6 與. ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(n7 λ7 )下之不偏估計量,因此Var 𝑋5 = 𝑛5 𝜆5 。. 當隨機變數(𝑋6 , 𝑋7 )下,我們可以得到這組的 100(1-α)%之信賴區間為 𝜆6 +. -9U 9S ‚9U. − 𝑧ù × U. vS 9S ‚9U. +. 9S ‚9U U. , 𝜆6 +. 20. -9U 9S ‚9U. + 𝑧ù × U. vS 9S ‚9U. +. 9S ‚9U U. ,.

(26) 藉由上式我們可以得到信賴區間,但是當單一給定(𝑥6 , 𝑥7 )下,上式的信賴區間 並非不偏的,因此我們將在這裡做些許調整讓此信賴區間能夠達到穩定的結 果,以下我們將敘述如何利用蒙地卡羅法(Monte Carlo method)建構此信賴區 間。 令(𝑦6 , 𝑦7 )分別為從波松母數抽出之隨機變數,且其波松母數之均數分別為 (𝑥6 , 𝑥7 ),記作 𝑦6 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑥6 ), 𝑦7 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑥7 ),. 治 政 大 : 因此,我們將(𝑦 , 𝑦 )分別重複抽取一萬次,而每一次的結果取算術平均𝑦 立 7. 5. úS ‚úU 7. , i = 1, … ,10000,. 學. 𝑦5 =. ‧ 國. 6. 因此我們將得到 10000 組由隨機變數(𝑥6 , 𝑥7 )得到之𝑦5 ,令 6EEEE 5T6 𝑦5 ,. ‧. Y=. n. al. U. Ch. U. 其中,𝑌為Y的平均數,sd 為標準差。. engchi. y. sit. io. 𝑌 − 𝑧ü ×𝑠𝑑 𝑌 , 𝑌 + 𝑧ü ×𝑠𝑑(𝑌) ,. er. Nat. 我們期望每一次的(𝑥6 , 𝑥7 )將落在𝜆 ∈ 𝐶Å (𝑥1 , 𝑥2 )為:. i n U. v. 有了上述推導的蒙地卡羅法讓𝜆 ∈ 𝐶Å (𝑥6 , 𝑥7 )下,我們將可以藉由上節所建 立之𝑝g 𝑥6 , 𝑥7 下,增加新的點建構為較強力檢定𝑝h 𝑥6 , 𝑥7 ,而蒙地卡羅法可以 幫助我們在100 1 − β %對任意的 𝑥6 , 𝑥7 下找到合理之信賴區間。而根據 Roger L.Berger 與 Dennis D.Boos 的引理,𝑝g 𝑥6 , 𝑥7 與𝑝h 𝑥6 , 𝑥7 皆為顯著水準為α的檢 定。 另外引理中說明只要β夠小,𝑝h 𝑥6 , 𝑥7 ≤ 𝛼恆成立,而β通常取 0.001 或 0.01 即可,因此我們取 Roger L.Berger(1996)所使用的 Roger L.Berger(1996) 建議可取β = 0.001 或 0.0001,我們取0.001建立 99.99%的信賴區間。. 21.

(27) 舉例來說若檢定𝐻E ,假設 d=0 下,為找出顯著水準 α = 0.05的檢定,取𝑥6 與𝑥7 各為 0~100,我們先利用精確性檢定找出適當𝑝g 𝑥6 , 𝑥7 即有效的 p-value 後,令β =0.001,找出𝜆 ∈ 𝐶E.EE6 (𝑥1 , 𝑥2 )後,建立較強力檢定𝑝h 𝑥6 , 𝑥7 ,再比較 拒絕域的集合與 p-value。 我們找出Z 76,98 = 1.67為在α = 0.05下最大的臨界點,而 p-value 為 0.0487,對於𝐻E 來說此檢定為右尾檢定,於是我們以Z 76,98 往左邊找,下個 點為Z 62,82 = 1.67,但𝑝\ 62,82 = 0.052 > 0.05,但我們利用𝑝h 𝑥6 , 𝑥7 的 定義,先計算以點 62,82 當作觀察值,並以統計軟體 R 重複抽樣 10000 次得. 治 政 = (52.3,91.4),而落在此區間的𝑝 大 62,82 立. 到𝐶E.EE6 62,82. _. = 0.0491 < 0.05,. ‧ 國. 學. 因此以 Roger L.Berger 定義下的較強力檢定,(62,82)可以被加進去的新的拒絕 域,最後找到 Z(77,99)=1.66,𝑝_ 77,99 = 0.0497 < 0.05,而經我們計算後,. sit. Nat. 之較強力檢定的拒絕域可見圖 3.1,p-value 則可見圖 3.2。. y. ‧. 比 Z(77,99)小的點之 p-value 皆大於 0.05,亦無法加進𝑝_ 𝑥1 , 𝑥2 中,最後完成. 𝑥6 , 𝑥7. n. al. er. io. 表 3.1 𝛂 = 𝟎. 𝟎𝟓下,𝛂𝒁 𝝀; 𝒙𝟏 , 𝒙𝟐 與𝐙 𝐮, 𝐯 的比較. (76,98). (62,82). Z(𝑥6 , 𝑥7 ). 1.67. 1.67. 𝑝\ 𝑥1 , 𝑥2. 0.0487. 0.052. 𝑝_ 𝑥1 , 𝑥2. 0.0488. 0.0491. Ch. …. (77,99). 1.66. …. 1.66. 0.052. 0.052. …. 0.052. 0.0493. 0.0495. …. 0.0497. e n g c1.67 hi. 註:共可增加 6 個點進𝑝h 𝑥6 , 𝑥7. 22. iv (69,90) n U. (33,48).

(28) 圖 3.1 𝒑𝑪 𝒙𝟏 , 𝒙𝟐 與𝒑𝒁 𝒙𝟏 , 𝒙𝟐 的拒絕域. 立. 政 治 大. ‧ 國. 學. 註:綠點為條件檢定的拒絕域,精確性檢定的拒絕域為綠點加上黑點,較強力 檢定則為精確性檢定的拒絕域再加上 6 個紅點。. ‧. 圖 3.2 𝒑𝑪 𝒙𝟏 , 𝒙𝟐 、𝒑𝒁 𝒙𝟏 , 𝒙𝟐 與二項分配條件檢定的 p-value. n. er. io. sit. y. Nat. al. Ch. engchi. 註:X 軸為𝜆6 = 𝜆7 = 𝜆. 23. i n U. v.

(29) 第四章. 模擬分析比較. 此章我們希望建立當任兩波松分配隨機變數下,對於𝐻E :𝜆7 − 𝜆6 ≤ 𝑑 𝑣𝑠 𝐻6 : 𝜆7 − 𝜆6 > 𝑑的問題,建立精確性檢定與較強力檢定的拒絕域,並計算 分別的 p-value 與檢定力。. 4.1 參數設定. 政 治 大 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛 立 nλ ,𝑋 = 𝑋 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(n(λ. 先假設n6 = n7 = 𝑛或n6 = n7 = 1,當𝐻E : 𝜆7 − 𝜆6 ≤ 𝑑為真時,我們令 𝑋6 =. 9 5T6 𝑋6x. 6. 9 yT6. 7. 7y. 6. + 𝑑)),. ‧ 國. 學. 設定參數α = 0.1、0.05、0.01、0.001,以及d = 0、1、2、10,𝜆6 = 25、35、45,比較𝑝g 𝑥6 , 𝑥7 與𝑝h 𝑥6 , 𝑥7 的拒絕域、p-value、檢定力,再經由統. ‧. 計軟體 R,利用蒙地卡羅法重複 100000 次,針對不同的α、d 以及𝜆6 模擬顯著. y. Nat. er. io. sit. 水準以及檢定力比較差異。. n. al 4.2 兩波松母數的精確性檢定與較強力檢定建構拒絕域 iv Ch. n U engchi. 我們將𝑋6 與𝑋7 各取若干筆,作為各條件下蒙地卡羅模擬的拒絕域,比較 𝑝g 𝑥6 , 𝑥7 與𝑝h 𝑥6 , 𝑥7 占 𝑥6 , 𝑥7 = { 0, n × 0, 𝑛 , 𝑛 ∈ ℕ}的比例。 而𝑋6 與𝑋7 分別為服從某均數的波松分配,因此每個的值域皆為ℕ,我們取 0~100 作為取值範圍。因此𝑝g 𝑥6 , 𝑥7 將改為 𝑝g 𝑥6 , 𝑥7 = 𝑠𝑢𝑝E"v"6EE 𝑃™ 𝑍 𝑋6 , 𝑋7 ≥ 𝑍 𝑥6 , 𝑥7 = 𝑠𝑢𝑝E"v"6EE. 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑎, 𝜆) ×𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑏, 𝜆 + 𝑑) Í,Î ∈ÏÐ sS ,sU. 與. 24.

(30) 𝑝h 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v∈hÇ {sS ,sU } 𝑃™ 𝑍 𝑋6 , 𝑋7 ≥ 𝑍 𝑥6 , 𝑥7 = 𝑠𝑢𝑝v. + 0.001. 𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑎, 𝜆) ×𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝑏, 𝜆 + 𝑑) + 0.001 (Í,Î)∈Ïö (sS ,sU ). 以下觀察α = 0.1、0.05、0.01、0.001下,𝑝g 𝑥6 , 𝑥7 與𝑝h 𝑥6 , 𝑥7 的情形,而 𝑝h 𝑥6 , 𝑥7 是基於精確性檢定再依序往臨界值左側,逐一計算每個點合理的信賴 區間,並判斷該點是否可以被加入到𝑝h ,直到沒有點可以被加進較強力檢定後 即是𝑝h 的拒絕域。圖 4.1~圖 4.2 中,黑點是精確性檢定所得拒絕域,,紅點是 較強力檢定找到額外可加的離散點;由圖 4.1(a)知,α = 0.1時可以增加最多的. 治 政 𝑥 ,𝑥 點,我們進一步找出α = 0.05、0.01、0.001下的𝑝 大 立 g. 6. 7. 與𝑝h 𝑥6 , 𝑥7 ,當α越. ‧ 國. 學. 小時,額外可增加的點也就越少,在我們的研究中以單尾為例,α = 0.01就已. 經沒有額外的點可被加進𝑝h 𝑥6 , 𝑥7 拒絕域;當 𝑥6 , 𝑥7 靠近左下方時能增加的點. Nat. n. al. er. io. (a) α = 0.1. sit. 圖 4.1 Level-𝛂、𝐝 = 𝟎下的拒絕域. y. ‧. 比較少,原因與波松分配的機率密度函數有關。. Ch. engchi. 25. i n U. v.

(31) (b) α = 0.05. 立. ‧. ‧ 國. 學. (c) α = 0.01. 政 治 大. n. er. io. sit. y. Nat. al. Ch. engchi. 26. i n U. v.

(32) (d) α = 0.001. 立. 政 治 大. ‧ 國. 學. 圖 4.2 Level-𝛂 = 𝟎. 𝟎𝟓、𝐝 ≠ 𝟎下的拒絕域. (a) α=0.05、d=1. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 27. i n U. v.

(33) (b) α=0.05、d=2. 立. 政 治 大. ‧ 國. 學. (c)α=0.05、d=10. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 28. i n U. v.

(34) 4.3 模擬之𝐋𝐞𝐯𝐞𝐥 − 𝛂檢定 此節我們藉由上節建構不同α與 d 下的拒絕域計算出 P 值。由圖 4.3(a)(d),以 Roger L.Berger 與 Dennis D.Boos(1994)提出的方法,在虛無假設下當λ越 大,P 值非常接近α,也因此我們相信𝑝h 𝑥6 , 𝑥7 比起精確性檢定有過之而無不 及的 P 值;當α=0.01 後,因為沒有其他額外的點可以被加進來𝑝h 𝑥6 , 𝑥7 ,因 此精確性檢定與較強力檢定的 P 值相同。. 政 治 大. 圖 4.3 精確檢定與較強力檢定之 P 值比較. 立. (a) α = 0.1. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 29. i n U. v.

(35) (b) α = 0.05. 立. ‧. ‧ 國. 學. (c) α = 0.01. 政 治 大. n. er. io. sit. y. Nat. al. Ch. engchi. 30. i n U. v.

(36) (d) α = 0.001. 立. 政 治 大. ‧ 國. 學. (e) α = 0.05,d=1. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 31. i n U. v.

(37) (f) α = 0.05,d = 2. 立. 政 治 大. ‧. ‧ 國. 學. (g) α = 0.05,d = 10. n. er. io. sit. y. Nat. al. Ch. engchi. 32. i n U. v.

(38) 4.4 模擬之檢定力 上節我們知道,當α = 0.01後,以N=100 下,𝑝h 𝑥6 , 𝑥7 與𝑝a 𝑥6 , 𝑥7 相. 同,因此我們觀察當 α = 0.05、d = 0下檢力的變化情形,我們取𝜆6 = 25、35、45作為示範。假設檢定為𝐻E :𝜆7 − 𝜆6 ≤ 𝑑 ,當給定𝜆6 ,檢力與𝜆7 呈 正相關,𝜆6 越大,較強力檢定的檢力也越高。. 圖 4.4 𝛂 = 𝟎. 𝟎𝟓、𝐝 = 𝟎、𝝀𝟏 = 𝟐𝟓、𝟑𝟓、𝟒𝟓下的檢力. (a) α = 0.05、d = 0、𝜆6 = 25. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 33. i n U. v.

(39) (b)α = 0.05、d = 0、𝜆6 = 35. 學. ‧ 國. 立. 政 治 大. (c)α = 0.05、d = 0、𝜆6 = 45. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 34. i n U. v.

(40) 第五章. 實例分析. 本章我們利用實際例子分別計算第三章的精確性檢定與第四章的較強力檢 定。第一個例子我們將示範 Przyborowski 與 Wilenski(1940)考慮從兩個不同賣 家手中買到的三葉草種子麻袋中,被摻入的菟絲子種子數量是否相同。第二個 例子是 Shiue 與 Bain(1982)考慮某個影響飛機速度上的零件,新推出的型號 是否可以比目前使用的型號有更好的表現。. 治. 立. 三葉草種子 大 5.1政. ‧ 國. 學. Przyborowski 與 Wilenski(1940)考慮兩袋三葉草種子,並分別從袋子中取出 100 顆種子,發現從第一袋抽取的種子中沒有任何菟絲子種子,而從第二袋中. ‧. 抽取 100 顆的種子中有 3 顆是菟絲子種子,假設λ6 表示第一袋中菟絲子種子的. y. Nat. io. sit. 數量,λ7 表示第二袋中菟絲子種子的數量,我們希望檢定:. n. al. er. 𝐻E : λ7 − λ6 ≤ 0 𝑣𝑠 𝐻6 ∶ λ7 − λ6 > 0,. 假設:. Ch. engchi. i n U. v. 𝑋66 、𝑋67 、 … 、𝑋69S ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ6 ), 𝑋76 、𝑋77 、 … 、𝑋79U ~𝑝𝑜𝑖𝑠𝑠𝑜𝑛(λ7 ), 其中𝑛6 = 100 、 𝑛7 = 100,令 9S. 𝑌6 =. 𝑋65 ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑛6 λ6 , 𝑦6 = 0,1,2,3, … 5T6 9U. 𝑌7 =. 𝑋7y ~ 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑛7 λ7 , 𝑦7 = 0,1,2,3, … yT6. 35.

(41) 檢定統計量為: &U &S ‰ ‰ï •U •S. Z Y6 , Y7 =. ®'. ~N(0,1) ,其中V( =. &S ¢S. 9S. +. &U ¢U. 9U. ,. 而拒絕域為: °U °S ‰ ¢U ¢S. Z(Y6 , Y7 ) ≥ Z(k6 = 0, k 7 = 3)=. 並在𝐻E 下將λ6• = λ7• = ¤ úS TE. ¤ úU TE. •S ‚•S 9S ‚9U. =. E‚) 6EE‚6EE. =. ) 7EE. °S °U ¢S ¢U ‚ ¢S ¢U. = 1.732,. 帶入. *S *U p q¢S rS› 9S nS› p q¢U rU› 9U nU›. 𝐼 𝑍(S ,(U ≥ 𝑇•S ,•U ,. 治 政 大 ,因此我們 計算出 p-value=0.0442,若令顯著水準α = 0.05,結果顯示不拒絕𝐻 立 úS !. sU !. E. 相信這兩袋中菟絲子種子數量並無統計上的顯著差異。. ‧ 國. 學. 接著計算較強力檢定𝑝h 𝑦6 , 𝑦7 ,令β = 0.001。在圖 5.1 中黑點為𝑝a 𝑦6 , 𝑦7. ‧. 找出的拒絕域,而紅點加上黑點為較強力檢定的拒絕域,我們可以看到當 時,且後者計算的 p-value 也. y. ) 7EE. io. sit. Nat. 𝑦6 , 𝑦7 在左下角可增加的點不多,因此在λ6 =. er. 為 0.0442,但若是k6 與k 7 越大,則能夠增加的 p-value 也越高,如圖 5.2。另外. al. n. v i n 由下表 5.1 我們可以觀察𝑍(𝑦6C , 𝑦7 )與𝑝g 𝑦6 , 𝑦7 之關係;以點(0,3)往左找時第一個 hengchi U. 點為(3,9),然而計算𝑝_ 3,9 = 0.0506 > 0.05,此點不納入𝑝_ 中,再下一個點為 (9,18),𝑝_ 9,18 = 0.0461 < 0.05,依序計算得到最後一個可以被加進較強力檢 定的點(78,100)。. 36.

(42) 表 5.1. 𝒁 𝒚𝟏 , 𝒚𝟐 與𝒑𝒛 𝒚𝟏 , 𝒚𝟐 之比較. 𝑦6 , 𝑦7. (0,3). (3,9). (9,18). 𝑍 𝑦6 , 𝑦7. 1.732. 1.732. 1.732. 𝑝g 𝑦6 , 𝑦7. 0.0486. 0.0496. 0.0634. 0.0519. 𝑝_ 𝑦6 , 𝑦7. 0.0486. 0.0506. 0.0461. 0.0499. 圖 5.1. 立. (78,100) …. d=0, 𝒚𝟏 , 𝒚𝟐 : 𝟎~𝟏𝟎𝟎之拒絕域. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 註:共可以增加 56 個點. 37. i n U. v. 1.649.

(43) 𝛂 = 𝟎. 𝟎𝟓,d=0, 𝒚𝟏 , 𝒚𝟐 : 𝟎~𝟏𝟎𝟎之 p-value. 圖 5.2. 立. 政 治 大. ‧. ‧ 國. 學. n. al. 𝛂 = 𝟎. 𝟎𝟓,d=0,檢定力變化. er. io (a) 𝜆6 = 25. sit. y. Nat 圖 5.3. Ch. engchi. 38. i n U. v.

(44) (b) 𝜆6 = 25. 立. io. (c) 𝜆6 = 25. y. sit. Nat. n. al. er. ‧. ‧ 國. 學. 政 治 大. Ch. engchi. 39. i n U. v.

(45) 5.2. 輪船零件. 第二個例子是 Shiue 與 Bain(1982)考慮某個影響輪船速度上的零件。令 𝜆6 為舊零件的故障率為 4%,而希望新零件的故障率𝜆7 為 2%,因此檢定為: 𝐻E : λ6 − λ7 > 0 𝑣𝑠 𝐻6 ∶ λ6 > λ7 , 我們希望找出零件測試所需要使用的時間(小時),取𝑦6 , 𝑦7 為 0~100、α = 0.05、檢定例下,精確性檢定與較強力檢定分別所需要樣本數(時間),其中 檢定力的計算我們利用第二章 K.Krishnamorthy 與 Jessica Thomson 的方法計. 治 政 大 算,並固定檢定力=0.80、0.90、0.95。 立. 結果發現較強力檢定要達到與精確性檢定的檢定力所需的樣本數(時間). ‧ 國. 學. 較少,如表 5.2 所示,當檢定力訂為 0.80 時兩檢定所需的樣本數(時間)相. ‧. 同,而檢定力訂為 0.9 時較強力檢定比精確性檢定減少 6 小時,當檢定力訂為. sit. y. Nat. 0.95,則減少 8 小時,因此當研究人員若想要檢定兩個產品都服從波松母數. n. al. er. io. 時,當利用較強力檢定進行實驗後可以期望至少樣本數或需實驗的時間將比過. i n U. v. 去的方法還要更少或至少持平,而研究人員可選擇此方法以達節省成本、時間 亦達到相同的效果。 表 5.2. 舊零件. Ch. engchi. 給定𝛂 = 𝟎. 𝟎𝟓、不同檢定力下比較兩個檢定所需要的樣本數. 新零件. 差. Sample size n. 檢定力. (𝑛6 = 𝑛7 = 𝑛) 𝜆6. 0.04. 𝜆7. 0.02. d. 0. Power. E-test. MP-test. 0.80. 926. 926. 0.90. 1270. 1264. 0.95. 1597. 1589. 40.

(46) 第六章. 結論與建議. 本文主要應用 Roger L. Berger 與 Dennis D.Boos(1994)提出的較強力檢定方 法應用在離散型分配上,先是比較兩波松分配下的條件檢定、精確性檢定其拒 絕域、檢定力,更進一步比較精確性檢定與較強力檢定;模擬結果發現當單尾 時所設定的顯著水準α 小於 0.1,較強力檢定與精確性檢定檢力的拒絕域沒有差. 政 治 大. 別,而當α越大,較強力檢定增加的點越多,如此以來,較強力檢定不僅尺度小. 立. 於α,為一個Level − α的檢定,檢定力也將增加。. ‧ 國. 學. 本篇使用 Roger L. Berger(1996)中檢定兩個二項分配中假設的β = 0.001. ‧. 建構檢定,然而是否能找出更多有效的β值,使較強力檢定更好,並觀察檢定的 變化亦是一難題;當給定誤差下,在 C.J Clopper,E.S.Pearson(1934)提出單一. sit. y. Nat. io. er. 的二項分配之信賴區間中,可推得出檢定兩二項分配分別機率值的可能情況,. al. 然而給定兩波松分配卻無法保證其均數的信賴區間,原因在波松分配需要考慮. n. v i n Ch 到觀測值之值域,因此本篇在給定誤差下,利用蒙地卡羅找出兩波松分配可能 engchi U 的信賴區間,而或許能夠使用兩母數差分配(Skellam Distribution)建構差的信賴 區間更能表示其真實性,也許能夠比現在有更好得結果。 最後在實證分析方面,由三葉草種子中發現的菟絲子種子比例中,我們改 善了原先的檢定力達到最大,之後我們由飛機零件的例子中,降低樣本數已達 到所需要的檢定力,而 Roger L. Berger 的方法是否可以應用到其他離散分配的 檢定值得討論。. 41.

(47) 參考文獻 1. C.J Clopper,E.S.Pearson(1934)“The Use of Confidence or Fiducial Limits Illustrated in the Case of the Binomial”. 2. K.Krishnamoorthy,Jessica Thomson(2002),“A more powerful test for comparing two Poisson means”. 3. K.Krishnamoorthy,Jessica Thomson(2002),“Hypothesis Testing About. 政 治 大 4. Roger L. Berger (1989),“Uniformly more powerful tests for hypotheses concerning 立 Proportions in Two Finite Populations”.. ‧ 國. 學. linear inequalities and normal means”, Journal of the American Statistical Association,84(405), 192-199.. ‧. 5. Roger L. Berger ,Dennis D.Boos(1994)“P Values Maximized Over a Confidence. y. Nat. io. sit. Set for the Nuisance Parameter”.. n. al. er. 6. Roger L. Berger(1994)“Power Comparison of Exact Unconditional Tests for. Ch. Comparing Two Binomial Proportions”.. engchi. i n U. v. 7. Roger L. Berger(1996),“More Powerful Test From Confidence Interval p values”.. 42.

(48)

參考文獻

Outline

相關文件

估計兩母 體平均數 差時樣本 數的選擇 估計兩母 體比例差

Population: the form of the distribution is assumed known, but the parameter(s) which determines the distribution is unknown.. Sample: Draw a set of random sample from the

which can be used (i) to test specific assumptions about the distribution of speed and accuracy in a population of test takers and (ii) to iteratively build a structural

Then, it is easy to see that there are 9 problems for which the iterative numbers of the algorithm using ψ α,θ,p in the case of θ = 1 and p = 3 are less than the one of the

By correcting for the speed of individual test takers, it is possible to reveal systematic differences between the items in a test, which were modeled by item discrimination and

In summary, the main contribution of this paper is to propose a new family of smoothing functions and correct a flaw in an algorithm studied in [13], which is used to guarantee

For the proposed algorithm, we establish a global convergence estimate in terms of the objective value, and moreover present a dual application to the standard SCLP, which leads to

double-slit experiment is a phenomenon which is impossible, absolutely impossible to explain in any classical way, and.. which has in it the heart of quantum mechanics -