• 沒有找到結果。

以無母數方法來檢測變異 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "以無母數方法來檢測變異 - 政大學術集成"

Copied!
45
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學商學院統計學系 碩士學位論文. 治. 政 以無母數方法來檢測變異 大. 立. ‧ 國. 學. A nonparametric test for detecting increasing. ‧. variability. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 指導教授: 黃子銘 博士 研 究 生: 鄭雅文. 中 華 民 國 一 百 年 六 月.

(2) 謝辭. 在政大統研所的兩年讓我成長了不少,尤其要感謝的是我的指導教授黃子. 政 治 大 的給予幫助和建議,由於老師的教導和鼓勵讓我能夠順利的完成論文,也感謝 立 銘老師,除了悉心指導我的論文以外,對於我所遇到的問題總是能夠不遺餘力. ‧ 國. 學. 所上的老師們這兩年來的教導與叮嚀。在統研所的期間,感謝所有研究所的同 學們,因為有你們的陪伴和鼓勵讓我能夠度過精彩又快樂的研究所生活,最後. ‧. 要感謝我的家人,一直以來對我的栽培以及支持,願與你們一起分享這份成果。. 國立政治大學統計學系研究所. n. er. io. sit. y. Nat. al. 鄭雅文 謹誌於. Ch. engchi. i Un. v. 中華民國一百年六月.

(3) 摘要. 當我們探討的是兩組樣本的變異是否有所差異時,常見的方法有以 ANOVA 為. 政 治 大. 基礎的檢定與秩檢定,傳統的秩檢定需要假設兩母體具有相同的中位數或知道. 立. 其差異。本研究採用 Moses (1963) 提出的 rank-like 檢定方法,此方法在處理兩. ‧ 國. 學. 組樣本的變異問題時,優點是不需要估計任何中心參數,也不需要假設母體中 心參數相同,在資料偏態的情況下也表現得很穩健,我們試圖在樣本數極小的. ‧. 情況下對此方法作修正,將此檢定方法與以 ANOVA 為基礎的檢定和秩檢定進. Nat. sit. y. 行模擬比較,以能夠良好的控制型一誤差與檢定力作為評斷標準。由模擬的結. n. al. 修正後的方法特別適用於小樣本的情形。. Ch. engchi. er. io. 果可得知,rank-like 檢定方法與修正後的方法在不同的分配下皆表現的穩健而. i Un. v.

(4) Abstract. We consider the problem of detecting variability change in the two-sample case. Several classical variability tests are investigated, including the ANOVA based. 政 治 大 cation parameters for both samples are identical or of known difference. In this 立. tests and the rank tests. Traditional two-sample rank tests assume that the lo-. ‧ 國. 學. thesis, a modified version of the distribution-free rank-like test proposed by Moses (1963) is proposed. Moses’s test has several advantages. It does not require loca-. ‧. tion parameter estimation, is applicable without assuming that location parameter. sit. y. Nat. are identical, and is robust for skewed data. However, Moses’s test has no power. io. er. when each of the two samples has size 5 or less. The modified version of Moses’s test proposed in this thesis has some power when the sample sizes are small. Com-. n. al. Ch. i Un. v. parative simulation results are presented. According to these results, both Moses’s. engchi. test and the proposed test are robust under all conditions, and the proposed test works better when the sample sizes are small..

(5) 目錄. 1 緒論. 7. 立. 2 文獻回顧. 9. ‧ 國. 學. 3 研究方法. 政 治 大. 12. Moses rank-like 檢定 . . . . . . . . . . . . . . . . . . . . . . . . .. 3.2. Moses rank-like 檢定小樣本的改進 . . . . . . . . . . . . . . . . .. 3.3. Savage 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.4. Siegel-Tukey 檢定 .. . . . . . . . . .. 16. 3.5. Conover Squared Rank 檢定 . . . . . . . . . . . . . . . . . . . . .. 17. 3.6. 以 ANOVA 為基礎的檢定 . . . . . . . . . . . . . . . . . . . . . .. 17. 3.6.1. Brown-Forsythe 檢定 . . . . . . . . . . . . . . . . . . . . .. 17. 3.6.2. O’Brien 檢定 . . . . . . . . . . . . . . . . . . . . . . . . .. 18. 3.6.3. 結合 Brown-Forsythe 檢定與 O’Brien 檢定 . . . . . . . . .. 19. ‧. 3.1. n. er. io. sit. y. Nat. al. iv n C . . h . . . . . . . . . .U engchi . . . . .. 4 模擬分析與討論 4.1. 13 14 15. 20. 模擬設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1. 20.

(6) 4.2. 模擬結果與分析 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5 結論與建議. 22. 37. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i Un. v.

(7) 圖目錄. 4.1. n1 = 7, n2 = 7 時,BFO,WMM2,MBFO 在不同分配下的型一誤. 政 治 大. 差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 立. n1 = 5, n2 = 7 時,BFO,WMM2,MBFO 在不同分配下的型一誤. 學. ‧ 國. 4.2. 差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. sit. io. er. n1 = 7, n2 = 13 時,BFO,WMM2,MBFO 在不同分配下的型一誤 差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. al. n. 4.5. 4.6. 4.7. 4.8. 35. y. Nat. 4.4. 34. n1 = 5, n2 = 10 時,BFO,WMM2,MBFO 在不同分配下的型一誤. ‧. 4.3. 34. Ch. n engchi U. iv. 35. n1 = 7, n2 = 7 時,BFO,WMM2,MBFO 在不同分配下的檢定力, √ 其中 σ2 /σ1 = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35. n1 = 7, n2 = 7 時,BFO,WMM2,MBFO 在不同分配下的檢定力, √ 其中 σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 35. n1 = 5, n2 = 7 時,BFO,WMM2,MBFO 在不同分配下的檢定力, √ 其中 σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36. n1 = 5, n2 = 10 時,BFO,WMM2,MBFO 在不同分配下的檢定 √ 力,其中 σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . .. 36. 3.

(8) n1 = 7, n2 = 13 時,BFO,WMM2,MBFO 在不同分配下的檢定 √ 力,其中 σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . .. 立. 政 治 大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 4.9. Ch. engchi. 4. i Un. v. 36.

(9) 表目錄. Siegel-Tukey 給予 score 的方法 . . . . . . . . . . . . . . . . . . .. 16. 4.1. 治 政 母體分配型態 . . . . . . . . . . . . . . . 大 . . . . . . . . . . . . . . 立. 21. 4.2. n1 = n2 = 5 時,比較各檢定方法在不同分配下之型一誤差率 . .. 23. 4.3. n1 = n2 = 7 時,比較各檢定方法在不同分配下之型一誤差率 . .. 24. 4.4. n1 = n2 = 10 時,比較各檢定方法在不同分配下之型一誤差率 . .. 4.5. 不同樣本數下 n1 = 5, n2 = 7 時,比較各檢定方法在不同分配下. ‧. ‧ 國. 學. 3.1. er. io. sit. y. Nat. al. n. 之型一誤差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6. Ch. n engchi U. iv. 4.8. 4.9. 26. 不同樣本數下 n1 = 5, n2 = 10 時,比較各檢定方法在不同分配下 之型一誤差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.7. 25. 27. 不同樣本數下 n1 = 7, n2 = 13 時,比較各檢定方法在不同分配下 之型一誤差率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. n1 = n2 = 7 時,比較各檢定方法在不同分配下之檢定力,其中 √ σ2 /σ1 = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 29. n1 = n2 = 7 時,比較各檢定方法在不同分配下之檢定力,其中 √ σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 30. 5.

(10) 4.10 n1 = n2 = 7 時,比較各檢定方法在不同分配下之檢定力,其中 σ2 /σ1 = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 31. 4.11 n1 = 7, n2 = 13 時,比較各檢定方法在不同分配下之檢定力,其 √ 中 σ2 /σ1 = 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. A1. 39. WMM2 的檢定統計量 U 的臨界值表 . . . . . . . . . . . . . . . .. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 6. i Un. v.

(11) 第一章 緒論 關於兩組樣本的問題除了比較平均數、中位數的差異外,現在有興趣的是 比較兩母體的變異數是否有差異,在品質管制的研究中,管制圖 (control chart). 政 治 大. 是常用來監控統計製程管制 (Statistical Process Control; 簡稱 SPC) 的工具,藉. 立. 由偵測製程是否異常來改善產品的品質,洪志真 (2003) 提到過去研究中通常探. ‧ 國. 學. 討平均數的監控,但在製程失控時很難分辨出是平均數或是變異數發生改變,. ‧. 要改善品質,偵測製程變異會比偵測平均數還要重要。. sit. y. Nat. 傳統上兩組母體變異數的檢定可以簡單的利用樣本變異數算出 F 值,但 F. io. er. 檢定需要母體服從常態分配的假設,當分配不服從常態且樣本數又較少時,若 我們仍然使用 F 檢定可能會造成型一誤差過大。所以現在考慮在無母數的情況. n. al. Ch. i Un. v. 下,檢定兩母體變異數是否相等,取代以往利用標準差、分位差來看資料分布. engchi. 的情形,在這研究中會使用隨機順序 (stochastic order) 的方法來偵測變異是否 增加。 Sprent 與 Smeeton (2007) 指出利用隨機順序來偵測變異時,大部分的檢定 需要假設兩母體具有相同的中位數或知道母體中位數的差異,但母體的資訊通 常無法知道,所以很多檢定方法例如 Siegel-Tukey 檢定 (1960)、Ansari-Bradley 檢定 (1960)、Conover squared-rank 檢定 (1980) 只能利用樣本估計中心參數, 藉由減去中位數或平均數的差異來對齊兩組樣本的中心位置,但將樣本作此調 整時有時候會有反效果,造成大部分的時候 p-value 太小 (Sprent & Smeeton, 2007, 頁 172)。. 7.

(12) Moses (1963) 提出的 rank-like 檢定方法在處理兩組樣本的變異問題時,不 需要估計任何中心參數,也不需要假設母體中心參數相同,在資料偏態的情況 下也表現得很穩健,缺點是需要將原本的樣本數折半使用,在樣本數為奇數時 還會有一個觀測值無法使用的情形,可能會造成資訊不完整的情況。Blair 與 Thompson (1992) 修改 Moses (1963) 提出的 rank-like 檢定,應用不同的評分函 數 (score function),Wilcoxon scores 與 Savage scores 來建立檢定統計量。 本研究採用由 Moses 提出的 rank-like 檢定,並且試圖在樣本數極小的情 況下作修正,尋求一個在無母數的情況下,能夠簡單的檢定變異是否增加的 方法。為了瞭解此 rank-like 檢定是否為穩健的檢定方法,將此 rank-like 與. 政 治 大. Blair 與 Thompson (1992) 的 Savage 檢定,以及 Siegel-Tukey 檢定、Conover. 立. squared-rank 檢定,需要估計中心參數的秩檢定,和以 ANOVA 為基礎檢定的. ‧ 國. 學. Brown-Forsythe 檢定 (1974)、O’Brien 檢定 (1979) 與同時結合 Brown-Forsythe 和 O’Brien 檢定的方法,將這八種檢定方法在不同的分配下進行模擬比較,以. ‧. 能夠良好的控制型一誤差與檢定力作為評斷標準。. n. er. io. sit. y. Nat. al. Ch. engchi. 8. i Un. v.

(13) 第二章 文獻回顧. 常見用來比較兩母體變異數大小的方法有 F 檢定和 Bartlett’s 檢定 (1937),. 政 治 大 料不是來自常態分配時,這兩種檢定方法的檢定統計量不具穩健性,所以在 立. 這兩種檢定方法對於母體為常態分配的假設非常敏感,Box (1953) 指出當資. 母體非常態分配的情形下依然能表現穩健的檢定隨之被提出,目前文獻中. ‧ 國. 學. 主要分兩方面來探討,一方面是對原始資料轉換後應用單因子變異數分析. ‧. (one-way ANOVA) 作變異數同質性檢定,另一方面則是以無母數的方法來進行. y. Nat. 1 檢定,以下我們將對這兩方面研究作詳細的回顧。假設兩組資料為 {X1,j }nj=1 、. er. io. sit. 2 {X2,j }nj=1 ,樣本數分別為 n1 、n2 。. al. 一開始提出對原始資料轉換後進行 ANOVA 檢定的為 Levene (1960),將. n. iv n C ¯ ¯ 原本的觀測值考慮 Zi,j = |Xi,j −hXi. | 轉換,其中UXi. 為第 i 組樣本之平均數, engchi 接著對 Zi,j 進行單因子變異數分析。Brown 與 Forsythe (1974) 延續 Levene 檢. 定,試著以中位數與截尾平均數取代原本的平均數,比較不同轉換在常態分配、 自由度為 4 的 t 分配、柯西分配以及 χ24 (自由度為 4 的卡方分配) 下的表現, Monte Carlo 的結果顯示在資料為長尾分配時,以截尾平均數作轉換的表現較穩 健,而中位數在資料為 χ24 分配時表現較穩健,平均數則是在資料為常態時有較 好的檢定力。 O’Brien (1979) 提出用以下的方法對原本的觀測值 Xi,j 作轉換:. ri,j (w) =. ¯ i. )2 − ws2 (ni − 1) (w + ni − 2)ni (Xi,j − X i , i = 1, 2 j = 1, 2, . . . , ni , (ni − 1)(ni − 2) 9.

(14) ¯ i. 為第 i 組樣本的平均數,參數 w (0 ≤ w ≤ 1),當 w 為 0 時, 其中 X ri,j (0) =. ¯ i. )2 ni (Xi,j − X ni (Zi,j )2 = , (ni − 1) (ni − 1). 為對原來的 Levene 檢定統計量作加權修改。當 w 為 1 時, ri,j (1) = ni s2i − (ni − 1)s2i,−j , 其中 s2i,−j 為第 i 組樣本將第 j 個觀測值去除後的樣本變異數,此為 Miller (1968) 提出的摺刀法 (jacknife)。ri,j (w) = (1 − w)ri,j (0) + wri,j (1) 為兩種方法的 線性組合,O’Brien (1981) 建議參數 w 設定為 0.5,表示兩種方法採用同等的權 重。. 立. 政 治 大. Olejnik 與 Algina (1987) 認為 Brown-Forsythe 檢定對於型一誤差的控制良. ‧ 國. 學. 好, 母體為高狹峰 (leptokurtic) 時有較好的檢定力,而 O’Brien 則是在低闊峰. ‧. (platykurtic) 的情形比 Brown-Forsythe 檢定有更好的檢定力。Ramsey (1994) 提 出一個結合 Brown-Forsythe 檢定和 O’Brien 檢定的方法,先檢定兩組樣本的峰. y. Nat. sit. 度 (kurtosis) 分別給予顯著高峰度、無顯著、顯著低峰度,−1、0、1 的分數,. n. al. er. io. 將兩組樣本所得分數加總為 S 代表全體峰度,若 S ≤ −1 表示低闊峰、S = 0. i Un. v. 表示常態峰、S ≥ 1 表示高狹峰,當 S ≥ 0 採用 Brown-Forsythe 檢定,其他情 形則採用 O’Brien 檢定。. Ch. engchi. 接下來開始討論以無母數的方法來偵測變異,在不限制分配的情況下 (distribution-free),常 見 的 無 母 數 檢 定 有 Siegel-Tukey 檢 定 (1960)、AnsariBradley 檢 定 (1960)、 Mood 檢 定 (1954)、 Klotz 檢 定 (1962)、 Capon 檢 定 (1961),利 用 隨 機 順 序 來 偵 測 變 異 時,必 須 要 假 設 兩 母 體 的 中 位 數 或 平 均 數相等,或是知道中心位置,但母體的資訊通常無法得知,將每一組樣本的觀 測值藉由減去樣本中位數或平均數來做調整,將中心位置對齊後的兩組樣本結 合在一起排序,使用不同的加權方式,最後應用 Wilcoxon-Mann-Whitney 檢定 (簡稱 WMW 檢定) 或排列檢定 (permutation test) 偵測變異是否增加。Conover squared rank 檢定 (1980) 也是另一種常用的檢定,將排序後的秩平方作為觀察 10.

(15) 值的得分,再使用排列檢定。 Moses (1963) 提出的 rank-like 檢定方法不需要假設母體中位數相同,將 第 i 組樣本以 {|Xi,1 − Xi,2 |, |Xi,3 − Xi,4 |, . . . , |Xi,2⌊ni /2⌋−1 − Xi,2⌊ni /2⌋ |} 作轉換, 其中 ⌊·⌋ 為高斯符號,將轉換後的值合併排序後應用 WMW 檢定,Blair 與 Thompson (1992) 採用 Moses 所提出的 rank-like 檢定並且應用 Savage (1956) 檢定,利用 Monte Carlo 比較 WMW 檢定、Savage 檢定以及 Siegel-Tukey 檢 定,結果發現在中心位置相差兩個標準差以上時,WMW 檢定和 Savage 檢定比 起 Siegel-Tukey 檢定更具檢定力,Ramsey 與 Ramsey (2007) 卻認為這種方法有 兩個缺點,第一是將觀察值兩兩相減造成樣本數折半,在樣本數為奇數時甚至. 政 治 大. 會落下一個觀測值,造成檢定力低,第二是重複隨機選取成對樣本可能會造成. 立. 不同的結果。. ‧ 國. 學. Shoemaker (1995) 利用分位數 (quantile) 來看資料的分散程度,將兩組資 料合併後以第 p 分位數 zp 與第 (1 − p) 分位數 z1−p 為界,計算第一組樣本小於. ‧. zp , 大於 z1−p 的個數為統計量,若統計量過大或過小時,拒絕變異數相同的假. Nat. sit. y. 設。Shoemaker 考慮 10th 以及 16th 兩種不同的 p 值,並且與 F 檢定、Conover. n. al. er. io. squared rank 檢定與 Klotz 檢定比較在不同分配下的表現,結果顯示 Conover. i Un. v. squared rank 檢定與 Klotz 檢定較適合母體為高狹峰分配,而分位差較適合用. Ch. 於母體為低闊峰分配以及小樣本。. engchi. 11.

(16) 第三章 研究方法 在比較兩組資料的分散程度時,為了使結果能適用於二階動差不存在的分 布,我們不使用變異數表示分散程度,而是假設資料來自一位置 - 尺度分配族. 政 治 大. (location-scale family),以尺度參數來表示分散程度。. 立. Fµ,σ (x) = F. x−µ σ. ). ‧. ‧ 國. (. 學. 對一累積分布函數 F ,令. 為 F 經 過 位 置 - 尺 度 轉 換 的 累 積 分 布 函 數,其 中 µ 為 位 置 參 數 (location. y. Nat. io. sit. parameter) 而 σ 為尺度參數 (scale parameter)。令 F = {Fµ,σ : µ ∈ R, σ > 0},. n. al. er. 1 2 假設兩組資料 X1 = {X1,j }nj=1 、X2 = {X2,j }nj=1 ,分別為來自 Fµ1 ,σ1 及 Fµ2 ,σ2 的. Ch. i Un. v. 隨機樣本,且兩組樣本互相獨立。針對檢定製程變異是否增加的應用問題,我 們考慮單邊檢定,. H0 : σ12 = σ22. engchi versus. H1 : σ12 < σ22. (3.1). 本研究中以 Moses (1963) 所提出的 rank-like 檢定方法為基礎,對於如何利 用此檢定方法偵測變異是否增加做詳細的敘述,接下來會針對小樣本做改進, 同時比較 Blair-Thompson (1992) 修改評分函數 (score function),以 Savage 檢 定取代 WMW 檢定。而接下來的幾節會介紹利用其他秩檢定 (rank tests) 的方 法,Siegel-Tukey 檢定、Conover Squared Rank 檢定與以 ANOVA 為基礎的穩 健檢定,Brown-Forsythe 檢定、O’Brien 檢定和同時結合兩種檢定的方法來跟 Moses rank-like 檢定作比較。 12.

(17) 3.1. Moses rank-like 檢定. Moses (1963) 使用隨機順序 (stochastic order) 的方法來看母體的分散程度, 首先定義隨機順序: Definition 3.1.1 假設 U 、V 分別以 FU 與 FV 為其分布的二隨機變數,若 FU (t) ≥ FV (t), ∀t ∈ R 則稱 V 隨機大於 U ( V is stochastically larger than U )。. 政 治 大 同,Moses 考慮將兩組資料作以下轉換: 立. 利用隨機順序來偵測變異是否增加時,為了使兩組資料分配的位置參數相. ‧ 國. X2∗. 學. X1∗ = |X1,1 − X1,2 |, |X1,3 − X1,4 |, . . . , |X1,2⌊n1 /2⌋−1 − X1,2⌊n1 /2⌋ |. (3.2). = |X2,1 − X2,2 |, |X2,3 − X2,4 |, . . . , |X2,2⌊n2 /2⌋−1 − X2,2⌊n2 /2⌋ |. ‧. 其中 ⌊·⌋ 為高斯符號,然後應用 WMW 檢定 X2∗ 的母體分配是否隨機大於. er. io. H0 : X1∗ 與 X2∗ 具有相同的母體分配. al. iv 的母體分配隨機大於 的母體分配 n Ch engchi U ∗ ∗. n H1 :. X2∗. sit. y. Nat. X1∗ 的母體分配,即檢定. (3.3). X1∗. 這裡轉換後的兩組樣本 X1 與 X2 相互獨立,母體分布屬於同一位置 - 尺度分配 族,位置參數均為 0,且尺度參數可設定為 σ1 與 σ2 ,因此檢定 3.3 式等同於檢 定 3.1 式。 以下說明 WMW 檢定統計量與臨界值的計算,對 i = 1, 2,令 n∗i 為 Xi∗ 樣 ∗ 為 Xi∗ 的第 j 個值,則 WMW 檢定統計量為 本數,對 j = 1, . . ., n∗i ,令 Xi,j ∗. U=. ∗. n2 n1 ∑ ∑. ∗ ∗ ) < X2,k I(X1,j. k=1 j=1. 其中 ∗ ∗ )= < X2,k I(X1,j.    1 若 X∗ < X∗ , 1,j 2,k   0 其他情形. 13. (3.4).

(18) 在 α 水準下,WMW 檢定當 U ≥ cα 時拒絕 H0 ,其中臨界值 cα 的計算可以利 用 3.5 式,在 H0 下令 pn∗1 ,n∗2 (c) = p(U = c),則 p. n∗1 ,n∗2. n∗1 n∗2 ∗ ∗ ∗ (c) = ∗ pn ,n −1 (c − n1 ) + ∗ pn∗ −1,n∗2 (c), n1 + n∗2 1 2 n1 + n∗2 1. (3.5). 其中 pn∗1 ,n∗2 (c) 滿足以下條件,    0 若 c < 0,    pi,j (c) = 1 若 c = 0 且 ij = 0,      0 若c= ̸ 0 且 ij = 0. 使用 Moses rank-like 檢定的優點在於不需要對位置參數作估計,也不需要. 政 治 大. 知道其位置參數相等與否,但在樣本數極小的情況下由於無法取到在 α 水準下. 立. 的臨界值,造成型一誤差過小,針對這項缺點我們將於下節作修改。. ‧ 國. 學. Moses rank-like 檢定小樣本的改進. ‧. 3.2. Nat. sit. y. 利用 Moses rank-like 檢定時,使用兩兩內部相減消除位置參數不同的影. n. al. er. io. 響,造成轉換後的樣本數折半,可能無法反映出所有的樣本資訊,為了能夠使. i Un. v. 用到所有的資訊,將原本的想法作修改,考慮將兩組資料作以下轉換:. Ch. engchi. X1∗ = (|X1,1 − X1,2 |, |X1,2 − X1,3 |, . . . , |X1,n1 −1 − X1,n1 |) X2∗ = (|X2,1 − X2,2 |, |X2,2 − X2,3 |, . . . , |X2,n2 −1 − X2,n2 |) ∗ 為 Xi∗ 的第 j 個值, 對 i = 1, 2, 令 n∗i 為 Xi∗ 樣本數,對 j = 1, . . ., n∗i , 令 Xi,j. 考慮單尾檢定 3.3 式,檢定統計量為 3.4 式,當 U ≥ c 時拒絕 H0 ,但轉換後的 資料並不獨立,所以我們利用模擬的方法來求得臨界值 c,當我們知道資料的 範圍時可利用線性轉換將資料轉換到 0 到 1 之間,若不知道範圍時則考慮將資 料除以一個數亦可將資料控制在 0 到 1 之間,因此模擬時考慮的範圍在 0 到 1 之間,以 10 個離散值 (a1 , a2 , . . . , a10 ) = (0.05, 0.15, . . . , 0.95) 為可能值的不同分 配,其中每種分配可用一種抽取這 10 個離散值的方式來代表,說明如下。考慮 從這 10 個離散值以抽出放回的方式抽取 10 個值,假設每個離散值 ai 被抽取 14.

(19) 的次數為 ni ,則 ai 發生的機率 p(ai ) =. ni 10. 且 p(a1 ) + p(a2 ) + . . . + p(a10 ) = 1,. 因此一種抽取方式可代表一種分配。例如分別抽到 a1 、a3 、a5 這三個離散值 3 次、5 次、2 次,此為一多項分配,其中 a1 、a3 、a5 發生的機率分別為 0.3、 0.5、0.2。 模擬的次數 n 依據可容許的誤差 d ≤ zα/2. √ (p)(1 − p)/n,當 n 為 10000 信. 賴水準在 95% 的水準下,其容忍誤差為 0.00436,模擬的步驟如下: 1. 考慮所有抽取的可能性,總共有. (19) 10. = 92378 種不同的分配,在每一種分. 配下抽取兩組樣本,針對第 k 種分配 (k = 1, 2, . . . , 92378) 模擬 n 次可得. 政 治 大. n 個 U 統計量 U1 , . . ., Un ,在單尾 0.05 的水準下考慮誤差,取 U1 , . . ., Un √ 的 0.95 分位數加上 2 (0.05)(0.95)/n 作為第 k 種分配 U 的臨界值 ck 。. 立. ‧ 國. 學. 2. 在所有模擬出來的臨界值 ck 中取最大值作為檢定統計量 U 的臨界值。. ‧. 步驟 1 中模擬次數 n 設為 10000,但實際上為節省模擬時間,先模擬 1000 次做 篩選,再針對需要較大臨界值的分配作二次模擬。. n. sit er. io. Savage 檢定a. y. Nat. 3.3. iv l C n hengchi U. Blair-Thompson (1992) 以 Moses rank-like 檢定為基礎,修改評分函數 (score n∗. n∗. ∗ ∗ 1 2 function),與 Moses 一樣考慮 3.2 式轉換,將 X1∗ = {X1,j }j=1 與 X2∗ = {X2,k }k=1 ∗ ∗ ∗ ∗ 與 X2,k 所分配的 ), R(X2,k ) 分別表示 X1,j 合併在一起由小到大排序,令 R(X1,j. 秩 (rank),考慮單尾檢定 3.3 式使用 Savage scores N ∑. s(i) =. (1/j),. j=N +1−i. 其檢定統計量為. ∗. Bs =. n2 ∑. ∗ )), s(R(X2,k. k=1. 應用排列檢定,Savage 檢定當統計量 Bs ≥ c 時拒絕 H0 ,其中臨界值可由 3.5 式決定。 15.

(20) 3.4. Siegel-Tukey 檢定. 這檢定方法是由 Siegel 與 Tukey (1960) 提出,需先將一組樣本減去中位數 的差異以對齊兩組樣本的中心位置,再來探討變異是否有所差異。假設兩組樣 ˜ 1 、X ˜ 2 ,令 md = X ˜2 − X ˜ 1 ,將 X2 考慮以下轉換: 本的中位數分別為 X ∗ X2,i = X2,i − md , i = 1, 2, . . . , n2. ∗ n2 1 將轉換後的資料 X2∗ = {X2,j }j=1 與 X1 = {X1,j }nj=1 合併在一起,由小到大排序. 為 (Z1 , ..., ZN ),其中 N = n1 + n2 ,給予 Zi score 的方法為序列中較極端的觀測. 政 治 大 給予 立2、次大的觀測值 Z 給予 3、次小的觀測值 Z. 值較小的 score,而在序列中間的觀測值較高的 score,將最小的觀測值 Z1 給予 1、最大的觀測值 ZN. N −1. 2. 給. ‧ 國. 學. 予 4、第三小的觀測值 Z3 給予 5、第三大的觀測值 ZN −2 給予 6、第四大的觀 測值 ZN −3 給予 7 以此類推:. ‧. 表 3.1: Siegel-Tukey 給予 score 的方法. y. 8. ... ZN −5. a l 9 ... Ch. 11. sit. 5. Z4. ZN −4. ZN −3. 10. v ni. engchi U. er. 4. 1. Z4. n. Score. Z3. io. Z2. Nat. Value Z1. 7. ZN −2. ZN −1. ZN. 6. 3. 2. 考慮單邊檢定 3.1式,令 ss−t (Zi ) 代表 Zi 所分配的 score,檢定統計量 T =. N ∑. ss−t (Zi )I(Zi ). i=1. 其中 I(Zi ) =.    1 若 Zi 屬於 X ∗ , 2   0 其他情形.. 應用 WMW 檢定,當 T ≤ c 時拒絕 H0 ,其中臨界值使用 3.5 式決定。. 16.

(21) 3.5. Conover Squared Rank 檢定. Conover (1980) 提出檢測變異數是否相等的方法,考慮將兩組資料作以下 轉換: ∗ X1,j = |X1,j − X 1 |, j = 1, 2, . . . , n1 ∗ X2,k = |X1,k − X 2 |, k = 1, 2, . . . , n2. 其中 X 1 、X 2 分別為兩組資料的樣本平均數,將 X1∗ 與 X2∗ 合併在一起由小到 ∗ ∗ ∗ ∗ ∗ 大排序,令 R(X1,j ) 與 R(X2,k ) 分別表示 X1,j 與 X2,k 所分配的秩,以 R(X2,k ). 的平方加總作為檢定統計量 T ,. 治 政∑[R(X T = )] 大 n2. 立. ∗ 2,k. 2. k=1. ‧ 國. 以 ANOVA 為基礎的檢定. sit. y. Nat. er. Brown-Forsythe 檢定. io. 3.6.1. ‧. 3.6. 學. 考慮單尾檢定 3.1 式,應用排列檢定,當統計量 T ≥ c 時拒絕 H0 。. al. n. iv n C Brown 與 Forsythe (1974) 延續 (1960) h e Levene i U的想法,以中位數取代平均 ngch. ˜ i |,其中 數作為中心位置的估計,建議將 Xij 作以下的轉換,令 Zi,j = |Xij − X ˜ i 為第 i 組樣本的中位數,假設檢定 X H0 : σ12 = σ22. H1 : σ12 ̸= σ22. versus. (3.6). 則 one-way ANOVA 檢定統計量 ∑2 ni (Z¯i. − Z¯.. )2 /(2 − 1) W = ∑2 i=1 , ∑n i ¯ 2 i=1 j=1 (Zij − Zi. ) /(N − 2). (3.7). 其中 Z¯i. =. ni ∑ Zij j=1. ni. , Z¯.. =. ni 2 ∑ ∑ Zij i=1 j=1. 17. N. ,N=. 2 ∑ i=1. ni.

(22) 在 α 水 準 下,Brown-Forsythe 檢 定 當 W > Fα (1, N − 2) 時 拒 絕 H0 ,其 中 Fα (1, N − 2) 為自由度 (1, N − 2) 的 F 分配的 (1 − α) 分位數。 由於我們想要偵測變異是否增加,考慮單尾檢定 3.1 式,以 t 檢定取代 F 檢定,檢定統計量 Z¯2. − Z¯1. T =√ σ ˆ 2 ( n11 + n12 ) 其中. ∑2 2. σ ˆ =. i=1. ∑n i. j=1 (Zij. − Z¯i. )2. N −2. 在 H0 下 T 服 從 t(N − 2) 分 配,在 α 水 準下,Brown-Forsythe 檢定 當 t >. 政 治 大. tα (N − 2) 拒絕 H0 ,其中 tα (N − 2) 為自由度 N − 2 的 t 分配的 (1 − α) 分位數。. 立 O’Brien 檢定. ‧ 國. 學. 3.6.2. ¯ i. )2 − ws2 (ni − 1) (w + ni − 2)ni (Xi,j − X i , i = 1, 2 , j = 1, 2, ..., ni , (ni − 1)(ni − 2). sit. y. Nat. ri,j (w) =. ‧. O’Brien (1979) 提出用以下的方法對原本的觀察值 Xi,j 作轉換:. n. al. 數,參數 w (0 ≤ w ≤ 1),當 w 為 0 時,. Ch. engchi. er. io. ¯ i. 為第 i 組樣本的平均數,s2i 第 i 組樣本的變異數 ni 為第 i 組的樣本 其中 X. i Un. v. ¯ i. )2 ni (Xi,j − X ri,j (0) = = Z˜ij2 , (ni − 1) 為對原來的 Levene 檢定統計量作加權修改。當 w 為 1 時, ri,j (1) = ni s2i − (ni − 1)s2i,−j = qij , 為 Miller (1968) 所提出的 jacknife,其中 s2i,−j 為第 i 組樣本去掉第 j 個觀測值 的樣本變異數。 2 在很多情況下會造成型一誤差過度膨脹,但以 rij (1) = qi,j 由於 rij (0) = Z˜i,j. 作檢定時的型一誤差率則較保守,所以 rij (w) 在 rij (0) 與 rij (1) 間取一個加權 平均,ri,j (w) = (1 − w)ri,j (0) + wri,j (1),在過於膨脹跟保守的拒絕率之間取一 18.

(23) 個平衡 [9]。O’Brien (1979) 建議 w = 0.5,因為 E(Vˆ [ri (0.5)]) 在常態下非常接 近不偏估計量,使用以 ri,j (0.5) 對原始資料作轉換,並進行 ANOVA 檢定,檢 定 3.6 式,在 α 水準下,O’Brien 檢定當 W > Fα (1, N − 2) 時拒絕 H0 ,其中 Fα (1, N − 2) 為自由度 (1, N − 2) 的 F 分配的 (1 − α) 分位數。 若我們考慮單尾檢定 3.1 式,則檢定統計量為 T = 其中. r¯2. (0.5) − r¯1. (0.5) √ σ ˆ 2 ( n11 + n12 ). ∑2 2. σ ˆ =. ∑n i. j=1 (rij. i=1. − r¯i. )2. N −2. 政 治 大. 在 α 水準下,O’Brien 檢定當 t > tα (N − 2) 時拒絕 H0 ,其中 tα (N − 2) 為自由. 立. 度 N − 2 的 t 分配的 (1 − α) 分位數。. ‧ 國. 學. 3.6.3. 結合 Brown-Forsythe 檢定與 O’Brien 檢定. ‧ sit. y. Nat. Ramsey (1994) 提出一個結合 Brown-Forsythe 檢定和 O’Brien 檢定的方法,. io. er. 簡稱 BFO 檢定,因為 Brown-Forsythe 檢定較適用高狹峰分佈,而 O’Brien 檢. al. n. 定較適用於低闊峰分佈,所以若能先估計峰度係數 (kurtosis),了解母體的分布. ni Ch 狀況後,再選擇適合的檢定方法,可以提高檢定力。 U engchi. v. 將峰度的檢定應用在兩組樣本,樣本峰度係數的計算如下,第 i 組樣本的 ∑ i 峰度 b2 = m4 /m22 ,其中 mr = nj=1 (Xij − Xi. )r /ni 為 r 階動差,使用 Ramsey 與 Ramsey (1993) 提出用來檢定峰度的臨界值表,當峰度 b2 ≤ c0.005 時,將此 樣本定義為低闊峰; 當峰度 b2 ≥ c0.5 時,則定義為高狹峰; 當樣本無法定義成低 闊峰或高狹峰時,則為常態峰。 進行峰度檢定後,可將兩組樣本個別定義成顯著低闊峰、常態峰及顯著高 狹峰,並給予 −1、0、1 的分數,將兩組樣本的得分加總為 S,代表全體峰度, 若 S ≤ −1 表示低闊峰、S = 0 表示常態峰、S ≥ 1 表示高狹峰,BFO 檢定是 當 S ≤ −1 時採用 O’Brien 檢定,其他情形則採用 Brown-Forsythe 檢定。 19.

(24) 第四章 模擬分析與討論. 4.1. 模擬設定. 政 治 大 在 本 章 我 們 採 用 蒙立 地 卡 羅 模 擬 方 法,探 討 Moses rank-like 檢 定 (簡 稱. ‧ 國. 學. WMM)、Modified Moses rank-like 檢 定 (簡 稱 WMM2)、Savage 檢 定 (簡 稱 SV),以 及 Siegel-Tukey 檢 定 (簡 稱 ST)、Conover squared-rank 檢 定 (簡 稱. ‧. CSR),Brown-Forsythe 檢定 (簡稱 BF)、O’Brien 檢定 (簡稱 OB) 與 BFO 檢. sit. y. Nat. 定,這八種檢定方法在不同母體分配下,其檢定力的優劣以及型一誤差的大小,. io. er. 考慮的母體分配包括常態分配、t 分配、均勻分配、卡方分配、雙指數分配、貝 他分配以及雙峰分配,分佈型態的比較如表 4.1 所示。其中雙峰分配為一混合. al. n. iv n C 模型 (mixture model),這裡利用兩常態分配合成且採用相等的權重,其機率密 hengchi U 度函數為. f (x) = 0.5f1 (x) + 0.5f2 (x) 其中 f1 (x), f2 (x) 分別為平均數 -5,5,標準差皆為 2 的常態分配。 1 2 模擬的方法為從同一個母體分配中隨機抽取兩組樣本 {U1,j }nj=1 ,{U2,j }nj=1 ,. 樣本數分別為 n1 與 n2 ,位置參數的差異並不會影響到檢定變異數,但有些學 者卻認為位置的差異對於檢定變異數有所影響,應該將位置參數的差異也加入 考慮 (參考 [13]),所以我們將第二組樣本加上 4σ 作為位置參數的差異,因此考. 20.

(25) 慮的兩組樣本為 X1 = (U1,1 , U1,2 , . . . , U1,n1 ) X2 = (kU2,1 + 4σ, kU2,2 + 4σ, . . . , kU2,n2 + 4σ) 其中參數值 k 為兩組樣本尺度參數之比例,σ 為母體分配的標準差,但當母體 分配為 t(1)、t(4) (自由度為 1、4 的 t 分配) 時,σ = 1。. 表 4.1: 母體分配型態 Population 生成方法. γ1. γ2. 0 政 治 大 t(1) NA. NA. t(4). 0. NA. 4. t(5). 0. 學. 5. t(10). 0. 1. 6. t(24). 0. 7. Uniform. 0. χ23. 1.633 4. 1. Normal. 立. n. al. Cχ26h. -1.2. sit. io. 9. 0.3. y. Nat. 8. 6. ‧. ‧ 國. 3. er. 2. 0. i Un. v. 1.155 2. engchi. 10. double exponential 0. 3. 11. Beta(0.5,0.5). 0. -1.5. 12. Beta(1,5). 1.18. 1.2. 13. Beta(5,1). -1.18. 1.2. 14. 雙峰分配. *. 3/2. 偏態係數 (skewness) γ1 = µ3 /µ2. 峰態係數 (kurtosis) γ2 = µ4 /µ22 − 3. 我們依據第三章所介紹的檢定方法,選擇顯著水準 α 為 0.05,在不同的樣 √ √ 本數以及參數值 k = 1, 2, 3, 2 下各模擬 10000 次,記錄 10000 次實驗中拒絕 21.

(26) H0 的次數,當 k = 1 時表示 H0 為真,兩母體變異數相等,計算 10000 次實 √ √ 驗中拒絕 H0 的比例即為型一誤差率; 當 k = 2, 3, 2 時表示 H0 為偽,計算 10000 次實驗中拒絕 H0 的比例即為檢定力。在重複作 10000 次的實驗中,想要 了解其型一誤差率 α 是否滿足我們所設定的 0.05,計算標準誤 (standard error) √ SE = (0.05)(0.95)/10000 = 0.002179,即在 α = 0.05 的水準下,其 α 的 95% √ 信賴區間在 α ± 2 (0.05)(0.95)/10000 = (0.0457, 0.0543),若型一誤差率大於數 值 0.0543,表示此方法無法控制住型一誤差率。. 4.2. 模擬結果與分析. 政 治 大 本節我們探討兩組樣本數相同的情形 (n , n ) = (5, 5), (7, 7), (10, 10) 以及 立 1. 2. ‧ 國. 學. 兩組樣本數不同的情形 (n1 , n2 ) = (5, 7), (5, 10), (7, 13),在不同分配之下,比較. n. al. er. io. sit. y. Nat. 4.2 至表 4.11。. ‧. ST、CSR、BF、OB、BFO、WMM、SV、WMM2 八種檢定方法之型一誤差 √ √ 率,以及給定參數值 k = 2, 3, 2 的條件下其檢定力的表現,其結果整理在表. Ch. engchi. 22. i Un. v.

(27) CSR. BF. OB. BFO. WMM. SV. WMM2. 1. .0012. .0697*. .0158. .0317. .0163. .0000. .0000. .0257. 2. .0013. .2242*. .0171. .0256. .0174. .0000. .0000. .0441. 3. .0012. .0822*. .0150. .0290. .0155. .0000. .0000. .0298. 4. .0006. .0798*. .0156. .0291. .0166. .0000. .0000. .0293. 5. .0007. .0735*. .0154. .0300. .0159. .0000. .0000. .0256. 6. .0005. .0691*. .0130. .0309. .0131. .0000. .0000. .0290. 7. .0000. .0743*. .0097. .0000. .0172. 8. .0011. .1184*. 立. .0181. .0474. .0189. .0000. .0000. .0307. 9. .0003. .0926*. .0156. .0411. .0161. .0000. .0000. .0272. 10. .0004. .0862*. .0173. .0314. .0177. .0000. .0000. .0206. 11. .0005. .0802*. .0101. .0504. .0156. .0000. .0000. .0159. 12. .0009. .1158*. .0196. .0536. .0212. .0000. .0000. .0286. 13. .0000. .1122*. .0199. .0552*. .0215. .0000. .0000. .0288. 14. .0025. .0113. .0476. .0140. .0000. .0031. 政 .0438治 .0109大 .0000. 學. io. .0730*. al. sit. y. ‧. Nat. .0000. iv n C 在顯著水準 α = 0.05 下,超過h α 的 95% 信賴區間上界 e n g c h i U 0.0543 的數值 n. *. ‧ 國. Population ST. er. 表 4.2: n1 = n2 = 5 時,比較各檢定方法在不同分配下之型一誤差率. 表 4.2 為 (n1 , n2 ) = (5, 5) 時,各檢定方法在不同分配下之型一誤差率,可 知在樣本數只有 5 時,因為 WMM 檢定與 SV 檢定方法需將樣本數折半使用, 使得樣本數過少無法找到在 α = 0.05 水準下的臨界值,造成無法拒絕的情 形,若使用 WMM2 檢定作修正,在樣本數只有 5 的情況下,利用模擬的臨界 值可以改善無法拒絕的情形,其中 WMM2 在小樣本時的臨界值表於附錄 A, WMM2 對於型一誤差率的控制有穩健的表現,但在雙峰分配下其型一誤差則過 於保守。CSR 檢定在我們考慮的各種分配下皆不能控制住型一誤差率。. 23.

(28) CSR. BF. OB. BFO. WMM. SV. WMM2. 1. .0177. .0628*. .0251. .0394. .0255. .0515. .0515. .0375. 2. .0280. .2273*. .0189. .0244. .0189. .0534. .0534. .0571*. 3. .0182. .0729*. .0246. .0359. .0249. .0511. .0511. .0405. 4. .0194. .0683*. .0269. .0358. .0270. .0503. .0503. .0410. 5. .0184. .0613*. .0221. .0368. .0228. .0483. .0483. .0386. 6. .0176. .0605*. .0235. .0349. .0238. .0505. .0505. .0362. 7. .0176. .0565*. .0148. .0490. .0281. 8. .0330. .1155*. 立. .0308. .0523. .0317. .0502. .0502. .0393. 9. .0246. .0911*. .0268. .0515. .0281. .0496. .0496. .0410. 10. .0219. .0744*. .0335. .0386. .0337. .0503. .0503. .0358. 11. .0148. .0635*. .0122. .0460. .0214. .0482. .0482. .0240. 12. .0337. .1036*. .0285. .0543. .0303. .0478. .0478. .0415. 13. .0343. .1092*. .0328. .0580*. .0346. .0499. .0499. .0398. 14. .0144. .0129. .0412. .0207. .0352. .0045. 政 .0399治 .0181大 .0490. 學. io. .0658*. al. sit. y. ‧. Nat. .0352. iv n C 在顯著水準 α = 0.05 下,超過h α 的 95% 信賴區間上界 e n g c h i U 0.0543 的數值 n. *. ‧ 國. Population ST. er. 表 4.3: n1 = n2 = 7 時,比較各檢定方法在不同分配下之型一誤差率. 24.

(29) 表 4.4: n1 = n2 = 10 時,比較各檢定方法在不同分配下之型一誤差率 Population ST. CSR. BF. OB. BFO. WMM. SV. 1. .0349. .0552*. .0371. .0403. .0371. .0463. .0463. 2. .0497. .2458*. .0268. .0213. .0268. .0482. .0474. 3. .0397. .0659*. .0399. .0365. .0399. .0490. .0520. 4. .0393. .0644*. .0415. .0376. .0414. .0486. .0458. 5. .0413. .0630*. .0450. .0422. .0450. .0466. .0438. 6. .0371. .0563*. .0404. .0422. .0405. .0441. .0444. 7. .0353. .0591*. .0468. .0472. 8. .0728* .1250*. .0484. .0583*. .0488. .0480. .0490. 9. .0572* .0918*. .0456. .0521. .0460. .0507. .0489. .0446. .0703*. .0471. .0416. .0471. .0503. .0497. .0482. .0649*. .0323. .0418. .0381. .0484. .0510. .0744* .1112*. .0487. .0580*. .0491. .0469. .0462. .0725* .1112*. .0494. .0607*. .0499. y. .0516. .0465. .0451. er. sit. ‧ 國. 14. io. 13. Nat. 12. ‧. 11. 學. 10. 立. .0459 .0370 政.0362 治 大. n. .0361 .0336 a l.0653* .0309 .0425 .0366 iv n C h α 的 95% 信賴區間上界 * 在顯著水準 α = 0.05 下,超過 0.0543 的數值 engchi U. 表 4.3 與表 4.4 為 (n1 , n2 ) = (7, 7), (10, 10) 時,各檢定方法在不同分配下之 型一誤差率,當樣本數增加到 7 與 10 時,WMM 與 SV 檢定已經沒有找不到 臨界值的問題存在,能將型一誤差控制在 0.0543 的限制以下,且最接近我們所 設定的顯著水準 0.05,與修正後的 WMM2 一樣表現穩健。其中特別注意的是 WMM 與 SV 的檢定統計量雖然非一對一的關係,但在樣本數為 7 時其 level 0.05 拒絕域恰好相同,因此在使用同一筆模擬資料所計算出的拒絕率亦相同。 BF 與 BFO 檢定之型一誤差率與其他檢定方法相比較較為保守,在任何分配下 皆沒有超出上界的情形,能良好的控制住型一誤差率,當樣本數到增加到 10. 25.

(30) 時,其型一誤差率的控制更能接近我們所設定的值,另外由表 4.4 可知 OB 檢 定在有偏的分配下,其型一誤差率 α 較容易超過上界 0.0543。. 表 4.5: 不同樣本數下 n1 = 5, n2 = 7 時,比較各檢定方法在不同分配下之型一. CSR. BF. OB. BFO. WMM. SV. WMM2. 1. .0185. .0769*. .0250. .0288. .0259. .0000. .0000. .0379. 2. .0234. .2447*. .0137. .0122. .0137. .0000. .0000. .0490. 3. .0196. .0880*. .0244. .0244. .0252. .0000. .0000. .0377. 4. .0183. .0768*. .0239. .0000. .0363. 5. .0181. .0731*. 立. .0203. .0219. .0208. .0000. .0000. .0330. 6. .0192. .0731*. .0248. .0254. .0251. .0000. .0000. .0339. 7. .0199. .0828*. .0246. .0443. .0278. .0000. .0000. .0204. 8. .0345. .1350*. .0295. .0382. .0305. .0000. .0000. .0380. 9. .0262. .1084*. .0268. .0349. .0277. .0000. y. .0000. .0305. 10. .0206. .0878*. .0252. .0220. .0255. .0000. .0000. .0218. 11. .0218. .0877*. al. .0238. .0565*. .0320. .0000. .0211. 12. .0359. .1317*. .0000 v i n .0000. .0000. .0340. 13. .0267. .1304*. .0347. .0452. .0364. .0000. .0000. .0344. 14. .0184. .0842*. .0214. .0520. .0271. .0000. .0000. .0047. 政 .0225治 .0242大 .0000. er. n. U e n.0471 g c h i.0330. .0316. ‧. io. Ch. 學. Nat. *. ‧ 國. Population ST. sit. 誤差率. 在顯著水準 α = 0.05 下,超過 α 的 95% 信賴區間上界 0.0543 的數值. 接下來考慮兩組樣本數為不同的情形,表 4.5 為 (n1 , n2 ) = (5, 7) 兩組樣本 數不同時,各檢定方法在不同分配下之型一誤差率,可以得知 WMM 以及 SV 依然存在無法拒絕的情形,而其他檢定方法除了 CSR 之外皆能夠控制住型一誤 差,另外 OB 檢定在 beta 分配中有超出上界的情形。. 26.

(31) 表 4.6: 不同樣本數下 n1 = 5, n2 = 10 時,比較各檢定方法在不同分配下之型一誤 差率 CSR. BF. OB. BFO. WMM. SV. WMM2. 1. .0623*. .0841*. .0453. .0227. .0455. .0456. .0456. .0389. 2. .0665*. .2472*. .0137. .0041. .0138. .0482. .0482. .0639*. 3. .0645*. .0882*. .0399. .0151. .0399. .0464. .0464. .0466. 4. .0609*. .0835*. .0403. .0164. .0404. .0474. .0474. .0477. 5. .0620*. .0851*. .0460. .0205. .0461. .0489. .0489. .0395. 6. .0642*. .0832*. .0483. .0491. .0491. .0391. 7. .0744*. .0980*. 政 .0234治 .0485 大 .0602* .0480 .0597*. .0487. .0487. .0309. 8. .0951*. .1488*. .0472. .0296. .0473. .0503. .0446. 9. .0798*. .1169*. .0537. .0312. .0541. 學. .0503. .0476. .0476. .0429. 10. .0604*. .0857*. .0375. .0122. .0376. .0342. .0342. .0267. 11. .0932*. .1100*. .0650*. .0660*. .0676*. .0504. .0504. .0263. 12. .1013*. .1447*. .0552*. .0378. .0556*. .0471. .0471. .0436. 13. .0989*. .0545*. .0407. .0547*. .0491. .0491. .0415. 14. .0997*. .0313. .0313. .0038. y. n. al. .1063*. sit. io. .1427*. er. ‧ 國. Nat. *. 立. ‧. Population ST. i n .0702* .0734* C.0726* U hengchi. v. 在顯著水準 α = 0.05 下,超過 α 的 95% 信賴區間上界 0.0543 的數值. 表 4.6 為 (n1 , n2 ) = (5, 10) 兩組樣本數不同時,各檢定方法在不同分配下之型一 誤差率,由表 4.6 可知隨著兩組樣本的樣本數相差更多時,其 ST 與 CSR 檢定 在任何分配下皆不能控制住型一誤差率,而 BF 與 BFO 檢定在 uniform 分配以 及 beta 分配下,皆無法將型一誤差控制住,OB 則是在 beta (機率密度函數為 U 型) 分配的情形控制不佳,總結來說在兩組樣本數為 (n1 , n2 ) = (5, 10) 的情形 下只有 WMM 與 SV 在所有不同的分配下依然能夠穩定的控制型一誤差率。. 27.

(32) 表 4.7: 不同樣本數下 n1 = 7, n2 = 13 時,比較各檢定方法在不同分配下之型一 誤差率 CSR. BF. OB. BFO. WMM. SV. WMM2. 1. .0493. .0703*. .0413. .0322. .0417. .0481. .0481. .0473. 2. .0506. .2459*. .0112. .0041. .0112. .0444. .0444. .0665*. 3. .0462. .0758*. .0333. .0184. .0334. .0474. .0474. .0508. 4. .0526. .0725*. .0350. .0207. .0350. .0447. .0447. .0538. 5. .0510. .0715*. .0384. .0235. .0387. .0498. .0498. .0470. 6. .0496. .0763*. .0410. .0528. .0430. 7. .0495. .0780*. .0528 政 .0303治 .0413 大 .0420 .0491 .0455 .0476. .0476. .0323. 8. .0838*. .1423*. .0438. .0384. .0451. .0485. .0485. .0472. 9. .0606*. .0986*. .0411. .0334. .0415. .0475. .0475. .0431. 10. .0525. .0757*. .0377. .0203. .0378. .0371. .0371. .0366. 11. .0669*. .0911*. .0403. .0589*. .0510. .0491. .0491. .0295. 12. .0879*. .1267*. .0472. .0434. .0483. .0437. .0437. .0464. 13. .0884*. .0466. .0417. .0473. .0476. .0481. 14. .0585*. .0293. .0052. y. n. al. .0963*. sit. io. .1311*. er. ‧ 國. ‧. Nat. *. 立. 學. Population ST. .0476. iv .0517 .0465n .0293 C.0344 hengchi U. 在顯著水準 α = 0.05 下,超過 α 的 95% 信賴區間上界 0.0543 的數值. 表 4.7 為 (n1 , n2 ) = (7, 13) 兩組樣本數不同時,各檢定方法在不同分配下之型一 誤差率,由表 4.7 可知當樣本數在增加一點時,除了 ST 與 CSR 檢定仍不能控 制住型一誤差率外,其餘方法皆有穩健的表現,而 OB 檢定在 beta (機率密度 函數為 U 型) 分配中有超出上界的情形,WMM2 在柯西分配的情況下也有超出 上界的情形。 在比較檢定力前必須先確保其檢定方法能夠控制住型一誤差率,由於 CSR 無論在樣本數為多少的情況下皆無法控制住型一誤差率,而使用 WMM 與 SV. 28.

(33) 檢定所得結果差異不大,BF 與 BFO 結果也很相近,所以接下來我們將比較 ST、OB、BFO、WMM、WMM2 五種方法之檢定力大小。. 表 4.8: n1 = n2 = 7 時,比較各檢定方法在不同分配 √ 下之檢定力,其中 σ2 /σ1 = 2 Population ST. OB. BFO. WMM. WMM2. 1. .0615 .1223. .0889. .1028. .0996. 2. .0601 .0427. .0495. .0818. .1001. 3. .0619 .0967. .0889. .0994. .1054. 4. .0645 .0975. 立.0608. .1063. .0630 .1208. .0925. .1060. .0771 .1987. .1030. .1122. .0892. .0907 .1330. .0916. .0981. .0967. .0763 .1311. .0900. .0980. .0983. .0634 .0896. .0901. .0858. 12. .1039. y. a .0800 iv l C .2367 .1112 .1036 n .0943h .1452 .0952 e n g .0992 chi U. n. 11. .1016. sit. io. 10. Nat. 9. .0876. ‧. 8. .1094. .0839. er. 7. .1074. 學. 6. ‧ 國. 5. 政 治 .0880 .0989 大. .0802 .0911. 13. .0899 .1386. .0978. .0884. .0932. 14. .0792 .2628. .1064. .0746. .0286. Max. .0943 .2628. .1112. .1122. .1074. *. 顯著水準 α = 0.05. 表 4.8 為 (n1 , n2 ) = (7, 7) 時,各 檢 定 方 法 在 不 同 分 配 下 之 檢 定 力,其 中 √ √ k = σ2 /σ1 = 2,當 k = 2 時,OB 在低闊峰分配型態下 (分配 7 與分配 11), 其檢定力明顯高於其他檢定,這樣的結果相同於 Olejnik 與 Algina (1987) 認為 OB 在低闊峰 (platykurtic) 的分配下具有較好的檢定力,但不同於以往的結果 29.

(34) 是在高狹峰的分配下,OB 仍有不錯的檢定力,而 BFO 檢定雖然先作了峰度檢 定決定選擇 BF 或 OB,在大部分的情況下仍會選擇 BF 檢定導致其檢定力在分 配為低闊峰時的表現並沒有如 OB 檢定好。在所有的檢定方法中由於 ST 對型 一誤差率的控制過於保守,所以檢定力在所有方法中偏低。. 表 4.9: n1 = n2 = 7 時,比較各檢定方法在不同分配 √ 下之檢定力,其中 σ2 /σ1 = 3 Population ST. OB. 1. .1144 .2176. 2. .0902 .0626. 立.1008. .1635. 政 治 .0755 .1179 大. 10. .1431. .1469. .1505. .1431. .1626. .1106 .1644. .1585. .1464. .1677. .1154 .1897. .1670. .1493. .1656. .1154 .2033. .1684. .1507. .1629. .1382 .3367. .1883. .1524. .1469. .1435 .1856. .1512. .1351. y. a .1255 iv l C .1960 .1572 .1337 n .0996h .1378 .1167 e n g .1443 chi U. n. 9. .1517. sit. io. 8. Nat. 7. .1793. ‧. 6. WMM2. .1488. er. 5. WMM. 學. 4. ‧ 國. 3. BFO. .1522 .1298. 11. .1510 .4151. .2076. .1479. .1289. 12. .1446 .2097. .1550. .1316. .1478. 13. .1401 .2086. .1536. .1343. .1450. 14. .1399 .4448. .1945. .1068. .0583. Max. .1510 .4448. .2076. .1524. .1677. *. 顯著水準 α = 0.05. 30.

(35) 表 4.10: n1 = n2 = 7 時,比較各檢定方法在不同分配 下之檢定力,其中 σ2 /σ1 = 2 Population ST. OB. BFO. WMM. WMM2. 1. .1638 .2823. .2458. .1983. .2209. 2. .1091 .0677. .0865. .1239. .1738. 3. .1521 .2005. .2154. .1794. .2158. 4. .1542 .2162. .2204. .1869. .2112. 5. .1534 .2573. .2368. .1857. .2206. .2439 .1924 政 治 大 .1965 .4468 .2822 .1909 立. 6. .1634 .2757. 7. .2058. .1982. .1552. .1704 .2635. .2244. .1740. 10. .1361 .1960. .2023. .1452. .1668. 11. .2133 .5391. .3033. .1739. .1742. .1977 .2671. .2111. .1635. .1893. Max *. y .2718 .2174 .1642 a .1939 iv l C .5701 .2763 .1348 n .1898 hengchi U .2133 .5701 .3033 .1983. n. 14. sit. io. 13. .2040. ‧. Nat. 12. .1859. er. 9. ‧ 國. .1805 .2365. 學. 8. .2097. .1914 .0971 .2209. 顯著水準 α = 0.05. 表 4.9、表 4.10 為樣本數為 7 時,給定 σ2 /σ1 =. √ 3, 2 下,各檢定方法在. 不同分配下之檢定力,隨著 σ2 /σ1 的比例增加,WMM2 與 WMM 的檢定力相 差越來越大,即在尺度參數比例大的情形,WMM2 的檢定力有明顯的優勢, 但缺點為 WMM2 在尋求臨界值時耗時,所以建議在樣本數小時使用修改後的 WMM2,作為偵測變異數是否增加的穩健檢定方法。當兩尺度參數比例增加, 在低闊峰分配下 OB 仍然具有較高的檢定力,在高狹峰的分配下部分分配 BFO. 31.

(36) 的檢定力有優於 OB 的趨勢,而在有偏的分配下以 OB 的檢定力有較大的優 勢。 雖然 OB、BFO 檢定在某些特殊的分配下,其檢定力具有較大的優勢,但 在所有不同的分配下 WMM 與 WMM2 為較穩健的檢定方法,比較不受分配 形狀的影響,在比例不大時,兩檢定方法並沒有明顯的差異,當 k 增加時, WMM2 在大部分的分配中的檢定力比 WMM 更具優勢。. 1. .2088 .2876. .1616. .2341. 2. .0148 .0494. .1167. .1844. 3. .1047 .2084. .1553. .2200. 4. .1321 .2310. .1607. .2301. .1673 .2574. .1593. .2223. .1879 .2677. .1585. .2361. er. 9. .1800 .2401. .1517. .2104. 10. .0900 .1906. .1136. .1431. 11. .5906 .4564. .1500. .1828. 12. .1917 .2316. .1430. .1933. 13. .1908 .2368. .1462. .1951. 14. .6148 .4368. .1022. .0587. Max. .6148 .4564. .1664. .2341. io. 6. al. n 7 8. *. y. sit. 5. ‧. ‧ 國. 立. 學. Population. 治 政 大 WMM2 OB BFO WMM. Nat. 表 4.11: n1 = 7, n2 = 13 時,比較各檢定方法 √ 在不同分配下之檢定力,其中 σ2 /σ1 = 3. v .3808 .1664 n i.2130 C.4424 hengchi U .1434 .2019 .1429 .2018. 顯著水準 α = 0.05. 32.

(37) 表 4.11 為樣本數 (n1 , n2 ) = (7, 13) 時,給定 σ2 /σ1 =. √ 3 下,OB、BFO、. WMM、WMM2 四種檢定方法在不同分配下之檢定力,當樣本數不同時,在大 部分的分配中,BFO 的檢定力與其他檢定方法相比具有相當的優勢,但在低闊 峰的分配中以 OB 的檢定力較好。在雙峰分配下 OB 檢定具有很好的檢定力但 在雙指數分配下卻是這四個檢定方法中最小的。WMM 與 WMM2 在不同分配 中其檢定力的表現並沒有很明顯的差異,且 WMM2 的檢定力在大部份的情形 下皆高於 WMM,但在雙峰分配的情況下由於型一誤差非常保守導致於其檢定 力也相對很小。 我們現在考慮結合 WMM2 與 BFO 兩種檢定 (簡稱 MBFO),WMM2 在大. 政 治 大. 部分的分配中表現穩健,但是在雙峰分配的情形下表現非常保守,在柯西分配. 立. 時又會過度膨脹,BFO 檢定則是在柯西分配的情形下有較低的檢定力,當樣本. ‧ 國. 學. 數小且兩組樣本數不同 (n1 , n2 ) = (5, 10) 時,在有較多極端值的分配下比較無法 控制住型一誤差,所以我們使用多重檢定,同時使用 BFO 與 WMM2 檢定作為. ‧. 評斷是否拒絕 H0 的依據,為了將型一誤差仍然控制在顯著水準 α = 0.05,我. sit. y. Nat. 們採用 Bonferroni 作校正,因此 BFO 與 WMM2 個別採用顯著水準 0.025,兩. io. n. al. er. 個檢定中只要有一個拒絕則拒絕 H0 的假設。. i Un. v. 當樣本數 (n1 , n2 ) = (5, 5) 取顯著水準為 0.025 時,WMM2 檢定有無法拒. Ch. engchi. 絕的情形,所以在樣本數只有 5 的情況下我們不考慮使用 MBFO,考慮樣本數 (n1 , n2 ) = (7, 7), (5, 7), (5, 10), (7, 13) 時 MBFO 之型一誤差率。 圖 4.1 至圖 4.4 為 BFO,WMM2,MBFO 在不同分配下的型一誤差率,由圖 可發現 MBFO 在 BFO 與 WMM2 間取一個平衡,改善了在某些特別的分配 中無法控制型一誤差的情形,尤其是在柯西分配有明顯的效果,在樣本數為 (n1 , n2 ) = (5, 10) 時原本在 BFO 以及 WMM2 皆不能控制住型一誤差,應用 MBFO 改善了型一誤差率的控制。. 33.

(38) 0.10. 0.10. 0.06. 0.08. BFO WMM2 MBFO. 0.00. 0.02. 0.04. Type 1 error rate. 0.06 0.04 0.00. 0.02. Type 1 error rate. 0.08. BFO WMM2 MBFO. 2. 4. 6. 8. 10. 12. 14. 2. 4. 6. Population. 圖 4.1:. n1. =. 8. 10. 12. 14. Population. 7, n2. =. 7 時,. BFO,WMM2,MBFO 在不同分配下的型 一誤差率. 立. 圖 4.2:. n1. =. 5, n2. =. BFO,WMM2,MBFO 在不同分配下的型. 政 治 一誤差率 大. 圖 4.5 至圖 4.9 為 BFO,WMM2,MBFO 在不同分配下的檢定力,MBFO 能. ‧ 國. 學. 夠將檢定力維持在一定的水準,提升原先個別檢定中較低的檢定力,在不同分. ‧. 配下表現的更加穩定。在樣本數相同皆為 7 時,MBFO 能在 BFO 與 WMM2 兩者之間取一個適當的值,但在樣本數不同的情況時,除了在某些特殊的分配. y. Nat. sit. 例如柯西分配或雙峰分配較有優勢外,在大部份的分配中雖然 MBFO 仍然將檢. n. er. io. 定力維持在一定的水準,但是其檢定力是在三種檢定方法中最低的。. al. Ch. engchi. 34. 7 時,. i Un. v.

(39) 0.10. 0.10. 0.06. 0.08. BFO WMM2 MBFO. 0.00. 0.02. 0.04. Type 1 error rate. 0.06 0.04 0.00. 0.02. Type 1 error rate. 0.08. BFO WMM2 MBFO. 2. 4. 6. 8. 10. 12. 14. 2. 4. 6. Population. 8. 10. 12. 14. Population. 政 治 圖大4.4: n = 7, n = 13 時, BFO,WMM2,MBFO 在不同分配下的型 BFO,WMM2,MBFO 在不同分配下的型 立 10 時,. =. 1. 一誤差率. ‧ 國. ‧ er. engchi. v. BFO WMM2 MBFO. 0.00. 0.00. 0.05. BFO WMM2 MBFO. i Un. 0.25. Ch. power. 0.10. 0.15. n. al. Type 1 error rate. io. sit. y. Nat. 0.05. 2. 學. 一誤差率. 5, n2. 0.20. =. 0.15. n1. 0.10. 圖 4.3:. 2. 4. 6. 8. 10. 12. 14. 2. 4. 6. Population. 圖 4.5:. n1. =. 7, n2. 8. 10. 12. 14. Population. =. 7 時,. BFO,WMM2,MBFO 在不同分配下的檢 √ 定力,其中 σ2 /σ1 = 2. 35. 圖 4.6:. n1. =. 7, n2. =. 7 時,. BFO,WMM2,MBFO 在不同分配下的檢 √ 定力,其中 σ2 /σ1 = 3.

(40) 0.4. 0.20. 0.1. 0.2. power. 0.3. 0.15 0.10. power. 0.05. BFO WMM2 MBFO. 0.0. 0.00. BFO WMM2 MBFO. 2. 4. 6. 8. 10. 12. 14. 2. 4. Population. 6. 8. 10. 12. 14. Population. 7 時, 治 圖 4.8: n = 5, n = 10 時, 政 大 BFO,WMM2,MBFO 在不同分配下的檢 BFO,WMM2,MBFO 在不同分配下的檢 立 √ √ 圖 4.7:. n1. =. 5, n2. 定力,其中 σ2 /σ1 =. =. 1. 定力,其中 σ2 /σ1 =. ‧. ‧ 國. 學. 3. er. io. sit. y. Nat. Ch. engchi. 0.1. 0.2. power. 0.3. 0.4. 0.5. n. al. 0.0. BFO WMM2 MBFO. 2. 4. 6. 8. 10. 12. 14. Population. 圖 4.9:. n1. =. 7, n2. =. 13 時,. BFO,WMM2,MBFO 在不同分配下的檢 √ 定力,其中 σ2 /σ1 = 3. 36. i Un. v. 2. 3.

(41) 第五章 結論與建議 由第四章的模擬結果我們可以發現利用 Moses rank-like (WMM) 檢定除了 在樣本數極小的情況下有無法拒絕的情形,當樣本數提升到 7 時在不同的分配. 政 治 大. 下,不論是對於型一誤差的控制或檢定力都有穩健的表現,且求出的型一誤差. 立. 率都非常符合設定的顯著值。我們採用 WMM2 檢定在小樣本時作修正也確實. ‧ 國. 學. 改善了 WMM 無法拒絕的情形,若從兩尺度參數的比例來比較修正與否的檢. ‧. 定力大小,發現當兩尺度參數的比例不大時不管使用 WMM 或 WMM2 並沒有 明顯的差異,當兩尺度參數的比例越來越大時,WMM2 的檢定力有明顯大於. y. Nat. sit. WMM 的趨勢。在樣本數不同的情形下,其檢定力的表現以 WMM2 檢定的表. al. n. 定方法。. er. io. 現較好,WMM2 除了在尋找模擬的臨界值較費時外,是一種偵測變異的穩健檢. Ch. engchi. i Un. v. Savage 檢定與 WMM 檢定採用不同的評分函數,雖然 Savage 檢定統計量 有較多的可能值,但在小樣本的情況下並無明顯的差異,所以對於使用何種評 分函數都沒有太大的差別,這裡以方便使用作為選取的原則,其他秩檢定方法 Siegel-Tukey 檢定與 Conover Squared Rank 檢定,Conover Squared Rank 檢定 在所有我們考慮的分配中皆無法將型一誤差控制住,而 Siegel-Tukey 檢定在樣 本數相同時型一誤差率過於保守造成檢定力跟其他方法相比居於劣勢,在樣本 數不同的情形下有型一誤差無法控制的情形產生,並不是一個穩健的檢定方法。 以 ANOVA 為基礎的檢定方法 Brown-Forsythe 檢定 (BF)、O’Brien 檢定 (OB) 與結合 Brown-Forsythe 檢定與 O’Brien 檢定 (BFO) 在不同形狀的分配下. 37.

(42) 有不同的表現,在低闊峰的分配下 OB 的檢定力最佳,但在高狹峰的情形下則 沒有一定的趨勢,當兩尺度參數比例不大時,OB 仍然有較高的檢定力,但當 兩尺度參數比例越來越大時,BFO 的檢定力也隨之增加。在樣本數不同的情形 下,當樣本數 (n1 = 5, n2 = 10) 時,在 beta 分配、Uniform 分配以及雙峰分配 較不容易控制住型一誤差,但當樣本增加到 (n1 = 7, n2 = 13) 時,在大部分的 分配下皆能控制住型一誤差,BFO 的檢定力跟其他檢定方法相比有相當的優 勢。 當兩組樣本數相同時,使用 WMM2 雖然不是所有方法中檢定力最高的檢 定,但在不同形狀的分配中不僅可以有效地控制型一誤差,同時具備一定的檢. 政 治 大. 定能力,比較不受分配所影響,在樣本數很少的情況下有相對的優勢,而 BFO. 立. 由於結合了 BF 與 OB 兩種不同的檢定,在一定樣本數下,也有不錯的檢定能. ‧ 國. 學. 力,所以我們若能考慮結合兩種檢定的多重檢定,能夠改善在某些分配下的缺 點進而成為一個更穩健的檢定。. ‧. 在偵測變異問題時,WMM 以及小樣本修正的 WMM2 的確改善了其他無. Nat. sit. y. 母數方法需要估計中心位置的問題,但相對的由於利用兩兩相減消除掉位置的. n. al. er. io. 變異,因此 WMM 以及 WMM2 檢定方法無法用在檢定平均數的差異,只能應 用在檢定變異數是否增加的問題上。. Ch. engchi. 38. i Un. v.

(43) 附錄 A WMM2 的檢定統計量 U,滿足 P (U ≥ c) ≤ α 之 c 值,其中臨界值 c 是利 用 3.2 節的方法所模擬出來的結果。. 政 治 大. 立. 學. ‧ 國. 表 A1: WMM2 的檢定 統計量 U 的臨界值表. ‧. α. 5. 0.05. y. 5. 0.025. io. sit. n2. 16. n. 6. 20. 19. 5. 20. 19. 6. 24. 22. 7. 28. 26. 5. 23. 22. 6. 28. 26. 7. 32. 31. er. Nat. al. n1. C h7 23 22 U n i engchi 6. 7. 39. v.

(44) 參考文獻 [1] 洪志真. 監控製程變異之 SPC 方法 (II). 2003.. 政 治 大 the Royal Society of London. Series A-Mathematical and Physical Sciences, 立. [2] M.S. Bartlett. Properties of sufficiency and statistical tests. Proceedings of. 160(901):268, 1937.. ‧ 國. 學. [3] R.C. Blair and G.L. Thompson. A distribution-free rank-like test for scale. ‧. with unequal population locations. Communications in Statistics: Simulation. sit. y. Nat. and Computation, 21:353–371, 1992.. al. n. 335, 1953.. er. io. [4] G.E.P. Box. Non-normality and tests on variances. Biometrika, 40(3/4):318–. Ch. engchi. i Un. v. [5] M.B. Brown and A.B. Forsythe. Robust tests for the equality of variances. Journal of the American Statistical Association, 69:364–367, 1974. [6] Y.L. Chen. A Test for Two-Sample Problem Based on Sample Spacings. Tamsui Oxford Journal of Mathematical Sciences, 20(2):267–278, 2004. [7] H.B. Mann and D.R. Whitney. On a test of whether one of two random variables is stochastically larger than the other. The Annals of Mathematical Statistics, 18(1):50–60, 1947. [8] L.E. Moses. Rank tests of dispersion. The Annals of Mathematical Statistics, 34:973–983, 1963. 40.

(45) [9] R.G. O’Brien. A general ANOVA method for robust tests of additive models for variances. Journal of the American Statistical Association, 74:877–880, 1979. [10] S.F. Olejnik and J. Algina. Type I error rates and power estimates of selected parametric and nonparametric tests of scale. Journal of Educational Statistics, 12:45–61, 1987. [11] P.H. Ramsey. Testing variances in psychological and educational research. Journal of Educational Statistics, 19:23–42, 1994.. 政 治 大 standardized fourth moment. Journal of statistical computation and simula立. [12] P.H. Ramsey and P.P. Ramsey. Updated version of the critical values of the. ‧ 國. 學. tion, 44(3):231–241, 1993.. [13] P.H. Ramsey and P.P. Ramsey. Testing variability in the two-sample case.. ‧. Communications in Statistics: Simulation and Computation, 36(2):233–248,. io. sit. y. Nat. 2007.. n. al. er. [14] L.H. Shoemaker. Tests for differences in dispersion based on quantiles. The. Ch. American Statistician, 49(2):179–182, 1995.. engchi. i Un. v. [15] S. Siegel and J.W. Tukey. A nonparametric sum of ranks procedure for relative spread in unpaired samples. Journal of the American Statistical Association, pages 429–445, 1960. [16] P. Sprent and N. C. Smeeton. Applied nonparametric statistical methods. Chapman & Hall Ltd, fourth edition, 2007.. 41.

(46)

參考文獻

相關文件

應用統計學 林惠玲 陳正倉著 雙葉書廊發行 2006... 了解大樣本與小樣本母體常態、變異數已知與未知 下,單一母體平均數區間估計的方法。知悉

每一位孩子必須接受 定期的英、數檢測,以 檢視每一位孩子面臨 的學習困難點。轉換教 學方式,找到真正適合

策劃較為周全的學校,能善用質性和量性 的評估數據,辨識學生需要加強的質素,並根

•  三分搜在有水平線的情況下,如果可以確定水平線的地方一定是 答案的話,才可以用三分搜找極值。..

相關分析 (correlation analysis) 是分析變異數間關係的

母體分配 樣本平均數 的抽樣分配 抽樣誤差與 非抽樣誤差 樣本平均數 的平均數與. 變異數

評定量表 (rating scale) :指用以評定等級的工具,按評定結果可以看出學生 在某種特質上的等級,當中有各種形式如數字評定量表 (numerical rating scal e) 、圖示評定量表

即使各種新檢定並不能適用在每一個模型設定 , 這些新檢定的表現 都遠勝過傳統 ADF/PP 檢定。 因此 , Maddala and Kim (1998) 建議 應該揚棄 ADF/PP 檢定 (it is time to completely