文獻探討

第二章文獻探討

多重檢定中，同時進行檢驗 m 個虛無假設 𝐻_0𝑖，𝑖 = 1,2,3, ⋯ , 𝑚之真偽，檢驗結果可能的分類如表 2.1，假設𝑚₀為虛無假設為真之個數，R 是檢定結果為顯著之檢定個數。

表 2.1 m 個假設檢定之結果對應分類

結論為拒絕虛無假設之個數

結論為不拒絕虛無假

設之個數總和

虛無假設為真

之個數 V

( ) 

(1   ) m

₀

虛無假設為偽

之個數 U

(1   ) T ( )  m m 

₀

總和

R m − R ^m

若虛無假設是沒病，對立假設是有病，由上表，U 是真陽性的個數，V 是偽陽性的個數，S 為真陰性之個數與 T 為偽陰性之個數，其中 R 是可觀察的變項，

而 U、V、S、T 則為未知變項，α、β分別為個別之型 I 與型 II 錯誤發生率。當顯著水準α提高，可見的是可觀測的變項 R 亦隨之增加。

整體型 I 錯誤發生率(familywise error rate; FWER)定義為發生一次以上錯誤拒絕的機率大小，即至少出現一次偽陽性的情形，

FWER= P(V ≥ 1) = 1 − P(V = 0)

若 m 個檢定之檢定統計量彼此獨立，並假設 FWER=𝛼₀，則 FWER 可表示：

𝛼₀ = FWER = 1 − P(V = 0) = 1 − (1 − 𝛼)^𝑚⁰ (1) 由(1)，透過代數運算整理可得單一檢定之顯著水準，α = 1 − (1 − 𝛼₀)^{1 𝑚}^⁄ ⁰，另一方面，若檢定統計量間為相關，Hsueh et al. (2003)依據 Bonforroni 的方法提出單一檢定之顯著水準為 _𝑚^𝛼⁰

0。

許多處理多重檢定的文獻中，往往提及整體型 I 誤發生率過大的問題，

Benjamini & Hochberg (1995)提出錯誤發現率(false discovery rate; FDR)，來調整多重檢定存在錯誤拒絕虛無假設之比例過大的問題，FDR 是錯誤拒絕虛無假設的期望個數與整體達顯著個數的比值，

FDR = E (^V_R) =^E(V)_R (2) 當 R=0，令(^𝑉_𝑅) = 0 。若將 FDR 控制不超過𝑞^∗，即FDR ≤ 𝑞^∗，可約略估計出E(V) ≈ R × 𝑞^∗。

依照錯誤發現率(false discovery rate; FDR)，Benjamini & Hochberg (1995)提出 FDR 的控制方法，假定𝑃_𝑖為對應檢定假設𝐻_0𝑖之 p 值(p-value)，𝑃_(𝑖) 為來自 𝑃_𝑖(𝑖 = 1,2, ⋯ 𝑚)的一組次序統計量，𝐻_0(𝑖)是𝑃_(𝑖)所對應之虛無假設，而拒絕𝐻_0(𝑖)的步驟為依序比較𝑃_(𝑖) 與 𝑞^{∗ 𝑖}_𝑚 (𝑖 = 1,2, ⋯ m)兩者的大小，尋找最大滿足的𝑘值，其中𝑞^∗為給定的 FDR 水準值。

𝑘 = max {𝑖 | 𝑃_(𝑖) ≤ 𝑞^{∗ 𝑖}_𝑚 }, 𝑖 = 1,2, ⋯ , m。

並作出𝐻₀₍₁₎、𝐻₀₍₂₎⋯ 𝐻_0(𝑘)，此 𝑘 個虛無假設被拒絕的結論，。而 Benjamini &

Hocherg (2000)提出修正，改以比較𝑃_(𝑖) 與 𝑞^{∗ 𝑖}_𝒎

𝟎 以提高檢定力，然而𝑚₀為一未知參數，需作估計，也就是

𝑘^∗= max {𝑖 | 𝑃_(𝑖) ≤ 𝑞^{∗ 𝑖}_𝑚_̂

0 }, 𝑖 = 1,2, ⋯ , m。

不論是 FWER 的控制程序，或是 FDR 控制程序，虛無假設為真的個數(𝑚₀)之估計就顯得非常重要。以下是過去文獻之方法。

方法一：Benjamini 與 Hochberg 最小斜率法(LSL)

Benjamini & Hochberg (2000) 提出藉由點(𝑖, 𝑃_(𝑖))與點(𝑚 + 1, 1)，兩點求斜率的方式來計算取得𝑚₀的估計，步驟如下：

步驟一：計算兩點斜率𝑆_𝑖 = (1 − 𝑃_(𝑖)) / (𝑚 +1−𝑖) ; 𝑖 = 1,2, ⋯ , 𝑚。

步驟二：由𝑖 = 1 起始，判斷是否𝑆_𝑖 ≤ 𝑆_𝑖+1，一旦𝑆_𝑖 > 𝑆_𝑖+1，則停止，

得出𝑚₀的估計量如下：

𝑚̂₀^𝐿𝑆𝐿 = 𝑚𝑖𝑛 { [_𝑆¹

𝑖+1] , 𝑚}，其中[. ]為高斯運算子。

方法二：麥內瑪檢定(McNemar Test; MT)

由表 2.1 : m 個假設檢定之結果對應分類，Ma & Chao (2011)提出利用 V 的期望個數可將表 2.1 表示為表 2.2 之型式，並藉由麥內瑪檢定之檢定統計量，得出𝑚₀的估計。

表 2.2 檢定結果分類

結論為拒絕虛無假設之個數

結論為不拒絕虛無假設之

個數總和

虛無假設為真之個數 α𝑚0 𝑚0− α𝑚0

m

虛無假設為偽之個數 R − α𝑚0 m − 𝑚0− R + α𝑚0

m m 

總和 R m − R

m

由表 2.2，麥內瑪檢定統計量為 (𝑉 − 𝑇)²

𝑉 + 𝑇 = (m − 𝑚₀ − R)² m − 𝑚₀− R + 2α𝑚₀

如果不拒絕 McNemar 檢定的虛無假設，即：虛無假設真偽的實際狀況和檢定結果是一致的，則：

^(m−𝑚⁰^−R)

m−𝑚₀−R+2α𝑚₀ ≤ 𝜒²_𝛼(1) (3)

由(3)式，可得出區間估計量[𝑚̂₀^{𝑀𝑇(−)}, 𝑚̂₀^𝑀𝑇(+)] ，其中：

𝑚̂₀^{𝑀𝑇(−)} = 𝑚𝑎𝑥 (0,

2(m−R)+𝜒²_𝛼(1)(2𝛼−1)−√(𝜒²_𝛼(1)(2𝛼−1))²+8𝛼(𝑚−𝑅)𝜒²_𝛼(1)

2 )

和，

𝑚̂₀^𝑀𝑇(+) = 𝑚𝑖𝑛 ( 𝑚,

2(𝑚−𝑅)+𝜒²_𝛼(1)(2𝛼−1)+√(𝜒²_𝛼(1)(2𝛼−1))²+8𝛼(𝑚−𝑅)𝜒²_𝛼(1)

2 )

其中，𝑚̂₀^{𝑀𝑇(−)} ≥ 0 與 𝑚̂₀^𝑀𝑇(+)≤ 𝑚 ，而𝑚₀的估計可由𝑚̂₀^{𝑀𝑇(−)}與𝑚̂₀^𝑀𝑇(+)兩者的平均得出：

𝑚̂₀^𝑀𝑇 =^𝑚^̂⁰^{𝑀𝑇(−)}^+𝑚₂^̂⁰^𝑀𝑇(+)。

方法三：傅萊得曼檢定(Friedman Test; FD)

傅萊得曼檢定是無母數的統計方法之一，可用來比較來自同一個體之重複測量所得的觀察值，Ma & Tsai (2011)提出，透過傅萊得曼檢定統計量以估計虛無假設為真的個數𝑚₀，而此一方法優點在於能夠正確反映出檢定統計量間為相關之問題。

該方法係透過假設𝑚₀個有相關性的水準(檢定統計量)，是由大至小對應之 p 值(p-value)，令𝑃_1,(𝑚), 𝑃_1,(𝑚−1), ⋯ , 𝑃_{1,(𝑚−𝑚}₀₊₁₎為由大至小排序之 p 值，作為區集 1，

再利用拔靴方法(bootstrap method)進行取後放回抽樣共計 B 個區集，拔靴樣本 (bootstrap sample)結果示意如表 2.3 與樣本資料排序如表 2.4。

表 2.3 傅萊得曼檢定與拔靴樣本結果

1 2 ⋯ 𝑚0

區集 1 𝑃1,(𝑚) 𝑃1,(𝑚−1) ⋯ 𝑃1,(𝑚−𝑚₀+1)

區集 2 𝑃2,1 𝑃2,2 ⋯ 𝑃2,𝑚₀

⋮ ⋮ ⋮ ⋮ ⋮

區集 B 𝑃𝐵,1 𝑃𝐵,2 ⋯ 𝑃𝐵,𝑚₀

表 2.4 之𝑅_𝑗 ; 𝑗 = 1,2, ⋯ , 𝑚₀為第 j 行(column)的加總，

傅萊得曼檢定統計量為：

T =_𝐵𝑚 ¹²

0(𝑚₀+1)∑^𝑚_𝑗=1⁰ 𝑅_𝑗²− 3𝐵(𝑚₀+ 1) (4) 給定顯著水準α，與估計量𝑚₀，可計算出：

𝑇_𝐹 =_𝐵𝑚_̂ ¹²

0(𝑚̂₀+1)∑^𝑚_𝑗=1^̂⁰ 𝑅_𝑗²− 3B(𝑚̂₀+ 1) ≈𝜒²_𝛼(𝑚_̂

0−1) (5) 然而∑^𝑚_𝑗=1^̂⁰ 𝑅_𝑗²難以計算該值，故以下式代替：

𝑇̃ =_𝐹 _𝐵𝑚_̂ ¹²

0(𝑚̂₀+1)∑^𝑚_𝑗=1^̂⁰^𝐿𝑆𝐿𝑅_𝑗²− 3B(𝑚̂₀+ 1) ≈𝜒²_𝛼(𝑚_̂

0−1) (6) 其中𝑚̂₀^𝐿𝑆𝐿為第一節文獻之方法，當𝑇̃很靠近𝜒_𝐹 ²_𝛼(𝑚_̂

0−1)時，可運算得出𝑚̂₀，並表示為𝑚̂₀^𝐹𝐷。

表 2.4 傅萊得曼資料等級排序

1 2 ⋯ 𝑚0

區集 1 𝑅1,1 𝑅1,2 ⋯ 𝑅_1,𝑚₀

區集 2 𝑅2,1 𝑅2,2 ⋯ 𝑅_2,𝑚₀

⋮ ⋮ ⋮ ⋮ ⋮

區集 B 𝑅_𝐵,1 𝑅_𝐵,2 ⋯ 𝑅𝐵,𝑚₀

總和 𝑅₁ 𝑅₂ ⋯ 𝑅_𝑚₀

註：針對橫列(區集)作等級排序，以縱行作等級加總

在文檔中利用經驗貝氏方法估計錯誤發現率 (頁 10-14)

第二章 文獻探討