第二章 文獻探討
多重檢定中,同時進行檢驗 m 個虛無假設 𝐻0𝑖,𝑖 = 1,2,3, ⋯ , 𝑚之真偽,檢 驗結果可能的分類如表 2.1,假設𝑚0為虛無假設為真之個數,R 是檢定結果為顯 著之檢定個數。
表 2.1 m 個假設檢定之結果對應分類
結論為拒絕虛無假設 之個數
結論為不拒絕虛無假
設之個數 總和
虛無假設為真
之個數 V
( )
S(1 ) m
0虛無假設為偽
之個數 U
(1 ) T ( ) m m
0總和
R m − R m
若虛無假設是沒病,對立假設是有病,由上表,U 是真陽性的個數,V 是偽 陽性的個數,S 為真陰性之個數與 T 為偽陰性之個數,其中 R 是可觀察的變項,
而 U、V、S、T 則為未知變項,α、β分別為個別之型 I 與型 II 錯誤發生率。當 顯著水準α提高,可見的是可觀測的變項 R 亦隨之增加。
整體型 I 錯誤發生率(familywise error rate; FWER)定義為發生一次以上錯誤 拒絕的機率大小,即至少出現一次偽陽性的情形,
FWER= P(V ≥ 1) = 1 − P(V = 0)
若 m 個檢定之檢定統計量彼此獨立,並假設 FWER=𝛼0,則 FWER 可表示:
𝛼0 = FWER = 1 − P(V = 0) = 1 − (1 − 𝛼)𝑚0 (1) 由(1),透過代數運算整理可得單一檢定之顯著水準,α = 1 − (1 − 𝛼0)1 𝑚⁄ 0,另 一方面,若檢定統計量間為相關,Hsueh et al. (2003)依據 Bonforroni 的方法提出 單一檢定之顯著水準為 𝑚𝛼0
0。
許多處理多重檢定的文獻中,往往提及整體型 I 誤發生率過大的問題,
Benjamini & Hochberg (1995)提出錯誤發現率(false discovery rate; FDR),來調整 多重檢定存在錯誤拒絕虛無假設之比例過大的問題,FDR 是錯誤拒絕虛無假設 的期望個數與整體達顯著個數的比值,
FDR = E (VR) =E(V)R (2) 當 R=0,令(𝑉𝑅) = 0 。若將 FDR 控制不超過𝑞∗,即FDR ≤ 𝑞∗,可約略估計 出E(V) ≈ R × 𝑞∗。
依照錯誤發現率(false discovery rate; FDR),Benjamini & Hochberg (1995)提 出 FDR 的控制方法,假定𝑃𝑖為對應檢定假設𝐻0𝑖之 p 值(p-value),𝑃(𝑖) 為來自 𝑃𝑖(𝑖 = 1,2, ⋯ 𝑚)的一組次序統計量,𝐻0(𝑖)是𝑃(𝑖)所對應之虛無假設,而拒絕𝐻0(𝑖)的 步驟為依序比較𝑃(𝑖) 與 𝑞∗ 𝑖𝑚 (𝑖 = 1,2, ⋯ m)兩者的大小,尋找最大滿足的𝑘值,其 中𝑞∗為給定的 FDR 水準值。
3
𝑘 = max {𝑖 | 𝑃(𝑖) ≤ 𝑞∗ 𝑖𝑚 }, 𝑖 = 1,2, ⋯ , m。
並作出𝐻0(1)、𝐻0(2)⋯ 𝐻0(𝑘),此 𝑘 個虛無假設被拒絕的結論,。而 Benjamini &
Hocherg (2000)提出修正,改以比較𝑃(𝑖) 與 𝑞∗ 𝑖𝒎
𝟎 以提高檢定力,然而𝑚0為一未 知參數,需作估計,也就是
𝑘∗= max {𝑖 | 𝑃(𝑖) ≤ 𝑞∗ 𝑖𝑚̂
0 }, 𝑖 = 1,2, ⋯ , m。
不論是 FWER 的控制程序,或是 FDR 控制程序,虛無假設為真的個數(𝑚0)之 估計就顯得非常重要。以下是過去文獻之方法。
方法一:Benjamini 與 Hochberg 最小斜率法(LSL)
Benjamini & Hochberg (2000) 提出藉由點(𝑖, 𝑃(𝑖))與點(𝑚 + 1, 1),兩點求斜 率的方式來計算取得𝑚0的估計,步驟如下:
步驟一:計算兩點斜率𝑆𝑖 = (1 − 𝑃(𝑖)) / (𝑚 +1−𝑖) ; 𝑖 = 1,2, ⋯ , 𝑚。
步驟二:由𝑖 = 1 起始,判斷是否𝑆𝑖 ≤ 𝑆𝑖+1,一旦𝑆𝑖 > 𝑆𝑖+1,則停止,
得出𝑚0的估計量如下:
𝑚̂0𝐿𝑆𝐿 = 𝑚𝑖𝑛 { [𝑆1
𝑖+1] , 𝑚},其中[. ]為高斯運算子。
方法二:麥內瑪檢定(McNemar Test; MT)
由表 2.1 : m 個假設檢定之結果對應分類,Ma & Chao (2011)提出利用 V 的 期望個數可將表 2.1 表示為表 2.2 之型式,並藉由麥內瑪檢定之檢定統計量,得 出𝑚0的估計。
表 2.2 檢定結果分類
結論為拒絕虛無假設 之個數
結論為不拒絕虛無假設之
個數 總和
虛無假設為真之個數 α𝑚0 𝑚0− α𝑚0
m
0虛無假設為偽之個數 R − α𝑚0 m − 𝑚0− R + α𝑚0
m m
0總和 R m − R
m
由表 2.2,麥內瑪檢定統計量為 (𝑉 − 𝑇)2
𝑉 + 𝑇 = (m − 𝑚0 − R)2 m − 𝑚0− R + 2α𝑚0
如果不拒絕 McNemar 檢定的虛無假設,即:虛無假設真偽的實際狀況和檢定結 果是一致的,則:
(m−𝑚0−R)
2
m−𝑚0−R+2α𝑚0 ≤ 𝜒2𝛼(1) (3)
4
由(3)式,可得出區間估計量[𝑚̂0𝑀𝑇(−), 𝑚̂0𝑀𝑇(+)] ,其中:
𝑚̂0𝑀𝑇(−) = 𝑚𝑎𝑥 (0,
2(m−R)+𝜒2𝛼(1)(2𝛼−1)−√(𝜒2𝛼(1)(2𝛼−1))2+8𝛼(𝑚−𝑅)𝜒2𝛼(1)
2 )
和,
𝑚̂0𝑀𝑇(+) = 𝑚𝑖𝑛 ( 𝑚,
2(𝑚−𝑅)+𝜒2𝛼(1)(2𝛼−1)+√(𝜒2𝛼(1)(2𝛼−1))2+8𝛼(𝑚−𝑅)𝜒2𝛼(1)
2 )
其中,𝑚̂0𝑀𝑇(−) ≥ 0 與 𝑚̂0𝑀𝑇(+)≤ 𝑚 ,而𝑚0的估計可由𝑚̂0𝑀𝑇(−)與𝑚̂0𝑀𝑇(+)兩者 的平均得出:
𝑚̂0𝑀𝑇 =𝑚̂0𝑀𝑇(−)+𝑚2̂0𝑀𝑇(+)。
方法三:傅萊得曼檢定(Friedman Test; FD)
傅萊得曼檢定是無母數的統計方法之一,可用來比較來自同一個體之重複測 量所得的觀察值,Ma & Tsai (2011)提出,透過傅萊得曼檢定統計量以估計虛無 假設為真的個數𝑚0,而此一方法優點在於能夠正確反映出檢定統計量間為相關 之問題。
該方法係透過假設𝑚0個有相關性的水準(檢定統計量),是由大至小對應之 p 值(p-value),令𝑃1,(𝑚), 𝑃1,(𝑚−1), ⋯ , 𝑃1,(𝑚−𝑚0+1)為由大至小排序之 p 值,作為區集 1,
再利用拔靴方法(bootstrap method)進行取後放回抽樣共計 B 個區集,拔靴樣本 (bootstrap sample)結果示意如表 2.3 與樣本資料排序如表 2.4。
表 2.3 傅萊得曼檢定與拔靴樣本結果
1 2 ⋯ 𝑚0
區集 1 𝑃1,(𝑚) 𝑃1,(𝑚−1) ⋯ 𝑃1,(𝑚−𝑚0+1)
區集 2 𝑃2,1 𝑃2,2 ⋯ 𝑃2,𝑚0
⋮ ⋮ ⋮ ⋮ ⋮
區集 B 𝑃𝐵,1 𝑃𝐵,2 ⋯ 𝑃𝐵,𝑚0
表 2.4 之𝑅𝑗 ; 𝑗 = 1,2, ⋯ , 𝑚0為第 j 行(column)的加總,
傅萊得曼檢定統計量為:
T =𝐵𝑚 12
0(𝑚0+1)∑𝑚𝑗=10 𝑅𝑗2− 3𝐵(𝑚0+ 1) (4) 給定顯著水準α,與估計量𝑚0,可計算出:
𝑇𝐹 =𝐵𝑚̂ 12
0(𝑚̂0+1)∑𝑚𝑗=1̂0 𝑅𝑗2− 3B(𝑚̂0+ 1) ≈𝜒2𝛼(𝑚̂
0−1) (5) 然而∑𝑚𝑗=1̂0 𝑅𝑗2難以計算該值,故以下式代替:
5
𝑇̃ =𝐹 𝐵𝑚̂ 12
0(𝑚̂0+1)∑𝑚𝑗=1̂0𝐿𝑆𝐿𝑅𝑗2− 3B(𝑚̂0+ 1) ≈𝜒2𝛼(𝑚̂
0−1) (6) 其中𝑚̂0𝐿𝑆𝐿為第一節文獻之方法,當𝑇̃很靠近𝜒𝐹 2𝛼(𝑚̂
0−1)時,可運算得出𝑚̂0, 並表示為𝑚̂0𝐹𝐷。
表 2.4 傅萊得曼資料等級排序
1 2 ⋯ 𝑚0
區集 1 𝑅1,1 𝑅1,2 ⋯ 𝑅1,𝑚0
區集 2 𝑅2,1 𝑅2,2 ⋯ 𝑅2,𝑚0
⋮ ⋮ ⋮ ⋮ ⋮
區集 B 𝑅𝐵,1 𝑅𝐵,2 ⋯ 𝑅𝐵,𝑚0
總和 𝑅1 𝑅2 ⋯ 𝑅𝑚0
註:針對橫列(區集)作等級排序,以縱行作等級加總
6