第四章 研究結果與討論
第二節 型一錯誤機率及檢定力
Test Statistics KLIC1 KLIC2 KLIC3 KLIC4 KLIC5 KLIC6 KS 95% Critical Value 0.0144 0.0144 0.0143 0.1192 0.1192 0.1187 0.0600
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
為確保信心水準 維持在 0.05,表中第三列呈現的是樣本同樣來自 的情況。
由於 10000 次模擬實驗中,檢定統計量大於臨界值的比率,都十分靠近 ,與理論值 吻合。再者,針對位置與散佈參數的變動,六種 KLIC 與 KS 統計量都有極高的檢定力,
大體上只要參數的變化不要太小,檢定力幾乎可以達到 100%。Dowd(2005, p345-p347) 中提到 KS 對位置參數變動較敏感,對於尾端分配變動的反應效果較差,表中數據確實 也反映出這種現象[11]。由表中可以看到同樣在位置參數變化下,KLIC 檢定力雖不比 KS 高,卻差異不大,但在散佈參數時 KLIC 表現比 KS 好許多。形狀參數(也可說尾部 薄厚程度)的部分,各個統計樣的表現較沒有一致性,檢定的效果也較不理想,其中紅 色數據3為不符合預期的模擬結果,全部出現在 KLIC 的情況。這顯示出 KLIC 在厚尾的 狀態下其檢定力並不穩定,究其原因,我們猜測可能是因為機率的互消或是積分範圍不 夠完整產生負值造成檢定力降低,而第三種 KLIC 是修正 KLIC1 和 KLIC2 所得,比較 不會有過度重視某一方而偏頗的情形,以及 KLIC4 到 KLIC6 的絕對值修正皆較單純 KLIC1 和 KLIC2 來的高檢定力。
3其積分實務操作上修正方式與第壹部分相同,惟厚尾區段 t 分配選取以 和 百分位數作為積分 上下界,利用上一節原理,少數時候會有過遠的資料使得在離群與大多數資料之間形成近乎 0 的機率斷 層使積分發散,而多數這種現象發生都幾乎有一個共通性—斷層的末端樣本個數比非常少( ),故以 相同方式處理。
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
影響較 Skew-normal 來的多,且兩者分配並沒有左右對照的關係,相較之下 明顯 右偏許多。如圖 4-2 所示,對同樣移動 0.5 單位的形狀參數與散佈參數來看,Skew-normal 的 CDF 最大差異不似 大;但在形狀參數上變化就平分秓色,所以檢定力也反映 出這樣的現象。同樣的,表中第三列用來檢驗信心水準,結果與理論值 十分接近。
圖 4-2 左右偏態之 CDF 比較
我們想知道兩統計量在小樣本下的表現狀況及其穩定程度,故重複一樣實驗,將樣 本數改為 500 與 200 去看檢定力變化,並將結果置於附錄表 1 至表 6,其討論內容如下。
整體而言,不論基準分配為何,一如預期檢定力隨樣本數增加而上升,基本上只要
參數的差異到達某個程度,KLIC 或 KS 統計量都有辦法分辨出差異。進一步分析可以 發現,對稱分配的情況下,三種樣本數都呈現出 KS 在位置參數的變化上有較強的檢定 力。至於散佈參數與形狀參數的變動上,最高檢定力都出現在前三類 KLIC,但缺點是 在形狀參數的檢定力較不具有規則性(尤其是 KLIC2),推測其原因可能與 KLIC 在實務 操作上的困難(積分範圍定義與選取)有關。相較之下,後三類 KLIC 的表現雖略遜於 KS
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
是與對稱分配相同,在形狀參數上其檢定力較不具規則性。比較出乎意料的是,後三類 KLIC 及 KS 在小樣本(n = 200)時,針對形狀參數變動的檢定力不甚理想,在前三類 KLIC 可以達到 98%的檢定力時,KS 只有 40%,而後三類 KLIC 更僅 27%。至於右偏 分配 的情況,這些統計量的表現最合乎預期,我們猜測這或許與分配參數變動時較其他兩者 來的明顯有關。如同前面提到,KS 對形狀參數變動較不敏感,因此其檢定力較六種 KLIC 來的低。此外,由於此處的形狀參數為分配的既有參數,不像是常態與(左)偏斜常態的 情況,以 t 分配來描述厚尾分配的情形,故 KLIC 在積分上較沒有定義範圍的問題,較 不易發生計算上的問題。
綜合以上九個表格,我們認為若分配具有一定差異,基本上 KLIC 與 KS 都 可 以 準確判斷。但若要偵測一些較輕微的變化,針對不同參數的選擇會有所不同。雖然 KS 對於位置參數較為敏感,但若要判斷散佈參數與形狀參數時,KLIC 會有較佳的檢定力。
不過在使用 KLIC 時,有個前提—欲比較的兩者分配在定義與(分布範圍)上要盡量一致,
或者不能相差太遠,尤其我們是在比較兩實際樣本的分配時會受限更多因素。幸運的是,
以傾向分數在配對上的實際應用,其分配在定義域都有一定重疊的比例,對於積分範圍 選取較無前述問題。故綜合各種考量,我們認為可以考慮使用 KLIC3、KLIC6 以及 KS 統計量來作為平衡標準,主要原因是在於雖然不比 KLIC1 在許多狀況下有較高的檢定 力,但此三者有較良好的規律性可以遵循,來減少診斷時產生的確定性問題。下一節將 針對此三種統計量進行配對數比討論。