型一錯誤機率及檢定力 - 研究結果與討論 - KLIC作為傾向分數配對平衡診斷之可行性探討

第四章研究結果與討論

第二節型一錯誤機率及檢定力

Test Statistics KLIC1 KLIC2 KLIC3 KLIC4 KLIC5 KLIC6 KS 95% Critical Value 0.0144 0.0144 0.0143 0.1192 0.1192 0.1187 0.0600

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

為確保信心水準維持在 0.05，表中第三列呈現的是樣本同樣來自的情況。

由於 10000 次模擬實驗中，檢定統計量大於臨界值的比率，都十分靠近，與理論值吻合。再者，針對位置與散佈參數的變動，六種 KLIC 與 KS 統計量都有極高的檢定力，

大體上只要參數的變化不要太小，檢定力幾乎可以達到 100%。Dowd(2005, p345-p347) 中提到 KS 對位置參數變動較敏感，對於尾端分配變動的反應效果較差，表中數據確實也反映出這種現象[11]。由表中可以看到同樣在位置參數變化下，KLIC 檢定力雖不比 KS 高，卻差異不大，但在散佈參數時 KLIC 表現比 KS 好許多。形狀參數(也可說尾部薄厚程度)的部分，各個統計樣的表現較沒有一致性，檢定的效果也較不理想，其中紅色數據³為不符合預期的模擬結果，全部出現在 KLIC 的情況。這顯示出 KLIC 在厚尾的狀態下其檢定力並不穩定，究其原因，我們猜測可能是因為機率的互消或是積分範圍不夠完整產生負值造成檢定力降低，而第三種 KLIC 是修正 KLIC1 和 KLIC2 所得，比較不會有過度重視某一方而偏頗的情形，以及 KLIC4 到 KLIC6 的絕對值修正皆較單純 KLIC1 和 KLIC2 來的高檢定力。

3其積分實務操作上修正方式與第壹部分相同，惟厚尾區段 t 分配選取以和百分位數作為積分上下界，利用上一節原理，少數時候會有過遠的資料使得在離群與大多數資料之間形成近乎 0 的機率斷層使積分發散，而多數這種現象發生都幾乎有一個共通性—斷層的末端樣本個數比非常少( )，故以相同方式處理。

‧

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

影響較 Skew-normal 來的多，且兩者分配並沒有左右對照的關係，相較之下明顯右偏許多。如圖 4-2 所示，對同樣移動 0.5 單位的形狀參數與散佈參數來看，Skew-normal 的 CDF 最大差異不似大；但在形狀參數上變化就平分秓色，所以檢定力也反映出這樣的現象。同樣的，表中第三列用來檢驗信心水準，結果與理論值十分接近。

圖 4-2 左右偏態之 CDF 比較

我們想知道兩統計量在小樣本下的表現狀況及其穩定程度，故重複一樣實驗，將樣本數改為 500 與 200 去看檢定力變化，並將結果置於附錄表 1 至表 6，其討論內容如下。

整體而言，不論基準分配為何，一如預期檢定力隨樣本數增加而上升，基本上只要

參數的差異到達某個程度，KLIC 或 KS 統計量都有辦法分辨出差異。進一步分析可以發現，對稱分配的情況下，三種樣本數都呈現出 KS 在位置參數的變化上有較強的檢定力。至於散佈參數與形狀參數的變動上，最高檢定力都出現在前三類 KLIC，但缺點是在形狀參數的檢定力較不具有規則性(尤其是 KLIC2)，推測其原因可能與 KLIC 在實務操作上的困難(積分範圍定義與選取)有關。相較之下，後三類 KLIC 的表現雖略遜於 KS

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

是與對稱分配相同，在形狀參數上其檢定力較不具規則性。比較出乎意料的是，後三類 KLIC 及 KS 在小樣本(n = 200)時，針對形狀參數變動的檢定力不甚理想，在前三類 KLIC 可以達到 98%的檢定力時，KS 只有 40%，而後三類 KLIC 更僅 27%。至於右偏分配的情況，這些統計量的表現最合乎預期，我們猜測這或許與分配參數變動時較其他兩者來的明顯有關。如同前面提到，KS 對形狀參數變動較不敏感，因此其檢定力較六種 KLIC 來的低。此外，由於此處的形狀參數為分配的既有參數，不像是常態與(左)偏斜常態的 情況，以 t 分配來描述厚尾分配的情形，故 KLIC 在積分上較沒有定義範圍的問題，較 不易發生計算上的問題。

綜合以上九個表格，我們認為若分配具有一定差異，基本上 KLIC 與 KS 都可以準確判斷。但若要偵測一些較輕微的變化，針對不同參數的選擇會有所不同。雖然 KS 對於位置參數較為敏感，但若要判斷散佈參數與形狀參數時，KLIC 會有較佳的檢定力。

不過在使用 KLIC 時，有個前提—欲比較的兩者分配在定義與(分布範圍)上要盡量一致，

或者不能相差太遠，尤其我們是在比較兩實際樣本的分配時會受限更多因素。幸運的是，

以傾向分數在配對上的實際應用，其分配在定義域都有一定重疊的比例，對於積分範圍選取較無前述問題。故綜合各種考量，我們認為可以考慮使用 KLIC3、KLIC6 以及 KS 統計量來作為平衡標準，主要原因是在於雖然不比 KLIC1 在許多狀況下有較高的檢定力，但此三者有較良好的規律性可以遵循，來減少診斷時產生的確定性問題。下一節將針對此三種統計量進行配對數比討論。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

在文檔中 KLIC作為傾向分數配對平衡診斷之可行性探討 - 政大學術集成 (頁 23-29)

型一錯誤機率及檢定力

第四章 研究結果與討論

第二節 型一錯誤機率及檢定力

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧

‧

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第四章研究結果與討論

第二節型一錯誤機率及檢定力

立政治大學

立政治大學

立政治大學

立政治大學