第五章 電腦模擬與比較
5.1 平均數偏移
5.1.1 模擬過程
在模擬的過程中,我們假設資料來自於混合常態分配,其中一個 分配是製程在管制狀態內N(μ σ0, 2),另一個分配則是製程在管制狀態 外N(μ σ1, 2),其中子群數m=100(1000),樣本數n=5,μ0 =0,σ2 =1, 平均數的偏移程度δ =(μ μ σ δ1− 0) / ( =0, 0.5, 1, 1.5, 2, 2.5, 3),資料來自於管 制狀態外之製程的比例p p( =0.05, 0.1, 0.15, 0.2),對不同的δ 和p的組合 作模擬。模擬步驟如下:
步驟一. 給定δ 和p值。
步驟二. 生成m組子群資料,每組n個樣本;每組子群有1−p的機率來 自於N(μ σ0, 2),p的機率來自於N(μ σ1, 2),子群內的資料則都 來自同一分配。
步驟三. 計算出m組子群的組內平均{X1,...,Xm}並用直接估計法、重覆
篩選法和 EM-MLE 法三種方法估計管制狀態內之製程的參
5.1.2 參數估計的比較
表三到表五分別列出當子群數m=100時直接估計法、重覆篩選 法、和 EM-MLE 法三種估計參數方法的估計值在 10000 次模擬中的 平均值和標準差,表六則是列出求μ0和σ 的最大概似估計量來估計參 數(與 EM-MLE 法不同,EM-MLE 法是用σSp來估計σ)。圖一和圖二 分別是當子群數m=100時直接估計法、重覆篩選法和 EM-MLE 法三 種方法在μ0和σ估計上的比較。圖三和圖四則是當m=1000時的情形。
從表三中可以發現直接估計法在估計μ0方面估計得不好,而且隨 著平均數的偏移程度δ和資料來自於管制狀態外之製程的比例p變大 而變差,原因是因為X是算所有資料的平均,連資料來自於管制狀態 外之製程也會被計算進去,所以會受到管制狀態外之製程的資料影 響,導致估計得不理想。
在X 管制圖中用重覆篩選法去估計參數,從表四中可以發現在估 計μ0方面也估計得不好,原因是因為X 會受到管制狀態外之製程的資 料影響,雖然說有做過篩選,但是在篩選的過程中也有可能把管制狀 態內之製程的資料給刪除,而且也無法把全部管制狀態外之製程的資 料都刪除。
從表五中可以發現 EM-MLE 法在所有的情況下μ0和σ 都估計得相
法中我們是採用σSp來估計σ ,如果是用σ 的最大概似估計量估計參 數,從表六中可以發現σ 估計得不理想,因為子群內的資料來自同一 分配,所以我們採用σSp來估計σ 。
從圖一的比較中可以發現,無論偏移程度δ 是多少,EM-MLE 法 在估計μ0 =0方面表現較好,圖二則顯示三種方法在估計σ =1方面表 現得差不多。
從圖一至圖四可以發現,當子群數m變大時,三種方法在估計
0 0
μ = 和σ =1方面都會表現的比較好。
5.1.3 假警報率α 和偵測力1−β的比較
表七到表九分別列出當子群數m=100時直接估計法、重覆篩選 法、和 EM-MLE 法三種估計參數方法在階段 I 中假警報率和偵測力 在 10000 次模擬中的平均值和標準差。圖五和圖六表示的是當子群數
m=100時三種估計法在階段 I 中假警報率和偵測力的表現,圖七和圖 八則是m=1000時的情形。從圖五和圖六中可以發現,EM-MLE 法的 假警報率比起另外兩種方法要來得低,而偵測力則比較高,因此 EM-MLE 法表現得比另外兩種方法好。
從圖五至圖八可以發現,當子群數m變大時,三種方法在假警報 率和偵測力上都會表現的比較好。
5.1.4 階段 II 中ARL的表現
在階段 I 中偏移程度δ 和資料來自於管制狀態外之製程的比例p 有許多不同的組合,在這裡我們只列出當δ =2和p=0.2時用三種估計 方法估計參數後在階段 II 中ARL的表現,表十至表十二分別列出直接 估計法、重覆篩選法和 EM-MLE 法三種估計參數方法在階段 II 中ARL 的表現。圖九表示的是三種方法在階段 II 中ARL的表現。當階段 II 的資料來自於管制狀態內N(0,1)時,我們發現直接估計法之ARL0比參 數已知時之設定值 370.4 小很多;重覆篩選法之ARL0較靠近 370.4 但 即使m大到 1000 仍有偏差(bias);而 EM-MLE 法之ARL0雖然在m較 小時比 370.4 大,但隨著m愈大則愈逼近 370.4。當階段 II 的資料來 自於管制狀態外時,EM-MLE 法的ARL1比另外兩種方法都要小而且 較接近參數已知時之ARL1。由上面的比較可以得知 EM-MLE 法在階 段 II 中ARL的表現比其他兩種方法為佳。
從表十二中可以發現,無論偏移程度δ 是多少,當子群數m變大 時,ARL會變小且漸漸逼近參數已知時(m= ∞),而當m=200時,ARL 就會跟參數已知時相當接近,也就是說當階段 I 資料來自於混合常態 分配時,EM-MLE 法至少需要 200 個子群,才能使得估計的參數和 管制圖在階段 II 中ARL的表現與參數已知時相近。