第二章 文獻探討
2.1 管制圖的基本判讀
Walter Shewhart 在 1924 年提出 Shewhart 管制圖( Shewhart 1931),其概念為給定製程在管制狀態下產品特性的分配,再依照選 取的信賴水準計算出對應的管制上限(upper control limit;UCL)、中 心線(center line;CL)和管制下限(lower control limit;LCL),當樣本 落在管制界限(control limit)外時,我們判定製程失控,此時需要採取 調整和修正的措施來發現並消除可歸屬原因。
在 Montgomery (2005)一書提到:一般正常情況下,管制圖上的 樣本點是呈現隨機性散佈於管制界限內;若超出管制界限外,可能為 製程平均水準偏移或製程變異數改變,這時候可以著手找出造成此偏 移的因素來改善製程。但另一種情況是管制圖上的樣本點都落在管制 界限內,但呈現有順序性或非隨機性的情況,則應找出其原因並加以 處理。因此管制圖的目的是預防製程異常的發生,運用簡單的圖表方 式,讓操作者能方便以目視管理,使得管制圖被廣泛運用在各式生產 線上,作為製程管制的主要工具。
μ、變異數σ2均為已知,若有n 個樣本X X1, 2,...,Xn,其樣本平均數為
4
σ (pooled sample standard deviation):
4
因為S2p correct, 是分別計算每個子群內(within subgroup)的變異數,然後再
做平均;而S2p incorrect, 是把全部樣本混合在一起計算而得的變異數,同時 包含子群內和子群間(between subgroup)的變異,因而導致高估σ。
但樣本點落在管制界限外時,即拒絕製程在管制狀態下之假設,此為
1 1
時來討論會誤導的可能結果,例如作者用ˆ
Jensen, Jones-Farmer, Champ, and Woodall (2006)指出階段 I 使用 估計的參數所產生之估計誤差會嚴重影響階段 II 管制圖的表現,與
圖才能快速偵測到變異。而子群數m 和子群內樣本數 n 要多大才是
〝足夠〞呢?當階段 I 的樣本全部來自管制狀態下,根據 Montgomery (2005),通常都選定 m = 20 ~ 30 且 n = 3 ~ 5。
但 Quesenberry (1993)提到不同的看法,作者認為 m = 20 ~ 30 而 n = 4 或 5 這數目是不足以讓估計的參數和參數已知時所做的管制界
限接近,也就是低估獲得準確管制界限所需要的樣本數。作者指出當 階段 I 的樣本全部來自管制狀態下,在 n = 5 時,m 至少要 100,估計 的參數之管制界限才能夠近似參數已知時之管制界限。
Chen (1997)認為μ和σ 必須估計的時候,在n = 5,m 至少要 100;
n = 10,m 至少要 50,X 管制圖的表現才會接近參數已知之情況。
Jensen, Jones-Farmer, Champ, and Woodall (2006)也指出當子群數 m 越 大時,使用估計的參數在管制狀態下所得的平均連串長度,會收斂到 參數已知時所得的平均連串長度。
子群數m 太小會估計不準,太大則不符合經濟效益,所以必須 選取適當的子群數m 和子群內樣本數 n。
第三章 傳統方法與新方法之探討
1 ... 1 ...
1 1
步驟三. 計算X 混合樣本之管制界限( ˆ /
計算新的試驗管制界限,這過程將一直被重複,直到所有點都在試驗
時,兩者差距必定越小越好。當資料為混合樣本,我們希望估計的參 數μˆ0、σˆ和管制狀態下的參數μ0、σ 很接近。
首先觀察表二,使用直接估計法,μˆ0平均值會隨δ 和p增加而變 大(除了δ =0之外),這裡的μˆ0其實是估計混合樣本的樣本平均數之期 望值E X( ),所以拿來估計μ0是很不恰當的。再觀察表三,使用重複 篩選法,仍有些μˆ0平均值和μ0很不接近,雖然有經過篩選的動作,但 有可能在篩選的過程中把來自管制狀態下的樣本給刪除,或無法把來 自失控狀態下的樣本全部刪除,因此影響到μˆ0的準確性。
再觀察表一中α 和1−β之理論值和表二、表三中傳統兩種方法之 α 和1−β平均值歸類出以下結果:
(1)當 p 不變,δ 變大,則
α
變大,1-β
變大。(2)當δ ( 0)≠ 不變,p 變大,則
α
變大,1-β
變小。我們可以由下面圖形解釋其原因:(1) p 不變,δ 變大,管制界限 往右移,但受到管制狀態下的樣本之牽制,移動速度不及失控狀態下 的常態分配往右移的速度,所以
α
變大,1-β
變大;(2)δ 不變,p 變 大,管制界限往右移,但失控狀態下的樣本固定不動,只向上增長,所以
α
變大,1-β
變小。(1) p 不變,δ 變大:
(2)δ 不變,p 變大:
3.3 新方法
3.3.1 新方法之起源
在不同δ, p值組合下,當使用直接估計法,μˆ0平均數表現最差的
情況在( , )δ p =(3, 0.2);而當使用重複篩選法,μˆ0平均數表現最差的情
況在( , )δ p =(1, 0.2)。所以我們先觀察這兩種組合的情況:(1)、給定八
十個X 來自管制狀態下的常態分配N(0,1/ 5),二十個X來自失控狀態 下的常態分配N(3,1/ 5);(2)、給定八十個X來自管制狀態下的常態分
配N(0,1/ 5),二十個X 來自失控狀態下的常態分配N(1,1/ 5)。使用核密
度估計量(Kernel Density Estimator;KDE)來估計這一百個X 組成的混 合樣本之機率密度函數(probability density function;p.d.f.),其圖形如 下:
由上圖發現密度函數最高點對應的X 值,很接近管制狀態下的常 態分配之平均數μ0 =0,因此觸發「使用核密度估計量來估計X 混合 樣本之密度函數,並用對應最大密度函數值的X值,來估計管制狀態 下之平均數μ0」此想法。
3.3.2 核密度估計量之介紹
直方圖(histogram)和次數多邊形(frequency polygon) 簡單易作、
容易解釋,且不需要高階繪圖軟體,是最常被使用的密度函數估計 量,但有兩個嚴重的缺點:(1)、圖形不夠平滑(smooth);(2)、對密度
0
步驟一. 同 3.2.1 小節的步驟一,生成樣本。
分)和來自失控狀態下的樣本之密度函數(右虛線部分)經過堆疊後產
0 0 0 0
對每個m和δ%的組合,上排左邊表示 ARL 的平均估計量,記為 ARL,由 10000 個 ARL 的平均得來;上排右邊括號中是ARL的標準 差;下排表示 SDRL 的平均估計量,記為SDRL,由 10000 個 SDRL 的平均得來。表格中最下面一排為參數已知時 ARL 和 SDRL 的理論 值,m 以∞表示之。
第四章 數值比較與其他相關討論
4.1 階段 I 的比較
在階段 I 估計方法的比較有兩個準則:(1)μ0和σ 估得好不好、(2) α 和1−β的大小。由於本文三種估計方法都是使用ˆ
Sp
σ 估計σ,所以省 略σˆ比較的部分。
將表二、表三、表五中,使用三種不同的估計方法,10000 個模 擬μˆ0平均值、μˆ0標準差、α 平均值、α 標準差、1−β平均值、1−β標 準差之折線圖,分別繪於圖一至圖六。圖中黑色實線表示使用直接估 計法,藍色實線表示使用重複篩選法,紅色實線表示使用核密度估計 法。
觀察圖一,我們發現在平均數偏移程度較小時(δ =0.5, 1, 1.5),p 越大的時候,三種方法之μˆ0平均值越不接近μ0,但使用核密度估計法 之μˆ0平均值還是比傳統兩種方法來得接近。當樣本全部來自管制狀態 下或平均數偏移程度較大時(δ =2, 2.5, 3),使用核密度估計法之μˆ0平均 值很接近μ0。再觀察圖二,我們發現三種方法之μˆ0標準差相差於 0.05 之內,大致看來,使用核密度估計法之μˆ0標準差略大,使用直接估計
和傳統兩種方法差不多。當平均數偏移程度較大時(δ =1.5, 2, 2.5, 3),p
觀察圖七,當階段 I 為( , )δ p =(0, 0.05)時的情況,因為階段 I 樣本 全部來自管制狀態下
,
m 越大的時候,μˆ0估計得越準確,所以三種估 計方法之ARL都很接近參數已知時之 ARL 值。在階段 II 為δ%=0 時的 情況,使用核密度估計法之ARL0比傳統兩種方法更接近參數已知時之ARL0,而其他情形二者表現差不多。
觀察圖八,當階段 I 為( , )δ p =(1, 0.2)時的情況,因為μˆ0估計得不 準確,不管m 是多少,三種方法之ARL都和參數已知時之 ARL 值差 很遠。而且ARL0比參數已知時之ARL0小很多、ARL1比參數已知時之
ARL1大很多。這代表當階段 II 樣本來自管制狀態下,誤判率增加;
而當階段 II 樣本來自失控狀態下,偵測力變差。不過,比較之下,
使用核密度估計法之ARL還是比傳統兩種方法接近參數已知時之 ARL 值。
觀察圖九,當階段 I 為( , )δ p =(2, 0.1)時的情況,使用直接估計法,
因為μˆ0估計得不準確,不管m 是多少,ARL都很不接近參數已知時之 ARL 值;m 越大的時候,使用重複篩選法和核密度估計法之ARL都越 接近參數已知時之 ARL 值,不過,比較起來,使用核密度估計法之ARL 還是比重複篩選法之ARL接近。
配,於是我們將核密度估計法套用於 t 分配和 logistic 分配,其特性
σ 1.290994 1.118034 1.054093 1.035098 給定μ0 =0、m = 100、n = 5、δ = 0(0.5)3、p = ( 0.05, 0.1, 0.15, 0.2)、h =0.5、logistic 分配之尺度參數(scale parameter)β= (0.01, 0.1, 0.5, 1),表十一為不同δ, ,p β值組合下各模擬 N = 10000 次所得之 10000 個μˆ0的平均值及標準差。logistic 分配(尺度參數為β)的變異數為
2 2
π β / 3,所以對應不同的尺度參數,logistic 分配之標準差為:
β 0.01 0.1 0.5 1 σ 0.018138 0.181380 0.906900 1.813799 觀察表十、表十一,發現當σ 越小,如 logistic 分配之尺度參數
(mean integrated squared error;MISE),
而漸近積分均方誤差(Asymptotic mean integrated squared error;
AMISE)較容易計算,讓漸近積分均方誤差達到最小的h0為本文提供
數,則管制界限(μˆ0−Lσˆ/ n,μˆ0+Lσˆ/ n)為隨機區間,若希望X 落在管
管制界限也會跟著偏移,α增加的比例一定比α減少的比例多,所以
在不失ㄧ般性下,可假設μ0 =0,上述式子中,T 為自由度為(n-1)的 t 分配,Φ%為自由度為(n-1)的 t 分配之累積分配函數。因為 t 分配和 n 有關,所以L 和 n 也有關,因此我們只列出 m = 100,n = 2(1)19
,
20(10)100 之 L 的逼近值,見表九(b)。第五章 結論及未來研究方向
針對階段 I 樣本皆來自常態分配,部分樣本來自製程發生平均數 偏移的情況,我們提出核密度估計法來估計管制狀態下的常態分配之 平均數μ0,並發現當平均數偏移程度δ 較大時,估計表現尤佳。
事實上,核密度估計法並不受限於來自常態分配之樣本;而且,
失控狀態下的樣本不一定要和管制狀態下的樣本一樣來自同一分 配。另外,核密度估計法也可用於製程同時發生平均數偏移或變異數 改變之情況,只要混合樣本的分布情形在管制狀態下之分配平均值附 近呈現高峰皆適用。
我們曾經嘗試將核密度估計法套用於估計變異數的時候,但因為 樣本變異數服從 Gamma 分配,其密度函數最高點不會對應到平均 數,所以估計效果很差。未來可以繼續研究新的估計方法,希望其對 樣本不只來自兩個不同的分配之情況皆適用。
參 考 文 獻
1. Champ, C. W. and Chou, S. P. (2003). “Comparison of Standard and Individual Limits Phase I Shewhart X , R, and S Charts”. Quality and Reliability Engineering International 19, pp. 161-170.
2. Chen, G. (1997). “The Mean and Standard Deviation of the Run Length Distribution of X Charts When Control Limits Are Estimated”. Statistica Sinica 7, pp. 789-798.
3. Ghosh, B. K., Reynolds, M. R., and Hui, Y. V. (1981). “Shewhart X -Charts with Estimated Process Variance”. Communications in Statistics- Theory and Methods 18, pp. 1797-1822.
4. Jensen, W. A., Jones-Farmer, L. A., Champ, C. W., and Woodall, W.
H. (2006). “Effects of Parameter Estimation on Control Chart
Properties: A Literature Review”. Journal of Quality Technology 38, pp. 349-364.
5. Montgomery, D. C. (2005). Introduction to Statistical Quality Control, 5th ed. John Wiley, New York.
6. Quesenberry, C. P. (1993). “The Effect of Sample Size on Estimated Limits forX andX Control Charts”. Journal of Quality Technology 25, pp. 237-247.
7. Shewhart, W. A. (1931). Economic Control of Quality of Manufactured Product. D. Van Nostrand, New York.
8. Simonoff, J. S. (1996). Smoothing Methods in Statistics.
Springer-Verlag, New York.
9. Woodall, W. H. and Montgomery, D. C. (1999). “Research Issues and
表一:資料為混合樣本,用E X( ) 3 /± σ n當管制上下限之α 和1−β的理論值
α 理論值
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 0.0027 0.0027 0.0027 0.0027 0.0027 0.0027 0.0028 0.05 0.0027 0.0027 0.0029 0.0031 0.0034 0.0038 0.0043 0.1 0.0027 0.0029 0.0034 0.0043 0.0056 0.0075 0.0100 0.15 0.0027 0.0031 0.0043 0.0065 0.0100 0.0154 0.0231 0.2 0.0027 0.0034 0.0056 0.0100 0.0177 0.0299 0.0486 1−β理論值
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 0.0027 0.0292 0.2158 0.6257 0.9233 0.9944 0.9999 0.05 0.0027 0.0263 0.1906 0.5739 0.8941 0.9896 0.9996 0.1 0.0027 0.0231 0.1617 0.5075 0.8473 0.9789 0.9988 0.15 0.0027 0.0202 0.1358 0.4408 0.7885 0.9601 0.9966 0.2 0.0027 0.0177 0.1129 0.3757 0.7183 0.9295 0.9910
表二:資料為混合樣本,使用直接估計法估計參數,10000 個模擬μˆ0、σˆ、α 和1−β的平均值及標準差
ˆ0
μ 平均值(μˆ0標準差):
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 0.0001( 0.0448 ) 0.0052 ( 0.0443 ) 0.0103 ( 0.0450 ) 0.0154 ( 0.0448 ) 0.0201 ( 0.0448 ) 0.0247 ( 0.0444 ) 0.0293 ( 0.0452 ) 0.05 -0.0004( 0.0443 ) 0.0243 ( 0.0447 ) 0.0499 ( 0.0449 ) 0.0752 ( 0.0446 ) 0.1002 ( 0.0449 ) 0.1250 ( 0.0452 ) 0.1505 ( 0.0451 ) 0.1 0.0000( 0.0444 ) 0.0498 ( 0.0446 ) 0.0997 ( 0.0443 ) 0.1499 ( 0.0446 ) 0.1990 ( 0.0445 ) 0.2494 ( 0.0446 ) 0.2999 ( 0.0452 ) 0.15 0.0006( 0.0448 ) 0.0749 ( 0.0448 ) 0.1498 ( 0.0446 ) 0.2248 ( 0.0444 ) 0.2995 ( 0.0442 ) 0.3746 ( 0.0447 ) 0.4499 ( 0.0447 ) 0.2 0.0001( 0.0446 ) 0.0995 ( 0.0445 ) 0.1997 ( 0.0446 ) 0.3004 ( 0.0443 ) 0.3998 ( 0.0450 ) 0.5005 ( 0.0449 ) 0.6001 ( 0.0449 ) σˆ平均值(σˆ標準差):
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 0.9993 ( 0.0351 ) 1.0002 ( 0.0355 ) 0.9997 ( 0.0357 ) 1.0005 ( 0.0356 ) 0.9999 ( 0.0350 ) 1.0003 ( 0.0353 ) 1.0001 ( 0.0359 ) 0.05 0.9994 ( 0.0355 ) 0.9997 ( 0.0355 ) 1.0001 ( 0.0353 ) 0.9997 ( 0.0353 ) 0.9999 ( 0.0352 ) 1.0000 ( 0.0350 ) 0.9989 ( 0.0353 ) 0.1 0.9998 ( 0.0356 ) 1.0000 ( 0.0357 ) 0.9991 ( 0.0350 ) 0.9997 ( 0.0354 ) 1.0000 ( 0.0357 ) 0.9997 ( 0.0356 ) 1.0002 ( 0.0357 ) 0.15 1.0003 ( 0.0351 ) 0.9995 ( 0.0350 ) 0.9998 ( 0.0354 ) 1.0002 ( 0.0352 ) 1.0000 ( 0.0353 ) 0.9993 ( 0.0350 ) 0.9999 ( 0.0354 )
α 平均值(α 標準差):
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 0.0028 ( 0.0054 ) 0.0028 ( 0.0054 ) 0.0027 ( 0.0053 ) 0.0027 ( 0.0053 ) 0.0027 ( 0.0053 ) 0.0028 ( 0.0054 ) 0.0027 ( 0.0052 ) 0.05 0.0027 ( 0.0053 ) 0.0028 ( 0.0055 ) 0.0029 ( 0.0057 ) 0.0031 ( 0.0058 ) 0.0034 ( 0.0060 ) 0.0038 ( 0.0064 ) 0.0043 ( 0.0068 ) 0.1 0.0028 ( 0.0053 ) 0.0029 ( 0.0058 ) 0.0034 ( 0.0062 ) 0.0044 ( 0.0070 ) 0.0057 ( 0.0080 ) 0.0074 ( 0.0091 ) 0.0100 ( 0.0107 ) 0.15 0.0027 ( 0.0053 ) 0.0031 ( 0.0061 ) 0.0043 ( 0.0071 ) 0.0065 ( 0.0087 ) 0.0101 ( 0.0109 ) 0.0157 ( 0.0135 ) 0.0234 ( 0.0165 ) 0.2 0.0027 ( 0.0053 ) 0.0033 ( 0.0064 ) 0.0056 ( 0.0085 ) 0.0101 ( 0.0113 ) 0.0177 ( 0.0151 ) 0.0302 ( 0.0191 ) 0.0489 ( 0.0245 ) 1−β平均值(1−β標準差):
δ
p 0 0.5 1 1.5 2 2.5 3
0.01 NA ( NA ) 0.0291 ( 0.1681 ) 0.2121 ( 0.4088 ) 0.6256 ( 0.4840 ) 0.9198 ( 0.2716 ) 0.9935 ( 0.0804 ) 0.9999 ( 0.0100 ) 0.05 NA ( NA ) 0.0279 ( 0.0738 ) 0.1925 ( 0.1776 ) 0.5764 ( 0.2220 ) 0.8936 ( 0.1396 ) 0.9893 ( 0.0456 ) 0.9997 ( 0.0080 ) 0.1 NA ( NA ) 0.0237 ( 0.0479 ) 0.1643 ( 0.1184 ) 0.5104 ( 0.1590 ) 0.8504 ( 0.1127 ) 0.9804 ( 0.0439 ) 0.9985 ( 0.0121 ) 0.15 NA ( NA ) 0.0198 ( 0.0357 ) 0.1360 ( 0.0894 ) 0.4392 ( 0.1288 ) 0.7890 ( 0.1051 ) 0.9598 ( 0.0504 ) 0.9965 ( 0.0152 ) 0.2 NA ( NA ) 0.0174 ( 0.0292 ) 0.1136 ( 0.0714 ) 0.3771 ( 0.1086 ) 0.7177 ( 0.1024 ) 0.9304 ( 0.0574 ) 0.9912 ( 0.0210 )
表三:資料為混合樣本,使用重複篩選法估計參數,10000 個模擬μˆ0、σˆ、α 和1−β的平均值及標準差
表三:資料為混合樣本,使用重複篩選法估計參數,10000 個模擬μˆ0、σˆ、α 和1−β的平均值及標準差