第二階段二維剖面監控之研究

(1)

國

立

交

通

大

學

統計學研究所

碩

士

論

文

第二階段二維剖面監控之研究

A Study on Phase II Two-dimensional Profile Monitoring

研究生：劉俞伶

指導教授：洪志真博士

(2)

第二階段二維剖面監控之研究

A Study on Phase II Two-dimensional Profile Monitoring

研究生：劉俞伶 Student：Yu-Ling Liu

指導教授：洪志真博士 Advisor：Dr. Jyh-Jen Horng Shiau

國立交通大學理學院

統計學研究所

碩士論文

A Thesis Submitted to Institute of Statistics College of Science

National Chiao Tung University in Partial Fulfillment of the Requirements

for the Degree of Master

in Statistics July 2012

Hsinchu, Taiwan, Republic of China

(3)

i

第二階段二維剖面監控之研究

研究生：劉俞伶指導教授：洪志真博士

國立交通大學統計學研究所碩士班

摘

要

近年來以統計觀點來監控製程或產品剖面資料的研究已有廣泛發展，大多數的研究皆針對一維剖面提出第一階段或第二階段監控策略。本篇文章是針對二維剖面並納入剖面與剖面之間的變異，運用PCA 及 MPCA 提出第二階段的監控策略。對於運用PCA 方面，將二維剖面矩陣的行向量拉成一維向量，並利用主成分分析的方法來分析此一維向量的共變異結構，進而對主成分投影量 (principal component scores) 提出監控策略。對於運用 MPCA 方面，先利用 Ye (2005) 提出的演算法來找尋分別為行方向和列方向的兩個基底矩陣，然後將新進的二維剖面同時對這兩個基底矩陣投影而獲得座標矩陣 (coordinate matrix) ，進而對座標矩陣提出監控策略。兩方法皆採用常見的Hotelling 2

T 管制圖來確認製程穩定性。

評估兩種方法之績效的方式則是利用平均連串長度來比較偵測能力；整體而言， MPCA 表現較 PCA 來得好，且在執行時間方面，MPCA 較不會受到維度增大的影響。

關鍵字：二維剖面監控、剖面與剖面之間的變異、平均連串長度、主成分分析、多線性主成分分析

(4)

ii

A Study on Phase II Two‐dimensional Profile Monitoring

Student: Yu-Ling Liu Advisor: Dr. Jyh-Jen Horng Shiau

Institute of Statistics National Chiao Tung University

Abstract

The study of monitoring process or product profiles by means of statistics already has extensive development. Most research works focus on one-dimensional profile monitoring schemes of Phase I or Phase II. This thesis is directed towards two-dimensional profiles with profile-to-profile variation. We utilize principal component analysis (PCA) and multilinear principal component analysis (MPCA) to propose monitoring schemes of Phase II. Since two-dimensional profile data are represented as matrices, we vectorize these matrix data for PCA to analyze the

covariance structure of the resulting one-dimensional vectors. With that, we propose a control chart based on principal component scores. For using MPCA, we first utilize the algorithm proposed by Ye (2005) to search for two basis matrices, one for

columns and one for rows, and then project an incoming two-dimensional profile onto the two basis matrices simultaneously to obtain a score matrix. We construct a

monitoring scheme based on this score matrix. Both control charts use the Hotelling’s

2

T _{statistic to monitor the stability of the process. The performances of the two}

methods are evaluated and compared in terms of the average run length. Generally, MPCA performs better than PCA. Moreover, for the execution time, the MPCA method is not affected as much as the PCA method when the size of the profile matrix

(5)

iii increases.

KEY WORDS: Two-dimensional Profile Monitoring, Profile-to-Profile Variation, Average Run Length, Principal Component Analysis, Multilinear Principal Component Analysis

(6)

iv

誌謝

本論文能順利完成，由衷地感謝老師洪志真教授這兩年悉心指導並對於學生的諸多疑問給予耐心且專業的引導。尤其在修改論文階段，老師鉅細靡遺地將論文中的錯誤挑出來，並給予諸多的寶貴建議，讓學生學習到嚴謹的研究態度及多元的思考方向，使學生獲益良多，學生再一次的深表感謝。此外還要感謝口試委員王秀瑛教授、黃榮臣教授和鄭少為教授對於本研究給予實際且可行的建議，使本論文的架構更為完整且清晰。光陰似箭，在交大統計研究所的兩年歲月也將告一段落。在這段歲月裡，很感謝博班清仁學長和博文學長在課業及論文上給予協助及指導。感謝研究夥伴源毅同學在研究上的協助，增廣我的見聞。感謝家榕與子賢在我趕論文期間給予我鼓勵及關心，使我更有動力完成論文。感謝其他同學與朋友的陪伴與幫助。我很喜歡在交大兩年的生活，認識到許多人也學習到許多事，這將會是我人生中美好記憶的一部分。最後，我很感謝我的父母親，在這兩年除了提供我不虞匱乏的生活外，也給予我努力往前衝的勇氣。感謝我姐姐的打氣及我妹妹在我趕論文時幽默逗趣的講話方式讓我能舒壓。希望大家都能健康與順心。劉俞伶謹誌于國立交通大學統計學研究所中華民國一 O 一年七月

(7)

v

目錄

中文摘要... i 英文摘要... ii 誌謝... iv 目錄... v 圖目錄... vi 表目錄... vi 第一章緒論... 1 1.1 研究動機與目的... 1 1.2 研究架構... 2 第二章文獻回顧... 3 2.1 剖面監控之文獻... 3 2.2 高階張量資料降低維度之文獻... 4 2.3 MPCA 概念簡介 ... 5 2.3.1 樣本觀點... 6 2.3.2 母體觀點... 7 2.3.3 維度之選擇... 9 第三章監控方法... 11 3.1 PCA 方法 ... 11 3.2 母體觀點演算法... 12 3.3 MPCA 方法 ... 12 3.4 ARL ... 14 3.4.1 PCA 方法的 ARL 算法 ... 14 3.4.2 MPCA 方法的 ARL 算法 ... 15 第四章模擬與比較研究... 16 4.1 範例一... 16 4.1.1X s₁( )X t₂( )為布朗橋+積分布朗運動之情況 ... 18 4.1.2X s₁( )Y t₁( )為布朗運動+積分布朗運動之情況 ... 20 4.2 範例二... 22 4.3 PCA 與 MPCA 的執行時間 ... 24 4.4 晶圓應用範例... 25 第五章結論和未來展望... 30 5.1 結論... 30 5.2 未來展望... 30 參考文獻... 31 附錄... 33

(8)

vi

圖目錄

圖一、晶圓氧化厚度在(a)管制內及在(b)管制外之二模擬剖面 ... 2 圖二、範例一之假設模型在情況(i)布朗橋+積分布朗運動下所模擬出來兩個管制內的二個維剖面... 18 圖三、範例一之假設模型在情況(i)下以(a)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線... 19 圖四、範例一之假設模型在情況(i)下以(b)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線... 19 圖五、範例一之假設模型在情況(ii)布郎運動+積分布朗運動下所模擬出來兩個管制內的二維剖面... 20 圖六、範例一之假設模型在情況(ii)下以(a)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線... 21 圖七、範例一之假設模型在情況(ii)下以(b)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線... 21 圖八、由4.2 小節之假設模型所模擬出來兩個管制內的二維剖面... 23

圖九、PCA 在k 4及MPCA 在 p 3及q3時個別的ARL 曲線，兩者完全重合... 23 圖十、PCA(解釋比例約為 85%)和 MPCA(解釋比例約為 70%)在X 和₁ X 的平均₂ 向量皆有偏移及只有X 的平均向量有偏移兩種情形的 ARL 曲線 ... 24 ₁ 圖十一、晶圓氧化的目標厚度在4.1.1 小節之情形下所模擬出來的兩個管制內的二維剖面... 27 圖十二、晶圓氧化的目標厚度在4.1.2 小節之情形下所模擬出來的兩個管制內的二維剖面... 27 圖十三、在情況(I)下之 150 筆測試資料用 PCA 方法監控的管制圖 ... 28 圖十四、在情況(I)下之 150 筆測試資料用 MPCA 方法監控的管制圖 ... 28 圖十五、在情況(II)下之 150 筆測試資料用 PCA 方法監控的管制圖 ... 29 圖十六、在情況(II)下之 150 筆測試資料用 MPCA 方法監控的管制圖 ... 29

表目錄

表一、PCA 及 MPCA 在範例一的 CPU 執行時間 (單位：秒) ... 25

(9)

1

第一章

緒論

1.1 研究動機與目的

統計製程管制被廣泛運用在很多領域，對於產品或製程上單一或多個可量測的品質特性之監控技術其研究已近乎成熟。近年來，某些產品製程所感興趣的品質特性已不再是傳統的單維或多維之變量而是一些變量間之函數。品質特性常被稱為反應變數，當反應變數為一個單維變量之函數，則在幾何上的意義是曲線。像這樣的函數在先前的文獻是以剖面 (profile) 稱之。關於監控一維剖面在第一和第二階段的研究近年來愈來愈受到重視並已有相當程度的發展。對於某些特定的製程，品質特性為二維剖面。舉例來說，在半導體薄膜製程中 (Thin Film Process) 晶圓之氧化厚度 (氧化層上研磨的厚度) 是一個重要的品質特性。此類品質特性亦稱之為反應變數，其幾何上的意義是曲面。此例之反應變數是氧化厚度，而兩個解釋變數代表晶圓上量測厚度的位置。Gardner et al. (1997) 以空間特徵 (spatial signature) 一詞來描述此二維剖面，並提出利用 thin-plate splines 方法來估計氧化厚度，且在不考慮晶圓與晶圓之間有個體差異的模型下提出監控方法。本文針對二維剖面之監控問題，在考慮剖面有個體差異性下，藉由傳統的主成分分析 (Principal Component Analysis，簡稱 PCA) 及影像處理領域上的多線性主成分分析 (Multilinear Principal Component Analysis，簡稱 MPCA) ，提出第二階段製程監控方法。圖一仿Gardner et al. (1997) 文章中的晶圓氧化厚度之例，以布朗運動 (Brownian motion) 來納入晶圓與晶圓之間的差異性，呈現兩個二維剖面；(a)圖、(b)圖分別為兩片晶圓之氧化厚度在管制內和管制外的情形，其中 (b)圖所呈現管制外的情形為晶圓由內往外研磨時，在某一圈研磨機器發生狀況而導致那一圈的厚度較厚。

(10)

2 圖一、晶圓氧化厚度在(a)管制內及在(b)管制外之二模擬剖面。

1.2 研究架構

第一章是敘述本篇論文的研究動機及目的。第二章是文獻回顧，包括回顧一維和二維剖面的研究發展，及在影像處理領域上對於高階張量資料降低維度的研究情形，最後回顧Hung et al. (2012) 對於 MPCA 概念的介紹。第三章是在考慮剖面與剖面之間具有個體差異性下，對於二維剖面提出第二階段的監控策略，並評估所提方法的執行效率。第四章列舉三個模擬範例，我們藉由前兩個範例來說明並評估在第三章中所提的方法，藉由第三個範例來陳述實際的晶圓資料應如何處理。第五章是本文的結論及未來展望。最後的附錄包括第二章中之定理二及第三章中所提的性質和定理的證明。

(11)

3

第二章

文獻回顧

本篇論文主要探討二維剖面之監控問題，在考量剖面間存在個體差異性之情形下，運用PCA 及 MPCA 提出第二階段製程監控方法。在影像處理領域方面，已有很多方法是在處理高階張量 (higher-order tensors) 資料降低維度的問題， MPCA 是其中之一。底下的文獻回顧分成三小節，2.1 小節是回顧剖面監控、2.2 小節是回顧影像處理領域中關於高階張量資料降低維度的研究發展及2.3 小節是 MPCA 概念簡介。

2.1 剖面監控之文獻

1.1 小節提到，有些產品或製程的品質特性是一些解釋變數的函數，因此，第二階段剖面監控主要是抽取製程現場樣本來確認隨著時間的推移這函數關係是否仍維持穩定。近年來，以統計觀點對於第一、二階段剖面監控的研究皆有廣泛發展。最早的研究是針對線性剖面 (linear profiles) 提出第一、二階段的監控策略。例如，Kang and Albin (2000) 提出兩種策略來監控線性剖面；Kim et al. (2003) 提出利用指數加權移動平均 (EWMA) 管制圖個別監控截距、斜率及誤差項的變異數；Zou et al. (2006) 及 Mahmoud et al. (2007) 皆利用類似的線性模型來描述線性剖面且分別提出監控理論；Saghaei (2009) 提出藉由累積和 (CUSUM) 來監控線性剖面。Zou et al. (2007) 及 Kazemzadeh et al. (2008) 考慮利用多個 (multiple) 或多項式 (polynomial) 迴歸模型來描述線性剖面。之後有些學者考慮非線性剖面。例如，Williams et al. (2007) 對於第一階段的監控統計量 2 T 提出三 種形式來估計共變異矩陣，同時亦考慮非參數迴歸模型藉以衡量新進剖面與基準剖面之間的差異。另外，Gardner et al. (1997) 以晶圓氧化厚度為例，針對二維剖面發展一套方法。首先，藉thin-plate splines 來估計實際的晶圓氧化厚度曲面；其次，找尋基準曲面 (baseline surface) 並提出四種衡量標準來量測新進的曲面與

(12)

4

基準曲面之間的差異，進而判定晶圓在研磨過程是否有狀況發生；其中四種衡量標準包括(i)2-階範數 (2-norm)、(ii)1-階範數(1-norm)、(iii)設定限制條件及(iv)對不同區域的厚度加不同的權重。以上是Gardner et al. (1997) 所提方法的概要，文中並未納入剖面間存在個體差異性之考量也未針對所提方法研究執行效能。 Shiau and Weng (2004) 以非參數迴歸來處理更一般化的剖面並提出監控策略。以上所提研究均假設固定效應之模型。Shiau et al. (2009) 將 Shiau and Weng (2004) 之非參數固定效應 (nonparametric fixed-effect) 模型推廣至剖面間有個體差異性 (亦即為隨機效應) 的情形，並運用 PCA 來獲得資料對前幾個主要的主成分個別投影的投影量 (即主成分分數 (score)) 且提出 2 T 統計量來監控之。關於剖面間 存在個體差異性之一維剖面研究亦有其他學者提出不同的監控方法。例如，Ding et al. (2006) 對第一階段製程管制提出利用獨立成分分析 (Independent

Components Analysis) 來監控剖面。Jensen et al. (2008) 及 Jensen and Birch (2009) 分別提出線性及非線性混合效應 (mixed-effect) 模型。Qiu et al. (2010) 以無母數迴歸模型提出監控策略。上述除了Gardner et al. (1997) 的文章外，其餘皆是學者針對一維剖面監控所提出的監控方法。最近幾年，有些學者對於一維剖面模型有更進一步的推廣，他們考慮一次不只一個反應變數的情形。這裡的反應變數是函數，以幾何觀點來看，學者們一次考慮多條曲線。例如，Eyvazian et al. (2011) 考慮多變數管制圖 ( multivariate control chart ) 來監控模型中的所有參數、Zou et al. (2012) 提出 LASSO-based 多變數管制圖。

2.2 高階張量資料降低維度之文獻

在資料分析上將高維度資料降低維度的方法中PCA 是常見的方法之一。其方法為：對m個變數得到n個m1之觀測向量，計算此筆資料之m m 共變異矩陣並對其做特徵根分解；目標是選擇較少的特徵向量當作新座標軸使得轉換後的新變數能夠盡可能保留原本資料的變異。然而，當資料是高階張量資料，如果將它拉成一個很長的一維向量，在運用傳統PCA 來處理則會有一些問題產生。因

(13)

5

為此情形通常參數個數會遠大於樣本個數使得大多的統計方法都不適用。克服此困難的方法是利用資料本身的張量結構。De Lathauwer et al. (2002a) 對於一個給定的 th

H 階張量提出將一般的奇異值分解 (singular value decomposition，簡稱

SVD) 推廣到高階奇異值分解 (HOSVD) ；De Lathauwer et al. (2002b) 有更進一步的研究；Yang et al. (2004) 對於影像資料提出二維度 PCA (two-dimensional PCA，簡稱 2DPCA) ；Zhang and Zhou (2005) 提出二方向二維 PCA (two- directional two-dimensional PCA，簡稱_{2D PCA) 的方法來改善 2DPCA，藉由模}2

擬顯示出2D PCA 比 2DPCA 在重建表現上較佳；Ye (2005) 制訂矩陣的一般低 2 秩 (low rank) 近似的問題，同時也提出演算法；Lu et al. (2008) 將 Ye (2005) 的問題一般化並對任意階的張量資料提出多線性主成分分析方法；Kolda and Bader (2009) 提出張量分解的一般觀點及應用；Li et al. (2010) 將張量分解方法應用於監督學習 (supervised learning) 方面之迴歸與分類上；Hung et al. (2012) 對於二

階張量的MPCA 提出一些有用的統計性質。

2.3 MPCA 概念簡介

由於二維剖面的資料型態是矩陣，因此以下所介紹之MPCA 基本概念乃針對二階張量 (two-order tensors) 資料。將隨機矩陣X_{p q}_ 視為二階張量，令E X( )_{p q}_ 及cov(vec X( )) _{pq pq}_ ，其中vec  為將矩陣向量化之算子，亦即將 X 的第二行放在第一行下面，而後第三( ) 行放在第二行下面，依此類推拉成一pq 的向量。例如令1 _{2 2} 11 12 21 22 (x x ) X x x   ，則 11 21 12 22 ( ) ( , , , )T vec X  x x x x 。MPCA 主要目的是在找尋二基底矩陣 0 0 0, 0, {A _{p p}_ ,B _{q q}_ }及座標矩陣 (coordinate matrix) 0 0 , X p q U _ 使得 ₀ ₀T X A U B



 和 X 的 差異度很小，其中p₀ 和p q₀  皆為未知，而q A 和₀ B 分別反應₀ X 行和列方向 上的資訊，並要求 0 0 0 T p A A I 及 0 0 0 T q B B I 。故在影像處理應用上可藉由

(14)

6 0 X 0T A U B



 來重建 X 。以下我們介紹

A

₀、U_X 和B₀的找法以及 p 和 q 的選擇準 則，詳情見Hung et al. (2012)。 2.3.1 樣本觀點 假設{ }n₁ i i X _ 是與 X 同分配的一組隨機樣本。在預先給定的 p 及 q 下， Ye (2005) 提出 2 1 1 { } 1 ( )

min

T F i n i i i p p q q n i A O B O U X X n  AU B       



  (1) 的準則，其中 1 1 n i i X X n _ 



， F  為矩陣的佛賓尼斯範數 (Frobenius norm) 其定義為矩陣中的每個元素平方後相加最後將總和開根號，O_{ }_為一個集合包括所有



 

的矩陣_{M }  滿足 T M M  I ，其中

 



。底下的定理一為Ye (2005) 對於式(1)的解所提出之一些有用的性質。定理一 (Ye，2005) 在預先給定的 p 及 q 下，令Aˆ_0,_{p p}_{ }、Bˆ_0,_{q q}_{ }及

{

Uˆ_i_,_{p q}_{ }_

}

n_i_₁為式 (1)的解。則 ( )a U_i Aˆ₀T(X_i X B)ˆ₀； ( )b {Aˆ₀,Bˆ₀}為 1 2 1 ( )

max

n T i _F i p p q q A O B O n  A X X B     



  的解； ( )c ˆA₀的行向量是由 0 1 ˆ 1 n ₍ ₎ ₍ ₎ T i i i B X X P X X n   



的前 p 大的特徵值所對應的特 徵向量依序排置而成， ˆB₀的行向量是由 0 1 ˆ 1 n ₍ ₎ ₍ ₎ T i i i A X X P X X n   



的前 q 大的 特徵值所對應的特徵向量依序排置而成，其中 0 1 0 0 0 0 ˆ ˆ ˆ ˆ( T ) ˆT A P A A A  A 為一正交投影矩陣，正交投影到span A( )ˆ₀ 空間上， 0 1 0 0 0 0 ˆ ˆ ˆ ˆ( T ) ˆT B P B B B  B 為正交投影矩陣，正交

(15)

7 投影到span B( )ˆ0 空間上。下面是Ye (2005) 所提計算{ , }A Bˆ ˆ0 0 的演算法，其將之稱為GLRAM 演算法。 GLRAM (Ye，2005) 給定一隨機初始值 (0) p p A O __ ，對於N 0,1,2,... 步驟一： (N 1) B  為 2 ( ) 1 1 max N T( ) i F n B O _{q q}___n



_i_ A X X B 的解。步驟二： (N 1) A  為 2 ( 1) 1 1 max T( ) N F n i O_{p p} _i A _n A X X B   __



_  的解。步驟三：重複步驟一及步驟二，直到 2 ( ) ( ) 1 1 ( ) N T N F n i i A X X B n  



和 2 ( 1) ( 1) 1 1 ( ) N T N F n i i A X X B n    



之間沒有顯著差異，即可令 ˆ0 ( 1) N A  A  及 ˆ0 ( 1) N B



B  。

在Hung et al. (2012) 的文章提到，GLRAM 演算法確保當

N

遞增時

2 ( ) ( ) 1 1 ( ) N T N F n i i A X X B n



_  會單調遞增 (指的是不嚴格遞增) ，並且 2 1 1 F n i i X X n  



是其上界，故此演算法必會收斂。但GLRAM 演算法有可能只找到局部最大值，這和所選擇的隨機初始值A(0)有關。Ye (2005) 提出重複選擇隨機初始值 (0) A 來確保得到整體最大值。相對的，Hung et al. (2012) 提出利用 1 ( ) 1 ( ) T n i i i X X X X n   



的 前 p 大的特徵值所對應的特徵向量來當作隨機初始值A 。因此，藉由定理一及(0) GLRAM 演算法就可獲得{ ,A Bˆ ˆ₀ ₀}及{ }Uˆ_i n_i_₁。 2.3.2 母體觀點 相對於定理一之樣本觀點，我們有如下之母體觀點。 在預先給定的 p 及 q 下，將式(1)修改為 2 min ( ) T p p q q A O F B O U E X  AUB         。 (2) 定理二 在預先給定的 p 及 q 下，令A_0,_{p p}_{ }、B_0,_{q q}_{ }及U_0,_{p q}_{ }_ 為式(2)的解。則

(16)

8 (

a



)_{Prob U}( ₀ _A₀T(_X 



) )_B₀ 1_； (

b



){ , }A B ₀ ₀ 為 max T( ) 2 F p p q q A O B O E A X



B        的解； (

c



)A₀的行向量是由 0 [( ) ( )T] B E X 



P_ X 



的前 p 大的特徵值所對應的特徵向 量依序排置而成，B 的行向量由₀ 0 [( )T ( )] A E X 



P_ X 



的前 q 大的特徵值所對 應的特徵向量依序排置而成，其中 0 1 0( 0T 0) 0T A P_ A A A    A 及 0 1 0( 0T 0) 0T B P_ B B B    B 。將A₀及B 表示成₀ A₀



(

a a₁, ,...,₂ a_p_)及B₀



(

b b₁, ,...,₂ b_q_)，其中a 及_i b 分別_i 為A0及B 的第0 i個行向量。因 1 1 0 [( ) ( ) ]T [( )( T)( ) ]T ( )T ( ) j j j p j p j j B q q E X  P X  E X  X  I I    _  



 b b  



b   b    及 1 1 0 [( )T ( )] [( ) (T T)( )] ( )T ( ) i i q i q i i i A p p E X  P X  E X  X  I I    _  



 a a  



a  a   ，

其中為克羅內克積 (Kronecker product) 。因此A₀包括

1 ( )T ( ) j p j p j q I I    



b b  的前 p 大的特徵值所對應的特徵向量；B 包括₀ 1 ( )T ( ) q i q i i p I I    



a a  的前 q 大的 特徵值所對應的特徵向量。附錄中有我們對上面兩式詳細的推導過程。另外，由定理二性質( )b 進一步可推得 max T( ) 2 max {( )T ( )} F p p p p q q A O A O B O _{B Oq q} trace B A B A E A X



B       _{ }          。 (3) 以上是Hung et al. (2012) 針對定理二中的性質 ( )b 及 ( )c 所做之進一步推 導。文中並提出下列之性質一，但並未對定理二中之性質( ) ( )a  c 提出證明，其證明請見附錄。性質一 ( Hung et al.，2012 ) 對任一大小為 pq pq 之半正定矩陣，式(3)右式

(17)

9 之最大解會存在。

在Hung et al. (2012) 文章中提到，由性質一可知 max T( ) 2

F p p q q A O B O E A X



B        的

解會存在，進而得到式(2)的解亦會存在。至於求算A₀和B 的演算法，Hung et al. ₀

(2012) 並未提到，我們仿照 GLRAM 演算法提出母體觀點演算法來求算A₀和B₀

並敘述在第三章中。

2.3.3 維度之選擇

Hung et al. (2012) 利用 PCA 的觀念，提出藉由解釋變異來決定 p 及 q 。首 先定義累積變異 (cumulative variance) ，其用來量度張量資料投影到 MPCA 子空間上所能解釋的變異。定義一 (Hung et al.，2012) 令{ , }A B ₀ ₀ 為式(3)的一組解， 2 0 0 ( , ) T( ) F p q E A X  B  _{ }     _{為 X 在秩(}_rank₎_{  }_{( , )}_{p q} _{內的累積變異，及} ( , )p q ( , )p q ( , )p q         為 X 的總變異在秩  ( , )p q 內被解釋的比例，其中 2 ( , )p q E X  _F    為 X 的總變異。對於樣本亦有類似的定義： 2 0 0 1 1 _ˆ _ˆ ˆ ( , ) T( ) F i i n p q A X X B n _    



 、 2 1 1 ˆ ( , ) F n i i p q X X n _  



 及 ˆ ˆ ˆ( , )p q ( , )p q ( , )p q         。令



₁



_p_ 0及



₁



_q_ 0分別為 0 [( ) ( ) ]T B E X  P_ X  的前 p 大 及 0 [( )T ( )] A E X  P_ X 的前 q 大的特徵值，那麼可得 1 1 ( , ) _i _j i j p q p q



      



 



 。同樣地令



ˆ₁



ˆ_p_ 0及ˆ₁



ˆ_q_ 0分別為 0 1 ˆ 1 ( ) ( )T n i i i B X X P X X n   



的前 p 大的及 0 1 ˆ 1 ( )T ( ) i n i i A X X P X X n



_   的前 q 大的特徵值，亦可得

(18)

10 1 1 ˆ ˆ ( , ) ˆ i j i j p q p q



      



 



 ，推導過程見附錄。另外，因( , )p q   ( , )p q ，進而得 ( , ) 1p q     ；而對於樣本觀點亦有類似情形。因此可由( , )p q  達到預定的解釋比例₀(0,1)來決定 p 及 q ，而此部分在 Hung et al. (2012 ) 的文章中則以假設檢 定來呈現。

(19)

11

第三章

監控方法

本研究將一維剖面之監控方法推廣到二維剖面上，並考慮二維剖面間具有個體差異性，藉由PCA 及 MPCA 提出第二階段的監控策略。假設二維剖面資料模型是Y_ij Z s t( , )_i _j 



_ij ,i1,..., ,p j 1,...,q， p 和 q 為正整數且_ijiidN(0,2)。我們可知二維剖面的資料型態是矩陣且矩陣元素為Z s t( , )_i _j 



_ij。

3.1 PCA 方法

先將新進的二維剖面資料矩陣Y_{p q}_ 中心化，這邊的中心化是指Y 減掉藉由經驗或第一階段而得的平均矩陣。再藉由thin-plate splines 方法將其平滑化以去除噪音之干擾，所得的矩陣以符號X_{p q}_ 表之。假設在利用thin-plate splines 平滑化 時每個剖面所使用之平滑參數都一樣，那麼每個第二階段之 X 仍彼此獨立且具 相同分配。在第二階段製程監控的研究中，假設在管制內的vec X( )其結合分配服從N_pq( ,0 _X)。首先，我們先對_X做特徵根分解得到



₁



₂ 



_pq 0及所對應的特徵向量

v v

₁

, ,...,

₂

v

_pq。可知第r個主成分就是第r大的特徵根_r所對應的特徵向量

v

_r。接下來，我們需決定要保留多少個主成分，以符號k代表此量。最常見的方法是利用由這些主成分所解釋的變異在原本資料總變異上所占的比例 (亦即 1 1 pq k i i i i    



) 是否達到預定的合適值來決定k，其中krank(_X)。將每個新進的vec X( )對k個主成分v₁, ,...,v₂ vk個別投影得到s s1, ,...,2 s ，亦即k ( ), 1,..., r r s v vec X r k。因v₁, ,...,v₂ v_k彼此間獨立且對於在管制內的vec X( ) 而言其結合分配服從N_pq( ,0 _X)，因此s_r彼此間獨立且服從N(0, )



_r ,r1,...,k。那麼我們可以考慮藉由監控統計量

(20)

12 2 2 1 k i pca i i s T   



(4) 來建構T 管制圖。當製程在管制內時，此統計量服從自由度為2 k之卡方分配。接下來我們將利用MPCA 建構出第二階段的監控方法。在這之前，我們仿 GLRAM 演算法提出母體觀點演算法來求得A₀及B 。 ₀

3.2 母體觀點演算法

母體觀點演算法給定一個隨機初始值

A

(0)



O

_{p p}__，對於N 0,1,2,... 步驟一： (N 1) B  為 max ( )N T( ) 2 F B O _{q q}__

E

A X 



B 的解。步驟二： (N 1) A  為 max T( ) (N 1) 2 F O_{p p} A E A X



B   __  的解。步驟三：重複步驟一及步驟二，直到 ( )N T( ) ( )N 2 F E A X B 和 2 ( 1) ( 1) ( ) N T N F E A  X  B  之間沒有顯著差異，即可令A₀ A(N1)及B₀ B(N1)。類似於樣本觀點，上述的母體觀點演算法確保當N遞增時 2 ( ) ₍ ₎ ( ) F N T N E A X  B 會單調遞增 (指的是不嚴格遞增) ，又由附錄內定理二性質( )b 的證明中之式(A1)可知E X  2_F為 ( ) ( ) ( ) 2 F N T N E A X  B 的上界，故此演算法會收斂。在隨機初始值的選擇上可藉由 [( )( ) ]T E X  X  的前 p 大的特徵 值所對應的特徵向量來當作隨機初始值

A

(0)。因此藉由上述的母體觀點演算法及定理二即可得到{ , }A B 0 0 及U 。 0

3.3 MPCA 方法

以下我們分成製程參數已知和未知兩種情況來討論。第一種情況：參數已知

(21)

13 先將新進的二維剖面資料矩陣Y_{p q}_ 中心化，如有必要再藉由thin-plate splines 方法將其平滑化以去除噪音之干擾，所得矩陣以符號X_{p q}_ 表之。在第二階段製程監控的研究中，假設在管制內的X 其E X( ) 0 _{p q}_ 及cov(vec X( ))Xpq pq ，其中 為已知。在預先給定的 p 及 q 下，將_X _X套用母體觀點演算法得到A_0,_{p p}_{ } 及B_0,_{q q}_{ }。由定理二性質( )a 可知，每個矩陣X 皆可得到相對應之 0, 0, , T X p q p p p q q q U  _  A _ X _ B _。性質二假設X 在管制內，且vec X( )N_pq(0_pq_₁,_X_{pq pq}_ )，則 1 (U_X) _pq( _pq ,T_{pq pq})

vec N_{ } 0_{ }_ _{   }_ ，其中T cov(vec U( _X))。

性質二的證明請見附錄。令rank T( _{pq pq}_{   }_ )k₁ ，亦即矩陣T 的秩。將T 正交 對角化使得 T T GDG ，其中G是單範正交矩陣 (orthonormal matrix) 及 D 是對 角矩陣其對角元素是T 的特徵值。令 1 * * * 1 k pq

0

     為T 的特徵值。因 1 (UX) pq( pq ,Tpq pq) vec N_{ } 0_{ }_ _{   }_ 且 T pq pq pq pq pq pq pq pq D_{   }_ G_{       }_ T _ G_{   }_ ，則 1 ( ) ( , ) T X pq pq pq pq vec U N G



  0 _ D   _ 。令 ( ) ( , ,1* *₁, , * ) T T X k pq G vec U  s  s  s_{ } ，明顯地， *id _(0, *_), _{1, ,} i N i i pq

s

     。特別注意第k 個以後的特徵值是等於 0，因此下面的統₁ 計量只考慮前k 個。類似於 PCA 我們可以藉由監控統計量 ₁ 1 2 2 * * 1 i mpca i k i

s

T

_





(5) 來建構T 管制圖。當製程在管制內時，此統計量服從自由度為2 k 之卡方分配。 ₁ 第二種情況：參數未知假設vec X 的共變異矩陣( ) _X未知，則可藉由第一階段製程管制獲得一組管制內且已中心化及平滑化的二維剖面資料，並藉由這組資料獲得樣本共變異矩陣

(22)

14 ˆ X  。在預先給定的 p 及 q 下，將這組管制內的資料藉由 GLRAM 演算法獲得 0, ˆ p p A _{ }及Bˆ_0,_{q q}_{ }分別用來估計A₀及B₀。接下來，套用第一種情況所敘述的方法來監控新進的二維剖面資料。

當PCA 及 MPCA 的解釋比例皆為 100%時，則 PCA 和 MPCA 兩個監控統

計量會相等。定理三描述PCA 和 MPCA 在何種情形下解釋比例皆為 100%。定理三 假設對於特定的p 及0 q ，0 0 0 T X X  A U B ，並假設式(4)中主成分個數 ( X) krank  。那麼當p  p₀和qq₀時，則式(5)會等於式(4)。定理三之證明請見附錄。在母體觀點下，定理三的p  p₀和qq₀表示 0 0 A A 及B₀ B₀。明顯地，當p₀ p且q₀ q時，對任何例子而言，定理三中的A 及₀ B 一定存在。不過，當₀ p₀ p且q₀ q時，在某些情況下，定理三中的A₀ 及B 仍會存在。當定理三成立時，對於 PCA 而言，₀ krank(_X)表示第k個以後的特徵值皆為0，因此前k個特徵值的總和會等於資料總變異，亦即PCA 的解釋比例為100%。對於 MPCA 而言，重建結果等於原本，表示A₀及B 皆分別抓₀ 到行及列方向上的所有資訊，亦即MPCA 的解釋比例為 100% (亦可由 2.3.3 中的 ( , )p q    公式及附錄定理二性質 ( )b 證明中之式(A1)獲得)。在第四章的範例二我

們將呈現PCA 和 MPCA 有相同的平均連串長度 (Average Run Length ，簡稱 ARL ) 曲線來反應定理三之情形。

3.4 ARL

我們藉由ARL 來評估與比較 PCA 及 MPCA 兩方法的偵測能力。

3.4.1 PCA 方法的 ARL 算法

(23)

15 p q X _ ，假設vec X( )N_pq(0_pq_₁δ_pq_₁,_{X pq pq}_ )。那麼式(4)的統計量T_pca2 會服從自由度為k及非中心參數為 ( *T )T *1( *T ) c DP  _{ } _δ  _ _{δ 之非中心卡方分配}_(noncentral chi-square distribution) ，其中  v v*



₁, ,...,₂ v 及_k



D 為對角矩陣其元素為_P* 1 2 k

 

 



，則T 管制圖的偵測力可藉由2 P T( _pca2 _k2_,_)P(



_k2( )_c _k2_,_) 獲得，其中 是中心卡方分配 (chi-square distribution) _k2_,_



_k2 的(1) 100% 百分位數。 3.4.2 MPCA 方法的 ARL 算法 算法和3.4.1 一樣，只不過 ₍₍₍ ₀ ₀₎ *₎T ₎T * 1₍₍₍ ₀ ₀₎ *₎T ₎ c B A G D B A G



_ _ _ _ _δ  _ _ _ _δ _，其中D 為對角矩陣其元素為* 1 1* k*







及G*為由G的前k 個行向量依序排置₁ 而成之矩陣。

(24)

16

第四章

模擬與比較研究

在本章中，我們藉由範例一及範例二來比較PCA 和 MPCA 兩方法之間的偵

測能力及執行時間，並呈現在某種特殊情況下PCA 和 MPCA 兩方法之間的關

係。值得一提的是我們所提出的方法皆假設vec X 服從多元常態分配，而我們( )

知道如果一個隨機過程 (stochastic process) 是一個高斯過程 (Gaussian

process) ，則任意有限個時間點的結合分配會服從多元常態分配。故而底下的範例其模型皆採用高斯過程。

4.1 範例一

此例我們考慮布朗運動 (Brownian motion) 及它的變化型式來模擬二維剖面

資料，底下對布朗運動及它的變化型式做簡單介紹。

(a) 布朗運動過程 (Brownian motion process)：一個隨機過程[ ( ),B t t 是一個0]

布朗運動如果(i) (0) 0B  ；(ii)[ ( ),B t t 具有穩定獨立遞增 (stationary 0]

independent increments) 之性質；(iii)對於t0而言，B t( )N(0,2t)，其中 是大於0 的常數。布朗運動，又稱為維納過程 (Wiener process)，是一個高斯過程，具有E B t( ( )) 0 及cov( ( ), ( ))B t₁ B t₂ 2t t_{1 1},  。 t₂

(b) 布朗橋 (Brownian bridge)：如果[ ( ),B t t 是一個布朗運動，則 0]

[ ( ),0B t  t 1| (1) 0]B  稱為布朗橋。它亦是一個高斯過程，具有

( ( ) | (1) 0) 0,E B t B   t 及1 cov( ( ), ( ) | (1) 0)B t₁ B t₂ B  



2t₁(1t₂),t₁ t₂ 1。

(c) 積分布朗運動 (integrated Brownian Motion)：如果[ ( ),B t t 是一個 0]

布朗運動，則定義 0 ( ) t ( ) IB t 



B s ds，稱{ ( ),IB t t 為積分布朗運動。它亦是 0} 一個高斯過程，具有 ( ( )) 0E IB t  及cov( ( ),₁ ( ))₂ 2 2₁( 2 1), ₁ ₂ 2 6 t t IB t IB t  t  t  。 t 假設此例的模型為Yij Z s t( , )i j ij,i1,...,30,j1,..., 29，其中

(25)

17 1 2 ( , )i j ( )i ( ), ,j Z s t  X s X t i j，且X s 及₁( ) X t 皆屬於上述(a),(b),(c)三種高斯過₂( ) 程的其中一種，照理應有八種情況，底下只呈現(i)布朗橋+積分布朗運動和(ii)布朗運動+積分布朗運動兩種情況。值得一提的是，我們只知道X s 及₁( ) X t 個別₂( ) 的平均向量和共變異矩陣，因此對它們做特徵根分解分別得到特徵值 (1) (1) 1 30 0    和₁(2)₂₉(2)0及個別所對應的特徵向量v₁(1), , v₃₀(1)和 (2) (2) 1 , , 29 v  v 。讓K 和₁ K 分別代表₂ X 和₁ X 的特徵值非零的主成分個數。則可藉由₂ 1 (1) (1) 1 1 1 30 1 ( ( ), , ( ))T K i i i X s X s c  



v  及 ₂ ₁ ₂ ₂₉ 2 (2) (2) 1 ( ( ), , ( ))T K i i i X t X t c  



v  分別建構 1( ),i 1, ,30 X s i  和X t₂( ),_j j 1, , 29，進而建構Z s t( , ), ,_i _j i j，其中 (1) (1) 1 (0, ), 1, , i i c



N  i  K 及c_i(2)



N(0,_i(2)),i 1, ,K₂。我們將考慮下列兩種偏移方式： (a) 1 (1) (1) 1 1 1 30 1 ( ( ), , ( ))T K i i i X s X s c  



v  且c_i(1)



N(0  _i(1), _i(1)),i 1, ,K₁及 2 (2) (2) 2 1 2 29 1 ( ( ), , ( ))T K i i i X t X t c  



v  且c_i(2)



N(0 _i(2),_i(2)),i 1, ,K₂。 (b) 平均矩陣平移一個常數c，亦即垂直平移。 套用第三章的方法，先將Y 中心化後再去除噪音之干擾所得的矩陣 X 其元素 應相當靠近Z s t( , ), ,i j i j，再藉由3.1 及 3.3 小節的方法來監控 X 。我們用 ARL 曲線來比較PCA 和 MPCA 兩方法；但因二者無法有完全相同的解釋比例，我們只能擇相差不大的情形來比較，例如在4.1.1 小節中所選擇三種水準之一的 90%

其PCA 的解釋比例為 90.86%而 MPCA 為 89.92%；對 MPCA，我們所選擇的解

釋比例皆略低於PCA。另外，我們想了解不同的解釋比例是否會影響偵測力，

於是我們將這三種水準放在同一張圖上。以符號ARL 來表示在管制內的 ARL，₀

(26)

18

4.1.1X s₁( )X t₂( )為布朗橋+積分布朗運動之情況

圖二呈現藉由此例之模型且X s 為布朗橋及₁( ) X t 為積分布朗運動所模擬₂( )

出來的兩個管制內之二維剖面。對於此例我們選擇的解釋比例為90%、95%及

99%三種水準，在此設c0(0.0075)0.15、 0(0.15)1.65，且s及t的值皆為0 和 1 之間的等分值。圖三及圖四以 ARL 曲線呈現 PCA 和 MPCA 兩方法分別對於平均矩陣在(a)和(b)兩方式偏移下的偵測能力。我們首先觀察到 PCA 及 MPCA 對大

部分的解釋比例而言皆有解釋比例越高所對應的ARL 會越低的情形。圖三是平

均矩陣以(a)方式偏移，觀察到對於每個解釋比例而言，MPCA 的偵測力均比 PCA 佳；而綜觀三個水準來看，則是一對接在一對後面交錯呈現。因此對於平均矩陣以(a)方式偏移時，MPCA 表現比 PCA 來得好。圖四是平均矩陣以(b)方式垂直平移，MPCA 表現比(a)方式更佳，由圖四觀察到 MPCA 幾乎所有的 ARL 曲線皆在 PCA 的 ARL 曲線下方。

圖二、範例一之假設模型在情況(i)布朗橋+積分布朗運動下所模擬出來兩個管制內的二個維剖面。

(27)

19

圖三、範例一之假設模型在情況(i)下以(a)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線。

圖四、範例一之假設模型在情況(i)下以(b)方式偏移時，PCA 及 MPCA 兩方法的ARL 曲線。

(28)

20 4.1.2X s₁( )Y t₁( )為布朗運動+積分布朗運動之情況 針對此情形，我們所選擇的解釋比例及s和t之設法仍相同，但c0(0.015)0.3 及 0(0.15)1.95。圖五、圖六及圖七依序呈現此例模型在X s 為布朗運動且₁( ) 2( ) X t 為積分布朗運動情況下所模擬出來兩個管制內的二維剖面及 PCA 和

MPCA 兩方法對於平均矩陣以(a)及(b)兩方式偏移時的 ARL 曲線。由圖六觀察到，PCA 及 MPCA 兩方法以(a)方式偏移所獲得的 ARL 曲線之間的關係和圖三很類似。從圖七觀察到對每個解釋比例而言，MPCA 的偵測能力仍皆比 PCA 來

得好。不過在此例MPCA 和 PCA 之 ARL 曲線就交錯出現，並非如圖四所呈現

MPCA 之 ARL 曲線幾乎皆在 PCA 的下方。

圖五、範例一之假設模型在情況(ii)布郎運動+積分布朗運動下所模擬出來兩個管制內的二維剖面。

(29)

21

圖六、範例一之假設模型在情況(ii)下以(a)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線。

圖七、範例一之假設模型在情況(ii)下以(b)方式偏移時，PCA 及 MPCA 兩方法的 ARL 曲線。

(30)

22

4.2 範例二

我們採用和範例一相同做法，也利用X s₁( )i X t₂( )j 來建構二維剖面資料 , ( i j), , Z s t i j。假設模型為Yij Z s t( , )i j ij,i1,..., 20, j1,..., 20，其中 1 2 ( , )i j ( )i ( ), ,j Z s t  X s X t i j而X s₁( )Z₁cos₁sZ₂sin₁s且假設 2 1, 2

~

(0, 1) iid

Z Z N  ，同樣地X t₂( )Z₃cos₂tZ₄sin₂t且Z Z₃, ₄iid

~

N(0,₂2)。在此

假設Z₁、Z₂、Z 和₃ Z 彼此間獨立。那麼我們可以很容易獲得₄ _Z( , ) 0s t  及

2 2

1 1 2 2 1 1 2 1 2 2 2 1

cov( ( , ), ( , ))Z s t Z s t  cos ( s s) cos (t  。對於參數設定，令t )

1 0.2, 2 0.5     、₁ 2,₂  以及3 s0(2 /(2 19))  和 2 3 =0(2 /(3 19)) t    。圖八呈現藉由此例的模型所模擬出來的兩個管制內之二維剖面。接下來套用3.1 及 3.3 小節的方法來監控這樣的二維剖面。在 MPCA 方法中我們是採用母體觀點以及製程參數已知的情況。對於此例的偏移是藉由Z Z₁, ₂iid~ (0N 

 

₁, ₁2)及 2 3, 4~ (0 2, 2) iid Z Z N 

 

來設定，其中 0(0.25)3。明顯地我們可發現到，像這樣的二維剖面，其rank(_X) 4 。對於 PCA，讓krank(_X) 4 ，而對於 MPCA，

讓p 3及q3，則發現 X 的重建剛好等於原本的 X ，並發現k₁  ，進而4 k

發現PCA 和 MPCA 的 ARL 相同並呈現在圖九，且在此情況 PCA 和 MPCA 的解釋比例皆為100%。因此，此情況驗證了定理三。圖十所呈現之 PCA 取k 3 (解

釋比例約為85%) 而 MPCA 取p 3及q2 (解釋比例約為 70%) 。在X 和₁ X₂

的平均向量皆有偏移及X 的平均向量有偏移而₁ X 的平均向量沒有偏移兩種情₂

形下，計算PCA 及 MPCA 的 ARL 曲線。由圖十可發現，當只有X 的平均向量₁

偏移時，MPCA 的偵測力明顯較 PCA 好。此可能是因為 X 在p 3及q3時可

完全百分百地被重建，意味著p 3就能夠反應行方向上所有的資訊；而現在的

(31)

23 反應此變化。對於X 和₁ X 的平均向量皆有偏移的情形，MPCA 的偵測力雖略比₂ PCA 來得好但相較於只有X 平均向量有偏移的情形，二者相差有限。我們猜測₁ 此乃因PCA 的解釋比例已達 85%表示已具有大多的資訊，而 MPCA 的解釋比例只有70%，且由上述可知行方向上的資訊已夠，進而表示列方向上的資訊還不足。圖八、由 4.2 小節之假設模型所模擬出來兩個管制內的二維剖面。

圖九、PCA 在k 4及MPCA 在p 3及q 3時個別的ARL 曲線，兩者完全重合。

(32)

24 圖十、PCA (解釋比例約為 85%) 和 MPCA (解釋比例約為 70%) 在X 和 ₁ 2 X 的平均向量皆有偏移及只有X 的平均向量有偏移兩種情形的 ARL ₁ 曲線。

4.3 PCA 與 MPCA 的執行時間

在進行製程監控前，對 PCA 而言，需先對 做特徵根分解，以得到它的特X 徵值及特徵向量；對於MPCA 而言，在母體觀點下需先獲得矩陣 A、B、T 及G。底下的執行時間是使用R 程式在硬體設備 Intel Q8300 處理器 2.5 GHz 且高速快取記憶體 (Cashe RAM) 容量為 2G 之下所需之 CPU 執行時間。當 p 及 q 增大時，PCA 在進行特徵根分解時需花較多時間，且當p q 80時，會有記憶體

(memory space) 容量不足而沒辦法進行分解的情形。至於純粹的第二階段線上監控，PCA 及 MPCA 的計算時間則差不多。在不同的維度 p 和 q 下，表一及表二

(33)

25 包括在監控前需獲得參數的時間。由表一及表二我們觀察到，PCA 在此二範例的執行時間類似；反觀MPCA 在兩範例的執行時間有明顯差異。我們發現此乃因範例一之疊代演算收斂較久並且利用2D2PCA 求算初始值時也耗費較多時間，因為此範例需利用到判斷式故需多花一些時間。總而言之，對於執行時間而 言，除了維度 p 和 q 很小的幾個情形外，MPCA 在計算速度上優於 PCA；而對 於記憶量而言，PCA 在做特徵分解時所需的記憶量遠大於 MPCA 所需。

表一、PCA 及 MPCA 在範例一的 CPU 執行時間 (單位：秒)

, 20

p q p q, 30 p q, 40 p q, 50 p q, 60 p q, 70 p q, 80

PCA 0.36 2.03 10.02 35.92 105.93 275.69 ---- MPCA 2.14 4.02 10.99 27.94 67.05 209.53 404.54

表二、PCA 及 MPCA 在範例二的 CPU 執行時間 (單位：秒)

, 20 p q p q, 30 p q, 40 p q, 50 p q, 60 p q, 70 p q, 80 PCA 0.42 2.06 12.58 35.95 104.3 258.13 ---- MPCA 1.30 1.87 3.30 6.83 13.80 37.67 73.11

4.4 晶圓應用範例

藉由模擬方式來模擬晶圓氧化厚度，首先利用球方程式生成一個30 29 的矩陣來模擬晶圓氧化目標厚度，以符號T 表之，再藉由範例一之模型來納入晶圓與₀ 晶圓之間的變異，最後加上量測誤差 而得Y_{30 29}_ ，其模型為Y_ij T₀_ijZ s t( , )_i _j _ij ,i1, ,30, j1, , 29 。因晶圓為圓形，我們將矩陣Y 所對應之晶圓缺值部分的 數值改為0。圖十一及圖十二分別呈現此模型在 4.1.1 和 4.1.2 小節所述之兩種情況下並藉由將部分值改為0 的方法所模擬出來兩個管制內的二維剖面。對於製程

(34)

26 監控，我們考慮兩種情況(I)藉由上述模型模擬出方形資料Y 及(II)將(I)所得的方 形資料Y 內所對應之晶圓缺值部分的數值改為 0，此種情況較貼近實際的晶圓資 料。對於情況(II)而言，因有些部分的數值是 0，所以無法經由推導求得在母體觀點中所需用到的 ；因此，我們採用樣本觀點進行製程監控之模擬。 _X 模擬T 及Y 的作法： ₀ 假設在管制內的晶圓氧化厚度為在4 6 奈米內，且假設晶圓氧化目標厚度是在4.5 5.2 奈米內。令下面式(6)的R=171.9571、s和t的值皆為0 和 1 之間的等分值及由式(6)所得到的值中最小的值為T_min， 2 ₍₂₉₍ _0.5))2 ₍₂₈₍ _0.5))2 i j R s t      (6) 其中i1, ,30, j1, , 29 。藉由將式(6)所有值減掉T_min再加上4.5 後所得到的值來當作T_0,_ij, , 。利用 4.1.1 小節的情況來模擬 ( , ), ,i j Z s t_i _j  ，則藉由模型可得i j Y 。 在情況(I)及情況(II)下監控Y 的作法： 在情況(I)下，藉由上述生成一組 300 筆Y ；將這組資料一一中心化及平滑化而得300 筆在管制內的 X ；而情況(II)則將在情況(I)下所得的 300 筆管制內的 X 中之晶圓缺值部分的數值改為0 來當作管制內的一組晶圓資料。對於 PCA 和

MPCA 兩方法的解釋比例無論情況(I)或(II)皆設定約為 96%。在 PCA 方面，情況 (I)和(II)分別藉由各自的 300 筆管制內資料來求得 ˆ(I) X  和ˆ 及(I) ˆ(II) X  和ˆ 。在(II) MPCA 方面，為了使解釋比例均在 96%附近，對於情況(I)採用p 11和q10而情況(II)採用p 12和q 12，並分別將各自的300 筆管制內資料套用樣本觀點的 GLRAM 演算法來求得 (I) 0

ˆA 、 ˆB₀(I)、Tˆ₀(I)和Gˆ₀(I)及 ˆA₀(II)、 ˆB₀(II)、Tˆ₀(II)和Gˆ₀(II)。

接下來先針對情況(I)模擬三組資料，分別為管制內及在 4.1 小節提及的兩種

偏移方式，每組資料皆有50 筆，其中兩偏移方式所需的參數設為 1.5和

0.0375

(35)

27 而得的150 筆資料。圖十三和圖十四及圖十五和圖十六分別為在情況(I)及情況(II) 下藉由PCA 和 MPCA 方法來監控兩情況各自的 150 筆資料的管制圖。由圖十三和圖十五其最右方發現，無論情況(I)或(II)，PCA 對平均矩陣以垂直方式偏移之偵測力很差。由圖十四和圖十六發現雖然情況(II)沒符合監控方法的前提假設，但對於以(a)或(b)方式偏移的偵測力和情況(I)相似。圖十一、晶圓氧化的目標厚度在 4.1.1 小節之情形下所模擬出來的兩個管制內的二維剖面。圖十二、晶圓氧化的目標厚度在4.1.2 小節之情形下所模擬出來的兩個管制內的二維剖面。

(36)

28

圖十三、在情況(I)下之 150 筆測試資料用 PCA 方法監控的管制圖。

圖十四、在情況(I)下之 150 筆測試資料用 MPCA 方法監控的管制圖。

(37)

29

圖十五、在情況(II)下之 150 筆測試資料用 PCA 方法監控的管制圖。

(38)

30

第五章

結論和未來展望

5.1 結論

在先前的文獻中，較少關於二維剖面監控之研究，Gardner et al. (1997) 對於空間特徵提出如何建構這樣的曲面，並在不考慮晶圓與晶圓之間具有個體差異性下，利用四個衡量標準來量測新進資料和基準曲面之間的差距，進而偵測研磨過程中哪邊出狀況。本篇文章主要探究在剖面與剖面之間存在個體差異性下二維剖面之監控，並運用PCA 及 MPCA 提出第二階段的監控策略。對於偵測能力，我

們利用平均連串長度ARL 來評估 MPCA 及 PCA 兩方法的績效，大體上 MPCA

方法較PCA 方法來得好。MPCA 的兩個基底矩陣分別抓取行方向及列方向上的資訊，因此當新進的二維剖面資料若只有在行或列方向上有變化且MPCA 的基底矩陣能抓取所有行方向或列方向上的資訊時，則能較快偵測出平均矩陣已發生變化。而在建構正交基底時，PCA 所需的參數會較 MPCA 來得多，此極可能就是MPCA 優於 PCA 的緣故。對於執行時間方面，當p及q皆很大時，將二維剖面拉成一維向量其共變異矩陣之維度會很大，使得R 程式在對其做特徵根分解時需要較多計算時間；反之MPCA 需特徵分解的共變異矩陣的維度已變小，則所需的計算時間會較少。因此相較二者我們比較建議使用MPCA 來執行第二階段的製程監控。

5.2 未來展望

本篇文章只針對第二階段提出二維剖面監控策略，並沒有探討第一階段二維剖面的監控，未來可探究第一階段的監控。在第四章中，我們藉由X s₁( )X t₂( ) 來建構Z s t 這或許太簡單化，未來可考慮較實際或較複雜的 ( , )( , ) Z s t 。

(39)

31

參考文獻

[1] De Lathauwer, L., De Moor, B., and Vandewalle, J. (2000a), “A Multilinear Singular Value Decomposition,” SIAM Journal on Matrix Analysis and

Applications, 21, pp. 1253–1278.

[2] De Lathauwer, L., De Moor, B., and Vandewalle, J. (2000b), “ On the Best Rank-1 and Rank-(R1,R2, . . . ,RN) Approximation of Higher-Order Tensors,”

SIAM Journal on Matrix Analysis and Applications, 21, pp. 1324–1342.

[3] Ding, Y., Zeng, L., and Zhou, S. (2006), “Phase I Analysis for Monitoring Nonlinear Profiles in Manufacturing Processes,” Journal of Quality Technology, 38, pp. 199–216.

[4] Eyvazian, M., Noorossan, R., Saghaei, A., and Amiri, A. (2011), “Phase II Monitoring of Multivariate Multiple Linear Regression Profiles,” Quality and

Reliability Engineering International, 27, pp. 281–296.

[5] Gardner, M. M., Lu, J. C., Gyurcsik, R. S., Wortman, J. J., Hornung, B. E., Heinisch, H. H., Rying, E. A., Rao, S., Davis, J. C., and Mozumder, P. K. (1997),“ Equipment Fault Detection Using Spatial Signatures,” IEEE

Transactions on Components Packaging and Manufacturing Technology, 20, pp.

295–303.

[6] Hung, H., Wu, P. S., Tu, I. P., and Huang, S. Y. (2012), “On Multilinear Principal Component Analysis of Order-Two Tensors,” Biometrika, pp. 1–15.

[7] Jensen, W. A. and Birch, J. B. (2009), “Profile Monitoring via Nonlinear Mixed Models,” Journal of Quality Technology, 41, pp. 18–34.

[8] Jensen, W. A., Birch, J. B., and Woodall, W. H. (2008), “Monitoring Correlation Within Linear Profiles Using Mixed Models,” Journal of Quality Technology, 40, pp.167–183.

[9] Kang, L. and Albin, S. L. (2000), “On-Line Monitoring When the Process Yields a Linear Profile,” Journal of Quality Technology, 32, pp. 418–426. [10] Kazemzadeh, R. B., Noorossana, R., and Amiri, A. (2008), “Phase I Monitoring

of Polynomial Profiles,” Communications in Statistics: Theory and

Methods, 37, pp. 1671–1686.

[11] Kim, K., Mahmoud, M. A., and Woodall, W. H. (2003), “On the Monitoring of Linear Profiles,” Journal of Quality Technology, 35, pp. 317–328.

[12] Kolda, T. G. and Bader, B. W. (2009), “Tensor Decompositions and Applications,” SIAM Review, 51(3), pp. 455–500.

[13] Li, B., Kim, M. K., and Altman, N. (2010), “On Dimension Folding of Matrix- or Array-valued Statistical Objects,” Annals of Statistics, 38, pp. 1094–1121.

(40)

32

[14] Lu, H., Plataniotis, K. N., and Venetsanopoulos, A. N. (2008), “ MPCA: Multilinear Principal Component Analysis of Tensor Objects,” IEEE

Transactions on Neural Networks, 19, pp. 18–39.

[15] Mahmoud, M. A., Parker, P. A., Woodall, W. H., and Hawkins, D. M. (2007), “A Change Point Method for Linear Profile Data,” Quality and Reliability

Engineering International, 23, pp. 247–268.

[16] Qiu, P., Zou, C., and Wang, Z. (2010), “Nonparametric Profile Monitoring by Mixed Effects Modeling,” Technometrics, 52:3, pp. 265–277.

[17] Saghaei, A., Mehrjoo, M., and Amiri, A. (2009), “A CUSUM-Based Method for Monitoring Simple Linear Profiles,” The International Journal of Advanced

Manufacturing Technology, 45, pp. 1252–1260.

[18] Shiau, J. - J. H. and Weng, Z. - P. (2004), “Profile Monitoring by Nonparametric Regression,” Technical Report, Institute of Statistics, National Chiao Tung University, Hsinchu,Taiwan.

[19] Shiau, J. - J. H., Huang, H. L., Lin, S.-H., and Tsai, M. - Y. (2009), “Monitoring Nonlinear Profiles with Random Effects by Nonparametric Regression,”

Communications in Statistics - Theory and Methods, 38, pp. 1664–1679.

[20] Williams, J. D., Woodall, W. H., and Birch, J. B. (2007), “Statistical Monitoring of Nonlinear Product and Process Quality Profiles,” Quality and Reliability

Engineering International, 23, pp. 925–941.

[21] Yang, J., Zhang, D., Frangi, A. F., and Yang, J. Y. (2004), “Two-dimensional PCA: A New Approach to Appearance-based Face Representation and

Recognition,” IEEE Transactions on Pattern Analysis and Machine Intelligence, 26, pp. 131–137.

[22] Ye, J. (2005), “ Generalized Low Rank Approximations of Matrices,” Machine

Learning, 61, pp. 167–191.

[23] Zhang, D. and Zhou, Z. H. (2005), “(2D) 2PCA: Two-directional

Two-dimensional PCA for Efficient Face representation and recognition,”

Neurocomputing, 69, pp. 224–231.

[24] Zou, C., Ning, X., and Tsung, F. (2012), “LASSO-Based Multivariate Linear Profile Monitoring,” Annals of Operations Research, 192, pp. 3–19.

[25] Zou, C., Tsung, F., and Wang, Z. (2007), “Monitoring General Linear Profiles Using Multivariate EWMA Schemes,” Technometrics, 49, pp. 395–408. [26] Zou, C., Zhang, Y., and Wang, Z. (2006), “Control Chart Based on Change-

Point Model for Monitoring Linear Profiles,” IIE Transactions, 38, pp. 1093– 1103.

第二階段二維剖面監控之研究

國

立

交

通

大

學

統計學研究所

碩

士

論

文