主成份分析法推導過程

第三章建模步驟

3.1 多變量管制圖推導過程

3.1.1 主成份分析法推導過程

本節中將對主成份分析原理由矩陣運算的代數觀點做一些介紹，主成份分析是一個於資料壓縮和資訊萃取方面常被運用的方法，藉由分析代表變數間相關性的互變異矩陣，找到一組由原始變數經過線性組合而成的新變數，稱為主成份變數，且滿足以下性質：

(性質 3.1) 每一主成份為原來變數的線性組合。

(性質 3.2) 第一主成份必須能解釋最大的資料變異量。

(性質 3.3) 第二主成份必須能解釋扣除第一主成份後所剩餘的最大資料變異量。

(性質 3.4) 第 K 個主成份則解釋扣除前 K-1 個主成份後所剩餘的最大資料變異量。

(性質 3.5) 此 K 個主成份間是不相關的。

由以上性質可以看出，主成份座標中各座標軸互相正交，並且此主成份座標軸為唯一，也就是說在相同難度的空間中，再也找不到比此主成份座標軸可以解釋更多資料變異量的另一組正交座標軸。

假設有一個N×M 階原始資料矩陣

其互變異矩陣(covariance matrix)可以計算如下：

) 1

算此互變異矩陣之特徵值及特徵向量，便可以瞭解資點的分佈情況。

λ1≧λ2≧…≧λK≧λK+1≧…≧λM

其中，主成份值矩陣(score matrix)

]

主成份係數矩陣(loading matrix)

]

殘值矩陣(residual matrix)

]

在以上分解中，K≦min{M,N}，由此可知由主成份分析所產生的新變數所展開的空間將小於或等於原始變數所展開的空間，且通常 K 會遠小於 min{M,N}。

透過利用原始資料所計算出來的主成份係數矩陣，主成份分析建立了一個成份模型，可以用來描述原始變數間的關係，而由分析新的量測資料是

所顯示的有所不同。由式(23)，定義主成份模型估計值為

N 1 t t

^T_k _k

= −

λ

k=1~K (28)

由式(28)可以看出，主成份分析所作的就是將原始資料矩陣的互變異矩陣轉換成為一個對角矩陣，又因為互變異矩陣中非主對角線上的元素所代表的意義為變數間的相關性，所以經過這樣的轉換之後，原始變數間的相關性就完全被分離開來，主成份分析就是利用這樣的原理來找出多變數系統中互不相關的新變數，以達到降低維度、簡化問題的目的。

本研究將以檢測電力品質做為研究目標，利用討論過的研究方法，做為改善電力的預測品質的方法，運用主成份分析法可簡化多變量資料的變數個數：(1)解釋的變異比例：若只取最大的 q 個主成分代替原有的 p 個變數，則這 q 個主成分解釋的變異比例為

一般以能解釋原有變數變異達 70% 以上為原則。(2)陡坡圖(Scree plot)：由特徵值對特徵值的總和 (即特徵值的個數) 劃散佈圖，找到開始平坦的點，

即為所求個數。(3)亦有其他多種統計上正式分析，但並無標準制式規定的分析統計量。

在文檔中半導體廠生產電力品質管理之研究 (頁 54-60)

第三章 建模步驟

3.1 多變量管制圖推導過程

3.1.1 主成份分析法推導過程

) 1

N 1 t t

= −

λ

第三章建模步驟