• 沒有找到結果。

主成份分析法推導過程

第三章 建模步驟

3.1 多變量管制圖推導過程

3.1.1 主成份分析法推導過程

本節中將對主成份分析原理由矩陣運算的代數觀點做一些介紹,主成份 分析是一個於資料壓縮和資訊萃取方面常被運用的方法,藉由分析代表變 數間相關性的互變異矩陣,找到一組由原始變數經過線性組合而成的新變 數,稱為主成份變數,且滿足以下性質:

(性質 3.1) 每一主成份為原來變數的線性組合。

(性質 3.2) 第一主成份必須能解釋最大的資料變異量。

(性質 3.3) 第二主成份必須能解釋扣除第一主成份後所剩餘的最大資料變 異量。

(性質 3.4) 第 K 個主成份則解釋扣除前 K-1 個主成份後所剩餘的最大資料 變異量。

(性質 3.5) 此 K 個主成份間是不相關的。

由以上性質可以看出,主成份座標中各座標軸互相正交,並且此主成 份座標軸為唯一,也就是說在相同難度的空間中,再也找不到比此主成份 座標軸可以解釋更多資料變異量的另一組正交座標軸。

假設有一個N×M 階原始資料矩陣

=

其互變異矩陣(covariance matrix)可以計算如下:

) 1

算此互變異矩陣之特徵值及特徵向量,便可以瞭解資點的分佈情況。

λ1≧λ2≧…≧λK≧λK+1≧…≧λM

其中,主成份值矩陣(score matrix)

]

主成份係數矩陣(loading matrix)

]

殘值矩陣(residual matrix)

]

在以上分解中,K≦min{M,N},由此可知由主成份分析所產生的新變數 所展開的空間將小於或等於原始變數所展開的空間,且通常 K 會遠小於 min{M,N}。

透過利用原始資料所計算出來的主成份係數矩陣,主成份分析建立了一 個成份模型,可以用來描述原始變數間的關係,而由分析新的量測資料是

所顯示的有所不同。由式(23),定義主成份模型估計值為

N 1 t t

Tk k

K

= −

λ

k=1~K (28)

由式(28)可以看出,主成份分析所作的就是將原始資料矩陣的互變異矩 陣轉換成為一個對角矩陣,又因為互變異矩陣中非主對角線上的元素所代 表的意義為變數間的相關性,所以經過這樣的轉換之後,原始變數間的相 關性就完全被分離開來,主成份分析就是利用這樣的原理來找出多變數系 統中互不相關的新變數,以達到降低維度、簡化問題的目的。

本研究將以檢測電力品質做為研究目標,利用討論過的研究方法,做 為改善電力的預測品質的方法,運用主成份分析法可簡化多變量資料的變 數個數:(1)解釋的變異比例:若只取最大的 q 個主成分代替原有的 p 個 變 數 , 則 這 q 個 主 成 分 解 釋 的 變 異 比 例 為

一般以能解釋原有變數變異達 70% 以上為原則。(2)陡坡圖(Scree plot):由 特徵值對特徵值的總和 (即特徵值的個數) 劃散佈圖,找到開始平坦的點,

即為所求個數。(3)亦有其他多種統計上正式分析,但並無標準制式規定的 分析統計量。

相關文件