Chapter 2 文獻回顧
2.6 探索性因素分析 (exploratory factor analysis)
由於兒童排尿障礙患者的相關症狀呈相關性多變量分佈,因此因素分析(factor analysis) 除 了可以用來探討這些症狀(觀察變項,observable variable)的相關性,更可以依潛在變項(latent
variables)將這些症狀進行分類。通常因素分析可以使用下列兩種方式施行A. 以一種探索性,
且不帶有偏見的方式去檢驗觀察變項與潛在變項之間的相關性。B. 當作一個檢驗一個因素結 構(factor structure),檢驗特定觀察變項與特定潛在變項間的相關性。[16]
因素分析(Factor analysis)的表示:
2
Λ
:迴歸係數,又稱為因素負荷量(factor loadings)u
p:不可被潛在變項解釋的變異,u
1,..., u
p之間獨立不相關。2
Λ
:迴歸係數,又稱為因素負荷量(factor loadings)Ψ
:為對角線以 組成的對角矩陣(diagonal matrix).ψ
i的解為特定解(unique solution),需要給予限定條件(constraints),即為限定 為一 個對角線矩陣(diagonal matrix),而且其對角線的元素排列為由大到小,類似主成分分析中的特 徵值(eigenvalue),第一個因素(factor)對於原有變數所貢獻的變異數最多,依序次之,而 且這些因素有互相獨立的性質(orthogonal properties)。
) Λ M
'
1G = Λ Ψ Λ
−主因素分析(Principal factor analysis)
主因素分析與主成分分析(principal component analysis)的技巧類似,只是主因素分析所採用 的共變異數矩陣的對角線減去了特異變異數:
*
ˆ
S = − Ψ S
(2-16)S
為原觀察變數 的共變異數矩陣(covariance matrix)x
iΨ ˆ
為包含ψ
i的對角矩陣(diagonal matrix)S
*為reduced covariance,因此 其對角線的值則為估計的共同性,S
*我們最常用來運算共同性(communalities)的方法為
a.
X
i與其他觀察變數的multiple correlation coefficients 的平方 b.X
i與其他觀察變數相關係數(correlation coefficients)的極大值如果 與其他變數的相關性較大,則會有較大的共同性值。而主因素分析可能遇到的困難在 有時候於計算出來的共同性值(communalities)可能會超出 的變異數,使得specific variance( ) 的估計值可能為負值,而我們無法接受specific variance 為負值,因此需要其他方法去調整。
X
iX
iψ
i通常我們決定要選取 P﹡個因素時,會考慮這 P﹡個因素可以解釋共同性(communalities)的比例
(proportion)。若要考慮第1 到 P﹡個因素解釋了多少共同性值(communalities)的比例(cumulative proportion),則可以下列式子表示:
*
* 1
( )
p k
P
ktrace S λ
= ∑
=(2-17)
另外Cattell(1965)提出了 scree diagram(Figure 2.6-1)的觀念,依每個因素的 eigenvalue 由大到小作排列,選取P﹡個因素至scree diagram 有出現明顯轉折(elbow)為止。
Figure 2.6-1 scree diagram
因素旋轉(Rotation of factors)
由於因素之間互相獨立(orthogonal property),因此有可能造成下列兩種現象
1. 變數可能會在一個以上的因素有顯著的因素負荷(factor loadings),增加因素的複雜度
(factorial complexity)
2. 除了第一個因素之外,其他的因素的因素負荷會有正有負,即為雙極性(bipolar)
以上現象會造成解讀因素時的困難,最好是一個變數只在一個因素有較大的因素負荷,而在其 他的因素最好是接近零,這便是Thurstone (1931)提出的 simple structure 原則:
1. 因素負荷矩陣的每一列應該至少有一個負荷接近零。
2. 因素負荷矩陣的每一行至少應該有 k 個負荷接近零。
3. 每對因素負荷矩陣的行(column)至少有好幾個變數的負荷在一行接近零另一行數值較大。
4. 如果因素大於四個,則每一對的行(column)至少有好幾個變數的負荷都接近零。
5. 因素負荷矩陣中,每一對的行(column)只有少數幾個變數的負荷都不為零。
為了盡量符合simple structure 的原則,可以旋轉因素的軸線(axis)。最常使用的方法為varimax rotation(Kaiser 1958),經過 varimax rotation 之後的軸線為垂直的性質,其原則為讓較少的因
素有較大的因素負荷,而有較多的因素有接近零(near-zero)的因素負荷。
另一種為傾斜旋轉oblique rotation,不過這種技巧產生的因素之間可能會有相關性。雖然我們 可以隨著我們的需要選擇軸線的旋轉,如垂直或傾斜,但軸線(axis)旋轉並不會改變原有的 變項的分佈,而且軸線的旋轉依然是從原點經過,我們只是讓這些點的分佈可以以較簡單的方 式描述及解釋。
因素分數 (Factor Scores)
經過因素分析後,有時候我們需要計算每一個個體觀察值在因素分析後個別因素的分數 因此在假設因素為常態分佈之下,因素的分佈以下面式子表示:
−1
⎤
1 1
⎥⎦
' ( ),( ' )
N ⎡Λ ⎢⎣ ∑
−x − μ Λ Ψ Λ +
−I
(2-18)Λ
:因素負荷矩陣∑
:為原始變數共變異數矩陣(covariance)x
:個案原始分數矩陣μ
:個案原始平均分數矩陣Ψ
: 為包含特異變異的對角矩陣因此利用下列式子計算每個個案在每個因素的分數:
' 1( )
f = Λ S− X −X (2-19) f :每個個案其於每個因素的分數矩陣
Λ :因素負荷矩陣
S
:為原始變數的共變異數矩陣(covariance)X :個案原始分數矩陣