第三章 研究方法
3.5 因素分析模式架構
因素分析是討論如何將 p 個變數
X X
1,
2, , L X
p中的每一個變數X 分成少數幾個i 共同因素(Common Factor)F F
1, , ,
2L F
m(m<p,且通常比 p 小很多),與獨特因素(Specific Factor)
ε
i的線性組合。即1
- =
1 11 1 12 2 1m m 1X μ l F + l F + L + l F + ε
2
- =
2 21 1 22 2 2m m 2X μ l F + l F + L + l F + ε
25
M
1 1 2 2
p
- =
p p p pm m pX μ l F + l F + L + l F + ε
其中
F F
1, , ,
2L F
m是共同因素(簡稱因素),包含在變數X
i中,而ε
i是獨特因素,只 在第 i 個變數X
i才有。l
ij(i = 1, , L p , j = 1, , L m
)為第 i 個變數X
i在第 j 個共同 因素F
j的權重或因素負荷(或簡稱為負荷,Factor Loading)。1.
因素分析模式基本假設因素分析的基本假設有下列三項:
(1) 獨特因素
ε
1,..., ε
p是互相獨立且具常態分配,且ε
i的平均數為0,而變異數為
ψ
i,即1
p
ε ε
ε
⎡ ⎤⎢ ⎥
= ⎢ ⎥
⎢ ⎥⎣ ⎦
% M ~
1 2
0 0
0
0 0
0 , =
0 0
0
pN
ψ ψ ψ
ψ
⎛ ⎡ ⎤ ⎡ ⎤ ⎞
⎜ ⎢ ⎥ ⎢ ⎥ ⎟
⎜ ⎢ ⎥ ⎢ ⎥ ⎟
⎜ ⎢ ⎥ ⎢ ⎥ ⎟
⎜ ⎢ ⎥ ⎢ ⎥ ⎟
⎜ ⎣ ⎦ ⎣ ⎦ ⎟
⎝ ⎠
L L
M M O M
M
L
其中
ψ
是對角矩陣,表示獨特因素ε
i之間是獨立的。(2) 共同因素F1, ,L Fm間的共變量矩陣為Φ ,即
令
1
m
F F
F
⎡ ⎤ ⎢ ⎥
= ⎢ ⎥
⎢ ⎥ ⎣ ⎦
% M
,則11 12 1
21 22 2
1 2
( ) ( ')
m
m
m m mm
Cov F E FF
Φ Φ Φ
⎡ ⎤
⎢ Φ Φ Φ ⎥
⎢ ⎥
= = Φ =
⎢ ⎥
⎢ Φ Φ Φ ⎥
⎣ ⎦
L L
% % % M M O M
L
一般要求Φ 對角線上的元素Φ = ,而當時 iii 1 ≠ (即對角線外)時則j Φ = ,ij 0
26
也就是Φ 為單位矩陣,表示共同因素間是獨立的,且變異數皆為 1,此為最常遇 到的要求。
(3) 共同因素與獨特因素間也是獨立的,即
( , ) 0
j iCov F ε =
,對所有 i, j因素分析模式也可寫成矩陣表示法
X − = μ LF + ε
% % % %
其中11 1 1
1 1 1
21 2 2
1
X
, , , ,
X
m m
p p m
p pm p
l l
l l F
X L F
l l F
μ ε
μ ε ε
μ ε
⎡ ⎤ ⎡ ⎤
⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
=⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎢ ⎥
⎣ ⎦ ⎣ ⎦ ⎢⎣ ⎥⎦ ⎢ ⎥⎣ ⎦
L
M M M
M M M
% % % %
L
而
E F ( ) 0, =
% % Cov F ( ) = Φ ,
% E ( ) 0, ε =
% % Cov ( ) ε = ψ ,
% Cov ( , ) 0 ε F =
%
%
2.
因素模式中因素之決定因素分析要達到簡化的目標,選取因素愈少愈好,但選取的因素少表示其解釋能 力相對較低,代表性相對不足。因此如何在簡化與代表性之間取得平衡乃是一個兩難 的問題,看法亦見仁見智,以下提出一些常用來決定選取因素個數的參考標準。
(i) 凱莎(Kaiser)準則
保留特徵值大於1(或大於所有變數的平均變異數)的因素,亦即除非選取的因素 解釋度多於原始變數平均,否則不選取,由凱莎在1960 年所提出的,選取因素個數 時,最常使用的準則之一。
(ii) 陡坡圖(Scree plot)檢驗
27
陡坡圖是Cattell(1966)所提出的一種圖形判斷方法,原理與主成分分析相同,根 據因素之解釋比例作成一個折線圖,當折線開始不陡時,表示接下來的特徵值差異不 多,其後之因素可不需選取。
(iii) 累積解釋能力
由研究者所設定一個累積解釋之比例(如60%以上),再從所有因素中由解釋能力 較大者開始選取,直至所選取的因素累積能力總和達到要求之門檻為止。
(iv) 特徵值
所選取的特徵值其值要大於所有特徵值的平均,即若以相關矩陣來做分析,則選 出特徵值大於1 之因素,針對因素個數選取的問題,通常還需符合下列幾項原則:
I. 一般而言,凱莎法偏向選取較多的因素,而相對的陡坡圖則會選取較少的因 素。
II. 實務上,選取的因素需以「解釋」或「說明意義」的程度為主要考量。
III. 一般由 p 個變數選取 m 個因素時常需滿足1
( 1) ( 1) 0
2 p p+ −p m+ ≥ 及p>2m (v) KMO 值
在因素項目的挑選,除參考凱莎(Kaiser)準則、陡坡圖(Scree plot)檢驗兩大 主要判斷標準外,還需考量樣本數、題項數、變項共同性的大小等。除此之外,
題項間是否適合進行因素分析,依據Kaiser(1974)的觀點,可從取樣適切性量數 值(Kaiser-Meyer-Olkin measure of sampling adequacy;KMO)的大小來判別,其判 斷的準則如下表3-2:
28
表 3-2 KMO 統計量值
KMO 統計量值 因素分析適合性
0.9 以上 極適合進行因素分析
0.8 以上 適合進行因素分析
0.7 以上 尚可進行因素分析
0.6 以上 勉強可進行因素分析
0.5 以上 不適合進行因素分析
0.5 以下 非常不適合進行因素分析
進行因素分析前,需先檢查變項間的相關矩陣,因為在因素分析時變項間需具有 一定的相關程度,相關性太高或太低的變項,皆會造成因素分析的困難。相關性太低 則很難篩選出穩定的共同因素,也不適於進行因素分析,通常相關係數絕對值低於 0.3 時,題項間便不適合進行因素分析;而題項間的相關性太高,便會發生如迴歸分 析之多重共線性(multicollinearity)問題、區別效度有待檢驗或獲得的因素價值性不高 (邱皓政,2000)……等問題,可透過 KMO 來檢驗。
在社會科學領域中,常用李克特式之多選項量表(multiple-item scale),嚴格說起 來,量表之變項特性是一種次序(ordinal)變項,但次序變項與名義(nominal)變項均屬
「間斷變項」(discrete variable) 。間斷變項無法求其平均數、或進行相關、迴歸等統 計分析,因而無法驗證相關的研究假設。所以多數研究者在編制多選項量表時,會把 量表視為等距的連續變項來設計,如此才能進行有意義的資料統計分析與歸納出合理 的結論(Bryman & Cramer ,1997)。
29