第三章 研究方法
3.5 因素分析模式架構
分析),或進行其它的統計分析,如 ANOVA、MDS(多元尺度分析),或 經由畫因素得點(Score)的散佈圖來找出異常點,或作為 LISREL 的 構面中測量變數指標。值得注意的是作為構面測量指標可以是因素得 點,也可以用因素負荷中最高的一個變數值為代表,還可以是幾個因 素負荷較高的平均值(但如有不同號時則採對比)。
1.
因素分析模式基本假設因素分析的基本假設有下列三項:
(1) 獨特因素
ε
1,..., ε
p是互相獨立且具常態分配,且ε
i的平均數為 0,而變異數為ψ
i,即1
p
ε ε
ε
⎡ ⎤⎢ ⎥
= ⎢ ⎥
⎢ ⎥⎣ ⎦
% M ~
1
2
0 0
0
0 0
0 , =
0 0
0
pN
ψ ψ ψ
ψ
⎛⎡ ⎤ ⎡ ⎤⎞
⎜⎢ ⎥ ⎢ ⎥⎟
⎜⎢ ⎥ ⎢ ⎥⎟
⎜⎢ ⎥ ⎢ ⎥⎟
⎜⎢ ⎥ ⎢ ⎥⎟
⎜⎣ ⎦ ⎣ ⎦⎟
⎝ ⎠
L L
M M O M
M
L
其中
ψ
是對角矩陣,表示獨特因素ε
i之間是獨立的。(2) 共同因素F1,L,Fm間的共變量矩陣為Φ,即
令
1
m
F F
F
⎡ ⎤⎢ ⎥
= ⎢ ⎥
⎢ ⎥⎣ ⎦
% M
,則11 12 1
21 22 2
1 2
( ) ( ')
m
m
m m mm
Cov F E FF
Φ Φ Φ
⎡ ⎤
⎢ Φ Φ Φ ⎥
⎢ ⎥
= = Φ =
⎢ ⎥
⎢ Φ Φ Φ ⎥
⎣ ⎦
L L
% % % M M O M
L
一般要求Φ對角線上的元素Φ =ii 1,而當時i≠ j(即對角線外) 時則Φ =ij 0,也就是Φ為單位矩陣,表示共同因素間是獨立的,
且變異數皆為 1,此為最常遇到的要求。
(3) 共同因素與獨特因素間也是獨立的,即
(
j, )
i0
Cov F ε =
,對所有i, j
X − =
μ
LF +ε
% % % % 其中
11 1 1
1 1 1
21 2 2
1
X
, , , ,
X
m m
p p m
p pm p
l l
l l F
X L F
l l F
μ ε
μ ε ε
μ ε
⎡ ⎤ ⎡ ⎤
⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
=⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎢ ⎥
⎣ ⎦ ⎣ ⎦ ⎢⎣ ⎥⎦ ⎢ ⎥⎣ ⎦ L
M M M
M M M
% % % %
L
而
E F ( ) = 0,
% % Cov F ( ) = Φ ,
% E ( ) ε = 0,
% % Cov ( ) ε = ψ ,
% Cov ( , ) ε F = 0
% %
2.
因素模式中因素之決定因素分析要達到簡化的目標,選取因素愈少愈好,但選取的因 素少表示其解釋能力相對較低,代表性相對不足,因此如何在簡化與 代表性之間取得平衡乃是一個兩難的問題,看法亦見仁見智,以下提 出一些常用來決定選取因素個數的參考標準。
(i) 凱莎(Kaiser)準則
保留特徵值大於 1(或大於所有變數的平均變異數)的因素,亦即 除非選取的因素解釋度多於原始變數平均,否則不選取,由凱莎在 1960 年所提出的,選取因素個數時,最常使用的準則之一。
(ii) 陡坡圖(Scree plot)檢驗
陡坡圖是 Cattell(1966)所提出的一種圖形判斷方法,原理與主 成分分析相同,根據因素之解釋比例作成一個折線圖,當折線開始不
陡時,表示接下來的特徵值差異不多,其後之因素可不需選取。
(iii) 累積解釋能力
由研究者所設定一個累積解釋之比例(如 60%以上),再從所有因 素中由解釋能力較大者開始選取,直至所選取的因素累積能力總和達 到要求之門檻為止。
(iv) 特徵值
所選取的特徵值其值要大於所有特徵值的平均,即若以相關矩陣 來做分析,則選出特徵值大於 1 之因素,針對因素個數選取的問題,
通常還需符合下列幾項原則:
I. 一般而言,凱莎法偏向選取較多的因素,而相對的陡坡圖則 會選取較少的因素。
II. 實務上,選取的因素需以「解釋」或「說明意義」的程度為 主要考量。
III. 一 般 由
p
個 變 數 選 取m
個 因 素 時 常 需 滿 足 1 ( 1) ( 1) 02 p p+ −p m+ ≥ 及p>2m (v) KMO 值
在因素項目的挑選,除參考凱莎(Kaiser)準則、陡坡圖(Scree
plot)檢驗兩大主要判斷標準外,還需考量樣本數、題項數、變 項共同性的大小等。除此之外,題項間是否適合進行因素分析,
依 據 Kaiser(1974) 的 觀 點 , 可 從 取 樣 適 切 性 量 數 值 (Kaiser-Meyer-Olkin measure of sampling adequacy;KMO)的 大小來判別,其判斷的準則如下表 3-1:
表 3-1 KMO 統計量值
KMO 統計量值 因素分析適合性 0.9 以上 極適合進行因素分析 0.8 以上 適合進行因素分析
0.7 以上 尚可進行因素分析
0.6 以上 勉強可進行因素分析
0.5 以上 不適合進行因素分析
0.5 以下 非常不適合進行因素分析
進行因素分析前,需先檢查變項間的相關矩陣,因為在因素分析 時變項間需具有一定的相關程度,相關性太高或太低的變項,皆會造 成因素分析的困難,相關性太低則很難篩選出穩定的共同因素,也不 適於進行因素分析,通常相關係數絕對值低於 0.3 時,題項間便不適
合進行因素分析,而題項間的相關性太高,便會發生如迴歸分析之多 重共線性(multicollinearity)問題、區別效度有待檢驗或獲得的因 素價值性不高(邱皓政,2000)……等問題,可透過 KMO 來檢驗。
在 社 會 科 學 領 域 中 , 常 用 李 克 特 式 之 多 選 項 量 表 (multiple-item scale),嚴格說起來,量表之變項特性是一種次序 (ordinal)變項,但次序變項與名義(nominal)變項均屬「間斷變項」
(discrete variable),間斷變項無法求其平均數、或進行相關、迴 歸等統計分析,因而無法驗證相關的研究假設,所以多數研究者在編 制多選項量表時,會把量表視為等距的連續變項來設計,如此才能進 行 有 意 義 的 資 料 統 計 分 析 與 歸 納 出 合 理 的 結 論 (Bryman &
Cramer ,1997)。