因素分析模式架構 - 研究方法

第三章研究方法

3.5 因素分析模式架構

因素分析是討論如何將 p 個變數

X X

₁

,

₂

, , L X

_p^{中的每一個變數}^{X 分成少數幾個}ⁱ 共同因素（Common Factor）

F F

₁

, , ,

₂

L F

_m（m<p，且通常比 p 小很多），與獨特因素

（Specific Factor）

ε

_i的線性組合。即

- =

1 11 1 12 2 1_m _m 1

X μ l F + l F + L + l F + ε

- =

2 21 1 22 2 2_m _m 2

X μ l F + l F + L + l F + ε

M

1 1 2 2

- =

p p p pm m p

X μ l F + l F + L + l F + ε

其中

F F

₁

, , ,

₂

L F

_m是共同因素（簡稱因素），包含在變數

X

_i中，而

ε

_i是獨特因素，只 在第 i 個變數

X

_i才有。

l

_ij（

i = 1, , L p ^， j = 1, , L m

^{）為第 i 個變數}

X

i在第 j 個共同因素

F

_j的權重或因素負荷（或簡稱為負荷，Factor Loading）。

1.

因素分析模式基本假設

因素分析的基本假設有下列三項：

(1) 獨特因素

ε

₁

,..., ε

_p是互相獨立且具常態分配，且

ε

_i的平均數為0，而變異數

為

ψ

_i，即

ε ε

ε

⎡ ⎤⎢ ⎥

= ⎢ ⎥

⎢ ⎥⎣ ⎦

% M ～

1 2

0 0

0 0 0

0 , =

0 0

0 N

ψ ψ ψ

ψ

⎛ ⎡ ⎤ ⎡ ⎤ ⎞

⎜ ⎢ ⎥ ⎢ ⎥ ⎟

⎜ ⎣ ⎦ ⎣ ⎦ ⎟

⎝ ⎠

L L

M M O M

M

L

其中

ψ

是對角矩陣，表示獨特因素

ε

_i之間是獨立的。

(2) 共同因素F₁, ,L F_m間的共變量矩陣為Φ ，即

令

F F

F

⎡ ⎤ ⎢ ⎥

= ⎢ ⎥

⎢ ⎥ ⎣ ⎦

% M

^,則

11 12 1

21 22 2

1 2

( ) ( ')

m m mm

Cov F E FF

Φ Φ Φ

⎡ ⎤

⎢ Φ Φ Φ ⎥

⎢ ⎥

= = Φ =

⎢ ⎥

⎢ Φ Φ Φ ⎥

⎣ ⎦

L L

% % % M M O M

L

一般要求Φ 對角線上的元素Φ = ，而當時 i_ii 1 ≠ (即對角線外)時則j Φ = ，_ij 0

也就是Φ 為單位矩陣，表示共同因素間是獨立的，且變異數皆為 1，此為最常遇到的要求。

(3) 共同因素與獨特因素間也是獨立的，即

( , ) 0

_j _i

Cov F ε =

^{，對所有 i, j}

因素分析模式也可寫成矩陣表示法

X − = μ LF + ε

% % % %

其中

11 1 1

1 1 1

21 2 2

, , , ,

m m

p p m

p pm p

l l

l l F

X L F

l l F

μ ε

μ ε ε

μ ε

⎡ ⎤ ⎡ ⎤

⎡ ⎤ ⎡ ⎤ ⎢ ⎥ ⎡ ⎤ ⎢ ⎥

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥

=⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥ =⎢ ⎥

⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎢ ⎥

⎣ ⎦ ⎣ ⎦ ⎢⎣ ⎥⎦ ⎢ ⎥⎣ ⎦

M M M

% % % %

而

E F ( ) 0, =

% % Cov F ( ) = Φ ,

% E ( ) 0, ε =

% % Cov ( ) ε = ψ ,

% Cov ( , ) 0 ε F =

%

2.

因素模式中因素之決定

因素分析要達到簡化的目標，選取因素愈少愈好，但選取的因素少表示其解釋能力相對較低，代表性相對不足。因此如何在簡化與代表性之間取得平衡乃是一個兩難的問題，看法亦見仁見智，以下提出一些常用來決定選取因素個數的參考標準。

(i) 凱莎(Kaiser)準則

保留特徵值大於1(或大於所有變數的平均變異數)的因素，亦即除非選取的因素解釋度多於原始變數平均，否則不選取，由凱莎在1960 年所提出的，選取因素個數時，最常使用的準則之一。

(ii) 陡坡圖(Scree plot)檢驗

陡坡圖是Cattell(1966)所提出的一種圖形判斷方法，原理與主成分分析相同，根據因素之解釋比例作成一個折線圖，當折線開始不陡時，表示接下來的特徵值差異不多，其後之因素可不需選取。

(iii) 累積解釋能力

由研究者所設定一個累積解釋之比例(如60%以上)，再從所有因素中由解釋能力較大者開始選取，直至所選取的因素累積能力總和達到要求之門檻為止。

(iv) 特徵值

所選取的特徵值其值要大於所有特徵值的平均，即若以相關矩陣來做分析，則選出特徵值大於1 之因素，針對因素個數選取的問題，通常還需符合下列幾項原則：

I. 一般而言，凱莎法偏向選取較多的因素，而相對的陡坡圖則會選取較少的因素。

II. 實務上，選取的因素需以「解釋」或「說明意義」的程度為主要考量。

III. 一般由 p 個變數選取 m 個因素時常需滿足1

( 1) ( 1) 0

2 p p+ −p m+ ≥ 及p>2m (v) KMO 值

在因素項目的挑選，除參考凱莎(Kaiser)準則、陡坡圖(Scree plot)檢驗兩大主要判斷標準外，還需考量樣本數、題項數、變項共同性的大小等。除此之外，

題項間是否適合進行因素分析，依據Kaiser(1974)的觀點，可從取樣適切性量數值(Kaiser-Meyer-Olkin measure of sampling adequacy；KMO)的大小來判別，其判斷的準則如下表3-2：

表 3-2 KMO 統計量值

KMO 統計量值因素分析適合性

0.9 以上極適合進行因素分析

0.8 以上適合進行因素分析

0.7 以上尚可進行因素分析

0.6 以上勉強可進行因素分析

0.5 以上不適合進行因素分析

0.5 以下非常不適合進行因素分析

進行因素分析前，需先檢查變項間的相關矩陣，因為在因素分析時變項間需具有一定的相關程度，相關性太高或太低的變項，皆會造成因素分析的困難。相關性太低則很難篩選出穩定的共同因素，也不適於進行因素分析，通常相關係數絕對值低於 0.3 時，題項間便不適合進行因素分析；而題項間的相關性太高，便會發生如迴歸分析之多重共線性(multicollinearity)問題、區別效度有待檢驗或獲得的因素價值性不高 (邱皓政，2000)……等問題，可透過 KMO 來檢驗。

在社會科學領域中，常用李克特式之多選項量表(multiple-item scale)，嚴格說起來，量表之變項特性是一種次序(ordinal)變項，但次序變項與名義(nominal)變項均屬

「間斷變項」(discrete variable) 。間斷變項無法求其平均數、或進行相關、迴歸等統計分析，因而無法驗證相關的研究假設。所以多數研究者在編制多選項量表時，會把量表視為等距的連續變項來設計，如此才能進行有意義的資料統計分析與歸納出合理的結論(Bryman & Cramer ,1997)。

在文檔中中華大學 (頁 35-40)

因素分析模式架構

第三章 研究方法

3.5 因素分析模式架構

X X

,

, , L X

F F

, , ,

L F

ε

- =

X μ l F + l F + L + l F + ε

- =

X μ l F + l F + L + l F + ε

M

- =

X μ l F + l F + L + l F + ε

F F

, , ,

L F

X

ε

X

l

i = 1, , L p ， j = 1, , L m

X

F

1.

ε

,..., ε

ε

ψ

ε ε

ε

0 0

0

0 0

0 , =

0 0

0

N

ψ ψ ψ

ψ

⎛ ⎡ ⎤ ⎡ ⎤ ⎞

⎜ ⎢ ⎥ ⎢ ⎥ ⎟

⎜ ⎢ ⎥ ⎢ ⎥ ⎟

⎜ ⎢ ⎥ ⎢ ⎥ ⎟

⎜ ⎢ ⎥ ⎢ ⎥ ⎟

⎜ ⎣ ⎦ ⎣ ⎦ ⎟

⎝ ⎠

L L

M M O M

M

L

ψ

ε

F F

F

⎡ ⎤ ⎢ ⎥

= ⎢ ⎥

⎢ ⎥ ⎣ ⎦

% M

( ) ( ')

Cov F E FF

Φ Φ Φ

⎡ ⎤

⎢ Φ Φ Φ ⎥

⎢ ⎥

= = Φ =

⎢ ⎥

⎢ Φ Φ Φ ⎥

⎣ ⎦

L L

% % % M M O M

L

( , ) 0

Cov F ε =

X − = μ LF + ε

% % % %

μ ε

第三章研究方法

i = 1, , L p ^， j = 1, , L m