一、 緒論
1.7 論文結構
本論文除第一章緒論外,再區分為四章,各章內容簡述如下:
第二章 LGM 文獻回顧與評述說明 SEM 與 HLM 差異性、說明本文兩個釋例 LGM 架構及估檢方法、模型評估指標、ECM 依穩態分類、及 ECM 選擇方法。
第三章 ECM 鑑定之研究方法,本章將做為第四章 ECM 實例操作示範之理論及方 法依據。因此,包含多變量常態分配資料模擬、SEM 方法與 HLM 方法資料結構差異、
HLM 穩態性檢定理論與方法、SEM 穩態性檢定理論與方法、ECM 依限制式強弱決定 ECM 篩選順序、並提出 ECM 鑑定準則。
第四章 ECM 實例操作示範,本章依據第二章之 LGM 兩個釋例架構及第三章 ECM 鑑定之研究方法配合 PROC CALIS 及 PROC MIXED 為釋例進行操作示範及比較。
最後,第五章 結論與建議,本章對全文研究解決問題點做一總結及研究限制,並 建議一些可供後續研究之議題。
7
第二章 LGM 文獻回顧與評述
如前章所述 LGM 適用於大量受測者之樣本而且有限重複測量時點之縱橫斷面資
料,藉以探討全部受測者隨著時間變動趨勢或受測者彼此間隨着不同屬性而變動、受測 者本身隨時間改變以及受測者彼此間變化隨着本身變化而變動情況。而其統計建模方式 可分別以階層線性模式(HLM)或線性結構模式(SEM),雖 HLM 和 SEM 兩種模型源自於 不同統計理論及研究問題之對象;然而在 LGM 兩個模型有其重疊性,是為本單元探討 之一部份。另外SEM 及 HLM 估計方法及模型評估指標也簡單說明,同時依據文獻一階 LGM 及二階 LGM 稍加稍正之後推導出統計性質及文獻上常使用 LGM level-1 ECM 加以 系統性分類,以供第四章釋例操作使用。
2.1 LGM 之統計模式
本單元說明 LGM 分別以多層次線性模式(HLM)及線性結構模式(SEM)表示統計模 式,並比較兩者之關係。
2.1.1 LGM 之多層次線性模式(HLM)
不失一般情況下,兩階層線性模式可視為傳統線性迴歸模式之延伸,若考慮縱橫斷
面之資料有N 個受測者(participants, subjects)且有 T 個不同時點(occasions, times),對每
個受測者進行重複施測所得之變數值為y (j =1,…, N ; t =1,…,T),(occasions t nested
tj within subject j)即為成長模型取樣資料之方法,第一層次(level-1)可以下列方程式表示 (Curran, 2003)0
1 0
K K
k k
tj j kj tj tj kj tj tj
k k
y β β λ r β λ r
= =
= +
∑
+ =∑
+ (2.1)式中
β
0 j為level-1 中第j 個受測者之截距;
λ 表示第 k 個變數tjk λ,k
=1, ,K
;β
kj為level-1 中第j 個受測者被吸收在
λ 下之迴歸係數;tjkr 表示第 j 個受測者在時點 t 之誤差。在成
tj 長模型中λ
tjk經常表示依照年代或時間排序(chronological)的變數如年齡;又每個受測著之 截距β
0 j及斜率迴歸係數β
kj是隨機變動(randomly varying),在 SEM 稱之為成長因素 (growth factors)或在 HLM 以隨機係數(random coefficients)稱之,係代表第二層次(level-2) 依變數,若每個受測者j 包含一個或 m 數個 level-2 之預測變數 w ,
mj m=1, ,M,該成長 因素稱之為條件的成長模成(conditional LGM) 可表為下列方程式8 level-1 預測變數(包含一個截距為 1 之行向量)所形之設計矩陣(design matrix)其維度為
T
× (K
+ ;1)W 代表第 j 個受測者在 level-2 預測變數(包含一個截距為 1 之行向量)所形
j 之設計矩陣(design matrix)其維度為(K
+ ×1) (M
+1)(K
+ ;γ 為固定效果迴歸係數向量,1) 其維度為(M
+1)(K
+ × 。1) 1r 表示 level-1 具
jT
× 維度之誤差向量;1u 表示 level-2 為
j9
10 (error covariance matrix structure,簡稱 level-1 ECM)
Σ 均相同。
r為清楚說明式(2.6)之資料結構,我們以 level-1 之預測變數 K=1、level-2 之預測變數 M=2,
且為線性成長模型為例,將式(2.6)表成矩陣型式
11
12
2.1.2 LGM 之線性結構模式(SEM)
潛在成長模式(LGM)為線性結構方程式(structural equation model,簡稱 SEM)之一個 特定形式(e.g., Bauer, 2003; Boolen & Curran, 2006; Chan, 1998; Curran, 2003; Duncan, Duncan, & Hops, 1996; Mehta & Neal 2005; Meredith & Tisak, 1990; Willet & Sayer, 1994)。為清楚說明起見,以圖 2.1 表示,圖中所示共可分為一階 SEM,在測量模式中觀 察不同時點(occasion 或 time 以“t"表之)、受測者(subject 或 individual 以“j"表之)及 有趣研究之可測變數(y),對每個受測者進行重複施測所得之變數值為
y ,如圖中 t 共有
itT 期而“j"省略,而各期測量誤差則分別以 ε
t (t=1,…,T)表之。在結構模式之截距 (intercept)及斜率(slope)為潛在變數(latent variables)係無法直接測量構念(constructs),該構 念即為稱為成長因素(growth factors),用以表示受測者成長趨勢線彼此間截距及斜率之變 動;若潛在變數另有預測變數(如 w 表之),則該 LGM 稱為條件式的 LGM (conditional LGM)。反之若無預測變數稱為非條件式的 LGM (unconditional LGM)。另以三角形符號 表示截距及斜率兩個潛在變數之平均數(Curran & Bauer, 2007)。(註 A-2.2)Intercept
13
結構模式可以表示為(Bollen and Curran, 2006, p134-135):
0 j
對式(2.24)取變異數可得蘊涵平均數向量(implied mean vector)及蘊涵共變數矩陣(implied covariance matrix)分別如下:
14 Baucer (2007)之符號體系,亦即 SEM 中方框表示可觀察變數、圓形(或橢圓形)表示無法 觀察變數(如構念),而三角形表截距項之解釋變數。
由表2.1 得知 SEM 及 HLM 在 LGM 之數學式是等價的。然而 SEM 可用來處理測 量構念、具有模型配適度推論指標、並可以處理具仲介變數(mediator)模型,此為 HLM
15 Adapted from Curran & Bauer (2007)
圖2.2 HLM 及 LGM 與 SEM 關係圖
16
17 示成模型參數之函數如下(Bollen & Curran, 2006, p.134-135):
18
考慮線性成長二階的LGM (second-order LGM) (e.g., Bollen & Curran, 2006, Chap. 8;
Blozis, 2006; Hancock, Kuo, & Lawrence, 2001; Preacher et al., 2008, Chap. 3; Sayer &
Cumsille, 2001),如圖 2.4 所示第一階(order-1)有 4 個量測時點 (t = 1,2,3,4),每個構念有 三個可測量問項(指標),第二階兩個構念分別表示截距及斜率,並有一個與時間無關的 構念做為預測變數(
ξ
),該構念亦有三個可測量問項(指標)。在圖 2.3 為一階之 LGM 與 圖 2.4 為二階 LGM 其差異有三部份(Blozis, 2006; Hancock, Kuo, & Lawrence, 2001;Preacher et al., 2008, Chap. 3),第一部份:一階 LGM 中,測量誤差(
ε
t)包含著測量誤差二階 LGM 能夠檢定同一時間內各構念各指標因素負荷(factor loading)是否相等, Leite (2007)已研究過二階 LGM 之構念 F 之得分(score)採用 Summated score (essential tau-equivalent)及採用 CFA 自由估計因素負荷再計算 F 之得分,則以後者較佳。最後,
第三部份:二階LGM 可以檢定不同期各構念因素的不變性 (factorial invariance)( Blozis, 2006; Bollen and Curran, 2006, p. 255; Hancock & Lawrence, 2006; Preacher et al., 2008, p.
63; Sayer & Cumsille, 2001)之探討,此三點為有二階 LGM 所具有優點。
19
20
為模型可鑑定(identification)起見,經常將每個構念其中一個因素負荷設為 1 ((Blozis, 2006; Hancock & Lawrence, 2006; Sayer & Cumsille, 2001; Chan, 1998)。
* 關(see, e.g., Blozis, 2006; Bollen & Curran, 2006, p. 249; Preacher et al., 2008, p. 63; Sayer &
Cumsille, 2001),因此, Θε可表示為式(2.38)。
21
22
23
因素不變性(factorial invariance)可分成三種(Blozis, 2006; Sayer and Cumsille, 2002),兩在 LGM 可分別定義如下:
(1)弱因素不變性
弱因素不變性(weak factorial invariance 或稱 configural invariance),其定義為各期因 素負荷矩陣相同,即
Λ
y, 1t= =Λ
y, 2t= =Λ
y, 3t= =Λ
y, 4t= ,換言之,因素負荷矩陣對應元素相同,即相同問項在不同期之因素負荷均需相同。
(2)強因素不變性
強因素不變性(strong factorial invariance),其定義為除了滿足弱因素不變性之外(各 期因素負荷矩陣相同),另外各期問項的平均數向量亦需相同。然而 Sayer and Cumsille (2002)指出由於 LGM 中是各期問項得分會隨著時間成長,故必不相等,亦即不可能有強 因素不變性存在。
24
(3)嚴格因素不變性
嚴格因素不變性(strict factorial invariance)除了滿足強因素不變性之外,測量誤差的 變異了數矩陣各期均相等。由於 LGM 中強因素不變性已不存在,即使測量誤差的變異 了數矩陣各期均相等也不滿足嚴格因素不變性。
換言之,在LGM 僅需檢定是否具有弱因素不變性即可。
2.4 參數估計方法
LGM 採用 HLM 或 SEM 方法時,就一階 LGM 數學式是相同,然而各方法參數估 計之演算法並不一樣,因而參數估計值可能會有些許差異,而就SAS/STAT Version 9.2 而言,在HLM (Proc Mixed)係採 ML(maximum likelihood) 及 REML(restricted/residual ML),而 SEM (Proc CALIS)係採 ML、ADF(Brown, 1982, 1984)、 WLS(或 ADF)、GLS 等等(SAS PROC CALIS V9.2, p859)。本研究僅採 ML,因而分別就 HLM 及 SEM 以 ML(REML)說明如下:
2.4.1 SEM 參數估計方法
SEM 利用 ML 估計方法之基本假設為測量變數服從多變量常態分配,
{
* 1 1}
1ln ( ) ln | ( ) | tr[ ( )] [ ( )] ( )[ ( )]
2
L θ
= −⎛ ⎞⎜ ⎟⎝ ⎠N Σ θ
+S Σ θ
− + −y μ θ
′Σ θ y μ θ
− − +常數 (2.44)而Jöreskog (1967) 提出差距函數(discrepancy function)
F
ML1 1
( ) ln | ( ) | ln | | tr[( ( )] [ ( )] ( )[ ( )]
2FML θ
=
Σ θ−
S+
SΣ θ−+ −
y μθ ′
Σ θ y μ θ−− + 常數
(2.45) 式中,N 為樣本數;Σ θ 為蘊涵共變異數矩陣及 ( )
( )μ θ 為蘊涵平均數向量,兩者係由模型
待估參數所形成;S樣本共變異數矩陣,S
*={(N
−1) / ]N S ; y 為樣本平均數向量;又當
量測資料均已標準化則F 最後一項
ML [y μ
− ( )]θ
′Σ θ y μ θ
−1( )[ − ( )]為0。
Bollen (1989, p135) 亦有說明 ln ( )
L θ 及
( )F
MLθ 之關係式(未包含平均數向量)為
{
1}
3,
ln ( ) 1 ln | ( ) | tr[ ( )]
2
FML
L θ
= −⎛⎜⎝N
− ⎞⎟⎠Σ θ
+SΣ θ
− +忽略平均數部份
常數 (2.46)
當獲得樣本資料時,則ln | |
S 為已知值,則 ln ( ) L θ 與
( )F
MLθ 具有式(2.46)關係式,亦即若
存在ˆθ
使得ln ( )L θ 最大化,相當於使得
( )F
MLθ 達到最小。而 F 亦廣為
ML SEM 套裝軟體所 採用,如SAS PROC CALIS、Lisrel、 Mplus 等。又由式(2.46)可得到下列關係式(Iacobucci,25
26
指標說明如下。
2.5.1 SEM 方法評估適合度指標
SEM 方法用以評估理論模型與資料之配適度之指標,可區分為推論式指標(inferential fit index)及描述性指標(descriptive fit indices) (Fan et al., 2007, p146),其中描述性指標各 種套裝軟體(SAS, AMOS, LISREL 等等)均有提供多種不同指標供使用者使用,例如常被 使用NNFI、CFI、RMSEA、SRMR (Iacobucci, 2010; Preacher et al., 2008, p18~p19)。
2.5.1.1 SEM 推論式指標
在 SEM 欲檢定理論模型與資料之配適度其虛無假設(null hypothesis)與對立假設 (alternative hypothesis )分別為(Bollen and Curran, 2006, p44):
0 1
( ), ( ),
: and vs : or/and
( ). ( ).
H H
= ≠
⎧ ⎧
⎪ ⎪
⎨ ⎨
⎪ = ⎪ ≠
⎩ ⎩
Σ Σ θ S Σ θ
μ μ θ μ μ θ
(2.50)
在多變量常態假設且 under H0,其檢定統計量TML服從自由度為
df 之卡方分配
0 2
( 1) ~ H
ML ML df
T = N− F
χ
(2.51)式中FML即為式(2.45)差距函數,N 為樣本數,df 自由度為可觀測變所形成平均數向量之 個數及共變異數矩陣個數之上三角矩陣(或下三角矩陣)元素個數扣除模型待估自由參數 之個數。
2.5.1.2 SEM 敘述性式指標
實證上由模型與資料之配適度之卡方檢定虛無假設不易被接受。因此,一般採用其 他指標,如RMSEA、SRMR、NNFI、CFI 分別說明於下:
1. RMSEA
RMSEA(root mean square error of approximate) (Browne & Cudeck, 1993; Steiger & Lind, 1980):
27
該值愈小愈好,一般以小於0.05 為判斷準則(Bollen & Long, 1993, p144), 2. SRMR
SRMR (standardized root mean square residual) (Joreskog & Sorbom, 2001),以 PROC CALIS procedure (V9.22 p1232)之表現式:
2 2
CFI (comparative fit index) ( Bentler, 1995) 為一種增量指標 (Incremental Index) 該式以 PROC CALIS procedure (V9.22, p1236) 之表現式為:
model model
NNFI (Bentler-Bonett nonnormal coefficient)( Bentler & Bonett, 1980; Tucker & Lewis, 1973),為一種增量指標 (Incremental Index) 該式以PROC CALIS procedure (V9.22, p1236)之表現式為:
null null model model
null null
28
2.5.2 HLM 方法評估適合度指標
在SAS PROC MIXED (HLM)並沒有提供推論式指標而僅描述性指標如 AIC、BIC、
-2LLR、SBC(SAS/STAT V9.22, p.4530),本研究僅取–2LL、AIC 及 BIC 為指標,分別說 明如下:PROC MIXED 計算 2−
LL
= − ×2 loglikelihood function、 AIC=− 2
LL+ 2
d(Akaike, 1974)及 BIC= 2−LL d
+ logN
(Schwarz,1978),其中 LL 為對數概似函數最大值,而 d 為模 型之參數個數,N 為概似函數在估計過程中有效之觀測值個數。2.5.3 SEM 及 HLM 方法評估適合度指標比較
在SEM 及 HLM 評估模型合適性之指標最大差異在於 SEM 方法有提供推論式之卡 方檢定指標,另外SEM 亦提供多種描述性指標 AIC、SBC(BIC)、NNFI、CFI、RMSEA 及SRMR 等等。
2.6 ECM 之分類及文獻常用種類
本研究之重點為提供 LGM 之 Level-1ECM 之鑑定準則(Guideline)程序,首先我們檢 視PROC MIXED 使用手冊(SAS PROC MIXED, V9.22, p4583~4584)提供 ECM 分別有空 間共變結構(spatial covariance structure) 及期間共變結構(occasion covariance structure) (附表 A-2.2 及附表 A-2.3),本研究將焦點放在等距期間(equal space)測量誤差之共變結 構為主,即為等期間ECM,後文所提 Level-1 ECM 均為等期間 ECM。本節將依據 PROC MIXED 所提供 ECM 做一個有系統分類及回顧文獻在研究 LGM 時常用 ECM。最後,
引出本研究採用ECM。
2.6.1 常用 ECM 種類及其分類
如附表A-2.1 之
SAS PROC MIXED 提供 ECM 共有 30 幾種以上供研究者使用,但
回顧文獻研究LGM 使用 ECM 彙整如表 2.2. (e.g., Beck & Katz, 1995; Blozis et al., 2008;Dawson, Gennings, & Carter 1997; Eyduran & Akbaş, 2010; Ferron et al., 2002; Goldstein, 1994; Heitjan & Sharma, 1997; Keselman et al., 1998; Kowalchuk & Keselman, 2001; Kwok et al., 2007; Littell, Henry, & Ammerman ,1998; Littell, Rendergast, & Natarajan, 2000;
Mansour, Nordheim, & Rutledge, 1985; Murphy & Pituch, 2009; Orhan, Eyduran, & Akbaş, 2010; Rovine & Molennaar,1998, 2000; Reynolds et al., 2007; Singer & Willett, 2003, Chap.
7; Velicer & Fava, 2003; Verbeke & Molenberghs, 1997; West & Hepworth, 1991; Willett &
Sayer, 1994; Wolfinger, 1993, 1996; Wulff & Robinson, 2009)。事實上,可以採用 ECM 結 構是否穩態(stationary)以及前後期之期差間(lag)是否具自我相關函數(autocorrelation
29
TOEP(1), AR(1), ARMA(1,1), TOEP(2), UN
Heitjan and Sharma (1997)
CS, HF, AR(1), UN, ARH(1), CSH, HF PROC MIXED
(simulation)
Keselman et al., (1998)
AR(1), UN, ARH(1), CSH, HF, RC PROC MIXED
Littell, Henry, and Ammerman (1998)
ARMA(1,1), MA(1), AR(1), VC,UN Fortran, S-Plus
(simulation)
Murphy and Pituch (2009)
AR(1), UN PROC MIXED
(simulation)
Ferron, Dailey, and Yi .(2002)
TOEP(1), CS, AR(1), TOEP, UN PROC MIXED, BMDP
(empirical study)
Littell, Pendergast, and Nataraja (2000)
AR(1), UN PROC MIXED,
PROC IML. Lisrel
(simulation)
Rovine and Molenaar (2000)
TOEP(1), CS, AR(1), TOEP, UN PROC MIXED
(simulation)
Dawson, Gennings, and Carter (1997)
TOEP(1),CS,UN(2), AR(1),TOEP, UN, TOEPH(1), UN(2),CSH, ARH(1), TOEPH
PROC MIXED
(empirical study)
Verbeke and
Molenberghs (1997) TOEP(1), VC,CS,AR(1),TOEP,
TOEP(2), UN, UN(2)
PROC MIXED
(simulation)
Wolfinger (1993)
CS,AR(1), VC, TOEP, CSH, ARH(1), UN(1), UN
30
表 2.2 (續)
ECM 套裝軟體 參考文獻
AR(1), TOEP(2), UN LISREL 8.8 Blozis et al.(2008) CS, AR(1), TOEP, CSH, UN, HF,
ARH(1), ANTE(1), TOEPH
PROC MIXED
(empirical study)
Eyduran and Akbaş (2010)
AR(1), AR(2), UN 未說明 Goldstein (1994)
AR(1), CS, TOEP, VC, UN, ARH(1), CSH, TOEPH
PROC MIXED (tutorial in SAS
user guide)
Kincaid (2005)
AR(1) 未說明
(simulation and empirical study)
Mansour, Nordheim, and Rutledge (1985)
AR(1), CS, TOEP, UN Lisrel and PROC MIXED.LISREL(si
mulation)
Rovine and Molenaar (1998) ARH(1), ANTE(1), TOEPH
PROC MIXED
Willett and Sayer (1994)
備註:( )表示該文主要為實證或模擬
2.6.2 ECM 弱穩態定義
按照Box, Jenkins and Reinsel (1994, p24~26)之時間序列對穩態之定義如下:
設誤差過程{ }
ε
t ,t
= … 滿足下列三條件,則稱該過程為弱穩態(weakly stationary)過1, ,T
31
32
其中UN(1)=TOEPH(1)=UNR(1), TOEP(1)=VC (i.i.d).
1(A)表示當條件A 成立則為 1 否則為 0,例如1(|
t t
− <′|q
)表示當|t t
− <′|q
條件成立則為1 否則為0,又如[ 1(ρ t t
≠ ′) 1(+t t
= ′)]當(t t′
≠ )成立則為ρ
否則為1。2.6.5 傳統時間序列與 LGM 之自我相關共變異數差異
傳統時間序列(time series, 簡稱 TS)基本上次對一個反應變數進行重複測量而獲得 一組實現值 (one realization),且受測者或觀察變數(y)少但觀察期(T)長;但 LGM 是受測 者或觀察變數(y)多但觀察期(T)少;為 TS 與 LGM 兩者就受測者數目及觀察期長短之差
33
34
由上述諸多ECM,如何選擇合適 Level-1ECM 呢?變成一個很重要議題,如第一章 所言,若未妥善設定ECM 會產生成長因數參數型 I 誤差、參數估計之偏誤(bias)或模型 估計收斂問題。然而,如何選擇ECM 呢?若有理論之基礎則依理論(Hedeker & Mermelstein,
由上述諸多ECM,如何選擇合適 Level-1ECM 呢?變成一個很重要議題,如第一章 所言,若未妥善設定ECM 會產生成長因數參數型 I 誤差、參數估計之偏誤(bias)或模型 估計收斂問題。然而,如何選擇ECM 呢?若有理論之基礎則依理論(Hedeker & Mermelstein,