第三章 研究方法
3.4 模式理論
由研究目的可知,本研究擬將採用結構方程式模型與個體選擇模式進行結果 分析,茲分別說明如下:
3.4.1 結構方程式模型
在結構方程式中,包含了兩大類變數:觀察變數(observed variable; X,Y)與潛 在變數(latent variable; ζ, xi, η, ξ),基本的結構如圖 3.3 所示。
Exogenous Variables Endogenous Variables
圖 3.3 結構方程式模型
結構方程式模型理論架構係由兩個部分模式所構成:第一是「結構方程式模 式」(structural equation model)和測量模式(measurement model)。
(一) 結構方程式模式
社會行為科學所處理的便項通常為非觀察變數或潛在變數,所謂結構方程式 模式便是描述潛在變項與潛在變項之間的因果關係的模式(林清山,民 73)。在模 式中假定為「因」的變數稱為「潛在自變數(latent independent variables)」或「潛 在外生變數(latent exogenous variables)」,在模式中用ξ表示;而被假定為「果」
的變數稱為「潛在依變數(latent dependent variables)」或「潛在內生變數(latent endogenous variables)」,在模式中用η表示。基本公式為:
)
B 是潛在依變數對潛在依變數的影響效果矩陣;Γ是潛在自變數對潛在依變 數的影響效果矩陣;而ζ則是此一結構方程式的殘餘誤差向量。在此個變數假定 是以離均差分數(deviation scores)表示之,亦即平均數為 0;又ζ與ξ沒有相關;
且 B 為非特異(non-singular)矩陣。
(二) 測量模式
測量模式是用來說明非觀察變數與觀察變數(observed variables)之間的關 係,亦即說明潛在變數與外顯變數(manifest variables)之間關係的模式(林清山,
民 73)。測量模式包含兩個公式:
(theta epsilon):Y 的測量誤差ε的 p×p 階變異互變異矩陣。
(theta delta):X 的測量誤差δ的 q×q 階變異互變異矩陣。
此 八 個 矩 陣 的 估 計 方 式 包 括 : 固 定 母 數 (fixed parameter) 、 限 制 母 數 (constrained parameter)、以及自由母數(free parameter)。
(三)模式驗證之前提假設
1. 必要條件
在應用確認性因素分析時,有一些必要條件是研究者要注意的(Hatcher, 1998)。這些條件除了統計上的限制外,也為保有實際操作時的有效性。以簡單 非遞迴模式為例,這些重要的假設條件包括:
條件 1: 觀察變數必須是區間(interval-level)或比率(ratio-level)的程度變數。
條件 2: 觀察變數必須為連續且至少要有四個數值。
條件 3: 資料需為常態分配。
條件 4: 變數間之關係為線性與附加的(additive)。若為非線性關係則需另行假設 關係函數。
條件 5: 變數間應避免多重共線性。
條件 6: 必須包含所有重要的因果關係。
條件 7: 模式是過度確認(over-identified)的。
條件 8: 觀察變數個數。一般而言,樣本數至少要有 200 個。或者,也可以 5 倍 的待估計參數個數為最小樣本數個數。
條件 9: 每個潛在變數一開始至少有三個觀察變數。
條件 10:觀察變數總數不要超過 30 個。
2. 模式確認
為確認是否有「足夠的」變異量與共變異資料,可用以估算矩陣中的未知參 數或係數,因此,在進行模式的參數估算前,應先對模式的確認狀態進行分析。
為避免當模式的不足確認狀態發生以及多重共線性相關的問題,每個潛在變數至 少需要有三個觀察變數。確認方式分為:
(1) 足夠確認(just-identification):在此狀態下,參數數目與要估算的資料一 樣多,故估算結果僅有一組唯一且獨特的結果,因此,必然的結果是模 式與資料數據極為吻合,故不需對模式進行適合度測試。
(2) 過度確認(over-identification):在此狀態下,有充裕的資料可以被確認,
每個參數都至少還有剩餘一個參數可以被確認。也就是資料數據比要估 算的參數多,因此會有一組以上的解。此時模式可以被測試與驗證。
(3) 不足確認(under-identification):在此狀態下,至少會有一個參數不能被 估算,因為該模式沒有足夠的觀察變數提供資料數據,此時模式無法得 到求解結果,因此無法進行模式適合度測試。
確認的方式,係將模式中所有的路徑係數、變異數以及待估計之共變異數個 數相加,與資料點(data points)的個數作比較。當估計參數等於資料點的個數,則 為足夠確認;當估計參數個數小於資料點的個數,則為過度確認;而若估計參數 個數大於資料點的個數,則為不足確認。資料點的個數計算方式為:
Number of data points=(p(p1))/2
其中,p 為可以被分析的觀察變數個數。
3. 多重共線性(multicollinearity)之處理
由於 SEM 在分析技巧上與多元迴歸分析一樣具有多重共線的問題。此一問 題存在於兩部分:一為觀察變數間的共線性,另一為潛在自變數間的共線性。
觀察變數的共線會影響到潛在變數的被衡量效果,即 SEM 的衡量模式部 分,此亦牽涉到效度的概念。因此,Anderson and Gerbing (1988)建議研究者應先 進行確認性因素分析,檢查是否有觀察變數彼此間具有高度共線性,進而確認衡 量模式的效度。而在操作概念上則是檢定研究者所設定的觀察變數是否僅被其所 屬之潛在變數所解釋,若有觀察變數同時被兩個以上的潛在變數所解釋,則顯示 該觀察變數與其他潛在變數所解釋的觀察變數存在共線性的問題,此時研究者必
須基於理論意涵與實務意義來考慮是否要刪除該變數。
另一方面,在結構模式的分析上,潛在自變項與潛在依變數並非僅限於各一 個,而是可以多個。當潛在自變數間有高度相關時,也可能會產生多元迴歸分析 時之多重共線性問題(馬信行,民 88)。此問題會發生於結構模式的部分。由於結 構關係係由觀察變數來進行參數估算而得,對於潛在自變數間的共線性必須由分 析結果來判定。在結構模式的分析部分,SEM 的相關軟體均會展示出潛在自變 數間的相關係數矩陣,並提供相關的調整指標與建議值。一般常用的有 Lagrange multiplier test 與 Wald test。Lagrange multiplier test 旨在提供是否有變數間存在顯 著關係而結構模式中沒有設定的;Wald test 則提供是否有研究者所假設之關係是 不顯著或刪除後可降低 chi-square 值而應予以刪除的。
4. 軟體應用之相關規則
Hatcher (1998)建議在利用 SAS 軟體進行結構模式或衡量模式分析時,需考 慮到以下多項規則。雖然主要係針對軟體應用所敘述,但大部分內容亦與模式分 析時所應考量之限制有關。茲彙整如下:
規則 1: 一般而言,只有外生變數間允許存在共變異數。
規則 2: 模式中每個內生變數均有殘差項。
規則 3: 外生變數沒有殘差項。
規則 4: 每個外生變數均必須估計其變異數,包括殘差項。
規則 5: 在大部分的個案中,觀察外生變數兩兩間的共變異數均必須被估計,
但內生變數則不用。
規則 6: 在簡單遞迴(simple recursive)模式中,殘差項之共變異數不需被估計。
規則 7: 每個外生變數需有個別的方程式,且外生變數名稱在等號左邊。
規則 8: 對列於等號左邊之內生變數有直接影響的變數均放在等號右邊。
規則 9: 外生變數(包括殘差項)不可出現在等號左邊。
規則 10: 為估計已知自變數之路徑係數,應給予待估計之路徑係數一獨立變數 名稱。
規則 11: 將內生變數之殘差項列於各個方程式中之最後一項。
規則 12: 給予所有待估計之參數定名。
規則 13: 若有參數為已知或被固定假設為某數值,則不用變數名稱。
規則 14: 欲限制兩個或多個變數相等,給予相同之名稱。
規則 15: 在確認性因素分析中,潛在變數的變異數固定為 1。
規則 16: 在進行路徑分析時,潛在外生變數的變異數是要被估計的,潛在內生 變數則不用。
規則 17: 在進行路徑分析時,將每個潛在變數的觀察變數因素負荷量最大者固 定為 1(因素負荷量資訊係來自確認性因素分析之結果)。
規則 18: 在對非標準模式(即結構模式中同時有潛在與觀察變數)進行確認性因 素分析時,觀察結構變數之變異數是要被估計的。
(四)分析結果的評估
SEM 的目標就是再生成一個觀測變數的共變異矩陣 ,使之與樣本共變異 矩陣S盡可能地接近,同時定量地評估模式對資料的適合程度。SEM 方法提供 五種充分評估結果的方法:
1. 標準誤差和參數估計的相關結果。
2. 變異的度量說明。包括對度量模型、結構方程式模式和整個模型的複相關係 數及決定係數。
3. 綜合適配度指標,例如:
(1) 卡方值(x2)、卡方值(x2) / 自由度(df),其中
t q p q p
df ( )( 1) 2
1
p+q 為所有觀察變數個數,t 為待估計獨立參數之個數。
(2) 適合度指標(goodness of fit index, GFI) 由 Tanaka and Huba (1984)所提出,公式為
] 正的適合度指標(adjusted-goodness of fit index, AGFI)
)
包括比較性適配指標(comparative fit index, CFI)、標準適配度指標 (normed-fit index, NFI) 、 非 標 準 適 配 度 指 標 (non-normed-fit index, NNFI)、均方殘差的平方根(root mean squared residual, RMR)等。
4. 殘差分析。包括擬合矩陣 ,殘差矩陣,標準化殘差,殘差圖等。
5. 模型修正指數。除了以上幾種特有的評估方法外,輸出結果中還可以給出變 數對變數的直接效應、總效應等有用的結果。
在評估上,卡方值必須不顯著,但卡方值本身會對樣本數的大小極為敏感,
容易得到具顯著差異的結果(Hoyle, 1995),因此僅以卡方值檢定並不足以判斷模 式不具有適合度。一般常用的規則為卡方值/自由度的比率:一個小於 5(最好是 3)的值可以作為判斷模式是否可接受的參考(J oreskog and S orbom, 1993),有部 分研究也以 2 作為判斷的依據(Hatcher, 1998)。此外,各項適配度指標必須愈大 越好,大於 0.9 是較好的情況。RMR 代表觀察變數之共變異矩陣和資料數據矩 陣間差異平方的平均值,當其值小於 0.08(最好是 0.05)時表示模式適合度佳。這 些評估模式好壞的指標是當被選用的準則,而可以交互配合的使用。Bagozzi and Yi (1988)指出模式的適合度無法僅就單一準則或指標而定奪,必須重視整體模式 的測試結果,不該存在而存在的無意義結果雖使指標結果很好,但卻無益於理論 或學理的推演。研究者必須避免這種資料引導模式(data driven model)的疏失。
過去研究指出有許多指標可供參考,一般多以下幾點為參考特性,以確認模 式適配之優劣,以下為本研究整理出模式適配指標彙整。
1. 卡方值不顯著(nonsignificant),亦即 p-value 大於 0.05 較佳。
2. 卡方值除以自由度(x2 / df)小於 5(最好是 3)。
3. 適配指標愈大愈好,如 GFI、AGFI、CFI、NFI 與 NNFI 等,大於 0.9 更好。
4. 所有因素負荷量之 t 值達統計顯著,標準化因素負荷量之絕對值應大於 0.05。
5. 每個潛在變數之 R2愈大愈好。
6. 常態化殘差呈現以零為中心點之對稱性,而 RMR 應小於 0.05。
6. 常態化殘差呈現以零為中心點之對稱性,而 RMR 應小於 0.05。