觀測變項含平均值SEM模式之模擬研究

41  Download (0)

全文

(1)國立臺中教育大學教育測驗統計研究所理學碩士論文. 指導教授:. 楊. 志. 堅. 教授. 觀測變項含平均值 SEM 模式 之模擬研究. 研究生:. 中. 華. 民. 國. 邱 才 恬. 九. 十 I. 六. 撰. 年. 一. 月.

(2) 摘. 要. 在多組群驗證性因素分析中,對於平均數的分析,常是研究所關注的議 題。例如,若是在一般的共變數結構分析中,研究者欲探討不同族群間所表 現的平均數情形,也須使用到平均數結構分析。本研究將探討,多組群平均 數結構的驗證性因素分析中,ML 估算法(Maximum likelihood method)與 WLS 估算法(Weight least square estimation)之估算情形,遂採模擬方式(蒙地卡羅法) 進行,將實驗模型設定為一個潛藏因子與六個觀測變項,且符合因素恆等性, 並將組群數設定為兩個組群,利用 4 種不同截距差與 10 種樣本數,產生 40 種情 境,來檢測估算法之穩定性及適用性的模擬研究。 研究主要結果如下: 1. 對 ML 估算法與 WLS 估算法來說,觀測變項截距的改變並不會對模式的 選取與參數的估算造成影響。 2. 在固定樣本數的情況下,ML 估算法在小樣本(100 到 300)中的表現較 WLS 估算法來得好,但是在大樣本(300 以上)的情況下,二種估算法皆十分相 近。 3. 在本研究所假設之模式下,不論是使用 ML 估算法或是 WLS 估算法,皆 會有不錯的表現。. 關鍵字: 平均數結構、因素恆等性. II.

(3) Abstract The analysis of mean structure in the multigroup confirmatory factor analysis has usually been the significant issue for studies. For example, if there is interest in modeling whether verbal abilities are increasing across time, an analysis of means is an essential modeling component. The Monte Carlo method is used for simulation in this study and let the model include three factors and six observed variables. Depending on sample size and intercepts, we focus on the comparison between ML and WLS methods with model fit index, mean square error, and 95% C. I. coverage. According to this research, the major findings included: 1.. The change of observed intercepts made no influences for model selection and parameter estimation.. 2.. When the sample size is fixed, ML method seems better than WLS method in small sample, but their performance are similar in large sample.. 3.. Either ML method or WLS method would have acceptable performance under the model design of this study.. Keywords: Mean structure, Factorial invariance. III.

(4) 目錄 第一章. 緒論 ..................................................................................................... 1. 第一節 研究背景與研究動機...................................................................... 1 第二節 研究目的.......................................................................................... 2 第三節. 名詞定義 ........................................................................................ 3. 壹、平均數結構......................................................................................... 3 貳、因素不變性......................................................................................... 4 参、MSE .................................................................................................. 6 肆、95%信賴區間的覆蓋率 ..................................................................... 7 第二章. 文獻探討............................................................................................. 8. 第三章 研究方法 ............................................................................................ 13 第一節. 研究工具 ...................................................................................... 14. 壹、ML 估算法........................................................................................ 14 貳、WLS 估算法 ..................................................................................... 15 参、蒙地卡羅研究法............................................................................... 16 第二節. 研究設計 ...................................................................................... 17. 壹、研究流程........................................................................................... 17 貳、實驗設計........................................................................................... 19 第四章 研究結果 ............................................................................................ 22 第一節. 模式適配的結果.......................................................................... 22. 第二節. 參數估計的結果.......................................................................... 25. 第五章. 結論與建議 ...................................................................................... 32. 第一節. 研究結論 ...................................................................................... 32. 第二節. 研究限制 ...................................................................................... 33. 第三節. 研究建議 ...................................................................................... 33. 參考文獻 ............................................................................................................ 34. 1.

(5) 圖目錄 圖 1 平均數結構模式圖.................................................................................. 3 圖 2 弱因素不變性模式................................................................................... 4 圖 3 強因素不變性模式................................................................................... 5 圖 4 嚴格因素不變性....................................................................................... 6 圖 5 基本結構模型 ........................................................................................ 10 圖 6 模式架構圖............................................................................................. 14 圖 7 研究流程圖............................................................................................. 19 圖 8 研究設計圖............................................................................................. 20 圖 9 模式適配度指標立體折線圖................................................................. 25 圖 10. MSE 值折線圖...................................................................................... 27. 圖 11 MSE 值長條圖...................................................................................... 28 圖 12 95%信賴區間覆蓋率折線圖 ............................................................... 29 圖 13 95%信賴區間覆蓋率長條圖 ............................................................... 30. 2.

(6) 表目錄 表 1 群組情境模式整理表 ............................................................................... 9 表 2 ML、GLS 與 WLS 相等的情況.......................................................... 11 表 3 參數值設定表......................................................................................... 21 表 4 模式適配度指標(RMSEA 值) ............................................................... 24 表 5 ν 6(2) = 1 的估算結果 ................................................................................. 31 表 6 ν 6(2) = 3 的估算結果 ................................................................................. 31 表 7 ν 6( 2) = 5 的估算結果 ................................................................................. 32 表 8 ν 6( 2) = 7 的估算結果 ................................................................................. 32. 3.

(7) 第一章. 緒論. 本研究主要目的在探討多組群平均數結構的驗證性因素分析中,具有因 素不變性(factorial invariance)之模型在不同的樣本數與截距差距下,估算觀測 變項截距的表現。本章將分為三部份,第一部分為研究背景與研究動機,第 二部份為研究目的,第三部份為名詞定義。. 第一節. 研究背景與研究動機. 與平均數有關的結構模式,最早是由 Sörbom 在 1974 年所提出(Sörbom, D., 1974),並發展出其他不同的模式,如成長曲線模式(growth curve modeling)、 多樣本的模式(multiple sample models)等;在社會科學或是心理計量的研究 中,對於平均數的分析,常是研究所關注的議題。例如,在縱貫研究中,欲 分析各組別間平均數的變動,就必須使用到平均數結構分析;若是在一般的 共變數結構分析中,研究者欲探討不同族群間所表現的平均數情形,也須使 用到平均數結構分析。Wicherts 與 Dolan (Wicherts, & Dolan, 2004) 在 2004 年 的研究中,利用六種不同的模型,探討共變數結構模型在有平均數的條件限 制 之 下 所 適 用 的 適 配 度 指 標 ; 並 將 重 點 放 在 具 有 因 素 不 變 性 (factorial invariance)之模型檢驗。Meredith (Meredith, 1993) 提到,包含因素不變性的 模型,大致可分為三類:弱因素不變性(weak factorial invariance)、強因素不 變性(strong factorial invariance)與嚴格因素不變性(strict factorial invariance), 且在平均數的結構設定方面,須符合因素不變性(Bollen, 1989)。以上的研究 多屬於潛藏變項之平均數的估算研究,而對於觀測變項截距之研究,卻為少 1.

(8) 數;以測驗為例,若潛藏變項的平均數與學生能力變動有關,則觀測變項的 截距便與試題的難度有關;因此,本研究遂利用多組群平均數結構,來進行 觀測變項截距之研究。 一般而言,對於結構方程模式的估算研究,較常使用的估算方法為最大 概似估算法(Maximum likelihood)、一般化最小平方法(Generalized Least Square) 與加權最小平方法(Weighted Least Square),但是在大部分的研究中,仍以採 用最大概似估算法為主,因為 ML 估算法具有一些特性,如估計值具有漸近 不偏性(asymptotically unbiased)、一致性(consistent);在小樣本數下,表現較 不好。然而,WLS 估算法也有優缺點,其優點為是可使觀測變項分佈的假設 為最小,可適用於樣本相關矩陣的分析(加權矩陣為漸進共變數矩陣時適用); 缺點為計算十分複雜,欲達到收斂所需之樣本數似乎也較其他估算法大 (Bollen, 1989)。對於 ML 估算法與 WLS 估算法在平均數結構模式下的表現並 沒有很清楚的比較,所以本文將觀察此二種估算法在平均數結構模式下的估 算情形。. 第二節. 研究目的. 本研究目的係在多組群平均數結構的驗證性因素分析中,探討 ML 估算 法(Maximum likelihood method)與 WLS 估算法(Weight least square estimation) 在不同樣本數與觀測變項截距值之估算情形,遂進行模擬研究,期望能提出 適用準則,以提供實徵研究者未來在進行相關研究時有所參考。本研究的目 的如下: 1、不同的樣本數下,ML 估算法與 WLS 估算法的估算準確性。 2、在不同的觀測變項截距值下,ML 估算法與 WLS 估算法的估算準確性。 2.

(9) 第三節. 名詞定義. 壹、平均數結構 結構方程模式由測量模型與結構模型所組成( Bollen, 1989 ),測量模型代 表觀測變項與潛在變項的關係式;觀測變項是指研究者可直接測得的變項, 潛在變項是指無法直接測得但可利用觀測變項推算的變項。多組群平均數結 構模式圖如圖 1。在圖 1 中,設定組群數為 2,兩組群模式為一個潛在變項與 三個觀測變項的組合。. y1(1). ε. (1) 1. λ. (1). 1. y2( 2 ). ε. 2. y3( 2 ). ε. (2). (2). 1. λ. (1). F1. ε. λ. 1. (1). y1( 2 ). (1 ). 2. y2. ε. λ. (2). (1). F1. 2. (2). λ. 2. (2). λ. (1). (2). 3. 3. y3(1). ε. (1) 3. 圖 1 平均數結構模式圖. 3. (2) 3.

(10) 其測量模型與結構模型如下( Bollen, 1989 ):. η (g) = α ( g ) + ζ ( g ) , y ( g ) = ν y( g ) + Λ(yg )η ( g ) + ε ( g ) ,. ∑ = ΛΦΛ ′ + Ψ. 其中,g 代表組群數, η 代表潛在變項的向量,ζ 為潛在變項的誤差,α 是潛 在變項之平均數,ν 則是觀測變項之截距,Λ 是因素負荷量, Σ 為參數共變數 矩陣, Ψ 為 ε 之共變數矩陣, Φ 則是潛在變項之共變數矩陣。 平均數結構主要被使用在比較多組群間平均數的變異情況,且必須要建 立在因素不變性的情況之下。. 貳、因素不變性 Meredith (Meredith, 1993) 提到,包含因素不變性的模型,大致分為三類: 1. 弱因素不變性. y1(1). ε. (1) 1. λ. (1). 1. y2( 2 ). ε. 2. y3( 2 ). ε. 3. (2). (2). 1. λ. (1). F1. ε. λ. 1. (1). y1( 2 ). (1 ). 2. y2. ε. λ. (2). (1). F1. 2. (2). λ. 2. (2). λ. (1). (2). 3. 3. y3(1). ε. (1) 3. Group1. Group2 圖 2 弱因素不變性模式. 4. (2).

(11) 將模式間的因素負荷量設為相同:. λ1(1) = λ1( 2 ) , λ(21) = λ(22 ) , λ(31) = λ(32 ) 使其具有跨樣本的因素負荷量均等之性質。. 2. 強因素不變性:. y1(1). ε. (1) 1. λ. (1). 1. y2( 2 ). ε. 2. y3( 2 ). ε. 3. (2). (2). 1. λ. (1). F1. ε. λ. 1. (1). y1( 2 ). (1 ). 2. y2. ε. λ. (2). (1). F1. 2. (2). 2. (2). λ. λ. (2). (1). 3. 3. y3(1). ε. (1) 3. Group1. Group2 圖 3 強因素不變性模式. 將模型間的因素負荷量與測量殘差變異設定相同:. λ1(1) = λ1( 2 ) , λ(21) = λ(22 ) , λ(31) = λ(32 ) , Θ (1) = Θ ( 2 ) ,. ,使因素負荷量與測量殘差變異具有跨樣本的均等性。. 5. (2).

(12) 3. 嚴格因素不變性:. ν. (1) 1. ε. (1) 1. λ. (1). ν. 2. ν. 3. (2). ε. 1. ε. 2. ε. 3. (2). (2). 1. λ. (1). F1. 1. λ. 1. (1). ν. ν. 2. (1) 2. ε. λ. (2). (1). F1. 2. (2). 2. (2). (2). λ. λ. (2). (1). 3. 3. ν. (1) 3. ε. (1) 3. Group1. (2). (2). Group2 圖 4 嚴格因素不變性. 將模型間的因素負荷量、測量殘差變異與潛在變項的變異數與共變異 數設定相同:. λ1(1) = λ1( 2 ) , λ(21) = λ(22 ) , λ(31) = λ(32 ) , Θ (1) = Θ ( 2 ) ,. φ1(1) = φ1( 2 ) , 使因素負荷量、測量殘差變異與潛在變項的變異數具有跨樣本的均等 性。. 参、MSE (Mean square error): MSE =. 1 2 2 ∑ f i ( xi − t ) 2 i =1. 6.

(13) 其中, x. i. = 第 i 個估計值, t =目標值。. MSE 為變異數分析中母體變異數的估計值,也等同於估計值與目標值 距離平方後的平均值;在本研究中將 MSE 定義為觀測變項截距的估計值 與真實值間距離平方的平均。. 肆、95%信賴區間的覆蓋率( 95% Confidence Interval coverage rates ):. 95%信賴區間的覆蓋率 =. 覆蓋真值的次數 模擬 資料數. 7.

(14) 第二章. 文獻探討. 本研究旨在探討多組群平均數結構的驗證性因素分析中, ML 估算法與 WLS 估算法在不同樣本數與觀測變項截距值之估算情形,基於以上目的,本 章將回顧並整理和本研究相關之文獻。 Wicherts & Dolan (Wicherts, & Dolan, 2004) 在 2004 年的研究中提及,若 模式中含有平均數的參數被忽略,將容易造成訊息指標低估的情況,則會造 成錯誤的決策。在其 2004 年的研究中利用六種不同的模型,探討共變數結構 模型在有平均數的條件限制之下所適用的適配度指標。Wicherts 與 Dolan(2004) 研究模式設定如下:. μ i = ν i + Λ iα i , ′ ∑ i = Λ i Ψi Λ i + Θ i. 其中 μ i 與 ∑ i 定義為群組中平均數與共變數之矩陣, Λ i 是一個 p × q 包含因素負 荷量的矩陣,ν i 為 p 維包含測量截距的向量, Θ i 是包含誤差變異數的 p × p 矩 陣, Ψi 是一個 q × q 的共變異數矩陣,最後, α i 是 q 維向量的因素平均數。 研究的數據則是依據 Naglieri & Jensen (1987)所做的研究中,包含 86 個 非裔與 86 個美國小孩的魏氏智力測驗分數,在研究中所設定之六種不同情 境,分別為初探性(Exploratory)、部分結構不變性(Configural invariance)、結構不 變性(Metric invariance)、等同誤差/單一標準差(Equal error/unique variance)、嚴格 因素不變性(Strict factorial invariance)、強因素不變性(Strong factorial invariance), 如表 1 所示。. 8.

(15) 表 1 群組情境模式整理表 ∑1. ∑2. μ1. μ2. Λ*1 Λ*1 + Θ1. t. Λ*2 Λ*2 + Θ 2. t. ν1. ν2. 部分結構不變性 (部 份因素負荷量設定為 相同). Λ 1 Ψ1 Λ 1 + Θ1. Λ 2 Ψ2 Λ 2 + Θ 2. ν1. ν2. ΛΨ1 Λt + Θ1. ΛΨ2 Λt + Θ 2. ν1. ν2. ΛΨ1 Λt + Θ. ΛΨ2 Λt + Θ. ν1. ν2. 4a. 結構不變性 (因素負荷量相同) 等同誤差 /單一標準差 嚴格因素恆等性. ΛΨ1 Λt + Θ. ΛΨ2 Λt + Θ. ν. ν + Λα 2. 4b. 強因素恆等性. ΛΨ1 Λt + Θ1. ΛΨ2 Λt + Θ 2. ν. ν + Λα 2. 編號. 條件描述. 0. 初探性. 1. 2 3. t. t. 註: Λ*1 定義所有的元素都已被估算;除模式 4b 外,毎一模式都是前模式的巢套模式。 (摘錄自 Wicherts, & Dolan, 2004, Table 2 ). 利用初探性因素分析(Exploratory factor analysis, EFA)完成基本模型,如 圖 5,此模型含有語言能力、空間能力與記憶力三個因素,與 16 子量表之簡 單結構,並設定每一個因素中的其中一個因素負荷量為 1,更將參數型態設定 為多變量常態,而估算方法則是採用 ML 估算法,再加入其他的條件限制進 行研究。研究結果發現,在平均數結構被忽略的情況下,所計算出的訊息指 標容易讓研究者做出錯誤的結論,並指出在共變數結構含平均數的條件限制 之 下 , 所 使 用 的 訊 息 指 標 以 BIC (Bayesian Information Criterion) 及 CAIC(Consistent Akaike Information Criterion)較為適當。. 9.

(16) 圖 1 基本結構模型. 其次,在有關結構方程模式的研究中,經常會討論到兩個重要議題:(1) 參數估算的準確性,(2)模式與資料的適配性。而在參數估算方面,最常使用 到 的 是 最 大 概 似 估 算 法 (Maximum Likelihood, ML) 、 一 般 化 最 小 平 方 法 (Generalized Least Square, GLS),與加權最小平方法(Weighted Least Square,. 10.

(17) WLS)。當假設模式是被完整地定義,且觀測變項為多變量常態的情況下,此 三 種 方 法 都 可 以 找 出 最 佳 參 數 估 計 值 , 而 且 會 有 相 似 的 漸 近 性 質 (Browne, 1974)。. 表 2 ML、GLS 與 WLS 相等的情況 Model / Distribution. Normal. Nonnormal. Correct model. ML ⇔ GLS ⇔ WLS asymptotically. ML ⇔ GLS asymptotically,. Misspecified model. GLS ⇔ WLS asymptotically. but(N-1)F is not χ 2 distributed No equivalence. (摘錄自 Olsson, Foss, Troye, & Howell, 2000, Table 2). Yuan & Bentler(1997)指出,在所有分配及樣本數下使用 ML 估算法所得 之估算值的偏誤皆較使用 WLS 估算法所得之估算值要小很多。至於模式與資 料的適配度指標,則有卡方值、AIC、BIC、RMSEA (root mean square error of approximation)…等。 在 Olsson, Foss, Troye, & Howell (2000)的研究中,模擬 11 種峰度,4 種模 式與 5 種樣本數,利用適配度來比較 ML 估算法、GLS 估算法、WLS 估算法。 根據研究結果,Olsson, Foss, Troye, & Howell 得到以下結論:ML 估算法對 於樣本數與峰度的改變比較不敏感,而且 ML 估算法不但比較穩定,在適配值方 面,又比其他二種方法具有高度的準確性;GLS 估算法需要定義良好的模式,但 是也可以允許在小樣本時做適配值的估算;而 WLS 估算法也是需要定義良好的 模式,但是對照 GLS 與 ML 估算法時,它需要在大樣本的情況下才會有比較好 的表現。 邱才恬、楊志堅(民 94)的研究指出,在多組群平均數結構的驗證性因素分析. 11.

(18) 中樣本數的選取,若以適配度指標 RMSEA 值為依據,樣本數可選取 300 或是 300 以上。若是著重在估計參數的情形下,則樣本數就沒有太大限制。 根據 Wicherts & Dolan (2004)所發表之文章,本研究將利用文中所提及之 因素不變性作為研究要點之ㄧ,由於該篇文章中樣本數為固定,以至於 Wicherts & Dolan 建議採用 BIC 及 CAIC 作為適配度指標較為恰當,但因考量 本研究將主要研究放在估算法的比較,並非模式的選取,且訊息指標 (Information Criteria)容易受到樣本數的影響,並且,在本研究中,樣本數的變 化較多,因此在適配度指標方面,將採用 RMSEA 值作為評斷標準。 根據以上文獻的回顧,本研究將進行在多組群驗證性因素分析含平均數結 構之下,ML 估算法與 WLS 估算法對觀測變項截距估算情形的表現。. 12.

(19) 第三章. 研究方法. 本研究主要探討在平均數結構之下,參數估算法對觀測變項截距估算情 形的表現。本章將分為兩節,第一節將說明研究工具,第二節則介紹研究設 計。模型是採用多組群平均數結構之驗證性因素分析的模式,如圖 6,將組群 數設定為兩個組群,分別具有一個潛在變項及六個觀測變項,由於是使用平 均數結構,所以必須符合因素不變性的條件,其設定將會在第二節研究設計 中詳細說明,此外,在參數估算方面,本研究則是使用 ML 估算法與 WLS 估 算法。. 註:λ 為因素負荷量;ε為觀測變項的殘差。. 圖 1 模式架構圖. 13.

(20) 第一節. 研究工具. 本研究主要的目的在利用模擬資料進行觀測變項截距 (ν ) 估算的比較。估 算法則是使用 ML 估算法與 WLS 估算法,以下將針對ν 的估算作介紹說明, 首先是 ML 估算法,其次是 WLS 估算法,最後將介紹蒙地卡羅研究法。. 壹、ML 估算法 ML 估算法之適配函數數學式( Bollen, 1989 )如下: FML = log | Σ | +tr ( SΣ −1 ) − log | S | −( p + q ) ,. ⎤ ⎡ VAR( y1 ) ⎥, ⎢ VAR( y 2 ) ∑ = ⎢COV ( y 2 , y1 ) ⎥ ⎢⎣COV ( y 3 , y1 ) COV ( y 3 , y 2 ) VAR( y3 )⎥⎦. 其中, Σ 為參數共變數矩陣, S 為估計值之樣本共變數矩陣,且 Σ 與 S 皆為 正定矩陣。 平均數結構模式為. η =α +ζ , y = ν y + Λ yη + ε ,. 設 y 的期望值為 E (y ) = ν y + Λ y κ ,. 式中ν y 為觀測變項之截距值,並令 κ 為η之期望值。 以一個潛藏變項與三個觀測變項的模式為例,可以得到. 14.

(21) E (Y1 ) = ν 1 + κ E (Y2 ) = ν 2 + λ2κ , E (Y3 ) = ν 3 + λ3κ VAR(Y1 ) = E [(Y1 − E (Y1 )) 2 ] = E [(ν 1 + η1 + ε 1 − (ν 1 + κ )) 2 ] = E [(η1 − κ + ε 1 ) 2 ]. ,. = ψ 11 + VAR(ε 1 ). 上述式中,ψ 為 ε 之共變數矩陣。 由以上列式可推得 ∑(θ ) = ΛΦΛ ′ + Ψ. ⎡ψ 11 + VAR(ε 1 ) ⎤ ⎢ ⎥ , 2 =⎢ λ2ψ 11 λ2ψ 11 + VAR(ε 2 ) ⎥ ⎢⎣ λ3ψ 11 λ2 λ3ψ 11 λ32ψ 11 + VAR(ε 3 )⎥⎦. 讓 ∑ = ∑(θ ) ,找出 θˆ ,使得 FML 為最小,則 θˆ 為最佳的參數估計值。. 貳、WLS 估算法 WLS 估算法之適配函數數學式( Bollen, 1989 )如下: FWLS = [ s − σ (θ )]′W −1 [ s − σ (θ )] ,. 其中,s 是取樣本共變異數矩陣(S)中不相重疊的元素所形成的向量,其元素 1 ( p + q )( p + q + 1) ; σ (θ ) 則是與 ∑(θ ) 對應相同秩的向量; W -1 則是 2 1 ( p + q )( p + q + 1) × 1 ( p + q )( p + q + 1) 的加權矩陣。對 FWLS 取最小化,以求得 θ 2 2. 個數為. 之估計值。 如果觀測變項為多重常態分配,經由化簡動作後,可得. 15.

(22) 1 FWLS = tr{ [S − ∑(θ )]V −1 }2 , 2. 式中, V −1 是一個 ( p + q ) × ( p + q ) 的加權矩陣(Browne, 1974)。適當地選擇 ˆ , or I),就可以得到 F 、 F 與 F 。 V (=S, ∑ GLS ML ULS. 参、蒙地卡羅研究法 蒙地卡羅(The Monte Carlo method)研究經常用於方法學的研究,它也可以 被用在決定研究所需的樣本數或是檢定力的判定(Muthén & Muthén, 2002),有 時也被視為是模擬研究,也可用在資料的產生和數據分析,而在模式的設定 上,分析模式可與資料產生模式不同。 在 Mplus (Muthén & Muthén, 1998-2004)中,蒙地卡羅法在資料產生方面, 有以下三步驟: 1. 多變量常態資料是由模式中觀測變項所產生的。 2. 觀測變項也可以是類別的型態。 3. 第三個步驟隨著潛在變項和模式類型可再作改變。 在資料分析方面,分為兩種類型: 1. 內部蒙地卡羅模擬研究:資料的生成與分析皆在同一步驟完成。 2. 外部蒙地卡羅模擬研究:第一步可利用 Mplus 或是其他軟體產生資 料,接下來再利用正規的分析方法結合蒙地卡羅研究法進行資料分析。 本研究中所使用的蒙地卡羅法設定為內部蒙地卡羅模擬研究,在研究中的模 擬資料產生與數據估算,是利用 M-plus 來完成在不同的觀測變項截距與不同 樣本數下之組合,最後再進行相關的分析。. 16.

(23) 第二節. 研究設計. 壹、研究流程 本研究欲根據不同的樣本數與截距的真實值,產生模擬資料。樣本數的 設定由 100 至 1000 共十種不同的樣本數;觀測變項截距真值為 1、3、5、7, 最後產生 40 種的不同試驗組合。研究流程如圖 7,首先,利用實驗所設計的 條件產生試驗組合,資料產生完之後,再利用模式適配度指標 RMSEA 值判 定所模擬出來的資料是否符合假設模式;接下來則利用 ML 估算法與 WLS 估 算法去估計觀測變項的截距值;最後將估算所得的數值與結果加以分析並比 較。. 17.

(24) 圖 2 研究流程圖. 18.

(25) 貳、實驗設計 本研究的實驗設計模型是採用多組群平均數結構之驗證性因素分析的模 式。主要探討在一個潛藏因子與六個觀測變項的模型設定下,根據估算方法 的不同,是否會對觀測變項截距的估計有所差異。進而探討在不同樣本數及 觀測變項截距下,不同估算法的穩定性與適用性。 本研究之模擬資料是根據圖 8 的模式所產生。將組群數設定為兩個組群, 在此二組群裡皆具有六個觀測變項與一個潛在變項。. 註:λ 為因素負荷量;α為潛在變項的平均值;ζ為潛在變項的誤差;ν為觀測 變項( y )之截距;ε為觀測變項的殘差變異數。 圖 3 研究設計圖. 19.

(26) 為了符合因素的恆等性質,遂將兩組群之因素負荷量( λ )、潛藏變項的平 均數與其殘差、觀測變項的殘差皆設定相同;在觀測變項截距方面,Group1 中觀測變項之截距皆設為 1,而在 Group2 前五個觀測變項截距與 Group1 之 設定相同,僅改變第六個觀測變項之截距值,使其與 Group1 之截距差距為: 1、3、5、7,並將兩模式設定值的異同整理如表 3。在三種不同截距差之下, 產生樣本數為 100、200、300、400、500、600、700、800、900、1000 筆的 資料。根據截距差與樣本數的設定,產生 40 種情境,針對此 40 種情境反覆 估算,來檢測估算法之穩定性及適用性的模擬研究。. 表 1 參數值設定表 Λ Group1 Group2. λ1 = 1 λ 2 ~ λ6 = 0.5 λ1 = 1 λ 2 ~ λ6 = 0.5. α. ζ. ν. ε. 1. 0. ν1 ~ ν 5 = 1 ν6 =1. 1. 1. 0. ν1 ~ν 5 = 1 ν 6 = 1, 3 , 5,7. 1. 註:Λ為因素負荷量;α為潛在變項的平均值;ζ為潛在變項的誤差; ν為觀測變項之截距;ε為觀測變項的殘差。. 在估算法方面,使用 ML 估算法與 WLS 估算法進行觀測變項之截距估 算。探討在每一種情境下,ML 估算法與 WLS 估算法的情況,進而找出在研 究設計下所適用的估算法。 最後,根據不同情境下所估算出的數據,以 1. MSE (mean square error) 2. 95%信賴區間的覆蓋率(95%C.I. coverage rates) 作為評定估算穩定性與適用性的標準,比較 ML 估算與 WLS 估算法在平均數. 20.

(27) 結構模式下是否有所差異,再綜合分析且比較,並提出結論與建議,詳細的 研究結果將於第四章呈現。. 21.

(28) 第四章. 研究結果. 在本章節中,將依照第三章所建構之流程進行模擬試驗,依據不同的觀 測變項截距與樣本數之組合,比較在平均數結構下,ML 法與 WLS 法所做參 數估算之情形。本章將分為兩節,第一節說明模式適配的結果,第二節說明 參數估計的結果。. 第一節. 模式適配的結果. 將 Group2 之截距設為:1、3、5、7 等 4 種,與 Group1 截距之差距為 0、 2、4、6;樣本數為 100、200、300、400、500、600、700、800、900、1000 等 10 種;共有 40 種不同的試驗組合,對於每一種組合皆模擬 1000 筆資料進 行估算。本研究所假設的兩組群,爲了符合因素恆等性質,將大部份的參數 設為相同,僅改變第六個觀測變項(ν (2) )的值,其研究設計圖如圖 8 所示。 6. 利用模式適配度指標(RMSEA)來檢驗所產生的模擬資料是否符合研究所 設定之模式;一般而言,對於 RMSEA 值的判定是以 0.08 作為標準,介於 0.05 至 0.08 之間為可接受的範圍,代表模擬出來的資料與模式還算合適;當指標 低於 0.05 則為良好,也就是說模擬資料的模式與假設的模式相當符合(Browne & Cudeck, 1993),並將研究所得之 RMSEA 值整理如表 4。. 22.

(29) 表 1 模式適配度指標(RMSEA 值). ν 6( 2) = 1. ν 6( 2 ) = 3. ν 6( 2 ) = 5. ν 6( 2) = 7. sample size. ML. WLS. ML. WLS. ML. WLS. ML. WLS. 100. 0.020. 0.096. 0.021. 0.098. 0.021. 0.099. 0.020. 0.096. 200. 0.013. 0.040. 0.014. 0.041. 0.014. 0.041. 0.013. 0.040. 300. 0.011. 0.026. 0.011. 0.026. 0.011. 0.026. 0.011. 0.025. 400. 0.009. 0.019. 0.009. 0.019. 0.009. 0.019. 0.009. 0.019. 500. 0.008. 0.014. 0.008. 0.015. 0.008. 0.015. 0.008. 0.014. 600. 0.007. 0.013. 0.008. 0.013. 0.007. 0.013. 0.007. 0.012. 700. 0.007. 0.011. 0.007. 0.011. 0.007. 0.011. 0.007. 0.011. 800. 0.006. 0.010. 0.006. 0.010. 0.007. 0.010. 0.006. 0.009. 900. 0.006. 0.009. 0.006. 0.009. 0.006. 0.009. 0.006. 0.008. 1000. 0.005. 0.008. 0.006. 0.008. 0.006. 0.008. 0.005. 0.008. 在表 4 中,每一直行代表在不同樣本數下,ML 估算法和 WLS 估算法依 據ν 6(2) 的不同所計算出的 RMSEA 值。以樣本數為 200 時說明,在ν 6(2) = 1 時, ML 估算法的 RMSEA 值為 0.013,WLS 估算法的 RMSEA 值為 0.040;當ν 6(2) = 3 時, ML 估算法的 RMSEA 值為 0.014,WLS 估算法的 RMSEA 值為 0.041;. ν 6(2) = 5 時,ML 估算法的 RMSEA 值為 0.014,WLS 估算法的 RMSEA 值為 0.041;在ν 6(2) = 7 時,ML 估算法的 RMSEA 值為 0.013,WLS 估算法的 RMSEA 值為 0.040。由表 4 可發現,大部份 RMSEA 值小於 0.05,除了 WLS 估算法 在樣本數為 100 的 RMSEA 值分別為 0.096、0.098、0.099、0.096,均超過判 定值,但是在樣本數 200 之後,不論是 ML 估算法或是 WLS 估算法都低於判 定值。依據表 4 的數值,將其轉換成圖 9 表示,圖中 X 軸代表樣本數,Y 軸 代表 RMSEA 值;由前而後的線,分別代表著 ML 估算法與 WLS 估算法在四 種不同的觀測變項截距值下 RMSEA 值的表現。由圖 9 可見,WLS 估算法的. 23.

(30) 表現在樣本數 100 到樣本數 300 之間的變動幅度較其他樣本數大,而在樣本 數 300 到樣本數 500 時,變動的幅度逐漸變小;ML 估算法的表現則呈現平緩 的趨勢。整體來看,隨著樣本數的增加,RMSEA 值有逐漸下降的走向,並且 慢慢趨於穩定。. 圖 1 模式適配度指標立體折線圖. 24.

(31) 第二節. 參數估計的結果. 在確認模擬資料符合模式之後,依照先前的實驗設計,進行參數的估算, 並將所得之數據整理如表 5、表 6、表 7、表 8。 表 5、表 6、表 7、表 8 的數值,分別代表當ν 6(2) = 1、ν 6( 2 ) = 3、ν 6( 2 ) = 5 與 ν 6( 2 ) = 7 時所得之估計結果,直行代表在不同樣本數下,ML 估算法和 WLS 估算法在 Group1 和 Group2 截距估計值差距、MSE、95%信賴區間的覆蓋率的數值。 以表 5 為例,在觀測變項截距值估計方面,Group1 與 Group2 觀測變項 截距估計值差距的範圍介於-0.0051 到 0.0063,當樣本數為 100 時,ML 估算 法所得數值為 0.0004,WLS 估算法所得數值為 0.0063;樣本數為 300 時,ML 估算法所得數值是-0.0046,WLS 估算法所得數值是-0.0051。由表 5 可看出, ML 估算法或是 WLS 估算法所估計出來的數值都呈現跳動狀態,沒有一定的 規律,大部分的差距也都在 0.005 以下,不同的樣本數所得估計值之差距也沒 有明顯的差別。以 MSE 來說,估算所得的 MSE 值在 0.0011 到 0.0165 之間, 在樣本數為 100 時,使用 ML 估算法所得 MSE 值為 0.0105,WLS 估算法所 得 MSE 值為 0.0165;樣本數為 300 時,ML 估算法所得 MSE 值為 0.0037, WLS 估算法所得 MSE 值為 0.0041。95%信賴區間的覆蓋率之數值則是介於 0.809 與 0.959 之間,在樣本數為 100 時,ML 估算法所得之數值為 0.955, WLS 估算法所得之數值為 0.809;樣本數為 300 時,ML 估算法所得之數值為 0.954,WLS 估算法所得之數值為 0.915。 將表 5、表 6、表 7、表 8 的數值,依照估算法與觀測變項截距值的不同, 將其繪製成 MSE 值折線圖如圖 10、MSE 值長條圖如圖 11、95%信賴區間覆 蓋率折線圖如圖 12 與 95%信賴區間覆蓋率長條圖如圖 13。. 25.

(32) 在圖 10 中,X 軸代表樣本數,Y 軸代表 MSE 值,每一條折線代表不同 的估算法在不同觀測變項截距值下的表現,共有 8 條線。估算所得的 MSE 值 介於 0.0010 到 0.0180。由圖 10 可以看出,在樣本數低於 300 時,MSE 會隨 著樣本數的上升有明顯的下降,而在樣本數過 300 之後,MSE 的下降幅度便 逐漸緩和。在樣本數低於 200 時,ML 估算法的表現是比 WLS 估算法來得好, 但是在樣本數超過 200 之後,兩估計法所估算出的 MSE 值皆十分相近。. 0.02. 0.018. 0.016. 0.014. 0.012. 0.01. 0.008. 0.006. 0.004. 0.002. 0 100. 200 ML_1. 300 ML_3. 400 ML_5. 500. 600. ML_7. 700. WLS_1. 圖 2 MSE 值折線圖. 26. WLS_3. 800. 900 WLS_5. 1000 WLS_7.

(33) 將研究所得之 MSE 數據,根據估計法與樣本數的不同,繪製成各個觀測 變項截距值下的 MSE 值長條圖如圖 11。圖中的 X 軸代表四種不同的觀測變 項截距值,Y 軸為 MSE 值,圖中黑色的長條代表使用 ML 法估算所得之 MSE 值,灰色長條代表使用 WLS 法估算所得之 MSE 值。由圖 11 可發現,不論觀 測變項截距值(ν 6(2) )的真值為何,MSE 會隨著樣本數的增加而變小;大致上來 說,使用 ML 估算法所得之數值比使用 WLS 估算法所得之數值還要低。. 0.0200 0.0180 0.0160 0.0140 0.0120 0.0100 0.0080 0.0060 0.0040 0.0020 0.0000 1. 3. 5. 7. 圖 3 MSE 值長條圖 根據研究所得的 95%信賴區間覆蓋率,按照估算法與觀測變項截距值的 不同,將其繪製成 95%信賴區間覆蓋率折線圖如圖 12。在圖 12 中,X 軸代表 樣本數,Y 軸代表 95%信賴區間覆蓋率,每一條折線代表不同的估算法在不 同觀測變項截距值下的表現,共有 8 條線。估算所得的信賴區間覆蓋率範圍 由 0.786 到 0.959。在圖 12 中,使用 ML 估算法所得之 95%信賴區間覆蓋率大. 27.

(34) 都集中在 95%左右;當樣本數為 100 到 300 時,我們可以發現使用 WLS 估算 法所得之 95%信賴區間覆蓋率會隨著樣本數的增加有大幅上升的趨勢,而在 樣本數過了 300 之後,便趨於平穩,且所有的數值皆在 90%以上。整體來說, 使用 ML 估算法所得之數值,不會因為樣本數改變而受到影響,而使用 WLS 估算法所得之數值在樣本數低於 300 時,會因為樣本數的改變而受到相當程 度的影響。. 1. 0.95. 0.9. 0.85. 0.8. 0.75. 0.7 100. 200 ML_1. 300 ML_3. 400 ML_5. 500. 600. ML_7. WLS_1. 700. 800. WLS_3. 900 WLS_5. 1000 WLS_7. 圖 4 95%信賴區間覆蓋率折線圖. 根據研究所得的 95%信賴區間覆蓋率,依照估計法與樣本數的不同,繪 成各個觀測變項截距值下的 95%信賴區間覆蓋率如圖 13。圖中的 X 軸代表四 種不同的觀測變項截距值,Y 軸為 95%信賴區間覆蓋率,圖中黑色的長條代 表使用 ML 法估算所得之 95%信賴區間覆蓋率,灰色長條代表使用 WLS 法估 算所得之 95%信賴區間覆蓋率。由圖 13 可發現,使用 ML 估算法所得之數值,. 28.

(35) 除了不因樣本數改變而受到影響,觀測變項截距值的改變亦不會影響其覆蓋 率。而對於使用 WLS 估算法所得之數值來說,觀測變項截距值的改變並不會 對其 95%信賴區間覆蓋率有影響,反而是樣本數的改變,會對其有影響。. 1.000. 0.950. 0.900. 0.850. 0.800. 0.750. 0.700 1. 3. 5. 圖 5 95%信賴區間覆蓋率長條圖. 29. 7.

(36) 表 2 ν 6(2) = 1 的估算結果. difference. MSE. 95% C.I.. sample size. ML. WLS. ML. WLS. ML. WLS. 100 200 300 400 500 600 700 800 900 1000. 0.0004 -0.0019 -0.0046 -0.0004 0.0004 -0.0002 0.0010 0.0012 -0.0005 -0.0014. 0.0063 -0.0024 -0.0051 -0.0004 0.0008 -0.0006 0.0012 0.0012 -0.0003 -0.0012. 0.0105 0.0052 0.0037 0.0027 0.0021 0.0019 0.0016 0.0013 0.0011 0.0011. 0.0165 0.0063 0.0041 0.0030 0.0022 0.0020 0.0016 0.0014 0.0012 0.0011. 0.955 0.949 0.954 0.945 0.951 0.946 0.951 0.957 0.959 0.948. 0.809 0.899 0.915 0.922 0.933 0.932 0.946 0.950 0.951 0.946. 表 3 ν 6(2) = 3 的估算結果. difference. MSE. 95% C.I.. sample size. ML. WLS. ML. WLS. ML. WLS. 100 200 300 400 500 600 700 800 900 1000. 2.0008 1.9987 2.0013 1.9998 2.0019 2.0003 2.0001 2.0007 2.0018 2.0007. 2.0018 1.9977 2.0019 1.9996 2.0017 2.0000 2.0003 2.0009 2.0020 2.0007. 0.0113 0.0055 0.0041 0.0029 0.0022 0.0019 0.0016 0.0013 0.0012 0.0011. 0.0179 0.0062 0.0044 0.0030 0.0024 0.0019 0.0016 0.0014 0.0013 0.0011. 0.948 0.950 0.934 0.943 0.946 0.950 0.950 0.947 0.951 0.945. 0.786 0.910 0.897 0.927 0.928 0.945 0.947 0.940 0.938 0.934. 30.

(37) 表 4 ν 6( 2 ) = 5 的估算結果. difference. MSE. 95% C.I.. sample size. ML. WLS. ML. WLS. ML. WLS. 100 200 300 400 500 600 700 800 900 1000. 4.0014 4.0010 3.9977 3.9990 4.0014 3.9972 3.9988 3.9995 3.9996 3.9989. 4.0014 4.0017 3.9988 4.0003 4.0012 3.9974 3.9992 3.9993 3.9998 3.9985. 0.0111 0.0057 0.0035 0.0029 0.0022 0.0018 0.0016 0.0013 0.0012 0.0011. 0.0178 0.0069 0.0040 0.0031 0.0023 0.0019 0.0017 0.0014 0.0012 0.0011. 0.946 0.945 0.957 0.948 0.952 0.947 0.943 0.956 0.941 0.955. 0.799 0.894 0.914 0.922 0.934 0.937 0.930 0.947 0.947 0.937. 表 5 ν 6( 2 ) = 7 的估算結果. difference. MSE. 95% C.I.. sample size. ML. WLS. ML. WLS. ML. WLS. 100 200 300 400 500 600 700 800 900 1000. 5.9998 6.0032 6.0007 6.0008 5.9994 6.0010 5.9991 5.9995 6.0005 6.0005. 5.9994 6.0027 6.0012 6.0007 6.0002 6.0009 5.9986 5.9997 6.0004 6.0006. 0.0106 0.0056 0.0036 0.0029 0.0023 0.0017 0.0014 0.0014 0.0012 0.0011. 0.0177 0.0073 0.0041 0.0033 0.0024 0.0019 0.0016 0.0015 0.0013 0.0012. 0.951 0.949 0.953 0.935 0.943 0.956 0.957 0.944 0.951 0.946. 0.791 0.881 0.919 0.905 0.931 0.934 0.945 0.933 0.929 0.940. 31.

(38) 第五章. 結論與建議. 本研究主要目的是在探討在多組群平均數結構的驗證性因素分析中,具 有因素恆等性之模型在不同的樣本數與不同的截距差距下,估算觀測變項截 距的表現。本章將對模擬試驗所得的結果做最後的結論,並說明研究的限制 及建議。遂將此章分為三節,第一節為研究結論,第二節將說明研究限制, 第三節為研究建議。. 第一節. 研究結論. 在 Wicherts & Dolan (Wicherts & Dolan, 2004) 2004 年的研究中提及,若 模式中含有平均數的參數被忽略,容易造成造成錯誤的決策;Olsson, Foss, Troye, & Howell (2000)的研究中指出,在參數為常態且模型設定正確的情況 下,ML 估算法與 WLS 估算法其實是十分相近的。 根據第四章的研究結果,我們可以發現,隨著樣本數的增加,RMSEA 值 有下降的趨勢,在樣本數 500 之後趨於穩定;在 MSE 值方面,其值不受觀測 變項截距值真值所影響,但會因樣本數的改變而有所變動;在 95%信賴區間 覆蓋率的部份,我們可以發現在樣本數 300 之後,兩種估算法皆不受樣本數 影響。單看 WLS 估算法的估算情況,可以發現在樣本數低於 200 時,所得之 估算結果, RMSEA 值會有高估的情形發生,此項結論與 Bentler & Kaon (Bentler & Kaon, 1992)所提出之論點相呼應,此外還能看出 MSE 值或是 95% 信賴區間覆蓋率,都不好。若將樣本數固定,可以看出 ML 估算法的確是比 WLS 估算法穩定,但是大樣本底下,則是沒有明顯差異。整體來說,在多組. 32.

(39) 群平均數結構驗證性因素分析中,使用 ML 法或是 WLS 法來估算觀測變項 的截距值皆會有不錯的表現,大致來說 ML 估算法的表現比 WLS 估算法佳; 若是將重點放在其他方面如模式選取,則較建議使用 ML 估算法。 在本研究中所得結論大多與文獻相印証,但由於使用之模式為多組群平 均數結構與近年來實徵資料型態相近,且研究中設計的 10 種樣本數,也較符 合實用性質,可提供實徵研究者作為研究方面之參考。. 第二節. 研究限制. 本研究主要的研究模式為多組群平均數結構驗證性因素分析。模型為一 個潛在變項與六個觀測變項,且將組群數設定為二個組群,並符合因素恆等 性之設定。研究所得之結論皆為特定模式所得,若要廣泛地利用,則需再作 測試。. 第三節. 研究建議. 對於後續相關研究,有以下建議: 1. 研究所設定的觀察變項為連續資料,由於實徵資料的型態較接近離散 資料,建議未來可利用類別或是二元資料作研究。 2. 此次研究所設定模型為較簡單的模式,建議後續研究者可擴充研究模 型,如潛在成長曲線模式,或是增加組群數,深入研究。 3. 除了本研究中所使用的估算方法,未來也可使用其他估算法來做比 較,以找出最適用於多組群平均數結構的估算方法。. 33.

(40) 參考文獻 英文部份 Bollen, K. A. (1989). Structural equations with latent variable: Wiley New York. Browne, M. W. (1974).Generalized least-squares estimators in the analysis of covariance structures. South African Statistical Journal, 8, 1-24 . Browne, M. W. (1987). Robustness of statistical inference in factor analysis and related models. Biometrica, 74, 375-384. Jelte, M. W., & Conor, V. D. (2004). A Cautionary Note on the Use of Information Fit Indexes in Covariance Structure Modeling With Means. Structural Equation Modeling, 11(1), 45-50. Meredith, W. (1993). Measurement invariance, factor analysis and factorial invariance. Psychometrika,58, 525–543. Muthén, L. K., & Muthén, B. O. (1998–2004). Mplus user’s guide (3rd ed.). Los Angeles: Muthén & Muthén. Olsson, U. H., Foss T., Troye S. V., & Howell, R. d. (2000). The Performance of ML, GLS, and WLS Estimation in Structural Equation Modeling Under Conditions of Misspecification and Nonnormality. Structural Equation Modeling, 7(4), 557-595. Yuan, K. H., & Bentler, P. M. (1997). Improvimg parameter tests in covariance structure analysis. Computational Statistics & Data Analysis, 26, 177-198.. 34.

(41) 中文部份 楊志堅、邱才恬 (2005)。潛藏變數含平均值模式之適配度檢定模擬研究。2005 年第二屆統計方法學學術研討會,輔仁大學。 邱才恬、楊志堅 (2005)。Simulation Studies on Evaluating Models of Latent Variables with Constrained Means。台灣心理學會第 44 屆年會,中原大學。. 35.

(42)

數據

Updating...

參考文獻