第三章 研究方法
第五節 資料分析方法
本研究資料分析工具為SPSS 13.0 及 LISREL 8.80 統計套裝軟體。
SPSS 13.0 主要用來進行描述性統計分析、項目分析、探索性因素分析、
以及內部一致性分析等;LISREL 8.80 主要用來進行驗證性因素分析及複 核效化等分析,用以確認假設模式是否成立。以下依研究分析流程介紹 主要進行的資料分析方法:
一、項目分析 (Item Analysis)
項目分析的目的在於對預試量表的題項進行適切性的評估,以決定 題項的堪用程度,據以刪除不良題目,進而決定正式量表和題項(邱浩 政,2006)。本研究使用預試樣本及台灣正式樣本的回收問卷進行項目分 析,所採用的檢驗包括:(1)項目總分相關係數(corrected item-total correlation):所有題項與分量表總分的相關程度,需達顯著並超過 0.3 以 上(邱浩政,2006);(2)題項的平均數(mean)及標準差(standard deviation):
若題項的標準差小於 0.75 表示該題目的鑑別度較差,應考慮優先刪除;
(3)偏態(skewness)及峰度(kurtosis):在結構方程模式的應用上,變項的 偏態絕對值須小於 3,峰度絕對值須小於 10,否則將被視為非常態分配 (Kline, 1998);(4)內部一致性分析等方法綜合判斷。本研究以 Cronbach’s α 係數檢定各分量表的內部一致性,其係數在 0.7 以上者表示具有良好的 信度(Nunnally, 1978)。
二、專家效度 (Expert Validity)
由於本研究的主題具有教育評鑑的深度,因此在問卷的內容效度 上,以採用專家效度為主。本研究在指標初步建構階段,共舉辦了三場 焦點座談會議,邀請包含教育評鑑專家、具評鑑經驗之餐旅觀光休閒系 所主任、產業主管、政府單位主管等共同檢視初始指標架構與項目,做 為修正評鑑指標內涵的參考依據。
此外,本研究在預試階段,將初始問卷交給美國、英國及台灣具有 教育評鑑經驗之餐旅觀光休閒系所的主任及學者專家,請其逐一檢視問 卷題項,並指出題項是否包含了適當且正確的構面與內容,作為一種構 念效度的評估方式。
三、探索性因素分析 (Exploratory Factor Analysis, EFA)
本研究以台灣的正式樣本進行探索性因素分析。探索性因素分析的 功能在於探討潛在變項的因素結構與存在的形式,確立潛在變項的因素 效度,以協助研究者進行構念效度的檢驗。EFA 能用來縮減與簡化問項,
增進量表的內部一致性(Clark & Watson, 1995)。本研究進行 EFA 時採用 主軸因子法(principle axis factoring),經斜交轉軸(oblique rotation),採用 直接斜交法(direct oblimin)萃取特徵值(eigenvalue)大於 1 的因素,另配合 陡坡圖的檢定(scree test),以共同決定萃取的因素個數。
本研究EFA 採用斜交轉軸的原因,在於使用斜交轉軸是比較貼近真 實現象的一種作法,其容許因素與因素之間有一定的共變;觀察變項經 過斜交轉軸後,因素間的相關被另行估計,因素負荷量之間即不受因素
相關的影響,數值的差異更形擴大明確,因素的結構更易於理解(邱浩 政,2006)。而各題項經斜交轉軸所獲得樣式矩陣(pattern matrix)的因素負 荷量能反映變項間的相對重要性,適合於做比較。各題項中若有因素負 荷量(factor loading)未達 0.5 或有交叉負荷量(cross-loading)的狀況時 (Conway & Huffcutt, 2003)(兩個因素負荷量同時皆超過 0.5、且其數值相 差不到0.1)即予以刪除題項。
四、驗證性因素分析 (Confirmatory Factor Analysis, CFA)
驗證性因素分析具有理論檢驗的功能,用以確認先前設計的指標構 面是否與實際觀察資料的分佈相契合,亦即所界定的理論模式是否能夠 成立(Jöreskog & Sörbom, 1993)。本研究在台灣正式樣本進行 EFA 之後所 得的結果,以LISREL 8.80 進行高階 CFA 假設模式的驗證。之後,針對 美國樣本亦進行高階CFA 以檢定此假設模式的複核效度。
CFA 在評估因素結構的適配度方面,提供了多項指標作為評鑑的依 據。根據黃芳銘(2004)的建議,以多數決的判斷方式視模式是否可被 接受。所謂多數決即指在各類評鑑指標中,必須有一半以上的指標通過 要求,才能宣稱模式的有效性。本研究將採用以下多重適配指標判定模 式的適配程度(Bagozzi & Yi, 1988; Anderson & Gerbing, 1988;邱皓政,
2003;黃芳銘,2004):
(一)整體模式適配度
1. 卡方考驗估計值(χ2):χ2估計值愈小代表整體模式與實際資料愈 適配。其值須不達顯著(p > 0.05)。基本上,χ2 估計值易受到樣本
數大小所影響(Bagozzi & Yi, 1988),若樣本數大於 200 以上容易 造成χ2估計值呈現顯著,此時需參考其他適配指標作進一步的判 斷。
2. 契合度指標(Goodness of fit index,簡稱 GFI):GFI 為假設模式 可以解釋觀察資料的變異數與共變數的比例。GFI 介於 0 至 1 之 間,其值大於0.90 可視為具有良好的適配度。Bagozzi 與 Yi (1988) 認為 GFI 大於 0.90 為較保守的標準,大於 0.80 可視為可接受的 範圍。
3. 調整後契合度指標(Adjusted goodness of fit index,簡稱 AGFI):
AGFI 介於 0 至 1 之間,其值大於 0.90 可視為具有良好的適配度,
大於0.80 可視為可接受的範圍(Bagozzi & Yi, 1988)。
4. 比較適配指標(Comparative fit index,簡稱 CFI):CFI 反應假設 模式與獨立模型差異程度的量數。CFI 大於 0.90 可視為具有良好 的適配度。
5. 規範適配指標(Normed fit index,簡稱 NFI):NFI 反應假設模式 與一個觀察變項間沒有任何獨立模型的差異程度。NFI 大於 0.90 可視為具有理想的適配度。
6. 非規範適配指標(Non-normed fit index,簡稱 NNFI):調整後的 NNFI 大於 0.90 可視為具有理想的適配度。
7. 簡效適配指標(Parsimonious goodness of fit index,簡稱 PGFI):
PGFI 說明模式的簡單程度。PGFI 介於 0 至 1 之間,其值大於 0.50 為可接受的範圍。
8. 漸進殘差均方和平方根(Root-mean-square error of approximation index,簡稱 RMSEA):RMSEA 在比較理論模式與完美契合的飽 和模式的差距程度。其值大於0.10 以上時,顯示模式不良適配;
介於0.08 至 0.10 之間表示具有可接受的適配度;介於 0.05 至 0.08 之間表示具有良好的適配度;而小於0.05 時代表具有非常好的適 配度。Byrne (2001)指出 RMSEA 小於 0.10 是可接受的值。此外,
RMSEA 在小樣本時會有高估的現象,使契合模式會被視為是不 理想的模式(Bentler & Yuan, 1999)。因此使用 SEM 在小樣本時應 謹慎使用RMSEA 數值。
9. 標準殘差均方和平方根(standardized root-mean-square residual index,簡稱 SRMR):SRMR 反映假設模式的整體殘差,其值小 於0.08 時表示模式的契合度佳(Hu & Bentler, 1990);而小於 0.05 時代表具有相當良好的適配度。
(二)模式內在結構適配度
1. 建 構 信 度 (construct reliability) : 除 了 個 別 觀 察 變 項 的 信 度 (individual item reliability)必須大於 0.20 (Jöreskog & Sörbom, 1993)之外;模式中潛在變項的信度亦須採用建構信度(construct reliability)的檢驗,其值必須大於 0.60 以上(Bagozzi & Yi, 1988)。建構信度的計算公式如下所示:
ρc = (Σλ)2 / [(Σλ)2 + (Σθ)]
其中,ρc = 建構信度
λ = 觀察變項在潛在變項上的標準化參數 θ = 觀察變項的測量誤
2. 聚合(建構)效度(convergent validity):個別觀察變項的因素負 荷量(factor loading)須達到顯著水準(t > 1.96),且大於 0.45 以上 (Jöreskog & Sörbom, 1993)。此外,潛在變項的平均抽取變異量 (average variance extracted, AVE)應大於 0.50 以上(Bagozzi & Yi, 1988)。一個潛在變項的 AVE 愈高,表示其構面有愈高的聚合 及區辨效度。平均抽取變異量的計算公式如下所示:
ρv = (Σλ2) / [(Σλ2 + (Σθ)]
其中,ρv = 聚合效度
λ = 觀察變項在潛在變項上的標準化參數 θ = 觀察變項的測量誤
3. 區辨效度(discriminant validity):本研究使用卡方差異檢定(χ2 difference test)來進行潛在變項之間的區辨效度檢定。其方法乃 利用某兩個潛在變項之間的相關設定為 1,以估計此模式所產 生的卡方值與原始模式所產生的卡方值的差異值(△ χ2);若此 卡方差異大於3.84(p < 0.05),表示此兩個潛在變項具有區辨 效度。本研究將針對假設模式中的潛在變項兩兩配對,估計其
△ χ2 以檢驗模式的區辨效度。
五、複核效化 (Cross-Validation)
複核效化可視為是SEM 結果的有效性分析。當運用 SEM 分析檢驗 某一個假設模型得到一個理想的終解之後,可以利用其他樣本進行跨樣 本的檢測,來證明因素模式的跨樣本有效性(邱浩政,2006)。換言之,
複核效化是指一個模式在不同群的樣本之下,能夠複製的程度。使用複 核 效 化 的 目 的 是 為 了 檢 驗 模 式 的 預 測 效 度 ( 黃 芳 銘 ,2004 )。
Diamantopoulos 與 Siguaw (2000) 指出針對單一假設模式,應利用測定樣 本(樣本一)的參數估計數,作為效度樣本(第二母群或稱樣本二)的 參數數值,以評估SEM 模型在效度樣本上的適合度,用來反應測量模式 的效度延展性(validity extension)。由於本研究目的在於發展及效化跨國學 門品質評量工具,因此採用我國及美國的教師樣本來檢定此模式之複核 效度,以確認此模式具備跨樣本的效度延展性。