六個國家經過兩兩一組分析與檢定後總共有 30 個結果,模型配適度部分除 了編號 27,28 的 RMSEA 達到 0.1,其餘的 RMSEA 大都小於 0.08,且 CFI 皆 介於 0.93 與 0.98 之間。檢定結果部分如表 22,在嚴格度 (m = M = 0.5) 之 下,結果出現 MRS 差異 3 次 (編號 2,4,21),ERS 差異 1 次 (編號 3),ARS 差 異 8 次 (編號 1,3,5,13,16,22,26,28),DARS 差異 6 次 (編號 1,3,16,22,26,28)。發 現了多項重要訊息如下:
(1) 在編號 1 與 2 中看到加拿大相對於挪威同時有 ARS 與 DARS,挪威相對於 加拿大有 MRS。
以挪威為焦點組 (實心點),加拿大為參照組 (空心點) 之 F 矩陣與各模型各題
閾值估計圖如下。
F =
0.5 0.5 0.625 0.625 0.75 0.75 0.75 0.625 0.125 0.125 0.375 0.375 0.125 0.125 0.375 0.375
(43)
圖 13: 挪威 (實心點) 與加拿大 (空心點) 各模型各題閾值估計圖
如再參考表 6,則可以進一步判定挪威相對於加拿大有 MRS4 型作答風格。
(2) 在編號 3 與 4 中,清楚地看到加拿大相對於法國有 ERS,且法國相對於加 拿大有 MRS。
(3) 在編號 21 與 22 中,立陶宛相對於法國同時有 ARS 與 DARS,法國相對於 立陶宛有 MRS。
(4) 在編號 16,立陶宛相對於挪威同時有 ARS 與 DARS。
(5) 在編號 26,立陶宛相對於香港同時有 ARS 與 DARS。
(6) 在編號 13,挪威相對於香港有 ARS。
(7) 在編號 5,加拿大相對於香港有 ARS。
綜合 (1)∼(4) 可以看到加拿大與立陶宛傾向極端作答,法國與挪威傾向中立
5 研究限制
由於作答風格差異的定義僅牽涉到相同態度的人回答各選項的機率不盡相 同,這使得可以操弄的變項非常多,例如五點量表的作答風格差異不只四種,
六點量表的分類又更多,乃至於因素負荷量或閾值的參數設定都可以當作變項 來處理。因此本研究有下列模擬或使用上的限制:
1、模擬資料都是標準型的作答風格差異,並且是單因子五點量表。
2、焦點組相較於參照組的閾值改變,中間閾值的移動量較兩端閾值小,而且 剛好是其一半。
3、生成模擬資料的閾值參數只有一套,並且具有 τj,3 或 τj,2 在 κ 附近的特徵。
4、生成模擬資料的因素負荷量參數只有一套,而且兩群組相同 (因素負荷量沒 有 DIF)。
6 結論與展望
在研究一,經過大量的模擬實驗,可以看到在 MFB 模型下閾值估計的連帶 性相當明顯,利用此特性發展作答風格檢定是一個好方向。
在研究二,經過實徵資料的分析可以看到,本研究所發展的方法確實能 帶來一些新的且可靠的資訊。因此建議在分析多群組態度量表時,先用各種 MFB 模型檢測群組間是否有作答風格差異,若沒有差異,就放心定錨一整題 的閾值。若有差異,則根據作答風格差異的類型,選擇合適的 MFB 方式。例 如在實徵資料分析中,表 22 編號 2 出現 MRS4 型,則根據表 2 使用 MFB1 模 型來分析。因此解決了 MFB 模型在四種常見的作答風格差異下,該定錨哪一 個閾值的問題。
展望的部分有以下三點:
1、問卷若改成多個因子五點量表,用相同的方法應該就能檢定作答風格差異,
可嘗試多因子模擬實驗。
2、做因素負荷量也有 DIF 的模擬實驗,發展適用範圍更廣的檢定。
3、因為檢定的錯誤率幾乎是 0,所以可思考如何將檢定合理與適度的放寬,提 升正確率。尤其是樣本數較小時的 MRS 檢定,是一個需要再克服的問題。
除此之外,比較模擬實驗與實徵資料結果發現實徵資料中所有穩健卡方差 異檢定幾乎都是顯著,也就是說,不論定錨哪一個閾值,比較兩群人的每一個 閾值都幾乎至少有一題達到顯著差異,這顯示模型在實徵資料分析時還有進步 的空間。期待將來能改進模型,使得定錨在某個閾值後,兩群人每一題的這個 閾值都沒有顯著差異!
參考文獻
Asparouhov, T. & Muthén, B.O. (2006). Robust chi square difference testing with mean and variance adjusted test statistics. Retrieved from
https://www.statmodel.com/download/webnotes/webnote10.pdf
Chang, Y-W., Huang, W-K., & Tsai, R. (2015). DIF detection using multiple-group categorical CFA with minimum baseline approach. Journal of Educational Measurement, 52, 181-199.
Drasgow, F.(1984).Scrutinizing psychological tests: Measurement equivalence and equivalent relations with external variables are the central issues. Psycho-logical Bulletin, 95, 134-135.
Greenleaf, E.A. (1992). Improving rating scale measures by detecting and cor-recting bias components in some response style. Journal of Marketing Research, 26, 176-188.
Meisenberg, G., & Williams, A. (2008). Are acquiescent and extreme response styles related to low intelligence and education? Personality and Individual Dif-ferences, 44, 1539-1550.
Moors, G. (2004). Facts and artifacts in the comparison of attitudes among eth-nic minorities: A multigroup latent class structure model with adjustment for response style behavior. European Sociological Review, 20, 303-320.
Muthén, B.O. (1983). Latent variable structural equation modeling with
cate-gorical data. Journal of Econometrics, 22, 43-65.
Muthén, B.O. (1984). A general structural equation model with dichotomous, ordered categorical, and continuous latent variable indicators. Psychometrika, 49, 115-132.
Muthén, B.O. (1998-2004). Mplus technical appendices. Los Angeles, CA:
Muthén & Muthén.
Muthén, L.K. & Muthén, B.O. (1998-2015). Mplus User’s Guide. Seventh Edi-tion. Los Angeles, CA: Muthén & Muthén.
R Core Team (2015). R: A language and environment for statistical computing.
Vienna, Austria: R foundation for statistical computing. Retrieved from http://www.R-project.org/
Satorra, A. (1999). Scaled and adjusted restricted tests in multi-sample analysis of moment structures. In Heijmans, D. D. H., Pollock, D. S. G. & Satorra, A.
(Eds.), Innovations in multivariate statistical analysis: A festschrift for Heinz Neudecker (pp. 233-247), Dordrecht: Kluwer Academic.
Stark, S., Chernyshenko, O.S., & Drasgow, F. (2006). Detecting differential item functioning with confirmatory factor analysis and item response theory: Toward a unified strategy, Journal of Applied Psychology, 91, 1292-1306.
Willem, J.P., & Ronald E.A. (Eds.). (2001). ICT and the emerging paradigm for life-long learning. Amsterdam: IEA.
李盟、郭慶科 (2016)。反應風格與人格特質的關係。心理學進展,6(3),320-331。
附錄 (SITES1998 實徵資料問卷)
圖 15: SITES1998 五點量表問卷 (續)
註:ICT 為 Information Communication Technology 資訊通訊科技之簡寫。