• 沒有找到結果。

以最小限制的離散型因素分析模型檢定多群組間的作答風格差異

N/A
N/A
Protected

Academic year: 2021

Share "以最小限制的離散型因素分析模型檢定多群組間的作答風格差異"

Copied!
55
0
0

加載中.... (立即查看全文)

全文

(1)國立臺灣師範大學數學系碩士班碩士論文. 指導教授: 蔡 蓉 青 博士. 以最小限制的離散型因素分析模型 檢定多群組間的作答風格差異. 研究生: 林 炯 伊. 中 華 民 國 一零五 年 七 月.

(2) 致謝 這篇論文的完成,首先感謝指導教授蔡蓉青老師的諄諄教誨,老師一方面 用心良苦的指導我什麼是文章的邏輯,如何寫出一篇好讀的文章,一方面給我 非常大的創意揮灑空間以及成就感。過程中雖不免有些壓力,卻能愈寫愈有趣 味,最終感嘆當老師的研究生實在收穫滿滿,在完成論文之外,更見識到廣大 的學術研究世界! 在論文口試期間,承蒙口試委員蔡恆修教授、張少同教授對 於論文的細心審閱並給予建議,使得本篇論文更加完備與具備發展性。 在論文的最後衝刺時期,感謝驥緯、冠宏、國棟、建宇與昶宏等同學們的 共同研討與鼓勵,讓我快速地從工作情境轉變為研究生模式,除了刺激論文進 度外,也見識到更多研究以及多元的想法。 最後,尤其感謝我的家人,在家庭時間因工作而僅剩不多的情況下,仍支 持我完成學業,謝謝你們。.

(3) 摘要 本研究目的在多群組離散型因素分析模型下,發展一個檢測作答風格差 異的方法,共分為兩個子研究。研究一透過模擬資料操弄潛藏態度差異、四 種常見作答風格類型與差異程度、樣本大小、問卷題數以及數種最小限制 (minimum free-baseline, MFB) 六個自變項,比較具有作答風格差異的兩群組, 在定錨題之外的各題各閾值的大小關係,最後再操弄閾值特徵符合程度之高 低,使錯誤率在 5% 以下,作為檢定方法的依據。研究二分析「1998 年國際資 訊科技教育應用研究 (SITES 1998)」之跨國五點量表問卷,選取其中六個國 家,兩兩分析對於資訊融入教學的學習成效認同程度是否具有作答風格差異。 研究一結果顯示,隨著樣本數或作答風格差異程度增加,各種作答風格之 閾值特徵皆會更加明顯,檢定的正確率也隨之增加,至於問卷題數則不影響檢 定的正確率與錯誤率,但潛藏態度差異則會影響正確率。研究二結果顯示,雖 然六國之間的各題各閾值幾乎都有顯著差異,但是在 30 個檢定中只有 11 個符 合某種作答風格差異,這可能是國家間存在其他的作答風格差異,或是題目中 還有其他的試題差異功能。而在作答風格顯示有差異的 11 個國家組合中,有 6 個同時出現默認肯定與默認否定的作答風格差異,例如立陶宛對於挪威、法 國與香港三個國家皆如此,可解釋為立陶宛相較於這三個國家,較不傾向回答 中立選項,是一個值得注意的作答風格。 最後依據本研究結果可提出以下建議:在分析多群組態度量表時,先用各 種 MFB 模型檢測群組間是否有作答風格差異,若沒有差異,則可以放心定錨 一整題的閾值。若有差異,則根據作答風格差異的類型,選擇合適的 MFB 方 式。例如群組間顯示出標準型的默認肯定作答風格,就選擇定錨第 1 個或第 2 個閾值。. 關鍵詞:作答風格、態度量表、多群組離散型因素分析、穩健卡方差異檢定。. iii.

(4) Abstract The purpose of this study is to develop a test for detecting the difference in response styles between groups under the multiple-group categorical confirmatory factor analysis model. In Study 1, the factors of impact of latent attitude, sample size, the number of questionnaire questions, and the type of minimum free-baseline (MFB) setting were manipulated and their effects on the empirical Type I error and power of the proposed test in detecting different types of response styles investigated. The results indicate that the greater the sample size or the larger degree of response styles, the greater the degree of compliance of thresholds’ characteristics and the power of the test. As for the number of questionnaire questions had no impact with type I & II error. In Study 2, we analyzed the Likert scale data of Second Information Technology in Education Study 1998. In particular, six countries were chosen and examined for the presence of various response styles in their attitude towards the role of computer and other information and communication technologies. We found significant differences in response styles between 11 pairs of countries, among which 6 pairs showing the acquiescent and disacquiescent response styles simultaneously, such as Lithuania in comparison to Norway, France, and Hong Kong. The results implied that Lithuania was not inclined to midpoint response style with respect to the other three countries. Based on our findings, some recommendations are given as follows: In the analysis of Likert scale, one can first start with a variety of MFB models to check whether there exists any response style between groups, if not, we can anchor one item as the common method to increase power. If so, we select the appropriate MFB method for the different types of response style. For example, while testing for the extreme response style between the two groups, we could choose to anchor the threshold of the middle category.. iv.

(5) Keywords: response style, Likert scale, multiple-group catigorical CFA, robust chi-square difference test. v.

(6) 目錄 ii. 致謝 中文摘要. iii. Abstract. iv. 1 緒論. 1. 1.1. 研究動機 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.2. 研究目的 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 2. 2 MCCFA 模型與作答風格檢定方式. 3. 2.1. MCCFA 模型簡介 . . . . . . . . . . . . . . . . . . . . . . . . . .. 3. 2.2. 模型辨識與 MFB . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4. 2.3. 四種常見的作答風格定義 . . . . . . . . . . . . . . . . . . . . . .. 4. 2.3.1. 極端作答風格 (ERS) . . . . . . . . . . . . . . . . . . . . .. 5. 2.3.2. 折衷作答風格 (MRS) . . . . . . . . . . . . . . . . . . . .. 5. 2.3.3. 默認肯定作答風格 (ARS) . . . . . . . . . . . . . . . . . .. 6. 2.3.4. 默認否定作答風格 (DARS) . . . . . . . . . . . . . . . . .. 6. 作答風格差異檢定 . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 2.4.1. 穩健卡方差異檢定簡介. . . . . . . . . . . . . . . . . . . .. 7. 2.4.2. 作答風格差異檢定 . . . . . . . . . . . . . . . . . . . . . .. 9. 2.4.3. ERS 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 11. 2.4.4. MRS 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 13. 2.4.5. ARS 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 14. 2.4.6. DARS 檢定 . . . . . . . . . . . . . . . . . . . . . . . . . .. 16. 2.4. vi.

(7) 3 模擬研究設計與結果. 18. 3.1. 自變項、依變項與參數設定 . . . . . . . . . . . . . . . . . . . . .. 18. 3.2. ERS 實驗設定. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 20. 3.3. MRS 實驗設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 21. 3.4. ARS 實驗設定 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 22. 3.5. DARS 模擬設定 . . . . . . . . . . . . . . . . . . . . . . . . . . .. 23. 3.6. 模擬結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 3.6.1. fk,c 的模擬結果 . . . . . . . . . . . . . . . . . . . . . . . .. 24. 3.6.2. 錯誤率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 3.6.3. 正確率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32. 討論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 34. 3.7. 4 實徵資料分析. 36. 4.1. 資料說明 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 36. 4.2. 分析結果與討論 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 5 研究限制. 40. 6 結論與展望. 41. 參考文獻. 42. 附錄. 44. vii.

(8) 表目錄 1. ERS 的類型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 2. MRS 的類型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 3. ARS 的類型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 4. DARS 的類型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 5. 不同的 ERS 類型在四種模型下的閾值估計特徵 . . . . . . . . . .. 12. 6. 不同的 MRS 類型在四種模型下的閾值估計特徵 . . . . . . . . . .. 13. 7. 不同的 ARS 類型在四種模型下的閾值估計特徵 . . . . . . . . . .. 15. 8. 不同的 DARS 類型在四種模型下的閾值估計特徵 . . . . . . . . .. 16. 9. 參照組的因素負荷量與閾值的設定 . . . . . . . . . . . . . . . . .. 19. 10. ERS 的 fk,c 模擬結果列表,J = 15 題 . . . . . . . . . . . . . . .. 25. 11. ERS 的 fk,c 模擬結果列表,J = 15 題 (續) . . . . . . . . . . . .. 26. 12. MRS 的 fk,c 模擬結果列表,J = 15 題 . . . . . . . . . . . . . . .. 27. 13. MRS 的 fk,c 模擬結果列表,J = 15 題 (續) . . . . . . . . . . . .. 28. 14. ARS 的 fk,c 模擬結果列表,J = 15 題 . . . . . . . . . . . . . . .. 29. 15. ARS 的 fk,c 模擬結果列表,J = 15 題 (續) . . . . . . . . . . . .. 30. 16. DARS 的 fk,c 模擬結果列表,J = 15 題 . . . . . . . . . . . . . .. 31. 17. DARS 的 fk,c 模擬結果列表,J = 15 題 (續) . . . . . . . . . . .. 32. 18. 四種 RS 差異檢定的錯誤率列表 . . . . . . . . . . . . . . . . . . .. 33. 19. ERS 與 MRS 差異檢定的正確率列表 . . . . . . . . . . . . . . . .. 34. 20. ARS 與 DARS 檢定的正確率列表 . . . . . . . . . . . . . . . . . .. 35. 21. 選用的國家與樣本數列表 . . . . . . . . . . . . . . . . . . . . . .. 37. 22. 六國作答風格檢定結果與模型配適度列表 (m = M = 0.5) . . . .. 39. viii.

(9) 圖目錄 1. 四種作答風格之閾值特徵示意圖 . . . . . . . . . . . . . . . . . .. 7. 2. 沒有作答風格差異的兩群組閾值估計圖 . . . . . . . . . . . . . . .. 10. 3. 焦點組具有作答風格差異的兩群組閾值估計圖 . . . . . . . . . . .. 10. 4. 作答風格檢定流程圖 . . . . . . . . . . . . . . . . . . . . . . . . .. 17. 5. 甲對於乙有 ERS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 甲對於乙有 ERS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7. 22. 甲對於乙有 DARS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選 項回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . .. 12. 22. 甲對於乙有 ARS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 11. 21. 甲對於乙有 ARS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10. 21. 甲對於乙有 MRS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 9. 20. 甲對於乙有 MRS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項 回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8. 20. 23. 甲對於乙有 DARS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選 項回答機率比較圖 . . . . . . . . . . . . . . . . . . . . . . . . . .. 23. 13. 挪威 (實心點) 與加拿大 (空心點) 各模型各題閾值估計圖 . . . .. 38. 14. SITES1998 五點量表問卷 . . . . . . . . . . . . . . . . . . . . . .. 45. 15. SITES1998 五點量表問卷 (續). 46. ix. . . . . . . . . . . . . . . . . . . ..

(10) 1. 緒論 本章共分為兩節,第一節為本研究之研究動機,第二節則是條列本研究之. 研究目的並加以說明。. 1.1. 研究動機. 作答風格或者稱為反應風格 (response style, RS) 的差異,是指兩位潛藏態 度相同的作答者在回答態度量表問題時,其結果卻有系統性的不同。例如對於 外來文化抱持相同的態度的甲乙兩人,在填寫一份對於外來文化態度的問卷調 查時,對於每一個問題,甲回答「不同意也不反對」的機率皆大於乙,而乙回答 「同意」的機率皆大於甲,就稱甲相對於乙有折衷作答風格 (midpoint response style, MRS),或是乙相對於甲有默認肯定作答風格 (acquiescence response style, ARS)。以機率函數表達為: P甲 (Yj = 3|η) > P乙 (Yj = 3|η),. j = 1, 2, ..., J,. (1). P甲 (Yj = 4|η) < P乙 (Yj = 4|η),. j = 1, 2, ..., J,. (2). 其中假設回答 3 表示「不同意也不反對」,回答 4 表示「同意」,Yj 為第 j 題的 作答變數,η 為潛藏態度。 通常我們把潛在態度或能力相同的人,其受測結果之觀測變項也有相同 之表現稱為測量恆等性 (Measurement Equivalence/Invariance, ME/I)(Drasgow, 1984),因此像作答風格差異這種態度相同,但回答某些選項的機率卻不同的 情形,也可視為不具測量恆等性,或是每一題皆具有試題差異功能 (differential item functioning, DIF)。換言之,影響某個問題作答結果的因素除了原本要量 測的態度或能力之外,還有其他像是性別、國別、城鄉差異、文化差異等因 素。這是問卷或試題設計者不願見到的情形,因為 DIF 必然會影響考試的公平 性或造成態度的誤判。然而一般對於 DIF 的認知或模擬研究設定,不會每一題 都有 DIF,在整份題目中有 30% 的 DIF 題就非常多了。而作答風格差異的特. 1.

(11) 點就是「題題有 DIF」與「跨越不同主題的量表」 ,而且每一題所顯現的 DIF 是 相同的,例如甲對於乙有折衷作答風格,每一題就都呈現這種風格,不會突然 有一題呈現默認肯定作答風格。雖然比起每個 DIF 題可能有不同的 DIF 種類, DIF 類型都相同在參數估計或檢定感覺是更容易的,但「題題有 DIF」卻讓過 去必須定錨 (anchor) 一個沒有 DIF 試題的所有閾值以估計參數變成不可能! 這 就是本研究採用最小限制基線模式開放法 (minimum free-baseline, MFB),將 原本定錨某一題的所有閾值改成只定錨某一題其中一個閾值 (Chang, Huang, & Tsai, 2015),想解決的問題。. 1.2. 研究目的. 許多文獻指出跨國研究皆顯現作答風格差異,例如中東與拉丁美洲人傾 向極端回答,東亞與西歐人較不喜歡極端的回答 (Meisenberg, & Williams, 2008),以及中國人相較於其他國家,因為深受儒家中庸之道思想的影響,而 有較強的折衷或默認肯定作答風格 (李盟、郭慶科,2016) 等。因此在跨國調 查的資料中,採用的模型如不允許作答風格差異,將很可能會造成模型錯誤設 定 (model mis-specification) 並降低態度分析或推估的正確性 (Greenleaf, 1992; Moors, 2003)。 本研究之研究目的可分為以下三點: 1、探討四種常見的作答風格在各種 MFB 模型中,閾值估計結果所顯現的型式 (pattern)。 2、依據閾值估計結果所顯現的型式,設計檢定四種作答風格之方式,並討論 檢定的錯誤率與正確率。 3、檢定跨國的實徵資料是否有這四種作答風格差異,並與文獻作比較。 以下各章將依序介紹所使用的模型、作答風格的檢定方式、模擬實驗設定 與結果,最後是實徵資料的分析、研究限制與討論。. 2.

(12) 2. MCCFA 模型與作答風格檢定方式 過去在分析問卷是否有 DIF 時,Stark 等人 (2006) 曾經嘗試用視資料為連. 續型的 MG-MACS 模型進行分析,但是大部分的態度量表均為離散型,直接 視為連續型不大恰當。近年 Chang, Huang, & Tsai (2015) 的研究指出在多群組 離散型驗證性因素分析 (multiple-group catigorical confirmatory factor analysis, MCCFA) 模型下,使用穩健卡方差異檢定 (robust chi-square difference test) 來 檢測 DIF 試題是有效的。故本研究採用 MCCFA 模型作模擬研究。由以下兩 個重點來設計作答風格差異的檢定。一是利用各種最小限制 (MFB) 法在閾值 (threshold) 估計中呈現的型式 (pattern)。二是利用穩健卡方差異檢定確保群組 間的閾值估計除了大小關係符合某種型式,差異也達到顯著。. 2.1. MCCFA 模型簡介. 考慮一個 N 個作答者,J 題問題,每題 C 個選項的情境,令 Yi,j 為作答者 i 對第 j 題之反應變數,假設作答者 i 屬於第 g 個群組,則他的反應變數 Yi,j 滿足以下關係: (g). Yi,j = c, ∗(g). Yi,j. (g) (g). = λj ηi + ϵi,j ,. ∗(g). 其中 Yi,j. (g). ∗(g). 若 τj,c−1 < Yi,j. i = 1, 2, ..., Ng ,. (g). ≤ τj,c ,. j = 1, 2, ..., J,. (g). (g). 之因素負荷量 (loading),若 λj 程度愈大,反之若 (g). g = 1, 2, ..., G,. (4). (g). 為第. 為第 g 群組之作答者 i 對第 j 題的連續潛藏作答變數。ηi. g 群組之作答者 i 對於欲量測之因素的潛藏態度。λj. λj. (3). c = 1, 2, ..., C,. (g) λj. 為第 g 群組在第 j 題 (g). 愈大,表示第 j 題量測出潛藏態度 ηi. 的. = 0 則表示第 j 題與想要量測之潛藏態度無關,若. < 0 則顯示第 j 題可能是反向題。ϵi,j 為殘差變數,並假設殘差不受群組 (g). 變數 g 的影響且期望值為 0(Muthén, 1983; 1984)。τj,c 表示第 g 群組在第 j 題 (g). 之閾值 (threshold),決定了作答者 i 在給定 ηi (g). (g). 率,τj,0 = −∞,τj,C. (g). 後,選擇各選項之機 ∑ = ∞。Ng 是第 g 群組的人數,滿足 G g=1 Ng = N 。最. 3. 與 λj.

(13) (g). 後,ηi. 與 ϵi,j 皆假設為常態分配,彼此互相獨立。(Stark, Chernyshenko, &. Drasgow, 2006) (g). ηi. 2.2. 2(g). ∼ N (κ(g) , φ(g) ),. ϵi,j ∼ N (0, σj. (5). ). 模型辨識與 MFB. 由於模型參數眾多,例如分析 J 題的 C 點量表時,每一個群組皆須估計 J (g). 2(g). 個因素負荷量 λj ,J 個殘差變異數 σj. (g). ,(C − 1)J 個閾值 τj,c ,以及潛藏態. 度的平均 κ(g) 與變異數 φ(g) 各 1 個,總計 G 個群組有 ((C + 1)J + 2)G 個參 數要估計。為了讓模型可以辨識,需再限制: (g). λ1 = 1,. κ(1) = 0,. 2(g). σj. = 1,. (1). (g). τ1,1 = τ1,1 ,. g = 1, 2, ..., G,. j = 1, 2, ..., J, (6). 上述的限制再拿掉一個,模型就無法辨識 (Chang, Huang, & Tsai, 2015), 故稱之為最小限制基線模式開放法 (minimum free-baseline, MFB) 的 MCCFA (1). (g). (1). (g). 模型。又因為其中對於閾值的限制 τ1,1 = τ1,1 可以換成 τ1,c = τ1,c , 1, 2, ..., G,. g =. c = 1, 2, ..., (C − 1),故依序命名為 MFB1 法,MFB2 法,...,MFB(C-. 1) 法以區辨之。 最後,模型在上述限制之下滿足: ∗(g). (g). Yi,j |η (g) ∼ N (λj η (g) , 1) (g). (g). (g). P (Yi,j = c|η (g) ) = Φ(τj,c − λj η (g) ) − Φ(τj,c−1 − λj η (g) ), c = 0, 1, 2, ..., C. (7) (8). 其中 Φ 為標準常態分配的累積分配函數 (CDF of the standard normal distribution)。. 2.3. 四種常見的作答風格定義. 為了方便說明閾值與作答風格之間的關係,下列各作答風格將以五點量表 (每題有 4 個閾值) 為例,每張量表有 J 個問題,選項 1 表示非常不同意,2 表. 4.

(14) 示不同意,3 表示不同意也不反對,4 表示同意,5 表示非常同意。若群組分為 焦點組 (focal group, f ) 與參照組 (reference group, r),則焦點組對於參照組具 有四種作答風格定義如下: 2.3.1 極端作答風格 (ERS) 極端作答風格 (extreme response style, ERS),指作答皆傾向回答兩端點的 (f ). (r). (f ). (r). 選項,τj,1 > τj,1 且 τj,4 < τj,4 , (f ). (f ). (r). j = 1, 2, ..., J。再加上 τj,2 與 τj,2 的大小關. (r). 係以及 τj,3 與 τj,3 的大小關係,可將 ERS 細分成標準型與 1 到 4 型: 表 1: ERS 的類型 標準型 ERS1 型 ERS2 型 ERS3 型 ERS4 型. (f ). τj,2 (f ) τj,2 (f ) τj,2 (f ) τj,2 (f ) τj,2. (r). = τj,2 (r) < τj,2 (r) > τj,2 (r) = τj,2 (r) = τj,2. 且 且 且 且 且. (f ). τj,3 (f ) τj,3 (f ) τj,3 (f ) τj,3 (f ) τj,3. (r). = τj,3 (r) = τj,3 (r) = τj,3 (r) < τj,3 (r) > τj,3. 由於模型辨識至少要定錨某一題的某一個閾值,而且作答風格會一致的呈現在 每一題,因此上述的 ERS 分類就是五點量表資料符合 ERS 特徵的所有可能 類型。同樣道理,以下的分類亦包含了五點量表資料符合 MRS、ARS、DARS 特徵的所有可能類型。 2.3.2 折衷作答風格 (MRS) 折衷作答風格 (midpoint response style, MRS),指作答者皆傾向回答中立的 (f ). (r). (f ). (r). 選項,τj,2 < τj,2 且 τj,3 > τj,3 , (f ). (f ). (r). j = 1, 2, ..., J。再加上 τj,1 與 τj,1 的大小關. (r). 係以及 τj,4 與 τj,4 的大小關係,可將 MRS 細分成標準型與 1 到 4 型:. 5.

(15) 表 2: MRS 的類型 標準型 MRS1 型 MRS2 型 MRS3 型 MRS4 型. (f ). τj,1 (f ) τj,1 (f ) τj,1 (f ) τj,1 (f ) τj,1. (r). = τj,1 (r) < τj,1 (r) > τj,1 (r) = τj,1 (r) = τj,1. 且 且 且 且 且. (f ). τj,4 (f ) τj,4 (f ) τj,4 (f ) τj,4 (f ) τj,4. (r). = τj,4 (r) = τj,4 (r) = τj,4 (r) < τj,4 (r) > τj,4. 2.3.3 默認肯定作答風格 (ARS) 默認肯定作答風格 (acquiescent response style, ARS),表示作答者傾向回答 (f ). (r). (f ). (r). (f ). 同意的選項,τj,3 < τj,3 且 τj,4 < τj,4 , (f ). (r). j = 1, 2, ..., J。再加上 τj,1 與 τj,1 的大. (r). 小關係以及 τj,2 與 τj,2 的大小關係,可將 ARS 細分成標準型與 1 到 4 型: 表 3: ARS 的類型 標準型 ARS1 型 ARS2 型 ARS3 型 ARS4 型. (f ). τj,1 (f ) τj,1 (f ) τj,1 (f ) τj,1 (f ) τj,1. (r). = τj,1 (r) < τj,1 (r) > τj,1 (r) = τj,1 (r) = τj,1. 且 且 且 且 且. (f ). τj,2 (f ) τj,2 (f ) τj,2 (f ) τj,2 (f ) τj,2. (r). = τj,2 (r) = τj,2 (r) = τj,2 (r) < τj,2 (r) > τj,2. 2.3.4 默認否定作答風格 (DARS) 默認否定作答風格 (disacquiescent response style, DARS),指作答者皆傾向 (f ). (r). (f ). (r). (f ). 回答不同意的選項,τj,1 > τj,1 且 τj,2 > τj,2 , j = 1, 2, ..., J。再加上 τj,3 與 (r). (f ). (r). τj,3 的大小關係以及 τj,4 與 τj,4 的大小關係,可將 DARS 細分成標準型與 1 到 4 型:. 6.

(16) 表 4: DARS 的類型 標準型 DARS1 型 DARS2 型 DARS3 型 DARS4 型. (f ). τj,3 (f ) τj,3 (f ) τj,3 (f ) τj,3 (f ) τj,3. (r). = τj,3 (r) < τj,3 (r) > τj,3 (r) = τj,3 (r) = τj,3. 且 且 且 且 且. (f ). τj,4 (f ) τj,4 (f ) τj,4 (f ) τj,4 (f ) τj,4. (r). = τj,4 (r) = τj,4 (r) = τj,4 (r) < τj,4 (r) > τj,4. 將上述焦點 (f ) 組的四種作答風格標準型的閾值特徵由上而下依序圖示如下:. 圖 1: 四種作答風格之閾值特徵示意圖 其中 Ai 表示在給定 η = −0.8,λ = 1 與閾值 (-2.78,-1.31,-0.6,0.96) 之下,此題回 答 i 的機率。. 2.4. 作答風格差異檢定. 2.4.1 穩健卡方差異檢定簡介 本 研 究 的 模 型 參 數 估 計 使 用 Mplus 軟 體 與 其 中 的 「修 正 平 均 與 變 異 數 的 加 權 最 小 平 方 法」(weighted least squares mean and variance adjusted,. 7.

(17) WLSMV)、「穩健卡方差異檢定」(robust chi-square difference test) 來進行巢套 (nested) 模型的差異檢定 (Asparouhov, & Muthén, 2006)。以下僅摘要介紹其 檢定統計量與其近似分配。 令結構方程模型 M0 與 M1 的參數向量分別為 θ0 與 θ1 ,di 表示模型 Mi 之 參數個數,M0 巢套在 M1 中 (d0 < d1 ),則檢定 θ1 = f (θ0 ) 所使用的檢定統計 量為 T = T0 − T1. (9). T0 = (σ(θ0 ) − s)′ W −1 (σ(θ0 ) − s). (10). T1 = (σ(θ1 ) − s)′ W −1 (σ(θ1 ) − s),. (11). 其中. s 是由樣本觀察而來的共變異數矩陣 (variance covariance matrix),σ(θi ) 是由 Mi 模型所估計的共變異數矩陣 (詳見 Muthén & Muthén 1998-2004)。 而檢定背後的統計量 T 為近似自由度d′ 之卡方分配 T =. d T, tr(M ). d′ 為最接近. d = d1 − d0. (tr(M ))2 之正整數 tr(M 2 ). M = W −1 ∆′1 (P1−1 − H(H ′ P1 H)−1 H ′ )∆1 W −1 Γ ∆i =. ∂σ(θi ) ∂θi. Pi = ∆′i W −1 ∆i H=. ∂θ1 ∂θ0. Γ 為 s 的漸進共變異數矩陣。. (12) (13) (14) (15) (16) (17) (18) (19). T 的平均數與變異數修正以及 T 的近似分配推導請見 Satorra(1999) 第 3 章。. 8.

(18) 2.4.2 作答風格差異檢定 首先在 M F Bk 法中定義指標函數 Dk,c 如下: { Dk,c =. 0, 若接受 H0 1, 若拒絕 H0 (f ). (20) (r). 其中 H0 是穩健卡方差異檢定的虛無假設 H0 : τj,c = τj,c ,. j = 1, 2, ..., J。. 舉例來說,D1,1 = 0 就是在 MFB1 法的 MCCFA 模型中,焦點組的每一 題第一個閾值與參照組的每一題第一個閾值沒有顯著差異。D2,3 = 1 就是在 MFB2 法的 MCCFA 模型下,焦點組的第三個閾值與參照組的第三個閾值,在 J 題中至少有 1 題具有顯著差異。須注意此處只檢定了兩群組閾值差異是否顯 著,還沒比較兩群組的閾值有無系統性差異。 再定義. J ∑. fk,c =   F = . f1,1 f2,1 .... (f ). (r). I(ˆ τj,c > τˆj,c ). j=2. J −1 f1,2 f2,2 .... f(C−1),1 f(C−1),2.  ... f1,(C−1) ... f2,(C−1)    ... ... ... f(C−1),(C−1). (21). (22). 也就是說,fk,c 表示 MFBk 法的 MCCFA 模型參數估計中,比較兩群組間第 2 到 J 題的第 c 個閾值,焦點組大於參照組的比例。F 則是 fk,c 形成的矩陣。畫 圖說明如下:. 9.

(19) 圖 2: 沒有作答風格差異的兩群組閾值估計圖. 圖 2 是沒 有作 答風 格差 異 的 兩 群各 1000 人用 MFB1 法所估 出的 閾值 圖, 其 穩 健 卡 方 差 異 檢 定 之 P 值 第 一 個 到 第 四 個 (圖 中 由 下 到 上) 分 別 是 0.7561,0.4907,0.5378,0.2632。圖 3 是焦點組 (實心點) 具有 ARS 標準型作答 風格與參照組 (空心點) 各 1000 人用 MFB1 法所估出的閾值圖,其穩健卡方差 異檢定之 P 值第一個到第四個分別是 0.4345,0.7403,0.0426,0.0107。. 圖 3: 焦點組具有作答風格差異的兩群組閾值估計圖. 10.

(20) 從以上兩個例子可以看出,穩健卡方差異檢定扮演了重要的角色,因為 不具作答風格差異的兩群組,閾值的估計很容易出現一致性的大小關係,而 誤判具為作答風格的差異! 探討其原因,假設在焦點與參照兩群組間沒有 (f ). 作答風格差異而且因素負荷量也沒有 DIF 的情形下,參數 τ1,1 遭低估,由 ∗(f ). (f ). (f ). Yi,j |η (f ) ∼ N (λj η (f ) , 1) 可知 λj η (f ) 必定也要低估才能平衡失去的回答 1 的 (f ). 機率,又因為 λj. (f ). 與 λj η (f ) 不一定是單調地一個變小,另一個就變小,因此 (f ). (f ). (f ). 可以預見閾值估計結果 τ2,1 , τ3,1 , ..., τJ,1 也都一起低估,而呈現一致性的大小關 (f ). (f ). (f ). 係。再者,焦點組的各題的第 2,3,4 個閾值 τj,2 , τj,3 , τj,4 也會有相同理由導致 全部一起低估。這樣的參數估計連帶性以及穩健卡方差異檢定,成為接下來利 用 MFB 模型來設計檢定的主要想法。 2.4.3 ERS 檢定 (f ). (r). 考慮 ERS 標準型的焦點組在 MFB1 模型中閾值的估計,由於 τ1,1 > τ1,1 卻 (f ). (r). (f ). (f ). (f ). 定錨了 τ1,1 = τ1,1 ,因此在參數估計時,可以預見 τj,2 , τj,3 , τj,4 會一起低估。 (f ). (r). 例如若焦點組相對於參照組是 ERS 標準型,參數估計就會有 τj,2 < τj,2 且 (f ). (r). (f ). (r). (f ). τj,3 < τj,3 且 τj,4 < τj,4 。但如果是 ERS1 型的焦點組在 MFB2 模型中閾值 τj,4 (f ). (r). (f ). (f ). (r). 的估計,因為 τj,4 < τj,4 與係數估計連帶性導致 τj,4 要高估,最後 τj,4 與 τj,4 就沒有明確的大小關係。完整的 ERS 閾值相對大小關係分析如表 5。. 由表 5 中焦點組相對於參照組有 ERS 標準型時各模型的分析,可推測此時 F 矩陣有明顯的型式 FERS0 如下:  f1,1 f1,2 ≈ 0 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 ≈ 1 f2,2 f2,3 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 f3,3 f3,4 ≈ 0  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 ≈ 1 f4,4 . FERS0. (23). 令 ΨERSt,0 與 ΨERSt,1 分別表示 FERSt 中出現型式「≈ 0」與「≈ 1」的位置所形 成的集合,例如: ΨERS0,0 = {(1, 2), (1, 3), (1, 4), (2, 4), (3, 4)}. 11. (24).

(21) 表 5: 不同的 ERS 類型在四種模型下的閾值估計特徵 ERS 類型. 模型. MFB1 MFB2 ERS 標準型 MFB3 MFB4 MFB1 MFB2 ERS1 型 MFB3 MFB4 MFB1 MFB2 ERS2 型 MFB3 MFB4 MFB1 MFB2 ERS3 型 MFB3 MFB4 MFB1 MFB2 ERS4 型 MFB3 MFB4. 焦點組閾值估計特徵 (f ) (f ) (f ) (f ) τj,1 τj,2 τj,3 τj,4 小 小 小 大 小 大 小 大 大 大 小 小 小 大 大 大 小 小 大 大 小 小 小 小 大 大 小 大 大 大 小 小 小 大 小 小 大 大 大 大 小 小 大 大 小 小 小 大 大 大. ΨERS0,1 = {(2, 1), (3, 1), (4, 1), (4, 2), (4, 3)}. (25). 則 ERS 的檢定統計量 IERS = ∑. {(. t=0,1,2,3,4. ∏. (k,c)∈ΨERSt,0. I(fk,c ≤ m))(. ∏ (k,c)∈ΨERSt,1. I(fk,c ≥ M ))(. max. (k,c)∈ΨERSt,0 ∪ΨERSt,1. {Dk,c })}. (26) 若 IERS = 0 則拒絕焦點組相對於參照組有極端作答風格差異的假設, 若 IERS ̸= 0 則接受焦點組相對於參照組有極端作答風格差異的假設。 其中 ERS0,ERS1,ERS2,ERS3,ERS4 依序表示 ERS 標準型,ERS1 型,ERS2 型,ERS3 型,ERS4 型。m 與 M 是決定檢定嚴格或寬鬆的參數,在 3.6 模擬結果中有進 一步的討論。. 12.

(22) 2.4.4 MRS 檢定 (f ). (r). 考慮 MRS 標準型的焦點組在 MFB2 模型中閾值的估計,由於 τ1,2 < τ1,2 (f ). (r). (f ). (f ). (f ). 卻定錨了 τ1,2 = τ1,2 ,因此在參數估計時,可以預見 τj,1 , τj,3 , τj,4 會一起高估。 (f ). (r). 例如若焦點組相對於參照組是 MRS 標準型,參數估計就會有 τj,1 > τj,1 且 (f ). (r). (f ). (r). τj,3 > τj,3 且 τj,4 > τj,4 。但如果是 MRS1 型的焦點組在 MFB2 模型中閾值 (f ). (f ). (r). (f ). (f ). τj,2 的估計,因為 τj,1 < τj,1 與係數估計連帶性導致 τj,1 要高估,最後 τj,1 與 (r). τj,1 就沒有明確的大小關係。完整的 MRS 閾值相對大小關係分析如表 6。 表 6: 不同的 MRS 類型在四種模型下的閾值估計特徵 MRS 類型. 模型. MFB1 MFB2 MRS 標準型 MFB3 MFB4 MFB1 MFB2 MRS1 型 MFB3 MFB4 MFB1 MFB2 MRS2 型 MFB3 MFB4 MFB1 MFB2 MRS3 型 MFB3 MFB4 MFB1 MFB2 MRS4 型 MFB3 MFB4. 焦點組閾值估計特徵 (f ) (f ) (f ) (f ) τj,1 τj,2 τj,3 τj,4 小 大 大 大 大 小 小 小 小 大 大 大 大 大 小 小 小 小 小 大 小 小 大 大 大 小 小 大 小 大 小 大 小 大 大 小 小 小 大 大 小 大 大 大 大 大 小 小 小 小. 由表 6 中焦點組相對於參照組有 MRS 標準型時各模型的分析,可推測此時 F 矩陣有明顯的型式 FM RS0 如下:. 13.

(23) . FM RS0.  f1,1 f1,2 ≈ 0 f1,3 ≈ 1 f1,4  f2,1 ≈ 1 f2,2 f2,3 ≈ 1 f2,4 ≈ 1   =  f3,1 ≈ 0 f3,2 ≈ 0 f3,3 f3,4 ≈ 0  f4,1 f4,2 ≈ 0 f4,3 ≈ 1 f4,4. (27). 令 ΨM RSt,0 與 ΨM RSt,1 分別表示 FM RSt 中出現型式「≈ 0」與「≈ 1」的位置所形 成的集合,例如: ΨM RS0,0 = {(1, 2), (3, 1), (3, 2), (3, 4), (4, 2)}. (28). ΨM RS0,1 = {(1, 3), (2, 1), (2, 3), (2, 4), (4, 3)}. (29). 則 MRS 的檢定統計量 IM RS = ∑. {(. t=0,1,2,3,4. ∏. ∏. I(fk,c ≤ m))(. (k,c)∈ΨM RSt,0. I(fk,c ≥ M ))(. max. (k,c)∈ΨM RSt,0 ∪ΨM RSt,1. (k,c)∈ΨM RSt,1. {Dk,c })}. (30) 若 IM RS = 0 則拒絕焦點組相對於參照組有折衷作答風格差異的假設, 若 IM RS ̸= 0 則接受焦點組相對於參照組有折衷作答風格差異的假設。 其中 MRS0,MRS1,MRS2,MRS3,MRS4 依序表示 MRS 標準型,MRS1 型,MRS2 型,MRS3 型,MRS4 型。m 與 M 是決定檢定嚴格或寬鬆的參數,在 3.6 模擬結 果中有進一步的討論。 2.4.5 ARS 檢定 (f ). (r). 考慮 ARS 標準型的焦點組在 MFB3 模型中閾值的估計,由於 τ1,3 < τ1,3 卻 (f ). (r). (f ). (f ). (f ). 定錨了 τ1,3 = τ1,3 ,因此在參數估計時,可以預見 τj,1 , τj,2 , τj,4 會一起高估。 (f ). (r). 例如若焦點組相對於參照組是 MRS 標準型,參數估計就會有 τj,1 > τj,1 且 (f ). (r). (f ). (r). (f ). (f ). (r). τj,2 > τj,2 ,但 τj,4 < τj,4 與係數估計連帶性導致 τj,4 要高估,最後 τj,4 與 τj,4 就沒有明確的大小關係。完整的 ARS 閾值相對大小關係分析如表 7。. 由表 7 中焦點組相對於參照組有 ARS 標準型時各模型的分析,可推測此時 F 矩陣有明顯的型式 FARS0 如下:. 14.

(24) 表 7: 不同的 ARS 類型在四種模型下的閾值估計特徵 ARS 類型. 模型. MFB1 MFB2 ARS 標準型、2 型、4 型 MFB3 MFB4 MFB1 MFB2 ARS1 型 MFB3 MFB4 MFB1 MFB2 ARS3 型 MFB3 MFB4. 焦點組閾值估計特徵 (f ) (f ) (f ) (f ) τj,1 τj,2 τj,3 τj,4 小 小 小 小 大 大 大 大 大 小 小 小 大 大 小 小 小 大 大 大. . FARS0.  f1,1 f1,2 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 f2,2 f2,3 ≈ 0 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 ≈ 1 f3,3 f3,4  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 f4,4. (31). 令 ΨARSt,0 與 ΨARSt,1 分別表示 FARSt 中出現型式「≈ 0」與「≈ 1」的位置所形 成的集合,例如: ΨARS0,0 = {(1, 3), (1, 4), (2, 3), (2, 4)}. (32). ΨARS0,1 = {(3, 1), (3, 2), (4, 1), (4, 2)}. (33). 則 ARS 的檢定統計量 IARS = ∑. {(. t=0,1,2,3,4. ∏. (k,c)∈ΨARSt,0. I(fk,c ≤ m))(. ∏ (k,c)∈ΨARSt,1. I(fk,c ≥ M ))(. max. (k,c)∈ΨARSt,0 ∪ΨARSt,1. {Dk,c })}. (34) 若 IARS = 0 則拒絕焦點組相對於參照組有默認肯定作答風格差異的假設, 若 IARS ̸= 0 則接受焦點組相對於參照組有默認肯定作答風格差異的假設。. 15.

(25) 其 中 ARS0,ARS1,ARS2,ARS3,ARS4 依 序 表 示 ARS 標 準 型,ARS1 型,ARS2 型,ARS3 型,ARS4 型。m 與 M 是 決 定 檢 定 嚴 格 或 寬 鬆 的 參 數, 在 3.6 模 擬結果中有進一步的討論。 2.4.6 DARS 檢定 (f ). (r). 考慮 DARS 標準型的焦點組在 MFB2 模型中閾值的估計,由於 τ1,2 > τ1,2 (f ). (r). (f ). (f ). (f ). 卻定錨了 τ1,2 = τ1,2 ,因此在參數估計時,可以預見 τj,1 , τj,2 , τj,4 會一起低估。 (f ). (r). 例如若焦點組相對於參照組是 MRS 標準型,參數估計就會有 τj,3 < τj,3 且 (f ). (r). (f ). (r). (f ). (f ). (r). τj,4 < τj,4 ,但 τj,1 > τj,1 與係數估計連帶性導致 τj,1 要低估,最後 τj,1 與 τj,1 就沒有明確的大小關係。完整的 DARS 閾值相對大小關係分析如表 8。 表 8: 不同的 DARS 類型在四種模型下的閾值估計特徵 DARS 類型. 模型. MFB1 MFB2 DARS 標準型、1 型、3 型 MFB3 MFB4 MFB1 MFB2 DARS2 型 MFB3 MFB4 MFB1 MFB2 DARS4 型 MFB3 MFB4. 焦點組閾值估計特徵 (f ) (f ) (f ) (f ) τj,1 τj,2 τj,3 τj,4 小 小 小 小 大 大 大 大 小 小 小 大 大 大 小 小 大 大 大 小. 由表 8 中焦點組相對於參照組有 DARS 標準型時各模型的分析,可推測此 時 F 矩陣有明顯的型式 FDARS0 如下:  f1,1 f1,2 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 f2,2 f2,3 ≈ 0 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 ≈ 1 f3,3 f3,4  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 f4,4 . FDARS0. 16. (35).

(26) 令 ΨDARSt,0 與 ΨDARSt,1 分別表示 FDARSt 中出現型式「≈ 0」與「≈ 1」的位置所 形成的集合,例如: ΨDARS0,0 = {(1, 3), (1, 4), (2, 3), (2, 4)}. (36). ΨDARS0,1 = {(3, 1), (3, 2), (4, 1), (4, 2)}. (37). 則 DARS 的檢定統計量 IDARS =. ∑. {(. t=0,1,2,3,4. ∏. ∏. I(fk,c ≤, m))(. (k,c)∈ΨDARSt,0. I(fk,c ≥ M ))(. (k,c)∈ΨDARSt,1. max. (k,c)∈ΨDARSt,0 ∪ΨDARSt,1. (38) 若 IDARS = 0 則拒絕焦點組相對於參照組有默認否定作答風格差異的假設, 若 IDARS ̸= 0 則接受焦點組相對於參照組有默認否定作答風格差異的假設。 其中 DARS0,DARS1,DARS2,DARS3,DARS4 依序表示 DARS 標準型,DARS1 型,DARS2 型,DARS3 型,DARS4 型。m 與 M 是決定檢定嚴格或寬鬆的參數, 在 3.6 模擬結果中有進一步的討論。. 簡言之,本研究所發展的檢定精神在於檢查兩群組間的閾值大小關係是否 具有特殊的型式,若有,再檢定這些特殊形式的閾值,在兩群組中是否有顯著 的差異。流程如下圖表示。. 圖 4: 作答風格檢定流程圖. 17. {Dk,c })}.

(27) 3. 模擬研究設計與結果 本模擬研究之對象是李克特 (Likert) 五點量表,主要的目的有兩個,一是. 觀察四種作答風格差異在四種 MFB 模型等變因下,各題內與各題間閾值的估 計是否有連帶性。二是決定檢定中的嚴格度 m 與 M 的設定值,以控制檢定的 錯誤率與正確率在可接受的範圍內。研究結果除了作為第 2 章檢定的依據,更 實際應用在實徵資料的分析中。. 3.1. 自變項、依變項與參數設定. 自變項總共有七個,說明如下: (1) 潛藏態度差異 (impact):分為兩種,κ(f ) = κ(r) = 0 與 κ(f ) = −1, κ(r) = 0。 (2) 作答風格差異類型:ERS、MRS、ARS、DARS (3) 作答風格差異程度:分為三種情況,無 (δ = 0)、小 (δ=0.4)、大 (δ=0.6) (4) 樣本大小: 分為小樣本兩群人各 250 人,中樣本兩群人各 500 人,大樣本兩群人各 1000 人。 (5) 問卷題數:15 題與 10 題。 (6) 模型的最小限制方式:MFB1、MFB2、MFB3、MFB4 (7) 檢定嚴格度 (m, M ) = (0.5, 0.5) 或 (m, M ) = (0.4, 0.6). 依變項有兩個,說明如下: 1、檢定錯誤率: 在兩群人沒有作答風格差異的變項組合下,均重複產生 1000 筆模擬資料,計 算每個變項組合情況下的 1000 次檢定中,結果接受兩群組有某種作答風格差 異的比例。. 18.

(28) 2、檢定正確率: 在兩群人有某種作答風格差異的變項組合下,均重複產生 1000 筆模擬資料, 計算每個變項組合情況下的 1000 次檢定中,結果接受兩群組有此種作答風格 差異的比例。 最後是模擬參數設定,參照組的因素負荷量 (λj , j = 1, 2, ..., 15) 以及各題的 閾值設定如表 9:. 表 9: 參照組的因素負荷量與閾值的設定 題號 因素負荷量 閾值 1 1 -2.78 -1.31 -0.6 0.96 2 .90 -1.89 -0.67 -0.08 1.48 3 .70 -2.74 -1.38 -0.45 1.33 4 .88 -1.82 -0.65 -0.20 0.87 5 .72 -2.44 -1.29 -0.58 0.85 6 .86 -2.35 -1.15 -0.46 0.95 7 .74 -2.12 -1.15 -0.59 1 8 .84 -1.97 -0.70 -0.12 1.28 9 .76 -2.98 -1.48 -0.57 1.35 10 .82 -2.8 -1.35 -0.43 1.31 11 .78 -2.75 -1.33 -0.46 1.30 12 .80 -2.52 -1.05 -0.43 0.93 13 .80 -2.26 -0.72 -0.06 1.63 14 .90 -2.49 -1 -0.26 1.47 15 .70 -2.71 -1.37 -0.49 1.35. 焦點組的因素負荷量與參照組完全相同,閾值則取決於作答風格類型,於 3.2 節分類說明。. 19.

(29) 3.2. ERS 實驗設定 (f ). (r). 焦 點 組 相 對 於 參 照 組 有 極 端 反 應 風 格 的 實 驗 設 定 為 τj,1 = τj,1 + δ 且 (f ). (r). τj,4 = τj,4 − δ, j = 1, 2, ..., 15。例如潛藏態度皆為 0 的甲乙兩人,若甲相對於乙 有程度 δ = 0.6 的極端作答風格差異,則甲各題的選項 1 到 5 的機率分配依序 如圖 5 中各小圖橫軸上方所示。乙各題的選項 1 到 5 的機率分配依序如圖 5 中 各小圖橫軸下方所示。其中每張小圖標題的括弧外數字為題號,括弧內的數字 為焦點組與參照組選擇兩端選項的機率差。. 圖 5: 甲對於乙有 ERS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項回答機率 比較圖. 圖 6: 甲對於乙有 ERS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項回答機率 比較圖. 20.

(30) 3.3. MRS 實驗設定 (f ). (r). 焦 點 組 相 對 於 參 照 組 有 折 衷 反 應 風 格 的 實 驗 設 定 為 τj,2 = τj,2 − (f ). δ 2. 且. (r). τj,3 = τj,3 + 2δ , j = 1, 2, ..., 15。例如潛藏態度皆為 0 的甲乙兩人,若甲相對於 乙有程度 δ = 0.6 的折衷作答風格差異,則甲各題的選項 1 到 5 的機率分配依 序如圖 6 中各小圖橫軸上方所示。乙各題的選項 1 到 5 的機率分配依序如圖 6 中各小圖橫軸下方所示。其中每張小圖標題的括弧外數字為題號,括弧內的數 字為焦點組與參照組選擇中立選項的機率差。. 圖 7: 甲對於乙有 MRS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項回答機率 比較圖. 圖 8: 甲對於乙有 MRS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項回答機率 比較圖. 21.

(31) 3.4. ARS 實驗設定 (f ). (r). 焦點組相對於參照組有默認肯定反應風格的實驗設定為 τj,3 = τj,3 − (f ). (r). τj,4 = τj,4 − δ,. δ 2. 且. j = 1, 2, ..., 15。例如潛藏態度皆為 0 的甲乙兩人,若甲相對於. 乙有程度 δ = 0.6 的默認肯定作答風格差異,則甲各題的選項 1 到 5 的機率分 配依序如圖 7 中各小圖橫軸上方所示。乙各題的選項 1 到 5 的機率分配依序如 圖 7 中各小圖橫軸下方所示。其中每張小圖標題的括弧外數字為題號,括弧內 的數字為焦點組與參照組選擇同意選項的機率差。. 圖 9: 甲對於乙有 ARS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項回答機率 比較圖. 圖 10: 甲對於乙有 ARS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項回答機 率比較圖. 22.

(32) 3.5. DARS 模擬設定 (f ). (r). 焦點組相對於參照組有默認否定反應風格的實驗設定為 τj,1 = τj,1 + δ 且 (f ). (r). τj,2 = τj,2 + 2δ ,. j = 1, 2, ..., 15。例如潛藏態度皆為 0 的甲乙兩人,若甲相對於. 乙有程度 δ = 0.6 的默認否定作答風格差異,則甲各題的選項 1 到 5 的機率分 配依序如圖 8 中各小圖橫軸上方所示。乙各題的選項 1 到 5 的機率分配依序如 圖 8 中各小圖橫軸下方所示。其中每張小圖標題的括弧外數字為題號,括弧內 的數字為焦點組與參照組選擇不同意選項的機率差。. 圖 11: 甲對於乙有 DARS(δ = 0.4) 且兩人潛藏態度皆為 0 之各題各選項回答機 率比較圖. 圖 12: 甲對於乙有 DARS(δ = 0.6) 且兩人潛藏態度皆為 0 之各題各選項回答機 率比較圖. 23.

(33) 3.6. 模擬結果. 本模擬實驗先使用 R(R-3.1.2) 軟體生成資料,每一個變項組合均重複產生 1000 筆資料,再使用 Mplus(Mplus Version 5) 軟體分析數據。結果顯示隨著樣 本數的增加或作答風格差異程度的增加,表 5 至表 8 所分析的焦點組閾值估計 特徵就更加明顯。而兩群人的潛藏態度差異與否並不影響結果。 3.6.1 fk,c 的模擬結果 fk,c 表示 MFBk 法的 MCCFA 模型參數估計中,比較兩群組間第 2 到 J 題 的第 c 個閾值,焦點組大於參照組的比例。由於每一個變項組合均重複產生 1000 筆資料,因此每一個比例 fk,c 都有 1000 次模擬結果,計算其平均與標準 差 (表中括弧內之數字),就能觀察閾值估計的連帶性。. 24.

(34) 表 10: ERS 的 fk,c 模擬結果列表,J = 15 題 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 無 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .564(.290) .892(.129) .903(.108) .988(.031) .617(.288) .961(.069) .968(.054) .999(.009) .659(.281) .993(.025) .995(.019) 1(.000) .604(.296) .975(.051) .980(.042) 1(.005) .656(.288) .997(.016) .997(.014) 1(.000) .723(.263) 1(.002) 1(.000) 1(.000). .130(.226) .492(.293) .495(.264) .950(.091) .074(.171) .508(.292) .515(.261) .988(.037) .019(.079) .500(.291) .495(.266) .999(.011) .053(.137) .493(.291) .483(.259) .992(.029) .014(.066) .492(.297) .491(.270) 1(.004) .001(.009) .496(.291) .503(.261) 1(.000). .114(.227) .491(.319) .494(.287) .965(.084) .061(.170) .509(.323) .513(.294) .996(.023) .014(.073) .500(.319) .500(.294) 1(.006) .042(.131) .494(.317) .480(.282) .997(.016) .009(.061) .491(.322) .489(.289) 1(.000) .000(.000) .497(.320) .502(.290) 1(.000). .007(.052) .026(.072) .016(.046) .345(.251) .000(.007) .003(.018) .002(.012) .294(.244) .000(.000) .000(.002) .000(.002) .232(.221) .000(.000) .002(.014) .000(.005) .300(.247) .000(.000) .000(.000) .000(.000) .224(.211) .000(.000) .000(.000) .000(.000) .144(.165). 在表中的大樣本數情況,我們清楚地看到了  f1,1 f1,2 ≈ 0 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 ≈ 1 f2,2 f2,3 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 f3,3 f3,4 ≈ 0  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 ≈ 1 f4,4 . FERS0. 再比較表 10 與表 11 就可看到潛藏態度差異不影響模擬結果。. 25. (39).

(35) 表 11: ERS 的 fk,c 模擬結果列表,J = 15 題 (續) 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 有 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .582(.297) .903(.126) .910(.112) .993(.024) .612(.290) .963(.069) .969(.058) 1(.006) .648(.286) .993(.025) .994(.022) 1(.000) .590(.296) .970(.068) .976(.052) 1(.000) .667(.273) .996(.020) .997(.016) 1(.000) .715(.258) 1(.000) 1(.000) 1(.000). .148(.223) .500(.283) .492(.264) .932(.124) .074(.163) .488(.286) .501(.269) .984(.046) .019(.070) .494(.290) .485(.262) .999(.010) .054(.131) .478(.291) .486(.265) .990(.035) .016(.062) .486(.282) .491(.264) 1(.006) .001(.011) .503(.285) .502(.267) 1(.000). .139(.232) .502(.304) .496(.282) .947(.116) .064(.161) .494(.307) .503(.290) .992(.034) .014(.068) .490(.308) .483(.283) 1(.006) .040(.118) .475(.310) .475(.286) .995(.025) .011(.052) .485(.300) .484(.285) 1(.002) .001(.011) .502(.303) .500(.284) 1(.000). .006(.030) .038(.079) .031(.068) .342(.247) .001(.016) .007(.030) .005(.022) .303(.244) .000(.000) .000(.005) .000(.002) .236(.215) .000(.005) .003(.015) .002(.016) .285(.237) .000(.000) .000(.002) .000(.003) .216(.202) .000(.000) .000(.000) .000(.000) .144(.166). 26.

(36) 表 12: MRS 的 fk,c 模擬結果列表,J = 15 題 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 無 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .502(.296) .687(.196) .316(.178) .500(.204) .494(.288) .749(.181) .252(.162) .506(.198) .483(.299) .829(.142) .173(.128) .510(.197) .495(.300) .768(.176) .230(.150) .504(.201) .504(.297) .834(.149) .156(.124) .493(.196) .475(.295) .910(.099) .082(.086) .495(.197). .273(.335) .423(.288) .034(.070) .162(.191) .176(.276) .395(.286) .006(.024) .086(.135) .103(.214) .350(.273) .000(.004) .025(.061) .180(.284) .395(.290) .004(.019) .073(.120) .096(.204) .341(.270) .000(.004) .023(.063) .036(.128) .277(.249) .000(.000) .002(.014). .728(.358) .966(.098) .576(.284) .858(.194) .816(.306) .994(.030) .634(.280) .948(.108) .885(.249) 1(.004) .679(.262) .990(.035) .817(.306) .996(.036) .625(.273) .956(.101) .907(.222) 1(.002) .691(.263) .992(.035) .966(.134) 1(.000) .746(.240) 1(.005). .495(.380) .760(.241) .210(.210) .496(.273) .482(.366) .835(.205) .130(.160) .494(.269) .479(.375) .927(.133) .056(.095) .506(.267) .481(.379) .851(.196) .106(.139) .500(.271) .506(.376) .929(.127) .043(.082) .494(.271) .476(.377) .984(.048) .007(.027) .493(.261). 在表中的大樣本數情況,我們看到了  f1,1 f1,2 ≈ 0 f1,3 ≈ 1 f1,4  f2,1 ≈ 1 f2,2 f2,3 ≈ 1 f2,4 ≈ 1   =  f3,1 ≈ 0 f3,2 ≈ 0 f3,3 f3,4 ≈ 0  f4,1 f4,2 ≈ 0 f4,3 ≈ 1 f4,4 . FM RS0. (40). 但是 FM RS0 比起 FERS0 較不穩定,例如 f2,1 在兩個矩陣中都預期 ≈ 1,但在 表 10 中最差也有.892(129),而在表 12 中最差為.687(.196)。. 接著再比較表 12 與表 13 也可看到潛藏態度差異不影響模擬結果。. 27.

(37) 表 13: MRS 的 fk,c 模擬結果列表,J = 15 題 (續) 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 有 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .469(.298) .684(.211) .306(.179) .508(.217) .504(.295) .772(.185) .254(.170) .493(.219) .513(.304) .844(.154) .168(.144) .521(.217) .501(.299) .786(.187) .242(.160) .507(.224) .496(.298) .870(.139) .170(.135) .510(.219) .499(.292) .932(.097) .085(.093) .511(.215). .236(.295) .418(.288) .050(.086) .187(.199) .180(.254) .407(.281) .012(.034) .101(.149) .104(.199) .355(.272) .001(.008) .036(.077) .153(.231) .388(.276) .008(.027) .089(.136) .081(.176) .358(.268) .000(.006) .028(.066) .024(.090) .286(.252) .000(.000) .003(.016). .697(.357) .943(.127) .569(.279) .828(.220) .804(.300) .990(.045) .608(.284) .896(.163) .889(.234) 1(.006) .644(.275) .970(.083) .818(.293) .993(.043) .614(.279) .916(.157) .896(.218) 1(.004) .657(.269) .972(.085) .966(.121) 1(.000) .714(.254) .998(.013). .462(.352) .727(.245) .238(.201) .500(.273) .491(.352) .829(.199) .177(.175) .483(.269) .502(.354) .902(.147) .090(.127) .506(.267) .496(.346) .845(.187) .158(.159) .502(.270) .485(.353) .918(.139) .086(.117) .494(.269) .492(.347) .976(.062) .026(.056) .497(.268). 28.

(38) 表 14: ARS 的 fk,c 模擬結果列表,J = 15 題 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 無 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .499(.299) .506(.211) .698(.181) .842(.134) .498(.302) .499(.213) .760(.163) .912(.089) .493(.291) .494(.215) .838(.127) .963(.054) .516(.301) .499(.212) .779(.158) .925(.084) .507(.293) .497(.212) .846(.124) .970(.048) .488(.301) .503(.213) .925(.082) .994(.020). .495(.385) .508(.293) .806(.196) .949(.096) .494(.381) .501(.293) .885(.154) .990(.033) .496(.379) .495(.296) .950(.087) .999(.009) .525(.387) .506(.294) .898(.146) .993(.027) .509(.380) .496(.294) .963(.077) 1(.006) .483(.384) .511(.296) .993(.029) 1(.000). .259(.344) .143(.200) .416(.286) .745(.247) .184(.306) .070(.139) .383(.274) .824(.207) .083(.202) .018(.060) .314(.258) .899(.149) .182(.296) .057(.121) .378(.272) .836(.194) .088(.210) .013(.050) .303(.253) .908(.143) .028(.121) .001(.010) .252(.235) .970(.068). .108(.218) .028(.072) .119(.151) .353(.260) .045(.140) .004(.021) .046(.086) .291(.240) .006(.038) .000(.007) .008(.030) .219(.207) .036(.123) .002(.014) .033(.074) .291(.246) .004(.032) .000(.000) .005(.023) .217(.215) .000(.002) .000(.000) .000(.003) .151(.171). 在表中的大樣本數情況,我們清楚地看到了  f1,1 f1,2 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 f2,2 f2,3 ≈ 0 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 ≈ 1 f3,3 f3,4  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 f4,4 . FARS0. (41). 值得注意的是表中「≈ 0」的特徵也出現在 f3,4 ,而且其表現甚至比原本預期的 f1,3 ≈ 0 更好更穩定。類似的觀察,表中「≈ 1」的特徵也出現在 f4,3 ,而且其 表現甚至比原本預期的 f3,1 ≈ 1 更好更穩定。再比較表 14 與表 15 就會看到潛 藏態度差異不影響上述所有結果。. 29.

(39) 表 15: ARS 的 fk,c 模擬結果列表,J = 15 題 (續) 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 有 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .481(.301) .501(.227) .709(.186) .858(.134) .497(.300) .519(.233) .783(.165) .934(.085) .482(.299) .499(.224) .850(.140) .980(.043) .481(.301) .505(.229) .787(.170) .943(.080) .491(.306) .509(.228) .873(.131) .986(.032) .487(.291) .502(.230) .939(.085) .998(.011). .472(.369) .498(.287) .780(.219) .936(.118) .480(.364) .506(.298) .858(.176) .983(.048) .477(.364) .494(.287) .927(.123) .998(.011) .470(.368) .498(.297) .874(.168) .991(.032) .480(.376) .506(.294) .947(.110) 1(.006) .472(.360) .489(.289) .989(.040) 1(.000). .225(.303) .160(.198) .410(.275) .729(.259) .155(.264) .091(.148) .381(.276) .802(.223) .079(.183) .029(.076) .327(.262) .885(.170) .140(.251) .073(.135) .371(.272) .820(.209) .073(.181) .020(.071) .324(.255) .913(.131) .014(.072) .002(.015) .251(.232) .973(.064). .077(.160) .034(.071) .122(.144) .345(.244) .028(.088) .008(.029) .056(.090) .297(.239) .004(.027) .000(.005) .013(.041) .233(.211) .018(.069) .004(.019) .037(.071) .260(.225) .002(.023) .000(.002) .008(.026) .206(.200) .000(.000) .000(.000) .000(.006) .148(.165). 30.

(40) 表 16: DARS 的 fk,c 模擬結果列表,J = 15 題 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 無 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .562(.297) .768(.180) .909(.093) .904(.104) .623(.291) .863(.141) .969(.056) .968(.055) .657(.284) .935(.095) .994(.021) .993(.023) .614(.300) .878(.140) .978(.044) .979(.042) .665(.284) .949(.080) .998(.012) .997(.016) .728(.266) .988(.033) 1(.002) 1(.000). .340(.343) .566(.293) .862(.164) .841(.186) .298(.335) .599(.288) .926(.124) .925(.124) .222(.291) .650(.280) .983(.049) .980(.058) .279(.321) .608(.284) .943(.103) .938(.112) .212(.285) .649(.272) .987(.038) .986(.049) .129(.220) .706(.264) .999(.009) .999(.008). .129(.248) .199(.236) .499(.281) .504(.305) .061(.164) .112(.174) .499(.297) .497(.310) .012(.073) .045(.101) .500(.284) .502(.300) .044(.137) .098(.161) .499(.291) .505(.309) .008(.046) .036(.094) .507(.299) .512(.306) .000(.003) .005(.025) .496(.289) .497(.300). .134(.235) .214(.224) .492(.253) .498(.272) .070(.166) .140(.185) .488(.263) .500(.278) .017(.079) .064(.118) .490(.255) .495(.269) .051(.138) .123(.170) .491(.256) .500(.275) .010(.052) .054(.110) .503(.259) .511(.269) .000(.005) .010(.035) .486(.252) .495(.272). 在表中的大樣本數情況,我們清楚地看到了  f1,1 f1,2 f1,3 ≈ 0 f1,4 ≈ 0  f2,1 f2,2 f2,3 ≈ 0 f2,4 ≈ 0   =  f3,1 ≈ 1 f3,2 ≈ 1 f3,3 f3,4  f4,1 ≈ 1 f4,2 ≈ 1 f4,3 f4,4 . FDARS0. (42). 值得注意的是由於 DARS 與 ARS 的閾值結構相同,所以相較於在表 14 與表 15 中預期外的特徵,此處應該也有 f1,2 ≈ 0 與 f2,1 ≈ 1。但是 f1,2 的特徵並不 明顯,推測這與閾值參數設定偏小,沒有對稱原點有關。最後比較表 16 與表 17 也會看到潛藏態度差異不影響模擬結果。. 31.

(41) 表 17: DARS 的 fk,c 模擬結果列表,J = 15 題 (續) 潛藏態度 作答風格 有無差異 差異程度 小. 小. 小 有 大. 大. 大. 樣本數. MFBk. MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4 MFB1 MFB2 250,250 MFB3 MFB4 MFB1 MFB2 500,500 MFB3 MFB4 MFB1 MFB2 1000,1000 MFB3 MFB4. fk,1. fk,2. fk,3. fk,4. .576(.305) .769(.196) .906(.114) .901(.122) .590(.291) .840(.161) .965(.063) .964(.076) .655(.285) .930(.100) .995(.020) .995(.021) .597(.296) .861(.161) .974(.056) .975(.056) .653(.280) .937(.099) .998(.016) .998(.014) .704(.269) .983(.045) 1(.002) 1(.005). .353(.340) .555(.292) .814(.206) .808(.212) .276(.310) .578(.289) .891(.158) .891(.165) .233(.282) .638(.281) .962(.083) .961(.089) .271(.299) .585(.286) .907(.143) .908(.142) .208(.266) .616(.282) .971(.077) .966(.084) .146(.223) .676(.265) .995(.030) .995(.023). .146(.244) .230(.247) .491(.292) .492(.297) .060(.153) .146(.201) .489(.293) .505(.297) .015(.073) .078(.142) .503(.291) .487(.301) .052(.139) .133(.178) .492(.286) .504(.298) .013(.065) .065(.126) .493(.286) .493(.302) .001(.015) .015(.051) .491(.285) .489(.309). .163(.232) .260(.235) .504(.257) .496(.270) .076(.156) .184(.201) .490(.262) .507(.264) .023(.080) .109(.158) .504(.262) .497(.266) .067(.136) .172(.186) .500(.254) .510(.266) .018(.065) .092(.133) .492(.247) .500(.271) .002(.019) .030(.064) .492(.254) .495(.273). 3.6.2 錯誤率 表 18 結果顯示四種檢定的模擬結果皆不受題數 15 題或 10 題的影響,且檢 定嚴格度 (m, M ) 取為 (0.5, 0.5) 就有極佳的表現,因此之後的討論都預設其檢 定嚴格度 (m, M ) = (0.5, 0.5)。 3.6.3 正確率 表 19 結果顯示 ERS 檢定在中樣本數就有 0.8 以上的正確率,不受題數 15 題或 10 題影響。至於 MRS 檢定則需要大樣本才有可以接受的正確率,群組樣 本數小於 250 不建議使用。. 32.

(42) 表 18: 四種 RS 差異檢定的錯誤率列表. RS 種類. 潛藏態度. 樣本數. 有無差異 無 ERS 有. 無 MRS 有. 無 ARS 有. 無 DARS 有. 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000. 錯誤率 (15 題) 錯誤率 (10 題) m = 0.5 m = 0.4 m = 0.5 m = 0.4 M = 0.5 M = 0.6 M = 0.5 M = 0.6 .009 .000 .004 .001 .013 .001 .008 .001 .017 .001 .008 .000 .013 .003 .012 .000 .008 .000 .005 .000 .013 .000 .009 .000 .002 .000 .000 .000 .002 .000 .000 .000 .002 .000 .004 .001 .005 .000 .000 .000 .000 .000 .001 .000 .004 .000 .000 .000 .030 .008 .027 .013 .044 .015 .033 .009 .045 .012 .032 .009 .044 .016 .033 .009 .033 .013 .022 .009 .039 .008 .021 .006 .030 .007 .027 .017 .039 .009 .031 .012 .038 .008 .039 .015 .040 .006 .035 .012 .032 .006 .025 .010 .043 .013 .030 .015. 表 20 結果顯示 ARS 與 DARS 檢定也需要的中樣本數以上,小樣本數的表 現並不理想。其中還看到 DARS 的表現比 ARS 還要好,推測與閾值參數偏 小,不對稱原點有關。至於題數 15 題與 10 題並沒有什麼影響。. 33.

(43) 表 19: ERS 與 MRS 差異檢定的正確率列表. RS 種類. 潛藏態度 作答風格. 樣本數. 有無差異 差異程度 小 無 大 ERS 小 有 大. 小 無 大 MRS 小 有 大. 3.7. 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000. 正確率 (15 題) 正確率 (10 題) m = 0.5 m = 0.4 m = 0.5 m = 0.4 M = 0.5 M = 0.6 M = 0.5 M = 0.6 .755 .679 .780 .690 .927 .898 .952 .933 .992 .989 .996 .991 .968 .941 .965 .953 .995 .993 .998 .996 1 1 1 1 .658 .578 .730 .627 .883 .854 .907 .867 .993 .987 .995 .979 .943 .926 .950 .930 .996 .993 .998 .992 1 1 .999 .999 .300 .116 .275 .125 .538 .336 .528 .341 .779 .633 .789 .669 .567 .394 .554 .381 .827 .683 .821 .709 .959 .923 .962 .930 .247 .072 .228 .096 .490 .298 .450 .274 .759 .599 .723 .611 .536 .330 .614 .340 .798 .653 .830 .661 .975 .931 .978 .925. 討論. 從本研究模擬結果的正確率而言,可以滿意的是 ERS 檢定,而 DARS 與 ARS 檢定次之,至於 MRS 檢定僅在大樣本數時才有可用的正確率。針對這個 結果從兩方面討論如後: 一方面是表 12 顯示 MRS 的 f2,1 , f2,4 , f3,1 , f3,4 型式 (pattern) 不如預期明顯,這 可能與生成資料時,焦點組相對於參照組的閾值加減量有關。因為同樣的 δ 在 ERS 情形中,兩端閾值都改變 1 個 δ,而在 MRS 情形中,中間兩個閾值的改 變都只有 0.5 個 δ,至於 ARS 與 DARS 的情形中,兩個閾值的改變恰好是一. 34.

(44) 表 20: ARS 與 DARS 檢定的正確率列表. RS 種類. 潛藏態度 作答風格. 樣本數. 有無差異 差異程度 小 無 大 ARS 小 有 大. 小 無 大 DARS 小 有 大. 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000 250,250 500,500 1000,1000. 正確率 (15 題) 正確率 (10 題) m = 0.5 m = 0.4 m = 0.5 m = 0.4 M = 0.5 M = 0.6 M = 0.5 M = 0.6 .358 .298 .399 .345 .606 .546 .653 .600 .831 .810 .927 .905 .634 .591 .718 .671 .881 .863 .947 .938 .996 .996 .999 .997 .307 .237 .347 .269 .516 .458 .587 .528 .775 .741 .878 .852 .580 .515 .615 .546 .815 .790 .900 .875 .991 .983 .998 .993 .471 .384 .490 .414 .760 .700 .792 .744 .951 .939 .933 .928 .779 .730 .793 .756 .966 .959 .952 .942 1 1 .999 .999 .452 .360 .455 .399 .730 .676 .748 .694 .918 .907 .938 .924 .751 .707 .824 .774 .941 .935 .951 .948 .995 .995 .999 .998. 個是改 1 個 δ,另一個改 0.5 個 δ,介於前兩者之間。 另一方面,如同 DARS 與 ARS 的檢定結果比較,若欲檢定的「目標閾值」用 來決定比較沒有人回答的選項的機率,則檢定正確率較佳。例如 ERS 檢定的 目標閾值是兩側的閾值,DARS 檢定的目標閾值是左側兩個閾值,都是用來決 定比較沒有人回答的選項的機率,結果有較好的檢定正確率。反觀 MRS 檢定 的目標閾值是中間的閾值,用來決定很多人回答的選項的機率,結果正確率最 低。因此對於 MRS 或許可以發展反向檢查,例如甲對於乙如果同時具有 ARS 與 DARS,則推論乙對於甲有 MRS。這樣做就能避免目標閾值都是中間的閾 值。. 35.

(45) 另外,從錯誤率都接近 0 來看,檢定嚴格度似乎可以再降,例如 (m = 0.6, M = 0.4),或是更寬鬆以增加正確率。但是這樣做變成 fk,c 只要比 0.4 大 就算大,只要比 0.6 小就算小,跟作答風格差異的直覺認知不太相符。而大與 小的範圍有交集,例如 0.5 變成是大也是小,應該要審慎考慮是否可行。 最後,在模擬實驗中發現不論定錨哪一個閾值,模型的配適度例如 CFI 與 RMSEA 皆相同。而且與過去常用的定錨某一題的所有閾值的模型作比較,配 適度僅稍微好一點。換言之,模擬實驗也顯示,一般的模型配適度指標不易發 現群組間的作答風格是否有差異,因此本研究所發展的檢定揭露了一般模型配 適度難以解讀的訊息。. 4. 實徵資料分析. 4.1. 資料說明. 1998 年國際教育成就評價研究協會 (International Association for the Evaluation of Educationl Achievement, IEA) 做了一份國際資訊科技教育應用研究 (Second Information Technology in Education Study, SITES; Willem & Ronald, 2001),受試者來自 25 個不同的國家,本研究從中挑選有效樣本數超過 500 人 的六個國家,兩兩分析是否有作答風格差異。問卷一共有 27 個題組,其中的 第 15 題組有 24 個五點量表,因為本研究的模型是單因子 (one factor) 結構, 故再從 24 題當中挑出 9 題專門量測受試者對於「ICT 與學生學習」的潛在認 同態度。題幹與選用的題目如下:(完整的英文問卷請參考附錄). 下列關於資訊通訊科技 (Information Communication Technology, ICT) 在教 學中扮演的角色的敘述,請勾選您同意或是不同意程度: 強烈不同意 (strongly disagree), 輕度不同意 (slightly disagree), 不確定 (uncertain), 輕度同意 (slightly agree), 強烈同意 (strongly agree) 1. 當課堂使用電腦時,學生會更專注上課。. 36.

(46) 8. ICT 可有效提升學生的解決問題與批判思考技巧。 10. 電腦是促進兒童教育品質的重要工具。 11. 基於 ICT 的學習能使學生對自己的學習更加負責。 12. 藉由提供知識處理、表達與創造的新工具,ICT 能調適學生各種不同的需 求、偏好與學習策略。 14. 教師應多運用 ICT 以創造學生的獨立學習環境。 15. ICT 增進學生在學習過程中的自我管理。 18. 使用電腦教學會增加學生的成就感。 19. 使用 email 會增加學生的學習動機。 選用的國家與樣本數則如下表所示: 表 21: 選用的國家與樣本數列表 國家 樣本數 有效樣本數 有效樣本佔總樣本之比例 (%) 加拿大 3043 2590 85.1 挪威 2513 2179 86.7 法國 898 768 85.5 香港 852 743 87.2 立陶宛 785 685 87.2 台灣 657 572 87.1. 4.2. 分析結果與討論. 六個國家經過兩兩一組分析與檢定後總共有 30 個結果,模型配適度部分除 了編號 27,28 的 RMSEA 達到 0.1,其餘的 RMSEA 大都小於 0.08,且 CFI 皆 介於 0.93 與 0.98 之間。檢定結果部分如表 22,在嚴格度 (m = M = 0.5) 之 下,結果出現 MRS 差異 3 次 (編號 2,4,21),ERS 差異 1 次 (編號 3),ARS 差 異 8 次 (編號 1,3,5,13,16,22,26,28),DARS 差異 6 次 (編號 1,3,16,22,26,28)。發 現了多項重要訊息如下: (1) 在編號 1 與 2 中看到加拿大相對於挪威同時有 ARS 與 DARS,挪威相對於 加拿大有 MRS。 以挪威為焦點組 (實心點),加拿大為參照組 (空心點) 之 F 矩陣與各模型各題. 37.

(47) 閾值估計圖如下。. . 0.5 0.5 0.625  0.75 0.75 0.75 F =  0.125 0.125 0.375 0.125 0.125 0.375.  0.625 0.625   0.375  0.375. (43). 圖 13: 挪威 (實心點) 與加拿大 (空心點) 各模型各題閾值估計圖 如再參考表 6,則可以進一步判定挪威相對於加拿大有 MRS4 型作答風格。. (2) 在編號 3 與 4 中,清楚地看到加拿大相對於法國有 ERS,且法國相對於加 拿大有 MRS。 (3) 在編號 21 與 22 中,立陶宛相對於法國同時有 ARS 與 DARS,法國相對於 立陶宛有 MRS。 (4) 在編號 16,立陶宛相對於挪威同時有 ARS 與 DARS。 (5) 在編號 26,立陶宛相對於香港同時有 ARS 與 DARS。 (6) 在編號 13,挪威相對於香港有 ARS。 (7) 在編號 5,加拿大相對於香港有 ARS。. 38.

(48) 綜合 (1)∼(4) 可以看到加拿大與立陶宛傾向極端作答,法國與挪威傾向中立 作答。綜合 (5)∼(7) 則看到香港傾向中立或輕微默認否定作答。至於台灣在六 國之中因為模型配適度不佳或檢定不出作答風格差異,猜測台灣可能是四種作 答風格以外之風格,例如僅極端肯定作答風格等,需再進一步研究。. 表 22: 六國作答風格檢定結果與模型配適度列表 (m = M = 0.5) 編號 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30. 焦點組 加拿大 挪威 加拿大 法國 加拿大 香港 加拿大 立陶宛 加拿大 台灣 挪威 法國 挪威 香港 挪威 立陶宛 挪威 台灣 法國 香港 法國 立陶宛 法國 台灣 香港 立陶宛 香港 台灣 立陶宛 台灣. 對照組 ERS MRS ARS DARS CFI RMSEA 挪威 0 0 1 1 .966 .070 加拿大 0 1 0 0 法國 1 0 1 1 .971 .072 加拿大 0 1 0 0 香港 0 0 1 0 .966 .079 加拿大 0 0 0 0 立陶宛 0 0 0 0 .973 .066 加拿大 0 0 0 0 台灣 0 0 0 0 .971 .072 加拿大 0 0 0 0 法國 0 0 0 0 .956 .075 挪威 0 0 0 0 香港 0 0 1 0 .948 .083 挪威 0 0 0 0 立陶宛 0 0 0 0 .958 .069 挪威 0 0 1 1 台灣 0 0 0 0 .963 .075 挪威 0 0 0 0 香港 0 0 0 0 .934 .097 法國 0 0 0 0 立陶宛 0 1 0 0 .947 .076 法國 0 0 1 1 台灣 0 0 0 0 .968 .083 法國 0 0 0 0 立陶宛 0 0 0 0 .935 .091 香港 0 0 1 1 台灣 0 0 0 0 .960 .100 香港 0 0 1 1 台灣 0 0 0 0 .977 .072 立陶宛 0 0 0 0. 39.

(49) 5. 研究限制 由於作答風格差異的定義僅牽涉到相同態度的人回答各選項的機率不盡相. 同,這使得可以操弄的變項非常多,例如五點量表的作答風格差異不只四種, 六點量表的分類又更多,乃至於因素負荷量或閾值的參數設定都可以當作變項 來處理。因此本研究有下列模擬或使用上的限制:. 1、模擬資料都是標準型的作答風格差異,並且是單因子五點量表。. 2、焦點組相較於參照組的閾值改變,中間閾值的移動量較兩端閾值小,而且 剛好是其一半。. 3、生成模擬資料的閾值參數只有一套,並且具有 τj,3 或 τj,2 在 κ 附近的特徵。. 4、生成模擬資料的因素負荷量參數只有一套,而且兩群組相同 (因素負荷量沒 有 DIF)。. 40.

(50) 6. 結論與展望 在研究一,經過大量的模擬實驗,可以看到在 MFB 模型下閾值估計的連帶. 性相當明顯,利用此特性發展作答風格檢定是一個好方向。. 在研究二,經過實徵資料的分析可以看到,本研究所發展的方法確實能 帶來一些新的且可靠的資訊。因此建議在分析多群組態度量表時,先用各種 MFB 模型檢測群組間是否有作答風格差異,若沒有差異,就放心定錨一整題 的閾值。若有差異,則根據作答風格差異的類型,選擇合適的 MFB 方式。例 如在實徵資料分析中,表 22 編號 2 出現 MRS4 型,則根據表 2 使用 MFB1 模 型來分析。因此解決了 MFB 模型在四種常見的作答風格差異下,該定錨哪一 個閾值的問題。. 展望的部分有以下三點: 1、問卷若改成多個因子五點量表,用相同的方法應該就能檢定作答風格差異, 可嘗試多因子模擬實驗。 2、做因素負荷量也有 DIF 的模擬實驗,發展適用範圍更廣的檢定。 3、因為檢定的錯誤率幾乎是 0,所以可思考如何將檢定合理與適度的放寬,提 升正確率。尤其是樣本數較小時的 MRS 檢定,是一個需要再克服的問題。. 除此之外,比較模擬實驗與實徵資料結果發現實徵資料中所有穩健卡方差 異檢定幾乎都是顯著,也就是說,不論定錨哪一個閾值,比較兩群人的每一個 閾值都幾乎至少有一題達到顯著差異,這顯示模型在實徵資料分析時還有進步 的空間。期待將來能改進模型,使得定錨在某個閾值後,兩群人每一題的這個 閾值都沒有顯著差異!. 41.

(51) 參考文獻 Asparouhov, T. & Muthén, B.O. (2006). Robust chi square difference testing with mean and variance adjusted test statistics. Retrieved from https://www.statmodel.com/download/webnotes/webnote10.pdf. Chang, Y-W., Huang, W-K., & Tsai, R. (2015). DIF detection using multiplegroup categorical CFA with minimum baseline approach. Journal of Educational Measurement, 52, 181-199.. Drasgow, F.(1984).Scrutinizing psychological tests: Measurement equivalence and equivalent relations with external variables are the central issues. Psychological Bulletin, 95, 134-135.. Greenleaf, E.A. (1992). Improving rating scale measures by detecting and correcting bias components in some response style. Journal of Marketing Research, 26, 176-188.. Meisenberg, G., & Williams, A. (2008). Are acquiescent and extreme response styles related to low intelligence and education? Personality and Individual Differences, 44, 1539-1550.. Moors, G. (2004). Facts and artifacts in the comparison of attitudes among ethnic minorities: A multigroup latent class structure model with adjustment for response style behavior. European Sociological Review, 20, 303-320.. Muthén, B.O. (1983). Latent variable structural equation modeling with cate-. 42.

(52) gorical data. Journal of Econometrics, 22, 43-65.. Muthén, B.O. (1984). A general structural equation model with dichotomous, ordered categorical, and continuous latent variable indicators. Psychometrika, 49, 115-132.. Muthén, B.O. (1998-2004).. Mplus technical appendices.. Los Angeles, CA:. Muthén & Muthén.. Muthén, L.K. & Muthén, B.O. (1998-2015). Mplus User’s Guide. Seventh Edition. Los Angeles, CA: Muthén & Muthén.. R Core Team (2015). R: A language and environment for statistical computing. Vienna, Austria: R foundation for statistical computing. Retrieved from http://www.R-project.org/. Satorra, A. (1999). Scaled and adjusted restricted tests in multi-sample analysis of moment structures. In Heijmans, D. D. H., Pollock, D. S. G. & Satorra, A. (Eds.), Innovations in multivariate statistical analysis: A festschrift for Heinz Neudecker (pp. 233-247), Dordrecht: Kluwer Academic.. Stark, S., Chernyshenko, O.S., & Drasgow, F. (2006). Detecting differential item functioning with confirmatory factor analysis and item response theory: Toward a unified strategy, Journal of Applied Psychology, 91, 1292-1306.. Willem, J.P., & Ronald E.A. (Eds.). (2001). ICT and the emerging paradigm for life-long learning. Amsterdam: IEA.. 43.

(53) 李盟、郭慶科 (2016)。反應風格與人格特質的關係。心理學進展,6(3),320331。. 44.

(54) 附錄 (SITES1998 實徵資料問卷). 圖 14: SITES1998 五點量表問卷 45.

(55) 圖 15: SITES1998 五點量表問卷 (續). 註:ICT 為 Information Communication Technology 資訊通訊科技之簡寫。. 46.

(56)

參考文獻

相關文件

Thus, the purpose of this study is to determine the segments for wine consumers in Taiwan by product, brand decision, and purchasing involvement, and then determine the

Developing a signal logic to protect pedestrian who is crossing an intersection is the first purpose of this study.. In addition, to improve the reliability and reduce delay of

Developing a signal logic to protect pedestrian who is crossing an intersection is the first purpose of this study.. In addition, to improve the reliability and reduce delay of

Therefore, the purpose of this study is to perform a numerical analysis on the thermal effect of shape-stabilized PCM plates as inner linings on the indoor air temperature

The main purpose of this study is to explore the status quo of the food quality and service quality for the quantity foodservice of the high-tech industry in Taiwan;

The main purpose of this study is to explore the work enthusiasm of the Primary School Teachers, the attitude of the enthusiasm and the effect of the enthusiasm.. In this

The purpose of this study is to examine the teaching process with the integration of games which has been used in number and calculation instructions for fifth grade

The purpose of this study is to explore the development of child concept and the effectiveness of learning in the design of learning areas for young mixed-age-oriented