行政院國家科學委員會專題研究計畫成果報告
多 向 度 試 題 反 應 理 論 分 析 運 動 教 練 評 鑑 量 表
合 上 述 的 研 究 成 果 , 本 研 究 得 到 的 結 論 是 : 運 動 教 練 評 鑑 量 表 依 據 多 向 度 試 題 反 應 理 論 測 量 模 式 編 製 最 合 適 , 但 量 表 架 構 上 有 待 進 一 步 的 研 究 。 關 鍵 詞 : 運 動 教 練 評 鑑 量 表 ; 多 向 度 試 題 反 應 理 論 ; 測 量 ; 單 向 度 ; 總 加 評 分 量 尺 。
Abstract
This purpose of paper was to investigate how the multidimensional item response theory (MIRT) was used to develop the coach evaluation questionnaire (CEQ. Yeh & Yau, 1998). The subjects of this study were 276 athletes. Moreover, we used ConQuest (ACER)that was a computer program to analyze the data. The CEQ is a summating rating scale in 1998. The basic underlying idea derives from classical test theory, where provides the
rational for repeated, summated measurement. In 1999, Yeh & Yau advanced the CEQ by the Many-Faceted Rasch model. It produced the additive scale and the evaluation of coach. However, the basic assumption was unidimensional in the system CEQ studies. The fact was that CEQ included two factors (dimensional). Therefor, the CEQ was not the model and data fit. The CEQ constructed close to the idea of valid measures by MIRT only. The conclusion of this study was that the CEQ was the best construction with the MIRT model, but the dimensional of testing must be more research.
Ke ywo rd s : coach evaluatio n questio nn aire (C EQ); multidim ensio nal item respo ns e th eor y (M IRT); measu rement;
月 網 路 查 詢 全 國 博 碩 士 論 文 , 結 果 未 發 現 有 「 多 向 度 試 題 反 應 理 論 」 的 相 關 研 究 ; 至 於 國 內 期 刊 的 相 關 研 究 , 僅 搜 出 壹 篇 , 李 源 煌 (1997)「 多 向 度 試 題 反 應 理 論 之 試 題 刻 度 等 化 」,此 篇 是 有 關 於 試 題 等 化 的 多 向 度 試 題 反 應 理 論 之 簡 介 。 國 內 在 民 國 86 年 五 月 28、 29 日 舉 辦「 教 育 與 心 理 測 驗 」教 學 與 研 究 國 際 研 討 會 , 其 中 Mei -chu Fan 博 士 有 兩 篇 多 向 度 試 題 反 應 理 論 的 專 題 演 講 , 應 算 是 將 「 多 向 度 試 題 反 應 理 論 」 較 完 整 的 介 紹 到 國 內 之 先 驅 者。Fan (19 97 ) 在「 多 向 度 試 題 反 應 的 理 論 和 應 用 」 論 文 中 指 出 : 多 向 度 試 題 反 應 理 論( MIRT)是 多 元 能 力 和 測 驗 試 題 交 互 作 用 模 式 的 方 法 學 , 二 分 計 分 法 的 MIRT 模 式 包 括 線 性 對 數 模 式 ( McKinley & Reck as e, 19 83 )、 常 態 肩 形 模 式 ( McDonald, 1967)、部 分 補 償 模 式 ( S ympson, 1978)、 一 般 模 式 ( Ackerman & Spray, 1987)等 四
二 、 評 估 單 向 度 運 動 教 練 評 鑑 量 表 (一)單向度量表估計摘要。 1.聚 斂 情 形 從 表 3-2-1 可 知 : 本 研 究 使 用 單 向 度 評 分 量 尺 模 式 分 析 資 料,樣 本 大 小 為 276,設 定 收 斂 標 準 值 為 0.005。 經 過 了 56 次 迭 代 計 算 進 行 精 確 估 計 , 得 到 單 向 度 模 式 的 偏 差 為 20604.4 96,產 生 了 3 3 個 估 計 參 數 , 包 含 27 道 試 題 難 度 參 數 , 單 向 度 的 平 均 數 和 變 異 數 , 以 及 4 個 階 段 參 數 。 僅 用 27 道 試 題 難 度 估 計 參 數 來 描 述 28 道 試 題 就 足 夠 了 , 這 是 因 為 已 將 第 28 道 試 題 的 難 度 作 限 制 , 因 此 無 須 再 作 估 計 。 同 理 可 知 , 雖 然 每 道 試 題 皆 有 6 個 反 應 類 別,僅 需 4 個 階 段 參 數 就 足 夠 。 表 3-2-1 單 向 度 評 分 量 尺 模 式 估 計 摘 要 ---The Data File was: Coach.dat
The format was: id 1-10 responses 15-42 The model was: item+step
Sample size was: 276
Deviance was: 20604.496
Total number of estimated parameters was: 33 The number of iterations was: 56
表 3-2-4 單 向 度 評 分 量 尺 模 式 之 階 段 參 數 估 計 表 變項 原始適合度 調整適合度 階 段 難度 誤差 MNSQ T值 MNSQ T值 1 -1.215 0.033 3.43 18.0 3.03 14.0 2 -1.204 0.029 3.14 16.4 2.93 14.7 3 -0.471 0.025 2.86 14.8 2.87 14.9 4 0.957 0.028 2.59 13.2 2.72 13.1 受試者 +試題 +階段 ---4 | | | | | | | | | | | | X| | | X| | | | | | 3 X| | | XX| | | X| | | X| | | X| | | X| | | X| | | 2 XX| | | XXX| | | XXX| | | XXXX| | | XXXXXXX| | | XXXXX| | | XXXXX| | | 1 XXXXXXX| | | XXXXX| |4 | XXXXXXXXX| | | XXXXXXX| | | XXXXXXXXX|9 16 | | XXXXXXXX|8 19 23 | | XXXXXXXXX|6 10 13 21 28 | | XXXXXXXXXX|7 11 14 15 20 22 | | 0 XXXXXXXXXX|4 5 12 | | XXXXXXXX|1 3 17 | | XXXXXX|2 18 25 27 | | XXXXXX| |3 | XXX|26 | | XX| | | XX|24 | | -1 XX| | | X| |1 2 | X| | | XX| | | X| | | | | | | | | -2 X| | | ======================================================================================= Each 'X' represents 1.8 cases
=======================================================================================
三 、 評 估 二 向 度 運 動 教 練 評 鑑 量 表 (一 )ConQuest 程 式 二 向 度 評 分 量 尺 定 義 1.資 料 定義: 標題:『Two- Dimensional Ratin g S cale Mo del 』。 資 料 檔 : 『 datafile Coach .d at;』。 資 料 格 式 : 『 format id 1-1 3 respo ns es 1 5-42;』。 有效編碼:『 1,2,3,4,5,6』 試 題 名 稱 資 料 檔:『 labels << Co ach. nam; 』 共 二 十 八 題 。 2.分 析 向 度 界 定:兩 個 向 度 。 score (1,2,3,4,5,6) (1,2,3,4,5,6) ( ) ! items (1-5,11-28); score (1,2,3,4,5,6) ( ) (1,2,3,4,5,6) ! items (6-10); 3.分 析 模 式 : 評 分 量 尺 。 mod el it em +st ep; 4. 估 計 設 定 : 估 計 有 問 題 時 , 不 設 警 告 , 資 料 自 動 覆 蓋 。
set warnin gs=no, up d at e= yes ; 5. 設 定 輸 出 檔 : 參 數 檔 、 迴
歸 係 數 檔 和 共 變 數 變 異 數 檔 。
export parameters >>Coach2.prm; export reg_coefficients
>>Coach2.reg;
export covariance >> Coach2.cov; 6. 設 定 輸 入 檔 : 做 為 估 計 的 起 點 , 參 數 檔 、 迴 歸 係 數 檔 和 共 變 數 變 異 數 檔 。 import init_parameters <<Coach1.prm; import init_reg_coefficients <<Coach1.reg; import init_covariance << Coach1.cov; 7. 設 定 估 計 : 估 計 方 法 為 『 Monte Carlo』, 積 分 估 計 節 點 數 2000,收 歛 標 準 0.0001 。
estim at e!m etho d=monteca rlo,nodes =2000,conv=. 0001;
『 Coach2.shw 』, 包 含 結 果 輸 出 表 一 至 表 四 。
show !
個 , 包 括 兩 個 潛 在 變 項 、 二 十 八 個 誤 差 變 項 ( Error), 沒 有 外 顯 的 觀 察 變 項( Manifest)。整 個 線 性 結 構 公 式 模 式 包 括 四 個 矩 陣 : SELECTION 矩 陣 是 28×58 階 變 異 數 共 變 數 矩 陣 。 EQSBETA 矩 陣 是 58 × 58 階 變 異 數 共 變 數 矩 陣 。 EQSGAMMA 矩 陣 是 58 × 30 階 變 異 數 共 變 數 矩 陣 。 SYMMETRIC 矩 陣 是 30×30 階 變 異 數 共 變 數 矩 陣 。( 參 考 圖 3-3-1) 表 3-5-1 運 動 教 練 評 鑑 量 表 共 變 結 構 模 式 的 CALIS 設 定 參 數 ======================================================================================== Covariance Structure Analysis: Pattern and Initial Values
LINEQS Model Statement
Matrix Rows Columns ---Matrix Type---Term 1 1 _SEL_ 28 58 SELECTION
2 _BETA_ 58 58 EQSBETA IMINUSINV 3 _GAMMA_ 58 30 EQSGAMMA
4 _PHI_ 30 30 SYMMETRIC
The 28 Endogenous Variables
Manifest V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21 V22 V23 V24 V25 V26 V27 V28
Latent
The 30 Exogenous Variables Manifest
Latent F2 F1
Error E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12 E13 E14 E15 E16 E17 E18 E19 E20 E21 E22 E23 E24 E25 E26 E27 E28
E1 E2 E3 E4 E5 E11 E12 E13 E14 E15 E16 E17 E18 E19 E20 E21 E22 E23
E28 E27 E26 E25 E24
E6 E7 E8 E9 E10 圖 3-5-1 運 動 教 練 評 鑑 量 表 的 共 變 結 構 模 式 圖 I12 I11 I 4 I 3 I 2 I 1 I13 I18 I20 I24 I21 I22 I23 I19 I25 I6 I 5 I16 I17 I15 I14
I28 I27 I26
運 動 教 練 評 鑑 量 表 的 共 變 結 構 模 式 估 計 情 形 , 參 考 表 3-5-2,經 過 十 五 次 反 覆 迭 代,得 到 最 佳 的 結 果 , 滿 足 估 計 的 聚 斂 標 準 。 主 要 結 果 摘 要 : Objective Function 5.0848353984 。 Max Abs Gradient Element 0.0000598543 。 Slope of Search Direction -3.516769E-8。 表 3 - 5 - 2 運 動 教 練 評 鑑 量 表 的 共 變 結 構 模 式 估 計 情 形 ======================================================================================== Optimization Results
Iterations 15 Function Calls 27
Gradient Calls 17 Active Constraints 0 Objective Function 5.0848353984 Max Abs Gradient Element 0.0000598543 Slope of Search Direction -3.516769E-8
GCONV convergence criterion satisfied.
======================================================================================== CALIS 估 計 運 動 教 練 評 鑑 量 表 整 體 模 式 適 合 度 指 標 的 結 果 , 參 考 表 3-5-3 , 重 要 的 適 合 度 指 標 : 適 合 度 指 標( Goodness of Fit Index,簡 稱 GFI ) 0.6967。 未 達 0.90 以 上,表 示 整 體 模 式 適 合 度 不 良 。 調 整 適 合 度 指 標 ( GFI Adjusted for Degrees of Freedom , 簡 稱 AGFI ) 0.6511 。 未 達 0.90 以 上 , 表 示 整 體 模 式 適 合 度 不 良 。 殘 差 均 方 ( Root Mean Square
0.1195 。 未 低 於 0.05 以 下 , 表 示 整 體 模 式 適 合 度 不 良 。 卡 方 值 1398.3297。 達 顯 著 水 準( <.0001), 自 由 度 353, 卡 方 值 除 以 自 由 度 的 比 率 3.96 ( 1398.3297÷353= 3.96), 也 超 過 2.0, 表 示 整 體 模 式 適 合 度 不 良 。 獨 立 模 式 的 卡 方 值 5804.6 , 97, 自 由 度 378 , 和 共 變 模 式 相 比 , 卡 方 值 差 4406.3 ( 5804.6 - 1398.3 = 4406.3), 自 由 度 差 25( 378- 353 = 25 ), 也 達 顯 著 水 準 ( <.0001),表 示 這 兩 個 向 度 有 共 變 的 關 係 。 班 特 利 的 比 較 適 合 度 指 標 ( Bentler's Comparative Fit Index ) 0.8074 。 未 達 0.90 以 上 , 表 示 整 體 模 式 適 合 度 不 良 。
Bentler & Bonett's (1980) 非 常 模 指 標 ( Non-normed Index ) 0.7937 和 Bentler & Bonett's (1980) 非 適 合 度 指 標 ( NFI ) 0.7591 。 皆 未
達 0.90 以 上,表 示 整 體 模 式 適 合 度 不 良 。
James, Mulaik, & Brett (1982) Parsimonious NFI 0.7089。未 達 0.90 以 上,表 示 整 體 模 式 適 合 度 不 良 。
表 3 - 5 - 3 C A L I S 估 計 整 體 模 式 適 合 度 指 標 的 結 果
==============================================================================================
Fit Function 5.0848
Goodness of Fit Index (GFI) 0.6967 GFI Adjusted for Degrees of Freedom (AGFI) 0.6511 Root Mean Square Residual (RMR) 0.1195 Parsimonious GFI (Mulaik, 1989) 0.6506
Chi-Square 1398.3297
Chi-Square DF 353
Pr > Chi-Square <.0001 Independence Model Chi-Square 5804.6 Independence Model Chi-Square DF 378
RMSEA Estimate 0.1038
RMSEA 90% Lower Confidence Limit 0.0981 RMSEA 90% Upper Confidence Limit 0.1095
ECVI Estimate 5.5157
ECVI 90% Lower Confidence Limit 5.0928 ECVI 90% Upper Confidence Limit 5.9696 Probability of Close Fit 0.0000 Bentler's Comparative Fit Index 0.8074 Normal Theory Reweighted LS Chi-Square 1676.3768 Akaike's Information Criterion 692.3297 Bozdogan's (1987) CAIC -938.6718 Schwarz's Bayesian Criterion -585.6718 McDonald's (1989) Centrality 0.1505 Bentler & Bonett's (1980) Non-normed Index 0.7937 Bentler & Bonett's (1980) NFI 0.7591 James, Mulaik, & Brett (1982) Parsimonious NFI 0.7089 Z-Test of Wilson & Hilferty (1931) 23.2317 Bollen (1986) Normed Index Rho1 0.7420 Bollen (1988) Non-normed Index Delta2 0.8083 Hoelter's (1983) Critical N 80
參 考 文 獻
李 源 煌 。 (1997) 。 多 向 度 試 題 反 應 理 論 之 試 題 刻 度 等 化 , 測 驗 年 刊 , 44(2) , 169-194。 姚 漢 禱 。 (1997) 。 評 分 量 尺 模 式 和 RASCH 二 分 模 式 應 用 在 運 動 技 能 測 驗 上 的 比 較 , 體 育 學 報 , 23, 95-106。 姚 漢 禱 。 (1998)。 參 加 1998 年 國 際 高 等 教 育 體 育 協 會 國 際 會 議 報 告 。 行 政 院 國 家 科 學 委 員 會 補 助 國 內 專 家 學 人 出 席 國 際 學 術 會 議 報 告 。 姚 漢 禱 。 (1999) 。 參 加 第 四 十 二 屆 國 際 體 育 、 健 康 、 休 閒 、 運 動 和 舞 蹈 世 界 會 議 報 告 。 行 政 院 國 家 科 學 委 員 會 補 助 國 內 專 家 學 人 出 席 國 際 學 術 會 議 報 告 。 葉 憲 清 和 姚 漢 禱 。 (1998) 。 編 製 運 動 教 練 評 鑑 量 表 , 行 政 院 國 家 科 學 委 員 會 八 十 八 年 度 專 題 研 究 計 畫 , NSC88-2 413-H-179 -001。 葉 憲 清 和 姚 漢 禱 。 (1999) 。 選 手 評 鑑 運 動 教 練 的 多 層 面 Ras ch 測 量 分 析 , 行 政 院 國 家 科 學 委 員 會 八 十 九 年 度 專 題 研 究 計 畫 , NSC8 9 -24 13 -H-17 9-001 。 Ackerman T. (1989). An alternative methodology for creating parallel test forms using the IRT Information function.Paper presented at the 1989 National Council on Measurement in education annual meeting, San
Francisco.
Ackerman, T.A. (1994). Using multidimensional item response theory to
understand what items and tests are measuring. Applied Measurement in Education, 7(4), 255-278.
respo ns e mo dellin g s oft ware. ACER P ress .
Bock , R. D., and Aitk en, M. (1981). Margi nal m ax imum
likel iho od Estim ati o n o f it em paramet ers: An ap pli cation of t h e EM al go rit hm.
Ps ychom et rik a, 46, 4 43-459 . Cole, E., & Zhu, W. (19 94 ). IRT
perso n fit s tat isti cs t o diagnos e moto r fu n ct ion. Res earch qu arterl y f or ex erci se and spo rt, March 1994 Sup pl ement, A-61. Fan, M. (1997). Theor y o f
multidim ensio nal it em respo ns e th eo r y and It’s app licati on. Pap er
pres ent ed at th e i nt ernati on al of ed ucati on and ps ycho logy test ed m eet in g, Nati onal Tai wan No rm al Univ ersit y, Tai pei, Taiwan , R. O. C. 29-58.
Fl et cher, R. (199 9). Incorporating recent advan ces i n
measu rement i n s port and ex erci se ps ych olo g y.
J ourn al o f spo rt an d exerci se ps ychol o g y, 21 (1 ), 2 4-3 8. Li nacre, J .M . (19 97 ). A u ser's
guid e t o Facet s R as ch measu rement com put er program. Chi cago: MESA. Loone y, M.A. (1 997).“Home”
improv em ent: th e t as k for measu rement s peci al ists. Measu rem ent i n p h ys ical education and ex erci se sci en ce, 1(2), 1 05 -11 6. McDon ald , R.P. (19 9 9). Test
Th eor y: A Un ifi ed Treatm en t. Hills dal e, NJ : Lawrence
Erl baum As so ci ates.
Nijk amp , P., & Voo gd, H. (1 984 ). Multidi mensio nal and
Meth odo lo g y, M easu rement, and Mo dels. Bro ok fi eld , Vermo nt: Go wer P ub lishin g Comp an y.
Rush all, B.S. , & Wiz nuk, K. (19 85 ). Athl et es ' ass essm en t of t h e co ach -- th e coach ev alu ati on qu esti onn ai re. Can adi an jo urnal o f app lied spo rt s ci en ces; 10 (3 ),
157 -16 1.
Segall, D.O. (1999). General Abilit y M easu rem ent : An Appli cati on of
Multidi mensio nal Ad apti ve Tes tin g. P ap er p res ent ed at the Ann ual M eetin g of t h e Nat ion al C oun cil o n
Measu rem ent i n Edu cation (Mo ntreal, Qu ebec, Can ad a, Ap ril 2 0-22 , 1 999 ).
Specto r, P.E. (199 2). Summ atin g ratin g s cale const ruction. Sage Univ ersit y P aper Seri es on Qu antit ati ve Appl ications
in th e S ocial Sciences, 07-082.Newbur y P ark, C A: Sage.
Volo din , N.A., & Adams, R.J . (1995). Id ent if yi ng and estim ati ng a D-dim ension al item resp ons e model.
Pap er present ed at th e In t ern ational Objecti ve Measu rem ent Works hop, Universit y o f C ali fo rnia, Berkele y, C ali fo rni a. Wri ght , B. D. , & Mas ters, G. N.
(1982). R ating s cale anal ys is. Chicago: M ESA.
Wu, M. L. (1 997 ). The
devel opm ent and ap p licatio n of a fit test fo r u se with margi nal m aximum
likel iho od est imation an d generalized it em res pons e mod els. Un publish ed
附錄二
ConQuest 程式(ACER)
:
(一)
估計單向度 Rasch 測量模式
title One-Dimensional Rating Scale Model ; datafile Coach.dat; format id 1-13 responses 15-42; codes 1,2,3,4,5,6; labels << Coach.nam; model item+step; set warnings=no,update=yes; export parameters >>one.prm;
export reg_coefficients >>one.reg; export covariance >> one.cov;
estimate! method=montecarlo,nodes=2000,conv=.005; show ! tables=1:2:3:4,estimates=latent>>one.shw; itanal>>one.itn;
quit;
(二)估計二向度 Rasch 測量模式
title Two-Dimensional Rating Scale Model; datafile Coach.dat; format id 1-13 responses 15-42; codes 1,2,3,4,5,6; labels << Coach.nam; score (1,2,3,4,5,6) (1,2,3,4,5,6) ( ) ! items (1-5,11-28); score (1,2,3,4,5,6) ( ) (1,2,3,4,5,6) ! items (6-10); model item+step; set warnings=no,update=yes; export parameters >>two.prm;
export reg_coefficients >>two.reg; export covariance >> two.cov;
附錄三
SAS 程式
/*YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD*/ /* */ /* NAME: 共變結構模式在多向度測驗上的應用: */ /* 雙向度運動教練評鑑量表。 */ /* TITLE: 驗證性分析運動教練評鑑量表 */ /* PRODUCT: STAT *//* SYSTEM: SAS WINDOWS 8.01 */ /* KEYS: 驗證性因素分析雙向度模式運動教練評鑑量表 */ /* PROCS: FACTOE CALIS */
/* DATA: 2001 年施測資料 */
/* */
/* */
/*YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD**YAU-HD*/ OPTIONS NODATE NONUMBER PS=300;
DATA CFA1(TYPE=CORR);
0.562844862 0.557925393 0.451620004 1 . . . . . CORR v24 0.327708747 0.235269645 0.35889081 0.351508405 0.399519413 0.18706237 0.274313775 0.227573625 0.211484744 0.30635045 0.479142174 0.353103138 0.380377651 0.342330286 0.337746477 0.36578669 0.299573483 0.452690901 0.229817259 0.358618337 0.320908917 0.310229557 0.333402122 1 . . . . CORR v25 0.53398616 0.452893345 0.593401485 0.546312644 0.604584288 0.373819422 0.433424794 0.40031615 0.364346023 0.450384703 0.697431787 0.548309764 0.574961057 0.568594489 0.595959869 0.582515109 0.468246325 0.516450549 0.376506503 0.601367653 0.472614415 0.409255338 0.439564765 0.645947642 1 . . . CORR v26 0.365405217 0.318780572 0.425842138 0.341216896 0.339959539 0.205095988 0.330701226 0.326410467 0.176857657 0.330046332 0.525969429 0.4019566 0.344700853 0.376534049 0.455769806 0.452533477 0.381657624 0.447385866 0.281868246 0.383905205 0.372101226 0.408082255 0.351560357 0.527158162 0.634043474 1 . . CORR v27 0.440284635 0.385281918 0.458541844 0.464973162 0.445202039 0.341389646 0.47979193 0.485355836 0.377789171 0.416746848 0.656390419 0.525252375 0.463245865 0.525432571 0.571276634 0.522027063 0.529033784 0.549410777 0.45636633 0.637296554 0.550473944 0.395955922 0.49535754 0.506234161 0.672171371 0.648932147 1 . CORR v28 0.423690033 0.353463942 0.505198968 0.496816384 0.523907004 0.448197545 0.512926085 0.508672007 0.512390633 0.441647669 0.644152293 0.605356019 0.509801971 0.558016801 0.524998779 0.548920377 0.448858928 0.494477366 0.448109648 0.651600832 0.530880911 0.474609184 0.579378438 0.485623157 0.635727063 0.42699642 0.601980206 1 ; TITLE'編製運動教練評鑑量表 CFA 一'; TITLE2'二十八題運動教練評鑑量表(6-10, 1-5 11-28)'; PROC CALIS COV CORR RESIDUAL MOD;
LINEQS