改進建議

第五章結論與建議

第二節改進建議

本研究欲探討在不同的受試者能力分布下，減少人數是否會對參數估計精準度造成影響，故設定此研究之模擬施測人數為 5460 人、 7566 人。本研究也想要探討測驗題數的不同，是否也會對參數估計精準度造成影響，故設定兩種題數，

分別為 27 題和 45 題。本研究也想要探討題組比例的不同，是否也會對參數估計精準度造成影響，故設定兩種試題結構，分別為前三分之一題數為題組，後三分之二題數為單題及前三分之二題數為題組，後三分之一題數為單題。也設定題組效果變異數分別為 0、0.5、1，來探討題組效果變異數的不同，是否也會對參數估計精準度造成影響。茲就本研究的結果，提出一些研究建議，供後續研究者參考。

一、實務方面：

(一) 以本研究設計來說，當受試者能力分布為常態或雙峰時，人數的多寡對於參數值的估計結果皆有所不同，但各種參數估計差距不大，結果也有一致性，所以若考慮到施測的成本，則可採用 5460 的受測人數即可。

(二) 當題組效果變異數為 0 時，均可採用此二種軟體估計參數的誤差值，都呈現受試者能力參數估計誤差為最小。

(三) 當試題中的題組比例增加時，BILOG-MG 與 SCORIGHT 大多能得到較低的

估計值，但 SCORIGHT 的估計效果更佳。

(四) 當受試者能力分布為常態時，是較適用 SCORIGHT 來估計各項參數值。

當受試者能力分布為雙峰時，較適用 BILOG-MG 來估計各項參數值，既方便又省時。

二、改進方面：

(一) 由於時間因素的考量，此資料是經 25 次模擬資料分析所得之結果，未來研究可考量進行達 50 次以上的模擬資料分析。

(二) 當受試者能力分布為常態時，使用 SCORIGHT 此軟體估計受試者能力參數及試題參數均較為精準，只是進行參數估計的過程十分耗時，未來若能再研發相關的設計程式，改善此缺點，使用的意願將會大幅的提升。

(三) 目前本研究結果，受試者群能力分布僅考慮常態與雙峰為主，未來研究可將再加入受試者群能力分布為偏態，來探討受試者群能力分布的形態是否也會影響估計結果。

(四) 本研究的 BIB 設計，只進行一種試題區塊的配置方式，未來研究可就其他配置方式探討其估計結果。

(五) 本研究僅探討 BILOG-MG 和 SCORIGHT 兩種軟體對參數估計誤差的比較，未來可搭配不同的計分方式，來探討其他不同的參數估計軟體。

參考文獻

中文部份

TASA臺灣學生學習成就評量資料庫(2004)。臺北縣：國家教育研究院籌備處。

王暄博(2006)。BIB與NEAT設計之水平及垂直等化效果比較。國立臺中教育大學 教育測驗統計研究所碩士論文。

余民寧(1992a)。試題反應理論的介紹(一)基本概念與假設。研習資訊，9（1），

頁5-9。

余民寧(1992b)。試題反應理論的介紹(三) ── 試題反應模式及其特性。研習資 訊，9 (2)，頁 6-10。

許思雯(2008)。題組測驗在三種 IRT 計分模式能力估計精確性之比較。國立台南 大學測驗統計研究所碩士論文。

曾玉琳、王暄博、郭伯臣、許天維(2006)。不同BIB 設計對測驗等化的影響。測 驗統計年刊，第十三輯下期，頁 209-229。台中市：國立台中教育大學。

彭森明(2003，7月)。如何建置全國性教育資料庫，使其發揮最大價值與功能。文 教新潮，8 (3)，37-44 。

楊孟麗、譚康榮、黃敏雄(2003)。心理計量報告：TEPS 2001 分析能力測驗。2009 年11月10日，取自http://www.teps.sinica.edu.tw/TestingReport2004-2-10.htm 趙素珍(1997)。BILOG-MG之簡介。測驗統計簡訊雙月刊，18，頁33-54。

趙素珍(1998)。IRT軟體估計精準度之比較。國立台中師範學院國民教育研究所 碩士論文。

顏秀聿(2009)。題組測驗等化效果於不同等化設計之比較。國立臺中教育大學 教育測驗統計研究所碩士論文。

英文部分

Allen, N.L., Donoghue, J.R., & Schoeps, T.L. (2001). The NAEP 1998 technical report. Washington, DC: National Center for Educational Statistics.

Allen S., &Sudweeks R.R.(2001). Identifying and managing local item Dependence in context-dependent item sets. Paper presented at the annual meeting of the

American Educational Research Association, Seattle, WA.

Baker, F. B. (1992). Item Response Theory: Parameter Estimation Techniques. New York: Marcel Dekker. Inc.

Birnbaum, A. (1968). Some latent trait models and their use in inferring an examinee·s ability. In F. M. Lord & M. R. Novick (Eds.), Statistical theories of mental test scores(pp. 397-479). Reading, MA: Addison-Wesley.

Bradlow,E. T.,Wainer H., & Wang X. (1999). A Bayesian random effects model for testlets. Psychometrika, 64(2),153-168.

Cureton, E.E.(1965). Reliability and validity: Basic assumptions and experimental designs. Educational and Psychological Measurement,25,326-346

Ebel,R.L.(1951).Writing the testing item. In E.F. Lindquist(Ed.), Educational Measurement(pp.185-249).Washington,DC:American Council on Education.

Haladyna T. M.(1992).Context-Dependent Item Sets. Educational Measurement:

Issues and Practice,11(4),21-25.

Hambleton, R.K., & Swaminathan, H. (1985). Item Response Theory: Principles and Application. Boston, MA：Kivwer-Nijhoff.

Hambleton, R. K., Zaal, N. J., & Pieters, J. P. M. (1991). Computerized Adaptive Testing: Theory, Applications, and Standards. In R. K. Hambleton & N. J. Zaal (Eds.), Advances in Educational and Psychological Testing.

Lee G, Brennan R.L., &Frisbie D. A.(2000). Incorporating the testlet concept in test score analyses. Educational Measurement:Issues and Practice,19(4),9-15.

Mislevy, R. J. & Bock R. D. (1990). BILOG-3 (2nd ed.): Item analysis and test scoring with binary logistic models. Mooresvilk: Scientific Software.

Nemhauser, G. L., & Wolsey, L. A. (1999). Integer and Combinatorial Optimization.

New York: John Wiley.

van der Linden, W.J., & Veldkamp, B.P.,& Carlson, J.E. (2004).Optimizing Balanced Incomplete Block Designs for Educational Assessments. Applied Psychological Measurement, 28, 317-331.

Wainer,H.,& Lewis,C.(1990).Toward a psychametrics for testlets.Journal of Educational Measurement,27(1),1-14

Wainer, H., & Lukhele, R. (1997). How reliable are TOEFL scores? Educational and Psychological Measurement, 57, 749-766.

Wainer,H., & Kiely,G.L.(1987).Item clusters and computerized adaptive testing: A case for testlets. Journal of Educational Measurement,24(3),185-201.

Wainer, H., & Thissen, D. (1996). How is reliability related to the quality of test scores? What is the effect of local dependence on reliability? Educational Measurement: Issues and Practice, 15(1), 22-29.

Wainer, H., & Wang, X. (2000). Using a new statistical model for testlets to score TOEFL. Journal of Educational Measurement, 37(3), 203-220.

Wainer, H., Bradlow, E. T., & Du, Z. (2000). Testlet response theory: An analog for the 3PL model using in testlet-based adaptive testing. In W. J. van der Linden &

C. A. W. Glas (Eds.), Computerized adaptive testing: Theory and Practice (pp.

245-269). Dordrecht, Netherlands: Kluwer.

Wainer, H., Sireci, S. G., & Thissen, D. (1991). Differential testlet functioning:

Definition and detecting. Journal of Educational Measurement, 28, 197-219.

Wang, W.-C., & Wilson, M. (2005). Exploring local item dependence using a random-effects facet model. Applied Psychological Measurement, 29, 296-318.

Wang, X., Bradlow, E. T., & Wainer, H. (2005). A user’s guide for SCORIGHT (verson 3.0): A computer program for scoring tests built of testlets including a module for covariate analysis (ETS Technical Report RR-04-49). Princeton, NJ: Educational Testing Service.

Wainer H., Bradlow E. T., & Wang, X. (2007). Testlet response theory and its applications. New Yorks Cambridge University Press.

Weiss, D.J., & Yoes, M.E. (1991). Item response theory. In R.K. Hambleton & J. N.

Zaal (eds.), Advances in educational and psychological testing. Boston: Kluwer Academic Publishers.

Yen,W.M. (1993). Scaling performance assessment: Strategies for managing local item dependence. Journal of Educational Measurement, 30(3), 187-213

Zimowski, M. F., Muraki, E. ,Mislevy, R. J., & Bock, R. D. (2003). BILOG-MG for Windows (version 3). Chicago, IL: Scientific Software International, Inc.

附錄一、常態與雙峰下，不同變項對 BILOG 參數估計之影響

附表 1-1 常態分布下，不同題數對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題組比例

題組效果變異數

題

數能力值鑑別度難度猜測度

27 0.402(0.014) 0.495(0.072) 0.360(0.112) 0.049(0.004) 0 45 0.327(0.017) 0.439(0.057) 0.247(0.047) 0.047(0.004)

27 0.438(0.022) 0.521(0.064) 0.337(0.104) 0.050(0.005) 0.5 45 0.354(0.015) 0.439(0.065) 0.212(0.045) 0.048(0.004) 27 0.449(0.018) 0.503(0.077) 0.320(0.108) 0.051(0.004) 1/3

1 45 0.377(0.017) 0.426(0.064) 0.222(0.046) 0.049(0.004) 27 0.408(0.020) 0.513(0.062) 0.368(0.125) 0.049(0.004) 0 45 0.328(0.013) 0.430(0.072) 0.251(0.067) 0.047(0.003) 27 0.424(0.018) 0.519(0.069) 0.320(0.073) 0.051(0.003) 0.5 45 0.332(0.019) 0.434(0.086) 0.224(0.069) 0.047(0.004) 27 0.443(0.020) 0.536(0.075) 0.320(0.067) 0.050(0.004) 5460

2/3

1 45 0.333(0.012) 0.426(0.052) 0.204(0.040) 0.048(0.005) 27 0.388(0.009) 0.489(0.095) 0.227(0.085) 0.047(0.004) 0 45 0.312(0.007) 0.415(0.064) 0.171(0.063) 0.044(0.004) 27 0.416(0.011) 0.475(0.079) 0.207(0.066) 0.047(0.004) 0.5 45 0.342(0.010) 0.382(0.078) 0.158(0.024) 0.048(0.017) 27 0.430(0.013) 0.478(0.095) 0.216(0.085) 0.050(0.004) 1/3

1 45 0.371(0.015) 0.395(0.077) 0.181(0.046) 0.047(0.005) 27 0.390(0.011) 0.492(0.094) 0.236(0.094) 0.046(0.004) 0 45 0.309(0.008) 0.398(0.077) 0.180(0.079) 0.043(0.003) 27 0.406(0.008) 0.477(0.090) 0.195(0.042) 0.047(0.004) 0.5 45 0.319(0.007) 0.372(0.066) 0.151(0.030) 0.044(0.003) 27 0.418(0.014) 0.489(0.088) 0.207(0.083) 0.049(0.004) 7566

2/3

1 45 0.321(0.007) 0.390(0.061) 0.164(0.077) 0.045(0.003)

附表-12 雙峰分布下，不同題數對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題組比例

題組效果變異數

題

數能力值鑑別度難度猜測度

27 0.405(0.012) 0.595(0.105) 0.226(0.077) 0.048(0.003) 0 45 0.339(0.015) 0.551(0.103) 0.190(0.031) 0.049(0.003) 27 0.424(0.009) 0.554(0.078) 0.205(0.034) 0.049(0.004) 0.5 45 0.362(0.011) 0.498(0.069) 0.188(0.024) 0.047(0.003) 27 0.436(0.008) 0.520(0.095) 0.211(0.047) 0.049(0.004) 1/3

1 45 0.381(0.012) 0.480(0.097) 0.197(0.025) 0.049(0.003) 27 0.402(0.007) 0.586(0.102) 0.204(0.033) 0.049(0.032) 0 45 0.341(0.016) 0.577(0.088) 0.201(0.035) 0.049(0.004) 27 0.419(0.010) 0.557(0.094) 0.199(0.033) 0.050(0.008) 0.5 45 0.345(0.013) 0.516(0.091) 0.193(0.028) 0.049(0.003) 27 0.428(0.014) 0.557(0.116) 0.212(0.031) 0.050(0.003) 5460

2/3

1 45 0.355(0.017) 0.555(0.086) 0.204(0.031) 0.049(0.003) 27 0.418(0.013) 0.644(0.091) 0.233(0.045) 0.047(0.003) 0 45 0.365(0.015) 0.641(0.088) 0.222(0.030) 0.046(0.003) 27 0.442(0.012) 0.613(0.122) 0.229(0.035) 0.048(0.003) 0.5 45 0.379(0.010) 0.566(0.061) 0.211(0.027) 0.047(0.004) 27 0.458(0.016) 0.578(0.084) 0.252(0.036) 0.048(0.003) 1/3

1 45 0.398(0.012) 0.539(0.072) 0.221(0.031) 0.048(0.003) 27 0.422(0.009) 0.646(0.084) 0.226(0.025) 0.047(0.003) 0 45 0.359(0.015) 0.620(0.095) 0.224(0.055) 0.046(0.003) 27 0.429(0.012) 0.582(0.118) 0.220(0.033) 0.048(0.003) 0.5 45 0.364(0.015) 0.583(0.097) 0.206(0.027) 0.047(0.004) 27 0.442(0.015) 0.583(0.110) 0.233(0.043) 0.048(0.003) 7566

2/3

1 45 0.377(0.018) 0.626(0.100) 0.220(0.025) 0.047(0.003)

附表 1-3 常態分布下，不同題組比例對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題數

題組效果變異數

題組比例

能力值鑑別度難度猜測度

1/3 0.402(0.014) 0.495(0.072) 0.360(0.112) 0.049(0.004) 0 2/3 0.408(0.020) 0.513(0.062) 0.368(0.125) 0.049(0.004) 1/3 0.438(0.022) 0.521(0.064) 0.337(0.104) 0.050(0.005) 0.5 2/3 0.424(0.018) 0.519(0.069) 0.320(0.073) 0.051(0.003) 1/3 0.449(0.018) 0.503(0.077) 0.320(0.108) 0.051(0.004) 27

1 2/3 0.443(0.020) 0.536(0.075) 0.320(0.067) 0.050(0.004) 1/3 0.327(0.017) 0.439(0.057) 0.247(0.047) 0.047(0.004) 0 2/3 0.328(0.013) 0.430(0.072) 0.251(0.067) 0.047(0.003)

1/3 0.354(0.015) 0.439(0.065) 0.212(0.045) 0.048(0.004) 0.5 2/3 0.332(0.019) 0.434(0.086) 0.224(0.069) 0.047(0.004) 1/3 0.377(0.017) 0.426(0.064) 0.222(0.046) 0.049(0.004) 5460

1 2/3 0.333(0.012) 0.426(0.052) 0.204(0.040) 0.048(0.005) 1/3 0.388(0.009) 0.489(0.095) 0.227(0.085) 0.047(0.004) 0 2/3 0.390(0.011) 0.492(0.094) 0.236(0.094) 0.046(0.004) 1/3 0.416(0.011) 0.475(0.079) 0.207(0.066) 0.047(0.004) 0.5 2/3 0.406(0.008) 0.477(0.090) 0.195(0.042) 0.047(0.004) 1/3 0.430(0.013) 0.478(0.095) 0.216(0.085) 0.050(0.004) 27

1 2/3 0.418(0.014) 0.489(0.088) 0.207(0.083) 0.049(0.004) 1/3 0.312(0.007) 0.415(0.064) 0.171(0.063) 0.044(0.004) 0 2/3 0.309(0.008) 0.398(0.077) 0.180(0.079) 0.043(0.003) 1/3 0.342(0.010) 0.382(0.078) 0.158(0.024) 0.048(0.017) 0.5 2/3 0.319(0.007) 0.372(0.066) 0.151(0.030) 0.044(0.003) 1/3 0.371(0.015) 0.395(0.077) 0.181(0.046) 0.047(0.005) 7566

1 2/3 0.321(0.007) 0.390(0.061) 0.164(0.077) 0.045(0.003)

附表 1-4 雙峰分布下，不同題組比例對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題數

題組效果變異數

題組比例

能力值鑑別度難度猜測度

1/3 0.405(0.012) 0.595(0.105) 0.226(0.077) 0.048(0.003) 0 2/3 0.402(0.007) 0.586(0.102) 0.204(0.033) 0.049(0.032) 1/3 0.424(0.009) 0.554(0.078) 0.205(0.034) 0.049(0.004) 0.5 2/3 0.419(0.010) 0.557(0.094) 0.199(0.033) 0.050(0.008) 1/3 0.436(0.008) 0.520(0.095) 0.211(0.047) 0.049(0.004) 27

1 2/3 0.428(0.014) 0.557(0.116) 0.212(0.031) 0.050(0.003) 1/3 0.339(0.015) 0.551(0.103) 0.190(0.031) 0.049(0.003) 0 2/3 0.341(0.016) 0.577(0.088) 0.201(0.035) 0.049(0.004) 1/3 0.362(0.011) 0.498(0.069) 0.188(0.024) 0.047(0.003) 0.5 2/3 0.345(0.013) 0.516(0.091) 0.193(0.028) 0.049(0.003) 1/3 0.381(0.012) 0.480(0.097) 0.197(0.025) 0.049(0.003) 5460

1 2/3 0.355(0.017) 0.555(0.086) 0.204(0.031) 0.049(0.003) 1/3 0.418(0.013) 0.644(0.091) 0.233(0.045) 0.047(0.003) 0 2/3 0.422(0.009) 0.646(0.084) 0.226(0.025) 0.047(0.003) 1/3 0.442(0.012) 0.613(0.122) 0.229(0.035) 0.048(0.003) 0.5 2/3 0.429(0.012) 0.582(0.118) 0.220(0.033) 0.048(0.003) 1/3 0.458(0.016) 0.578(0.084) 0.252(0.036) 0.048(0.003) 27

1 2/3 0.442(0.015) 0.583(0.110) 0.233(0.043) 0.048(0.003) 1/3 0.365(0.015) 0.641(0.088) 0.222(0.030) 0.046(0.003) 0 2/3 0.359(0.015) 0.620(0.095) 0.224(0.055) 0.046(0.003) 1/3 0.379(0.010) 0.566(0.061) 0.211(0.027) 0.047(0.004) 0.5 2/3 0.364(0.015) 0.583(0.097) 0.206(0.027) 0.047(0.004) 1/3 0.398(0.012) 0.539(0.072) 0.221(0.031) 0.048(0.003) 7566

1 2/3 0.377(0.018) 0.626(0.100) 0.220(0.025) 0.047(0.003)

附表 1-5 常態分布下，不同題組效果變異數對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題數

題組比例

題組效果變異數

能力值鑑別度難度猜測度

0 0.402(0.014) 0.495(0.072) 0.360(0.112) 0.049(0.004) 0.5 0.438(0.022) 0.521(0.064) 0.337(0.104) 0.050(0.005) 1/3

1 0.449(0.018) 0.503(0.077) 0.320(0.108) 0.051(0.004) 0 0.408(0.020) 0.513(0.062) 0.368(0.125) 0.049(0.004) 0.5 0.424(0.018) 0.519(0.069) 0.320(0.073) 0.051(0.003) 27

2/3

1 0.443(0.020) 0.536(0.075) 0.320(0.067) 0.050(0.004) 0 0.327(0.017) 0.439(0.057) 0.247(0.047) 0.047(0.004) 0.5 0.354(0.015) 0.439(0.065) 0.212(0.045) 0.048(0.004) 1/3

1 0.377(0.017) 0.426(0.064) 0.222(0.046) 0.049(0.004) 0 0.328(0.013) 0.430(0.072) 0.251(0.067) 0.047(0.003) 0.5 0.332(0.019) 0.434(0.086) 0.224(0.069) 0.047(0.004) 5460

45 2/3

1 0.333(0.012) 0.426(0.052) 0.204(0.040) 0.048(0.005) 0 0.388(0.009) 0.489(0.095) 0.227(0.085) 0.047(0.004) 0.5 0.416(0.011) 0.475(0.079) 0.207(0.066) 0.047(0.004) 1/3

1 0.430(0.013) 0.478(0.095) 0.216(0.085) 0.050(0.004) 0 0.390(0.011) 0.492(0.094) 0.236(0.094) 0.046(0.004) 0.5 0.406(0.008) 0.477(0.090) 0.195(0.042) 0.047(0.004) 27

2/3

1 0.418(0.014) 0.489(0.088) 0.207(0.083) 0.049(0.004) 0 0.312(0.007) 0.415(0.064) 0.171(0.063) 0.044(0.004) 0.5 0.342(0.010) 0.382(0.078) 0.158(0.024) 0.048(0.017) 1/3

1 0.371(0.015) 0.395(0.077) 0.181(0.046) 0.047(0.005) 0 0.309(0.008) 0.398(0.077) 0.180(0.079) 0.043(0.003) 0.5 0.319(0.007) 0.372(0.066) 0.151(0.030) 0.044(0.003) 7566

45 2/3

1 0.321(0.007) 0.390(0.061) 0.164(0.077) 0.045(0.003)

附表 1-6 雙峰分布下，不同題組效果變異數對 BILOG-MG 估計參數值之比較 RMSE(SD)

人數題數

題組比例

題組效果變異數

能力值鑑別度難度猜測度

0 0.405(0.012) 0.595(0.105) 0.226(0.077) 0.048(0.003) 0.5 0.424(0.009) 0.554(0.078) 0.205(0.034) 0.049(0.004) 1/3

1 0.436(0.008) 0.520(0.095) 0.211(0.047) 0.049(0.004) 0 0.402(0.007) 0.586(0.102) 0.204(0.033) 0.049(0.032) 0.5 0.419(0.010) 0.557(0.094) 0.199(0.033) 0.050(0.008) 27

2/3

1 0.428(0.014) 0.557(0.116) 0.212(0.031) 0.050(0.003) 0 0.339(0.015) 0.551(0.103) 0.190(0.031) 0.049(0.003) 0.5 0.362(0.011) 0.498(0.069) 0.188(0.024) 0.047(0.003) 1/3

1 0.381(0.012) 0.480(0.097) 0.197(0.025) 0.049(0.003) 0 0.341(0.016) 0.577(0.088) 0.201(0.035) 0.049(0.004) 0.5 0.345(0.013) 0.516(0.091) 0.193(0.028) 0.049(0.003) 5460

45 2/3

1 0.355(0.017) 0.555(0.086) 0.204(0.031) 0.049(0.003) 0 0.418(0.013) 0.644(0.091) 0.233(0.045) 0.047(0.003) 0.5 0.442(0.012) 0.613(0.122) 0.229(0.035) 0.048(0.003) 1/3

1 0.458(0.016) 0.578(0.084) 0.252(0.036) 0.048(0.003) 0 0.422(0.009) 0.646(0.084) 0.226(0.025) 0.047(0.003) 0.5 0.429(0.012) 0.582(0.118) 0.220(0.033) 0.048(0.003) 27

2/3

1 0.442(0.015) 0.583(0.110) 0.233(0.043) 0.048(0.003) 0 0.365(0.015) 0.641(0.088) 0.222(0.030) 0.046(0.003) 0.5 0.379(0.010) 0.566(0.061) 0.211(0.027) 0.047(0.004) 1/3

1 0.398(0.012) 0.539(0.072) 0.221(0.031) 0.048(0.003) 0 0.359(0.015) 0.620(0.095) 0.224(0.055) 0.046(0.003) 0.5 0.364(0.015) 0.583(0.097) 0.206(0.027) 0.047(0.004) 7566

45 2/3

1 0.377(0.018) 0.626(0.100) 0.220(0.025) 0.047(0.003)

附錄二、常態與雙峰下，不同變項對 SCORIGHT 參數估計之影響

附表 2-1 常態分布下，不同題數對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題組比例

題組效果變異數

題

數能力值鑑別度難度猜測度

27 0.371(0.007) 0.283(0.021) 0.197(0.022) 0.056(0.013) 0 45 0.297(0.004) 0.253(0.017) 0.166(0.015) 0.050(0.006) 27 0.396(0.009) 0.317(0.027) 0.187(0.024) 0.055(0.009) 0.5 45 0.330(0.005) 0.293(0.018) 0.170(0.021) 0.052(0.008) 27 0.416(0.008) 0.338(0.025) 0.198(0.021) 0.055(0.011) 1/3

1 45 0.355(0.008) 0.330(0.020) 0.179(0.027) 0.052(0.007) 27 0.371(0.005) 0.284(0.026) 0.194(0.022) 0.049(0.006) 0 45 0.299(0.004) 0.271(0.016) 0.180(0.020) 0.046(0.006) 27 0.387(0.007) 0.307(0.030) 0.188(0.023) 0.052(0.009) 0.5 45 0.305(0.004) 0.292(0.018) 0.167(0.017) 0.047(0.005) 27 0.402(0.009) 0.344(0.036) 0.202(0.027) 0.051(0.008) 5460

2/3

1 45 0.312(0.005) 0.319(0.014) 0.173(0.022) 0.048(0.009) 27 0.370(0.007) 0.225(0.022) 0.134(0.017) 0.044(0.005) 0 45 0.292(0.004) 0.189(0.014) 0.124(0.013) 0.042(0.005) 27 0.396(0.006) 0.246(0.019) 0.139(0.016) 0.048(0.007) 0.5 45 0.325(0.005) 0.220(0.011) 0.123(0.016) 0.042(0.003)

27 0.414(0.008) 0.270(0.023) 0.159(0.023) 0.049(0.008) 1/3

1 45 0.348(0.007) 0.247(0.017) 0.137(0.016) 0.045(0.005) 27 0.371(0.007) 0.222(0.015) 0.127(0.013) 0.042(0.004) 0 45 0.292(0.003) 0.194(0.007) 0.123(0.016) 0.041(0.003)

27 0.389(0.006) 0.228(0.018) 0.141(0.016) 0.044(0.004) 0.5 45 0.299(0.004) 0.217(0.013) 0.122(0.008) 0.041(0.002)

27 0.400(0.009) 0.248(0.023) 0.149(0.013) 0.044(0.003) 7566

2/3

1 45 0.305(0.005) 0.238(0.018) 0.124(0.014) 0.041(0.002)

附表 2-2 雙峰分布下，不同題數對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題組比例

題組效果變異數

題

數能力值鑑別度難度猜測度

27 0.411(0.006) 0.664(0.061) 0.309(0.036) 0.103(0.017) 0 45 0.336(0.003) 0.535(0.041) 0.267(0.026) 0.088(0.013) 27 0.433(0.007) 0.615(0.057) 0.314(0.032) 0.103(0.016) 0.5 45 0.362(0.004) 0.484(0.030) 0.261(0.018) 0.084(0.006)

27 0.447(0.006) 0.600(0.041) 0.335(0.036) 0.110(0.014) 1/3

1 45 0.382(0.005) 0.471(0.027) 0.278(0.026) 0.090(0.012) 27 0.409(0.007) 0.555(0.051) 0.278(0.033) 0.091(0.016) 0 45 0.331(0.004) 0.463(0.037) 0.247(0.023) 0.080(0.010) 27 0.425(0.006) 0.531(0.032) 0.286(0.034) 0.091(0.017) 0.5 45 0.339(0.004) 0.456(0.021) 0.255(0.024) 0.081(0.010) 27 0.436(0.007) 0.535(0.035) 0.293(0.028) 0.095(0.014) 5460

2/3

1 45 0.344(0.004) 0.457(0.023) 0.254(0.026) 0.083(0.011) 27 0.432(0.006) 0.739(0.054) 0.338(0.034) 0.098(0.016) 0 45 0.362(0.004) 0.597(0.027) 0.286(0.023) 0.079(0.008) 27 0.454(0.006) 0.676(0.052) 0.346(0.029) 0.101(0.015) 0.5 45 0.385(0.004) 0.554(0.031) 0.290(0.025) 0.082(0.013)

27 0.467(0.005) 0.655(0.054) 0.356(0.031) 0.102(0.016) 1/3

1 45 0.403(0.005) 0.541(0.032) 0.300(0.029) 0.085(0.012) 27 0.431(0.005) 0.638(0.032) 0.313(0.029) 0.089(0.011) 0 45 0.357(0.004) 0.551 (0.024) 0.267(0.021) 0.074(0.008) 27 0.445(0.006) 0.599(0.050) 0.323(0.031) 0.090(0.015) 0.5 45 0.364(0.004) 0.531(0.025) 0.270(0.021) 0.075(0.009)

27 0.456(0.006) 0.594(0.037) 0.338(0.030) 0.096(0.015) 7566

2/3

1 45 0.370(0.003) 0.529(0.021) 0.269(0.018) 0.073(0.009)

附表 2-3 常態分布下，不同題組比例對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題數

題組效果變異

數題組比例

能力值鑑別度難度猜測度

1/3 0.371(0.007) 0.283(0.021) 0.197(0.022) 0.056(0.013) 0 2/3 0.371(0.005) 0.284(0.026) 0.194(0.022) 0.049(0.006) 1/3 0.396(0.009) 0.317(0.027) 0.187(0.024) 0.055(0.009) 0.5 2/3 0.387(0.007) 0.307(0.030) 0.188(0.023) 0.052(0.009) 1/3 0.416(0.008) 0.338(0.025) 0.198(0.021) 0.055(0.011) 27

1 2/3 0.402(0.009) 0.344(0.036) 0.202(0.027) 0.051(0.008) 1/3 0.297(0.004) 0.253(0.017) 0.166(0.015) 0.050(0.006) 0 2/3 0.299(0.004) 0.271(0.016) 0.180(0.020) 0.046(0.006) 1/3 0.330(0.005) 0.293(0.018) 0.170(0.021) 0.052(0.008) 0.5 2/3 0.305(0.004) 0.292(0.018) 0.167(0.017) 0.047(0.005) 1/3 0.355(0.008) 0.330(0.020) 0.179(0.027) 0.052(0.007) 5460

1 2/3 0.312(0.005) 0.319(0.014) 0.173(0.022) 0.048(0.009) 1/3 0.370(0.007) 0.225(0.022) 0.134(0.017) 0.044(0.005) 0 2/3 0.371(0.007) 0.222(0.015) 0.127(0.013) 0.042(0.004) 1/3 0.396(0.006) 0.246(0.019) 0.139(0.016) 0.048(0.007) 0.5 2/3 0.389(0.006) 0.228(0.018) 0.141(0.016) 0.044(0.004) 1/3 0.414(0.008) 0.270(0.023) 0.159(0.023) 0.049(0.008) 27

1 2/3 0.400(0.009) 0.248(0.023) 0.149(0.013) 0.044(0.003) 1/3 0.292(0.004) 0.189(0.014) 0.124(0.013) 0.042(0.005) 0 2/3 0.292(0.003) 0.194(0.007) 0.123(0.016) 0.041(0.003) 1/3 0.325(0.005) 0.220(0.011) 0.123(0.016) 0.042(0.003) 0.5 2/3 0.299(0.004) 0.217(0.013) 0.122(0.008) 0.041(0.002) 1/3 0.348(0.007) 0.247(0.017) 0.137(0.016) 0.045(0.005) 7566

1 2/3 0.305(0.005) 0.238(0.018) 0.124(0.014) 0.041(0.002)

附表 2-4 雙峰分布下，不同題組比例對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題數

題組效果變異數

題組比例

能力值鑑別度難度猜測度

1/3 0.411(0.006) 0.664(0.061) 0.309(0.036) 0.103(0.017) 0 2/3 0.409(0.007) 0.555(0.051) 0.278(0.033) 0.091(0.016) 1/3 0.433(0.007) 0.615(0.057) 0.314(0.032) 0.103(0.016) 0.5 2/3 0.425(0.006) 0.531(0.032) 0.286(0.034) 0.091(0.017)

1/3 0.447(0.006) 0.600(0.041) 0.335(0.036) 0.110(0.014) 27

1 2/3 0.436(0.007) 0.535(0.035) 0.293(0.028) 0.095(0.014) 1/3 0.336(0.003) 0.535(0.041) 0.267(0.026) 0.088(0.013) 0 2/3 0.331(0.004) 0.463(0.037) 0.247(0.023) 0.080(0.010) 1/3 0.362(0.004) 0.484(0.030) 0.261(0.018) 0.084(0.006) 0.5 2/3 0.339(0.004) 0.456(0.021) 0.255(0.024) 0.081(0.010) 1/3 0.382(0.005) 0.471(0.027) 0.278(0.026) 0.090(0.012) 5460

1 2/3 0.344(0.004) 0.457(0.023) 0.254(0.026) 0.083(0.011) 1/3 0.432(0.006) 0.739(0.054) 0.338(0.034) 0.098(0.016) 0 2/3 0.431(0.005) 0.638(0.032) 0.313(0.029) 0.089(0.011) 1/3 0.454(0.006) 0.676(0.052) 0.346(0.029) 0.101(0.015) 0.5 2/3 0.445(0.006) 0.599(0.050) 0.323(0.031) 0.090(0.015)

1/3 0.467(0.005) 0.655(0.054) 0.356(0.031) 0.102(0.016) 27

1 2/3 0.456(0.006) 0.594(0.037) 0.338(0.030) 0.096(0.015) 1/3 0.362(0.004) 0.597(0.027) 0.286(0.023) 0.079(0.008) 0 2/3 0.357(0.004) 0.551 (0.024) 0.267(0.021) 0.074(0.008) 1/3 0.385(0.004) 0.554(0.031) 0.290(0.025) 0.082(0.013) 0.5 2/3 0.364(0.004) 0.531(0.025) 0.270(0.021) 0.075(0.009) 1/3 0.403(0.005) 0.541(0.032) 0.300(0.029) 0.085(0.012) 7566

1 2/3 0.370(0.003) 0.529(0.021) 0.269(0.018) 0.073(0.009)

附表 2-5 常態分布下，不同題組效果變異數對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題數

題組比例

題組效果變異數

能力值鑑別度難度猜測度

0 0.371(0.007) 0.283(0.021) 0.197(0.022) 0.056(0.013) 0.5 0.396(0.009) 0.317(0.027) 0.187(0.024) 0.055(0.009) 1/3

1 0.416(0.008) 0.338(0.025) 0.198(0.021) 0.055(0.011) 0 0.371(0.005) 0.284(0.026) 0.194(0.022) 0.049(0.006) 0.5 0.387(0.007) 0.307(0.030) 0.188(0.023) 0.052(0.009) 27

2/3

1 0.402(0.009) 0.344(0.036) 0.202(0.027) 0.051(0.008) 0 0.297(0.004) 0.253(0.017) 0.166(0.015) 0.050(0.006) 0.5 0.330(0.005) 0.293(0.018) 0.170(0.021) 0.052(0.008) 1/3

1 0.355(0.008) 0.330(0.020) 0.179(0.027) 0.052(0.007) 0 0.299(0.004) 0.271(0.016) 0.180(0.020) 0.046(0.006) 0.5 0.305(0.004) 0.292(0.018) 0.167(0.017) 0.047(0.005) 5460

45 2/3

1 0.312(0.005) 0.319(0.014) 0.173(0.022) 0.048(0.009) 0 0.370(0.007) 0.225(0.022) 0.134(0.017) 0.044(0.005) 0.5 0.396(0.006) 0.246(0.019) 0.139(0.016) 0.048(0.007) 1/3

1 0.414(0.008) 0.270(0.023) 0.159(0.023) 0.049(0.008) 0 0.371(0.007) 0.222(0.015) 0.127(0.013) 0.042(0.004) 0.5 0.389(0.006) 0.228(0.018) 0.141(0.016) 0.044(0.004) 27

2/3

1 0.400(0.009) 0.248(0.023) 0.149(0.013) 0.044(0.003) 0 0.292(0.004) 0.189(0.014) 0.124(0.013) 0.042(0.005) 0.5 0.325(0.005) 0.220(0.011) 0.123(0.016) 0.042(0.003) 1/3

1 0.348(0.007) 0.247(0.017) 0.137(0.016) 0.045(0.005) 0 0.292(0.003) 0.194(0.007) 0.123(0.016) 0.041(0.003) 0.5 0.299(0.004) 0.217(0.013) 0.122(0.008) 0.041(0.002) 7566

45 2/3

1 0.305(0.005) 0.238(0.018) 0.124(0.014) 0.041(0.002)

附表 2-6 雙峰分布下，不同題組效果變異數對 SCORIGHT 估計參數值之比較 RMSE(SD)

人數題數

題組比例

題組效果變異數

能力值鑑別度難度猜測度

0 0.411(0.006) 0.664(0.061) 0.309(0.036) 0.103(0.017) 0.5 0.433(0.007) 0.615(0.057) 0.314(0.032) 0.103(0.016) 1/3

1 0.447(0.006) 0.600(0.041) 0.335(0.036) 0.110(0.014) 0 0.409(0.007) 0.555(0.051) 0.278(0.033) 0.091(0.016) 0.5 0.425(0.006) 0.531(0.032) 0.286(0.034) 0.091(0.017) 27

2/3

1 0.436(0.007) 0.535(0.035) 0.293(0.028) 0.095(0.014) 0 0.336(0.003) 0.535(0.041) 0.267(0.026) 0.088(0.013) 0.5 0.362(0.004) 0.484(0.030) 0.261(0.018) 0.084(0.006) 1/3

1 0.382(0.005) 0.471(0.027) 0.278(0.026) 0.090(0.012) 0 0.331(0.004) 0.463(0.037) 0.247(0.023) 0.080(0.010) 0.5 0.339(0.004) 0.456(0.021) 0.255(0.024) 0.081(0.010) 5460

45 2/3

1 0.344(0.004) 0.457(0.023) 0.254(0.026) 0.083(0.011) 0 0.432(0.006) 0.739(0.054) 0.338(0.034) 0.098(0.016) 0.5 0.454(0.006) 0.676(0.052) 0.346(0.029) 0.101(0.015) 1/3

1 0.467(0.005) 0.655(0.054) 0.356(0.031) 0.102(0.016) 0 0.431(0.005) 0.638(0.032) 0.313(0.029) 0.089(0.011) 0.5 0.445(0.006) 0.599(0.050) 0.323(0.031) 0.090(0.015) 27

2/3

1 0.456(0.006) 0.594(0.037) 0.338(0.030) 0.096(0.015) 0 0.362(0.004) 0.597(0.027) 0.286(0.023) 0.079(0.008) 0.5 0.385(0.004) 0.554(0.031) 0.290(0.025) 0.082(0.013) 1/3

1 0.403(0.005) 0.541(0.032) 0.300(0.029) 0.085(0.012) 0 0.357(0.004) 0.551 (0.024) 0.267(0.021) 0.074(0.008) 0.5 0.364(0.004) 0.531(0.025) 0.270(0.021) 0.075(0.009) 7566

45 2/3

1 0.370(0.003) 0.529(0.021) 0.269(0.018) 0.073(0.009)

附錄三、常態與雙峰下，兩種軟體在不同變項的參數估計結果

附表 3-1 常態分布下，兩種軟體在不同題數中對參數估計值之比較(1) RMSE(SD)

人數題組

附表 3-2 常態分布下，兩種軟體在不同題數中對參數估計值之比較(2) RMSE(SD)

人數題組

附表 3-3 常態分布下，兩種軟體在不同題數中對參數估計值之比較(3) RMSE(SD)

人數題組

附表 3-4 常態分布下，兩種軟體在不同題數中對參數估計值之比較(4) RMSE(SD)

人數題組

附表 3-5 雙峰分布下，兩種軟體在不同題數中對參數估計值之比較(1) RMSE(SD)

人數題組

附表 3-6 雙峰分布下，兩種軟體在不同題數中對參數估計值之比較(2) RMSE(SD)

人數題組

附表 3-7 雙峰分布下，兩種軟體在不同題數中對參數估計值之比較(3) RMSE(SD)

人數題組

附表 3-8 雙峰分布下，兩種軟體在不同題數中對參數估計值之比較(4) RMSE(SD)

人數題組

附表 3-9 常態分布下，兩種軟體在不同題組比例中對參數估計值之比較(1) RMSE(SD)

人數題數

附表 3-10 常態分布下，兩種軟體在不同題組比例中對參數估計值之比較(2) RMSE(SD)

人數題數

附表 3-11 常態分布下，兩種軟體在不同題組比例中對參數估計值之比較(3) RMSE(SD)

人數題數

附表 3-12 常態分布下，兩種軟體在不同題組比例中對參數估計值之比較(4) RMSE(SD)

人數題數

附表 3-13 雙峰分布下，兩種軟體在不同題組比例中對參數估計值之比較(1) RMSE(SD)

人數題數

附表 3-14 雙峰分布下，兩種軟體在不同題組比例中對參數估計值之比較(2) RMSE(SD)

人數題數

附表 3-15 雙峰分布下，兩種軟體在不同題組比例中對參數估計值之比較(3) RMSE(SD)

人數題數

附表 3-16 雙峰分布下，兩種軟體在不同題組比例中對參數估計值之比較(4) RMSE(SD)

人數題數

附表 3-17 常態分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較(1)

RMSE(SD)

人數題數題組

附表 3-18 常態分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (2)

RMSE(SD)

人數題數題組

附表 3-19 常態分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (3)

RMSE(SD)

人數題數題組

附表 3-20 常態分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (4)

RMSE(SD)

人數題數題組

附表 3-21 雙峰分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (1)

RMSE(SD)

人數題數題組

附表 3-22 雙峰分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (2)

RMSE(SD)

人數題數題組

附表 3-23 雙峰分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (3)

RMSE(SD)

人數題數題組

附表 3-24 雙峰分布下，兩種軟體在不同題組效果變異數中對參數估計值之比較 (4)

RMSE(SD)

人數題數題組

在文檔中題組題與單選題混合測驗之BIB設計效果探究 (頁 73-114)

第五章 結論與建議

第二節 改進建議

參考文獻

中文部份

英文部分

附錄一、常態與雙峰下，不同變項對 BILOG 參數估計之影響

附錄二、常態與雙峰下，不同變項對 SCORIGHT 參數估計之影響

附錄三、常態與雙峰下，兩種軟體在不同變項的參數估計結果

第五章結論與建議

第二節改進建議