• 沒有找到結果。

第五章 結論與建議

第二節 限制與建議

3. 當測驗長度為 10 題時,以 PARSCALE 的斜率參數估計誤差最小。

(三)估計試題步驟難度:以 KS-GPCM 的估計誤差大部分較 PARSCALE 小。

由以上的結論發現,本研究用於分析大型測驗,會得到較 PARSCALE 好的 參數估計。在能力值為非常態分佈的情形下,KS-GPCM(λ=0.5orλ=1)大部 分可以得到較 PARSCALE 好的參數估計,所以如果可以藉由先前的診斷,先行 診斷出受試者群是屬於雙峰或偏態,之後藉由本程式進行參數估計。

第二節 限制與建議

本節就本研究未盡完備之處,提出一些研究建議,供後續研究者參考。

一、 以KS-GPCM 進行參數估計,本研究針對λ =0,0.5,1三種進行討論,後續研 究可以深入探討不同能力分布情境下以何種λ值估計較佳。

二、 由於本研究未探討PARSCALE 中參數初始值的設定對於估計的影響,未來 研究可以針對此點進行探討。

三、 由於本研究未探討等化,所以後續研究者可以針對研究等化議題進行探討。

四、 由於本研究未探討二元計分與多元計分混合的情形,後續研究可以針對此 議題進行探討。

行探討。

參考文獻

中文部分

吳慧珉(2001)。選項特徵曲線之研究-以核函數之平滑化為估計取向。國立臺 中師範學院教育測驗統計研究所碩士論文,臺中市。

陳政漳(2003)。項目反應理論在自然科學科能力測驗之應用:部分給分模式與 等級反應模式之比較。中原大學心理學研究所碩士論文,桃園縣。

張雅媛(2007)。融合 kernel smoothing 之 MMLE 法於 IRT 參數估計之應用。國 立臺中教育大學教育測驗統計研究所碩士論文,臺中市。

劉湘川(2001a)。相關加權核平滑化無參數試題選項特徵曲線估計法及其 IORS 整合模式。第五屆華人社會心理與教育測驗學術研討會,1-10。臺北市:中 國測驗學會、臺灣師範大學。

劉湘川(2001b)。核平滑化試題選項特徵曲線與選項關聯結構整合擴充模式。測 驗統計年刊第 9 輯。1-18。

謝典佑、王暄博、郭伯臣、楊思偉(2007)。以混合分佈改進 MMLE/EM IRT 參 數估計法。中國測驗學會 2007 年年會暨心理與教育測驗學術研討會。臺北 市:國立台灣師範大學。

英文部分

Andrich, D. (1982). A rating formulation for ordered response categories.

Psychometrika, 43, 561-573.

Andrich, D. (1988). A general form of Rasch’s extended logistic model for partial credit scoring. Applied Measurement in Education, 1, 363-378.

Bock, R. D. & Lieberman, M. (1970) Fitting a response model for n dichotomously scored items. Psychometrika, 35, 179-197.

Bock, R. D. & Aitkin, M. (1981) Marginal maximum likelihood estimation of item parameters:Application of an EM algorithm. Psychometrika, 46, 443-459.

Bock, R. D. & Mislevy, R. J. (1982). Adaptive EAP estimation of ability in a microcomputer environment. Applied Psychological Measurement, 6, 431-444.

Bock, R. D., Gibbons, R., & Muraki, E. (1988). Full-information factor analysis.

Applied Psychological Measurement, 12, 261-280.

Bowman, A. W. & Azzalini, A. (1997). Applied Smoothing Techniques for Data Analysis. Oxford University Press.

Baker, F. B. (1992). Item Response TheoryParameter estimation techniques. New York:Marcel Dekker.

Dodd, B. G., & Koch, W. R. (1987). Effects of variations in item step values on item and test information in the partial credit model. Applied Psychological Methods, 19, 5-22.

Gasser, T. & Muller, H. G. (1979). Kernel estimation of regression functions. In Smoothing Techniques for Curve Estimation . Springer-Verlag.

Kuo, B. C., Hsieh, T. Y., & Chang Y. Y. (2007). MMLE/EM-KS based on kernel smoothing. Pacific Rim Objective Measurement Symposium(PROMS

TW2007),TaoYuan, Taiwan.

Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47,149-174.

Muraki, E. (1990). Fitting a polytomous item response model to Likert-type data.

Applied Psychological Measurement,14 ,59-71.

Muraki, E. (1992). A generalized Partial credit model:Application of an EM algorithm.

Applied Psychological Measurement, 16(2), 159-176.

Muraki, E., & Bock, R. D. (1996). PARSCALE: IRT based test scoring and item analysis for graded open-ended exercises and performance tasks. Chicago:

Scientific Software.

Muraki, E., & Bock, R. D. (2003). IRT from SSI: BILOG-MG, MULTILOG, PARSCALE, TESTFACT. Scientific Software International, Inc.

Mislevy, R. J. (1986). Bayes modal estimation in item response models.

Psychometrica, 51, 177-195.

Nadaraya, E. A. (1964) On Estimating Regression, Theory Probability Application, 10, 186−90.

Priestley, M. B. & Chao, M. T. (1972). Non-parametric function fitting. J. Roy. Statist.

Soc.Ser. B 34, 385-392.

Silverman, B.W. (1986). Density Estimation for Statistics and Data Analysis. London:

Chapman & Hall.

Thissen, D. (1991). MULTILOG user's guide: Multiple, categorical item analysis and test scoring using Item Response Theory (Version 6.0). Chicago: Scientific Software.

Wainer, H. & Thissen, D. (1987). Estimating ability with the wrong model. Journal of

Wolfgang, H. & Marlene, M (2004) Nonparametric and Semiparametric Models.

Heidelberge New York.

Zimowski, M. F., Muraki, E. ,Mislevy, R. J. , & Bock, R. D.(1996). BILOG-MG.

Scientific Software International.

相關文件