第五章 結論與建議
第二節 限制與建議
3. 當測驗長度為 10 題時,以 PARSCALE 的斜率參數估計誤差最小。
(三)估計試題步驟難度:以 KS-GPCM 的估計誤差大部分較 PARSCALE 小。
由以上的結論發現,本研究用於分析大型測驗,會得到較 PARSCALE 好的 參數估計。在能力值為非常態分佈的情形下,KS-GPCM(λ=0.5orλ=1)大部 分可以得到較 PARSCALE 好的參數估計,所以如果可以藉由先前的診斷,先行 診斷出受試者群是屬於雙峰或偏態,之後藉由本程式進行參數估計。
第二節 限制與建議
本節就本研究未盡完備之處,提出一些研究建議,供後續研究者參考。
一、 以KS-GPCM 進行參數估計,本研究針對λ =0,0.5,1三種進行討論,後續研 究可以深入探討不同能力分布情境下以何種λ值估計較佳。
二、 由於本研究未探討PARSCALE 中參數初始值的設定對於估計的影響,未來 研究可以針對此點進行探討。
三、 由於本研究未探討等化,所以後續研究者可以針對研究等化議題進行探討。
四、 由於本研究未探討二元計分與多元計分混合的情形,後續研究可以針對此 議題進行探討。
行探討。
參考文獻
中文部分
吳慧珉(2001)。選項特徵曲線之研究-以核函數之平滑化為估計取向。國立臺 中師範學院教育測驗統計研究所碩士論文,臺中市。
陳政漳(2003)。項目反應理論在自然科學科能力測驗之應用:部分給分模式與 等級反應模式之比較。中原大學心理學研究所碩士論文,桃園縣。
張雅媛(2007)。融合 kernel smoothing 之 MMLE 法於 IRT 參數估計之應用。國 立臺中教育大學教育測驗統計研究所碩士論文,臺中市。
劉湘川(2001a)。相關加權核平滑化無參數試題選項特徵曲線估計法及其 IORS 整合模式。第五屆華人社會心理與教育測驗學術研討會,1-10。臺北市:中 國測驗學會、臺灣師範大學。
劉湘川(2001b)。核平滑化試題選項特徵曲線與選項關聯結構整合擴充模式。測 驗統計年刊第 9 輯。1-18。
謝典佑、王暄博、郭伯臣、楊思偉(2007)。以混合分佈改進 MMLE/EM IRT 參 數估計法。中國測驗學會 2007 年年會暨心理與教育測驗學術研討會。臺北 市:國立台灣師範大學。
英文部分
Andrich, D. (1982). A rating formulation for ordered response categories.
Psychometrika, 43, 561-573.
Andrich, D. (1988). A general form of Rasch’s extended logistic model for partial credit scoring. Applied Measurement in Education, 1, 363-378.
Bock, R. D. & Lieberman, M. (1970) Fitting a response model for n dichotomously scored items. Psychometrika, 35, 179-197.
Bock, R. D. & Aitkin, M. (1981) Marginal maximum likelihood estimation of item parameters:Application of an EM algorithm. Psychometrika, 46, 443-459.
Bock, R. D. & Mislevy, R. J. (1982). Adaptive EAP estimation of ability in a microcomputer environment. Applied Psychological Measurement, 6, 431-444.
Bock, R. D., Gibbons, R., & Muraki, E. (1988). Full-information factor analysis.
Applied Psychological Measurement, 12, 261-280.
Bowman, A. W. & Azzalini, A. (1997). Applied Smoothing Techniques for Data Analysis. Oxford University Press.
Baker, F. B. (1992). Item Response Theory:Parameter estimation techniques. New York:Marcel Dekker.
Dodd, B. G., & Koch, W. R. (1987). Effects of variations in item step values on item and test information in the partial credit model. Applied Psychological Methods, 19, 5-22.
Gasser, T. & Muller, H. G. (1979). Kernel estimation of regression functions. In Smoothing Techniques for Curve Estimation . Springer-Verlag.
Kuo, B. C., Hsieh, T. Y., & Chang Y. Y. (2007). MMLE/EM-KS based on kernel smoothing. Pacific Rim Objective Measurement Symposium(PROMS
TW2007),TaoYuan, Taiwan.
Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47,149-174.
Muraki, E. (1990). Fitting a polytomous item response model to Likert-type data.
Applied Psychological Measurement,14 ,59-71.
Muraki, E. (1992). A generalized Partial credit model:Application of an EM algorithm.
Applied Psychological Measurement, 16(2), 159-176.
Muraki, E., & Bock, R. D. (1996). PARSCALE: IRT based test scoring and item analysis for graded open-ended exercises and performance tasks. Chicago:
Scientific Software.
Muraki, E., & Bock, R. D. (2003). IRT from SSI: BILOG-MG, MULTILOG, PARSCALE, TESTFACT. Scientific Software International, Inc.
Mislevy, R. J. (1986). Bayes modal estimation in item response models.
Psychometrica, 51, 177-195.
Nadaraya, E. A. (1964) On Estimating Regression, Theory Probability Application, 10, 186−90.
Priestley, M. B. & Chao, M. T. (1972). Non-parametric function fitting. J. Roy. Statist.
Soc.Ser. B 34, 385-392.
Silverman, B.W. (1986). Density Estimation for Statistics and Data Analysis. London:
Chapman & Hall.
Thissen, D. (1991). MULTILOG user's guide: Multiple, categorical item analysis and test scoring using Item Response Theory (Version 6.0). Chicago: Scientific Software.
Wainer, H. & Thissen, D. (1987). Estimating ability with the wrong model. Journal of
Wolfgang, H. & Marlene, M (2004) Nonparametric and Semiparametric Models.
Heidelberge New York.
Zimowski, M. F., Muraki, E. ,Mislevy, R. J. , & Bock, R. D.(1996). BILOG-MG.
Scientific Software International.