• 沒有找到結果。

第五章 結論與建議

第二節 研究建議

「高低鑑別加權」、「相關鑑別加權」「核平滑化無參數IRT 模式常態 CDF 轉換遞迴估計」,均為試題反應理論中為達成更佳的區辨力而被提出的加權法 則,但「高低鑑別加權」僅取前後25%的資料來做為求得加權值之依據,喪失了 中間50%受試者的作答訊息,故在做為能力估計值的預測上,無法反應所有受試 者真實的答題情形。而「相關鑑別加權」,針對此一缺失加以改善,將所有受試 者的答題組型均列入考慮,所以能夠較精確的估算出受試者的真實能力值。另「核 平滑化無參數IRT 模式常態 CDF 轉換遞迴估計」在相關係數的基礎上加以改善,

故有更好的估算效果,在以上的模擬測試中已獲得實證。

本研究提出的模擬試驗在受試者人數設定為 200 人以下,取樣最高僅 160 人,模擬試驗資料顯示:試題 30 題、抽樣 20 次,當受試人數增至 160 人時,

Ramsay(1991)之「高低鑑別加權」模式之能力參數估計誤差反而大於受試人數 120 人時,因此此研究結果適用受試者人數160 人以下。

未來可考慮將本研究提出雙重改進之新模式轉化應用於個別受試者之試題 關聯順序分析。

參考文獻

壹、中文部分

王寶墉(1995):現代測驗理論。台北市:心理出版社。

伍孝春(2005):數學科基測命題競賽與試題分析之研究。桃園縣:國民教育教學 輔導團。

余民寧(1992):測驗理論的發展趨勢。心理測驗之學術及實務研討會。國立政治 大學。

余民寧(1992):試題反應理論的介紹(三):試題反應模式及其特性。研習資訊,

9(2),6-10。

余民寧(2001):心理與教育統計學(初版四刷)。台北市:三民書局。

余民寧(2002):教育測驗與評量─成就測驗與教學評量(第二版)。台北市:心理出 版社。

吳世能(2008):多點記分無參數試題反應理論與順序理論整合模式程式設計與應 用。亞洲大學資訊工程學系碩士論文。

吳慧珉(2001):選項特徵曲線之研究—以核函數之平滑化為估計取向。國立臺中 師範學院教育測驗與統計研究所碩士論文。

何志成(2008):改進核平滑化無參數 IRT 模式之蒙地卡羅模擬研究。亞洲大學資 訊工程學系碩士論文。

林清山(1992):心理與教育統計學。台北:東華書局。

周郡禾(2001):利用完美組型建構點二系列相關核平滑化無參數試題選項反應理 論及其應用。國立臺中師範學院教育測驗統計研究所碩士論文。

紀順雄(2007):模糊詮釋結構模式分析取向的分數加法概念診斷。國立臺中教育 大學教育測驗統計研究所碩士論文。

胡豐榮、許天維(2002):談無參數核平滑理論與其在試題反應理論上之應用。測 驗統計簡訊,49,20-30。

郭伯臣(1995):無參數試題反應理論簡介。測驗統計簡訊,6,13-22。

曾建銘(2006):國中數學題庫之建置─以一元一次方程式單元為例。教育部台灣 省中等學校教師研習會九十五年度研究計畫。

劉湘川(2000)。點二系列相關試題鑑別指數之值譜分析及其在 IRT 上 之應用。測 驗統計年刋,8,1-20。

劉湘川(2001a),相關加權核平滑化無參數試題選項特徵曲線估計法及其 IORS 整 合模式。第五屆華人社會心理與教育測驗學術研討會。C5,1-10。

劉湘川(2001b),核平滑化試題選項特徵曲線與選項關聯結構整合擴充模式。測驗 統計年刊,9, 1-18。

劉湘川(2002a),高階相關比累進加權核平滑化試題選項分析綜合模式。測驗統計 年刊,10,197-218。

劉湘川(2002b),多重加權核平滑化試題選項綜合模式及其轉化應用。國立嘉義大 學:師範學院教育學術論文發表。

劉湘川(2003)。核平滑化試題與選項分析模式之條件最大概似數值估計。測驗統 計年刋,11,17-40。

劉湘川(2007)。多點記分核平滑化無參數 IRT 及其應用。測驗統計年刋,15,13-28。

劉湘川(2007)。試題反應理論講義。亞洲大學資訊工程研究所資訊教育組。(未出 版)

劉湘川、劉新梧(2001)。不完全資料之多元計分三參數試題選項分析擴充模式。

測驗統計年刊,9,19-45。

歐順德(2006):廣義隱藏式馬可夫模型與核平滑化無參數試題反應理論整合模式 之蒙地卡羅模擬研究。亞洲大學資訊工程學系碩士論文。

鄭富森(1994):一個 CTT 和 IRT 之整合模式。初等教育學刊第三期,101-138。

貳、外文部分

Ramsay, J. O. (1991). Kernel smoothing approaches to nonparametric item characteristic curve estimation. Psychometrika, 56, 611-630.

Ramsay, J. O. (2000). TestGraf : A program for the graphical analysis of multiple choice test

and questionnaire data.Quebec, Canada: McGill University.

附錄

附錄 A 不同取樣下,三種模式之能力參數估計誤差 MSE 值比較(總表)

人 模 抽樣20 次 抽樣30 次 抽樣50 次 抽樣100 次

數 式 30 題 40 題 50 題 30 題 40 題 50 題 30 題 40 題 50 題 30 題 40 題 50 題 模式1 .1481 .1339 .1186 .1282 .1256 .1211 .1411 .1249 .1126 .1441 .1180 .1112 模式2 .1382 .1281 .1156 .1206 .1205 .1170 .1353 .1200 .1088 .1373 .1141 .1082 40

模式3 .1295 .1167 .0993 .1124 .1050 .0925 .1275 .1105 .0974 .1332 .1090 .0958 模式1 .1191 .1033 .0852 .1210 .1034 .0861 .1228 .1080 .0908 .1205 .0997 .0816 模式2 .1133 .0989 .0805 .1134 .0984 .0842 .1150 .1009 .0853 .1143 .0941 .0777 80

模式3 .1084 .0982 .0735 .1099 .0917 .0775 .1075 .1006 .0822 .1120 .0894 .0773 模式1 .1129 .0881 .0733 .1089 .0912 .0768 .1097 .0905 .0732 .1080 .0878 .0758 模式2 .1084 .0829 .0697 .1041 .0837 .0725 .1069 .0859 .0700 .1035 .0824 .0724 120

模式3 .1051 .0818 .0689 .1031 .0793 .0707 .1022 .0857 .0666 .1000 .0808 .0714 模式1 .1162 .0832 .0718 .1055 .0807 .0697 .1038 .0836 .0702 .1034 .0847 .0713 模式2 .1079 .0793 .0685 .1020 .0771 .0673 .0983 .0799 .0669 .0994 .0800 .0680 160

模式3 .1037 .0787 .0684 .0972 .0757 .0670 .0975 .0795 .0644 .0976 .0774 .0672 模式1:高低鑑別加權模式(Ramsay,1991)

模式2:相關鑑別加權模式(劉湘川,2001)

模式3:常態 CDF 轉換遞迴估計模式(劉湘川,2007)

附錄 B 不同人數下,三種模式之能力參數估計誤差 MSE 值比較(總表)

抽樣 人 30 題 40 題 50 題

次數 數 模式 1 模式 2 模式 3 模式 1 模式 2 模式 3 模式 1 模式 2 模式 3 40 人 .1481 .1382 .1295 .1339 .1281 .1167 .1186 .1156 .0993 80 人 .1191 .1133 .1084 .1033 .0989 .0982 .0852 .0805 .0735 120 人 .1129 .1084 .1051 .0881 .0829 .0818 .0733 .0697 .0689 抽樣

20 次

160 人 .1162 .1079 .1037 .0832 .0793 .0787 .0718 .0685 .0684 40 人 .1282 .1206 .1124 .1256 .1205 .1050 .1211 .1170 .0925 80 人 .1210 .1134 .1099 .1034 .0984 .0917 .0861 .0842 .0775 120 人 .1089 .1041 .1031 .0912 .0837 .0793 .0768 .0725 .0707 抽樣

30 次

160 人 .1055 .1020 .0972 .0807 .0771 .0757 .0697 .0673 .0670 40 人 .1411 .1353 .1275 .1249 .1200 .1105 .1126 .1088 .0974 80 人 .1228 .1150 .1075 .1080 .1009 .1006 .0908 .0853 .0822 120 人 .1097 .1069 .1022 .0905 .0859 .0857 .0732 .0700 .0666 抽樣

50 次

160 人 .1038 .0983 .0975 .0836 .0799 .0795 .0702 .0669 .0644 40 人 .1441 .1373 .1332 .1180 .1141 .1090 .1112 .1082 .0958 80 人 .1205 .1143 .1120 .0997 .0941 .0894 .0816 .0777 .0773 120 人 .1080 .1035 .1000 .0878 .0824 .0808 .0758 .0724 .0714 抽樣

100 次

160 人 .1034 .0994 .0976 .0847 .0800 .0774 .0713 .0680 .0672 模式1:高低鑑別加權模式(Ramsay,1991)

模式2:相關鑑別加權模式(劉湘川,2001)

模式3:常態 CDF 轉換遞迴估計模式(劉湘川,2007)

附錄 C 不同取樣組合下,三種模式之能力參數估計誤差 MSE 值折線圖彙整

題數50題 抽樣20次

人數40人 抽樣30次

人數40人 抽樣100次

人數40人 題數40題

相關文件