結論與未來發展 - 中華大學

經由上一章各種樣本的分析結果可以發現，即使全部的資料放一起，適性測驗能力值與50 題傳統測驗的兩種測驗成績的相關係數最低，但有達到顯著的相關性，而再進一步的將極端值去除掉，或者將能力較高的英文系學生單獨拿出來分析，都會讓相關係數提高，也都達到顯著相關性，顯示傳統英語字彙測驗與適性化英語字彙測驗的確具有高度相關性。

5.1、結論

以適性化英語字彙測驗系統所收集回來的實驗資料，再做進一步的結果分析。

5.1.1、研究結果

1.利用適性化英語字彙系統計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力值，呈現顯著正線性相關，並且達到 0.01 的顯著水準；另外適性化英語字彙系統計算出來的受測者的能力，與大量紙筆測驗中受測者計算出來的能力，其相關性也呈現顯著正相關，並且達到 0.05 的顯著水準，相關係數更高達0.641。

2.全體樣本在完全不篩選的情況下，適性化英語字彙系統所計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力，也是呈現正相關，並且達到0.01 的顯著水準。

3.在篩選掉一些極端值以後，適性化英語字彙系統所計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力，也是呈現示相關，並且達到0.01 的顯著水準，而且相關係數提高到 0.550。

4.在只採用英文系學生當樣本的行況下，成績都有顯著的提升，顯示能力的

確比一般受測者能力高，而且在適性化英語字彙系統所計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力，也是呈現正相關，並且達到0.01 的顯著水準，而且相關係數提高到 0.666。

5.在去除掉英文系樣本只留下其他科系的樣本的情況下，適性化英語字彙系統所計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力，相關係數僅有 0.228，未達顯著相關水準。在與統計博士羅琪老師請教的結果，認為原因是傳統英語字彙測驗的題目偏難，使得能力中等與能力較低的同學不具有區別效度，因為在英語字彙能力未達一個水平的同學，在回答這些題目上面，幾乎都是用猜測的，所得分數可能比中上中等程度同學還高。所以傳統測驗若題目太難或太簡單，是無法適當地區分出學生的英語字彙能力。反之，

適性測驗不會有此問題。

6.在分析部分的最後，以曾經在大量紙筆測驗有測驗過的受測者為樣本，適性化英語字彙系統所計算出來的受測者的能力，與利用線上測驗所建立的傳統英語字彙測驗所得到的能力，相關性分析達到 0.05 的顯著水準，而相關係數更高達 0.641，充分顯示出在大量測驗出來的成績，與適性化英語字彙測驗系統算出來的能力值，有著高度的正相關性。

7.大量紙筆測驗樣本的分析顯示出，大量紙筆樣本的受測者，測驗出來的成績，跟英語分級有著高度正相關；再從實驗後的分析結果，顯示出適性化英語字彙測驗系統所計算出來的能力值，與大量紙筆測驗的成績有著高度正相關。統和兩個結果，可以得到適性化英語字彙測驗系統的個人能力估計值，可以做為英語能力分級的依據，且與實際使用大量紙筆測驗分級的結果相去不遠。

8.使用 IRT(項目反映理論)來建立的適性化英語字彙測驗系統，可以有效的評量出個人英語字彙能力的水準。

5.1.2、研究貢獻

建立一個以2134 份大量紙筆測驗的樣本為基礎的題庫，並且使用項目反應理論當中的三個參數的羅吉斯模式，建立每個題庫的參數，設計出一套以項目反應理論為基礎的適性化英語字彙測驗系統。

建立一個能夠提供學生接受適性化英語測驗的環境，以及教師能夠實施適性化英語測驗的環境，也提供教師能夠新增題目，查詢題目資料，查詢學生能力資料，等等的功能，題目的資料包括選項以及區別參數、難度參數等資料，讓教師在英文測驗以及出題方面有個比較的依據。

在看過許多的 IRT 相關的論文以及書籍後，發現每篇都只有提到方法，以及參數的訓練方法跟過程，也有提到終止條件的計算方式，卻沒有提到終止條件的變數標準誤的差距，要在多少以下終止。經過大量的實驗及測試以後，我跟羅琪老師定出了0.001 這個數字當標準，能夠讓測驗者的題數有效的區別出來，不會每個人都做個7 題或 8 題就終止，也不會讓每個人都要做到 30 題才終止。

建立能夠當作英語字彙能力分級依據的一套測驗系統，能夠讓學校新生的英語分級測驗有個新的選擇，減少許多外包給廠商的成本，也能夠讓學校有自己的題目跟題庫資料的依據，不會再覺得永遠都是黑箱作業，而且也不會拿不到題目資料跟題目參數的資料。

5.2、未來發展

經由上面幾章跟上一節的分析，可以了解利用項目反應理論所建立出來的適性化英語測驗系統，的確可以有效的利用較少的題目，在短時間內就計算出受測者的英文能力水準，測驗的結果也能夠充分利用來當作英文分級的依據。在研究完後，還有一些研究的未來方向可以提供給後進的研究者當作參考，未來的研

1. 增加新題目：系統內題目僅有大量紙筆測驗的200 題，以及後來新增的用來做傳統英語字彙測驗的50 題，加上原本的 200 題有些參數估計出來的數字很大或很小，無法適用於項目反應理論內，所以實際可行的題目不達200 題，所以題數有點少，未來可以再新增一些題目以增加系統的完整性。

2. 新進題目參數的計算：由於項目反應理論一定要有參數才能做運算，

而系統採用的是三個參數的羅吉斯模式，所以每個題目都需要有三個參數。在這方面羅琪老師已經有了初步的想法，利用每次測驗後都新增題組來當作樣本，題組中除了新題目外，另外在原始題庫中選取 5~10 個具代表的定錨題目，等累積到足夠多的答題人數後，在估計這些題目的參數，然後再利用定錨題目對參數值做等化的工作。等化模式主要是利用 Stocking 與 Lord(1983) 所提之試題特徵曲線 (test characteristic curve)轉換法。

3. 適性化測驗系統的擴充：在研究目標那邊也有提到，希望能以英語字彙測驗為基礎，之後再推廣應用到文法、聽力、閱讀測驗上，讓線上適性化英文測驗的功能更加完整，能夠提供更多元化的測驗服務，不過這個研究方向算是比較有挑戰性。

參考文獻

[1]. 何榮桂、郭再興、蘇建誠(1991)。遠距適性測驗系統架構。資訊與教育雜誌, 42 期, p.29-35。

[2]. 吳信義(1996)。網路線上測驗系統。資訊與教育雜誌, 51 期, p.48-54。

[3]. 何榮桂、郭再興(1997)。網路化適性測驗系統。第六屆國際電腦輔助教學研討會大會論文集，p.186-196。

[4]. 何榮桂(1997)。遠距測驗－Dear Cat 的設計與實施, 物理教育, 1(1), p.51-62。

[5]. 何榮桂、郭再興、蘇建誠、陳麗如(1999)。在 Internet 上建構測驗環境之可行行及相關問題之探討。第三屆海峽兩岸心理與教育測驗學術研討會論文集, p.125-136。

[6]. 何榮桂(2000)。遠距測驗及其相關問題之探討。2000 網路學習理論與實務研討會論文集, p.23-33。

[7]. 古松民(2001)。線上適性測驗系統。資訊與教育雜誌, 81 期, p.60-69。

[8]. 羅琪、羅家駿、吳文舜(2006)。中華大學英語字彙能力線上適性測驗系統之建置。第十五屆南區統計研討會論文集, p.45。

[9]. 王淑敏、邱美秀、柳玉清等譯(1997)。教育測驗與評量。台北市，五南。

[10]. 林鴻源(1999)。線上測驗回饋形態對國小學童學習影響之分析研究。國立台南師範學院國民教育研究所碩士論文。

[11]. 葉千綺(1999)。測驗電腦化的理論與實務國小教學評量的反省與前瞻。台南師院測驗發展中心。

[12]. Baker, F. (2001) The basics of item response theory, 2^nd edition. ERIC Clearinghouse on Assessment and Evaluation.

[13]. Hambleton, R. K., & Swamination, H. (1985). Item response theory: Principles and applications. Boston: Kluwer-Niijhoff Publishing.

[14]. Ho, R. G. (1989). Computerized adaptive testing. Psychological Testing, XXXVI,117-130.

[15]. Hulin, C. L., Drasgow, F., & Parsons, C. K. (1983). Item response theory:

Applications to psychological measurement. Homewood, IL: Dow Jones Irwi.

[16]. Lord, F. M. (1980). Application of Item Response Theory to Practical Testing Problems. Hillsdale, NJ: Lawrence Erlbaum Associates.

[17]. Mills, C. & Stocking, M. (1996) Practical issues in Large Scale Computerized Adaptive Testing. Applied Measurement in Education, 9(4), 287-304.

[18]. Jeanne A. Teresi^a,b,* (2006) Mini-Mental State Examination (MMSE): Scaling the MMSE using item response theory (IRT). Journal of Clinical Epidemiology 60 (2007) 256-259.

附錄 A 參數訓練結果

列表如下：

題號參數a 參數b 參數c 1 0.513769 1.229218 0.25 2 0.879273 0.312738 0.25 3 0.766649 0.136456 0.25 4 1.105078 0.444765 0.25 5 0.637748 1.892118 0.25 6 0.763425 0.466461 0.25 7 0.960666 -0.94101 0.25 8 0.545197 0.3096 0.25 9 0.432423 -0.43711 0.25 10 1.05884 -0.44078 0.25 11 0.576582 3.964147 0.25 12 0.519849 1.210644 0.25 13 0.653374 2.080076 0.25 14 0.532735 -1.8661 0.25 15 0.470992 3.686302 0.25 16 0.506774 3.527413 0.25 17 -0.0335 -18.4396 0.25 18 0.224085 -0.28502 0.25 19 0.838627 1.791522 0.25 20 -0.00039 -1512.09 0.25 21 0.553754 0.394119 0.25 22 0.444422 0.98341 0.25 23 0.713214 0.361758 0.25 24 0.554063 0.420971 0.25 25 0.399788 1.48195 0.25 26 0.607466 2.160669 0.25 27 0.424649 5.868218 0.25 28 0.681423 0.830238 0.25 29 0.721715 2.146619 0.25 30 0.412652 1.856922 0.25

31 0.82799 0.550987 0.25 32 -0.00072 -1704.95 0.25 33 0.58954 2.597014 0.25 34 0.650076 -0.36402 0.25 35 0.421017 3.994071 0.25 36 0.690376 0.716506 0.25 37 0.62978 2.620827 0.25 38 0.440512 1.270225 0.25 39 0.467289 1.37251 0.25 40 0.421949 2.156427 0.25 41 0.606345 0.124234 0.25 42 0.186005 4.613091 0.25 43 1.242634 -0.22293 0.25 44 0.801526 0.885577 0.25 45 0.555707 2.143373 0.25 46 0.606819 1.068599 0.25 47 0.601913 3.841377 0.25 48 0.554783 2.199719 0.25 49 0.861709 0.77412 0.25 50 0.315847 6.438088 0.25 51 0.134401 4.89454 0.25 52 0.700845 0.776545 0.25 53 -0.00357 -374.81 0.25 54 0.576776 4.526673 0.25 55 0.33856 4.316655 0.25 56 0.829103 0.969015 0.25 57 -0.00037 -1506.29 0.25 58 0.344034 1.140661 0.25 59 1.182478 -0.6762 0.25 60 0.805128 3.357853 0.25 61 0.620133 2.995809 0.25 62 0.746712 0.099737 0.25 63 0.571596 1.170035 0.25 64 0.545783 1.97994 0.25 65 0.462993 2.187276 0.25 66 0.398723 1.501802 0.25

67 0.346464 1.976217 0.25 68 0.49817 2.920472 0.25 69 0.350307 3.84378 0.25 70 0.338324 3.502631 0.25 71 0.13609 3.133282 0.25 72 0.607495 2.181561 0.25 73 0.449161 2.040892 0.25 74 0.788923 -0.16564 0.25 75 0.520537 2.543729 0.25 76 0.640997 0.931398 0.25 77 0.664713 1.634665 0.25 78 0.452711 0.859668 0.25 79 0.481147 4.376786 0.25 80 0.768583 4.295562 0.25 81 0.829435 0.275738 0.25 82 0.803555 1.765369 0.25 83 0.379784 2.026861 0.25 84 0.558957 0.94649 0.25 85 0.33592 1.842151 0.25 86 0.292168 2.552015 0.25 87 0.280266 1.196143 0.25 88 0.370759 3.774142 0.25 89 -0.12007 -13.2658 0.25 90 0.783009 0.9266 0.25 91 0.354253 1.723767 0.25 92 0.73115 1.503795 0.25 93 0.379107 4.970611 0.25 94 0.778435 1.239289 0.25 95 0.506035 2.750238 0.25 96 0.518252 1.976055 0.25 97 0.308797 3.655228 0.25 98 -0.00056 -1524.03 0.25 99 0.24984 3.948147 0.25 100 0.81569 1.707708 0.25 101 0.644005 3.55821 0.25 102 1.02618 1.195324 0.25

103 0.664581 1.623135 0.25 104 0.729138 -0.06574 0.25 105 0.59538 2.530512 0.25 106 0.483512 2.832234 0.25 107 0.322175 0.754316 0.25 108 0.330859 2.806904 0.25 109 0.890982 0.370573 0.25 110 0.67569 1.378819 0.25 111 0.249325 3.167358 0.25 112 1.234196 0.158915 0.25 113 0.598274 2.300247 0.25 114 0.344712 4.136336 0.25 115 0.170517 2.013576 0.25 116 0.460473 3.844734 0.25 117 0.68892 0.941737 0.25 118 0.370414 1.049469 0.25 119 0.450495 2.549362 0.25 120 0.526733 2.235554 0.25 121 0.841409 0.674009 0.25 122 0.821788 0.531032 0.25 123 0.854209 0.514744 0.25 124 1.032857 0.862709 0.25 125 0.578155 3.13578 0.25 126 0.511678 2.133801 0.25 127 0.487362 2.365873 0.25 128 0.948986 0.668865 0.25 129 0.298034 5.276091 0.25 130 0.491328 1.849541 0.25 131 0.032349 48.43775 0.25 132 0.374619 3.4362 0.25 133 0.376143 3.090142 0.25 134 0.43632 4.249577 0.25 135 0.52772 2.839596 0.25 136 0.309511 4.511239 0.25 137 0.536375 2.451831 0.25 138 0.561421 0.58177 0.25

139 0.264858 3.754487 0.25 140 0.491068 1.721867 0.25 141 0.715375 1.802913 0.25 142 0.267612 3.518978 0.25 143 0.407535 3.772366 0.25 144 0.453539 1.633978 0.25 145 0.470277 1.395182 0.25 146 0.243832 4.343136 0.25 147 0.326206 1.82299 0.25 148 1.05114 0.313316 0.25 149 0.119338 6.484594 0.25 150 0.241292 1.534671 0.25 151 0.347341 0.168275 0.25 152 0.233148 1.589218 0.25 153 0.413022 2.157231 0.25 154 0.935721 1.311696 0.25 155 -0.0941 -15.6158 0.25 156 0.856968 0.62643 0.25 157 0.280688 3.528588 0.25 158 0.690213 2.379529 0.25 159 0.509655 2.131043 0.25 160 0.425338 1.953462 0.25 161 0.768619 0.224783 0.25 162 0.624445 -0.00602 0.25 163 0.226357 2.071195 0.25 164 0.429537 3.34334 0.25 165 0.556334 2.378814 0.25 166 0.10609 5.626506 0.25 167 0.584967 1.362692 0.25 168 0.906068 1.465477 0.25 169 0.582291 1.496985 0.25 170 0.643116 1.297302 0.25 171 0.52018 3.02595 0.25 172 0.354232 1.448308 0.25 173 0.299451 5.302495 0.25 174 0.422259 2.082371 0.25

在文檔中中華大學 (頁 71-82)