• 沒有找到結果。

第五章 結論與建議

第二節 建議

依據本研究之分析結果及研究發現提出以下建議,供後續研究或教師作為測 驗及教學之參考。

一、試題命題方式建議

(一)預試的必要性

- 107 -

一份好的測驗,經過編擬、命題、選題、重複審題、預試,由預試的結果進 行試題檢核及統計分析完成初稿後,再重複多次修正才得以將試題定稿。本測驗 中有部份缺失及限制,如少數試題的難易度值超出範圍太多、題意不清、超出高 職課程綱要範圍或涵蓋在國中已習得概念、選項不具誘答力等一般性的缺失,是 在預試時便可偵測出的。鑒於此,本研究再次強調預試在試題編製的過程中的重 要性。

(二)試題宜由易至難方式排列

本研究之模擬考試題雖無依據單元序作排列,但因考試範圍小難免鄰近試題 有出現相同概念之情形,對受試者而言,作答過程的概念連結及統整能力會受到 試題干擾,避免同一概念重複出現在題本中,可將試題由易至難排序以提升學生 作答動機。

(三)試題宜參考各單元建議教學時數作分配

依據雙向細目表(如附錄 3),本研究之模擬考試題在「直角坐標系」單元的 題數分配比例稍大,建議可依據課程綱要中訂定的各單元建議教學時數,調整各 單元題數的分配。

二、教學上的建議

(一)利用具誘答力選項進行教學設計

教師可針對學生之錯誤類型及常見迷思概念,進行教學設計、形成性評量、

課後練習、課程設計及補救教學等,協助學生概念釐清、引導學習過程之反思。

(二)建立題庫及測驗的回饋系統

教、學與測驗,是師生互動及反饋的重要環節。研究者建議可由本研究繼續 延伸,融入資訊科技彙集眾力,建置一套針對高職課程之擬題、研究、試題分析、

修題及反饋機制,協助區分各試題優劣,審慎挑選試題,以增進測驗編製與教學 上的成效;進而發展電腦化適性測驗,依據受試者答題反應估算出學生程度值,

並立即選出適合受試者程度的題目讓受試者作答,使學生的學習及思考得以適性 延展。

三、對未來研究的建議

(一)擴大研究範圍與對象

- 108 -

本研究針對「100學年度四技二專第一次聯合模擬考商業類數學科試題」的作 答資料來作相關統計分析,抽取北、中、南區各四所學校之高職三年級學生做樣 本,共8473筆有效樣本。未能涵蓋東部地區及考慮城鄉差異,建議未來研究者可 增加各地區抽取之學校數,將東部地區加入研究範圍,以了解全國高職生的數學 科學習情形。

(二)分析受試者之錯誤類型

本研究僅針對此試題提出部分學生迷思概念,未能完整整理出各個單元常出 現的錯誤類型,建議未來研究者可針對高職課綱所訂定的內容,搭配試題分析與 錯誤類型分析,提供教師在教學設計、編製測驗、釐清概念盲點、或補救教學的 實施上作輔助;同時提供學生在學習過程中作自我審視、檢視常見的迷思概念、

以建立鞏固推理思考及運思過程的完整性。

(三)融入資訊科技建立題庫

建議未來研究者可搭配資訊科技,彙整教學現場所提供的優良試題,進一步 進行大規模評量及嚴謹的試題分析,建立題庫及反饋系統,結合自編測驗試題的 上傳及共享,及各地區學生作答情形與試題分析,進而提供學生自學題庫及建立 即時教學回饋。

(四)辦理工作坊研習

大規模彙整教學經驗及資源,建立優良試題的共享題庫,需大量人力和時間 建置。建議學科中心匯集教師群、專家學者及相關研究人員,辦理工作坊對測驗 命題、學生迷思概念及教學回饋相互交流,進而推動研究及教學資源匯整及建立 反饋機制。

(五)考慮更多元化的樣本變因

本研究受試者的資料中,並無樣本的背景資料,建議後續研究可蒐集樣本之 性別、學習態度、課後補習與否、家庭環境、社經背景、城鄉區域…等因素加以探 討與成就測驗答題情形的相關性。

- 109 -

- 110 - Kubiszyn, & Gray Borich)

陳怡欣(1994)。試題反應理論與知識結構分析在國小六年級社會科學習成就評量

- 111 -

楊志強、楊志堅(2003)。選項特徵曲線在科學教育評量之應用。應用教學科技於 科學教育學術研討會,國立嘉義大學。

楊志強(2004)。測驗品質考驗與 TestGraf 98 的應用。教師專業成長與實踐智慧,

93-104。

楊明宗(2002)。數學試題分析模式的建置-以「九十學年度四技二專入學測驗」

商業類「數學科」試題為例(未出版碩士論文)。國立台中教育大學,台中市。

劉湘川(2000)。點二系列相關試題鑑別指數之值譜分析及其在 IRT 上之應用。

測驗統計年刊,8,1-17。

劉湘川、吳慧珉(2001)。無參數 IRT 軟體-Testgraf98 之介紹。測驗統計簡訊,

33,23-32。

劉湘川、許天維、郭伯臣(1993)。試題反應理論簡介。國教輔導,33(1),10-15。

劉湘川、許天維、鄭富森(1998)。IRT 軟體估計精確度之比較。測驗統計年刊,

61,1-112。

劉湘川、顧介梅(2001)。微積分選擇題型的試題檢核及黃參考示例。測驗統計簡 訊雙月刊,44,13-31。國立台中教育大學,台中市。

歐滄和(2003)。教育測驗與評量。台北市:心理出版社。

簡茂發(1991)。命題方法與試題分析。國教輔導,31(1),2-13。

簡茂發(1993)。測驗的編製。測驗統計年刊,1,13-32。

簡茂發、劉湘川、許天維、郭伯臣(1993)。試題反應理論在國民教育階段國小數 學科基本學習成量上的應用。測驗年刊,41,1-17。

- 112 -

二、英文部分

Anastasi, A. (1982). Psychological Testing. (5th ed.) NY: Macmillan Publishing.

Bashaw, W. L. (1982). Educational testing application of the Rasch Model. In C.

Renold(ed.). Handbook of School Psychology.

Bennett, D. T. (1998/2001). Randomness.

Birnbaum, A. (1968). Statistical theories of mental test scores.Reading,Mass.:Addison Wesley.

Carmines, E. G. & Zeller, R. A. (1979). Reliability and validity assessment. Beverly Hills, CA: Sage.

Chase, C. I.(1978). Measurement for educational evaluation(2 ed.). Reading, MA: th Addison-Wesley.

Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart & Winston.

Cronbach, L. J. (1951). Coefficient alpha and the internal structure of test.

Psychometrika, 16, 297-334.

Ebel, R. L. & Frisbie, D. A. (1991). Essentials of educational measurement(

5

thed.).

Englewood Cliffs, NJ: Prentice-Hall.

Guttman, L. (1944). A basis for scaling qualitative data. American Sociological Review, 9, 139-150.

Haladyna, T. M. (1994). Developing and validating multiple-choice test items. Hillsdale, NJ: Lawrence Erlbaum Associates.

Hambleton, R. K. & Cook, L. L. (1977). Latent trait models and their use in the analysis of educational test data. Journal of Educational Measurement,14,75-96.

Hambleton, R. K. & Swaminathan, H. (1985). Item response theory: Principles and applications. Boston,MA: Kluwer-Ni jhoff.

Hambleton, R. K. (1989). Principles and selected applications of item response theory.

In R. L. Linn(Ed.), Educational measurement(3rd ed. , pp.147-200). New York:

Macmillan.

Hambleton, R. K. , Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of item response theory. Newburry Park,CA: SAGE.

- 113 -

Hopkins, K. D., Stanley, J. C., & Hopkins, B. R.(1990). Educational and psychological measurement and evaluation(

7

thed.). Englewood Cliffs, NJ: Prentice Hall.

Hutten, L. (1980). Some empirical evidence for latent trait model selection. Paper presented at the annual meeting of the American Educational Research Association, Boston MA.

Kaiser, H. F. (1970). A Second generation little jiffy. Psychomertrika, 35, 401-415.

Kibler, R. J. (1978). Objectives or instruction and evaluation(2nded.). Boston, MA:

Allyn and Bocon.

Lord, F. M. (1980). Applications of item response theory to practical testing problems.

Hillsdale,New Jersey: Lawrence Erlbaum Associates.

Murphy, K. R. & Davidshofer, C. O. (1988). Psychological Testing : Principles and Application (4th ed.). NJ : Prentice-Hall.

National Assessment Governing Board(2007). Mathematics framework for the 2007 national assessment of educational progress. National Assessment Governing Board U.S. Department of Education.

National Assessment Governing Board(2002). Mathematics framework for the 2003 national assessment of educational progress. National Assessment Governing Board U.S. Department of Education.

Noll, V. H., Scannell, D. P., & Craig, R. C. (1979). Introducation to educational measurement(4 ed.). Boston,MA:Houghton Mifflin. th

Osterlind, S. J. (1998). Constructing test items:Multiple-choice,constructed-response, performance,andother formats(2 ed.). Boston: Kluwer Academic Publishers. th Ramsay, J. O. (1991). Kernel smoothing approaches to nonparametric item

characteristic curve estimation. Psychometrika, 56, 611-630.

Reckase, M. D. (1979). Unifactor latent trait models applied to multifactor tests:

Results and implication.Journal of Education Statistics, 4, 207-230.

Richardson, M. W. (1936). The relationship between difficulty and the differential validity of a test. Psychometrika, 1, 33-49.

Safrit, M. J., Cohen, A. S., & Costa, M. G.. (1989). Iten response theory and

measurement of motor behavior. Research Quarterly for Exercise and Sport, 60(4), 32-335.

Thorndike, R. M., Cunningham, G. K., Thorndike, R. L., & Hangen, E. P.(1991).

- 114 -

Measurement and evaluation in psychology and education (5th ed.). New York:

Macmillan.

Thurstone, L. L. (1929). Theory of attitude measurement. Psychological Bulletin, 36, 222-241.

Tucker, L. R. (1946). Maximum validity of a test with equivaleant items. Psychometrika, 11, 1-13.

Wayne, David, Patrick, Steve, & Sasha (2001). Assessment of Model-data Fit. Retrieved May 10, 2002, from University of Illinois IRT Laboratory Web site:http:

//work.psych.uiuc.edu/irt/

Weiss, D. J., & Yoes, M. E. (1991). Item Response Theory. In R. K. Hambleton & J. N.

Zaal (Eds), Advances in educational and psychological testing:theory and applications.

Boston:Kluwer Academic Publishers.

- 115 -

附錄一 數學試題

- 116 -

- 117 -

參考答案

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 D C D B A C A C A C C B A C D D B B D B D A B A B

- 118 -

- 119 -

- 120 -

- 121 -

試題檢核表(續前表)

選 擇 題 命 題 原 則 是 否

選 項 要 素

3-1 選項是否使用有效的垂直排列格式?

3-2 選項內容是否按邏輯順序排序排列?

3-3 選項之表達方式是否維持一致?

3-4 是否所有的選項皆具有誘答力?

3-5 選項中是否只含一個最佳或正確答對?

3-6 選項是否採正面陳述,避免負面陳述?

3-7 在各選項中重複出現之文字是否置於題幹內?

3-8 選項個數是否為一般所認為自然合理的四個?

3-9 是否已避「以上皆是」、 「以上皆非」的選項?

3-10 各選項的長度是否維持一致?

3-11 選項問的內容是否互相獨立,沒有重疊?

3-12 是否以受試者的典型錯誤作為選項?

3-13 是否避免使用幽默選項?

3-14 避免提供正確選項的線索。

3-15 選項是否避免出現總是、從不、完全與絕對等限定指示詞?

3-16 選項中的部分用語是否與題幹的部分用字一致或類似?

3-17 選項問的文法或寫法是否一致?

3-18 是否避免出現特別引人注目的選項?

3-19 是否避免出現成對或成組的錯誤選項?

3-20 是否避免明顯荒謬的錯誤選項?

- 122 -

- 123 -

- 124 -

- 125 -

相關文件