• 沒有找到結果。


王秀琲 (民 92)。實作評量在國小數學科之應用-以五年級學童分數為例。國立 臺中師範學院教育測驗統計研究所碩士論文。

方泰山(民 91)。第四次 TIMSS 2003 NRC 自由反應評分系統研討會會議報告。


石千奇(民 93)。國小六學童在數學實作評量中的小組解題歷程分析。國立中山 大學教育研究所碩士論文。

江文慈(民 87)。一個新評量理念的探討:多元智力取向的評量,教育資料與研 究,20 期,6-12。

曲慧娟 (民 94)。實作評量在國中學術性向優異班招生鑑定之效度研究~以臺灣 北區為例。國立臺灣師範大學特殊教育研究所碩士論文。

李坤崇(民 88)。多元化教學評量。台北:心理。

余民寧(民 93)。教育測驗與評量-成就測驗與教學評量。第二版。台北:心理。

吳毓瑩(民 85)。評量的蛻變與突破-從哲學思潮與效度理論參考起。教育資料 與研究,13 期,2-15。

李虎雄、張敏雪(民 87)。由學力評量觀點談實作評量之特性。測驗與輔導,


吳明隆(民 87)。教室做為評量環境的內涵與其評量新趨勢。研習資訊,15 卷,

4 期,62-77。

吳清山、林天佑(民 85)。教育名詞 —分流教育。教育資料與研究,8,85。

李長柏(民 91)。國小數學簡單機率解題實作評量與後設認知之相關研究。國立 臺中師範學院教育測驗統計研究所碩士論文。

呂政隆(民 93)。國小學童在數學實作評量解題、整合認知與課程之相關研究。


呂金燮(民 88)。實作評量-理論。載於王文中、呂金燮、吳毓瑩、張郁雯、張淑 慧(合著)。教育測驗與評量:教室學習觀點(頁 173-207)。台北:五 南。

李茂能(民 85)。信度考驗的另一途徑:推論力理論。國民教育學報,2,27-48。

林清山(民 81)。心理與教育統計學。台北:東華。

林敬修(民 92)。影響國小數學科實作評量信度相關因素之類推性理論分析。國 立屏東師範學院教育心理與輔導學系研究所碩士論文。

洪之昀(民 89)。數學科實作評量對國小高年級學童學習策略影響之研究。國立 臺中師範學院教育測驗統計研究所碩士論文。

桂怡芬、吳毓瑩(民 87)。自然科實作評量的效度探討。測驗年刊,45(2),19-36。

桂怡芬(民 85)。自然科實作評量的效度探討。國立台北師範學院國民教育研究 所碩士論文。

桂怡芬(民 85)。紙筆與實作的互補:我的實作評量經驗。教育資料與研究,13 期,36-40。

徐美英(民 89)。TIMSS 數學實作評量在台灣之試用探討。國立臺中師範學院教 育測驗統計研究所碩士論文。

夏淑琴(民 88)。教學評量革新-多元評量。載於高強華主編(民 88)學校變遷與 學校革新。台北:師大。

教育部(民 92)。國民中小學九年一貫課程綱要數學學習領域。台北:教育部。

張紹勳,張紹評,林秀娟(民 92a)。SPSS For Windows 統計分析‧初等統計與高 等統計(上冊)(第四版)。台北:文魁資訊股份有限公司。

張紹勳,張紹評,林秀娟(民 92b)。SPSS For Windows 統計分析‧初等統計與高 等統計(下冊)(第四版)。台北:文魁資訊股份有限公司。

張敏雪(民 86)。實作評量的本質及國民中小學數理科教師對實作評量的態度探 討。國立臺灣師範大學數學研究所碩士論文。

張敏雪(民 87)。教室內的實作評量。教育資料與研究,20 期,24-27。

張敏雪(民 86)。實作評量的本質及國民中小學數理科教師對實作評量的態度探 討。國立師範大學數學研究所碩士論文。

張英傑等著(民 94)。數學科教師手冊。台南:南一書局。

張永杰 (民 92)。實作評量取向的幾何思考研究。國立臺灣大學國際企業學研究 所碩士論文。

張麗麗(民 91a)。從分數的意義談實作評量效度的建立。教育研究月刊,98,37-51。

張麗麗(民 91b)。評量改革的應許之地,虛幻或真實?-談實作評量之作業與表 現規準。教育研究月刊,93,76-86。

郭生玉(民 84)。心理與教育研究法。台北:精華。

陳英豪、吳裕益(民 85)。測驗與評量。高雄:復文。

陳文典、陳義勳、李虎雄、簡茂發(民 84)。由馬里蘭州的學習成就評量與其在 台灣的施測結果看-實作評量的功能與應用。科學教育月刊,185 期,


陳昭地(民 88)。「第三次國際數學與科學教育成就研究」後續調查。

http://report.ice.ntnu.tw/nscreport/.../TIMSS-R(1999)實測後 期中報告--交國科會.htm。

陳怡玉(民 94) 。降低國小數學科實作評量人和作業交互作用變異方法的探討---以類推性理論分析。國立臺南大學測驗統計研究所碩士論文。

莊明貞(民 84)。變通性評量的發展與實施。研習簡訊,261。

莊明貞(民 85)。實作評量理論與實際。教育資料與研究,9 期,44-48。

曾惠敏(民 87)。國小分數概念實作評量之發展及其相關研究。國立台南師範學 院國民教育研究所碩士論文。

游麗卿(民 87)。從實作表現診斷學生乘除法的錯誤概念觀念。測驗與輔導雙月 刊,149 期,3094-3099。

鄒慧英譯(民 92)。測驗與評量。(原作者 Robert L. linn and Norman E.


鄒慧英(民 86)。實作型評量的品管議題─兼談檔案評量的應用。載於八十七年度 教育測驗新近發展趨勢學術研討會。

詹志禹(民 85)。評量改革為什麼要進行-回應吳毓瑩<評量的蛻變與突破>。

教育資料與研究,13 期,45-47。

詹元智(民 91)。國小數學科實作評量之效度探討。國立屏東師範學院教育心理 與輔導研究所碩士論文。

蔡正濱(民 95)。國小數學科實作評量評分者ㄧ致性相關因素探討。國立屏東教 育大學教育心理與輔導學系研究所碩士論文。

鄭麗玉(民 88)。教學評量的改革。教師之友,40 卷,1 期,23-33。

歐滄和(民 91)。教育測驗與評量。台北:心理。

盧雪梅(民 87)。實作評量的應許、難題和挑戰。教育資料與研究,20 期,1-5。

簡茂發(民 80)。命題方法與試題分析。國教輔導,31(1),2-13。

蘇義翔(民 86)。實作評量的理論與啟示。測驗與輔導,3099-3102。


Airasian, P.W. (1991). Classroom assessment. New York : McGraw-Hill.

Airasian, P.W. (1994). Classroom assessment(2nd ed.).NewYork:


Baron, J. B. (1991). Strategies for the development of effective

performance exercise. Applied Measurement in Education, 4(4), 305-318.

Baxter, G. P., Shavelson, R. J., Goldman, S. R., & Pine, J.

(1992). Evaluation of a procedure-based scoring for hands-on science assessment. Journal of Educational Measurement, 29(1), 1-17.

Baxter, G. P., Shavelson, R. J., Herman, S. J., Brown, K. A. & Valadez, J. R.(1993). Mathematics performance as sessment: technical quality and diverse student impact. Journal for Research in Mathematics Education, 24(3), 1990-216.

Dunbar, S. B., Koretz, D.M., & Hoover, H.D.(1991). Quality control control in the development and use performance assessment.Applied Measurement in Educational, 4(4), 289-303.

Frechtling, J. A. (1991). Performance assessment: Moonstruck or the real thing? Educational Measurement: Issues and Practice, 10(4), 23-25.

Haertel, E.H. and Linn, R.L. (1996). “Comparability" in G.W. Philips (Ed.), Technical Issues in Large-Scale Performance Assessment.

Washington. D.C.: National Center for Education Statistics.

Harmon, M. & Kelly,T.A.(1996). Development and Design of the TIMSS performance Assessment. In Martin,M.O. and Kelly,

D.L.,(eds.),Third International Mathematics and Science Study (TIMSS) Technical Report, Volume I : Design andd Development.

Chestnut Hill , MA:Boston College.

Herman, J.L., Aschbacher, P.R., & Winters, L.(1990, November). Issues in developing alternative assessments. Paper presented at the annual meeting of the California Educational Research Association, Chicago.

Mullis, I.V.S., Martin, M.O., Gonzalez, E.J., Chrostowski, S.J.(2005).

TIMSS 2003 International Mathematics Report.

http://timss.bc.edu/timss2003i/mathD.html .p31-p47

Linn, R.L.(1993). Educational assessment: Expanded expectations and challenges. Educational Evaluation and Policy Analysis, 15(1), 1-16.

Linn, R.L., Bader, E.L., & Dunbar, S.B.(1991). Complex, Performemce-based, assessment:expectations and validation criteria. Educational Researcher, 20(8), 15,21.

Linn, R.L. (2000). Assessments and accountability. Educational Researcher, 29(2), 4-16.

Long, C. & Stansbury, K. (1994). Performance assessment for beginning teachers. Phi Delta Kappan,76,318-322.

Messick, S. (1994). The interplay of evidence and consequences in the validation of performance assessments, Educational Researcher, 23(2), 13-23.

Messick, S. (1995). Standards of validity and the validity of standards in performance assessment. Educational Measurement: Issues and Practice, 14(4), 5-8.

Martin, M.O.,Mullis, I.V.S.,Chrostowski, S.J.(2005)TIMSS 2003 Technical Report. http://timss.bc.edu/timss2003i/technicalD.html.

Martin, M.O.(2005). TIMSS 2003 User Guide for the International Database.


Miller, M. D. & Linn, R. L. (2000). Validity of performance-based

assessments. Applied Psychological Measurement, 24(4), 367-378.

Moss, P. (1994). Can there be validity without reliability? Educational Researcher, 23 (2), 5-12

Mullis, I.V.S., Martin, M.O., & Foy, P. (2005) . IEA's TIMSS 2003 International Report on Achievement in the Mathematics Cognitive Domains . http://timss.bc.edu/timss2003i/mcgdm.html,p15-p36 Roid, G. H. & Haladyna, T. M. (1982). A technology for test-item writing.

Orlando, FL: Academic Press.

Ruiz-Primo, M. A., Baxter, G. P., & Shavelson, R. J.(1993). On the stability of performance assessments. Journal of Educational Measurement. 30(1), 41-53.

Shavelson, R. J., Baxter, G. P. & Gao, X. (1993). Sampling variability of performance assessments. Journal of Educational Measurement, 30, 3,215-32.

Shavelson, R. J., & Webb, N. W. (1991). Generalizability theory: A primer.

Newbury Park, CA:Sage.

Shepard, L. A., Flexer, R. J., Hiebert, E. H., Marion, S. F., Mayfield, V. , & Weston, T.J. (1996). Effects of introducing classroom performance assessments on student learning. Educational Measurement: Issues and Practice, 15(3), 7-18.

Schmidt, W. H., Jorde, D., Cogan, L., Barrier, E., Gonzalo, I., Moser, U., Shimizu, K., Sawada, T., Valverde, G., Prawat, R., Mcknight, C., Raizen, S., Britton, E., Wiley, D., & Wolfe, R. (1996).

Characterizing pedagogical flow: An investigation of

mathematics and science teaching in six countries. Hinglham, MA:Kluwer.

Silver, E. A. (1993). On mathematical problem posing. In N. Nohda & F. L.

Lin (Eds.). Proceedings of the Seventeenth Annual Meeting of the International Group for the Psychology of Mathematics Education, Vol 1 (pp. 66-85), Tsukuba, Japan: Author.

Stiggins, R. J. (1994). Stundent-centered classroom assessment. New York:


Stiggins, R. J. (1987). Design and development of performance assessment.

Educational Measurement: Issues and Practice, 6(3),33-42.

Telese, J. A., & Kulm, G. (1995). Performance-based assessment of at-risk students in mathematics: The effects of context and setting.

Paper presented at Annual Meeting of the American Educational Research Association. (ERIC Document Reproduction Service No.

ED 382 685)

TIMSS (1997). Performance Assessment in IEA's Third International Mathematics And Science Study. Chestnut Hill , MA:Boston College.

Webb, G. (1992) On pretexts for higher education development activities,

Higher Education 24 (3) pp351-61

Wiggins, G.(1998). Educative assessment :Designing assessments to inform and improve student performance. San Francisco, California:

