美国中小学课程评价：经验、实践与借鉴

时间：2026-01-24 理论教育 Jonker 版权反馈

【摘要】：从某种程度上讲，中小学课程评价领域的改革也一直是伴随着以美国为首的发达国家近百年的基础教育测量与评价运动的。因此，西方国家改革中小学课程评价的测试方式，在于选用动态评价与选择性评价的模式来评价学生。动态评价和选择性评价的实践，发挥了多样化的课程评价功能。以美国为首的发达国家都在着手建立健全国家课程评价制度以用于帮助教育决策，利用课程评价获得的信息来促进教育改革，提高基础教育质量。

西方发达国家的教育经费充足，国家的整个教育系统较为发达，运行较为稳定，不存在办学条件简陋、师资不足等影响教学的问题。这些国家这些年来也一直在进行中小学课程评价改革，并取得了一定的成效，总体上讲，当前这些发达国家在中小学课程评价方面的问题主要集中在如何测量与评价学生的学科成绩，以及如何解决评价功能过于狭窄、评价观念还较为陈旧等方面。同时，这些国家在中小学课程评价中同样存在一个突出的且一直存在争议的问题，就是如何处理课程评价的科学化、客观化、标准化。从某种程度上讲，中小学课程评价领域的改革也一直是伴随着以美国为首的发达国家近百年的基础教育测量与评价运动的。西方发达国家经过多年的课程评价改革，已经取得了一些较好的经验，从实际操作的角度进行归纳，以下两个方面特征较为明显。

（一）改革课程评价的测试方式，拓展评价功能

中小学课程评价在质的方面存在的两个突出问题：一是评价观念陈旧；二是传统的纸笔测验（即静态测量模式）无法评价过程。因此，西方国家改革中小学课程评价的测试方式，在于选用动态评价与选择性评价的模式来评价学生。动态评价和选择性评价都强调在真实情景中通过让学生完成操作任务来进行一系列测试，从而评价学生的学习过程，评价他们的认知加工过程、认知策略与技巧等，最终得出有个体差异的评价^[19]。动态评价和选择性评价所使用的方法多种多样，包括测验、档案袋、日常记录、学习笔记、课外活动等，对学生的评量也是从多个方面、针对多种能力综合进行，可以被应用于从教室评估到全国乃至全世界评估的所有类型的评估背景中，并且与教学指导直接联系，是一种更加全面的多元化评价方法。动态评价和选择性评价方法的提出，既指明了学生评价改革的方向是对学生真实生活和学习生活中的实际操作进行评价，同时也为教学改革指明了方向，学校、教师要为学生提供一种真实的、更加接近生活的教学情景。从这个意义上讲，动态评价和选择性评价不仅仅是一种评价方法的改革，更是一种教育思想和教育理论基础的根本革新。

动态评价和选择性评价的实践，发挥了多样化的课程评价功能。除了帮助教育决策、直接改进教师教学活动、使公众和学生家长了解学生现状和需求外，通常还用以反馈到课程设置、课程修订和中小学教师培训过程中去。基于不同地区、学生性别的来源差异，在这种课程评价成绩分析报告中，通常会结合学生家庭经济、教育经历、所在学校和社区的背景因素等进行综合分析，以更客观、更真实地进行反馈，发挥评价应有的促进学生学科学习、促进学生未来发展的功能。因此，全国性课程评价的主要目的是用于诊断学生在课程学习的过程中所存在的认知不足，以便调整课程设计、教师教学与学生的自我期望的关系。近年来，各发达国家都日益重视中小学课程评价在学生发展中的作用。以美国为首的发达国家都在着手建立健全国家课程评价制度以用于帮助教育决策，利用课程评价获得的信息来促进教育改革，提高基础教育质量。

（二）提高课程评价的测试命题质量，深化结果反馈(https://www.xing528.com)

在美国著名的教育测量公司如ETS、ACT等组织的大规模测试中，一道测试题从设计到最终进入考试组卷，需要包括学科专家、教学一线教师、测量学专家、课程专家等在内的题目命题、评审专家团的审核，需要经历十几道程序的检测，历时多年才能完成。每一道测试题的质量评审包括认知领域、内容领域、题型设计、作答时间、公平性以及难度系数、区分度系数等测量学指标。

随着计算机技术的不断普及以及现代测量理论的迅猛发展，构建大型的教育测量和考试题库在西方国家也是潮流，采用计算机化自适应测验（Computerized Adaptive Testing，简称CAT）已逐渐成为国际上大型考试的首选。计算机化自适应测验利用现代测量理论，对每个进入考试题库的测试题进行项目质量分析，既可以保证纳入题库中的测验题能包含足够的测量信息，还可以确保不同的测验题在共同的测量尺度上能够测量出相同的心理特质，从而保证了从题库中依据信息函数选题的各种测验在测量属性上的同质性。任何一种大型考试，必须有足够的题量以供选用，而且所有的试题都须事先试测计算出各个题目的特征值，包括难度、区分度和猜测参数，题库应包含具有不同等级难度、区分度的、能够测量和区分不同层次水平被试的题目，要求题库的试题能够覆盖某一学科的全部知识领域，题库的项目构成要具备测验的三个效度：内容效度、结构效度、预测效度。题库要实行动态管理，注意被试数据与题库反应模型的拟合与偏离，定期淘汰过时、质量不高、有错误的试题，补充具有新意、编制合理的试题^[20]。

传统的纸笔测验和目前的计算机自适应测验对被试个体的测试总体来说还是非常粗糙的，未来发展趋势是把测量理论、计算机方法和认知心理、神经科学、生理学等结合在一起对考试进行分析和评价。计算机自适应测验由于可以及时反馈考试结果，因此随着技术的成熟，完全可以依据考试反馈信息，结合多学科理论对学生自身的能力水平和未来发展方向提供咨询和建议，这是教育评价的重点和难点，也是考试分析和评价的未来发展趋势，更是考试公平性的一大体现。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

美国中小学课程评价：经验、实践与借鉴

相关推荐

美国中小学课程评价：经验、实践与借鉴

相关文章：

相关推荐