首页 理论教育 标准参照测验:理解其目的和制定方法以提升学生学习效果

标准参照测验:理解其目的和制定方法以提升学生学习效果

时间:2023-07-22 理论教育 版权反馈
【摘要】:在讲述测验法之前,有必要初步了解因为目的不同而常用的两种测验模式。(二)标准参照测验标准参照测验又称“目标参照测验”。这一测验的目的在于判断学生已经达到哪一级水平。教师自编测验,如果依照“标准参照测验”的原则和方法,将有助于学生明确学习目的,及时做出反馈调整。一个标准化测验的首要条件是具备较高的信度和效度。

标准参照测验:理解其目的和制定方法以提升学生学习效果

在讲述测验法之前,有必要初步了解因为目的不同而常用的两种测验模式。

(一)常模参照测验(norm-referenced test)

这是用常模作为解释个人测验分数的参照标准的一种测验。这种测验以区分个别差异为目的,要求将学生的差别在量表(主要是百分量表)上反映出来。编制者有一个基本的假设:学生的学习成绩是常态分布,大多数人处于中间,少数人处于两极。于是,测验编制者选择大量的中等难度的题目,加上一些较难和较易的题目组成整个测验。这种测验竞争性强,地区性的语文中考具有选拔功能,使用的多是这种测验。

(二)标准参照测验(standardized test)

标准参照测验又称“目标参照测验”。参照预先规定的学习目标,将其分解为许多相互联系的小单位,并用行为术语来陈述教学目标,按此编制出一系列与教学目标中各层次相应的测验题。这一测验的目的在于判断学生已经达到哪一级水平。测验的主要特点有两点:①以达到教学目标的某一水平为通过,未达到的就不通过;②以学生对各项教学目标已经完成的数量或分数来判断成绩的好坏(或通过的程度)。

学校的年段考试、毕业考试,大都使用这种测验。教师自编测验,如果依照“标准参照测验”的原则和方法,将有助于学生明确学习目的,及时做出反馈调整。在现代教学中,这种测验能与教学紧密结合,单元教学之前、其间和结束,都可以用该测验考核成绩、诊断问题、改进教学。运用得好,这种测验可能减少学校里的“恶性竞争”,增强学习有困难学生的自信心[2]

作为最常用的简便的评价方法,测验法主要为标准化测验。

标准化测验是指由专家或学者们所编制的,适用于大规模范围内评定个体心理特征或水平的测验。这种测验的命题、实测、评分和解释都有一定的标准或规定。由于测验条件的标准化,测验的结果比较客观一致,适用的范围和时限也较宽广。一个标准化测验的首要条件是具备较高的信度和效度。通过使测验和评分过程标准化,并根据标准来对照和解释测验结果,就可以有效地改进测验的信度和效度。

在发展标准化测验时,一般应遵循下列步骤:①仔细分析有关的教学计划、教材、课程学习和测验。参考这一领域内其他专家的意见,用细目表制订出测验的目标;②根据目标,发展和修改测验项目,并改善测验的信度与效度;③把已完成的测验在更大的人群样本中进行实测。这个人群样本,与测验所针对的总体在所有重要的方面都应保持相似;④确定测验的常模,即从特定的年龄或年级水平的标准化样本中获得的代表性分数。

使用标准化测验来测评学生的学习,既有优点也有不足之处。首先,标准化测验最大的优势在于它的客观性。尽管教师自己在编制和解释测验时,总是尽力提高测验的客观性,但效果仍不明显。因此,人们几乎一致认为,在大多数情境下,标准化测验是一种比教师编制出的测验更加客观的测量工具,这是因为教师对学生的情况了如指掌,对在过去考试很成功的学生或认为学习成绩较好的学生存在着积极预期,相信他们在将来的考试中也会名列前茅。反之,对那些以前考试成绩一贯不佳的学生,教师的预期值也较低,认为他们今后的考试成绩也会很差。标准化测验是由测验专家编制的,他们与接受测验的学生没有个人情感上的联系,因此可以避免此类问题。测验专家在测验的内容取样和题目编制时,也比教师更系统,更合理。总之,标准化测验的编制能比较全面地考虑造成测验误差的各项因素,并最大限度地减少这些因素的影响,从而将各方面的误差控制在尽可能小的范围内,使测验可靠准确。此外,专家在编制标准化测验时,已经考虑到所需的时间和经费,因此标准化测验比大部分的课堂测验更有计划性。

标准化测验由于具有统一的参照标准,使得不同考试的分数具有可比性。标准化测验有助于将单个学生的分数与标准化样本比较,以便了解学生在某一特定的学科领域里的优势和不足。还可以用于比较一个班级的学生与标准化样本的状况。不仅是标准化成就测验,其他测量特征的标准化测验也可以用于对比。例如,兴趣检查量表,测查了学生对日常生活中各种有关活动的兴趣。这个测验的高分和低分反映了兴趣的模式,而几乎与能力无关。它不能说明个体在具体某项活动中作业的好坏,至多能说明个体对这项活动的兴趣与普通人们相比更高些或更低。这些测验的最终分数都必须把初始分值同标准化样本相比,转换成量表分。

然而,标准化测验在很多方面都不尽如人意,它的缺陷也是不可避免的。标准化测验在一定范围内使用还是比较有效的,但是一旦忽略某些条件就会出现纰漏。

第一,标准化成就测验并不能必然提高或促进学生的学习。批评者指出,标准化成就测验很少为实际的教学活动提供支持。它们不能改善学习过程,诊断学习问题,为学生提供及时反馈。标准化测验只是粗线条地刻画学生的成就。它们只局限在由测验专家事先确定好的范围内提供关于成就的一般性信息。它们不能仔细地描述关于学生的技能、能力和学习方式的全貌。所以,我们建议标准化测验的结果,只是教师在对学生或课程进行学业决策时所依据的小部分评估信息。好的课堂评定,在开始阶段应当是教师对学生平时获得的学习结果亲自进行观察和测量。标准化测验不能取代教师为中心的评定,但可以作为补充性、辅助性资料,以供教师清楚地了解学生成就的概况。

第二,标准化测验要求接受测验的人在所有的重要方面,必须接近标准化样本。如果受测者与常模人群不可比,测验结果就没有意义。

由于标准化测验是通过标准化样本制定的常模,所以标准化成就和能力测验对个体学生的成就有较差的预测性,虽然标准化测验能较好地预测团体成就,如果教师具备一定的技能,就可以直接在课堂中实施测评。这些技能包括:能对测验的信度、效度及测验是否适合等问题做出判断;能识别测验和测验分数的不恰当的说明或解释;明白不同的测验在施测、计分和解释上需要不同的能力;防止所做的测验超出自己的能力所限;能在与测验标准化相当的条件下实施测评;在测验结果的解释上接受过一定的训练。

(三)初中语文测验的一般过程

一次规范的初中语文测验过程,一般包括决定测验目的、编制双向细目表、编拟试题、抽样试测及分析、组合成卷并制定评分标准、施测及评分、分析测验结果等步骤。

1.明确测验目的

教师在进行测验前一定要明确此次测验的目的,不能盲目、无计划地对学生测验,加重学生的心理压力和负担。

2.编制双向细目表

编制双向细目表就是规划测验范围和内容比重,是根据各种语文知识、能力和态度的重要程度分配题目和分数。双向细目表是包括测验内容和测验目标的双向表格。

(1)按课程标准的阶段目标要求进行纵向设计

根据初中语文新课程标准,初中语文测验内容可分为识字与写字、阅读、习作、口语交际、综合性学习等几个方面。具体的测验内容可根据课程标准的阶段目标和教材来确定,一般会把经过一定训练的内容作为测验的重点。测验的几个方面确定后,还要给每个方面定出所应占的分数比例。

(2)按照三维目标水平进行横向设计

初中语文新课程标准提出知识与能力、过程与方法、情感态度与价值观三维目标。在学力水平测验中,通常只能测查出学生的认知水平。根据布卢姆的认知领域学习水平分类学说,学生的学习能力水平可分为识记、理解、应用、分析、综合、评价六个层次。

“识记”指记忆所学的语文知识、规则和概念的能力。例如,汉字的书写规范,看拼音写汉字,默写生字词,背诵课文等。

“理解”指把握材料意义的能力,要求被试能用自己的话来复述某一事实,或者解释某一现象。例如,解释字词,理解句子的含义,复述故事等。(www.xing528.com)

“应用”指将学习过的知识用到新的和具体的情景中的一种能力。例如造句,变换句式,选词填空等。

“分析”指将材料分解成部分以了解每部分的含义,找出部分的本质属性和彼此间的关系的能力。例如分析文章的段落层次,概括段落的意思等。

“综合”指把各个不同部分组合成一个新的整体,整体把握材料的能力。例如概括文章的中心思想,作文等。

“评价”是指根据一定要求对材料的价值进行判断的能力。它包括评价材料的前后一致性,评价论点是否合理、证据是否充分等。

3.编拟试题

编拟试题要注意相关技术问题(如试题的信度、效度和区分度等等),否则会影响评价的有效性,阻碍学生发挥真实的水平。初中语文试题编拟过程中常见的问题,首先是无法回答的试题和僵死答案的试题。

此外,编拟试题过程中常见的问题还有模棱两可的陈述,指导语不清楚,句式结构过于复杂,提供的材料含糊不清,题目未提供回答的线索,等等,教师在编拟试题过程中要尽量避免这些问题的出现。

4.抽样试测及分析

测试题编制好以后,为了保证试卷的信度、效度和适当的难度、区分度,需要进行测试。通过测试能发现试题中存在的问题,能为制定详细的评分标准提供评价样本。重要考试的“试测”一般是把试卷分成几个部分,到不同的地区或语言相同的国家进行。试测完以后,再对试测结果进行统计分析,摈弃或修改不合格的题目。教师自己组织的小型考试,这步可以省略,但教师必须反复考查试题,确保试题的质量。

5.组合成卷并制定评分标准

即把合格的试题按照测验的目的和双向细目表的要求,以适当地编排组合成完整的试卷,并根据试测时学生提供的答题样本,制定相应的评分标准。

6.施测及评分

即安排考试场地、组织监考教师,使所有学生在相同的良好条件下进行测试。正规测试的评分,要求评分者事先必须接受培训,明确评分要求和评分标准。评分时,一个评分者只负责一题或少数几题的评分工作。为了保证评分准确无误,现在一般采用一份试卷由多人多次评分的办法,且用计算机监控。教师自己组织的小型考试不可能有这么严格的要求和程序,但教师在评分的时候必须公正,注意学生答案中与参考答案相似、相近的回答和那些事先没考虑到,但又合理的回答。

7.分析测验结果

就学生的测验情况,按测验目的,对学生的发展水平和教学效果进行分析。

(四)测验法的局限及超越

1.测验法的局限

目前,各种各样的测验已深深地浸透到学校教育中,达到了离开测验,教育将不复存在的地步。但是,与此同时对于测验的怀疑与批评之声也日渐强烈。批评者深刻地指出,由于现在学校中频繁地进行测验,正在将学生培养成不愿对问题进行深入思考的、只凭借感觉就反射式地做出判断的擅长于选A、B、C、D的人物。这些批评主要指向那些只求死记硬背或者故弄玄虚根本无法回答的测试题,这些题目使有智慧、有创造力和想象力的人处于不利的地位。对测验的另一种批评是测验仅仅能测到个体的有限方面。它能测定出学生对个别知识的记忆和理解,但较难把握到推理、想象、创造等高级认知活动,学生的动机、诚实等情感态度也很难通过测验检测。

但是,想把“测验”完全彻底地从学校教育中清除是根本办不到的,面对怀疑与批评,人们进行了多种尝试,例如采用开放式问题测验、情景测验等,试图超越测验的局限性。

2.开放式问题测验

在语文课程标准中,对学生解决问题的要求不仅是让学生获得具体的结论,更重要的是在学生解决问题的过程中体会到由于对问题认识角度的不同而产生不同的解题策略,每个人都应有自己对问题的判断和理解,从而形成有自己个人特色的解决问题的方法和策略。

按照命题者对问题的要求可将问题分为两类:一类是已知和结论都有确定要求的题型,也就是封闭式问题;另一类是回答问题的起点(已知)、步骤(过程)和终点(结论)三者中至少有一个没有确定要求的问题,也就是开放式问题,按照对上述三者要求的确定性程度,又可将开放式问题分为半开放式问题和全开放式问题等。

开放式问题的本质是“对问题指向只有原则性要求”,题目本身的条件和结论在一定的范围内是不能唯一确定的,具有可选择的多样性。正是由于它的这种不确定性和可选择的多样性,导致一个开放式问题在确定某些因素后,就可以转化为多个有确定问题指向的封闭型问题。这样,同一个开放式问题放到不同的学生手中,由于学生认知水平、能力素养、思维方式等的不同也就不尽相同了,学生回答的结果就会因人而异。也正是由于开放式问题的这种“不确定性”和“结果多样性”,给语文测验带来了一股新鲜气息,增加了语文测验的趣味性,也更能反映解题者的思维水准、能力水平和语文素养,增强学生对问题的认识和理解,能更好地培养学生的创新能力。

开放式问题测验关注学生对问题的个性化回答,通过开放式问题测验,不仅能够了解学生的表达能力、思维能力、想象力等综合的高级智能,而且可以测定出学生知识积累和驾驭语言等基础能力。但是,如果对这种方法运用不当,就很容易产生不同的评价者对同一回答做出完全不同评价的结果。

事实上,在用开放式问题进行测验的时候,评价标准很难在评价者之间保持一致。特别是在学生对所要评价的宗旨理解得五花八门并按照各自的方式完成回答时,是很难做出公正的评价的。为了克服开放式问题评价过程中的这种欠缺,首先要明确测定内容的评价标准,确定与这个目标相应的设问方式和评价方法之后,再对学生进行测验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈