首页 理论教育 语言测试的基本原则及特征分析

语言测试的基本原则及特征分析

时间:2023-07-07 理论教育 版权反馈
【摘要】:具体到语言测试,原则就更重要了,是决定测试方向性的问题。这些原则是非常重要的,涉及语言测试的一些本质属性。首先,不能把语言测试孤立起来。要弄清楚语言测试在教学及其他领域中的作用。这种广泛的应用使得语言测试成为一个矛盾体。有时,语言测试是履行行政权力的守门工具;有时又是社会用来提供平等机会或者学习权利的媒介。语言测试既是一项复杂的工作,又可以为新的更好的生活打开通道。

语言测试的基本原则及特征分析

评价实践应该在一定的原则下进行,我们要清楚这些原则。“评价素养指对评价原则与实践的理解及相关知识技能”(Taylor,2009)。具体到语言测试,原则就更重要了,是决定测试方向性的问题。把握原则,我们在操作过程中才能够避免方向性错误

Bachman和Palmer(1996:13)提出了语言测试的哲学(philosophy of language testing),以作为语言测试的原则:

(1)把语言测试与语言教学、语言运用联系起来。

(2)设计好测试,使之能促进受试者在测试中发挥出他们的最高水平。

(3)充分考虑测试的公平性。

(4)测试过程人性化:测试方式能够让受试者更多地直接参与测试过程;把受试者作为责任人;尽可能地向受试者提供有关整个测试过程的完整信息。

(5)负责任地使用测试,把持住自己和使用测试的其他人,对测试的使用方式负责。

(6)要认识到基于测试分数做出的决定是很复杂的,而对此没有万能的解决方法。

这些原则是非常重要的,涉及语言测试的一些本质属性。首先,不能把语言测试孤立起来。要弄清楚语言测试在教学及其他领域中的作用。

第二点是最重要的一点,在这个问题上,不少教师对测试的理解是有误的,他们认为考试就是要考学生,如果试题没有相当的难度,学生都答得很好,就不叫考试了。实际上,一个测试能够让受试者把其能力、水平充分展示出来,这就是效度高的体现,也是测试的本质性目的。

之前我们反复强调了测试公平的重要性,尤其是大规模、高利害的考试更需要公平,因此在设计测试、命制试题时必须充分考虑不同受试群体的特点,如性别差异、地域差异、民族差异、城乡差别等。

测试人性化的问题也很重要,这包括两个方面:一方面是把受试者作为责任人,让他们体会到自己的责任,这有利于他们更好地完成测试任务,即让受试者体会到他们在直接参与测试过程能增强他们的动机;另一方面是测试要为受试者着想,尽量创造有利于受试者发挥水平的条件,包括减少各方面的干扰,向受试者提供测试过程的完整信息等。比如试卷的每一页上都印上“本试卷共12页,这是第6页”,或6/12,能够让受试者清楚自己的答题进度,更好地把握时间。在试卷排版上也可以体现人性化,例如把完形填空题的文章和选项印在一页上就有利于受试者答题,如果是在两页上,受试者得不断翻页,就会影响其答题。

负责任地使用测试就是强调不能滥用测试。在什么情况下使用测试,采用什么方式进行测试和如何使用测试结果等都应该有严格的限制。

最后一点实际上是提醒我们,分数所反映的内容是有限的,不可唯分数论,但如何处理这个问题是一个大难题。

总之,这些原则的核心就是让受试者能够充分展示他们的语言能力,提高测试效度,实现测试的功能。

Mislevy et al.(2003:20)提出了一种重要的评价设计范式——以证据为中心的设计(Evidence-centred Design, ECD)。

该范式强调评价设计中的证据推理,设计基于三个前提:

(1)评价必须围绕所测试领域的重要知识进行,必须理解知识是怎样获得的,怎样运用的;

(2)从受试者在评价中所说的和所做的到推测他们所知道的、能做的和下一步应该做的这个推理环节,必须以证据推理的原则为基础;(www.xing528.com)

(3)目的必须是设计决定的驱动力,设计决定反映了限制、资源和运用条件。

这个设计范式强调的原理包括评价目的、内容和基于证据(受试者行为)的推理环节。

对于测试题,Osterlind(1990:3)给了这样的定义:

试题是测试心理特质的一个测量单位,它有刺激情境和规定性的应答形式,其目的是要获得被试的应答,并可以根据应答对被试的某些心理建构(如知识、能力、素质、特性)的表现进行推测。

雷新勇(2008)认为这是被普遍承认的一个定义。

这个定义从几个方面解释了测试的理论原理:

首先说明了测试是一个测量单位,测量就意味着需要量化,需要数据。然后是测什么,测试的是心理建构和心理属性,用在语言测试就是指受试掌握的语言知识和能力。接下来是怎么测,是根据受试的应答行为表现进行推测;行为表现是由试题这个刺激物引导出来的;评价则是按规定性的应答形式进行,不能任意进行。

好的评价数据具有四个特征:清晰的目标、适当的抽样、公认的推论来源和可用的结果。

关于测试内容的确定,Guion(1977:6-7)认为,一项测试在内容上可否接受取决于五个条件:

(1)内容范围必须能够反映某种行为,这种行为必须具有被普遍接受的意义;

(2)内容范围必须明确界定;

(3)内容范围必须与测量目标相关;

(4)合格的审题专家必须一致认为测试内容抽样充分;

(5)对作答内容必须进行可靠的观察和评价。

这涉及三个方面的特点:具有共识的测试范围、抽样的充分性和评分的可靠性

以英语水平测试为例,我们要测试考生的英语水平,可以设计一套试卷,让考生完成试卷上的试题。试题就应该是典型的有代表性的语言任务,考生答题就是考生的行为,作答的题就是行为结果,就是测试分数,我们根据分数的高低推测考生英语水平和能力的高低。

同所有的教育评价一样,语言测试是一种复杂的社会现象,用于执行课堂中、学校以及社会上的各种任务。现在语言测试被应用于多种环境,包括教育、招聘、语言规划、经济政策制定等。这种广泛的应用使得语言测试成为一个矛盾体。有时,语言测试是履行行政权力的守门工具;有时又是社会用来提供平等机会或者学习权利的媒介。我们怎样理解语言测试在一定程度上要根据自己的经验,也要考虑社会需求。语言测试既是一项复杂的工作,又可以为新的更好的生活打开通道。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈