首页 理论教育 良好教学测量的特征与要素:从《课堂教学技能(第3版)》学到的

良好教学测量的特征与要素:从《课堂教学技能(第3版)》学到的

时间:2023-08-01 理论教育 版权反馈
【摘要】:因为教学测验是教学测量的主要手段,教学测量有时则称教学测验。信度是良好测验的必要条件,但不是充分条件。测验的有效性是测验最基本的条件,是良好测验应当具备的最基本的特征。因此,难易性与鉴别性都是良好测验的重要特征。(二)良好教学测量的要素无论是物理特征的测量,还是精神特征的测量,都必须具有三大要素:参照点、单位和量表。

良好教学测量的特征与要素:从《课堂教学技能(第3版)》学到的

(一)良好教学测量的特征

要探讨教学测量的技能,首先必须明确什么样的测量是良好测量。一般而言,必须具备四大特征(信度、效度、区分度较高,难度适宜)且兼顾公平的测量才算良好测量。因为教学测验是教学测量的主要手段,教学测量有时则称教学测验。因此,在这里,我们可以说成是良好测验的特征。

1.可靠性(信度)

测验的可靠性是指测验能否稳定反映考生实际水平的程度。如果某生在连续两次或多次测验中所得结果相一致,或在某一班级的两次或多次测验的得分很接近、很稳定,其测验结果的相关度很高,这种测验可称为可靠性的测验,或称为信度高的测验。测验的可靠性是用信度来表示的。信度一般用两次测验同一对象的分数的相关系数表示。根据计算方法,可将信度分为再测信度、复本信度、内部一致性信度和评分者信度等。信度是良好测验的必要条件,但不是充分条件。一个测验只具有可靠性还不行,还必须具备有效性。

2.有效性(效度)

测验的有效性是指测验能确实地测量出所要测量的特性的程度。它是为特定的目的服务的。测验的有效性是测验最基本的条件,是良好测验应当具备的最基本的特征。测验如果有效性低,就无价值可言。例如,数学测验的目的是测量被试的数学成绩,如果考生在数学测验中得了低分,是由于试题的文字表述过于深难而妨碍了考生正确理解题意造成的,这个测验并没有测量到考生的数学水平,而是测量了学生的阅读能力,这表明该测验的有效性是不高的,没有达到测验的目的。测验的有效性是用效度来表示的。效度总是与测验目标密切相关的。因此,根据测验目的可以把效度分为内容效度、构想效度和效标关联效度。内容效度是指测验内容或题目代表所测对象范围的程度,它通常用于衡量学科成绩测验;构想效度是指测量分数能够描述个人所具有的心理品质和能力的程度,它主要适用于心理测验;效标关联效度是指测验分数与外在参照标准(亦称效标)的相关程度,它可以分为同时效度和预测效度,前者适用于以评定现状为目的的测验,后者适用于预测测验。

3.难易性(难度)

测验的难易性是指试题的难易程度,亦称难度。一个测验包含多个项目,不同项目之间的难度是不一样的,有的项目的难度高,有的项目的难度低。比如,在学业成就测验中,侧重于考察识记目标的项目的难度就比较低,而考察综合目标的项目的难度就相对要高。在教育测验中,不同类型的测验的难度要求是不一样的,比如,常模参照测验与目标参照测验两种测验,它们的难度分布就不相同。常模参照测验的目的是尽可能地把握被试的个别差异,一般来说,它的难度应接近中等水平,总的难度值趋近于0.50,难度分布在0.50±0.20之间。目标参照测验的目的在于考察被试水平是否达到特定要求(比如,单元测验等),它的难度就要依据特有的标准来确定难度也是良好测量的一个重要特征,测验项目的难度直接影响着测验的信度、效度与区分度。

在教育测量中,一般是以能够正确回答试题的人数与参加测验的总人数之比,作为难度指标。难度是测验中项目分析的重要内容,测验项目的难度对测验的信度和效度都产生直接影响。测验难度对测验在多方面的质量产生深刻影响。

4.鉴别性(区分度)

测验的鉴别性是指测验对不同水平的考生能鉴别其水平高低的程度。测验的鉴别性可以用测验中项目的区分度来表示。项目得分的高低与被试水平的高低是一致的,高水平的被试在该项目上的得分应是较高的;反之亦然。如果某项目不能反映出被试水平的差异,高水平的被试和低水平的被试在该项目所得分数并无差别,则说明该项目的区分度就比较低。如果某项目不仅不能反映出被试水平的差异,反而提供了一些相反的信息,即高水平的被试在该项目上所得分数较低,而低水平的被试在该项目上所得分数较高,则说明该项目完全没有区分度,且具有干扰破坏性。

要注意的是,项目的区分度与难度有关。测验项目要有区分度,则难度必须要适中,过难或过易区分度都较低。同样,区分度又影响测验的效度,它是保证测验具有较高效度的重要条件。如果一个测验使优生和差生得到同样或相近的分数,便说明测验无区分度或区分度较低,那么,这个测验的效度也较低。因此,难易性与鉴别性都是良好测验的重要特征。

5.公平

公平是衡量测验与评价质量的重要标准。它要求测验不能让学生因性别、种族、社会经济地位、宗教信仰或其他人口学特征而受到冒犯或不公平对待。特别是随着教育由规模效益向内涵发展逐渐过渡的当下,教育实践中的公平问题成为评判良好测验的重要特征。美国的《教育与心理测试标准》就要求,除了被认为是内容范畴的正当需要外,测验研制人员应努力鉴别并消除一般被人种、族裔、性别或其他亚群体认为具有冒犯性的语言、标记、短语或其他内容。[1]美国教育考试服务中心(ETS)于2002年颁布的《质量和公平性标准》(ETSStandards for Quality and Fairness)也十分重视评价的公平,要求对测验和题目进行正规的公平性审查。

(二)良好教学测量的要素

无论是物理特征的测量,还是精神特征的测量,都必须具有三大要素:参照点、单位和量表。

1.参照点

参照点是计算事物数量的起点,又称零点。零点有两种:一种是绝对零点,如各种度量衡器上的零点;另一种是相对零点,是人定的零点,如温度的测量以冰点作为零点。在教育测量中,所使用的参照点几乎都采用人定的相对零点。人定的零点的最大限制是不能以倍数的方式解释分数。例如,有两件物品,一件重50kg,另一件重100kg,可以说,重100kg的物品是重50kg物品的2倍。而在教育测量中,甲学生的智商是100,乙学生的智商是50,我们不能说甲学生的智力是乙学生智力的2倍,因为没有真正的零智力的学生。同样甲学生的学科成绩是100分,乙学生的学科成绩是50分,我们不能说甲学生的成绩是乙学生成绩的2倍。这是我们在解释教学测量分数时,必须注意的问题。(www.xing528.com)

2.单位

物理测量的单位比较明显,如长度以米、厘米等为单位,质量以千克等为单位,时间以秒等为单位。缺少单位,数量的多少就无法表示,数量分析也就无从进行。好的测量就必须具有好的单位。一个好的测量单位必须具备两个条件:一是有明确的意义,即同一单位在人们的心目中有同样的意义;二是有相等的价值,即单位与单位之间距离要相等。物理测量所使用的单位容易符合这两个条件,而教学测量使用的单位严格地讲不符合这两个条件。如以百分制为单位测量学生学习成绩,50分与51分之间价值差异不等同于99分与100分之间的价值差异。当然,教学测量必须具有单位,我们应当尽量改进教学测量的单位,使之科学化。

3.量表

量表是参照点和单位的连续载体。它是测量的工具,是表示数量的方法。如天平是权衡质量的量表,尺子是度量长短的量表,而教学测量则是以文字试题、图形、符号、操作等方式来测量学生的学业成就方面的发展水平。

在教学测量中所使用的量表有四种类型,即称名量表、顺序量表、等距量表和比率量表。

(1)称名量表

称名量表是一种最低水平的量表,这种量表与事物的分类相联系。它是用一定的数字对事物的类别加以标识。例如,用“1”和“0”分别表示男女学生在标识上的区别。用“1”和“0”分别表示电位器上的高电位与低电位等。这种数字只起到某种名称符号的标识作用,它只是对事物的属性进行归类以示区别,并没有高低序列的意思,更没有可加性,不能参与任何运算。

运用称名量表,可以对各类别的频数进行累计,如计算参加测验的学生中男生、女生的数量。对称名量表可运用的统计方法都属于对频数的统计处理。如百分比、x2检验等。

(2)顺序量表

顺序量表是表示事物相对关系(如顺序关系)的数值特征的量表。如学生学业成绩的名次,可分为第一名、第二名、第三名等等。又如学生思想品德的等级,可用优、良、中、及格和不及格五个等级表示。

顺序量表优于称名量表,因为它既能对事物进行分类,又能标志各类别之间的顺序关系。但顺序量表也存在缺点,因为它不能说明每一等级之差是否有相等的距离,没有表明测量单位的大小。因此,顺序量表不具有等距性,不能进行加减乘除的运算。但这种量表在教学测量中应用较广,如百分量表即属此种量表。

教学测量应用顺序量表进行统计处理的方法主要有,中位数、百分位数、等级相关系数等。

(3)等距量表

等距量表最显著的特点是等距性,它对事物所做的数量划分是等距离的、是确定的。所以,它是比称名量表和顺序量表较高一级的量表。如物理测量中的温度,用摄氏量表的刻度将冰水混合物的温度定为0度,1.01×105kPa下沸水的温度定为100度,其间作100等分,这样以摄氏度为单位可以比较温度之间的差异了,而且这种量表上所表示的数值可以进行加减运算,如可以求平均温度。由于等距量表没有绝对零点,它的零点是人定的。因此,用等距量表表示的数值虽可以作加减运算,但不能用倍数关系表示,不能进行乘除运算。等距量表虽有一些缺点,但在教学测量中却有实用意义。因为教学测量的结果都可以转化为等距量表进行比较,可以将原始测验分数转化为标准分数,进而可以将各种测验得到的不同单位的分数转换到同一等距量表上进行分析比较。等距量表在统计分析和处理时,应用比较广泛,许多统计方法都可运用。如计算平均数、差异量、相关系数等统计量,还可以运用Z检验、t检验、F检验等进行统计推断。

(4)比率量表

比率量表是测量中最高水平的量表。它既有绝对零点,又有相等的单位。因此,可以进行加减乘除运算。比率量表在物理测量中被广泛运用,但在教育测量中运用较少。因为它的条件极强,教学测量中的各种分数不易满足这一条件。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈