首页 理论教育 如何编制好的多项选择测验

如何编制好的多项选择测验

时间:2023-08-05 理论教育 版权反馈
【摘要】:诊断性测验则可看成是现行教与学过程的一部分。为了诊断目的而编制“好”的多项选择测验,必须有一个准则。总分没有实在的重要性或意义,在诊断性测验中猜测是不必要的,因为学生的猜测并不提供诊断和治疗所必需的具体信息。然而,某些诊断特征却需要根据这些测验得出。为了有效地将适应性测验用于诊断目的,必须增加用于作出诊断性决策的试题数。

如何编制好的多项选择测验

如果将诊断性测验定义为向教师和学生提供关于他们优缺点的反馈,则几乎所有测验均为诊断性测验。实际上,任何标准化测验的得分都能表示学生成绩,同时也能告诉教师他的教学是否成功。虽然各个试题的测验可以告诉我们哪些答案对,哪些答案错,但是总分并不能提供有关特定困难所在及形成原因的任何真实信息。然而,现在的问题是:大多数测验的目的并不是为了诊断,对于每一个教学目标,它们所用的试题太少,对错误答案的分析不能得出对学习问题的诊断。诊断性测验则可看成是现行教与学过程的一部分。为了使测验能用于诊断,应该作出专门的设计。为了诊断目的而编制“好”的多项选择测验,必须有一个准则。和其他任何测验一样,需要有明确的学习目标,但每种测验都应涉及十分具体的技能(如加、减等等),要从不同的角度来设计测验某个特定技能的试题。每个试题都能为学生和教师提供信息,因为每个诱答项对指出学习困难和提出可能的治疗方案都有重要作用。这里要强调的是每个特定答案的意义和反应模态。总分没有实在的重要性或意义,在诊断性测验中猜测是不必要的,因为学生的猜测并不提供诊断和治疗所必需的具体信息。

关于能否将诱答项作为诊断信息源的问题存在着不同的意见,主要有以下三种观点。一种观点认为,选择某个诱答项对指出学习困难有其特别作用(伯克和赫尔曼Baker and Hernan,待发表);而龙岗(Tatsuoka)则认为应从无限制问题(Openended questions)着手,分析各种回答,从而找出学生回答问题所遵循的规则;最后一种观点是,在适应性测验或顺序测验中要考虑的唯一信息是答案正确与否,认为分析学生的答案没有任何意义,从而对学生所给的答案不做任何分析。

在适应性或顺序测验中,后一个测验试题根据学生对前一个试题的回答情况而定。通常的情况是,如答对了就再给一个更难的试题,反之就给一个更易的试题。试题的确定并不取决于学生选了什么诱答项,而是根据答案的正确与否。这种类型的测验,通常由计算机执行,计算机记录下答案并确定一个试题。在这种测验中,内存试题的单维性要经过预先检验,而试题的确定则以难度为基础。最后,根据反应模式就可以估计出学习上的困难。顺序测验或适应性测验存在着一个问题,即它只根据对某个单一试题的回答来作决策。然而,某些诊断特征却需要根据这些测验得出。这种测验的主要优点是能提高测量的精确度,因为每个人都接受一组与他的成绩水平相适应的不同试题。为了有效地将适应性测验用于诊断目的,必须增加用于作出诊断性决策的试题数。因为适应性测验具有易于适应学生成绩水平的灵活性,所以进一步发展它在诊断性评定中的应用是有潜力的。文献中最后一个研究展望就是试图解释为什么会产生错误,其方法是识别“错误概念”,或产生这些错误概念的“故障”。第一件工作是将问题分解为一些必要的子技能,以便为研究中的每一种技能构造一个“程序网络”(procedual network)。事实上,为了回答完成一个作业会有哪些正确的与不正确的方法,将技能分解成子技能是很必要的,诊断模型“必须包含所有可能被学生错误理解的知识,否则某些学生的错误概念就会超出系统的诊断能力之外”(布朗和伯顿Brown and Burton,1978)。第二件工作就是编制一组试题,以便有机会向学生显示所有需要鉴别的子技能。然后检查学生的答案,找出学生尚未回答的子技能。根据学生的“错误概念”,再提出第二组问题,并验证原来的估计。测验所获信息应该给出可能治疗方案。这种方法已经得到实际施行,它使用一个“故障系统”(Buggy system),(布朗和伯顿,1978),即一种计算机对弈系统(多用于教师的培训)。计算机扮演学生的角色,教师必须识别学生所犯错误(或故障)的原因,并能复述这种错误。这样,教师就更易于找出学生学习困难的原因。很明显,根据这种模型,可以轻而易举地诊断单一的“故障”。但是,如果学生有“多种故障”,或者有不同的“故障”相互影响时,诊断就成问题了。此外,如某些子技能可能的错误概念已从“程序网络”中删去,则有些反应模式可能被解释为随机错误。(www.xing528.com)

进一步的研究前景是开发一种模型来解决几百个“故障”——这种情况在所研究的技能变得更复杂时可能产生。当可能出现几百个“故障”时,概率模型看来更适合于检测异常的反应模式。布朗和伯顿的模型表明,学生即使运用了“错误规则”,他也可能给出正确的答案。龙岗通过引入个体一致性指数(Individual Consistency Index),简写为ICD来改进这个模型。总分低而个体一致性指数高,就表示学生正在用错误规则来解答问题。这个指数可作为一种信号,用以指出哪些学生需要治疗和更精细的诊断,他们还用试题反应理论来说明这种情况,所得的数据是多维的。换句话说,这种测验是在不同的维向上进行测量以便检查学生是否掌握了技能。这项研究成果不但对诊断性测验,而且对一般测验都具有意义,它指明了检验构念效度(construct validity)的重要性。

不是所有“故障”都会以同样方式影响学习过程,但是有关“故障”或错误概念的类型还是应该研究的。此外,为治疗这些诊断出来的学习问题所采取的教学方案并非都是可行的。在作出结论前,应简要地分析一下“掌握学习”的测验技术,以便把它们作为诊断手段使用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈