亚星对大学的评估什么是有效期?

什么是有效期?

创建评估时要记住的基本概念是有效性。有效性是指测试是否可以衡量其目标。例如,有效的驾驶考试应该包括实际的驾驶成分,而不仅仅是驾驶规则的理论测试。例如,针对大学入学的有效语言测试应包括至少代表大学环境中实际发生的某些方面的任务,例如听讲座,进行演示,参加教程,撰写论文和阅读课文。

有效性具有不同的元素,我们现在将依次研究它们。

测试目的–我为什么要测试?

我们永远无法真正说出测试是有效还是无效。相反,我们可以说测试对于特定目的是有效的。为什么要测试学生有几个原因。您可能正在尝试在一个单元的结尾检查他们的学习,或者试图了解他们所知道的和不知道的。或者,您可能想使用测试将学习者根据他们的能力分组,或者向应试者提供语言能力证明。这些不同的测试原因都代表不同的测试目的。

测试的目的决定了要进行的测试的类型,而测试的类型又会影响您要选择的任务的种类,测试项目的数量,测试的时间等等。例如,证明医生可以在英语国家中实践的测试与旨在使这些医生参加语言课程的分班测试有所不同。

考生–我要考谁?

记住谁在接受考试也很重要。是小学儿童还是青少年或成年人?还是航空公司的飞行员,医生或工程师?这是一个重要的问题,因为考试必须适合其目标考生。例如,如果您的应试者是小学生,您可能希望给他们更多的互动性任务或游戏来测试他们的语言能力。例如,如果您正在测试听力技能,则可能希望扮演角色扮演医生的角色,但要针对大学生讲课或独白。

测试构造–我要测试什么?

另一个关键点是考虑要测试的内容。在设计测试之前,您需要确定测试旨在衡量的能力或技能,从技术角度来说,是“测试结构”。构造的一些例子是:智力,个性,焦虑,英语能力,发音。以语言评估为例,测试结构可以是交际语言能力或口语能力,甚至可能是与发音一样具体的结构。面临的挑战是定义构造,并找到方法进行引伸和测量。例如,如果我们正在测试流利性的构造,我们可能会考虑语音速率,停顿/犹豫的次数以及任何停顿/犹豫的程度对听众造成压力的功能。

测试任务–我如何测试?

定义了要测试的内容后,您需要确定如何进行测试。这里的重点是为您感兴趣的测试能力(即构造)选择正确的测试任务。所有任务类型都有其优点和局限性,因此使用一系列任务以最小化其各自的局限性并优化对您感兴趣的能力的衡量非常重要。测试中的任务就像是一个选项菜单,可供选择,并且您必须确保针对要测量的能力选择正确的任务或正确的任务范围。

测试可靠性-如何评分?

接下来,重要的是要考虑如何为考试打分。测试必须可靠并产生准确的分数。因此,您需要确保测验的分数反映出学习者的实际能力。在决定如何对考试进行评分时,您需要考虑对答案的评分是正确还是不正确(例如,多项选择任务可能就是这种情况),或者是否使用范围分数,例如在阅读或听力理解问题上给予部分称赞。在口语和写作中,您还必须决定要使用的标准(例如,语法,词汇,发音,论文,写作的组织方式等等)。您还需要确保参与口语或写作评估的老师接受了一些培训,

测试影响-我的测试将如何帮助学习者?

要问自己的最后一个问题(在许多方面是最重要的)是测试如何使学习者受益。良好的测试会使学习者处于类似于教室外可能面临的情况(即真实的任务),或者通过集中于所有四种技能(阅读,听,说,说)来提供有用的反馈或帮助他们的语言发展。例如,如果测试中有口语成分,这将鼓励在教室中进行口语练习。并且,如果该口语考试包括语言产生(例如,描述图片)和互动(例如,与另一个学生讨论话题),那么为考试做准备会鼓励在课堂上广泛使用口语活动,并促进学习。