注:以下建议摘自华盛顿大学网站,仅稍加修改。这些建议仍然是教师和管理人员考虑学生教学意见(SOIs)的最佳方式。

学生课程评分有很多用途,特别是在跨时间和跨课程查看时。学生评分爱博体育提供信息,教师可以使用这些信息来确定他们教学中的优势和需要改进的地方。此外,院系和教学单位可以综合使用学生评分来评估多课程和多讲师单位的整体表现,以及出于人事原因对个别教师进行评估,例如关于保留、晋升、终身教职和绩效工资的决定。

下面列出的建议可以为在人事决策中使用学生课程评分爱博体育提供有用的指导。

  1. 学生评分必须与其他与教师教学质量相关的数据一起使用,而不是作为教学质量的唯一指标。除了学生评价外,还应评估其他来源,如课堂教学的同行评议、课程材料的同行评议和教师的自我反思,以真正了解教师的教学技能和表现。考虑这些其他来源的证据是特别重要的,因为学生评分本身并不能爱博体育提供足够的证据来证明学生在一门课程中的爱博体育程度。
  2. 在做出有关教学质量的任何决定时,应使用多个部分的评估。研究表明,至少五个课程的评分是保证足够可靠性的必要条件。衡量教学质量的评级的有效性增加了,因为决策所依据的数据中包含了更多种类的课程格式。多年来的评分趋势在评估教学方面也很重要。
  3. 教学效果的综合评分最适合用于人事决策。教师和课程的总体评分往往比其他项目与学生成绩的关系更密切。教师应该使用更具体的项目来评估具体的技能和需要改进的领域。
  4. 个别评价的微小差异不应作为差别决定的依据。因为学生评分产生的是数值平均值,所以很容易高估所给出的平均值的精度。评级的微小差异可能没有意义。最好使用更广泛的分类,例如优秀/良好/可接受/不可接受或明显超出预期/达到预期/达不到预期/明显达不到预期。
  5. 在解释学生平均评分时,我们应该意识到,学生倾向于给教师的评分处于或接近于评分的高端。因此,使用中位数(或第50百分位)作为强教师和弱教师之间的推定分界线是不合适的。更合适的假设是,大多数教师都很强壮。在评估个别教师的平均评分时,还应考虑相关的比较(见建议6)和所教课程的具体特点(见建议7)。
  6. 比较数据应谨慎使用。整个部门的比较数据可以在总结报告中报告。然而,为了使比较有用,规范组的基础不应局限于教员的人数。较小的部门可能不希望依赖部门规范,而是使用为许多类似部门计算的规范。
  7. 在解释结果时应考虑课程特点。例如,大型讲座课程的评分通常低于小型课程,第一次教授的新课程的评分低于已建立的课程,非专业入门课程的评分低于专业高级课程。为了更公平地了解教师的教学技能,应调整课程类型。调整课程类型的一种方法是选择类似的课程进行规范比较。
  8. 教师应该有机会对评估结果作出回应。教师应该有机会讨论课程的目标,如何使用教学方法来实现这些目标,以及课程中的环境如何影响评估。此外,从给定课程中获得的其他评价信息(见建议1)可以帮助解释评分结果。(在VSU,教职员工有机会在他们的年度教职员工活动报告和行动计划中做出回应)。
  9. 课程评分的管理应该安排到最大限度地增加应答者的数量。一般情况下,学生填写评价表的比例越高,评价的效度越高。当回答的学生比例较小时,评分可能不能准确反映整个班级的情况。这个问题在小班中尤为突出。建议至少三分之二的入学学生必须包括在结果中,才能对结果有任何信心。随着比例的下降,特别是在小班中,一个或几个学生的评分更有可能不成比例地影响结果。

Angela Linse在2017年9月发表在《爱博体育评估研究》(https://www.sciencedirect.com/science/article/pii/S0191491X16300232)上的文章《解释和使用学生评分数据:为担任管理人员和评估委员会的教师爱博体育提供指导》中爱博体育提供了类似的建议。

本文推荐以下最佳实践:

  1. 学生评分应该只是教学的多种衡量标准之一。
  2. 在人事决策中,应该考虑教师的完整学生评分历史,而不是单一的综合分数。
  3. 平均评分的小差异很常见,但不一定有意义。
  4. 将异常评分视为其本身,而不是作为教师教学的代表。
  5. 检查分数在整个量表上的分布,以及平均值。
  6. 单独评估每位教员。评估和决定不应参考其他教员的意见;在人事决策中,避免将教员相互比较或与单位平均水平比较。
  7. 关注最常见的评分和评论,而不是强调一个或几个异常的评分或评论。
  8. 相互矛盾的书面评论并不罕见。

SOI资源