导读 来自南达科他州和北卡罗来纳州的前州官员写道,领导人和政策制定者必须了解灵活选择的前景和局限性。教育部提出了 2021 年春季考试管理的

来自南达科他州和北卡罗来纳州的前州官员写道,领导人和政策制定者必须了解灵活选择的前景和局限性。教育部提出了 2021 年春季考试管理的灵活性,例如缩短考试时间、远程提供考试或延长考试窗口。该部门还提供豁免,免除学校 95% 的学生参与测试的最低要求。

在 2021 年春季管理某些版本的全州评估将帮助家长和教育工作者了解对学区、学校和不同学生群体的学生学习的影响。数据可能不太完整,但考虑到对学生学习的潜在重大影响,收集数据对于设计教学支持和干预措施至关重要。

对于教育领导者和政策制定者来说,了解灵活选择的前景和局限性非常重要,特别是与衡量期间的增长和成就趋势有关。

跳过年增长测量是可能的

尽管测试环境波动,但诸如增值模型 (VAM) 和学生增长百分位 (SGP) 等复杂的统计方法可以解决跨年增长问题。这不是未知的领域。SAS 拥有超过 20 年的经验,为许多州提供各种增长模型和测试挑战。

2016 年,田纳西州没有对 3-8 年级进行总结性评估。次年,该州测量了 2015 年至 2017 年两年期间的增长。为了帮助做出这一决定,SAS 使用前几年的数据来比较有和没有缺失年份数据的增长措施。模拟显示,模拟的跨年结果与同一两年期间观察到的实际结果高度相关。

较短的测试

评估应区分成绩优异和成绩差的学生的表现。如果评估缩短太多,地板或天花板效应可能会阻止教育工作者了解对这些学生群体的真正影响。

假设它不是计算机自适应评估,则必须有足够多的不同难度的项目/问题来进行区分。根据我们的经验,非计算机自适应评估中的 40 到 50 个项目通常会提供足够的量表来可靠地衡量学生的成长。

如果州评估不能充分区分学生的成绩,那么基于 2020-21 学年甚至 2021-22 学年的评估将无法使用增长措施。这也可能会限制研究对不同学生群体的影响的可能性。

远程测试

远程测试环境是否可与现场条件相媲美,这确实令人担忧。州教育机构可以将学生在远程环境中的分数与以前的分数进行比较。根据各州的政策和偏好,在增长模型或影响分析中使用学生分数时,各州可以根据需要包括、排除或调整学生分数。

各州应认真考虑获取有关学生学习环境的数据,以发现计划有效性的趋势。通过衡量不同学生经历的学业成长,各州可以衡量不同虚拟或混合学习计划的影响。

扩展或多个测试窗口

扩展或提供多个测试窗口不一定会破坏可靠的增长措施。在典型的一年中,较长的测试窗口可能会使学习时间多于其他人的学生受益。然而,考虑到 2020-21 年学习环境和方式的差异,影响并不那么明显,而且较长的测试窗口增加了在解释结果时需要考虑的另一个因素。分析今年的评估结果可以揭示与评估时间相关的趋势。

在许多学生成长模型的情况下, 管理窗口的转变不会扭曲结果的整体分布,因为预期增长是一个相对衡量标准,将基于修改后的管理窗口的结果。

但是,从 2021 年春季到 2021 年秋季的转变可能会影响有关随时间推移对学生成绩影响的研究。此类研究可以使用前的评估数据,根据先前的成就来确定学生的预期表现。但如果评估转移到秋季,这些预期将基于春季过去的政府。

因此,对学生成绩的影响可能与任何暑期学习损失或增强的暑期课程混为一谈,这可能会使解释复杂化。为确保与之前和未来学生的表现具有可比性,各州应考虑在 2021 年春季保持考试管理,即使窗口扩大。

参加考试的学生越来越少

对 95% 的学生测试参与要求的豁免承认了减少参与学校和可能退出测试的现实。增长模型中包含的应试者减少可能会影响一个州对对学生学习的影响的理解。然而,从谁的学生测量不 参加弹簧试验,但所有学生的一个子集,仍然会带来有价值的见解,教育工作者,家长,研究人员和决策者。

虽然许多州正在放弃用于问责制的测试数据,但成长和成就数据可用于制定策略并加速学生未来的学习。与前几年相比,对这些结果的解释可能有所不同,特别是如果较低的参与率仅限于某些学生群体。

与 2020 年一样,这将是与众不同的一年。州和教育领导者需要了解他们的选择,并考虑如何准确解释和使用我们可以收集的测试数据。2020-21 年评估和增长结果的使用将是复杂的,需要测试和政策部门之间的谨慎合作。

在许多方面,评估结果中的数据比以往任何时候都更重要,可以指导响应和通知恢复。同时,需要仔细考虑将评估结果用于问责制决策。鉴于各州的教学交付和质量存在差异,教育领导者在应对下一阶段的 恢复时必须了解衡量的潜力和局限性。