大学英语四、六级考试现在考生数已达到每年900万,由于命题的科学性、评分的一致性、组织的严密性、成绩的可比性和可解释性,大学英语四、六级考试在社会上已有广泛影响,并且已经在国际上受到重视。由于种种原因,四、六级考试结果可能对学生有重要影响,因此是一项高风险考试,组织这样一项考试是极其严肃的心理测量学科学工作,又是一项艰苦细致的、政策性很强的工作。
大学英语四、六级考试是一种大规模标准化考试。人们常常把标准化考试等同于多项选择题,又把多项选择题等同于模拟试题集,于是指责标准化考试考不出学生水平等等,这是一种极大的误解。英语标准化考试是指采用教育测量技术对学生的英语能力进行客观、准确、公正的测量,并提供一种公认的客观标准, 通过对学生语言运用的抽样检查来确定学生的实际语言能力。大规模标准化考试为了保证考试的信度和效度,对考试有很高的质量要求。大学英语四、六级考试在设计时力求做到:
1) 评分具有客观性、一致性
2) 对教学具有正确的指导性
3) 分数具有可比性、可解释性
4) 施考条件对所有考生以及不同考次的考生一律平等
5) 便于施考
为了保证考试的效度,大学英语四、六级考试通过调查研究制定了考试大纲、定义了所测量的英语语言能力、编制了详细的考试内容规范,使历年测试在形式和内容上都稳定不变,保持了评价标准的稳定性。
考试的最终结果是以分数的形式报道考生成绩,这就涉及分数的可解释性问题。如果分数任意性很大而且又不可解释,不同考次的成绩因为没有经过等值处理而不可比较,那么这样的考试就不符合标准化考试的规范要求,就很难说是科学的考试。
为此,大规模标准化考试一般不采用原始分(即答对题数)来报道考生成绩,因为这样做分数的信息量太小,通常要进行一系列的分数转换过程,使最后报道的分数不但信息量大而且具有可解释性。
大学英语四、六级考试每次考试结束后到发布考试成绩之前,要经过一系列的统计处理,分为数据输入、数据处理、成绩计算及统计分析三部分,其流程如图1所示。