大学英语口语机考三阅评分模式的可靠性研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

口语考试是语言水平考试的重要组成部分。同时，口语考试是一种体现考生真实语言运用水平的测试手段，因此任何一个科学和理想的语言类测试都应该要包含口语考试。然而，口语考试也有其自身的特点，由于主观性考试的评分主要依靠评分员的主观判断，因此有效控制口语测试评分的客观性和公正性就是保证口语测试结果可靠性的一个重要途径。
　　本研究针对大规模口语考试评分中存在的评分不一致现象，提出了口语测试评分的三阅模式，并验证该评分模式是否在修正口语测试评分结果一致性上起到有效作用。本研究的实验数据来自2011年1月湖南大学国际教育学院ESL考试中的计算机化口语测试。该口语测试包括四个部分，考试过程全程由计算机自动录音保存为考生文件，考试结果由13位评分员参加阅卷，一阅评分员5位，二阅评分员5位，三阅评分员3位。一阅评分员与二阅评分员同时评分，一阅评分员与二阅评分员的评分结果差异大于一个级别或以上的考生文件由三阅最终评分。数据分析采用IRT多侧面Rasch模型，通过分析评分员内部一致性与评分员之间的一致性以及偏差模式来研究三阅评分模式在减少主观评分误差上的可靠性。
　　通过分析，本研究得出以下结论：首先，一阅评分员与二阅评分员在评分严厉度上呈现显著性差异，其中评分员L评分过于严厉，评分员K和评分员A在评分过程中却表现过于宽松；其次，在四个部分的评分中，评分员A和评分员C的内部均方拟合值超出理想区间范围0.5-1.5之外，大部分评分员基本保持较好的内部一致性；再次，就评分员之间一致性来看，模型分析数据显示为21.9％，未达到多侧面Rasch模型要求的一致性程度。另外，偏差分析的结果显示考生原始分数与模型调整后的分数存在显著性差异，各个评分员呈现出自己独特的评分偏差模式，基本表现为评分员对低水平考生评分严厉，而对高水平考生评分宽松；最后，对三阅评分结果的数据分析显示，三阅评分员既没有表现出一阅与二阅评分员评分的过于“趋中”也没有表现出过于“不可预测”，其拟合均方值接近理想值1，基本符合模型数据要求。另外，三阅评分结果的原始分数与模型调整分数趋于一致。
　　本研究的意义首先体现在对于湖南大学国际教育学院ESL考试以及英语分级考试口语考试部分的评分员三阅评分提供了信度分析，并且为这一评分模式的进一步发展和完善提供了实证研究。数据分析结果显示了三阅评分结果与多侧面Rasch模型更为拟合，在评分中更加保证了考生分数解释的科学性和合理性，这也为之后的语言测试主观考试评分模式提供了参考依据。

著录项

作者
吕玲玲;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科外国语言学及应用语言学
授予学位硕士
导师姓名肖云南;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类评分方法;中国;
关键词
大学英语; 口语测试; 三阅评分模式; 可靠性分析;

相似文献

中文文献
外文文献
专利

1. 分课型教学模式下的大学英语口语教学改革三步曲——以琼州学院为例 [J] . 单岩 ,付玉萍 . 科技信息 . 2013,第013期
2. 学生、教师、互联网三位一体的大学英语口语教学新模式探讨 [J] . 姜毓锋 . 外国语文（四川外语学院学报） . 2010,第006期
3. 医院—社区—家庭三元联动护理模式对癫痫患儿QOLCE评分、疾病控制效果的影响 [J] . 雷宏慧 . 医学理论与实践 . 2021,第005期
4. 三时段多模式保温护理对全麻输尿管结石手术患者干预情况以及寒战评分的影响 [J] . 吴灼金 . 中外医疗 . 2021,第35期
5. 管办评分离视域下职业教育第三方评价的运行模式 [J] . 唐小艳 . 现代教育管理 . 2020,第006期
6. 面向大规模英语口语机考的复述题自动评分技术研究 [C] . 严可 ,胡国平 ,魏思 . 第十届全国人机语音通讯学术会议 . 2009
7. OMOM胶囊内镜辅助阅片模式的临床应用评估与一种新型辅助阅片模式的探索 [A] . 徐扬志 . 2014

大学英语口语机考三阅评分模式的可靠性研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅