首页> 中文学位 >特征选择方法对英文作文自动评分性能影响的研究
【6h】

特征选择方法对英文作文自动评分性能影响的研究

代理获取

目录

文摘

英文文摘

声明

第一章 引言

1.1本文研究的背景和意义

1.2本文的创新之处

1.3本文的工作任务

1.4本文的组织结构

第二章 自动作文评分及本文的实现

2.1自动作文评分的概述

2.1.1自动作文评分的工作原理

2.1.2自动作文评分的流程

2.1.3自动作文评分的优点

2.2自动作文评分的发展状况

2.2.1国外发展现状

2.2.2国内发展现状

2.3相关自动作文评分的比较

2.4本文的实现

2.5本章小结

第三章英文作文的特征提取与表示

3.1英文作文特征的提取方法

3.1.1 TF-IDF

3.1.2 IG

3.1.3 CHI

3.2英文作文的表示及划分

3.3本章小结

第四章Boosting算法在作文评分中的应用

4.1分类器介绍

4.1.1模式识别与分类器技术简介

4.1.2 K近邻

4.1.3朴素贝叶斯

4.1.4支持向量机

4.1.5分类器融合概述

4.2 Boosting概述

4.3 AdaBoost方法

4.4实验结果与分析

4.4.1性能评价标准

4.4.2实验结果

4.5本章小结

第五章线性回归应用于作文自动评分

5.1一元线性回归

5.1.1相关系数

5.1.2方差分析和F检验

5.1.3残差分析

5.2多元线性回归

5.3实验结果

5.4本章小结

第六章总结与展望

6.1论文总结

6.2研究展望

参考文献

攻读学位期间公开发表的论文

致 谢

展开▼

摘要

英文作文自动评分是一项使用计算机进行作文评分的新技术。该项技术的研究起始于20世纪60年代。至今已经有多个国家开发出针对英文的作文自动评分系统,如E-rater等等。在目前中国此方面正属于研究之中。在当代大学英语四、六级考试是一项规模宏大的标准化考试。考试阅卷工作量大,很难保证阅卷评分的准确性和客观性,随着参考人数的增多,这一问题日显突出。面向大学英语写作的自动作文评分研究存在不少难题,如:评分标准、针对性、通用性等。自动评分要以人工评分为准,并结合写作教学理论;评分要考虑中国学生写作特点,使评价具有针对性。目前的自动化考试系统对客观题目均实现了自动判分,但对作文的自动评分仍有待研究。
   本文从语料库中抽取同一主题的作文作为系统的语料,根据作文分值的不同,将不同分值的作文划分到不同的类别。文中用到了两种不同的方法来实现对作文的评分-Boosting算法和线性回归方法。抽取相关作文的特征,根据提取的特征,利用向量空间模型来表示每一篇作文,然后利用TF-IDF、IG和CHI方法对抽取的特征进行筛选,删除作文中比所设阈值小的特征,再利用三种文本分类算法(朴素贝叶斯、K近邻和支持向量机)来作为分量分类器。文中用Boosting算法、线性回归的方法,对待测作文进行分类,得出作文的最后类别或分值。通过实验表明,不同的特征提取方法,对最终的结果存在不同影响,线性回归的评分结果比boosting方法稍好,进一步证明了该方法的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号