首页> 中文学位 >基于文本挖掘的主观题评阅辅助系统的研究
【6h】

基于文本挖掘的主观题评阅辅助系统的研究

代理获取

摘要

计算机评阅客观题已基本实现,对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动评阅。随着数据挖掘、模式识别、人工智能及自然语言理解等方面的不断发展,利用计算机评阅主观题将逐渐成为事实。
   在教师评阅主观题时,一般要检查学生答案中的得分点,即关键字,关键字越多,分数越高;其次要看关键字和标准答案的相似度,相似度越高,则分数越高。本文主要通过文本挖掘中的文本分类算法将主观题答案分到某一分值的类别中,主观题的最后得分也就是所属类别的分值。
   文章首先研究了主观题文本的预处理,如分词算法、向量空间模型、特征选择等基本理论及两种文本分类算法:最近邻法及BP神经网络法,并对各种算法进行分析;其次建立了基于某一学科且能动态调节的专业词库,并提出了将正向最大匹配法与专业词库相结合对文本进行分词的方法,解决了分词技术中歧义切分及未登录词问题;另外又提出了匹配替换法,对分词结果进行优化,解决了分词结果中词单位小、数量多的不足,并使关键字的集合更加接近于学生答案;再就是通过计算关键字的文档频率,对关键字进行特征选择,选取给定数目的关键字,通过向量空间模型将一个文本表示为向量空间中的一个特征向量;最后利用kNN和BP神经网络法将预处理得到的学生答案分类,分别对主观题文本进行测试,并对这两种分类算法的准确性及有效性进行分析。选取一种准确性较好的分类算法建立主观题评阅辅助系统。
   本文立足于中文自动分词和主观题文本分类两方面的问题,用Matlab进行仿真实验,并通过Visual C++进行编程。通过两种分类算法的比较,实验证明BP神经网络的准确性更好。在计算机判卷初期,通过教师和计算机共同阅卷的方式评阅主观题。由于主观题评阅辅助系统是个自适应系统,它会随着实验样本的增多而不断优化,最后实现计算机独立评阅主观题的目标。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号