首页> 中文学位 >基于SVM的初等数学问题自动分类的研究与应用
【6h】

基于SVM的初等数学问题自动分类的研究与应用

代理获取

目录

声明

第一章 绪论

1.1 研究工作的背景和意义

1.2 国内外研究现状

1.3 论文组织结构

第二章 相关理论与技术

2.1 自然语言理解概述

2.2 语言模型

2.3 支持向量机

2.4 本章小结

第三章 初等数学问题分类预处理模型的构建

3.1 初等数学问题文本的特点

3.2 基于最大熵模型的初等数学文本的分词

3.3 初等数学文本的词性标注

3.4 初等数学文本的命名实体标注

3.5 基于实体属性改进的指代消解方法

3.6 本章小节

第四章 基于SVM的初等数学问题的分类

4.1 初等数学问题的分类方式

4.2 一种新型词袋模型的构建

4.3 特征选择

4.4 基于SVM的初等初等数学问题分类算法

4.5 本章小节

第五章 初等数学问题自动分类系统的实现

5.1 初等数学问题分类预处理系统的设计与实现

5.2 初等数学问题的分类

5.3 初等数学问题分类测试

5.4 本章小节

第六章 总结与展望

6.1 总结

6.2 研究的不足和展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

众所周知,随着计算机信息技术的迅速发展,信息技术已经在我们生活的方方面面有所应用。在教育领域,人们的目光也逐渐从线下老师辅导以及手工批阅试卷,解题转向了基于人工智能的互联网智能教育。这种新型的数学教育理念实现的一个重要前提就是对文本自然语言进行转换,通俗的讲就是把人类理解的数学语句转化为事先定义好的计算机存储知识,来供计算机进行下一步的处理。这些处理主要有解题,以及全流程判卷等等。这一前提也可以称为自然语言处理过程。而分类问题又是自然语言处理的过程中的主要问题。
  本文主要分为两个部分,第一部分是对初等数学问题文本进行分词,以及词性标注和命名实体识别。第二部分是基于SVM对初等数学问题文本进行题型分类,进而根据不同的类别转换成计算机推理所需的表现形式。
  在英文表达中,每个单词之间都是有空格的,但是中文则不同,所有的字符都是连接在一起的,所以需要对中文的文本进行分词。但是数学表述中包含了较多的有特定含义的符号,所以通用的分词方法行不通。因此需要针对数学表述构造专门的分词器。同样,数学语言表达中的实体和普通语言表达的实体不同,普通语言的实体更多是时间,地点,姓名等。而在数学表达中,包含重要信息的实体往往是数学名词,比如三角形,以及各方程等等。因此需要针对初等数学方向定义专门的命名实体,然后进行提取。本论文采用条件随机场来进行命名实体标注。
  初等数学问题中涉及的类型有很多,想要对初等数学问题进行自动求解,首先要做的是把问题进行分类,然后根据不同的类别调用相应的求解方法。对经过命名实体模型标注的初等数学问题文本进行文本预处理,包括去停用词,建立词袋模型。在本论文中,通过卡方统计量来实现文本特征向量的选择。这样使用特征向量通过选择降维技术能很好的减少计算量,还能维持分类的精度。
  最后,根据本文提出的方法,使用支持向量机实现了一套对初等数学问题进行命名实体提取并且对题目进行分类的系统。该系统可以准确标注命名实体,为后面解题等处理提供知识表示,同时有效的题目分类可以为后面解题或者判卷做推理剪枝。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号