首页> 中文学位 >基于CRF模型的初等数学问题命名实体的识别
【6h】

基于CRF模型的初等数学问题命名实体的识别

代理获取

目录

声明

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究的现状

1.3 本文研究内容

1.4 论文组织结构

第二章 相关理论技术研究

2.1 命名实体识别的方法

2.2 梯度下降优化算法

2.3 CRF++工具的使用

2.4 本章小结

第三章 基于CRF的初等数学命名实体识别研究

3.1 引言

3.2 初等数学问题的相关研究

3.3 CRF算法在初等数学领域命名实体识别优势研究

3.4 基于CRF的初等数学命名实体标注方法研究

3.5 基于CRF的初等数学问题特征提取方法

3.6 基于CRF的初等数学问题特征构建方法的研究

3.7 初等数学问题命名实体识别后处理方法的研究

3.8 Viterbi算法引入规则策略剪枝研究

3.9 本章小结

第四章 命名实体识别在初等数学题意理解中的应用

4.1 引言

4.2 系统的需求分析与流程

4.3 系统总体架构

4.4 本章小结

第五章 系统测试

5.1 引言

5.2 评测标准

5.3 测试环境

5.4 测试数据介绍

5.5 测试设计

5.6章小结

第六章 总结与展望

6.1 总结

6.2 展望

致谢

参考文献

攻读硕士学位期间取得的研究成果

展开▼

摘要

近年来,人工智能领域机器学习、深度学习技术的发展使语音识别、图像识别取得了巨大的成功,因此人工智能技术越来越受到国内外专家学者的关注,而知识推理是机器学习、深度学习研究又是最重要、最核心的问题。因此基于知识推理的863课题“类人求解系统”相继被提出。然而在初等数学领域的类人解题系统进行知识推理的基础是数学知识的正确获取,然后才能进行准确的推理。所以本文从理论和实践两方面重点研究了如何正确高效的抽取数学领域的知识点。本文主要进行了以下几个方面的研究。
  1、基于自动解题的初等数学问题的相关研究
  首先通过分析初等数学语言的特点和基于自动求解初等数学问题的知识表示本文确定了以命名实体的方式进行知识的抽取。因为应用于解题的数学实体没有相关的研究,所以本文依据几何和代数知识的具体特点确定了基于解题需要的数学命名实体的类别。
  2、提出了新的基于解题的初等数学命名实体标注方法
  由于代数和几何实体的特点不同以及代数部分实体长度较长、实体边界判断容易出错的原因,本文针对于代数部分提出了新的6词位实体标注法。通过实验的方法证明了代数部分6词位标注方法效果要好于4词位和2词位的标注方法。
  3、提出了自动生成词典的实体识别后处理方法
  因为基于统计方法的命名实体的识别并不能达到100%的正确率,而解题需要完全正确的知识才能保证推理的正确。根据几何和代数部分实体的词形构造的特点,本文在统计模型识别之后添加了自动生成词典的识别后处理算法,大大的提高了实体识别的效果,也解决了人工收集词典效率不高的问题。
  4、提出了将Viterbi算法和规则相结合的剪枝策略
  本文统计了数学实体标注状态空间的转移规律后发现Vterbi算法在解码过程中的一些搜索路径是不符合实际情况的而且大大的影响了解码的效率。所以本文将发现的标注转移规律以规则的形式应用到解码算法中进行搜索路径的剪枝提高了解码的效率。
  最后,本文基于一系列方法,本文构建了一个基于CRF的初等数学问题命名实体识别系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号