首页> 中文学位 >基于规则的阅读理解问题回答技术研究
【6h】

基于规则的阅读理解问题回答技术研究

代理获取

目录

摘要

第一章 引言

1.1 课题的研究意义

1.2 问答系统和阅读理解

1.2.1 问答系统

1.2.2 阅读理解

1.2.3 RC与QA的区别

1.3 阅读理解系统的研究现状

1.3.1 阅读理解系统研究现状

1.3.2 中文阅读理解研究存在的问题

1.4 本文的研究内容

第二章 中文阅读理解语料库的开发

2.1 阅读理解语料库的现状

2.1.1 Remedia语料

2.1.2 CBC4Kids语料库

2.1.3 BRCC语料库

2.2 CRCC语料库的建设

2.2.1 文章的筛选

2.2.2 问句的设计

2.2.3 分词以及词性标注

2.2.4 指称指代标注方法

2.2.5 框架语义标注

2.3 CRCC语料库建设的意义

第三章 阅读理解任务描述及实验

3.1 阅读理解任务描述

3.1.1 英文阅读理解任务描述

3.1.2 中文阅读理解任务描述

3.2 基于规则的阅读理解问题回答

3.2.1 基于规则的方法

3.2.2 词层面的规则

3.2.3 句法层面的规则

3.3 四类问题回答规则的构建

3.4 系统流程及评价标准

3.5 正交设计

3.5.1 正交设计的定义

3.5.2 正交试验设计的步骤

3.5.3 阅读理解问题回答的正交试验

3.6 阅读理解任务的实验结果

第四章 总结与展望

4.1 本论文的工作总结

4.2 对新技术新方法的展望

参考文献

发表文章目录

致谢

个人简历

声明

展开▼

摘要

当前,如何让计算机理解人类的自然语言,并运用人类的自然语言模拟语言交际过程,实现“人机对话”,已经成为人工智能的一个重要研究领域——自然语言处理。问答系统是目前自然语言处理领域中一个倍受关注并具有广泛前景的研究方向,而它的研究热潮也引发了另一相关领域的研究——阅读理解。阅读理解问答系统能够自动分析给定的一篇自然语言文章,并且根据文中的信息,为每个针对本篇文章提出的问题生成相应的答案。
  目前,国内外很多的科研机构都在进行着英文阅读理解问题回答技术研究,而研究应用于中文阅读理解问题回答技术却寥寥无几。本文正是对中文阅读理解问答技术进行了探索性的研究。
  本文首先介绍了基于山西大学自主开发的中文阅读理解语料库CRCCv1.1版的构建过程,该语料库为中文阅读理解问题回答技术研究解决了语料资源的问题。其次介绍了词特征规则和基本块特征规则,人工制定的规则是根据问句和候选答案句的对应关系构造的,并针对时间、人物、地点、数值类型的问题制定了问题回答规则。最后,运用规则的方法在CRCC语料上对中文阅读理解的四类问题回答进行了实验,其中利用正交试验设计对规则的权重进行了优化选取。
  本文实现了一个基于规则的问题回答系统,并通过实验对其性能进行了评价。在本文的实验中,我们采用HumSent准确率作为阅读理解问题回答评价指标。实验结果表明,采用人工编写规则,能够取得较为令人满意的结果。对四类问题在阅读理解语料库上的测试,分别达到88.24%、80%、94.12%、89.61%的HumSent准确率。但规则的制定依靠的是人的先验知识,具有很大的主观性,缺乏一定的客观性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号