首页> 中文学位 >基于深度神经网络模型的非特定域中文智能问答系统研究与实现
【6h】

基于深度神经网络模型的非特定域中文智能问答系统研究与实现

代理获取

目录

声明

致谢

摘要

插图清单

表格清单

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 语言模型方法

1.2.2 统计学方法

1.2.3 模式匹配方法

1.3 建设目标与研究内容

1.4 关键问题与技术难点

1.5 论文组织结构

第二章 智能问答系统相关理论

2.1 文本预处理

2.1.1 中文分词

2.1.2 词性标注

2.1.3 句法分析

2.1.4 命名实体识别

2.1.5 词向量

2.2 非事实型问题的智能问答

2.2.1 AIML简介

2.2.2 AIML的核心标签简介

2.3 事实型问题的深度问答

2.3.1 问题分类

2.3.2 支持证据获取

2.3.3 支持证据评分

2.3.4 候选答案抽取评分

2.4 本章小结

第三章 基于序列映射模型的对话生成

3.1 循环神经网络

3.1.1 前向传播过程

3.1.2 反向传播过程

3.2 长短期记忆模型

3.2.1 LSTM基本结构

3.2.2 LSTM网络内部数据流向

3.3 基于RNN/LSTM的Encoder-Decoder模型

3.3.1 编码器

3.3.2 译码器

3.4.1 实验语料和设置

3.4.2 评价方法

3.4.3 实验结果

3.4.4 实验结论

3.5 循环神经网络应用

3.6 本章小结

第四章 系统设计与实现

4.1.2 系统总体设计框架

4.2.1 AIML模板匹配

4.2.2 WebService进行服务处理

4.2.3 LSTM Encoder-Decoder模型训练与调用

4.3 事实型问答知识库的构建与处理流程

4.4 事实型问答实验结果与分析

4.4.1 实验语料

4.4.2 评价标准

4.4.3 探究不同的候选证据评分组件效果

4.4.4 探究不同的答案评分组件效果

4.5 系统运行结果

4.6 本章小结

第五章 总结与展望

参考文献

攻读硕士学位期间的学术活动及成果情况

展开▼

摘要

智能问答系统是一种新型的信息服务系统,它综合运用了信息检索、自然语言处理、人工智能、语义分析等技术,可以对用户问题做出智能准确的响应。以领域划分可以分为特定领域和开放领域问答系统,按处理的问题类型可分为事实型问答和非事实型问答。本文设计并实现了开放域中文智能问答系统,使用不同策略处理不同类型的问题,重点研究针对非事实型问题的模板匹配和深度序列映射模型及针对事实型问题的处理流程。由于面向领域是开放域,设计的模板不可能覆盖到所有的非事实型问题,故本文引入基于深度神经网络的序列映射模型,使用大量问答对语料训练模型,可以学习到问题序列与答案序列之间的映射关系,相当于自主学习“模板”,一定程度上解决了模板覆盖不足的问题。本文所实现的智能问答系统包括针对事实型问题的深度问答流程,如问题类型判断、支持证据收集与检索、支持证据评分、候选答案抽取与评分步骤。本文涉及到的技术包括文本预处理过程、AIML模板匹配、Lucene全文检索、循环神经网络及其变形长短期记忆模型、基于循环神经网络的序列映射模型。本文的主要工作和成果如下:
  (1)构建基于循环神经网络的序列映射模型对问答对建模,将原始输入从稀疏词袋向量改为稠密词向量,设计实验探究影响实验结果的关键参数,并与全文检索模型相比较。实验结果表明模型生成的答案比基于Lucene检索出的答案合理性高出14%,说明序列映射模型的确可以学习到训练语料中某些隐藏的规则,可以对语料库中未登陆问题产生合理响应,验证了该方法的有效性。
  (2)分析比较目前存在的支持证据和候选答案评分组件,发现基于平均词距模型的候选答案评分方法能够利用句子的结构信息,基于词频的答案评分方法适用于预期答案在支持证据中多次出现但缺乏统一表述模式的情况。故本文将这两种方法加权结合,综合考虑结构、词频两方面对答案评分组件的影响,实验表明该方法具有更高的准确率和MRR值。
  (3)综合以上研究成果,设计系统框架,最终实现中文智能问答原型系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号