首页> 中文学位 >基于深度学习的检索式聊天机器人多轮回复选择研究
【6h】

基于深度学习的检索式聊天机器人多轮回复选择研究

代理获取

目录

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 基于规则或模板的方法

1.2.2 基于深度学习的方法

1.3 本文的主要贡献

1.4 论文组织结构

2 相关工作

2.1 词向量

2.2 卷积神经网络

2.3 循环神经网络

2.4 注意力机制

2.5 本章小结

3 基于多级别词序列粒度表示和融合词向量的多轮回复选择 3.1 引言

3.2 顺序匹配模型SMN

3.3 MRSMN模型的设计思想

3.3.1 多级别词序列粒度表示的设计思想

3.3.2 融合词向量的设计思想

3.4 模型结构设计

3.4.1 多轮回复选择任务定义

3.4.2 模型流程概述

3.4.3 融合词向量

3.4.4 多级别词序列粒度表示

3.4.5 话语回复匹配

3.4.6 匹配特征累积

3.4.7 匹配预测

3.5.1 实验环境

3.5.2 实验数据集

3.5.3 评价指标

3.5.4 实验过程

3.5.5 实验结果及分析

3.6 本章小结

4 基于双向注意力和时空匹配特征的多轮回复选择 4.1 引言

4.2 MRBAST模型的设计思想

4.3.1 模型流程概述

4.3.2 基于双向注意力的多级别粒度表示

4.3.3 话语回复匹配

4.3.4 时空匹配特征累积

4.3.5 匹配预测

4.4 实验及结果分析

4.4.1 实验过程

4.4.2 基准模型

4.4.3 实验结果及分析

4.5 本章小结

5 总结和展望

5.1 总结

5.2 未来工作展望

参考文献

附录

A. 作者在攻读学位期间发表的论文目录

B. 学位论文数据集

致谢

展开▼

摘要

随着网上购物、售后客服、教育咨询等领域的不断发展,传统的基于人工客服的服务方式显示出人工成本高、客服素质参差不齐等弊端。与此同时,伴随着数据积累和计算能力的大幅提升,基于深度学习的聊天机器人呈现爆发式增长态势,相对人工客服展现出巨大的经济优势。当前,聊天机器人的研究受到广泛关注并成为研究热点。  多轮回复选择作为实现检索式聊天机器人的关键任务,现有研究存在对话上下文和候选回复的词序列信息挖掘不足、对话上下文的文本信息表示未考虑不同文本信息重要性有差异的问题。本文针对这些问题对多轮回复选择模型展开深入研究。主要研究工作如下:  ①提出一种基于多级别词序列粒度表示和融合词向量的多轮回复选择模型(Sequential Matching Network with Multi-Level Granularity Representations,MRSMN)。该模型利用多级别词序列粒度表示解决词序列信息挖掘不足的问题,同时利用融合词向量解决现有模型仅使用训练词向量带来的原始词向量信息损失和过拟合的问题。实验结果表明MRSMN模型在两个实验数据集上的各项评价指标都有一定的提升。  ②提出一种基于双向注意力和时空匹配特征的多轮回复选择模型(Multi-Level Granularity Representations with Bidirectional Attention and Spatio-Temporal Matching Feature,MRBAST)。该模型利用双向注意力提取上下文中不同文本内容对于回复具有不同重要性的信息以及衡量候选回复和上下文整体语义的相关性,同时利用3D卷积神经网络提取的时空匹配特征来解决模型在加入注意力表示后无法训练的问题。实验表明,MRBAST模型的性能比MRSMN有所提升,并且优于绝大多数基准模型。  本文通过实验,在电子商务对话语料库和豆瓣对话语料库上验证了所提出的基于多级别词序列粒度表示和融合词向量的MRSMN模型以及基于双向注意力和时空匹配特征的MRBAST模型的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号