首页> 中文学位 >基于语句相似度计算的FAQ问答系统设计
【6h】

基于语句相似度计算的FAQ问答系统设计

代理获取

目录

声明

摘要

第1章 绪论

1.1 本文选题背景及意义

1.2 国内外问答系统简介

1.2.1 问答系统历史

1.2.2 国外问答系统研究现状

1.2.3 国内问答系统研究现状

1.2.4 问答系统分类

1.3 本文研究及设计内容

1.4 本文组织结构

第2章 中文自然语言处理相关方法研究

2.1 中文分词与词性标注

2.1.1 中文分词

2.1.2 词性标注

2.1.3 中文分词及词性标注实用工具

2.2 语句关键词提取

2.2.2 TopicModel关键词提取方法

2.2.3 TextRank关键词提取

2.3 语句相似度计算

2.3.1 基于向量空间模型的TF-IDF语句相似度计算方法

2.3.2 基于词语知识库的语句相似度计算方法

2.3.3 基于句法分析的语句相似度计算方法

2.3.4 基于句子形态的语句相似度算法

2.3.5 基于多特征融合的语句相似度计算方法

2.4 本章小结

第3章 基于Word2Vec和BM25的中文语句相似度计算方法

3.1 词句向量表达得分

3.1.1 Word2Vec词向量模型

3.1.2 基于词向量的语句表达

3.2 BM25得分

3.3 基于逻辑回归的特征融合得分

3.4 数据集及测试结果

3.5 本章小结

第4章 基于深度神经网络的中文语句相似度计算方法

4.1 深度神经网络

4.2 基于CNN的语句相似度计算

4.2.1 卷积神经网络CNN

4.2.2 语句相似度计算模型

4.3 基于LSTM模型的语句相似度计算

4.3.1 长短时神经记忆单元LSTM

4.3.2 语句相似度计算模型

4.4 实验部分

4.4.1 实验渤r据

4.4.2 实验过程及结果

4.5 本章小结

第5章 基于语句相似度计算的证书服务FAQ问答系统

5.1 项目需求与系统建设目标

5.2 数据抽取及FAQ问答数据库构造

5.3 问答系统架构设计

5.4 系统实现与测试

5.5 本章小结

6.1 工作总结

6.2 研究展望

参考文献

致谢

展开▼

摘要

当今互联网行业飞速发展,人工智能引领的科技浪潮正在把人类社会从互联网2.0时代推向互联网3.0时代。在全新互联网3.0时代提出的设想和建设中,互联网将理解用户需求并为之提供服务。互联网会对用户数据了如指掌,知道用户有什么、想要什么以及用户的行为习惯,并依据数据进行资源筛选匹配,直接给用户提供服务。如此一来,人们从互联网寻求问题答案、信息知识时,交流途径将变得越来越多样化。从传统的搜索引擎时代,演变到用户与用户之间交互式的问答知识社区时代,一步一步走向基于大量知识语料训练得到的问答机器人时代。
  传统搜索引擎对知识和答案的检索是一种纯粹的关键词查询方案,通过这种渠道检索到的问题答案往往没有针对性,不能准确理解用户检索、询问意图,且检索结果以网页相关信息列表呈现,包含大量无用信息,导致难以快速定位结果的问题;用户之间交互式的问答社区虽然部分消除了通过机器进行语义理解的环节,但同时又产生了时效性问题,同时需要人为干预以保证社区答案知识的准确性;通过语料知识训练的智能问答机器人既能在一定程度上理解用户检索问题的语义,又能保证回答的即时性和准确性,它将会成信息检索、自动问答领域中更高效、更便捷、更及时、更准确的解决方案。
  本文以浙江汇信科技有限公司数字证书问答客服系统科研项目为背景,设计并实现了基于语句相似度计算的FAQ问答。主要实现了包括问答知识库梳理、语言模型设计与实现、问答接口设计与实现等主要功能,项目涉及到文本检索、分词、词向量、语言模型、深度神经网络、Restful API、Gunicorn/Gevent等关键技术。
  通过浙江汇信科技有限公司的内部对接评测,该项目开发的智能问答客服机器人最终准确率达到83.75%,达到FAQ问答行业相似水平,远高于其原有基于关键字检索的问答检索方案。目前该算法模型及接口已成功通过各项测试,正在部署系统服务,做最后的上线准备。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号