面向中文问答系统问题分析与答案抽取方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的飞速发展以及自然语言处理技术的兴起，问答系统进入了面向开放领域、基于自由文本数据的发展阶段。如何从海量信息中获取有用信息是学术界和工业界关注的一个热点。与传统的搜索引擎相比，问答系统允许用户以自然语言提问，并能更好地满足用户对快速、高效、准确获取信息的需求。本文从问题分析和答案抽取两方面对问答系统进行进一步分析。在问题分析方面，本文从长文本和短文本以及数据的序列性三个角度提出了基于在线隐式狄利克雷分布(Extended Latent Dirichlet Allocation,Extended LDA)和增量短文本主题模型(Incremental Biterm Topic Model,IBTM)的动态主题模型—CTM主题模型。该模型不仅可以捕获用户问题文本中的语义信息，还可以捕获滑动窗口中的词对信息，并能对实时数据进行分类和用户意图分析。由于中文分词工具产生的误差和中文语法的灵活性，传统的从中文文本中提取关键词的方法并不能完整捕获用户所提问题中的主题焦点。本文从基于词性特征组合和同义词词库两个方面对前面提出的动态模型进行改进。实验证明本文所提出的两个改进方法有助于挖掘用户问题中的主题焦点。在答案抽取方面，现阶段本文所研究的答案抽取与答案选择和答案排序问题是类似的，为了保持上下文一致性，本文仍以答案抽取来表示答案选择和答案排序。针对目前基于神经网络的答案抽取模型没有充分考虑问题和答案之间的关系等问题，本文提出了基于双向长短时记忆神经网络(Bi-directional Long Short Term Memory Network,Bi-LSTM)的答案抽取模型。该模型直接用Bi-LSTM对问题的表示向量学习，通过利用卷积神经网络(Convolutional Neural Network,CNN)进一步提取问题特征，然后利用注意力机制对答案的表示向量与问题最终表示向量的相关性进行加权。该模型有效地提取了问题与答案之间的关系。经实验验证本文所提出的基于Bi-LSTM的答案抽取模型在基于搜索引擎中的问答数据集上取得了良好的实验效果。

著录项

作者
朱龙霞;
展开▼
作者单位

河北科技大学;

展开▼
授予单位河北科技大学;
学科计算机技术
授予学位硕士
导师姓名许云峰,丁保忠;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;电化教育;
关键词
中文问答系统; 问题分析; 答案抽取;
入库时间 2022-08-17 10:28:45

相似文献

中文文献
外文文献
专利

1. 多特征融合的中文问答系统答案抽取算法 [J] . 唐朝霞 . 贵州大学学报（自然科学版） . 2011,第005期
2. 中文问答系统中答案抽取的研究 [J] . 刘宁锋 ,史晓东 . 电脑知识与技术 . 2011,第012期
3. 中文问答系统答案抽取的研究 [J] . 何鹍 ,叶昕 ,李巍 . 商情 . 2010,第028期
4. 面向课程的中文 FAQ 自动问答系统模型 [J] . 侯丽敏 ,张永强 . 计算机与现代化 . 2014,第010期
5. 面向中文问答系统的问句句法分析 [J] . 张亮 ,王树梅 ,黄河燕 . 山东大学学报：理学版 . 2006,第3期
6. 面向课程教学的中文问答系统研究 [C] . 陈志峰 ,苏州经贸职业技术学院数字化校园管理中心 ,朱巧明 . 第三届全国信息检索与内容安全学术会议 . 2007
7. 中文问答系统中问题理解和答案抽取的研究 [A] . 胡长生 . 2009

面向中文问答系统问题分析与答案抽取方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅