面向在线问答社区的问题检索与答案抽取技术研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

由于自然语言处理的复杂性，现有的基于关键字的搜索引擎无法较好的理解、处理自然语言问题。与搜索引擎相比，社区型问答系统能够更好的理解用户意图，直接返回自然语言提问的答案。社区型问答系统已成为网络上不可或缺的高质量信息来源。
　　然而社区型问答系统还存在如下挑战。问答平台较多，问答资源分散在各个问答社区；自然语言问句表述多样性造成相似问句难以匹配；高质量答案淹没在大量低质量答案之中；相似问题下的最佳答案无法快速获取。本文在问题检索、答案抽取方面进行了具体的工作，设计实现了一个面向在线问答社区的多平台的问答系统。
　　在问题检索部分，本文设计了面向多平台的相似问题查询排序模型。第一步，识别问题类型并到对应在线问答社区的分类中检索相似问题。首先对自然语言形式的提问进行预处理，提取问题特征，考虑不同问题类别与不同在线问答社区的对应关系，到相应的问答社区分类中检索。第二步，将多个来源的相似问题检索结果按照与提问的相关度进行排序。排序过程综合考虑问句的语义距离特征，统计模型特征与问题质量特征，通过排序学习算法调整权重，选择与用户意图最相近的问题。
　　在答案抽取部分，本文设计了面向多平台的最佳答案查询排序模型。第一步采用有监督机器学习的方法从大量答案中过滤掉无关答案，通过层次化模型来得到高质量候选答案集合。第二步综合考虑相似问题下的所有答案，得到多平台的最佳答案。首先通过比较问题与提问的关联度、问题和答案的关联度，提取答案质量的关键特征。然后基于ListNet算法构建答案排序模型，选出与问句最相关的答案。
　　在人工构建的测试集合对上述方法进行了评测，并与经典的算法进行了对比分析。实验结果显示，系统能够实现多平台在线相似问题检索与最佳答案提取，基本满足用户需求。
　　基于上述两项关键技术，作者参与了一个QA系统的设计与开发。该系统参加了2015 年国际文本检索会议（TREC）举办的在线问答竞赛，并在答案质量综合得分上取得了第三名的优秀成绩。

著录项

作者
张鹏飞;
展开▼
作者单位

国防科学技术大学;

展开▼
授予单位国防科学技术大学;
学科软件工程
授予学位硕士
导师姓名贾焰;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;自动推理、机器学习;
关键词
问题检索; 答案抽取; 在线问答社区; 语义距离; 查询排序; 机器学习;

相似文献

中文文献
外文文献
专利

1. 面向大规模社区问答数据的问题检索方法 [J] . 田作辉 ,关毅 . 智能计算机与应用 . 2013,第006期
2. 面向大规模社区问答数据的问题检索方法 [J] . 田作辉 ,关毅 . 智能计算机与应用 . 2013,第006期
3. 面向健康问答社区的语义检索技术研究与分析 [J] . 范桥青 ,方钰 . 电子技术与软件工程 . 2017,第002期
4. 面向中文问答社区的问题去重技术研究 [J] . 彭月娥 ,杨思春 ,李心磊 . 苏州科技学院学报（自然科学版） . 2014,第001期
5. 基于问答社区的海量问句检索关键技术研究 [J] . 延霞 ,范士喜 . 计算机应用与软件 . 2013,第007期
6. 面向协作式问答的问题理解技术研究 [C] . . 第四届全国信息检索与内容安全学术会议 . 2008
7. 面向问答社区的高质量答案抽取研究 [A] . 董才正 . 2016

面向在线问答社区的问题检索与答案抽取技术研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅