首页> 中文学位 >面向慢性病海量数据问答系统智能摘要算法的研究与实现
【6h】

面向慢性病海量数据问答系统智能摘要算法的研究与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1选题背景及意义

1.2智能问答系统的概述

1.3国内外相关研究现状

1.4 本文主要研究内容

1.5文章的结构安排

第2章 相关算法介绍

2.1 自然语言处理

2.2 文档检索算法

2.3 实体抽取

2.4 答案摘要

第3章 问答系统的智能摘要算法研究

3.1 数据集和医学词典

3.2 问题处理

3.3 答案处理

3.4 基于多文档的答案摘要算法

3.5 本章小结

第4章 问答系统人机交互的设计与实现

4.1 系统设计

4.2 用户界面设计

4.3 功能实现

4.3 本章小结

第5章 问答系统的评测

5.1实体抽取评测

5.2系统评测

5.3 简单例子

第6章 结论与展望

6.1 结论

6.2 展望

参考文献

致谢

攻读学位期间发表论文及参加的项目

展开▼

摘要

互联网的蓬勃发展带来了数据的大量积累,而健康医疗产业作为一类非常重要的大数据来源,也越来越引起大家的关注。如今,医疗方面的在线服务产品如雨后春笋般涌现出来,其中在线问答服务以其方便有效、回复及时、专业性强等特点越来越受到大家的认可和接受。因此,我们调研了中国目前活跃度比较高的健康门户的问答模块,发现经过这么多年的积累已经产生了上亿规模的数据,其中,以糖尿病为代表的慢性疾病提问最为热烈,如何充分利用已有的数据来为未来具有相似问题的用户服务,则是提出智能问答系统的关键。
  本文所研究的智能问答系统就是基于这些历史数据进行分析处理,从而为新问题提供及时、有效的答案。尽管国外已经出现了一部分问答系统,但是都具有一定的局限性,比如限定了问题的类型,并且在处理中文数据时,也有很多的新问题需要集中解决。
  本文研究的主要贡献在于:第一,在认真分析了问题和答案的结构后对其中的关键性信息进行了抽取,即实体抽取,通过实体可以更清楚的表达答案的语义;然后结合答案的TF-IDF值,问题关键字,句子特征,以及与问题的相似度等指标对句子进行打分。实验结果表明加入实体后答案摘要算法提高了摘要质量。第二,本文在实现摘要内容优化的基础上又实现了智能问答系统界面的优化,一方面我们调研了慢性病方面的典型问题,用户可以直接点击这些问题获取相应的问题答案,从而提高了效率;另一方面,我们也对该系统答案的呈现方式进行了改进,仅答案是以原数据整段显示,仅片段是经过段落切分后的包含丰富信息量的片段,片段组合是选取得分较高的片段进行组装,从而形成简介、精准度高的一段话。同时,答案中和问题中同时出现的实体也用高亮的方式进行表现出来。
  最后,我们评测了实体抽取的性能,以及对本系统的整体评测,结果表明本系统相比于其他健康服务具有更好的适用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号