首页> 中文学位 >基于语义和半监督学习的医学文献知识发现
【6h】

基于语义和半监督学习的医学文献知识发现

代理获取

摘要

目前,每年生物医学文献的数量正在呈指数的方式增长,科研人员为了得到好的研究成果,需要查找阅读大量的文献,但如此大规模的文献,给科研人员带来了巨大的困难。同时,现代科学研究分工明确,不同学科之间的交流匮乏,交叉学科的知识往往会被人们忽视,而这些文献中隐含着大量有用的、潜在的信息。Swanson在1986年提出了基于非相关文献的假设发现研究,提出并验证了鱼油可以治疗雷诺氏病的经典案例。随后许多研究人员对假设发现做了大量研究,并取得了大量的研究成果。  但传统的基于简单共现的方法会产生大量的目标词,导致很难发现有用的假设。本文提出了一种基于语义资源的方法,利用SemRep工具抽取句子内实体之间的关系,结合语义类型、概念的信息量以及关联规则对连接词、目标词进行过滤,并根据统计量信息对目标词进行排序。通过对Swanson发现的经典病例进行验证,实验结果表明该方法取得很好的效果。  另一方面,由于SemRep工具产生的语义关系准确率召回率(55%)比较低,会丢失文本中大量的关系,并影响最终的发现结果。本文使用基于词特征的核和图核来抽取句子之间的关系,并使用半监督学习Co-training的思想对训练集进行扩充,在句子关系抽取方面相较于SemRep有提高。本文使用以上的关系抽取方法,利用SVM分类器,分别建立了AB、BC两个监督模型,对于不同语义类型的关系分别进行抽取,并与SemRep工具在经典病例上进行对比,实验结果表明该方法取得较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号