首页> 中文学位 >蛋白质关系抽取中平面特征和结构化信息的研究
【6h】

蛋白质关系抽取中平面特征和结构化信息的研究

代理获取

摘要

蛋白质相互作用关系(Protein-Protein Interactions,PPIs,简称蛋白质关系)对理解生物过程具有重要的意义,从生物医学文本中自动抽取出蛋白质关系可以极大地提高抽取效率。本文在深入研究现有蛋白质关系抽取方法的基础上,以发掘更有效的平面特征和更合理的结构化信息表达方式为研究主线,采用统计机器学习方法进行蛋白质关系抽取,研究内容主要包括:
   1.研究各种平面特征对蛋白质关系抽取的作用。本文探索了词汇、组块、句法、依存和语义等各种平面特征对蛋白质关系抽取的影响,并通过特征组合来有效提高蛋白质关系抽取的性能。
   2.研究结构化信息对蛋白质关系抽取的作用。针对目前结构化信息表达方式所存在的问题,本文提出了利用依存信息来指导句法树的裁剪策略,旨在产生既能涵盖关键结构化信息又能有效剔除噪音的依存指导句法树,从而有效捕获蛋白质关系实例中的结构化特征。
   在PPI基准语料库上对蛋白质关系抽取的实验表明,词汇信息和依存信息对蛋白质关系抽取的贡献最大,并且各种平面特征的集成能有效提高蛋白质关系抽取的性能;而依存指导句法树则能显著提高蛋白质关系抽取的性能,在目前采用成分句法树的蛋白质关系抽取中取得了最好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号