首页> 美国卫生研究院文献>other >Integrating Semantic Information into Multiple Kernels for Protein-Protein Interaction Extraction from Biomedical Literatures
【2h】

Integrating Semantic Information into Multiple Kernels for Protein-Protein Interaction Extraction from Biomedical Literatures

机译:从生物医学文献中将语义信息整合到多个内核中以进行蛋白质-蛋白质相互作用的提取

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Protein-Protein Interaction (PPI) extraction is an important task in the biomedical information extraction. Presently, many machine learning methods for PPI extraction have achieved promising results. However, the performance is still not satisfactory. One reason is that the semantic resources were basically ignored. In this paper, we propose a multiple-kernel learning-based approach to extract PPIs, combining the feature-based kernel, tree kernel and semantic kernel. Particularly, we extend the shortest path-enclosed tree kernel (SPT) by a dynamic extended strategy to retrieve the richer syntactic information. Our semantic kernel calculates the protein-protein pair similarity and the context similarity based on two semantic resources: WordNet and Medical Subject Heading (MeSH). We evaluate our method with Support Vector Machine (SVM) and achieve an F-score of 69.40% and an AUC of 92.00%, which show that our method outperforms most of the state-of-the-art systems by integrating semantic information.
机译:蛋白质-蛋白质相互作用(PPI)提取是生物医学信息提取中的重要任务。目前,许多用于PPI提取的机器学习方法已取得了可喜的成果。但是,性能仍然不能令人满意。原因之一是语义资源基本上被忽略了。在本文中,我们提出了一种基于多核学习的方法来提取PPI,将基于特征的内核,树形内核和语义内核相结合。特别是,我们通过动态扩展策略扩展了最短路径封闭树内核(SPT),以检索更丰富的语法信息。我们的语义内核基于两个语义资源:WordNet和医学主题词(MeSH)来计算蛋白质-蛋白质对相似性和上下文相似性。我们使用支持向量机(SVM)评估了我们的方法,并获得了69.40%的F得分和92.00%的AUC,这表明我们的方法通过集成语义信息优于大多数最新系统。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号