首页> 美国卫生研究院文献>Genome Biology >Uncovering protein interaction in abstracts and text using a novel linear model and word proximity networks
【2h】

Uncovering protein interaction in abstracts and text using a novel linear model and word proximity networks

机译:使用新颖的线性模型和词邻近网络发现摘要和文本中的蛋白质相互作用

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Background:We participated in three of the protein-protein interaction subtasks of the Second BioCreative Challenge: classification of abstracts relevant for protein-protein interaction (interaction article subtask [IAS]), discovery of protein pairs (interaction pair subtask [IPS]), and identification of text passages characterizing protein interaction (interaction sentences subtask [ISS]) in full-text documents. We approached the abstract classification task with a novel, lightweight linear model inspired by spam detection techniques, as well as an uncertainty-based integration scheme. We also used a support vector machine and singular value decomposition on the same features for comparison purposes. Our approach to the full-text subtasks (protein pair and passage identification) includes a feature expansion method based on word proximity networks.
机译:背景:我们参加了第二次BioCreative挑战赛的三个蛋白质-蛋白质相互作用子任务:与蛋白质-蛋白质相互作用有关的摘要的分类(相互作用文章子任务[IAS]),发现蛋白质对(相互作用对子任务[IPS]),和鉴定全文文档中表征蛋白质相互作用(相互作用句子子任务[ISS])的文本段落。我们通过一个新颖的,轻量级的线性模型来处理抽象分类任务,该模型受垃圾邮件检测技术的启发,以及基于不确定性的集成方案。为了进行比较,我们还对相同特征使用了支持向量机和奇异值分解。我们对全文子任务(蛋白质对和段落识别)的处理方法包括基于词邻近网络的特征扩展方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号