首页> 外文会议>43rd Annual Meeting of the Association for Computational Linguistics: Proceeding of the Conference >Using Biomedical Literature Mining to Consolidate the Set of KnownHuman Protein–Protein Interactions
【24h】

Using Biomedical Literature Mining to Consolidate the Set of KnownHuman Protein–Protein Interactions

机译:利用生物医学文献挖掘来巩固人类蛋白质-蛋白质相互作用的集合

获取原文

摘要

This paper presents the results of a largescaleeffort to construct a comprehensivedatabase of known human protein interactionsby combining and linking knowninteractions from existing databases andthen adding to them by automatically miningadditional interactions from 750,000Medline abstracts. The end result is anetwork of 31,609 interactions amongst7,748 proteins. The text mining systemfirst identifies protein names in thetext using a trained Conditional RandomField (CRF) and then identifies interactionsthrough a filtered co-citation analysis.We also report two new strategiesfor mining interactions, either by findingexplicit statements of interactions in thetext using learned pattern-based rules ora Support-Vector Machine using a stringkernel. Using information in existing ontologies,the automatically extracted datais shown to be of equivalent accuracy tomanually curated data sets.
机译:本文介绍了大规模的结果 努力建设全面 已知人类蛋白质相互作用的数据库 通过组合和链接已知 来自现有数据库的互动,以及 然后通过自动挖掘将其添加到他们 来自750,000的其他交互 Medline摘要。最终结果是 31,609个互动网络 7,748种蛋白质。文本挖掘系统 首先在 使用训练有素的条件随机文本 字段(CRF),然后识别互动 通过过滤的共同引文分析。 我们还报告了两种新策略 用于挖掘互动,方法是找到 互动中的明确陈述 使用基于学习的基于模式的规则的文本,或 使用字符串的支持向量机 核心。利用现有本体中的信息, 自动提取的数据 被证明与...具有同等的准确性 手动整理的数据集。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号