【24h】

Protein Name Tagging for Biomedical Annotation in Text

机译:用于文本中生物医学注释的蛋白质名称标签

获取原文
获取原文并翻译 | 示例

摘要

We explore the use of morphological analysisrnas preprocessing for protein namerntagging. Our method finds protein namesrnby chunking based on a morpheme, thernsmallest unit determined by the morphologicalrnanalysis. This helps to recognizernthe exact boundaries of protein names.rnMoreover, our morphological analyzerrncan deal with compounds. This offersrna simple way to adapt name descriptionsrnfrom biomedical resources for languagernprocessing. Using GENIA corpus 3.01,rnour method attains f-score of 70 points forrnprotein molecule names, and 75 points forrnprotein names including molecules, familiesrnand domains.
机译:我们探索使用形态学分析预处理蛋白质名称标签。我们的方法基于词素(通过形态分析确定的最小单位)通过分块查找蛋白质名称。这有助于识别蛋白质名称的确切界限。此外,我们的形态分析仪可以处理化合物。这提供了一种简单的方法来修改生物医学资源中的名称描述以进行语言处理。使用GENIA语料库3.01,rnour方法获得的f得分为70点伪蛋白质分子名称和75点伪蛋白质名称,包括分子,家族和域。

著录项

  • 来源
  • 会议地点 Sapporo(JP);Sapporo(JP);Sapporo(JP)
  • 作者单位

    Genomic Sciences Center, The Institute of Physical and Chemical Researchrn1-7-22-E209, Suehiro-cho, Tsurumi-ku, Yokohama, 230-0045 Japanrnkaorux@gsc.riken.go.jp, konagaya@gsc.riken.go.jp;

    Graduate School of Information Science, Nara Institute of Science and Technologyrn8916-5 Takayama, Ikoma, Nara, 630-0192 Japanrntaku-ku@is.aist-nara.ac.jp, matsu@is.aist-nara.ac.jp;

    Genomic Sciences Center, The Institute of Physical and Chemical Researchrn1-7-22-E209, Suehiro-cho, Tsurumi-ku, Yokohama, 230-0045 Japanrnkaorux@gsc.riken.go.jp, konagaya@gsc.riken.go.jp;

    Graduate School of Information Science, Nara Institute of Science and Technologyrn8916-5 Takayama, Ikoma, Nara, 630-0192 Japanrntaku-ku@is.aist-nara.ac.jp, matsu@is.aist-nara.ac.jp;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 程序语言、算法语言;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号