首页> 外文会议>Biomedical NLP workshop 2017 >Adapting the TTL Romanian POS Tagger to the Biomedical Domain
【24h】

Adapting the TTL Romanian POS Tagger to the Biomedical Domain

机译:使TTL罗马尼亚POS Tagger适应生物医学领域

获取原文
获取原文并翻译 | 示例

摘要

This paper presents the adaptation of the Hidden Markov Models-based TTL part-of-speech tagger to the biomedical domain. TTL is a text processing platform that performs sentence splitting, tokeni-zation, POS tagging, chunking and Named Entity Recognition (NER) for a number of languages, including Romanian. The POS tagging accuracy obtained by the TTL POS tagger exceeds 97% when TTL's baseline model is updated with training information from a Romanian biomedical corpus. This corpus is developed in the context of the CoRoLa (a reference corpus for the contemporary Romanian language) project. Informative description and statistics of the Romanian biomedical corpus are also provided.
机译:本文介绍了基于隐马尔可夫模型的TTL语音词性标注器对生物医学领域的适应性。 TTL是一个文本处理平台,可以对多种语言(包括罗马尼亚语)执行句子拆分,标记化,POS标记,分块和命名实体识别(NER)。当使用来自罗马尼亚生物医学语料库的培训信息更新TTL的基准模型时,通过TTL POS标记器获得的POS标记准确性超过97%。该语料库是在CoRoLa(当代罗马尼亚语的参考语料库)项目的背景下开发的。还提供了罗马尼亚生物医学语料库的信息描述和统计信息。

著录项

  • 来源
    《Biomedical NLP workshop 2017》|2017年|8-14|共7页
  • 会议地点 Varna(BG)
  • 作者

    Maria Mitrofan; Radu Ion;

  • 作者单位

    Research Institute for AI "Mihai Draganescu" Romanian Academy 13 "Calea 13 Septembrie", Bucharest 050711, Romania;

    Research Institute for AI "Mihai Draganescu" Romanian Academy 13 "Calea 13 Septembrie", Bucharest 050711, Romania;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号