【24h】

Investigation on Data Adaptation Techniques for Neural Named Entity Recognition

机译:神经名称实体识别数据适应技术的调查

获取原文

摘要

Data processing is an important step in various natural language processing tasks. As the commonly used datasets in named entity recognition contain only a limited number of samples, it is important to obtain additional labeled data in an efficient and reliable manner. A common practice is to utilize large monolingual unla-beled corpora. Another popular technique is to create synthetic data from the original labeled data (data augmentation). In this work, we investigate the impact of these two methods on the performance of three different named entity recognition tasks.
机译:数据处理是各种自然语言处理任务的重要步骤。 由于命名实体识别中的常用数据集仅包含有限数量的样本,因此重要的是以有效可靠的方式获得其他标记数据。 一个常见的做法是利用大型单机Ulbled Corpora。 另一种流行的技术是从原始标记数据(数据增强)创建合成数据。 在这项工作中,我们调查这两种方法对三种不同命名实体识别任务的性能的影响。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号