【24h】

Updating a Name Tagger Using Contemporary Unlabeled Data

机译:使用当代未标记的数据更新名称标记

获取原文

摘要

For many NLP tasks, including named entity tagging, semi-supervised learning has been proposed as a reasonable alternative to methods that require annotating large amounts of training data. In this paper, we address the problem of analyzing new data given a semi-supervised NE tagger trained on data from an earlier time period. We will show that updating the unlabeled data is sufficient to maintain quality over time, and outperforms updating the labeled data. Furthermore, we will also show that augmenting the unlabeled data with older data in most cases does not result in better performance than simply using a smaller amount of current unlabeled data.
机译:对于许多NLP任务,包括命名实体标记,已经提出了半监督学习作为需要注释大量培训数据的方法的合理替代方案。在本文中,我们解决了从早期时间段训练的半监控的NE标记器的分析问题的问题。我们将显示更新未标记的数据足以保持质量随着时间的推移,并且优于更新标记的数据。此外,我们还将显示在大多数情况下使用较旧数据增强未标记的数据不会导致更好的性能,而不是简单地使用较少量的当前未标记的数据。

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号