【24h】

Handling noisy training and testing data

机译:处理嘈杂的培训和测试数据

获取原文
获取原文并翻译 | 示例

摘要

In the field of empirical natural language processing, researchers constantly deal with large amounts of marked-up data; whether the markup is done by the researcher or someone else, human nature dictates that it will have errors in it. This paper will more fully characterise the problem and discuss whether and when (and how) to correct the errors. The discussion is illustrated with specific examples involving function tagging in the Penn treebank.
机译:在自然语言经验处理领域,研究人员不断地处理大量标记数据。不管标记是由研究人员还是由其他人完成的,人性决定标记中将存在错误。本文将更全面地描述问题,并讨论是否以及何时(以及如何)纠正错误。通过涉及Penn树库中功能标记的特定示例说明了该讨论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号