首页> 外文会议>Conference of the Association for Machine Translation in the Americas >COMET - Deploying a New State-of-the-art MT Evaluation Metric in Production
【24h】

COMET - Deploying a New State-of-the-art MT Evaluation Metric in Production

机译:Comet - 在生产中部署新的最先进的MT评估度量

获取原文

摘要

Metrics in a commercial setting: 1. Automatic metrics like BLEU are of limited use 2. Adaptive evaluation frameworks trained to correlate well provide an attractive solution 3. Our COMET framework is publicly available Evaluating Metrics: 1. Metrics can have different use cases and applications 2. A tiered evaluation method can help to align expectations 3. Considering the statistical significance of modelling decisions can be insightful.
机译:商业环境中的指标:1。像Bleu这样的自动指标是有限使用的2.培训的自适应评估框架训练良好提供了一个有吸引力的解决方案3.我们的彗星框架是公开的评估指标:1。指标可以有不同的使用情况和应用程序2.分层评估方法可以帮助对准期望3.考虑到建模决策的统计显着性可能是有洞察力的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号