首页> 外文会议>;42nd Annual Meeting of the Association for Computational Linguistics >Statistical Significance Tests for Machine Translation Evaluation
【24h】

Statistical Significance Tests for Machine Translation Evaluation

机译:机器翻译评估的统计显着性检验

获取原文

摘要

If two translation systems differ differ in performanceon a test set, can we trust that this indicatesa difference in true system quality? To answer thisquestion, we describe bootstrap resampling methodsto compute statistical significance of test results,and validate them on the concrete example of theBLEU score. Even for small test sizes of only 300sentences, our methods may give us assurances thattest result differences are real.
机译:如果两个翻译系统的性能不同 在测试集上,我们可以相信这表明 真实系统质量有何不同?为了回答这个 问题,我们描述自举重采样方法 计算测试结果的统计意义, 并在具体示例中对其进行验证 BLEU得分。即使只有300的小型测试 句子,我们的方法可以使我们确信 测试结果的差异是真实的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号