...
首页> 外文期刊>Вестник Московского государственного технического университета. Серия приборостроение >ВЗВЕШЕННАЯ ПОГРЕШНОСТЬ - НОВАЯ МЕТРИКА ДЛЯ ОЦЕНКИ КАЧЕСТВА ВАЛИДАЦИИ ОТВЕТОВ В ЗАДАЧЕ ВОПРОСНО-ОТВЕТНОГО ПОИСКА
【24h】

ВЗВЕШЕННАЯ ПОГРЕШНОСТЬ - НОВАЯ МЕТРИКА ДЛЯ ОЦЕНКИ КАЧЕСТВА ВАЛИДАЦИИ ОТВЕТОВ В ЗАДАЧЕ ВОПРОСНО-ОТВЕТНОГО ПОИСКА

机译:加权错误-评估问题-答案搜索问题中答案验证质量的新指标

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Рассмотрена подзадача валидации ответов в задаче вопросно-ответного поиска. Традиционными метриками качества на семинарах TAC-RTE и CLEF-AVE являются аккуратность (accuracy) и F-мера. По результатам участия в семинаре РОМИП-2010 отмечено, что число ложных ответов-гипотез, которые должен отклонить модуль валидации ответов, часто значительно превышает число верных ответов. Предложена новая метрика - взвешенная погрешность, которая чаще штрафует систему за ошибки первого рода (пользователю показан неверный ответ - falsepositive), чем за ошибки второго рода (правильный ответ отвергнут и пользователю не показан - falsenegative). В отличие от F-меры она также поощряет систему за верно отфильтрованный ответ (truenegative).
机译:考虑在问答搜索问题中验证答案的子问题。 TAC-RTE和CLEF-AVE研讨会的传统质量指标是准确性和F量度。根据参加ROMIP-2010研讨会的结果,应注意,答案验证模块应拒绝的错误假设答案的数量通常大大超过正确答案的数量。提出了一种新的度量标准-加权错误,它比第二种错误(更正答案被拒绝并且未显示用户-否定负)更经常地对第一类错误(向用户显示错误答案-错误肯定)惩罚系统。与F度量不同,它还会奖励系统真正的负响应。
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号