【24h】

Understanding Hard Negatives in Noise Contrastive Estimation

机译:了解噪声对比估计的努力

获取原文

摘要

The choice of negative examples is important in noise contrastive estimation. Recent works find that hard negatives-highest-scoring incorrect examples under the model-are effective in practice, but they are used without a formal justification. We develop analytical tools to understand the role of hard negatives. Specifically, we view the conlrastive loss as a biased estimator of the gradient of the cross-entropy loss, and show both theoretically and empirically that setting the negative distribution to be the model distribution results in bias reduction. We also derive a general form of the score function that unifies various architectures used in text retrieval. By combining hard negatives with appropriate score functions, we obtain strong results on the challenging task of zero-shot entity linking.
机译:负面示例的选择对于噪声对比估计是重要的。 最近的作品发现,在模型下,难以评分的最高评分错误的示例 - 在实践中有效,但没有正式的理由。 我们开发分析工具以了解硬否定的作用。 具体而言,我们将同次损耗视为跨熵损失梯度的偏置估计器,理论上和经验地显示将负分布设置为模型分布导致偏差降低。 我们还派生了一般形式的分数函数,统一统一文本检索中使用的各种架构。 通过将硬质否定性与适当的分数函数结合起来,我们对零击实体链接的具有挑战性的任务获得了强烈的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号