首页> 外文会议>Joint Workshop on Narrative Understanding Storylines, and Events >On-The-Fly Information Retrieval Augmentation for Language Models
【24h】

On-The-Fly Information Retrieval Augmentation for Language Models

机译:语言模型的即时信息检索增强

获取原文

摘要

Here we experiment with the use of information retrieval as an augmentation for pre-trained language models. The text corpus used in information retrieval can be viewed as form of episodic memory which grows over time. By augmenting GPT 2.0 with information retrieval we achieve a zero shot 15% relative reduction in perplexity on Gigaword corpus without any re-training. We also validate our IR augmentation on an event co-reference task.
机译:在这里,我们尝试使用信息检索作为对预训练语言模型的扩充。可以将信息检索中使用的文本语料库视为随时间增长的情节记忆的形式。通过使用信息检索增强GPT 2.0,我们无需进行任何重新培训就可以使Gigaword语料库的困惑度相对降低15%,为零。我们还验证了在事件共同参考任务上的IR增强。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号