首页> 外文会议>International University Communication Symposium >The structure of unseen trigrams and its application to language models: A first investigation
【24h】

The structure of unseen trigrams and its application to language models: A first investigation

机译:看不见的三重奏的结构及其对语言模型的应用:第一次调查

获取原文
获取外文期刊封面目录资料

摘要

In a series of preparatory experiments in 4 languages on subsets of the Europarl corpus, we show that a large number of unseen trigrams can be reconstructed by proportional analogy with trigrams having the lowest frequencies. We derive a very simple smoothing scheme from this empirical result and show that it outperforms Good-Turing and Kneser-Ney smoothing schemes on trigrams models in all 11 languages on the common multilingual part of the Europarl corpus, except Finnish.
机译:在一系列关于欧洲统计组的四种语言中的一系列预备实验中,我们表明,通过与具有最低频率的三角形的比例模拟可以重建大量的看不见的三元。我们从这个经验结果中得出了一个非常简单的平滑方案,并表明它在所有11种语言中的三元语言中的良好良好和关节的平滑计划优于铜欧尔语料库之外的所有11种语言。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号