【24h】

New Experiments in Distributional Representations of Synonymy

机译:同义词分布表示的新实验

获取原文

摘要

Recent work on the problem of detectingsynonymy through corpus analysis hasused the Test of English as a Foreign Language(TOEFL) as a benchmark. However,this test involves as few as 80 questions,prompting questions regarding thestatistical significance of reported results.We overcome this limitation by generatinga TOEFL-like test using WordNet, containingthousands of questions and composedonly of words occurring with sufficientcorpus frequency to support sounddistributional comparisons. Experimentswith this test lead us to a similarity measurewhich significantly outperforms thebest proposed to date. Analysis suggeststhat a strength of this measure is its relativerobustness against polysemy.
机译:关于检测问题的最新工作 通过语料库分析的同义词 用英语作为外语考试 (TOEFL)作为基准。然而, 该测试涉及多达80个问题, 提示有关 报告结果的统计意义。 我们通过生成克服了此限制 使用WordNet进行的类似于TOEFL的考试,其中包括 成千上万的问题和组成 仅出现足够的单词 语料频率以支持声音 分布比较。实验 通过此测试,我们可以得出相似度 明显优于 迄今为止最好的建议。分析提示 这项措施的优势在于其相对 抵抗多义性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号