...
【24h】

Computing distributed representations of words using the CoRoLa corpus

机译:使用CoRoLa语料库计算单词的分布式表示形式

获取原文
           

摘要

We investigate the usability of the CoRoLa corpus for generating high quality vectorrepresentations of words for Romanian language. Different model parameters are tested and modelquality is compared in three test cases: two word analogies data sets and a word similarity correlationwith human judgment. Furthermore, we prove that CoRoLa provides superior word representationscompared to other known Romanian corpora, such as the Wikipedia corpus.
机译:我们调查CoRoLa语料库在生成罗马尼亚语单词的高质量矢量表示形式方面的可用性。在三个测试案例中测试了不同的模型参数并比较了模型质量:两个单词相似度数据集以及一个单词相似性与人类判断力的相关性。此外,我们证明CoRoLa提供了比其他已知的罗马尼亚语语料库(例如Wikipedia语料库)更好的单词表示形式。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号