首页> 外文OA文献 >A Framework for the Construction of Monolingual and Cross-lingual Word Similarity Datasets
【2h】

A Framework for the Construction of Monolingual and Cross-lingual Word Similarity Datasets

机译:单语言和跨语言单词相似性数据集构建框架

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Despite being one of the most popularudtasks in lexical semantics, word similarityudhas often been limited to the Englishudlanguage. Other languages, even thoseudthat are widely spoken such as Spanish,uddo not have a reliable word similarityudevaluation framework. We put forwardudrobust methodologies for the extensionudof existing English datasets toudother languages, both at monolingual andudcross-lingual levels. We propose an automaticudstandardization for the constructionudof cross-lingual similarity datasets,udand provide an evaluation, demonstratingudits reliability and robustness. Based onudour procedure and taking the RG-65 wordudsimilarity dataset as a reference, we releaseudtwo high-quality Spanish and Farsiud(Persian) monolingual datasets, and fifteenudcross-lingual datasets for six languages:udEnglish, Spanish, French, German, Portuguese,udand Farsi.
机译:尽管它是词法语义学中最受欢迎的 udtask之一,但单词相似性 ud通常仅限于英语 udlanguage。其他语言,甚至诸如西班牙语之类的广泛使用的 ud,也没有可靠的单词相似度 udevaluation框架。对于单语言和跨语言的现有英语数据集扩展到其他语言,我们提出了 udrobust方法论。我们为跨语言相似性数据集的构建 udud提出了自动 udstandard, ud并提供了一个评估,证明 udit的可靠性和鲁棒性。基于 udour程序,并以RG-65单词 udsimilarity数据集为参考,我们发布了 udtwo高质量的西班牙语和波斯语波斯(ud)波斯语单语言数据集,以及15种 ud跨语言的六种语言的数据集: udEnglish ,西班牙语,法语,德语,葡萄牙语, udand波斯语。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号