首页> 外文会议>TALN-RECITAL workshop >Le système WoDiS - WOLF Distributions pour la substitution lexicale
【24h】

Le système WoDiS - WOLF Distributions pour la substitution lexicale

机译:WoDiS-WOLF&Distributions系统用于词汇替换

获取原文

摘要

Le présent article décrit le système WoDiS pour la tâche de substitution lexicale SemDis-TALN 2014. L'algorithme mis en place exploite le WOLF (WordNet Libre du Français) pour générer des candidats de substitution ainsi que pour induire un regroupement des sens fondé sur la structure des synsets. Un espace vectoriel est ensuite créé pour caractériser les différents sens du mot cible à partir de données distributionnelles extraites d'un corpus. Lors de la désam-biguïsation, cet espace est confronté au contexte par des méthodes empruntées au domaine de la classification thématique de documents. Pour surmonter le problème de l'insuffisance des données pour les sens peu fréquents, une expansion lexicale est appliquée au niveau des groupes de sens, qui permet de retrouver davantage de contextes caractéristiques et compenser le biais que présentent les vecteurs de mots induits de corpus. Le système a fini quatrième (sur neuf systèmes soumis) dans l'évaluation.
机译:本文介绍了用于SemDis-TALN 2014词汇替换任务的WoDiS系统,该实现算法利用WOLF(WordNet Libre duFrançais)生成替换候选词,并根据同义词集的结构诱导一组感官。然后创建一个向量空间,以根据从语料库中提取的分布数据来表征目标词的不同含义。在消除歧义的过程中,通过从文档的主题分类领域借用的方法来面对这个空间。为了克服数据不足而导致不频繁出现的含义的问题,在含义组的级别上应用了词法扩展,这使得可以找到更多的特征上下文并补偿语料库的诱导词向量所带来的偏差。该系统在评估中排名第四(提交的九个系统中)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号