首页> 外文会议>TALN-RECITAL workshop >Le système WoDiS - WOLF Distributions pour la substitution lexicale
【24h】

Le système WoDiS - WOLF Distributions pour la substitution lexicale

机译:WODIS - Lexical替代的狼和分布

获取原文

摘要

Le présent article décrit le système WoDiS pour la tache de substitution lexicale SemDis-TALN 2014. L'algorithme mis en place exploite le WOLF (WordNet Libre du Fran?ais) pour générer des candidats de substitution ainsi que pour induire un regroupement des sens fondé sur la structure des synsets. Un espace vectoriel est ensuite créé pour caractériser les différents sens du mot cible à partir de données distributionnelles extraites d'un corpus. Lors de la désam-bigu?sation, cet espace est confronté au contexte par des méthodes empruntées au domaine de la classification thématique de documents. Pour surmonter le problème de l'insuffisance des données pour les sens peu fréquents, une expansion lexicale est appliquée au niveau des groupes de sens, qui permet de retrouver davantage de contextes caractéristiques et compenser le biais que présentent les vecteurs de mots induits de corpus. Le système a fini quatrième (sur neuf systèmes soumis) dans l'évaluation.
机译:本文介绍了Semdis-Tall 2014的Lexical替代污染的WODIS系统。该算法放置在适当的地方利用狼(免费Wordnet du法国)来产生替代候选者,并诱导对结构的成立感应的分组synpsets。然后创建矢量空间以从语料库中提取的分布数据表征目标字的不同方向。在分歧期间,这种空间面临着从文件分类的主题分类领域借来的方法面临着背景。为了克服对不常见感官的数据不足的问题,在感官组的水平上施加词汇扩展,这使得可以找到更多特征的背景并补偿诱导语料的vias的偏差。该系统已在评估中完成第四位(在九个提交的系统上)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号