【24h】

Sélection non supervisée de relations sémantiques pour améliorer un thésaurus distributionnel

机译:未手术选择的语义关系,以改善分布词库

获取原文

摘要

Les travaux se focalisant sur la construction de thésaurus distributionnels ont montré que les relations sémantiques qu'ils recèlent sont principalement fiables pour les mots de forte fréquence. Dans cet article, nous proposons une méthode pour rééquilibrer de tels thésaurus en faveur des mots de fréquence faible sur la base d'un mécanisme d'amor?age: un ensemble d'exemples et de contre-exemples de mots sémantiquement similaires sont sélectionnés de fa?on non supervisée et utilisés pour entra?ner un classifieur supervisé. Celui-ci est ensuite appliqué pour réordonner les voisins sémantiques du thésaurus utilisé pour sélectionner les exemples et contre-exemples. Nous montrons comment les relations entre les constituants de noms composés similaires peuvent être utilisées pour réaliser une telle sélection et comment conjuguer ce critère à un critère déjà expérimenté sur la symétrie des relations sémantiques. Nous évaluons l'intérêt de cette procédure sur un large ensemble de noms en anglais couvrant un vaste spectre de fréquence.
机译:这项工作侧重于分布词库的建设表明,他们记住的语义关系主要是对高频词的可靠性。在本文中,我们提出了一种重新平衡这些词库的方法,支持基于华丽机制的低频率词:从非监督和用于征收监督分类器的语义类似单词的一组示例和反击示例。然后应用于重新排序用于选择示例和反例的词库的语义邻居。我们展示了如何使用类似复合名称的组件之间的关系来实现这样的选择以及如何将该标准与已经经验丰富的语义关系的对称性的标准组合起来。我们评估此程序对广泛频谱的广泛名称的兴趣。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号