首页> 外文会议>TALN-RECITAL workshop >Approche basée sur les arbres sémantiques pour la désambiguïsation lexicale de la langue arabe en utilisant une procédure de vote
【24h】

Approche basée sur les arbres sémantiques pour la désambiguïsation lexicale de la langue arabe en utilisant une procédure de vote

机译:基于语义树的使用投票程序消除阿拉伯语词汇歧义的方法

获取原文

摘要

Le problème de désambiguïsation lexicale du sens des mots est l'un des plus vieux problèmes de traitement du langage naturel. Dans cet article, nous proposons une approche semi-supervisé pour la désambiguïsation lexicale des mots arabes. La partie supervisée de notre méthode utilise le corpus et le dictionnaire comme ressources pour classifier les contextes du mot ambigu selon le sens. Le regroupement de ces contextes est représenté sous forme d'arbre sémantique. Par la suite nous allons faire la correspondance entre l'arbre sémantique (de chaque sens) et l'arbre de la phrase à désambiguïser pour obtenir un graphe acyclique pondéré. Nous avons défini une nouvelle mesure de score (en utilisant trois mesures de collocation) pour trouver l'arbre sémantique la plus proche. La partie non supervisé de ce travail est basé sur une procédure de vote permettant de classifier les mesures de collocations et de choisir le sens correct du mot ambigu.
机译:单词含义的词汇歧义化问题是自然语言处理中最古老的问题之一。在本文中,我们为阿拉伯语的词汇歧义提出了一种半监督方法。我们方法的监督部分使用语料库和字典作为资源,根据含义对歧义词的上下文进行分类。这些上下文的分组以语义树的形式表示。随后,我们将使语义树(每个意义上的树)与要消除歧义的句子树之间的对应关系得到加权的无环图。我们定义了一个新的得分度量(使用三个搭配度量)来找到最接近的语义树。这项工作的无监督部分基于投票程序,用于对搭配措施进行分类并选择歧义词的正确含义。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号