【24h】

Groupement de termes basé sur des régularités linguistiques et sémantiques dans un contexte cross-langue

机译:在跨语言上下文中基于语言和语义规则对术语进行分组

获取原文

摘要

Nous proposons d'exploiter des méthodes du Traitement Automatique de Langues dédiées à la structuration de terminologie indépendamment dans deux langues (anglais et français) et de fusionner ensuite les résultats obtenus dans chaque langue. Les termes sont groupés en clusters grâce aux relations générées. L'évaluation de ces relations est effectuée au travers de la comparaison des clusters avec des données de référence et la baseline, tandis que la complémentarité des relations est analysée au travers de leur implication dans la création de clusters de termes. Les résultats obtenus indiquent que: chaque langue contribue de manière équilibrée aux résultats, le nombre de relations hiérarchiques communes est plus grand que le nombre de relations synonymiques communes. Globalement, les résultats montrent que, dans un contexte cross-langue, chaque langue permet de détecter des régularités linguistiques et sémantiques complémentaires. L'union des résultats obtenus dans les deux langues améliore la qualité globale des clusters.
机译:我们建议使用专用于以两种语言(英语和法语)独立地构造术语的自动语言处理方法,然后合并以每种语言获得的结果。由于生成的关系,这些术语被分组到群集中。这些关系的评估是通过将聚类与参考数据和基线进行比较来进行的,而关系的互补性则通过它们在术语聚类创建中的作用来进行分析。得到的结果表明:每种语言对结果的贡献均是均衡的,共同的等级关系的数量大于共同的同义词关系的数量。总体而言,结果表明,在跨语言环境中,每种语言都可以检测互补的语言和语义规律。两种语言获得的结果的并集提高了群集的整体质量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号