首页> 外文期刊>The Canadian Journal of Information and Library Science >Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur
【24h】

Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur

机译:命名实体的标准化:结合声明性规则,内生资源和以用户为中心的流程

获取原文
获取原文并翻译 | 示例
           

摘要

Normalization is involved in many fields of information processing. It improves the performance of several applications, such as information retrieval or information extraction, and makes the construction of language resources more reliable. Normalization consists in standardizing each variant of a term or named entity into a unique form, and in this way restricts the impact of language variation. Our work applies to named entity normalization, and aims at optimizing fine-grained corpus analyses carried out by the TecKnowMetrix Company. Our approach mixes several methods, such as pattern matching, similarity metrics and endogenous techniques. Moreover, we place the user in the center of our normalization process, in order to obtain fully reliable data that fit his or her needs.%La normalisation intervient dans de nombreux champs du traitement de l'information. Elle permet d'améliorer l'efficacité d'applications telles que la recherche ou l'extraction d'information, et de rendre plus fiable la constitution de ressources langagières. La normalisation consiste à ramener toutes les variantes d'un même terme ou d'une entité nommée à une forme standard, et permet de limiter les effets de la variation linguistique. Notre travail porte sur la normalisation des entités nommées, et vise à optimiser les analyses de corpus fines réalisées par la société TecKnowMetrix. Notre approche combine plusieurs méthodes, telles que l'utilisation de formes, de calculs de similarité, ou encore derntechniques endogènes. De plus, nous plaçons l'utilisateur au centre du processus de normalisation, afin d'obtenir des données parfaitement fiables et adaptées à ses besoins.
机译:规范化涉及信息处理的许多领域。它提高了多种应用程序的性能,例如信息检索或信息提取,并使语言资源的构建更加可靠。规范化包括将术语或命名实体的每个变体标准化为唯一形式,并以此方式限制语言变体的影响。我们的工作适用于命名实体规范化,旨在优化由TecKnowMetrix公司执行的细粒度语料库分析。我们的方法混合了多种方法,例如模式匹配,相似性度量和内生技术。此外,我们将用户置于规范化过程的中心,以便获得完全适合其需求的可靠数据。%La规范化特性信息。 Elle permet d'améliorerl'efficacitéd'应用程序告诉了la recherche ou l'extraction d'information等信息,以及可靠的语言结构资源。归一化包括变形标准的变体名称和标准语言的变体限制,以及变体语言的有效限制。符合法人名义的普通法要求的最佳实践分析,以及根据TecKnowMetrix对企业社会罚款的最佳方法进行分析。巴黎圣母院结合了各式各样的方法,各种形式的使用方法,相似的计算方法和内在技术。再加上规范化的无用功中心,唐纳德·唐纳德·阿法纳·唐纳德·德·弗朗索瓦·贝索因·贝索因斯。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号