Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur

Vanessa Andréani; Thibault Roy et Thomas Lebarbé

首页> 外文期刊>The Canadian Journal of Information and Library Science >Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur

【24h】

Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur

机译：命名实体的标准化：结合声明性规则，内生资源和以用户为中心的流程

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Normalization is involved in many fields of information processing. It improves the performance of several applications, such as information retrieval or information extraction, and makes the construction of language resources more reliable. Normalization consists in standardizing each variant of a term or named entity into a unique form, and in this way restricts the impact of language variation. Our work applies to named entity normalization, and aims at optimizing fine-grained corpus analyses carried out by the TecKnowMetrix Company. Our approach mixes several methods, such as pattern matching, similarity metrics and endogenous techniques. Moreover, we place the user in the center of our normalization process, in order to obtain fully reliable data that fit his or her needs.%La normalisation intervient dans de nombreux champs du traitement de l'information. Elle permet d'améliorer l'efficacité d'applications telles que la recherche ou l'extraction d'information, et de rendre plus fiable la constitution de ressources langagières. La normalisation consiste à ramener toutes les variantes d'un même terme ou d'une entité nommée à une forme standard, et permet de limiter les effets de la variation linguistique. Notre travail porte sur la normalisation des entités nommées, et vise à optimiser les analyses de corpus fines réalisées par la société TecKnowMetrix. Notre approche combine plusieurs méthodes, telles que l'utilisation de formes, de calculs de similarité, ou encore derntechniques endogènes. De plus, nous plaçons l'utilisateur au centre du processus de normalisation, afin d'obtenir des données parfaitement fiables et adaptées à ses besoins.

机译：规范化涉及信息处理的许多领域。它提高了多种应用程序的性能，例如信息检索或信息提取，并使语言资源的构建更加可靠。规范化包括将术语或命名实体的每个变体标准化为唯一形式，并以此方式限制语言变体的影响。我们的工作适用于命名实体规范化，旨在优化由TecKnowMetrix公司执行的细粒度语料库分析。我们的方法混合了多种方法，例如模式匹配，相似性度量和内生技术。此外，我们将用户置于规范化过程的中心，以便获得完全适合其需求的可靠数据。％La规范化特性信息。 Elle permet d'améliorerl'efficacitéd'应用程序告诉了la recherche ou l'extraction d'information等信息，以及可靠的语言结构资源。归一化包括变形标准的变体名称和标准语言的变体限制，以及变体语言的有效限制。符合法人名义的普通法要求的最佳实践分析，以及根据TecKnowMetrix对企业社会罚款的最佳方法进行分析。巴黎圣母院结合了各式各样的方法，各种形式的使用方法，相似的计算方法和内在技术。再加上规范化的无用功中心，唐纳德·唐纳德·阿法纳·唐纳德·德·弗朗索瓦·贝索因·贝索因斯。

著录项

来源
《The Canadian Journal of Information and Library Science》 |2011年第3期|p.229-263|共35页
作者
Vanessa Andréani; Thibault Roy et Thomas Lebarbé;
展开▼
作者单位

TecKnowMetrix, 4, rue Léon Béridot, Les Jardins d'Epione, 38500 Voiron, France;

LIDILEM - Université Stendhal Grenoble 3, Domaine universitaire, 1180, avenue centrale, 38400 Saint Martin d'Hères, France;

展开▼
收录信息
原文格式 PDF
正文语种 fre
中图分类
关键词
normalisation; entités nommées; traitement de l'information; recherche d'information; analyse de corpus; méthodes endogènes; formes; mesures de similarité; évaluation;

机译：标准化;命名实体;数据处理;寻求信息;语料分析;内生方法形状;相似性度量;评价;

相似文献

外文文献
中文文献
专利

1. Normalisation centrée sur les données Normalisation centrée sur les traitements : le cas 'Open GIS' [J] . Franccedil, ois SALGEacute Geometre . 1996,第2期

机译：以数据为中心的标准化以处理为中心的标准化：“开放GIS”案例
2. Conception centrée sur l'utilisateur lors de la définition des exigences en RUP© [J] . Franccedil, ois Lemieux, Michel C. Desmarais Ingenierie des Systemes d'Information . 2007,第6期

机译：在RUP中定义需求时，以用户为中心的设计©
3. Impact de l'activité anthropique et des règles de gestion des eaux souterraines sur la ressource-exemple de l'Albien en Île-de- France [J] . Dupaigne Timothee, Violette Sophie LA Houille Blanche . 2020,第1期

机译：人为活动与地下水管理规则对Île-de-France的albian资源 - 举例的影响
4. Apprentissage supervisé sur ressources encycbpédiques pour l'enrichissement d'un lexique de noms propres destiné à la reconnaissance des entités nommées [C] . Nadia Okinina, Damien Nouvel, Nathalie Friburger, Conference on traitement automatique des langues naturelles et rencontres des etudiants chercheurs en informatique pour le traitement automatique des langues . 2013

机译：在全民资源方面的有监督的学习，用于充实旨在识别命名实体的专有名词词典
5. Processus RUP et conception centrée sur l'utilisateur: Une étude de cas [D] . Lemieux, Francois 2006

机译：RUP流程和以用户为中心的设计：一个案例研究
6. Intégrer la prise en compte des impacts sur la santé dans les processus d’approbation des plans d’aménagement du territoire: l’élaboration d’un cadre d’étude de base sur la santé [O] . Brent W. Moloughney, Gayle E. Bursey, Jana Neumann, 2015

机译：将对健康影响的考虑纳入土地使用计划的批准过程：制定基本的健康研究框架
7. Démarche centrée utilisateur pour la conception de SIAD basés sur un processus d'ECD, application dans le domaine de la santé [O] . Hela Ltifi, Mounir Ben Ayed, Christophe Kolski, 2014

机译：基于EDC过程的SIAD设计的用户以用户为中心的方法，在健康领域的应用

Normalisation des entités nommées : allier règles déclaratives, ressources endogènes et processus centré sur l'utilisateur

摘要

著录项

相似文献

相关主题

期刊订阅