首页> 外文会议>DEFT 2012 Workshop: Text Mining Challenge >Indexation libre et contrôlée d'articles scientifiques Présentation et résultats du défi fouille de textes DEFT2012

【24h】

Indexation libre et contrôlée d'articles scientifiques Présentation et résultats du défi fouille de textes DEFT2012

机译：科学文章的自由和受控索引文本挖掘挑战的演示和结果DEFT2012

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

Dans cet article, nous présentons la campagne 2012 du défi fouille de texte (DEFT). Cette édition traite de l'indexation automatique par des mots-clés d'articles scientifiques au travers de deux pistes. La première fournit aux participants la terminologie des mots-clés employés dans les documents à indexer tandis que la seconde ne fournit pas cette terminologie, rendant la tâche plus complexe. Le corpus se compose d'articles scientifiques parus dans des revues de sciences humaines, indexés par leurs auteurs. Cette indexation sert de référence pour l'évaluation. Les résultats ont été évalués en termes de micro-mesures sur les rappel, précision et F-mesure calculés après lemmatisation de chaque mot-clé. Dans la piste fournissant la terminologie des mots-clés employés, la F-mesure moyenne est de 0,3575, la médiane de 0,3321 et l'écart-type de 0,2985 ; sur la seconde piste, en l'absence de terminologie, la F-mesure moyenne est de 0,2055, la médiane de 0,1901 et l'écart-type de 0,1516.%In this paper, we present the 2012 edition of the DEFT text-mining challenge. This edition addresses the automatic, keyword-based indexing of scientific papers through two tracks. The first gives to the participants the terminology of keywords used to index the documents, while the second does not provide this terminology. The corpus is composed of scientific papers published in humanities journals, indexed by their authors. This indexing is used as a reference for the evaluation. The results have been evaluated in terms of micro-measures on the recall, precision and F-measure computed after keyword lemmatization. In the track giving the terminology of used keywords, the mean F-measure is 0.3575, the median is 0.3321 and the standard deviation is 0.2985 ; in the second track, the mean F-measure is 0.2055, the median is 0.1901 and the standard deviation is 0.1516.

机译：在本文中，我们介绍了2012年文本挖掘挑战（DEFT）活动。该版本通过两个途径处理科学文章关键词的自动索引。第一种向参与者提供要索引的文档中使用的关键字的术语，而第二种则不提供此术语，从而使任务更加复杂。语料库由在人文期刊上发表的科学文章组成，并由其作者进行索引。此索引可作为评估的参考。根据对每个关键词进行词素化后的查全率，精确度和F测度的微观度量来评估结果。在提供所用关键字术语的路径中，平均F量度为0.3575，中位数为0.3321，标准差为0.2985；在第二种情况下，在没有术语的情况下，平均F度量为0.2055，中位数为0.1901，标准偏差为0.1516。％。本文介绍了2012年版DEFT文本挖掘挑战。该版本通过两个途径解决了对科学论文进行基于关键字的自动索引的问题。第一种向参与者提供用于为文档建立索引的关键字的术语，而第二种则不提供此术语。语料库由在人文期刊上发表的科学论文组成，并由其作者索引。该索引被用作评估的参考。结果已根据关键字词形还原后计算的查全率，准确性和F度量的微观度量进行了评估。在给出所用关键字术语的轨迹中，平均F量度为0.3575，中位数为0.3321，标准差为0.2985；在第二个轨道中，平均F度量为0.2055，中位数为0.1901，标准偏差为0.1516。

著录项

来源
《DEFT 2012 Workshop: Text Mining Challenge》|2012年|1-13|共13页
会议地点 Grenoble(FR)
作者
Patrick Paroubek; Pierre Zweigenbaum; Dominic Forest; Cyril Grouin;
展开▼
作者单位

LIMSI-CNRS, Rue John von Neumann, 91403 Orsay, France;

LIMSI-CNRS, Rue John von Neumann, 91403 Orsay, France;

EBSI, Université de Montréal, C.R 6128, succursale Centre-ville, Montréal H3C 3J7, Canada;

LIMSI-CNRS, Rue John von Neumann, 91403 Orsay, France;

展开▼
会议组织
原文格式 PDF
正文语种 fre
中图分类
关键词
Campagne d'évaluation; fouille de textes; indexation libre; indexation contrôlée; mots-clés; thésaurusEvaluation campaign; Text-Mining; Free Indexing; Controlled Indexing; Keywords; Thesaurus;

机译：评估活动；文本挖掘；免费索引控制索引；关键字；词库％评估活动；文本挖掘；免费索引；受控索引关键字；词库;

相似文献

外文文献
中文文献
专利

1. How present ART' results: Questions' list to French ART professionals and application on Amiens' ART results [Comment présenter les résultats des centres d'AMP : Enquête auprès des professionnels des centres fran?ais et application aux résultats du centre d'AMP du CHU d'Amiens] [J] . Cabry-GoubetR., BoulardV., LourdelE., Gynecologie, obstetrique & fertilit . 2012,第1期

机译：如何向法国ART专业人士展示ART的“结果：问题”列表以及在亚眠的ART结果中的应用亚眠大学医院]
2. L'histoire d'Ike Antkare et de ses amis: Fouille de textes et systèmes d'information scientifique [J] . Cyril Labbé Document Numerique . 2016,第1期

机译：艾克·安特卡雷（Ike Antkare）和她的朋友们的故事：文本挖掘和科学信息系统
3. Renaissance de la Philosophie. Quatre articles, Carl Stumpf Choix de textes, traduction et présentation par Denis Fisette Paris, Vrin (coll. «Bibliothèque des textes philosophiques»), 2006, 333 p. doi:10.1017/S0012217309090118 [J] . Federico Boccaccini Dialogue: Canadian Philosophical Review/Revue canadienne de philosophie . 2009,第1期

机译：哲学复兴。四篇文章，卡尔·斯坦普夫的《文本选择，翻译和演讲》，丹尼斯·菲舍特·巴黎，弗林（合集：“哲学文本图书馆”），2006年，共333页。 doi：10.1017 / S0012217309090118
4. Indexation libre et contr?lée d'articles scientifiques Présentation et résultats du défi fouille de textes DEFT2012 [C] . Patrick Paroubek, Pierre Zweigenbaum, Dominic Forest, DEFT Workshop: Text Mining Challenge . 2012

机译：自由指标和控制科学文章的陈述和结果挑战文本诈骗2012
5. Évaluation des connaissances procédurales dans les réponses en texte libre par une approche hybride employant ontologies et réseaux sémantiques [D] . Snow, Eric 2015

机译：使用本体和语义网络的混合方法评估自由文本响应中的过程知识
6. Le sérodiagnostic de la toxoplasmose: etude comparative multicentrique dune gamme étalon par les différents tests actuels et avec expression des résultats en unités internationales. Groupe de travail toxoplasmose du Contrôle national de qualité en parasitologie Syndicat des fabricants de réactifs de laboratoire Groupe de travail standardisation des tests sérologiques du Réseau européen de lutte contre la toxoplasmose congénitale. [O] . J. C. Petithory, P. Ambroise-Thomas, J. De Loye, 1996

机译：弓形虫病血清学诊断：通过各种当前试验并以国际单位表示的结果对标准范围的多中心比较研究。国家寄生虫病质量控制弓形虫病工作组实验室试剂制造商联盟欧洲网络针对先天性弓形虫病的血清学检测标准化工作组。
7. L'Avenir du contrôle par les pairs dans la publication scientifique face aux défis du libre accès [O] . Samir Hachani 2018

机译：对同行控制在科学出版物的未来面对自由访问的挑战

Indexation libre et contrôlée d'articles scientifiques Présentation et résultats du défi fouille de textes DEFT2012

摘要

著录项

相似文献

相关主题

期刊订阅