Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

Esther Nicart; Bruno Zanuttini; Bruno Grilhères; Patrick Giroux; Arnaud Saval

首页> 外文期刊>Revue d'Intelligence Artificielle >Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

【24h】

Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

机译：通过强化学习不断完善文档处理链

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Nous modélisons une chaîne de traitement de documents comme un processus de décision markovien, et nous utilisons l'apprentissage par renforcement afin de permettre à l'agent d'apprendre à construire des chaînes adaptées à la volée, et de les améliorer en continu. Nous construisons une plateforme qui nous permet de mesurer l'impact sur l'apprentissage de divers modèles, services web, algorithmes, paramètres, etc. Nous l'appliquons dans un contexte industriel, spécifiquement à une chaîne visant à extraire des événements dans des volumes massifs de documents provenant de pages web et d'autres sources ouvertes. Nous visons à réduire la charge des analystes humains, l'agent apprenant à améliorer la chaîne, guidé par leurs retours (feedback) sur les événements extraits. Pour ceci, nous explorons des types de retours différents, d'un feedback numérique requérant un important calibrage, à un feedback qualitatif, beaucoup plus intuitif et demandant peu, voire pas du tout, de calibrage. Nous menons des expériences, d'abord avec un feedback numérique, puis nous montrons qu 'un feedback qualitatif permet toujours à l'agent d'apprendre efficacement.

机译：我们将文档处理链建模为马尔可夫决策过程，并使用强化学习使代理能够学习动态构建链并不断改进它们。我们正在建立一个平台，使我们能够衡量对各种模型，Web服务，算法，参数等的学习产生的影响。我们将其应用于工业环境，特别是旨在从网页和其他开放源中的大量文档中提取事件的链。我们的目标是减轻人员分析员的负担，使他们可以根据提取的事件的反馈来改进代理商链。为此，我们正在探索不同类型的反馈，从需要显着校准的数字反馈到更加直观，几乎不需要校准的定性反馈。我们进行实验，首先使用数字反馈，然后证明定性反馈始终可以使代理有效学习。

著录项

来源
《Revue d'Intelligence Artificielle》 |2017年第6期|619-648|共30页
作者
Esther Nicart; Bruno Zanuttini; Bruno Grilhères; Patrick Giroux; Arnaud Saval;
展开▼
作者单位

Cordon Electronics DS2i 27000 Val de Reuil, France,Normandie Univ, UNICAEN, ENSICAEN;

Normandie Univ, UNICAEN, ENSICAEN;

Airbus Defence and Space Elancourt, France;

Airbus Defence and Space Elancourt, France;

Cordon Electronics DS2i 27000 Val de Reuil, France;

展开▼
收录信息
原文格式 PDF
正文语种 fre
中图分类
关键词
intelligence artificielle; apprentissage par renforcement; extraction et gestion des connaissances; interaction homme-machine; renseignement d'origine source ouverte (ROSO);

机译：人工智能;强化学习;知识提取和管理;人机交互;开源智能（ROSO）;

相似文献

外文文献
中文文献
专利

1. Méthode d'aide à la décision dans le choix d'implantation d'une chaîne de traitement des déchets par incinération avec récupération d'énergie [J] . Fournier Stéphane, Dassens Audrey, Billeaud Daniel, Dechets Sciences & Techniques Dechets Science & Techniques . 2005,第40期

机译：焚烧与能量回收建立废物处理链的选择中的决策支持方法
2. Méthode d'aide à la décision dans le choix d'implantation d'une chaîne de traitement des déchets par incinération avec récupération d'énergie [J] . Fournier Stéphane, Dassens Audrey, Billeaud Daniel, Dechets Sciences & Techniques Dechets Science & Techniques . 2005,第40期

机译：焚烧与能量回收建立废物处理链的选择中的决策支持方法
3. Traitement des fractures péri-prothétiques de type B du fémur par une plaque anatomique non verrouillée avec trous excentrés : analyse rétrospective de 43 patients avec un recul minimum de 1 an [J] . A. Lunebourg, E. Mouhsine, S. Cherix, Revue de chirurgie orthopedique et traumatologique . 2015,第3期

机译：使用带偏心孔的解锁解剖钢板治疗股骨假体周围B型骨折：回顾性分析43例患者，至少随访1年
4. OPTIMISATION DE LA CONCEPTION DE CHAUSSÉES PORTUAIRES PAR UNE APPROCHE DE TRAITEMENT PAR STABILISATION ET SOLIDIFICATION: CAS DU RÉAMÉNAGEMENT DU SECTEUR VIAU AU PORT DE MONTRÉAL [C] . Jean-Philippe Boudreault, Jean-Claude Mwamba, Éric Hardy, Transportation Association of Canada conference exhibition on transportation: past, present, future . 2014

机译：通过稳定化和固化处理方法优化港口铺装设计：以蒙特利尔港口的VIAU SECRET重新开发为例
5. Modalites et elements constitutifs d'une approche d'apprentissage continu, pour une amelioration continue de la qualite des produits et des services dans les organisations. [D] . Wondje, Calixte. 2000

机译：持续学习方法的模式和组成要素，用于不断提高组织中产品和服务的质量。
6. Maladie de Kawasaki de l’adulte : un cas d’évolution chronique et d’issue fatale avec une spondylarthropathie sensible au traitement par immunoglobulines intraveineuses [O] . Elise Soltner, Antoine Neel, Mourad Tiab, -1

机译：成人川崎病：对静脉内免疫球蛋白治疗敏感的脊椎关节病的慢性和致命性结局
7. Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement [O] . Nicart Esther, Zanuttini Bruno, Grilhères Bruno, 2015

机译：通过强化学习不断完善文档处理链

Amélioration continue d'une chaîne de traitement de documents avec l'apprentissage par renforcement

摘要

著录项

相似文献

相关主题

期刊订阅