【24h】

Fouille de règles d'annotation partielles pour la reconnaissance des entités nommées

机译:挖掘部分注释规则以识别命名实体

获取原文

摘要

Ces dernières décennies, l'accroissement des volumes de données a rendu disponible une diversité toujours plus importante de types de contenus échangés (texte, image, audio, vidéo, SMS, tweet, données statistiques, spatiales, etc.). En conséquence, de nouvelles problématiques ont vu le jour, dont la recherche d'information au sein de données potentiellement bruitées. Dans cet article, nous nous penchons sur la reconnaissance d'entités nommées au sein de transcriptions (manuelles ou automatiques) d'émissions radiodiffusées et télévisuelles. À cet effet, nous mettons en œuvre une approche originale par fouille de données afin d'extraire des motifs, que nous nommons règles d'annotation. Au sein d'un modèle, ces règles réalisent l'annotation automatique de transcriptions. Dans le cadre de la campagne d'évaluation Etape, nous mettons à l'épreuve le système implémenté, mXS, étudions les règles extraites et rapportons les performances du système. Il obtient de bonnes performances, en particulier lorsque les transcriptions sont bruitées.
机译:在最近的几十年中,数据量的增加使得交换的内容类型(文本,图像,音频,视频,SMS,tweet,统计数据,空间数据等)的种类越来越多。结果,出现了新问题,包括在潜在噪声数据中搜索信息。在本文中,我们着眼于广播和电视广播的笔录(手动或自动)中对命名实体的识别。为此,我们通过数据挖掘实现一种原始方法以提取模式,我们将其称为注释规则。在模型中,这些规则执行转录的自动注释。作为Etape评估活动的一部分,我们测试已实施的系统mXS,研究提取的规则并报告系统的性能。它的性能很好,尤其是在转录嘈杂的情况下。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号