首页> 外文OA文献 >Indexation d'annotations vocales dans un contexte de gestion documentaire
【2h】

Indexation d'annotations vocales dans un contexte de gestion documentaire

机译:索引文档管理上下文中的语音注释

摘要

L'indexation des documents multimédia suscite actuellement un grand intérêt tant sur le plan expérimental que théorique. En particulier, la détection de mots clés dans des fichiers sonores est un secteur en pleine croissance. Cependant, malgré les progrès réalisés dans le domaine de l'indexation vocale, il reste beaucoup à faire notamment pour la recherche de mots clés dans la parole spontanée.ududLe travail qu'on présente dans ce manuscrit s'inscrit dans le cadre de l'indexation d'annotations vocales dans un contexte de gestion documentaire. Tout d'abord, on présentera quelques systèmes de recoimaissance automatique de la parole. En se basant sur des critères précis, on a identifié deux moteurs de reconnaissance automatique de la parole qui ont fait l'objet de nos expérimentations.ududEnsuite, on proposera un système de détection de mots clés dans les annotations vocales. Ce dernier sera basé sur les deux moteurs de reconnaissance automatique de la parole qu'on a choisi, à savoir le moteur de Dragon NaturallySpeaking et celui de Microsoft.ududPour tester les performances des deux systèmes, on a construit un corpus d'annotations vocales. L'évaluation des performances de transcription a été réalisée en se basant sur le taux de mot correct et le taux de précision. D'autre part, l'évaluation des performances d'indexation a été réalisée en se basant sur les courbes ROC et les taux de rappel et de précision.ududLes meilleurs résultats ont été observés avec le moteur de reconnaissance de Microsoft pour le profil sans apprentissage. Alors que pour le profil entraîné, le moteur de Dragon présente les meilleures performances. Afin d'améliorer les performances, on propose d'entraîner le modèle de langage avec un grand corpus de texte d'annotations écrites.
机译:多媒体文档的索引当前在实验和理论上都引起极大的兴趣。特别是,声音文件中关键字的检测是一个不断发展的领域。但是,尽管在语音索引领域取得了进步,但仍有许多工作要做,特别是在自发语音中搜索关键字的过程中。在文档管理上下文中为语音备忘录编制索引。首先,我们将介绍一些自动语音识别系统。基于精确的标准,我们确定了两个自动语音识别引擎,它们是我们实验的主题: Ud ud然后,我们将提出一个用于检测语音注释中的关键字的系统。后者将基于我们选择的两个自动语音识别引擎,即Dragon NaturallySpeaking引擎和Microsoft的 udd ud。为了测试这两个系统的性能,我们建立了一个语料库。语音注释。在正确的字率和准确率的基础上进行转录性能的评估。另一方面,基于ROC曲线以及查全率和查准率对索引性能进行了评估。没有学习的个人资料。对于驱动配置文件,Dragon引擎具有最佳性能。为了提高性能,我们建议使用大量书面批注文本训练语言模型。

著录项

  • 作者

    Ouali Chahid;

  • 作者单位
  • 年度 2010
  • 总页数
  • 原文格式 PDF
  • 正文语种 fr
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号