首页> 外文OA文献 >A Soft Computing Approach for On-Line AutomaticudSpeech Recognition in Highly Non-StationaryudAcoustic Environments.
【2h】

A Soft Computing Approach for On-Line AutomaticudSpeech Recognition in Highly Non-StationaryudAcoustic Environments.

机译:在线自动 ud的软计算方法高度不稳定的语音识别 ud声学环境。

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Ce travail de recherche aborde les problèmes de la conception d'un système de reconnaissance automatique de la parole ASR (Automatic Speech Recognition) en ligne (on-line) robuste au bruit, à savoir, la reconnaissance de la parole en ligne auto-adaptable à environnement-détectable similaire au processus humain et son exécution dans les environnements acoustiques réels hautement non stationnaires. Commengant par une étude de l'état d'art des technologies ASR en différé (off-line), on présente, en premier, les approches courantes utilisées dans la littérature de I'ASR afin de formuler un système de reconnaissance continue en ligne de la parole basé sur laudtechnique HMM. Dans cette approche, on examine la technique biaisée dynamique de suppression de trame (frame dynamic bias removal technique) pour l'ASR en ligne, qui a une très bonne performance d'ASR pour de la parole propre (non corrompue par du bruit). Nous introduisons alors une nouvelle technique pour un ASR en ligne typique basé sur la technique en ligne bayésienne d'inférence. Dans ce cas-ci, nous étudions la performance de la technique de la moyenne récursive commandée par des minimum MCRA (minima controlled recursive averaging) pour le détection et la compensationudde bruit de canal simple en réalisant les essais en ligne d'ASR pour le signal de parole dans des environnements acoustiques hautement non-stationnaires et comparer alorsudleurs résultats avec la parole bruitée au discours bruyant correspondant pour I'ASR en différé. Finalement, nous présentons une architecture d'ASR en ligne basée sur une technique non-linéaire et un modèle non-gaussienne pour modéliser des scénarios acoustiques réels. Dans cette approche nous proposons la technique de l'optimisationudd'essaim de particules PSO (particle swarm optimization) pour dépister et estimer le bruit, et nous avons montré par des expériences que la technique d'optimisation PSOudaméliore la performance du système en ligne de reconnaissance de la parole de manière significative dans les environnements acoustiques hautement non-stationnaires.
机译:这项研究工作解决了设计在线(在线)鲁棒性在线自动语音识别系统(ASR)的问题,即自适应在线语音识别。可以在类似于人类过程的环境中检测到它,并在高度不稳定的真实声学环境中执行它。从研究离线ASR技术的现状开始,我们首先介绍ASR文献中使用的当前方法,以便为以下方面建立连续的在线识别系统:基于HMM udtechnique的语音。在这种方法中,我们研究了在线ASR的帧偏置偏置技术,该技术对于干净的语音(不受噪声破坏)具有非常好的ASR性能。然后,我们基于贝叶斯在线推断技术为典型的在线ASR引入新技术。在这种情况下,我们正在通过执行在线ASR测试来研究由最小控制递归平均(MCRA)控制的递归平均技术的性能,以检测和补偿单通道噪声在高度非平稳的声学环境中对语音信号进行处理,然后将其结果与带噪语音与延迟ASR的相应带噪语音进行比较。最后,我们提出一种基于非线性技术和非高斯模型的在线ASR体系结构,以对真实的声学场景进行建模。在这种方法中,我们提出了粒子群优化(PSO)技术来检测和估计噪声,并且通过实验表明,PSO优化技术可以提高系统性能。在高度不稳定的声学环境中,在线语音识别效果显着。

著录项

  • 作者

    Chowdhury Foezur Rahman;

  • 作者单位
  • 年度 2012
  • 总页数
  • 原文格式 PDF
  • 正文语种 en
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号