Malgré sa présence grandissante dans les applications de la vie quofidienne, la reconnaissance robuste de la parole reste un défi à relever lorsqu'il s'agit de l'appliquer à partir de systèmes aux ressources limitées, même pour un vocabulaire très simple (recomiaissance de chiffres connectés à travers un canal téléphonique). Plutôt que d'utiliser une approche traditionnelle fondée sur les modèles de Markov cachés, qui nécessite un calcul intensif, et qui ne fonctionne d'ailleurs pas toujours bien dans des conditions acoustiques défavorables, la méthode présentée dans ce document se base sur un modèle de construction globale, identique pour l'ensemble des chiffres du vocabulaire, pour réduire la complexité de la tâche de reconnaissance tout en maintenant un bon niveau d'efficacité. Après une phase de segmentation découpant le signal en une succession d'unités acoustiquement homogènes, un processus de reconstmction se charge d'insérer ces segments dans le modèle global, en se fondant sur certaines contraintes et propriétés propres au vocabulaire concerné, pour ariver à déterminer au final le candidat le plus susceptible de correspondre au mot inconnu. La reconnaissance de chiffres aussi bien isolés que connectés est alors peraiise avec un taux de réussite satisfaisant, au moyen d'une quantité de calculs très réduite, tout comme l'espace mémoire requis.
展开▼