An automatic multimodal speech recognition system with audio and video information

Karpov A. A.

首页> 外文期刊>Automation and Remote Control >An automatic multimodal speech recognition system with audio and video information

【24h】

An automatic multimodal speech recognition system with audio and video information

机译：具有音频和视频信息的自动多模式语音识别系统

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

The mathematical model and software implementation of an automatic Russian speech recognition system that employs techniques of digital processing and analysis of audiovisual signals from a microphone and a video camera are presented. The description of probabilistic modeling of audiovisual speech based on coupled hidden Markov models, information fusion methods with weight coefficients for audio and video speech modalities, and parametric representation of signals is provided. Quantitative results in multimodal recognition of continuous Russian speech indicate high accuracy and reliability of the automatic system.

机译：本文介绍了自动俄语语音识别系统的数学模型和软件实现，该系统采用了数字处理技术以及对来自麦克风和摄像机的视听信号进行分析的技术。提供了基于耦合隐马尔可夫模型的视听语音概率模型的描述，具有音频和视频语音模态权重系数的信息融合方法以及信号的参数表示。多模式识别连续俄语语音的定量结果表明该自动系统具有很高的准确性和可靠性。

著录项

来源
《Automation and Remote Control》 |2014年第12期|共11页
作者
Karpov A. A.;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类远动化系统;
关键词

相似文献

外文文献
中文文献
专利

1. An automatic multimodal speech recognition system with audio and video information [J] . Karpov A. A. Automation and Remote Control . 2014,第12期

机译：具有音频和视频信息的自动多模式语音识别系统
2. Speech Acquisition and Automatic Speech Recognition for Integrated Spacesuit Audio Systems, Version Ⅱ [J] . NASA Tech Briefs . 2014,第6期

机译：集成航天服音频系统的语音采集和自动语音识别，第二版
3. Speech Acquisition and Automatic Speech Recognition for Integrated Spacesuit Audio Systems [J] . John H. Glenn NASA Tech Briefs . 2010,第11期

机译：集成航天服音频系统的语音采集和自动语音识别
4. Audio-Video Automatic Speech Recognition: An Example of Improved Performance through Multimodal Sensor Input [C] . Roland Goecke NICTA-HCSNet Multimodal User Interaction Workshop 2005(MMUI2005); 200511; Sydney(AU) . 2005

机译：音视频自动语音识别：通过多模式传感器输入提高性能的示例
5. A multimodal fusion approach for automatic postal address recognition system using Optical Character Recognition (OCR) and Automatic Speech Recognition (ASR) techniques. [D] . Singh, Amriteshwar. 2011

机译：一种使用光学字符识别（OCR）和自动语音识别（ASR）技术的自动邮政地址识别系统的多模式融合方法。
6. A systematic comparison of contemporary automatic speech recognition engines for conversational clinical speech [O] . Jodi Kodish-Wachs, Emin Agassi, Patrick Kenny III, 2018

机译：当代自动语音识别引擎用于对话式临床语音的系统比较
7. An audio-visual corpus for multimodal automatic speech recognition [O] . 2017

机译：用于多模式自动语音识别的视听语料库

An automatic multimodal speech recognition system with audio and video information

摘要

著录项

相似文献

相关主题

期刊订阅