Visual speech recognition from lip image sequences using a neocognitron-type neural net

Sei Takahashi; Rinichi Yokota; Yoshifumi Sekine; Hideo Nakamura

首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >Visual speech recognition from lip image sequences using a neocognitron-type neural net

【24h】

Visual speech recognition from lip image sequences using a neocognitron-type neural net

机译：使用Neocognitron型神经网络从唇形图像序列的视觉语音识别

获取原文

获取原文并翻译 | 示例

获取外文期刊封面目录资料

开具论文收录证明 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

This paper describes a neocognitron-type neural net model for discriminating image Sequences. This model is constructed by extending the architecture of our proposed Neocognitron-type Temporal Data Recognition Model. The structure, in which cells are arranged on three-dimensional arraies, allows the model to discriminate image sequences like lip movies. We apply the model to visual speech recognition from lip image sequences for one subjects saying names of train stations: 'Shinjuku', 'Ikebukuro', 'Tokyo', 'Shinagawa'. The model gives good discrimination result for each category.

机译：本文介绍了一种用于区分图像序列的新密架itron型神经网络模型。该模型是通过扩展我们所提出的新密码型时间数据识别模型的架构来构造的。其中小区布置在三维回程上的结构，允许模型区分唇部电影等图像序列。我们将模型应用于从唇形图像序列的视觉语音识别，了解一个主题的一个主题，称火车站的名称：'shinjuku'，'ikebukuro'，'tokyo'，'shinagawa'。该模型为每个类别提供了良好的歧视结果。

著录项

来源
《電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing》 |2001年第615期|共6页
作者
Sei Takahashi; Rinichi Yokota; Yoshifumi Sekine; Hideo Nakamura;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类人工智能理论;
关键词
Lip image sequences; Visual speech recognition; Neural net; Neocognitron; Temporal pattern;

机译：唇图像序列;视觉语音识别;神经网络;新ocognitron;时间模式;

相似文献

外文文献
中文文献
专利

1. Visual speech recognition from lip image sequences using a neocognitron-type neural net [J] . Sei Takahashi, Rinichi Yokota, Yoshifumi Sekine, 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2001,第615期

机译：使用新认知型神经网络从嘴唇图像序列进行视觉语音识别
2. Audio-Visual Speech Recognition Using Lip Information Extracted from Side-Face Images [J] . Koji Iwano, Tomoaki Yoshinaga, Satoshi Tamura, EURASIP journal on audio, speech, and music processing . 2007,第1期

机译：利用从侧面图像中提取的嘴唇信息进行视听语音识别
3. Speech recognition system based on visual features and neural network for persons with speech-impairments [J] . Zhi-yan Han, Xu Wang, Jian Wang International Journal of Modelling, Identification and Control . 2009,第3期

机译：基于视觉特征和神经网络的语音障碍者语音识别系统
4. Stream Weight Optimization of speech And LIP Image Sequence for Audio-Visual Speech Recognition [C] . Satoshi Nakamura, Hidetoshi Ito Kiyohiro Shikano 6th International conference on Spoken Language Processing ICSLP 2000 Oct. 16-Oct.20 2000 Beijing International Convention Center, Beijing, China . 2000

机译：语音流权重优化和LIP图像序列用于视听语音识别
5. Dysarthric Speech Recognition and Offline Handwriting Recognition using Deep Neural Networks. [D] . Pillai, Suhas Balkrishna. 2017

机译：使用深度神经网络的表情异常语音识别和离线手写识别。
6. Multi-resolution speech analysis for automatic speech recognition using deep neural networks: Experiments on TIMIT [O] . Doroteo T. Toledano, María Pilar Fernández-Gallego, Alicia Lozano-Diez 2012

机译：基于深度神经网络的自动语音识别的多分辨率语音分析：TIMIT实验
7. Stream Weight Optimization of Speech and Lip Image Sequence for Audio-Visual Speech Recognition [O] . Satoshi Nakamura, Hidetoshi Ito, Kiyohiro Shikano 2000

机译：语音和嘴唇图像序列的流权重优化用于视听语音识别
8. Lip Tracking for Audio-Visual Speech Recognition [R] . Kaucic, R. A. 1997

机译：用于视听语音识别的唇部跟踪

Visual speech recognition from lip image sequences using a neocognitron-type neural net

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅