首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >Visual speech recognition from lip image sequences using a neocognitron-type neural net
【24h】

Visual speech recognition from lip image sequences using a neocognitron-type neural net

机译:使用Neocognitron型神经网络从唇形图像序列的视觉语音识别

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

This paper describes a neocognitron-type neural net model for discriminating image Sequences. This model is constructed by extending the architecture of our proposed Neocognitron-type Temporal Data Recognition Model. The structure, in which cells are arranged on three-dimensional arraies, allows the model to discriminate image sequences like lip movies. We apply the model to visual speech recognition from lip image sequences for one subjects saying names of train stations: 'Shinjuku', 'Ikebukuro', 'Tokyo', 'Shinagawa'. The model gives good discrimination result for each category.
机译:本文介绍了一种用于区分图像序列的新密架itron型神经网络模型。 该模型是通过扩展我们所提出的新密码型时间数据识别模型的架构来构造的。 其中小区布置在三维回程上的结构,允许模型区分唇部电影等图像序列。 我们将模型应用于从唇形图像序列的视觉语音识别,了解一个主题的一个主题,称火车站的名称:'shinjuku','ikebukuro','tokyo','shinagawa'。 该模型为每个类别提供了良好的歧视结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号