首页> 外文OA文献 >Lip detection for audio-visual speech recognition in-car environment
【2h】

Lip detection for audio-visual speech recognition in-car environment

机译:嘴唇检测,用于车载环境中的视听语音识别

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Acoustically, car cabins are extremely noisy and asuda consequence audio-only, in-car voice recognition systemsudperform poorly. As the visual modality is immune toudacoustic noise, using the visual lip information from theuddriver is seen as a viable strategy in circumventing thisudproblem by using audio visual automatic speech recognitionud(AVASR). However, implementing AVASR requires a system being able to accurately locate and track the driversudface and lip area in real-time. In this paper we presentudsuch an approach using the Viola-Jones algorithm. Usingudthe AVICAR [1] in-car database, we show that the Viola-udJones approach is a suitable method of locating and trackingudthe driver’s lips despite the visual variability of illumination and head pose for audio-visual speech recognition system.
机译:听觉上,车厢非常嘈杂,因此仅音频的车内语音识别系统表现不佳。由于视觉模态不受 udausic噪声的影响,因此使用 uddriver中的视觉嘴唇信息被视为通过使用视听自动语音识别 ud(AVASR)来解决 udproblem问题的可行策略。但是,实施AVASR要求系统能够实时准确地定位和跟踪驾驶员面部和嘴唇区域。在本文中,我们介绍了一种使用Viola-Jones算法的方法。使用AVICAR [1]车载数据库,我们显示,尽管视听语音识别系统的照明和头部姿势存在视觉可变性,但Viola- udJones方法是一种定位和跟踪驾驶员嘴唇的合适方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号