首页> 外文会议> >Identification of sound source in machine vision sequences using audio information
【24h】

Identification of sound source in machine vision sequences using audio information

机译:使用音频信息识别机器视觉序列中的声源

获取原文

摘要

Identifying the sound source location in the acquired image for further processing is of concern in image/video processing especially when tracking objects of vibrating or sound making nature in the scene becomes necessary. On the other hand relying on the picture content to identify such objects is not an easy task especially when there are similar objects in the acquired image. In this paper, we present a technique for identifying the location of sound source using beam-forming techniques by means of an array of microphones based on the processing of audio from the source itself. Upon estimation of the location in 3-D space, a projection technique is used to accurately locate the position of sound source in 2-D image frame coordination.
机译:在图像/视频处理中,特别是在需要跟踪场景中的振动或发声性质的对象时,需要识别所获取图像中的声源位置以进行进一步处理。另一方面,依靠图片内容来识别这样的对象并不是一件容易的事,尤其是当所获取的图像中存在相似的对象时。在本文中,我们介绍了一种基于波束源技术的波束形成技术,根据来自声源本身的音频处理,使用波束形成技术来识别声源的位置的技术。在估计3-D空间中的位置后,将使用投影技术在2-D图像帧协调中准确定位声源的位置。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号