首页> 外国专利> VOICE ACTIVITY DETECTION USING AUDIO AND VISUAL ANALYSIS

VOICE ACTIVITY DETECTION USING AUDIO AND VISUAL ANALYSIS

机译:语音活动使用音频和视觉分析检测

摘要

A method of detecting voice activity includes performing a video analysis on a frame of video signal to determine a position of a user in the frame and to identify one or more beams of a corresponding audio signal associated with a region including the position of the user. The identified one or more beams of audio signal are analyzed to determine whether voice is present in the frame. When a user is not identified during the video analysis of the frame of video signal, audio analysis is not performed on the corresponding frame of audio signal.
机译:检测语音活动的方法包括对视频信号帧执行视频分析,以确定帧中的用户的位置,并识别与包括用户位置的区域相关联的相应音频信号的一个或多个波束。分析所识别的一个或多个音频信号以确定帧中是否存在语音。当在视频信号帧的视频分析期间未识别用户时,在相应的音频信号帧上不执行音频分析。

著录项

  • 公开/公告号US2021110830A1

    专利类型

  • 公开/公告日2021-04-15

    原文格式PDF

  • 申请/专利权人 FACEBOOK INC.;

    申请/专利号US201916601482

  • 发明设计人 JUN YANG;JOSHUA BINGHAM;

    申请日2019-10-14

  • 分类号G10L15/24;G06T7/70;G06T7;H04R1/40;H04R3;G10L15/22;G10L25/78;G06K9;

  • 国家 US

  • 入库时间 2024-06-14 21:25:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号