首页> 外国专利> SYSTEM AND METHOD FOR AUDIO-VISUAL MULTI-SPEAKER SPEECH SEPARATION WITH LOCATION-BASED SELECTION

SYSTEM AND METHOD FOR AUDIO-VISUAL MULTI-SPEAKER SPEECH SEPARATION WITH LOCATION-BASED SELECTION

机译:具有基于位置的选择的视听多扬声器语音分离系统和方法

摘要

A system and method for audio-visual multi-speaker speech separation, including: receiving audio signals captured by at least one microphone; receiving video signals captured by at least one camera; and applying audio-visual separation on the received audio signals and video signals to provide isolation of sounds from individual sources, wherein the audio-visual separation is based, in part, on angle positions of at least one speaker relative to the at least one camera.
机译:用于视听多扬声器语音分离的系统和方法,包括:接收由至少一个麦克风捕获的音频信号; 接收由至少一个相机捕获的视频信号; 并在接收的音频信号和视频信号上应用音频视觉分离,以提供来自各个源的声音的隔离,其中音频视觉分离部分地基于至少一个相对于至少一个相机的至少一个扬声器的角度位置上 。

著录项

  • 公开/公告号US2021312915A1

    专利类型

  • 公开/公告日2021-10-07

    原文格式PDF

  • 申请/专利权人 HI AUTO LTD.;

    申请/专利号US202016841142

  • 申请日2020-04-06

  • 分类号G10L15/20;G10L17/18;G10L21/0272;

  • 国家 US

  • 入库时间 2022-08-24 21:30:02

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号