首页> 外国专利> ASSOCIATING FACES WITH VOICES FOR SPEAKER DIARIZATION WITHIN VIDEOS

ASSOCIATING FACES WITH VOICES FOR SPEAKER DIARIZATION WITHIN VIDEOS

机译:在视频中将语音与说话人的声音关联起来

摘要

A computer-implemented method for speech diarization is described. The method comprises determining temporal positions of separate faces in a video using face detection and clustering. Voice features are detected in the speech sections of the video. The method further includes generating a correlation between the determined separate faces and separate voices based at least on the temporal positions of the separate faces and the separate voices in the video. This correlation is stored in a content store with the video.
机译:描述了一种用于语音区分的计算机实现的方法。该方法包括使用面部检测和聚类确定视频中单独面部的时间位置。在视频的语音部分中检测到语音功能。该方法还包括至少基于视频中的分离面部和分离语音的时间位置,在确定的分离面部和分离语音之间生成相关性。该相关性与视频一起存储在内容存储中。

著录项

  • 公开/公告号WO2018111374A1

    专利类型

  • 公开/公告日2018-06-21

    原文格式PDF

  • 申请/专利权人 GOOGLE INC.;

    申请/专利号WO2017US53727

  • 发明设计人 CHAUDHURI SOURISH;HOOVER KENNETH;

    申请日2017-09-27

  • 分类号G06F17/30;G10L17;

  • 国家 WO

  • 入库时间 2022-08-21 12:43:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号