首页> 外国专利> Brief description of the voice recognition in visual monitoring of local deformations of a set of points of interest of the mouth of the speaker.

Brief description of the voice recognition in visual monitoring of local deformations of a set of points of interest of the mouth of the speaker.

机译:在视觉监视说话者口中一组感兴趣点的局部变形的语音识别中的简要说明。

摘要

This method comprises steps of: a) for each point of interest of each image, the calculation of a local descriptor gradient and of a local descriptor movement; b) construction of the microstructures of n points of interest, each defined by a tuple of the order of order n ≧ 1; c) is determined for each tuple of a vector of visual characteristics structured (d0.. d3...) from the local descriptors; d) for each tuple, map - page of this vector by a classification algorithm selecting a codeword single from among a set of codewords forming a code - book (cb); e) the generation of a temporal series the ordinate of the codewords (a0.. a3...) for the successive images of the video sequence; and f) extent, by means of a function of the string kernel, the similarity of the temporal series of codewords with a temporal series of code - words from another speaker.
机译:该方法包括以下步骤:a)对于每个图像的每个兴趣点,计算局部描述符梯度和局部描述符运动;以及b)构造n个关注点的微结构,每个关注点由n≥1的数量级的元组定义; c)为每个元组确定一个从局部描述符构造的视觉特征向量(d0..d3 ...); d)对于每个元组,通过分类算法从构成代码书的一组代码字中选择一个单个代码字映射到该向量的页面。 e)生成视频序列的连续图像的码字(a0..a3 ...)的纵坐标的时间序列; f)通过字符串内核的功能在一定程度上扩展代码字的时间序列与代码的时间序列(来自另一个说话者的单词)的相似性。

著录项

  • 公开/公告号FR3005776B1

    专利类型

  • 公开/公告日2015-05-22

    原文格式PDF

  • 申请/专利权人 PARROT;

    申请/专利号FR20130054335

  • 发明设计人 ERIC BENHAIM;HICHEM SAHBI;

    申请日2013-05-15

  • 分类号G10L15/25;G06T7/20;

  • 国家 FR

  • 入库时间 2022-08-21 14:54:22

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号