首页> 中国专利> 具有高准确度的声源定位方法、装置、语音识别方法、系统、存储设备及终端

具有高准确度的声源定位方法、装置、语音识别方法、系统、存储设备及终端

摘要

本发明公开的一种具有高准确度的声源定位方法及装置,包括:采集声音信号;判断声音信号中是否存在语音信号;提取出所有的语音信号,获取每一个语音信号所在的声源位置;将每一个语音信号一一进行声纹识别;判断识别出的声纹特征是否已存储于声纹数据库中;获取该声纹特征对应的语音信号所在的声源位置处的图像信息;利用机器自学习方法进行模型训练,确定该声纹特征对应的发声人及其身份信息,并将对应的声纹特征和发声人身份信息存储于声纹数据库中;显示该声纹特征对应的语音信号所在的声源位置信息以及对应的发声人的身份信息。本发明能够准备地定位说话人的位置、匹配说话人的身份以及说话的内容;适用于语音识别领域。

著录项

  • 公开/公告号CN110767226B

    专利类型发明专利

  • 公开/公告日2022.08.16

    原文格式PDF

  • 申请/专利权人 山西见声科技有限公司;

    申请/专利号CN201911048283.6

  • 申请日2019.10.30

  • 分类号G10L15/22(2006.01);G10L15/26(2006.01);G10L17/04(2013.01);G10L17/14(2013.01);G10L25/78(2013.01);G01S5/22(2006.01);G06V40/16(2022.01);

  • 代理机构太原九得专利代理事务所(普通合伙) 14117;

  • 代理人高璇

  • 地址 030032 山西省太原市转型综合改革示范区太原唐槐园区科技创新孵化基地4号楼8层

  • 入库时间 2022-09-26 23:16:07

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号