首页> 中国专利> 一种基于文本信息的辅助说话人分离方法及相关装置

一种基于文本信息的辅助说话人分离方法及相关装置

摘要

本申请实施例公开了一种基于文本信息的辅助说话人分离方法及相关装置,方法包括:获取待分离的第一语音信息;对待分离的第一语音信息进行第一分离处理,得到第一分离结果,第一分离处理是指对第一语音信息中的不同说话人进行初步分割和聚类;对第一分离结果进行语音处理,得到第二语音信息,语音处理包括语音识别或语音表征信息采集;将第二语音信息输入预先训练好的说话人转变点识别模型,确定第二语音信息中的说话人的转变点;根据说话人的转变点和第一分离结果得到目标分离结果。可见,本申请通过获取的第一语音信息获取文本信息,融合底层声学特征与文本信息进行说话人分离,提高说话人分离的准确性。

著录项

  • 公开/公告号CN111128223B

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利权人 科大讯飞股份有限公司;

    申请/专利号CN201911424875.3

  • 发明设计人 方昕;柳林;刘海波;方磊;

    申请日2019-12-30

  • 分类号G10L21/0272(2013.01);G10L25/03(2013.01);

  • 代理机构广州三环专利商标代理有限公司 44202;

  • 代理人熊永强

  • 地址 230088 安徽省合肥市高新开发区望江西路666号

  • 入库时间 2022-09-06 00:40:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号