首页> 中国专利> 一种非平行语料语音个性化转换方法

一种非平行语料语音个性化转换方法

摘要

本发明公开了一种非平行语料语音个性化转换方法,包括以下步骤:根据文本采集目标语音;将目标语音的中文音素对齐,得到每个中文音素对应的音频;提取中文音素对应的音频特征和音素信息;训练HMM‑GMM语音识别模型,并将提取的音频特征和音素信息输入到HMM‑GMM语音识别模型中,得到目标语音音频特征与对应的中文音素之间的印射模型,用于对中文音素进行预测并训练第一CHBG网络;再通过对其训练DNN语言模型得到目标语音的PULSE;通过训练第二CHBG网络得到原语音的中文音素对应的PULSE与目标语音的中文音素对应的PULSE的对应模型;将DNN语言模型和CHBG网络串联即可将原语音转换为目标语音。本发明解决了目前的声音个性化算法需要先找到平行语音数据,训练时间较长的问题。

著录项

  • 公开/公告号CN109377986B

    专利类型发明专利

  • 公开/公告日2022-02-01

    原文格式PDF

  • 申请/专利权人 四川长虹电器股份有限公司;

    申请/专利号CN201811443776.5

  • 发明设计人 周琳岷;

    申请日2018-11-29

  • 分类号G10L15/14(20060101);G10L15/16(20060101);G10L21/003(20130101);G10L25/30(20130101);

  • 代理机构51213 四川省成都市天策商标专利事务所(有限合伙);

  • 代理人郭会

  • 地址 621000 四川省绵阳市高新区绵兴东路35号

  • 入库时间 2022-08-23 13:04:15

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号