首页> 中国专利> 一种基于WaveNet的骨导语音增强波形生成方法

一种基于WaveNet的骨导语音增强波形生成方法

摘要

本发明公开了一种基于WaveNet的骨导语音增强波形生成方法。该方法在基于BLSTM模型的骨导语音幅度谱增强基础上,采用WaveNet模型生成高质量语音。首先构建BLSTM模型和WaveNet模型,WaveNet模型中引入了跨采样率的上采样模块,并对两个模型分别进行训练;然后将待增强的低采样率下骨导语音幅度谱送入训练好的BLSTM模型中得到增强的幅度谱,再联合骨导语音相位信息送入训练好的WaveNet模型中,得到增强的高采样率下语音波形。本发明有效利用了骨导语音相位信息并且拥有频谱扩展功能,能够从增强的骨导语音幅度谱以及骨导语音相位信息直接生成增强的高采样率语音波形,显著提升了骨导语音的质量。

著录项

  • 公开/公告号CN110648684B

    专利类型发明专利

  • 公开/公告日2022-02-18

    原文格式PDF

  • 申请/专利权人 中国人民解放军陆军工程大学;

    申请/专利号CN201910590941.8

  • 申请日2019-07-02

  • 分类号G10L21/0232(20130101);G10L21/0332(20130101);G10L25/18(20130101);G10L25/27(20130101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人薛云燕

  • 地址 210007 江苏省南京市秦淮区后标营路88号

  • 入库时间 2022-08-23 13:08:04

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号