首页> 中国专利> 训练数据有限情形下的非平行文本语音转换方法

训练数据有限情形下的非平行文本语音转换方法

摘要

本发明公开了一种目标说话人训练数据有限情形下的多说话人对多说话人的非平行文本语音转换系统。在目标说话人训练数据有限情形下,通过对提取瓶颈特征的深度神经网络的训练过程进行干预与优化,从其他说话人特征空间自适应得到目标说话人的特征,解决了由于目标说话人不充分训练而导致特征空间分布不足的问题,完成非平行文本条件下基于瓶颈特征和变分自编码模型的多说话人对多说话人的语音转换。本发明的优势有三个方面:1)解除对平行文本的依赖,并且训练过程不需要任何对齐操作;2)可以将多个源‑目标说话人对的转换系统整合在一个转换模型中,即实现多对多转换;3)当目标说话人的训练数据有限时,可以完成非平行文本条件下的多对多转换,一定程度上实现语音转换技术从闭集走向开集,为实际的语音人机交互提供技术支撑。

著录项

  • 公开/公告号CN109671423A

    专利类型发明专利

  • 公开/公告日2019-04-23

    原文格式PDF

  • 申请/专利权人 南京邮电大学;

    申请/专利号CN201810418346.1

  • 发明设计人 李燕萍;许吉良;

    申请日2018-05-03

  • 分类号

  • 代理机构南京苏科专利代理有限责任公司;

  • 代理人姚姣阳

  • 地址 210003 江苏省南京市鼓楼区新模范马路66号

  • 入库时间 2024-02-19 09:00:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-17

    实质审查的生效 IPC(主分类):G10L13/08 申请日:20180503

    实质审查的生效

  • 2019-04-23

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号