首页> 中国专利> 训练数据有限情形下的非平行文本语音转换方法

训练数据有限情形下的非平行文本语音转换方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种目标说话人训练数据有限情形下的多说话人对多说话人的非平行文本语音转换系统。在目标说话人训练数据有限情形下，通过对提取瓶颈特征的深度神经网络的训练过程进行干预与优化，从其他说话人特征空间自适应得到目标说话人的特征，解决了由于目标说话人不充分训练而导致特征空间分布不足的问题，完成非平行文本条件下基于瓶颈特征和变分自编码模型的多说话人对多说话人的语音转换。本发明的优势有三个方面：1）解除对平行文本的依赖，并且训练过程不需要任何对齐操作；2）可以将多个源‑目标说话人对的转换系统整合在一个转换模型中，即实现多对多转换；3）当目标说话人的训练数据有限时，可以完成非平行文本条件下的多对多转换，一定程度上实现语音转换技术从闭集走向开集，为实际的语音人机交互提供技术支撑。

著录项

公开/公告号CN109671423A

专利类型发明专利
公开/公告日2019-04-23

原文格式PDF
申请/专利权人南京邮电大学;
展开▼

申请/专利号CN201810418346.1
发明设计人李燕萍;许吉良;
展开▼

申请日2018-05-03
分类号
代理机构南京苏科专利代理有限责任公司;
代理人姚姣阳
地址 210003 江苏省南京市鼓楼区新模范马路66号
入库时间 2024-02-19 09:00:07

法律信息

法律状态公告日

法律状态信息

法律状态
2019-05-17

实质审查的生效 IPC(主分类):G10L13/08 申请日:20180503

实质审查的生效
2019-04-23

公开

公开

相似文献

专利
中文文献
外文文献

1. 训练数据有限情形下的非平行文本语音转换方法 [P] . 中国专利： CN109671423A . 2019-04-23
2. 基于自适应高斯聚类的非平行文本条件下的语音转换方法 [P] . 中国专利： CN107301859B . 2020.02.21
3. Data shredding for speech recognition acoustic model training under data retention restrictions [P] . 美国专利： US9514741B2 . 2016-12-06

机译：在数据保留限制下用于语音识别声学模型训练的数据粉碎
4. Data shredding for speech recognition language model training under data retention restrictions [P] . 美国专利： US9514740B2 . 2016-12-06

机译：在数据保留限制下进行语音识别语言模型训练的数据粉碎
5. DATA SHREDDING FOR SPEECH RECOGNITION LANGUAGE MODEL TRAINING UNDER DATA RETENTION RESTRICTIONS [P] . 美国专利： US2014278425A1 . 2014-09-18

机译：数据保留限制下语音识别语言模型训练的数据粉碎