首页> 中国专利> 声学深度学习模型训练方法、语音生成方法及设备

声学深度学习模型训练方法、语音生成方法及设备

页面导航

摘要
著录项
法律信息
相似文献

摘要

本申请提供一种声学深度学习模型训练方法、语音生成方法及设备，所述语音生成方法包括：获取文本数据和语种信息；根据所述语种信息将所述文本数据转换为音素，并为每个所述音素分别添加语种标签；利用深度学习模型生成音频数据，所述深度学习模型包括音频生成模块、文本特征提取模块、流映射模块和时长预测模块，其中所述文本特征提取模块用于对所述音素提取文本特征值，所述时长预测模块用于根据所述文本特征提取模块提取的文本特征生成时长信息，所述流映射模块用于根据所述文本特征值和所述时长信息计算潜在变量，并根据所述潜在变量生成频谱特征数据，所述音频生成模块根据所述频谱特征数据生成音频数据。

著录项

公开/公告号CN113763924A

专利类型发明专利
公开/公告日2021-12-07

原文格式PDF
申请/专利权人北京优幕科技有限责任公司;
展开▼

申请/专利号CN202111310778.9
发明设计人陈栋;
展开▼

申请日2021-11-08
分类号G10L15/00(20130101);G10L15/02(20060101);G10L15/06(20130101);G10L15/16(20060101);G10L15/26(20060101);G10L13/027(20130101);
代理机构11900 北京力致专利代理事务所(特殊普通合伙);
代理人陈博旸
地址 100190 北京市海淀区中关村大街18号8层05-609
入库时间 2023-06-19 13:37:05

法律信息

法律状态公告日

法律状态信息

法律状态
2022-02-15

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 声学深度学习模型训练方法、语音生成方法及设备 [P] . 中国专利： CN113763924B . 2022.02.15
2. 声学深度学习模型训练方法、语音生成方法及设备 [P] . 中国专利： CN113763924A . 2021-12-07
3. ACOUSTIC MODEL TRAINING METHOD, SPEECH RECOGNITION METHOD, ACOUSTIC MODEL TRAINING APPARATUS, SPEECH RECOGNITION APPARATUS, ACOUSTIC MODEL TRAINING PROGRAM, AND SPEECH RECOGNITION PROGRAM [P] . US2021193161A1 . 2021-06-24

机译：声学模型训练方法，语音识别方法，声学模型训练装置，语音识别装置，声学模型训练节目和语音识别程序
4. APPARATUS AND METHOD FOR GENERATING MEDICAL IMAGE SEGMENTATION DEEP-LEARNING MODEL, AND MEDICAL IMAGE SEGMENTATION DEEP-LEARNING MODEL GENERATED THEREFROM [P] . 美国专利： US2020184274A1 . 2020-06-11

机译：生成医学图像分段深度学习模型的装置和方法，以及所生成的医学图像分段深度学习模型
5. IMAGE GENERATING DEVICE, IMAGE GENERATING METHOD, RECORDING MEDIUM GENERATING METHOD, LEARNING MODEL GENERATING DEVICE, LEARNING MODEL GENERATING METHOD, LEARNING MODEL, DATA PROCESSING DEVICE, DATA PROCESSING METHOD, INFERRING METHOD, ELECTRONIC INSTRUMENT, GENERATING METHOD, PROGRAM, AND NON-TRANSITORY COMPUTER-READABLE MEDIUM [P] . WO2021177324A1 . 2021-09-10

机译：图像生成设备，图像生成方法，记录介质生成方法，学习模型生成设备，学习模型生成方法，学习模型，数据处理设备，数据处理方法，推断方法，电子仪器，生成方法，程序和非暂时性计算机 - 可怕的媒介