首页> 中国专利> 基于单说话人语音合成数据集的声音克隆方法及装置

基于单说话人语音合成数据集的声音克隆方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于单说话人语音合成数据集的声音克隆方法、装置、电子设备和计算机存储介质，涉及声音克隆技术领域，该方法包括以下步骤：基于单说话人语音合成数据集，训练单说话人语音合成模型；基于多说话人语音数据集训练声纹模型；多说话人语音数据集通过训练完成的声纹模型计算，得到声纹特征数据集，并基于声纹特征数据集训练声音转换模型；目标文本和目标说话人语音通过训练完成的单说话人语音合成模型、声纹模型、声音转换模型计算，得到目标说话人文本语音。该方法只需一套单说话人的语音合成数据集，实现对目标说话人声音的克隆，对语音合成数据的处理简单方便，无需收集处理大量说话人的语音合成数据，极大地减少各种成本。

著录项

公开/公告号CN111048064B

专利类型发明专利
公开/公告日2020-07-07

原文格式PDF
申请/专利权人同盾控股有限公司;
展开▼

申请/专利号CN202010172979.6
发明设计人房树明;朱鹏程;燕鹏举;王洪涛;顾王一;毕成;
展开▼

申请日2020-03-13
分类号G10L13/02(20130101);G10L13/08(20130101);G10L15/06(20130101);G10L15/16(20060101);G10L17/02(20130101);G10L17/04(20130101);G10L17/18(20130101);G10L19/16(20130101);
代理机构33324 杭州创智卓英知识产权代理事务所(普通合伙);
代理人张迪
地址 311121 浙江省杭州市余杭区五常街道文一西路998号18幢704室
入库时间 2022-08-23 11:04:42

法律信息

法律状态公告日

法律状态信息

法律状态
2020-07-07

授权

授权
2020-05-15

实质审查的生效 IPC(主分类):G10L13/02 申请日:20200313

实质审查的生效
2020-04-21

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于单说话人语音合成数据集的声音克隆方法及装置 [P] . 中国专利： CN111048064B . 2020.07.07
2. 基于单说话人语音合成数据集的声音克隆方法及装置 [P] . 中国专利： CN111048064A . 2020-04-21
3. DEVICE FOR SELECTING SENTENCE FOR VOICE SYNTHESIS TRAINING TO BUILD VOICE SYNTHESIZER BASED ON VOICE OF INDIVIDUAL SPEAKER AND OPERATION METHOD THEREOF [P] . 韩国专利： KR102087301B1 . 2020-03-10

机译：基于个人说话人语音的语音合成训练句子选择装置及其操作方法
4. Speaker Identification Method Converged with Text Dependant Speaker Recognition and Text Independant Speaker Recognition in Artificial Intelligence Secretary Service and Voice Recognition Device Used Therein [P] . 韩国专利： KR101993827B1 . 2019-06-27

机译：融合了人工智能秘书服务中基于文本的说话人识别和基于文本的说话人识别的说话人识别方法及其中使用的语音识别装置
5. SPEAKER VERIFICATION APPARATUS AND METHOD UTILIZING VOICE INFORMATION OF A REGISTERED SPEAKER WITH EXTRACTED FEATURE PARAMETER AND CALCULATED VERIFICATION DISTANCE TO DETERMINE A MATCH OF AN INPUT VOICE WITH THAT OF A REGISTERED SPEAKER [P] . 美国专利： US6879968B1 . 2005-04-12

机译：说话人验证装置和方法，利用具有特征特征和计算的验证距离的注册说话人的语音信息来确定输入声音是否与注册说话人匹配