首页> 外国专利> TEXT-TO-SPEECH SYNTHESIS METHOD, DEVICE, COMPUTER APPARATUS, AND NON-VOLATILE COMPUTER READABLE STORAGE MEDIUM

TEXT-TO-SPEECH SYNTHESIS METHOD, DEVICE, COMPUTER APPARATUS, AND NON-VOLATILE COMPUTER READABLE STORAGE MEDIUM

机译：文本到语音合成方法，设备，计算机设备和非易失性计算机可读存储介质

页面导航

摘要
著录项
相似文献

摘要

A text-to-speech synthesis method, a device, and a computer apparatus. The text-to-speech synthesis method comprises: first acquiring a target text to be identified (101); performing discrete feature processing on each character in the target text to generate a corresponding feature vector for each character (102); inputting the feature vector into a pre-trained frequency spectrum conversion model, and acquiring a corresponding Mel-spectrum for each character in the target text, the Mel-spectrum being output by the frequency spectrum conversion model (103); and converting the Mel-spectrum into audio data to obtain audio data corresponding to the target text (104). Thus, speech synthesis is performed without generating phonemic notation of each character in a text so as to effectively reduce a workload during a speech synthesis process, provide an effective solution for pronunciation issues during the speech synthesis process, and achieve a wide application range in the field of artificial intelligence.

机译：文本语音合成方法，设备和计算机设备。文本到语音合成方法包括：首先获取要识别的目标文本（101）;对目标文本中的每个字符进行离散特征处理，以为每个字符生成对应的特征矢量（102）;将特征向量输入预先训练的频谱转换模型中，并为目标文本中的每个字符获取对应的梅尔谱，所述梅尔谱由频谱转换模型输出（103）;将Mel频谱转换为音频数据，得到与目标文本对应的音频数据（104）。因此，进行语音合成时不会在文本中生成每个字符的音标，从而有效地减少了语音合成过程中的工作量，为语音合成过程中的发音问题提供了有效的解决方案，并在语音合成中获得了广泛的应用范围。人工智能领域。

著录项

公开/公告号WO2020147404A1

专利类型
公开/公告日2020-07-23

原文格式PDF
申请/专利权人 PING AN TECHNOLOGY (SHENZHEN) CO. LTD.;
展开▼

申请/专利号WO2019CN117775
发明设计人 CHEN MINCHUAN;MA JUN;WANG SHAOJUN;
展开▼

申请日2019-11-13
分类号G10L13/02;
国家 WO
入库时间 2022-08-21 11:10:08

相似文献

专利
外文文献
中文文献