首页> 中文学位 >一种改进的语音合成方法
【6h】

一种改进的语音合成方法

代理获取

目录

原创性声明及关于学位论文使用授权的声明

摘要

绪论

第二章文语转换系统概述

第三章主要语音合成技术介绍

第四章PSOLA算法的时频分步语音合成

第五章动态语音的韵律特征分析与产生模型

第六章结束语

参考文献

致谢

攻读学位期间发表的论文

展开▼

摘要

随着计算机技术和信息技术的飞速发展,人机交互方式发生了革命性的变化,应运而兴的语音合成技术是将计算机自己产生的或从外部输入的文字、符号、数字等信息转换成自然流畅的语音信号输出,这种技术又称文语转换技术(TexttoSpeech,简称TTS)。早期的TTS系统多采用参数合成方法,如共振峰合成和LPC参数合成.参数合成方法在理论上相对比较成熟,易于实现,但实际合成的连续语音总是不够清晰、自然。近几年,基于基音同步叠加(PSOLA)算法的波形编辑和拼接技术应用于语音合成。与传统的拼接合成技术不同,PSOLA算法在对语音单元进行拼接前,能根据上下文分析得到发音符号标注,对拼接单元的音高、时长和强度做出适当地调整,在不改变原始语音音段音质细节的基础上,能灵活地改变体现语音自然度的韵律特征的变化,从而可获得更高的清晰度和自然度。 本文在广泛汲取现代语音信号处理和汉语韵律知识的基础上,对语音合成方法及其实现进行了深入的研究,主要工作如下:1、结合FD-PSOLA和TD-PSOLA算法的优势,提出一种音高、时长分步处理的语音韵律拼接合成方法。根据韵律生成模型计算得到的基频参数和时长参数,分别在频域和时域对语音拼接单元进行调整,在保持语音库中语音拼接单元清晰度和自然度基本不变的情况下,使合成语音的韵律调控能力得到提高,并以汉语短语词组合成实验证明了该方法实现的有效性。2、针对汉语发音特点,基于对大量自然汉语语句基频轮廓数据的统计和分析,提出一种用于数据驱动生成汉语韵律特征的数学模型。模型以基频参数为主,辅以时长和增益参数,能表现汉语的语气、短语节奏、韵律词的声调以及轻重音多层韵律信息,各层参数可按语言知识分类训练和标注,给出模型的各种归一化'调素'函数和变调规则。实验表明,模型有效地表示了自然汉语语句韵律特征变化的规律,其控制通用、可行。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号