文摘
英文文摘
声明
第1章绪论
1.1概述
1.2语音合成方法
1.2.1物理机理语音合成
1.2.2源-滤波器语音合成
1.2.3基于波形拼接技术的语音合成
1.2.4可训练的语音合成
第2章有表现力语音研究概述
2.1情感语音的声学特征
2.1.1情感语音的韵律特征
2.1.2情感语音的频谱参数
2.1.3和上下文关系方面
2.2常见的情感语音合成方法
2.3焦点重音研究
2.3.1重音的分类
2.3.2重音强弱的划分
2.3.3重音的标注
第3章基于韵律模型的情感语音合成
3.1概述
3.2韵律层级结构
3.3韵律建模的方法
3.3.1基于先验规则的韵律生成
3.3.2基于数据驱动的韵律生成
3.3.3基于参数模型的韵律生成
3.4基于SFC模型的情感语音合成
3.4.1 SFC模型概述
3.4.2 SFC模型对情感语音的韵律分析
3.4.3 SFC模型对情感语音建模
第4章基于Trainable TTS的有表现力语音合成
4.1概述
4.2 Trainable TTS框架
4.2.1模型训练
4.2.2训练流程
4.2.3后端合成
4.3基于决策树的模型聚类
4.3.1上下文属性和问题集设计
4.3.2决策树聚类
4.4基于Trainable TTS的情感语音合成
4.4.1情感语音的上下文属性和问题集设计
4.4.2 Emotion-dependent和Emotion-independent建模
4.4.3情感评测
4.4.4情感内插
4.5基于Trainable TTS的语气语调合成
4.5.1音库的设计
4.5.2上下文属性和问题集设计
4.5.3评测结果
4.6基于Trainable TTS的焦点重音建模
4.6.1方法与流程
4.6.2相关评测
第5章结束语
参考文献
致谢
在读期间发表的学术论文和取得的研究成果