首页> 中文学位 >基于可训练文语转换系统的韵律模型优化
【6h】

基于可训练文语转换系统的韵律模型优化

代理获取

目录

文摘

英文文摘

声明

第一章 引言

1.1 语音合成概述

1.1.1 TTS系统架构

1.2 语音合成历史

1.3 语音合成技术

1.3.1 发音参数合成

1.3.2 波形拼接合成

1.3.3 共振峰合成

1.3.4 可训练的语音合成

1.4 语音合成评估方法

1.5 语音合成存在的挑战

1.5.1 文本规整化

1.5.2 文本到音素的转换

1.5.3 语音评估问题

1.6 本文的研究目标和内容

1.7 论文内容安排

第二章 基于隐马尔可夫模型的语音合成

2.1 隐马尔可夫模型简介

2.1.1 马尔科夫链

2.1.2 隐马尔可夫模型

2.2 HMM在语音信号处理中的应用

2.2.1 HMM用于语音信号建模

2.3 基于HMM的语音合成

2.3.1 模型训练

2.3.2 后端合成

2.4 基于决策树的聚类

2.5 本章小结

第三章 基频建模

3.1 基于MSD-HMM的基频建模

3.1.1 多空间概率分布HMM模型

3.1.2 基于MSD-HMM的基频建模

3.2 结合动态特性的参数生成算法

3.3 本章小结

第四章 时长模型改进

4.1 改进前的时长模型

4.2 时长分析

4.3 改进后的时长模型

4.3.1 采用高斯分布

4.3.2 采用伽马分布

4.4 改进效果评测

4.4.1 实验环境建立

4.4.2 实验结果与分析

4.5 本章小结

第五章 基频模型优化

5.1 引言

5.1.1 存在的问题及相关研究

5.1.2 韵律结构

5.2 改进基频模型

5.2.1 参数拟合

5.2.2 改进前的基频产生算法

5.2.3 改进后的基频产生算法

5.3 实验效果

5.3.1 实验环境建立

5.3.2 实验结果与分析

5.3.3 主观评测

5.4 本章小结

第六章 总结

参考文献

致谢

个人简历

展开▼

摘要

文语转换是人机交互技术的核心技术之一。尽管当前的文语转换系统可以合成出良好可懂度和自然度的声音。但是合成声音的自然度并不是让人满意,听起来平淡且节奏感不强。本文主要研究在基于HMM的文语转换系统中韵律模型的优化。
   本文采用基于隐马尔可夫模型的文语转换技术搭建了中、英文语音合成系统。在此系统的基础上,本文针对韵律平淡和节奏感不强的问题进行了一下两方面的改进:一是改进时长模型,在产生时长的时候同时优化状态、音子和音节三层模型似然值,以弥补只考虑状态时长模型生成时长的不足;二是改进基频生成算法,传统的方法只考虑了状态级的基频模型,本文通过分析韵律的层次结构,提出了生成基频时同时优化状态、音节和音节段三层韵律模型的似然值,来提高生成基频的自然度。
   本文通过实验对这两方面的改进进行了验证,实验结果表明:通过时长模型的改进,中英文时长的均方根误差分别提高了11%和5.6%;在中英文语料库上基频算法前后基频相关系数从0.70和0.91提高到了0.75到0.92;主观评测显示经过两方面的改进自然度也有较大的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号