首页> 中文学位 >情感语音合成中的声源以及基频抖动的分析与建模
【6h】

情感语音合成中的声源以及基频抖动的分析与建模

代理获取

目录

文摘

英文文摘

独创性声明及学位论文版权使用授权书

第一章 绪论

1.1语音合成发展和现状

1.1.1语音合成的早期研究-机械式、电子式语音合成器

1.1.2语音合成的中期研究-参数合成器

1.1.3共振峰合成

1.1.4 LPC参数合成

1.1.5语音合成的近期研究-基于大规模语料库的语音合成器

1.2语音合成的新热点

1.2.1高自然度语音合成

1.2.2情感语音合成

1.2.3个性化语音合成

1.2.4嵌入式语音合成

1.3本文的研究背景和目的

1.3.1声源类型(Voice Quality)的研究

1.3.2基频抖动的研究

1.4论文结构

第二章情感语音合成的基本概念

2.1情感语音合成是情感计算的一个重要组成部分

2.2基本情感分类

2.3情感的外在表现

2.4语音中的情感信息

2.5声源类型在情感语音合成中的作用

2.6基频抖动在情感语音合成中的作用

第三章发音生理以及声源的分类

3.1发音器官之生理与解剖

3.1.1呼吸系统

3.1.2发声系统

3.1.3发音系统

3.1.4听觉系统

3.2言语链以及言语产生的过程

3.3声源的生理特征和作用

3.3.1声源类别在某些语言里有区分意义的功能

3.3.2声源类别是副语言层信息的载体

3.3.3声源类别是超语言层信息的载体

3.4声源类型的分类

3.4.1Modal voice

3.4.2Creaky voice

3.4.3Breathy voice

3.4.4Harsh voice

3.4.5Falsetto voice

3.4.6Whisper voice

3.4.7Lax Creaky

第四章分析声源的方法及工具

4.1语音信号的数字模型

4.1.1声源激励模型

4.1.2声道传输模型

4.1.3口鼻辐射模型

4.2声源计算方法

4.2.1基于LPC的方法

4.2.2基于滤波器组的方法

4.2.3基于IAIF的方法

4.2.4上述几种逆滤波算法的比较

第五章声源的建模

5.1 LF模型

5.2 LF模型的参数的获取

第六章话语中的jitter分析

6.1 基频抖动jitter的概念以及分类

6.2统计jitter的方法

6.3jitter的建模

第七章实验与分析

7.1用LF模型对不同声源逆滤波建模

7.2各种声源的jitter分析

7.3各种情感的jitter分析

7.4汉语的四个声调的jitter分析

7.5在语音合成器中的应用

第八章总结与展望

8.1全文总结

8.2前景展望

参考文献

发表论文和科研情况说明

致谢

展开▼

摘要

目前先进水平的语音合成系统都可以合成出可懂度相当高的语音.但是这些系统生成的语音的自然度与人讲的话之间还有明显的差距,这个差距妨碍着语音合成技术大规模进入市场.此外情感语音合成也要求研究者们重新审视已有的模型并提出新的更能反映出情感变化的高自然度语音合成模型来.影响合成语音自然度的因素有很多,大概分为三类:音质类,韵律类和清晰度类.改善这几类参数的模型,是提高合成出语音自然度的关键. 本文对情感语音合成中的声源类型和基频抖动两个方面进行了分析本文的工作主要包括以下的三个部分: 1.介绍了情感语音合成的基本概念,并在生理和感知的层面上分析了声源类型,并在声源逆滤波方法的基础上比较了各种声源的参数,并用LF模型对各种声源建模,得到各种声源的LF模型参数. 2.提出了一种分离和计算基频抖动的方法,将基频抖动中的随机因素和非随机性因素分离开来. 3.分析了基频抖动在在各种情感、各种声源以及在汉语普通话中各声调中的作用,并比较了基频抖动在上述分类中的大小,得到的结果能够初步估计出基频抖动的原因.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号