摘要
ABSTRACT
符号对照表
图索引
表索引
第一章 绪论
1.1 课题研究背景与意义
1.2 语音感知系统和生成系统
1.2.1 激励模型
1.2.2 声道模型
1.2.3 辐射模型
1.2.4 语音信号的数学模型
1.3 语音识别技术与语音合成技术的研究现状
1.3.1 国内外语音识别技术的现状
1.3.2 国内外语音合成技术的现状
1.4 本文的研究内容及创新点
1.5 论文的结构安排
第二章 情感语音基本理论研究
2.1 绪论
2.2 情感的分类
2.2.1 情感维度空间理论
2.2.2 离散情感理论
2.2.3 基于离散情感的情感维度空间理论
2.3 情感语音特征分析
2.3.1 短时平均过零率
2.3.2 短时平均能量
2.3.3 基音频率
2.3.4 共振峰
2.4 情感语音识别模型
2.4.1 隐马尔科夫模型(HMM)
2.4.2 人工神经网络(ANN)
2.4.3 混合高斯模型(GMM)
2.4.4 主元素分析法(PCA)
2.4.5 矢量分隔型马氏距离判别法
2.4.6 支持向量机(SVM)
2.5 情感语音合成研究
2.6 本章小结
第三章 情感语音库
3.1 引言
3.2 TYUT情感语音数据库的建立
3.2.1 情感语音数据库建立的基本原则
3.2.2 情感及情感语句的选择
3.2.3 语音的采集
3.2.4 情感语句的有效性分析
3.3 Berlin(EMO-DB)情感语音数据库
3.4 其它情感语音数据库简介
3.5 本章小结
第四章 多种语音情感识别特征对情感语音库有效性的验证
4.1 引言
4.2 基本特征简介
4.2.1 LPCC特征
4.2.2 MFCC特征
4.2.3 LPMCC特征
4.2.4 ZCPA特征
4.2.5 AUSEES特征
4.2.6 AUSEEG特征
4.3 实验过程及结果分析
4.3.1 一种语言的实验
4.3.2 混合语音数据库的实验
4.4 本章小结
第五章 基于人耳听觉特性模型的特征研究及在情感语音识别中的应用
5.1 引言
5.2 人耳的听觉模型
5.3 基于人耳听觉特性的过零峰值幅度(ZCPA)特征及其在情感语音识别中的应用
5.3.1 过零峰值幅度特征基本算法
5.3.2 过零峰值幅度特征在情感语音识别中的应用
5.4 帧优化算法对ZCPA特征的改进
5.4.1 帧优化算法基本理论
5.4.2 实验步骤
5.4.3 实验结果及分析
5.5 Teager能量算子特征及在情感语音识别中的应用
5.5.1 Teager能量算子
5.5.2 Teager能量算子在情感语音识别中的应用
5.6 基于人耳听觉特性的过零峰值最大Teager能量算子(ZCMT)特征
5.6.1 ZCMT特征原理及提取步骤
5.6.2 实验结果及分析
5.7 本章小结
第六章 声门特征补偿的人耳听觉模型特征研究及在情感语音识别中的应用
6.1 引言
6.2 声门特征的基本理论
6.2.1 语音产生的非线性模型
6.2.2 典型的声门特征及基音周期的提取
6.3 一种声门特征补偿的人耳听觉模型特征
6.3.1 声门特征对于人耳听觉模型特征的影响
6.3.2 人耳听觉补偿算法
6.3.3 声门特征补偿的人耳听觉模型特征在情感语音识别中的应用
6.3.4 实验结果及分析
6.3.5 本文所有特征在情感语音识别实验的结果比较
6.4 本章小结
第七章 基于隐马尔科夫模型的语音合成与情感语音合成
7.1 引言
7.2 基于HMM的语音合成系统
7.2.1 基于HMM的语音合成系统的基本结构
7.2.2 基于HMM的语音合成系统实验平台的搭建
7.2.3 实验结果及分析
7.3 基于HMM的情感语音合成系统的实现
7.3.1 基于HMM的情感语音合成系统的基本结构
7.3.2 实验结果及分析
7.4 本章小结
第八章 总结与展望
8.1 总结
8.2 展望
参考文献
致谢
攻读博士期间已发表的学术论文
攻读博士期间的科研工作及成果
太原理工大学;