首页> 中文学位 >语音情感识别中的分层特征与序贯识别
【6h】

语音情感识别中的分层特征与序贯识别

代理获取

目录

摘要

图表索引

第1章 绪论

1.1 语音情感识别的研究背景

1.2 语音情感识别的应用前景

1.3 语音情感识别国内外研究现状

1.4 语音情感识别面临的难题

1.5 论文的结构安排

第2章 情感的定义、分类以及情感语料库的建立

2.1 情感的定义、分类

2.1.1 离散情感范畴

2.1.2 连续情感范畴

2.2 情感语料库的建立

2.2.1 柏林情感数据库简介

2.2.2 剪辑法

2.3 本章小结

第3章 语音信号预处理及语音情感特征参数的提取

3.1 语音信号预处理

3.1.1 预加重处理

3.1.2 分帧加窗

3.1.3 端点检测

3.1.4 基于短时能量和短时过零率的双门限端点检测算法

3.2 语音情感特征参数提取

3.2.1 短时能量特征参数

3.2.2 语速

3.2.3 基音频率

3.2.4 共振峰

3.2.5 MFCCs

3.2.6 小波分形维

3.3 本章小结

第4章 情感识别模型及基于类对的特征选取

4.1 SVM模型简介

4.1.1 支持向量机理论基础

4.1.2 支持向量机的多类分类

4.2 GMM模型简介

4.2.1 高斯混合模型的基本概念

4.2.2 高斯混合模型参数估计算法—EM算法

4.2.3 高斯混合模型的识别问题

4.3 仿真实验

4.3.1 语音情感识别实验的流程

4.3.2 基于Fisher准则的特征选择

4.3.3 基于全局性特征的语音情感识别实验

4.3.4 基于时序性特征的语音情感识别实验

4.4 本章小结

第5章 语音情感中的分层特征及序贯识别

5.1 第一层特征参数的选取

5.2 第二层特征参数的选取

5.3 基于序贯分类器识别方法的分层语音情感识别实验

5.4 本章小结

第6章 总结展望

参考文献

攻读硕士期间发表的学术论文

致谢

声明

展开▼

摘要

语音情感识别技术具有广泛的应用前景,因此语音情感的识别研究具有重要的意义。本文以生气、高兴、中性、悲伤四种情感状态为例,对情感特征的提取、选择以及识别方法进行研究,主要工作概括为以下几个方面:
  (1)针对基音频率特征参数提取过程中的传统中值平滑算法的不足,提出了一种改进的中值滤波平滑算法。实验结果表明,改进的中值滤波平滑算法比传统的中值滤波平滑算法能更有效地去除“野点”,可在一定程度上抑制噪声对邻域的影响,使基频轨迹与真实的轨迹更接近,达到理想的平滑效果。
  (2)结合小波分析理论和分形维理论,提取了一种新的特征—小波分形维特征,突破了传统语音情感特征的局限性。使用GMM模型对时序性的小波分形特征进行建模,实验结果表明,小波分形的时序性特征对中性、悲伤两种情感具有较强的区分能力,可作为一种新的情感特征用于语音情感识别领域。
  (3)不同的情感特征、识别方法对识别率的高低产生很大的影响。本文依次采用SVM、GMM分别针对全局性的情感特征、时序性的情感特征进行建模和识别,寻找区分各个情感类对的有效的情感特征。
  (4)从情感维度理论出发,针对不同的两种基本情感状态适当组合与比对,采用不同的语音情感特征,对四种基本情感进行分层识别。四种基本情感状态的识别过程分两步进行:第一步利用一到两个分类器区分出(生气、高兴)情感组合与(中性、悲伤)情感组合两大类组合情感;第二步再针对生气与高兴基本情感、中性与悲伤基本情感分别提取不同特征和采用不同的分类器进行区分识别。这种序贯分类器识别方法有效降低了高激活维度情感与低激活维度情感之间的误识率,提高了四类情感总体的识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号