首页> 中文学位 >基于特征提取多模式结合的语音情感识别的研究
【6h】

基于特征提取多模式结合的语音情感识别的研究

代理获取

目录

声明

摘要

插图索引

第一章 绪论

1.1 课题意义及研究背景

1.2 国内外研究现状

1.2.1 特征提取方面

1.2.2 语音情感识别模型

1.3 课题的研究内容与章节安排

1.3.1 研究内容

1.3.2 论文结构安排

1.4 本章小结

第二章 语音情感特征分析与处理

2.1 情感分类

2.2 情感语音数据库的建立

2.3 语音信号的特点与模型

2.4 语音信号的预处理

2.4.1 预加重

2.4.2 加窗分帧

2.4.3 端点检测

2.5 本章小结

第三章 传统特征参数的分析与提取

3.1 短时过零率

3.2 短时能量

3.3 共振峰特征提取

3.4 Mel倒谱系数(MFCC)特征的提取

3.5 本章小结

第四章 改进的特征参数的分析与提取

4.1 传统的基音频率检测算法

4.1.1 自相关检测算法(ACF)的原理

4.1.2 平均幅度差函数检测算法(AMDF)的原理

4.2 改进的基音频率检测算法

4.2.1 经验模式分解算法

4.2.2 基于EMD的基音频率提取

4.2.3 不同算法对基频提取的实验结果比较

4.3 多重分形谱与广义hurst指数特征提取

4.3.1 多重分形的过程

4.3.2 多重分形消除趋势波动分析法(MF-DFA)

4.4 本章小结

第五章 基于GMM-SVM的混合模型的语音情感识别

5.1 高斯混合模型

5.2 支持向量机

5.3 GMM-SVM混合模型

5.4 本章小结

结论与展望

参考文献

致谢

附录A 攻读学位期间所发表的学术论文目录

展开▼

摘要

随着社会科技的发展,计算机的应用在生活中越来越普遍,智能化的人机交互越来越成为研究热点,人类越来越渴望与计算机进行更加人性化的和谐的交互。语音是人类最自然的交流方式,其中不仅包含了语义信息,更包含了大量的情感信息,能准确地识别情感的人机交互即为智能化的人机交互之一。因此对语音情感信息的识别成为更智能化的人机交互的研究关键。在目前的语音情感识别研究中,情感特征提取和情感识别的方法多种多样,研究使用的情感语音数据库也没有统一的标准,这些不同导致最后的识别结果也各不相同。
  本文首先分析了对语音中情感信息的识别的意义,了解了大量的相关知识。其次为实验录制了汉语情感语音库。选取本身不带有情感信息的20句语句文本,分别用高兴、愤怒、惊奇、悲伤、害怕、和平静6种不同的情感去朗读,录制并选取其中情感表达较好的情感语音构成情感语音数据库。然后观察并分析不同情感状态下,提取语音信号的基频、短时能量、短时过零率、共振峰、多重分形等26维的特征参数,分析比较他们的变化规律;针对传统的短时平均幅度差函数(AM-DF)法由于出现均值下降趋势,谷点并非全局最低谷点从而导致了基音周期提取中的倍频和半频的错误出现的情况,以及提取不精确等问题,提出一种改进算法。最后,在对现有语音情感识别领域常用算法进行分析的基础上,本文选取高斯混合模型(GMM)与支持向量机模型(SVM)相结合作为识别算法,将特征参数通过高斯混合模型进行概率分布统计,并将这些概率分布作为特征向量采用支持向量机模型对其进行分类判别,最终获得了比较满意的识别结果。
  论文针对语音情感识别的问题,在特征提取方面,提出了改进的基频特征提取算法,并且引入了多重分形特征参数进行描述;在模式识别方面,设计了GMM-SVM混合模型进行仿真识别,最终得到了较好的实验结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号