首页> 中文学位 >基于BP神经网络的语音情感识别算法的研究
【6h】

基于BP神经网络的语音情感识别算法的研究

代理获取

目录

文摘

英文文摘

声明

第1章 绪 论

1.1语音情感识别的研究背景

1.2语音情感识别的意义和应用价值

1.3语音情感识别研究发展现状

1.4论文的主要工作和内容安排

第2章语音信号的前端处理

2.1引言

2.2语音信号的预处理

2.2.1语音信号的预加重

2.2.2语音信号的加窗

2.2.3语音信号的端点检测

2.3基音周期的估计

2.3.1基音周期估计概述

2.3.2本文采用的基音周期估计算法

2.4小结

第3章 语音情感特征参数的选择和提取

3.1情感的分类

3.2语音情感特征参数的分析和提取

3.2.1振幅和能量特征分析

3.2.2基音频率分析

3.2.3共振峰特征分析

3.3小结

第4章 基于BP神经网络的语音情感识别

4.1 BP神经网络算法及改进

4.1.1 BP神经网络的结构

4.1.2 BP神经网络的标准算法

4.1.3 BP神经网络算法的改进

4.2语音情感识别的仿真实验与分析

4.2.1语音情感数据库的选择

4.2.2语音情感识别流程

4.2.3语音情感特征参数的选择

4.2.4用于语音情感识别的BP网络的设计

4.2.5实验与分析

4.3结论

第5章 总结和展望

5.1总结

5.2展望

参考文献

致 谢

攻读硕士学位发表论文和参加科研情况

展开▼

摘要

语音是人类交流的重要手段,是相互传递信息中最方便、最基本和最直接的途径。语音信号在传达语义信息的同时,还传递着情感信息,而情感在人们的交流中起着重要的角色。因此,随着人机交互技术的快速发展,语音信号中的情感信息正越来越受到研究人员的重视,特别是在语音合成和语音识别等领域。长期以来情感智能研究只存在于心理学和认知科学等领域,但是近年来随着信息技术的高速发展和人类与计算机关系的日益密切,如何实现计算机的拟人化,能感知周围的环境、情感等内容,已成为了人机交互能力的重要标志和目标。情感智能和计算机技术的结合使之产生了情感识别这一崭新的研究课题。语音信号的情感识别也可以看作是模式识别的问题,研究者通常会提取很多语音特征作为情感特征,将提取的语音特征输入到分类器进行情感识别。 论文重点研究了基于BP神经网络的语音情感识别。主要研究内容如下: (1)语音信号的前端处理。对情感语句进行了有效的预加重、加窗和端点检测处理,研究了短时过零率和短时能量的提取方法,比较和分析了基音周期的估计算法,通过研究前人提出的方法改进了基音周期估计算法。 (2)语音情感特征参数的分析和提取。对大量的情感语句的特征变化规律进行了统计分析,研究了与情感相关的特征信息,确定了用于语音情感识别的16个特征值,并组成了16维特征向量,包括:第一共振峰、第二共振峰、第三共振峰的最大值、最小值和平均值;平均短时过零率的最大值;基音频率的均值,最大值和最小值以及短时能量的最大值、最小值和平均值。 (3)由于提取的特征矢量是高维的,而且具有一定的相关性,即存在一定的冗余。因此本文对神经网络训练集中的样本作了归一化处理,然后作了主成分分析,既降低了输入的特征矢量的维数,同时也去除了冗余信息。本文还分析了BP神经网络的结构、原理和存在的缺点,在MATLAB6.5实验环境中,将两种改进的BP算法用于识别语音情感,与传统的BP算法相比,改进的BP算法无论从识别率还是收敛速度上都有了一定的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号