首页> 中文学位 >基于HMM和人工神经网络混合模型的汉语语音情感识别
【6h】

基于HMM和人工神经网络混合模型的汉语语音情感识别

代理获取

目录

摘要

1 绪论

1.1 研究背景

1.2 语音情感识别的研究现状

1.2.1 国际研究现状

1.2.2 国内研究现状

1.3 语音情感识别的应用前景

1.4 本文的研究内容与结构

1.4.1 论文的主要研究内容

1.4.2 论文的结构安排

2 语音情感理论基础

2.1 语音情感的定义

2.2 语音情感的分类

2.2.1 基本情感论和调色板情感论

2.2.2 情感维度空间论

2.3 情感语音数据库

2.3.1 建立情感语音数据库的原则

2.3.2 典型的情感语音数据库

2.3.3 本文的普通话情感语音数据库

2.4 本章小结

3 语音信号的处理

3.1 语音信号的预处理

3.2 基于GA-SVM的端点检测方法

3.2.1 端点检测的特征向量

3.2.2 SVM分类器算法

3.2.3 遗传算法优化SVM参数

3.2.4 语音端点检测步骤

3.3 语音情感特征分析

3.3.1 短时能量

3.3.2 梅尔频率倒谱系数

3.3.3 基因频率

3.3.4 共振峰

3.3.5 语音情感识别的特征向量

3.4 本章小结

4 HMM和人工神经网络混合模型的设计

4.1 隐马尔可夫模型

4.1.1 HMM的定义

4.1.2 HMM模型的基本算法

4.1.3 HMM模型的优缺点

4.2 人工神经网络

4.2.1 人工神经网络的概述

4.2.2 概率神经网络

4.2.3 概率神经网络的优缺点

4.3 HMM和 经网络的混合模型

4.3.1 HMM和人工神经网络结合的理论依据

4.3.2 HMM和人工神经网络混合模型的结合方式

4.4 HMM和人工神经网络混合模型的实现

4.4.1 HMM和人工神经网络混合模型的结构

4.4.2 HMM和人工神经网络混合模型的训练

4.4.3 HMM和人工神经网络混合模型的识别

4.5 本章小结

5 仿真实验和结果分析

5.1 仿真环境与数据来源

5.2 端点检测

5.2.1 遗传算法搜索SVM最优参数实验

5.2.2 语音端点检测实验

5.3 情感语音信号的特征提取

5.4 系统性能评估

5.4.1 识别率的比较

5.4.2 算法速度比较

5.4.3 噪声环境下系统的性能

5.5 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间发表的论文

致谢

声明

展开▼

摘要

随着人机交互技术的发展,语音的情感识别已经逐渐成为模式识别领域研究的热点之一。随着研究的不断深入,当单独使用HMM和人工神经网络来对语音情感状态进行分类识别时,效果并不是很理想。本文将HMM和人工神经网络两种算法进行融合,取长补短,形成新的混合模型,进而提高系统的识别率。该识别技术在服务机器人、语音自动应答系统等方面具有应用价值。
  本文对语音情感识别的发展现状进行了分析,对汉语语音情感识别的问题进行了深入的研究。首先,针对目前汉语语音情感识别在建立汉语语音情感数据库时存在很多困难的问题,对语音情感的基础理论以及建立汉语语音情感数据库的原则进行了详细的阐述。然后,为了减少语音信号本身对识别效果的影响,提出了基于GA-SW的语音端点检测方法并对汉语语音的情感特征进行了统计分析,形成了一个30维的特征向量。针对目前单一的HMM和人工神经网络模型存在的缺陷,提出了将HMM和人工神经网络混合模型应用于汉语语音情感状态的分类识别。该模型首先由HMM产生情感语音信号的最佳状态序列,然后利用时间规整算法对同一状态的特征参数进行规整得到等维的特征向量,并将它作为人工神经网络的输入进行语音情感状态识别。该算法充分利用了HMM极强的动态时序建模能力以及人工神经网络强大的分类能力。最后,以Matlab2012a为工作平台进行编程仿真。实现了HMM和人工神经网络两种模型的结合。并将混合模型分别与HMM和人工神经网络模型进行对比。实验结果表明,HMM和人工神经网络混合模型提高了汉语语音情感识别系统的识别准确率。此外,混合模型在不同信噪比的条件下也体现出了它的优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号