基于深度神经网络的语音情感识别模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音情感识别是音频领域的热点研究内容，尤其是在智能课堂、智能驾驶和智能医疗等人工智能交互领域中有广泛应用。语音情感识别旨在通过机器感知判断，使机器能够捕捉人类声音中所传达的情感，进而灵活调整交互方案和实时决策，达到更高程度的人机交互。　　本文对语音情感识别的谱图表示和深度学习的相关方法进行了研究，其中语音情感特征提取的充分性和情感识别的准确性是本文研究的重点。针对语音情感特征提取过程繁琐且特征提取不充分的问题，本文采用多态频谱图与深度学习相结合的方式进行端对端的学习，提高语音情感特征提取的充分性和有效性，实现自动的特征提取过程。针对传统语音情感误识别率高、辨别度较低等问题，本文提出语音情感多层次识别框架，该框架首先通过哈希算法计算得到高相似情感类别，并采用以长短时记忆网络为基础的语音情感模型，生成时序语音情感特征向量，并增加多采样率数据增强的方法来丰富原始样本，优化语音情感多层次识别框架，进一步提高识别的精度。　　本文的主要贡献包括：　　①传统语音情感识别方法需要分别对声学参数进行提取并统计，提取过程繁琐且提取的特征不充分。针对上述问题本文提出一种语音情感识别模型SMel-CNN，该模型将语谱图和梅尔频谱图作为初始输入，然后同时提取时频域特征，最后将时频域特征进行融合以提高语音特征提取的有效性，并实现自动语音情感特征提取过程。实验证明本文提出的SMel-CNN模型的有效性。　　②针对传统语音情感识别存在的误识别率高、情感相似性高等问题。本文提出多层次语音情感识别框架ML-EM，该框架采用哈希算法对语音情感类别进行相似度计算，得到高相似度情感集合，并采用本文提出的时序模型SC-LSTM对高相似度情感进行识别。SC-LSTM模型使用SMel-CNN网络进行前期谱图的特征提取并使用 LSTM 网络进行后期的时序建模。实验证明 ML-EM 框架提高了语音情感识别整体的辨别度和精确度。　　③本文设计并实现自动语音情感识别系统，提取语音段的语谱图和梅尔频谱图作为特征提取模型的初始层，通过SMel-CNN模型和SC-LSTM模型分别进行特征提取和识别，最终得到高精度识别结果。

著录项

作者
史晶;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科工程(计算机技术)
授予学位硕士
导师姓名邹东升;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
语音情感识别,卷积神经网络,长短时记忆神经网络,深度学习;

相似文献

中文文献
外文文献
专利

1. 基于端到端深度神经网络的语音情感识别研究 [J] . 吕惠炼 ,胡维平 . 广西师范大学学报（自然科学版） . 2021,第003期
2. 基于CGRU模型的语音情感识别研究与实现 [J] . 郑艳 ,陈家楠 ,吴凡 . 东北大学学报（自然科学版） . 2020,第012期
3. 基于HMM和ANN混合模型的语音情感识别研究 [J] . 林巧民 ,齐柱柱 . 计算机技术与发展 . 2018,第010期
4. 基于深度神经网络的旋转机械故障预测模型的研究 [J] . 潘莉丽 ,饶楚楚 . 机械工程与技术 . 2021,第001期
5. 基于深度神经网络的医药专利文本聚类模型研究 [J] . 王思源 ,何先波 . 太原师范学院学报（自然科学版） . 2021,第003期
6. 基于概念器的深度神经网络模型 [C] . 钱光武 ,张蕾 ,王炎 . 人工智能领域青年学者研讨会 . 2017
7. 基于时序深度学习模型的语音情感识别方法研究 [A] . 陈晓敏 . 2018

基于深度神经网络的语音情感识别模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅