首页> 中文期刊>广西师范大学学报(自然科学版) >基于端到端深度神经网络的语音情感识别研究

基于端到端深度神经网络的语音情感识别研究

     

摘要

语音情感识别是实现自然人机交互的重要组成部分,传统语音情感识别系统主要集中于特征提取和模型构建.本文提出一种将深度神经网络直接应用于原始信号的语音情感识别方法.原始语音数据携带了语音信号的情感信息、二维空间信息和时序上下文信息.建立的模型以端到端的方式进行训练,网络自动学习原始语音信号的特征表示,无需手工特征提取步骤.该网络模型同时兼顾了CNN和BLSTM 2种神经网络的优点.利用CNN从原始语音数据中学习空间特征,其后添加一个BLSTM学习上下文特征.为了评估该模型的有效性,在IEMOCAP数据库上进行识别测试,获得的WA和UA分别为71.39%、61.06%.此外,与基线模型进行对比,验证了提出方法的有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号