Speech Emotion Recognition Using Multi-granularity Feature Fusion Through Auditory Cognitive Mechanism

机译：基于听觉认知机制的多粒度特征融合语音情感识别

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we focus on the problems of single granularity in feature extraction, loss of temporal information and inefficient use of frame features in discrete speech emotion recognition. Firstly, preliminary cognitive mechanism of auditory emotion is explored through cognitive experiments, and then a multi-granularity fusion feature extraction method inspired by the mechanism for discrete emotional speech signals is proposed. The method can extract 3 different granularity features, including short-term dynamic features of frame granularity, dynamic features of segment granularity and long-term static features of global granularity. Finally, we use the LSTM network model to classify emotions according to the long-term and short-term characteristics of the fusion features. We implement experiment on the discrete emotion datasets of CHEAVD (CASIA Chinese Emotional Audio-Visual Database) released by the Institute of automation, China Research Academy of Sciences, and achieved improvement in recognition rate, increasing the MAP by 6.48%.

机译：在本文中，我们关注于特征提取中的单个粒度，时间信息的丢失以及离散语音情感识别中帧特征使用效率低下的问题。首先通过认知实验探索听觉情绪的初步认知机制，然后提出一种基于离散情绪语音信号机制的多粒度融合特征提取方法。该方法可以提取三种不同的粒度特征，包括帧粒度的短期动态特征，段粒度的动态特征和全局粒度的长期静态特征。最后，我们使用LSTM网络模型根据融合特征的长期和短期特征对情绪进行分类。我们对由中国科学院自动化研究所发布的CHEAVD（CASIA中国情感视听数据库）的离散情感数据集进行了实验，从而提高了识别率，使MAP提高了6.48％。

著录项

来源
《International conference on cognitive computing;Services conference federation》|2019年|117-131|共15页
会议地点
作者
Cong Xu; Haifeng Li; Hongjian Bo; Lin Ma;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Speech emotion recognition; Auditory cognitive mechanism; Multi-granularity feature fusion; CNN-LSTM;

机译：语音情感识别;听觉认知机制多粒度特征融合;有线电视新闻网;

相似文献

外文文献
中文文献
专利

1. Speech Emotion Recognition using auditory features [J] . Michal Choras, Guomin Zhou International journal of computational intelligence research . 2019,第1期

机译：使用听觉特征的语音情感识别
2. Characteristics of human auditory model based on compensation of glottal features in speech emotion recognition [J] . Sun Ying, Zhang Xue-Ying Future generation computer systems . 2018,第APRa期

机译：基于语音特征的声门特征补偿的人类听觉模型特征
3. Noise Robust Feature Scheme for Automatic Speech Recognition Based on Auditory Perceptual Mechanisms [J] . Shang CAI, Yeming XIAO, Jielin PAN, IEICE transactions on information and systems . 2012,第6期

机译：基于听觉感知机制的语音自动识别噪声鲁棒特征方案
4. Speech Emotion Recognition Using Multi-granularity Feature Fusion Through Auditory Cognitive Mechanism [C] . Cong Xu, Haifeng Li, Hongjian Bo, International conference on cognitive computing . 2019

机译：通过听觉认知机制使用多粒度特征融合的语音情感识别
5. A multimodal fusion approach for automatic postal address recognition system using Optical Character Recognition (OCR) and Automatic Speech Recognition (ASR) techniques. [D] . Singh, Amriteshwar. 2011

机译：一种使用光学字符识别（OCR）和自动语音识别（ASR）技术的自动邮政地址识别系统的多模式融合方法。
6. Fusion-ConvBERT: Parallel Convolution and BERT Fusion for Speech Emotion Recognition [O] . Sanghyun Lee, David K. Han, Hanseok Ko 2020

机译：Fusion-Convert：语音情感识别的并行卷积和伯特融合
7. Speech Emotion Recognition Using Multi-granularity Feature Fusion Through Auditory Cognitive Mechanism [O] . Cong Xu, Haifeng Li, Hongjian Bo, 2019

机译：通过听觉认知机制使用多粒度特征融合的语音情感识别

Speech Emotion Recognition Using Multi-granularity Feature Fusion Through Auditory Cognitive Mechanism

摘要

著录项

相似文献

相关主题

期刊订阅