基于声学和文本特征的多模态情感识别

顾煜; 金赟; 马勇; 姜芳艽; 俞佳佳

首页> 中文期刊> 《数据采集与处理》 >基于声学和文本特征的多模态情感识别

基于声学和文本特征的多模态情感识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在语音模态中,利用OpenSMILE工具箱可以从语音信号中提取浅层声学特征,通过Transformer Encoder网络从浅层声学特征中挖掘深层特征,并将深浅层特征融合,从而获取更丰富的情感表征。在文本模态中,考虑到停顿因素与情感之间的关联性,将语音和文本对齐以获得说话停顿信息,采用停顿编码的方式将停顿信息添加到转录文本中,再通过DC-BERT模型获取话语级文本特征。将获得的声学与文本特征进行融合,利用基于注意力机制的双向长短时记忆(Bi-directional long short-term memory-attention,BiLSTM-ATT)神经网络进行情感分类。最后,本文对比了3种不同注意力机制融入BiLSTM网络后对情感识别的影响,即局部注意力、自注意力和多头自注意力,发现局部注意力的效果最优。实验表明,本文提出的方法在IEMOCAP数据集上的4类情感分类的加权准确率达到了78.7%,优于基线系统。

著录项

来源
《数据采集与处理》 |2022年第6期|1353-1362|共10页
作者
顾煜; 金赟; 马勇; 姜芳艽; 俞佳佳;
展开▼
作者单位

江苏师范大学物理与电子工程学院;

江苏师范大学科文学院;

江苏师范大学语言科学与艺术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
多模态情感识别; 深浅特征融合; DC-BERT模型; 注意机制; 停顿编码;

相似文献

中文文献
外文文献
专利

1. 基于皮肤电信号与文本信息的双模态情感识别系统 [J] . 张力行 ,叶宁 ,黄海平 . 计算机系统应用 . 2018,第011期
2. 基于语音信号与文本信息的双模态情感识别 [J] . 陈鹏展 ,张欣 ,徐芳萍 . 华东交通大学学报 . 2017,第002期
3. 基于声学特征的语言情感识别 [J] . 金琴 ,陈师哲 ,李锡荣 . 计算机科学 . 2015,第009期
4. 基于多模态特征的音乐情感多任务识别研究 [J] . 王昊 ,刘渊晨 ,赵萌 . 现代情报 . 2022,第11期
5. 一种基于黏液菌觅食机制的特征选择算法及其在文本情感识别中的应用 [J] . 徐济惠 ,颜晨阳 . 南京理工大学学报（自然科学版） . 2021,第005期
6. 基于最优声学特征子集的语音情感识别 [C] . 毕福昆 ,杨鉴 ,杨桃香 . 第五届全国信息获取与处理学术会议 . 2007

基于声学和文本特征的多模态情感识别

摘要

著录项

相似文献

相关主题

期刊订阅