情感语音识别与合成的研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

情感语音识别与合成技术是当前语音信号处理研究的热点问题,目的是使计算机既能够听懂人类语言所携带的情感成分,又可以说出人类语言,实现人机智能通信,使计算机与人的交流畅通无阻。情感语音识别是语音识别技术的一个新的分支,由于情感本身概念的不确定性及语音中情感特征的模糊性,使得情感语音识别成为一个难点问题。语音合成技术一直以来研究者众多,但是,如何能够构建出一个存储量小,自然度高的合成系统一直是需要重点解决的问题。　　本文紧紧抓住情感语音识别的难点和语音合成的重点,提出了基于人耳听觉特性模型的情感语音识别特征,并用声门特征对基于人耳听觉的情感语音特征进行了补偿优化;实现了基于隐马尔科夫模型的语音合成系统,在此基础上,对系统合成的语音进行了参数分析和修改,将情感特征加入了合成语音,实现了基于隐马尔科夫模型的情感语音合成。　　本文的主要工作和创新性成果如下:(1)在深入研究情感理论的基础上,分析了韵律特征在不同情感中的表现,构建了包括“高兴”、“生气”和“中立”三种情感状态,汉语普通话和英语两种语言的TYUT情感语音数据库。通过主观辨听实验和典型特征的分析实验,确定了TYUT情感语音数据库的有效性。　　(2)将基于人耳听觉特性模型的过零峰值幅度特征用于情感语音识别,并将该特征中用于代表频率与说话速率的过零特征与Teager能量算子中的非线性能量特征有机地结合在一起,提出了一种基于人耳听觉特性模型的新特征——过零最大Teager能量算子特征,新特征在情感语音识别实验中表现出良好的性能。　　(3)将人的发音模型与听觉模型相结合,通过分析声门特征对人耳听觉模型特征的影响,提出了用声门特征补偿人耳听觉特征的新算法,并将补偿后的新算法用于情感识别实验,得到了较高的识别率。新算法表现出了优良的性能。　　(4)针对实际交谈中,背景环境复杂的情况,设计了一种混合情感语音数据库的实验,用以检验情感特征的数据库独立性。通过对混合语音数据库实验结果的对比,发现过零最大Teager能量算子特征是本文所有特征中,数据库依赖性最小的特征。　　(5)为了能够合成出具有不同情感的语句,首先,搭建了基于隐马尔科夫模型的情感语音合成系统,接着对合成出的语句进行了参数修改,最终实现了基于隐马尔科夫模型的情感语音合成,初步得到了合成的情感语音。

著录项

作者
孙颖;
展开▼
作者单位

太原理工大学;

展开▼
授予单位太原理工大学;
学科电路与系统
授予学位博士
导师姓名张雪英;
年度 2011
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
情感语音识别,合成技术,听觉特性,隐马尔科夫模型;

相似文献

中文文献
外文文献
专利

1. 情感障碍的语音识别研究进展 [J] . 潘忠德 ,蔡伟雄 ,朱杰 . 中国司法鉴定 . 2015,第006期
2. 基于基本情感特征的汉语语音识别方法的研究 [J] . 马承泽 ,鞠婷婷 . 长春大学学报（自然科学版） . 2014,第004期
3. 基于基本情感特征的汉语语音识别方法的研究 [J] . 马承泽 ,鞠婷婷 . 长春大学学报（自然科学版） . 2014,第008期
4. 机器狗情感语音识别技术的研究 [J] . 傅胤荣 . 科技信息（学术版） . 2008,第012期
5. 机器狗情感语音识别技术的研究 [J] . 傅胤荣 . 科教探索 . 2008,第007期
6. 基于人耳听觉特性的谱能量特征在情感语音识别中的研究 [C] . 孙颖 ,阴杰敏 ,张雪英 . 第十一届全国人机语音通讯学术会议 . 2011
7. 基于频谱上下文的语音识别及情感分类算法研究 [A] . 张晓 . 2018

情感语音识别与合成的研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅