首页> 中文学位 >基于关联规则与波形拼接相结合的情感语音合成研究与实现
【6h】

基于关联规则与波形拼接相结合的情感语音合成研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 引言

1.2 研究背景及意义

1.2.1 情感语音合成的研究背景

1.2.2 情感语音合成的意义

1.3 情感语音合成的研究现状

1.4 论文所作的工作及组织结构

第二章 语音合成方法的比较分析

2.1 参数合成法

2.1.1 线性预测合成方法

2.1.2 共振峰合成方法

2.2 波形拼接合成法

2.3 规则合成法

2.4 其他合成方法

2.5 本章小结

第三章 语音的情感分析

3.1 情感的定义

3.2 情感的分类

3.3 情感计算

3.4 语音的情感特征

3.5 情感语料库

3.6 本章小结

第四章 情感语音的基频模型与关联规则

4.1 情感语音韵律模型

4.1.1 韵律特征参数的选取

4.1.2 关联规则模型的构建

4.2 关联规则问题的描述

4.2.1 频繁项集的产生

4.2.2 Apriori算法

4.3 算法改进及性能分析

4.4 实验仿真与研究

4.5 本章小结

第五章 情感语音合成系统的实现

5.1 情感语音合成的基本原理

5.2 情感语音合成的系统设计

5.3 基于TD-PSOLA的波形拼接算法

5.4 编程实现的重点及界面

5.5 实验结果对比分析

5.5.1 基频

5.5.2 时长

5.5.3 强度

5.5.4 频谱参数

5.5.5 受上下文相关的影响

5.5.6 重音

5.5.7 其它语音参数

5.6 本章小结

第六章 总结与展望

参数文献

在校期间发表的论文和参与的项目

致谢

展开▼

摘要

随着现代计算机技术的不断向前发展,人机交互在人们生活中扮演着越来越重要的角色。语音通信是人与计算机之间交流的最直接、最便利的通信方式,它首要涉及的就是语音合成技术。传统的语音合成技术侧重于语音词汇表达的准确性,缺乏对语音情感的研究,合成的语音具有浓厚的机器味。如何让计算机合成出的语音能够像人说话那样清晰可懂、自然度高并且富有丰富的情感,是语音合成工作者的一项长期而又艰巨的任务。
  论文对情感语音合成的发展及技术做了一定的研究,报告了情感语音合成技术的现状,比较了主流语音合成技术的各自特点,结合语音的情感进行了分析,运用数据挖掘中的关联规则和波形拼接技术合成了自然度高、清晰可懂的情感语音。论文抽象出了一种比较直观的类正弦型的基频曲线模型,给出了基频的关联规则模型,并对关联规则中Apriori算法进行了改进,得出前后音节间的音联关系,从而来指导了情感语音合成的选音工作,缩小了波形拼接范围,提高了波形拼接效果,并运用TD-PSOLA算法对韵律特征参数进行了调整。实验语料库均来自全球最专业的语音软件供应商美国Loquendo语音技术研究实验室Dave的语音库。
  在搭建系统模块的开发过程中,以论文提出的情感语音合成技术和算法为基础,设计并实现了情感语音合成系统,并对合成出的情感语音作了生气、高兴、悲伤和恐惧四种情感下与真人发音的情感特征参数对比分析。系统操作方便,界面友好,稳定性高。研究结果表明,采用本系统合成的情感语音的各个特征参数非常接近真人情感语句的特征参数,合成的语音在听觉上自然度高、清晰易懂同时又富有丰富的情感。也就是说基于关联规则和波形拼接相结合的研究方法是较为理想的。该方法为情感语音合成的研究提供了帮助和指导。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号