语音合成中韵律结构预测改进——深度学习在韵律预测模块中的应用研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

韵律结构是影响语音合成中语音自然度的关键因素之一，对韵律结构预测的研究具有重要意义。传统的基于规则和基于统计的韵律预测模型建模方法在应用中取得了许多成功，但其在选取输入特征时多使用词性(Part-of-Speech，POS)等浅层信息,忽略了语义和语法等深层信息对韵律结构的影响。另外，当数据复杂性很大时，会出现适用范围窄、过拟合以及过于依赖规则等问题。针对传统方法中存在的局限性，需要一种对复杂数据建模能力很强的模型且模型的输入需表征深层信息。
　　本文在韵律结构预测模块中引入深度学习，基于词向量作为模型输入特征的深度神经网络预测模型进行研究。论文的主要工作如下:
　　(1)准备文本语料库训练词向量，使用训练得到的词向量替代传统的POS信息作为预测模型的输入，在模型的输入特征中加入词长信息和标点信息，从而增加输入特征中包含的信息，提高模型的学习效果;
　　(2)采用全连接的前馈网络(FF)与双向长短时记忆单元(BLSTM)网络组合的网络结构对韵律预测模型建模，对比不同网络结构下韵律层级预测模型的预测结果，找到较好的预测模型网络结构;
　　(3)为了进一步提高基于深度学习的韵律结构预测模型的预测效果，在网络模型之后，利用网络模型的输出打分和韵律结构类别之间的转移打分进行动态规划，找到网络模型输入语句对应的最优韵律层级类别序列。

著录项

作者
王天慧;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科电子与通信工程
授予学位硕士
导师姓名朱维彬;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音合成;
关键词
语音合成; 韵律结构; 预测模型; 深度学习;

相似文献

中文文献
外文文献
专利

1. 一种基于深度神经网络的汉语语音合成韵律结构预测模型 [J] . 吴树兴 ,张秀琴 . 科技资讯 . 2019,第027期
2. 改进的Apriori算法对语音合成中韵律参数的预测 [J] . 李炎阳 ,景新幸 . 桂林电子科技大学学报 . 2005,第006期
3. 条件随机场模型在韵律结构预测中的应用 [J] . 董远 ,周涛 ,董乘宇 . 北京邮电大学学报 . 2009,第5期
4. 自然言语的韵律组织中的不确定性及其在语音合成中的应用 [J] . 初敏 . 中文信息学报 . 2004,第004期
5. 中文语音合成系统中的一种两层韵律结构生成体系 [J] . 董远 ,周涛 ,董乘宇 . 自动化学报 . 2010,第011期
6. 基于深度学习的韵律结构预测 [C] . 丁星光 ,李雅 ,赖玮 . 第十三届全国人机语音通讯学术会议 . 2015
7. 中文语音合成系统中的文本正则化和韵律结构预测方法的研究 [A] . 周涛 . 2010

语音合成中韵律结构预测改进——深度学习在韵律预测模块中的应用研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅