首页> 中文学位 >基于DIVA模型的语音生成与获取声道模型及其控制机制的研究
【6h】

基于DIVA模型的语音生成与获取声道模型及其控制机制的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 课题的研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容及论文结构

第二章 DIVADIVADIVA 模型综述

2.1 DIVA 模型的基本概念

2.2 DIVA 模型的结构概述

2.3 DIVA 模型的基本结构

2.4 本章小结

第三章 一种改进的伪逆控制方案在 DIVADIVADIVA 模型中的应用

3.1 DIVA 模型体觉方向向量到发音速度向量的映射

3.2 基于零空间的再分配伪逆算法

3.3 实验过程与结果分析

3.4 本章小结

第四章 基于 DIVADIVADIVA 模型的前田几何声道模型

4.1 MOCHA 数据库

4.2 DIVA 声道模型

4.3 EMA 数据应用于 DIVA 声道模型

4.4 本章小结

第五章 以/u/ /u/ /u/音素为基准研究 DIVADIVADIVA 模型的声道配置

5.1 共振峰

5.2 运动等效现象

5.3 DIVA 模型的运动等效

5.4 基于 EMA 数据库/u/音素的运动等效现象

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

致谢

参考文献

攻读硕士期间的研究成果

展开▼

摘要

随着人工智能的发展,人们对这个领域的研究不断深入。对类似真人发音的语音生成和获取的控制,是机器人发音系统急需解决的问题。DIVA(Directions Into Velocities of Artculators)模型是一种用于语音生成与获取后描述相关处理过程的数学模型,也是一种为了生成单词、音节或者音素,被用来控制模拟声道运动的自适应网络模型。在当今真正具有生物学意义的语音生成和获取的神经网络模型中,DIVA模型的定义和测试相对而言是最彻底的,并且是唯一一种应用伪逆控制方案的模型。
  本文首先介绍了DIVA模型和声道模型的发展和现状,然后对DIVA模型的相关理论进行了介绍,包括DIVA模型的基本概念以及基本结构。然后研究讨论了DIVA模型体觉方向向量到发音速度向量的映射以及DIVA模型的伪逆控制机制,作者提出了基于零空间的再分配伪逆算法对DIVA模型中的伪逆控制求解算法进行改进,避免发音器官过早进入饱和状态,从而提高了DIVA模型的鲁棒性。
  文章引入EMA(electromagnetic articulograph)数据库,对前田几何声道模型进行描述。采用几何学的自适应的过程描述EMA数据应用到DIVA模型中的方法,从而能够更加准确的估算出DIVA模型语音的生成和获取过程中声道模型的形状。实验以/u/音素为基准,在上颚扰动的情况下,分析DIVA模型中的唇凸与收缩尺寸之间关系,对DIVA模型语音生成与获取过程中的运动等效现象,以及声道参数的配置进行研究与讨论。最后,对研究内容进行了总结,并指出了后续的研究方向,为进一步的研究开拓了思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号