首页> 中文学位 >与汉语语音同步的三维人脸动画的研究
【6h】

与汉语语音同步的三维人脸动画的研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 三维人脸建模

1.2.2 语音可视化建模

1.2.3 语音同步人脸动画技术

1.3 研究目标及内容

1.3.1 研究目标

1.3.2 研究内容

1.4 本文组织结构

第2章 三维人脸建模

2.1 人脸解剖学基础

2.1.1 口腔解剖学

2.1.2 人脸面部肌肉

2.2 三维人脸建模

2.2.1 Candide-3人脸模型

2.2.2 三维人脸肌肉模型

2.2.3 三维人脸肌肉配置

2.2.4 下颚运动轨迹分析模型

2.3 本章小结

第3章 协同发音建模

3.1 语音口型匹配机理

3.2 中文可视化音素数据映射

3.3 协同发音算法

3.4 本章小结

第4章 三维人脸语音同步动画的实现

4.1 语音合成技术

4.1.1 Microsoft Speech SDK简介

4.1.2 TTS引擎简介

4.2 中文文本分析

4.3 中文可视音素的获取

4.4 语音同步与插值处理

4.5 本章小结

第5章 实验结果与效果评估

5.1 三维人脸语音动画系统的框架与组成

5.2 评估方法

5.2.1 主观评估法

5.2.2 客观评估法

5.3 实验结果评测分析

5.3.1 合成动画效果主观评测

5.3.2 协同发音模型的主客观评价

5.4 本章小结

结论

致谢

参考文献

攻读硕士学位期间发表的论文及科研成果

展开▼

摘要

与汉语语音同步的三维人脸动画合成的研究是自然人机交互领域的重要内容。将任意的声音与一个“虚拟人”重新结合起来可能是语音合成中最重要的进步之一。人们相信,视觉合成语音将会被证明比听觉合成语音更有价值。合成视觉语音可以为精神物理学和心理学的问题提供更细微的评估,这是自然语言无法提供的,并且加入视觉信息后可以显著提高可懂度。目前,还没有一个较好的方法来实现符合汉语发音习惯的人脸语音同步动画。因此,本文的目标是探索研究一种语音可视化新方法,并建立一个与汉语语音同步的三维人脸动画系统。该技术能够广泛应用于新闻播报、对话系统、虚拟主持人、虚拟会议、电影制作、3D游戏娱乐等领域。
  针对汉语的发音习惯以及语音可视化技术中对口型动画自然、连续的要求,本文提出了一种符合汉语发音习惯的三维人脸语音同步动画的方法。本文主要分为三部分:三维人脸建模的研究,协同发音建模研究,语音与人脸动画同步的研究。
  第一部分,根据对人脸运动解剖学的研究,构建一个基于肌肉模型与运动几何学模型的三维人脸控制模型,为了达到逼真的效果,建立舌头、牙齿等模型来配合发音器官的发声。通过数据结构的形式去控制肌肉模型和运动几何学模型实现人脸的运动,从而实现各种口型和表情的变化。
  第二部分,为了解决汉语发音习惯的问题,设计了语音可视化协同发音模型,该方法通过分析相邻音子间视素的影响权重,可以描述辅音与元音之间,元音与元音之间相互影响的视位表达,从而产生符合汉语发音习惯的口型动画。
  第三部分,为了解决人脸动画的语音同步问题,提出了一种语音流与动画流匹配的方法。首先,通过对汉语文本的分析,来获取中文可视音素;其次,通过对语音基本口型的时间定位,将语音和人脸动画相结合,并且在时间轴上保证语音流与动画流的匹配;最后通过插值算法合成与语音同步的三维人脸动画。该方法提高了人脸语音动画的连贯性和合理性。
  在上述研究的基础上,本文开发了一种基于汉语文本的三维人脸语音同步动画系统,该系统可以根据输入的文本,通过语音可视化技术,产生与语音同步的三维人脸动画。为了有效地评估三维人脸语音动画系统,用主、客观评价的方式进行实验对比和分析,实验结果表明:本文方法产生的口型动画更为逼真,且符合汉语发音的习惯。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号