文摘
英文文摘
独创性声明和关于论文使用授权的说明
第一章绪论
1.1背景
1.2国内外研究现状
1.3音素层可视语音合成方法
1.4特征层可视语音合成的映射方法
1.1.1基于矢量量化的方法
1.1.2基于混合高斯模型的方法
1.1.3基于神经网络的方法
1.1.4基于隐马尔可夫模型的方法
1.5存在的问题和本文的主要贡献
1.5.1存在的问题
1.5.2本文的主要贡献
1.6论文的组织结构
第二章动画模型
2.1基于图像采样的动画
2.2基于模型的动画
2.3本章小结
第三章音素层的可视语音合成
3.1音素层可视语音合成介绍
3.2本文所用的人脸模型
3.3关键帧之间的平滑变形技术(MORPHING)
3.3.1用运动分析在关键帧之间建立象素级对应关系
3.3.2光流及其连接策略
3.3.3引入渐变控制速率的渐变过程
3.4连读模型与口形渐变速率
3.4.1发音的连读分析
3.4.2渐变控制率及连读模型
3.5与背景视频频缝合
3.6视频与音频的同步及汉字文本的处理
3.7本章小结
第四章概率映射模型
4.1 HMM的基本思想
4.1.1 Markov链
4.1.2 HMM的基本概念
4.1.3 HMM的基本算法
4.2 HMM的实际应用
4.3本章小结
第五章特征层的可视语音合成
5.1语音特征的表达及提取
5.1.1语音信号的时域处理方法
5.1.2线性预测系数及其倒谱系数
5.2视觉特征的表达及提取
5.2.1全局口形纹理的特征表达
5.2.2口形纹理的PCA分析
5.2.3同步映射模型中的视觉输入模式
5.3语音特征的矢量量化(VQ)
5.4双模态同步映射模型
5.4.1基本映射模型
5.4.2双层隐马尔可夫模型
5.4.3唇动预测
5.4.4实验结果
5.5本章小结
第六章语音动画系统
6.1文本驱动动画系统
6.1.1系统框架
6.1.2系统界面
6.2语音驱动动画系统
6.2.1系统框架
6.2.2视频合成
6.3本章小结
总结与展望
本文总结
未来工作展望
参考文献
发表论文
致谢