首页> 中文学位 >语音合成技术在口吃矫正中的研究与应用
【6h】

语音合成技术在口吃矫正中的研究与应用

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 问题的提出和研究意义

1.2 国内外研究现状

1.3 本文研究的主要工作

1.4 本文的组织结构安排

第二章 相关理论与技术

2.1 语音学概述

2.2 语音识别技术

2.3 语音处理技术

2.4 语音合成技术

第三章 SVSS系统研究与算法设计

3.1 SVSS系统总体设计分析

3.2 口吃语音预处理

3.3 口吃语音特征提取

3.4 语音压缩与编码实现

3.5 HMM在语音合成中的应用

第四章 提高合成语音自然度算法研究

4.1 共振峰语音合成

4.2 LPC语音合成

4.3 改进的共振峰模型

4.4 实验结果与分析

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

口吃是一种常见的语言障碍,随着计算机科学技术的发展,人工智能的应用逐渐走进医疗领域,如何将矫正口吃通过计算机智能来实现,是当今人工智能领域研究的一个新的课题并具有重要研究意义。
  本文基于口吃矫正的需求,开发了口吃矫正语音合成系统(The Stuttering Voice Synthesis System,简称SVSS)。分析了语音合成所用到的关键技术,设计了系统总体功能框架;该系统包含六大功能模块,文中重点对口吃语音识别和矫正语音合成这两个模块所用到的关键技术进行分析与算法设计;针对口吃语音的特点,提取语音特征参数,构建开发系统所需的参数模型库,成功开发出符合用户需求的SVSS系统。本文首先对口吃语音进行特征分析,结合口吃语音特点对患者语音进行预处理,包括防混叠滤波与预加重处理、语音信号数字化、加窗与分帧,最后进行端点检测。文中提取MFCC参数作为语音的特征参数,采用LPC分析方法进行语音压缩,建立HMM训练模型,利用Viterbi算法修正谱包络参数,并用k-means算法进行优化,使训练模型能输出最佳匹配结果,将匹配结果结合已有的韵律参数进行分析,成功开发出SVSS系统。由于口吃矫正需要较高音质的合成语音,单一的韵律模型满足不了实际的需要,最后提出一种改进的共振峰模型,采用LPC-共振峰算法来调整合成语音的共振峰,以提高合成语音的自然度。
  文中采用MOS评分法,验证LPC-共振峰算法的性能,结果表明合成的矫正语音的自然度和流利度都较为理想。最后总结了开发 SVSS系统所做的主要工作,并对系统应做的功能扩展进行展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号