汉语语音合成系统的改进与实现

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

语音作为人机交互手段这一趋势已经初见倪端,语音作为人机交互手段包含两个方面:语音合成和语音识别。通常语音合成指的是文本转语音,即把文字按语音处理规则转换为声音并输出。
　　一般来说语音合成系统包含三个模块:文本处理模块、韵律处理模块、声音合成模块。文本处理模块处于语音合成系统的前端,其内容有文本分词、非标准词正则化、字音转换。韵律处理模块的主要工作是从文本中提取韵律结构、重音和语调等与韵律有关的信息。声音合成模块是语音合成系统的后端模块,主要工作是合成声音并对其进行修改与输出。
　　为了提高汉语语音合成系统合成语音的可懂度以及自然度,本文重点研究了文本处理模块和韵律处理模块,所做具体工作如下:
　　 (1)分析了语音合成系统的整体框架,理解了系统各个模块的主要作用以及工作原理。鉴于PSOLA在语音合成模块中的重要作用,重点研究了PSOLA的分类以及实现过程,并将它应用到语音合成原型系统中。
　　 (2)针对文本处理模块做了研究,并对多音字处理方法做了改进与实现。本文一共实现了两种多音字处理方法:一种是静态的依词判音法,一种是动态的词性规则判音法。依词判音法是基于词库匹配的判音法,词性规则判音法是基于C4.5的决策树判音法。
　　 (3)针对韵律处理模块做了研究,并对韵律结构预测方法做了改进。改进后的韵律结构预测方法用HTK对一定规模标注好的韵律词或韵律短语的词性词长序列进行训练,得到对应的隐马尔科夫模型。然后用训练好的隐马尔科夫模型进行韵律结构预测。在模型训练过程中采用Good Turing法对模型进行参数平滑。
　　 (4)搭建语音合成原型系统,并对原型系统进行评测。评测数据表明本文工作的确能够帮助提高汉语语音合成系统合成语音的可懂度与自然度。

著录项

作者
贾志浩;
展开▼
作者单位

南京理工大学;

展开▼
授予单位南京理工大学;
学科控制工程
授予学位硕士
导师姓名何新;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音合成;马尔可夫过程;
关键词
词库匹配; 韵律结构预测; 决策树判音; 隐马尔科夫模型; 语音合成系统; 人机交互;

相似文献

中文文献
外文文献
专利

1. 车载嵌入式汉语语音合成系统的研究及实现 [J] . 张涌 . 轻型汽车技术 . 2003,第006期
2. 汉语语音合成系统语音材料设计 [J] . 邹海涛 ,郑新春 ,柴佩琪 . 中文信息 . 1999,第2期
3. 语音合成系统中语音库的设计与实现 [J] . 朱亚喆 ,柴佩琪 . 计算机工程 . 1997,第0S1期
4. 一种实用的语音合成系统：GIT语音合成系统 [J] . 黎伟峰 . 电脑 . 1990,第002期
5. 汉语语音合成系统中影响合成自然度的主要技术因素探析 [J] . 刘新红 ,吴树兴 . 消费电子 . 2020,第011期
6. 智能化汉语语音合成系统的实现 [C] . 游之墨 . 第一届全国语言识别学术报告与展示会 . 1990
7. 语音合成算法研究及嵌入式语音合成系统的实现 [A] . 乔英霞 . 2005

汉语语音合成系统的改进与实现

摘要

著录项

相似文献

相关主题

期刊订阅