首页> 中文学位 >面向语音合成的文本处理技术的改进
【6h】

面向语音合成的文本处理技术的改进

代理获取

目录

文摘

英文文摘

致谢

1 引言

1.1 选题背景和意义

1.1.1 语音合成及其文本处理技术的发展现状

1.1.2 选题的意义

1.2 本论文的研究内容与结构

1.2.1 研究内容

1.2.2 论文结构

2 新闻播报言语数据库构建及韵律标注

2.1 韵律标注内容

2.1.1 停顿(韵律边界)

2.1.2 重音

2.1.3 语气(基调)

2.1.4 语调

2.2 新闻播报言语数据库的构建

2.2.1 语料选取

2.2.2 数据库初加工

2.2.3 言语数据库设计

2.2.4 录音

2.2.5 韵律标注的实施

2.3 小结

3 语音合成的典型系统及文本处理模块

3.1 典型系统

3.2 文本处理模块

3.2.1 自动分词器的实现

3.2.2 自动注音的实现

3.2.3 韵律结构预测的实现

3.3 小结

4 文本处理模块设计与实现

4.1 文本处理模块设计方案

4.1.1 原有模块工作流程

4.1.2 韵律结构预测模型设计方案

4.2 韵律结构预测模型实现

4.2.1 分词模块对比

4.2.2 训练韵律结构预测模型

4.3 模型测试

4.3.1 集内和集外测试

4.3.2 实验数据分析

4.4 小结

5 总结与展望

5.1 全文总结

5.2 未来工作展望

参考文献

作者简历

学位论文数据集

展开▼

摘要

为解决汉语语音合成系统中目前普遍存在的、影响合成语音可懂度和自然度的发音及韵律结构等问题,并提高合成语音表现力,尤其要使其具有准确、生动的语义表现能力,需要文本分析模块能够输出更为丰富的语言学信息,并利用这些信息合成出更为准确、生动的语音。为此,本文围绕:言语数据库及其韵律标注,以及合成系统的前端模块,展开研究。
   本文研究一方面将语音合成所处理的文本对象由语句层面上升到篇章层面,构建了篇章级的新闻播报数据库;另一方面把语音合成的前端——文本处理模块进行了一定程度的改进。主要工作内容如下:
   1.选取新闻播报语料为研究/加工素材,综合考虑计算建模需求及样本的特点,在前人工作的基础上,制定了一套篇章级的韵律标注规范。韵律标注的内容包括:韵律层级结构、重音、语气和语调,丰富和完善了现有的韵律描述;并依据制定的规范实施了标注,构建了篇章级的新闻播报数据库。
   2.依据原有文本处理模块的工作流程,从其组成部分入手,在原有文本处理模块的分词模块与其它分词模块对比分析的基础上,进行了分词模块的替换;采用二元文法训练了新的文本处理模块,其核心是训练新的韵律结构预测模块;通过集内和集外测试的实验,证明新的模块实现了更好的韵律结构预测,进而使文本处理效果在一定程度上得到了改进。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号