首页> 中文学位 >有声出版物中自动分割系统的设计
【6h】

有声出版物中自动分割系统的设计

代理获取

目录

文摘

英文文摘

声明

1 绪论

1.1 论文的研究背景和现实意义

1.2 国内外研究的状况

1.2.1 版面分析与分类算法的研究状况

1.2.2 字符分割算法的研究状况

1.2.3 语音分割算法的研究状况

1.3 本文的内容安排

2 文本图像的版面分割与分类

2.1 引言

2.2 文本图像的预处理

2.2.1 图像的灰度化处理

2.2.2 图像去噪

2.2.3 图像的二值化

2.3 图文混排图像的版面分析

2.3.1 模式提取与矩形框的确定

2.3.2 合并矩形框形成模式

2.3.3 模式分类

2.4 实验结果分析

3 字符自动分割系统的设计

3.1 引言

3.2 中文字符区的字符分割

3.3 英文字符区的字符分割

3.4 实验结果分析

4 语音自动分割系统的设计

4.1 引言

4.2 语音端点检测基础知识

4.2.1 语音信号及其数字化

4.2.3 语音端点检测

4.3 语音自动分割系统模型

4.3.1 时域参数分析计算

4.3.2 阈值自适应分割

4.3.3 实验结果分析

结 论

参考文献

攻读硕士学位期间发表学术论文情况

致 谢

展开▼

摘要

随着科学技术的发展,出版物的有声化已经成为一个趋势。字符分割和语音分割是出版物有声化过程中的两个主要问题,在目前的产品设计过程中这两项分割技术都是通过手动完成的。针对这些问题,本文对出版物有声化过程中的自动分割技术进行了研究,实现了有声出版物中字符和语音的自动分割,极大地提高了工作效率和精度。
   本文在比较了传统的字符分割和语音分割方法的基础上,对传统的方法进行了改进并应用于自动分割系统中,实现了字符与语音的自动分割。本文主要研究工作:(1)图像的版面分析部分,对已有的算法进行了研究和实验并在此基础上应用了基于模式链分析的分割方法来完成系统中的版面分析,然后完成模式分类,分别输出图像的图形区和文字区。(2)字符分割部分,对图像的文字区进行处理,提出了一种基于文字平均宽度的字符自动分割算法来完成中文字符的自动分割;采用投影法的改进算法来完成英文字符的自动分割。(3)在语音自动分割部分,提出了阈值自适应分割模型完成对语音文件的有效分割。(4)基于Matlab平台实现了自动分割系统,该系统首先能够对文本图像进行必要的预处理并完成版面分析,然后完成对字符部分的自动分割:其次,该系统能够完成对语音文件的分析及自动分割。
   本文通过实验验证了字符和语音分割算法的可行性。同时,分析了误差产生的原因,并提出了改进的可行性方案。实验数据表明,本文提出的字符分割算法及语音分割算法原理上正确,技术上可行,对于相关的产品开发具有重要借鉴意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号