首页> 中文学位 >基于表格的影像文档特征提取算法的研究与设计
【6h】

基于表格的影像文档特征提取算法的研究与设计

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1课题来源及研究背景

1.2表格文档研究现状

1.3论文的研究内容

1.4论文的组织形式

第二章 特征提取理论基础及相关技术

2.1特征提取和选择

2.1.1特征提取

2.1.2特征选择

2.2常用的表格特征提取方法

2.2.1结构特征提取方法

2.2.2统计特征提取方法

2.3傅立叶变换

2.3.1离散傅立叶变换(DFT)

2.3.2快速傅立叶变换(FFT)

2.4本章小结

第三章 表格文档的预处理

3.1数字图像的表示

3.2图像黑边的去除

3.2.1数学形态学原理

3.2.2图像减法运算

3.2.3去除黑边算法

3.3图像增强

3.3.1直方图灰度变换

3.3.2图像去噪

3.3.3去噪算法

3.4本章小结

第四章 表格结构特征提取算法的研究

4.1直线检测的相关算法

4.2表格结构算法研究

4.2.1提取表格线算法

4.2.2误检测线段的剔除

4.2.3表格线的调整

4.3实验结果

4.4本章小结

第五章 基于傅立叶变换特征算法的研究

5.1表格特征和标准样本的构造

5.1.1表格特征提取

5.1.2标准样本库的构造

5.2基于BP神经网络的分类器

5.2.1分类器的设计

5.2.2 BP神经网络的设计

5.3实验结果

5.4基于傅立叶变换特征与表格结构特征算法的比较

5.5本章小结

结束语

读研期间发表的论文

参考文献

致谢

展开▼

摘要

近年来,随着计算机技术、多媒体技术的飞速发展,表格影像文档的自动分类、存储和管理日益成为人们研究的热点。而表格影像文档的特征提取是影像文档自动管理领域里重要的研究课题之一,对图像本身进行深入研究,通过合理的提取其特征,来提高影像文档分类的速度以及分类的准确性己成为必然要求。 当今虽然对表格影像文档处理进行了大量的研究,而且在一些行业已经应用,但这些系统基本上都是针对专用表格,对通用表格的分析和识别还不成熟。因此如何对通用表格特征的提取以及通用表格的分析和分类已经成为研究的热点。基于以上原因,本文以图像处理和模式识别理论为基础,研究了两种通用表格特征提取方法,并通过Matlab仿真,验证了算法的有效性。具体研究工作包括以下三方面: 1.在表格预处理阶段,本文提出一种简单有效的去除黑边的方法,该方法利用数学形态学原理首先对表格图像进行开运算,得到只有黑边的和原图一样大小的图像,再利用图像减法运算,可以很好的将黑边去除。 2.在特征提取阶段,研究了一种简单实用的通用表格特征提取方法,将表格结构作为表格识别特征。其处理过程是:先提取表格中的线段,再按照本文算法对相关线段进行合并或剔除,最后根据表格特性调整表格线,得到完整的表格结构。经实验结果表明该方法是可行的。 3.在对第一种特征提取算法分析的基础上,又给出了基于傅立叶变换特征提取算法。该算法综合考虑表格文档水平和垂直投影方向的信息,以傅立叶变换后的频谱作为特征,并采用BP神经网络作为分类器,实验证明这种特征可以有效地解决对称表格分类难的问题,并具有很好的抗干扰和泛化能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号