首页> 中文学位 >中文版面中标点符号的提取与识别
【6h】

中文版面中标点符号的提取与识别

代理获取

目录

文摘

英文文摘

声明及学位论文使用授权声明

1绪论

2版面理解前的预处理

3标点符号的提取

4标点符号的识别

5实验与分析

6总结与展望

致谢

参考文献

展开▼

摘要

本文主要研究中文文档中标点符号的提取和识别问题。主要工作包含以下内容: (1)研究了版面分析预处理的过程。首先在比较各种已有方法的基础上,采用Hough变换的方法对图像进行倾斜校正,然后用中值滤波方法对校正后的图像进行去噪,最后采用基于矩的阈值选取方法进行二值化处理,实验结果表明可以得到较好的预处理结果图,方便了进一步的分割。 (2)在版面分析过程中,首先研究比较了传统的投影法和连通域方法,然后在此基础上,采用一种基于膨胀算法的连通域搜索法对文档图像进行了分割。该方法根据数学形态学的原理对文档图像进行膨胀处理,并在此基础上进行连通域搜索,获得更加有效的分割效果。 (3)在预处理和版面分析步骤获得的结果图像基础上,采用了以相似度为决策函数的模板匹配方法以及基于支持向量机的方法的对标点符号分别进行识别。实验表明两种方法都可以有效的识别出文字块图像中的标点符号。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号