首页> 中文学位 >基于OCR快递单据识别的研究与实现
【6h】

基于OCR快递单据识别的研究与实现

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 汉字识别的发展及研究现状

1.2.1 汉字识别的发展

1.2.2 研究现状

1.3 论文的主要工作

第二章 相关理论与技术

2.1 快递分拣系统的识别流程

2.2 预处理

2.3 版面分析

2.4 汉字切分

2.5 特征提取

2.6 分类识别方法

2.6.1 结构模式识别方法

2.6.2 统计模式识别方法

2.6.3 神经网络分类器

2.7 本章小结

第三章 关键技术和主要方法

3.1 表格线消隐法

3.2 图像模板匹配定位法

3.3 基于多切分策略的字符分割

3.3.1 粗切分与函数拟合

3.3.2 字块再切分和合并

3.4 梯度特征的提取和降维

3.4.1 梯度特征提取

3.4.2 梯度特征降维

3.5 MQDF分类器

3.6 本章小结

第四章 基于OCR单据识别系统的实现

4.1 系统简介

4.1.1 硬件设备

4.1.2 软件系统

4.2 生成训练集

4.3 表格线消隐和版面分析模块

4.3.1 表格线消隐法在本系统中的使用

4.3.2 版面分析模块

4.4 文本行切分和识别模块

4.5 后处理模块

第五章 实验

5.1 实验环境

5.2 系统操作流程

5.3 图像测试集的选取

5.4 测试结果

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

展开▼

摘要

随着物流业的高速发展,每天都有大量的快递单信息需要录入,为了提高工作效率并降低劳动强度,寻找一种能够将纸张中的文字信息自动录入到计算机中的方式就成为一个迫切需要解决的问题。本文结合科研课题,以某快递公司的快递单为例,设计实现了一套基于OCR的快递单据识别系统。论文主要工作如下:
  (1)本文设计并实现了表格线消隐方法。快递单中存在的表格线严重影响文本块的提取,该方法能成功去除快递单图像中的表格线。
  (2)本文在快递单图像的版面分析阶段,采用图像模板匹配定位法准确提取出了快递单中的有效文本信息块图像。
  (3)本文结合投影直方图算法、多函数拟合算法以及后期合并策略,设计并实现了一种基于多切分策略的字符分割方法,较成功的把提取出的有效信息块切分成单个字符。
  (4)本系统把训练和识别两个步骤完全独立开,分类器采用离线训练,训练后的参数矩阵存于文件中供在线识别时使用。系统初始化时一次性把所有训练集读入内存,大大提高了运行效率。
  (5)本文采用了一种基于数据库的后处理方法对识别结果进行校准,提高了系统的识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号