首页> 中文学位 >包装箱表面印刷体汉字识别算法研究
【6h】

包装箱表面印刷体汉字识别算法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

Contents

1 绪论

1.1 课题的来源和意义

1.2 汉字识别研究现状

1.3 本文的主要工作和创新点

2 汉字图像归一化方法

2.1 归一化过程介绍

2.2 实验结果及分析

2.3 小结

3 基于Gabor滤波器的笔划穿越次数DCT特征的汉字粗分类方法

3.1 引言

3.2 Gabor滤波器的定义与性质

3.3 Gabor滤波器的参数选择

3.4 粗分类特征的生成与粗分类方法

3.5 实验结果及分析

3.6 小结

4 HMM在汉字特征细分类中的应用

4.1 引言

4.2 隐马尔可夫模型(HMM)

4.3 HMM结构设计和参数初始化方法

4.4 实验结果及分析

4.5 小结

5 总结与展望

致谢

硕士期间的研究成果

参考文献

展开▼

摘要

产品外包装上说明文字印刷的正确性对于商家和用户来说都是至关重要的。为了检验包装箱上说明文字的正确性,对包装箱上的印刷汉字进行识别算法的研究。
  印刷质量和摄像机成像等原因造成了包装箱文字图像质量比较差,使得传统的针对高质量汉字图像的识别方法无法直接应用到包装箱表面汉字识别当中。针对包装箱表面汉字图像,采用了两级汉字特征提取和分类方法。
  在对低质量汉字图像进行归一化的过程中,引入了高斯滤波和二值化方法,有效抑制了噪声污染和低对比度对归一化结果的干扰作用。
  粗分类阶段,针对归一化后汉字图像,采用Gabor滤波器提取高鲁棒性的汉字粗分类特征。应用Gabor滤波器旨在将汉字分解成“横撇竖捺”四个方向的笔划特征图,这就降低了Gabor滤波器的设计难度。对Gabor滤波结果进一步提取笔划穿越次数和低频DCT系数,形成最终的粗分类特征。实验证明采用K均值聚类可达到98%的粗分类识别率。
  细分类阶段,将Gabor滤波器对汉字图像的滤波结果与隐马尔可夫模型(HMM)结合起来,用一维HMM为二维汉字建立了模型,实现对汉字的细分类。HMM的状态对应“横撇竖捺”四个笔划特征图。从各个状态中获取观察序列时,提出了一种直观的量化方法。HMM状态和观察符号具有明确的物理意义简化了HMM参数的初始化选择。
  试验结果表明,Gabor滤波器和HMM的结合能够实现对低质量包装箱汉字图像的粗分类和细分类识别,两级综合识别率可达95%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号