首页> 中文期刊> 《图象识别与自动化》 >在图像中提取多种语言文本的高斯混合模型和相邻字符的学习

在图像中提取多种语言文本的高斯混合模型和相邻字符的学习

     

摘要

本文提出了一种基于统计模型和相邻字符的学习,在图像中提取多种语言文本的方法。三种相邻字符可以用高斯混合模型和通过“伪概率”定义的贝叶斯结构识别来表示。基于该模型,完整的文本提取由二值化图像根据相邻字符或非字符的判别,标识每个相连部件,基于数字结构的方法用来检测和连接每个分割的字符。Voronoi分割方法考虑建立相邻的连接部件。在本文的提取算法中,进一步提出了运用基于最大——最小相似性(MMS)训练算法的判别标准来评估参数。提取中英文文本的实验结果表明,在试验数据集中,MMS训练算法可实现93.56%的准确率和98.55%的重复利用率。实验也显示了MMS提供的重要特性,并与最大相似性(ML)标准和最大分类误差(MCE)训练作了比较。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号