首页> 中文会议>第14届中国少数民族语言文字信息处理学术研讨会 >多语种文本图像中的文字语种辨识方法的研究

多语种文本图像中的文字语种辨识方法的研究

摘要

本文针对汉字、朝鲜文字和英文单词混合的文本图像提出了采用主成分分析技术以文字为单位进行文种辨识的方法.首先,通过主成分分析方法构造特征空间,并且把分割的文字映射到此空间得到重构文字;其次,计算原图像和重构图像的水平和垂直方向直方图的相对熵;最后,根据原图像和重构图像之间的欧式距离和相对熵来判别文字语种.实验表明,本文提出的方法在没有分割错误的情况下,能获得99.78%的识别准确率,有效地解决了在汉朝英三种文字混合构成的文档图像中文种辨识问题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号