文档图像汉字检索方法

         

摘要

目的提出一种在文档图像中检索汉字的方法,解决快速检索文本图像问题.方法通过对文档图像的版面分割,找到版面上各个图形、图像和文本子区域.根据版面分割后抽取的子区域特征,采用遗传算法的基本思想,对每个文本图像子区域进行快速搜索.无需提取任何字符图像特征,也无需要遍历整个页面就可找到所需要的内容.结果在使用二值图像表达的文档中,也能够达到搜索字符的目的.结论在数字图书馆技术中,实现了搜索文档图像中符号信息内容,为数字资源的检索开辟了一种新的途径.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号