首页> 中国专利> 识别版面阅读顺序的方法及装置

识别版面阅读顺序的方法及装置

摘要

本发明提供一种识别版面阅读顺序的方法,包括:读取待识别版面,并分析该版面以得到版面布局信息和字符文本对象和图像对象的对象属性;根据版面布局信息和对象属性,将字符文本对象合并为文本段落并将图像对象识别为图像段落;采用全局递归切割与局部先后顺序判定相结合的方式来确定文本段落和图像段落的阅读顺序,其中,通过投影来进行全局切割,对于全局切割之后仍包含多个段落的分组,采用局部判定方法来判断段落的先后顺序。相应地,提供一种识别版面阅读顺序的装置。本发明将字符和图像均识别为段落,并采用全局递归切割与局部判定相结合的方式识别段落阅读顺序,从而实现了复杂版面中文本和图像的正确识别,并且效率和准确率高。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-11-06

    授权

    授权

  • 2012-07-11

    实质审查的生效 IPC(主分类):G06F 17/21 申请日:20101125

    实质审查的生效

  • 2012-05-30

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号