首页> 中国专利> 一种文档图像分类方法

一种文档图像分类方法

摘要

本发明公开了一种文档图像分类方法,包括:1、基于深度卷积神经网络,对文档图像进行图像内容特征提取;2、以1为输入利用目标检测框架对文档中的各关键信息条目位置进行检测回归;3、通过2中回归的各关键信息条目的坐标信息,裁剪抽取出各关键信息条目所在位置对应的图像内容特征的特征信息集合;4、基于2中检测的各关键信息条目的相对位置关系,按照预设排序逻辑对3中提取的特征信息集合进行顺序重组;5、利用可变长输入的深度循环网络对4中重组后的特征信息集合,进行深度融合并最终给出文档图像的分类结果。本发明利用CNN+RNN的技术巧妙地组合了图像文本内容特征和图像中内容的布局特征信息;整体精度能达到98%的准确率。

著录项

  • 公开/公告号CN109344815B

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 深源恒际科技有限公司;

    申请/专利号CN201811526387.9

  • 发明设计人 侯进;黄贤俊;

    申请日2018-12-13

  • 分类号G06K9/00(20060101);G06F16/35(20190101);

  • 代理机构11335 北京汇信合知识产权代理有限公司;

  • 代理人孙民兴

  • 地址 100086 北京市海淀区知春路113号0706-003

  • 入库时间 2022-08-23 12:18:26

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号