首页> 中国专利> 一种电厂两票系统PDF文档识别文字方法

一种电厂两票系统PDF文档识别文字方法

摘要

本发明公开了一种电厂两票系统PDF文档识别文字方法,该方法先是票据图像预处理,再利用预先通过信息区域训练自学习而构建的信息区域特征数据库,对经过预处理的PDF文档进行信息区域识别;边界和底纹处理,包括对所识别的信息区域进行重叠区域合并、去除底纹干扰、突出字符颜色以及二值化处理;加密/解密PDF文档;从PDF和XFDF的格式中导入或导出表单数据;向已有的PDF文档中追加内容,将一个PDF文档切分为多个文档,覆盖原PDF文档;排序sort为true后,PDF按行读取,保持顺序,最后保存PDF文档。本发明能够以良好的准确率和适应性自动地识别和提取两票数据信息,从而节省票据处理的人力和时间。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-16

    发明专利申请公布后的视为撤回 IPC(主分类):G06K 9/00 专利申请号:2020113709420 申请公布日:20210312

    发明专利申请公布后的视为撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号