首页> 中国专利> 一种半自动提取和结构化文档信息的存储方法及系统

一种半自动提取和结构化文档信息的存储方法及系统

摘要

本发明公开了一种半自动提取和结构化文档信息的存储方法及系统,主要实现对文档信息的半自动分类提取和结构化。系统中WebUI模块提供的Web界面用于支撑项目管理模块、提取项收集模块和用户管理模块;项目管理模块导入待分析的PDF文档;提取项收集模块对待提取列表中的信息进行人工校准和保存;用户管理模块是对用户权限的管理;采用存储模块保存文档元信息和提取项信息;实现对文档信息的自动化提取和结构化,核心采用自动化提取算法模块,用于将上传的文档扫描后自动检测生成提取项的页面预测,同时对提取项收集模块得到的信息进行结构化;本系统实现了对文档信息半自动提取和结构化,使存储的信息更合理化,同时提升了系统的速度和效率。

著录项

  • 公开/公告号CN109636303B

    专利类型发明专利

  • 公开/公告日2020-12-08

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN201811262115.2

  • 申请日2018-10-27

  • 分类号G06Q10/10(20120101);G06F16/951(20190101);G06F16/22(20190101);H04L29/08(20060101);

  • 代理机构42201 华中科技大学专利中心;

  • 代理人曹葆青;李智

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2022-08-23 11:24:45

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号