首页> 中国专利> 从数字化文档提取可搜索的信息

从数字化文档提取可搜索的信息

摘要

本公开内容的各实施例涉及从数字化文档提取可搜索的信息。公开了以不可编辑格式从数字化文档进行数据提取和自动验证。纸质文档被数字化或转换成适合用于存储在计算机或其他数字设备上的格式。数字化文档被分类为多种文档类型中的一种文档类型,并且基于文档类型,文档处理规则被选择用于分析数字化文档以实现数据提取和自动验证。数字化文档中的数据字段的位置和值使用机器学习技术而被获取。数据字段值被自动地验证并且被指派置信度得分。具有低置信度得分的数据字段被标记用于手动检查。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-22

    实质审查的生效 IPC(主分类):G06F17/22 申请日:20180621

    实质审查的生效

  • 2018-12-28

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号