首页> 外国专利> Method and system for using OCR data for grouping and classifying documents

Method and system for using OCR data for grouping and classifying documents

机译:使用OCR数据对文档进行分组和分类的方法和系统

摘要

A document template for classifying documents is created for each document class. The document template includes a set of keywords and the spatial relations of the keywords. A document to be classified is received. The spatial relations of the template keywords of a template are compared with the spatial relations of corresponding words in the document. If the spatial relations are the same, the document may be classified in the document class of the template.
机译:为每个文档类别创建一个用于对文档进行分类的文档模板。文档模板包括一组关键字和这些关键字的空间关系。收到要分类的文件。将模板的模板关键字的空间关系与文档中相应单词的空间关系进行比较。如果空间关系相同,则可以将文档分类在模板的文档类别中。

著录项

  • 公开/公告号US8724907B1

    专利类型

  • 公开/公告日2014-05-13

    原文格式PDF

  • 申请/专利权人 STEVEN SAMPSON;YANN PRUDENT;

    申请/专利号US201213432251

  • 发明设计人 STEVEN SAMPSON;YANN PRUDENT;

    申请日2012-03-28

  • 分类号G06K9/68;

  • 国家 US

  • 入库时间 2022-08-21 16:04:55

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号