首页> 外国专利> Automatic Hierarchical Classification and Metadata Identification of Document Using Machine Learning and Fuzzy Matching

Automatic Hierarchical Classification and Metadata Identification of Document Using Machine Learning and Fuzzy Matching

机译:基于机器学习和模糊匹配的文档自动分层分类和元数据识别

摘要

A hierarchical document classification system is disclosed. The system includes a text-based document classifier model for classifying an input electronic document into one of a set of predefined document categories. The system further includes an image-based metadata identification model for classifying electronic documents of a particular document category into a set of metadata categories. The system further includes a fuzzy text matcher for supplementing classification accuracy of the image-based metadata identification model to obtain a metadata category for the input electronic document.
机译:公开了一种分层文档分类系统。该系统包括基于文本的文档分类器模型,用于将输入电子文档分类为一组预定义文档类别中的一个。该系统还包括基于图像的元数据识别模型,用于将特定文档类别的电子文档分类为一组元数据类别。该系统还包括模糊文本匹配器,用于补充基于图像的元数据识别模型的分类准确性,以获得输入电子文档的元数据类别。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号