首页> 外国专利> System and method of extracting data from structured and unstructured sources of data using automated joins

System and method of extracting data from structured and unstructured sources of data using automated joins

机译:使用自动联接从结构化和非结构化数据源提取数据的系统和方法

摘要

System and method for creating enabling the user to select fields from a database, semi structured or unstructured documents that produces an automated process of joining the database tables, semi structured or unstructured documents into a feature vector that can be further processed by machine learning algorithms or preprocessing routines and filters. The full join performed starts by producing a graph representation of the links between data tables/documents and then restructuring the information into the most efficient join tree. The join tree then extracts the data in the form of a feature vector.
机译:用于创建的系统和方法使用户能够从数据库,半结构化或非结构化文档中选择字段,从而产生将数据库表,半结构化或非结构化文档连接到特征向量的自动化过程,可以通过机器学习算法或预处理程序和过滤器。完整的连接首先要生成数据表/文档之间链接的图形表示,然后将信息重构为最有效的连接树。然后,连接树以特征向量的形式提取数据。

著录项

  • 公开/公告号US2018322166A1

    专利类型

  • 公开/公告日2018-11-08

    原文格式PDF

  • 申请/专利权人 ATLANTIC TECHNICAL ORGANIZATION;

    申请/专利号US201715588435

  • 发明设计人 ARTURO GEIGEL;VICTOR RIVERA;

    申请日2017-05-05

  • 分类号G06F17/30;G01C21/34;

  • 国家 US

  • 入库时间 2022-08-21 12:56:49

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号