首页> 中国专利> 基于内存计算、web可视化配置的多数据源ETL工具

基于内存计算、web可视化配置的多数据源ETL工具

摘要

本发明公开了基于内存计算、web可视化配置的多数据源ETL工具,其特征在于包括数据源层、作业层及目标数仓层,数据源层用于连接客户的数据关系数据库;作业层包括数据源层与目标数仓层的映射配置以及基于spark的数据传输模块;映射配置体现在目标数仓层中数仓目标表与数据源层中数据来源业务表之间的关系;基于spark的数据传输模块能够使用spark的dataframe写表的自动建表功能,提高数据传输效率;目标数仓为公司研发的使用经典的4层架构标准数仓。本发明全部基于内存实现,性能相比现有工具和方法更高效。本发明通用性好,基本所有数据源通过Java接口都通用。本发明针对公司内部需要针对性研发,适用于拥有标准的大数据产品及后台表结构的大数据服务公司。

著录项

  • 公开/公告号CN112035468A

    专利类型发明专利

  • 公开/公告日2020-12-04

    原文格式PDF

  • 申请/专利权人 杭州览众数据科技有限公司;

    申请/专利号CN202010856829.7

  • 发明设计人 王一君;陈灿;王长振;谢鸿旺;

    申请日2020-08-24

  • 分类号G06F16/22(20190101);G06F16/25(20190101);G06F16/26(20190101);G06F16/28(20190101);

  • 代理机构33240 杭州君度专利代理事务所(特殊普通合伙);

  • 代理人朱月芬

  • 地址 310000 浙江省杭州市滨江区西兴街道物联网街451号芯图大厦17层

  • 入库时间 2023-06-19 09:07:30

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号