首页> 中文期刊> 《长春理工大学学报(自然科学版)》 >基于Storm非合作博弈调度的ETL研究

基于Storm非合作博弈调度的ETL研究

         

摘要

实时ETL(Extract-Translation-Load)打破了传统数据仓库离线批处理模式,采用了实时流处理策略,将变更数据发送至目标仓库.研究目的是降低ETL过程处理延迟,在短时间内确保源端和目标端数据一致性.采用了纯流式数据处理框架Storm研究ETL流程.变更数据捕获(CDC)作为ETL流程的关键步骤,当面对海量数据时,传统的基于快照捕获变更的方法,因延时高阻碍了实时ETL发展.Storm默认采用轮询调度算法,忽视了工作节点间网络通信开销以及集群负载均衡的问题.针对传统变更捕获方法存在延迟高的问题,提出了基于变更数据标记捕获算法(C D M C).针对Storm默认调度存在的问题,提出了基于非合作博弈的Storm调度算法(Game-Storm).Storm通过组件Spout提取源端变更数据,交于逻辑处理组件Bolt,最终加载至目标仓库.综合考虑了标记捕获策略和博弈调度策略,形成了ETL流程的优化策略(GS-M-ETL).实验分析表示,这种新方法使ETL处理延迟降低了29.5%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号