首页> 中文期刊> 《计算机应用与软件》 >基于Spark的分布式大数据分析算法研究

基于Spark的分布式大数据分析算法研究

         

摘要

随着大数据时代的到来,数据计算的实时性和数据量面临许多挑战.为了满足庞大的数据量和大数据高速处理的要求,研究将Apache作为一种集成的资源管理系统.采用Apache Storm、Apache Spice及SARKRDD处理大型分布式实时数据流,使用Apache Kafka作为消息中间件来支持异步消息的通信.设计一种支持并行运算规则的分布式大数据分析处理算法.实验结果表明:该算法可有效降低海量数据的分析速度,且支持系统内各子系统间的异构信息沟通与数据存储,足以满足高频交易市场的短期趋势预测需求.在高频、大数据处理系统中具有较高的应用价值.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号