首页> 中国专利> 一种优化Spark和机器学习框架整合的方法及装置

一种优化Spark和机器学习框架整合的方法及装置

摘要

本发明公开一种优化Spark和机器学习框架整合的方法及装置,其中,该方法包括:使用Spark的数据源接口读取数据和处理数据,生成DataFrame类型的数据;处理后的DataFrame数据,在数据转换模块,转换为Arrow格式的数据;Arrow格式的数据通过Ray框架,传递给TensorFlow、Pytorch等机器学习框架使用;Ray集群调度机器学习框架。本发明将大数据处理和机器学习算法运行在同一套系统;机器学习算法可以直接访问HDFS、MySQL、Elasticsearch等系统的数据,避免昂贵的数据传输成本,降低端到端学习延迟;多套机器学习框架,可以使用同一套框架,无需为每类机器学习算法构建各自的集群;机器学习框架可以有效的隔离GPU、CPU等资源。

著录项

  • 公开/公告号CN114185519A

    专利类型发明专利

  • 公开/公告日2022-03-15

    原文格式PDF

  • 申请/专利权人 中盈优创资讯科技有限公司;

    申请/专利号CN202111490756.5

  • 发明设计人 周朝卫;

    申请日2021-12-08

  • 分类号G06F8/20(20180101);G06F8/30(20180101);G06N20/00(20190101);

  • 代理机构31407 上海嘉蓝专利代理事务所(普通合伙);

  • 代理人金波

  • 地址 200000 上海市嘉定区安亭镇杭桂路1112号10层1004室-4

  • 入库时间 2023-06-19 14:31:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号