首页> 外文期刊>電子情報通信学会技術研究報告 >Jubatus:BigDataのリアルタイム処理を可能にする分散処理技術
【24h】

Jubatus:BigDataのリアルタイム処理を可能にする分散処理技術

机译:Jubatus:分布式处理技术,可实时处理BigData

获取原文
获取原文并翻译 | 示例
           

摘要

Hadoopの登場により、安価なハードウェアを用いて大規模なデータに対する高度な分析手段が普及しつつあり、その分析の精度および速度がビジネスの成否を分けるようになってきた。すなわち、大規模かつ高度な分析をリアルタイム化することが重要となる。そこで我々は大規模かつ高度なリアルタイム分析のための分散機械学習フレームワークJubatusをPFI社と共同開発した。Jubatusのゴールは、(a)オンライン機械学習アルゴリズムなどの分析処理をスケールアウトするように分散処理できること、(b)これらの分散処理をアルゴリズム間で共通化すること、(c)これらの分析処理を容易に試行錯誤しながら利用できるようにすること、の3点である.我々は(a)に関してJubatusに高度な分析をスケールアウトさせるための仕組みとして一貫性要件を緩和したmixというデータの同期機構を組み込み、そのスケールアウト性を確認した。本稿ではmixの特徴について解説し、一貫性要件の緩和の程度について検証する。
机译:随着Hadoop的出现,使用廉价硬件对大型数据进行复杂分析的方法已经普及,并且分析的准确性和速度已在业务成败之间产生了区别。换句话说,实时进行大规模和复杂的分析很重要。因此,我们与PFI共同开发了Jubatus,这是一种用于大规模和高级实时分析的分布式机器学习框架。 Jubatus的目标是(a)可以执行分布式处理以扩展诸如在线机器学习算法之类的分析处理;(b)可以在算法之间共享分布式处理;以及(c)可以执行分析处理。通过试错法可以轻松使用它有三点。我们有一个称为mix的数据同步机制,放宽了一致性要求,作为针对(a)扩展到Jubatus的高级分析的机制。 ,并确认了其横向扩展特性。本文介绍了混合的特性,并研究了一致性要求的放松程度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号