...
首页> 外文期刊>電子情報通信学会技術研究報告. 情報ネットワ-ク. Information Networks >Jubatus:Big Dataのリアルタイム処理を可能にする分散処理技術
【24h】

Jubatus:Big Dataのリアルタイム処理を可能にする分散処理技術

机译:Jubatus:分布式处理技术,可实时处理大数据

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Hadoopの登場により、安価なハードウェアを用いて大規模なデータに対する高度な分析手段が普及しつつあり、その分析の精度および速度がビジネスの成否を分けるようになってきた。すなわち、大規模かつ高度な分析をリアルタイム化することが重要となる。そこで我々は大規模かつ高度なリアルタイム分析のための分散機械学習フレームワークJubatusをPFI社と共同開発した。Jubatusのゴールは、(a)オンライン機械学習アルゴリズムなどの分析処理をスケールアウトするように分散処理できること、(b)これらの分散処理をアルゴリズム間で共通化すること、(c)これらの分析処理を容易に試行錯誤しながら利用できるようにすること、の3点である。我々は(a)に関してJubatusに高度な分析をスケールアウトさせるための仕組みとして一貫性要件を緩和したmixというデータの同期機構を組み込み、そのスケールアウト性を碓認した。本稿ではmixの特徴について解説し、一貫性要件の緩和の程度について検証する。
机译:随着Hadoop的出现,使用便宜的硬件对大规模数据进行高级分析的方法正变得越来越普遍,分析的准确性和速度已成为业务成败的关键。换句话说,实时实现大规模和高级分析很重要。因此,我们与PFI共同开发了Jubatus,这是一种用于大规模和高级实时分析的分布式机器学习框架。 Jubatus的目标是(a)能够执行分布式处理以便扩展诸如在线机器学习算法之类的分析处理;(b)使这些分布式处理在算法之间通用;以及(c)使这些分析处理通用。有以下三点:通过反复试验使它易于使用。关于(a),我们引入了一种称为mix的数据同步机制,该机制放松了一致性要求,作为Jubatus扩展高级分析并确认其扩展属性的机制。在本文中,我们解释了混合的特征并检查了一致性要求的松弛程度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号