...
首页> 外文期刊>電子情報通信学会技術研究報告. バイオメトリクス >並列分散処理における共変量シフトを導入したRandom Forestsの学習
【24h】

並列分散処理における共変量シフトを導入したRandom Forestsの学習

机译:并行分布处理中昌观察转变的随机林学习

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

データの大規模化は,統計的機械学習において高い識別性能を得るために重要な要件の1つであるが,学習時間を増加させる問題がある.しかし複数の計算機やGPUを用いて並列分散処理を適切に用いることができれば,学習時間を大幅に削減できる.本研究では,効率的に並列分散処理を行うモデルとしてMapReduceを採用し,MapReduceモデルに適した識別器の1つであるRandom Forestsの並列分散学習法を提案する.Map処理では,並列分散学習に共有データを導入し,転移学習を行うことで各ワーカノードに割り当てられた学習データあ少量であっても高い識別性能を獲得する.Reduce処理では決定木を削除することで識別時の計算コストを削減する.提案手法では,各ワーカノードに分布の偏りが強いデータが与えられた場合においても,識別性能の低下を防ぐことが可能である.
机译:大规模数据是在统计机器学习中获得高识别性能的重要要求之一,但存在提高学习时间的问题。然而,如果可以使用多个计算机和GPU适当地使用并行色散处理,可以显着降低学习时间。在这项研究中,我们通过MapReduce作为有效分发平行的模型,并提出了一种随机森林的并行色散学习方法,适用于MapReduce模型的一个鉴别器之一。在地图处理中,将共享数据引入并行色散学习,并且执行转换学习,即使分配给每个工作节点的学习数据很小,也要获取高识别性能。减少处理通过删除决策树来减少识别时的计算成本。在所提出的方法中,即使在每个工作节点中提供具有强大分布的数据分布的数据,也可以防止识别性能降低。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号