大規模並列深層学習のための目的関数の平滑化

机译：平滑目标函数以进行大规模并行深度学习

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

深層学習では極めて冗長な数のパラメータを持つ深層ニューラルネットワーク(DNN) を膨大な学習データを用いて学習することで他の機械学習手法を圧倒する高い性能を発揮している．一方で，DNN の学習には膨大な計算時間がかかるため，大規模並列化によって学習時間を短縮するのが喫緊の課題である．SGD における小さなバッチサイズ(SB : SmallBatch) での学習は確率的なノイズの影響で汎化性能の高い解(Flat Minima) に収束する理論づけとして，SGD のプロセスがRandom Potential のRandom Walk に類似しているという説や，SGD はパラメータの近似ベイズ推定を行なっているとみなせるため，SGD のノイズを調整をすることで良い汎化が期待できるといった研究の報告がある．大きなバッチサイズ(LB : Large Batch) での学習ではそのノイズが適切ではなくなり，局所解から多少のパラメータ変動で誤差が極端に増加するSharp Minima を避けることができず汎化性能が劣化するといった報告や，Keskar らは，SGD を用いたDNN のバッチサイズを増加させた場合，目的関数の勾配が正確になり分散が小さくなることに起因して汎化性能が劣化するとしている．本研究では，汎化性能を改善するための前処理手法であるData Augmentation を，大きなバッチサイズ(LB : Large Batch) での学習に適用し，大規模並列化に伴うバッチサイズの増加により汎化性能が劣化する問題のへの解決手法となるか，また目的関数を平滑化する効果があるのかの検証を行う．

机译：深度学习具有大量冗余参数使用大量的培训数据来学习RAL网络（DNN）通过这样做，它证明了淹没其他机器学习方法的高性能。有。另一方面，学习DNN需要花费大量的计算时间。因此，通过大规模并行化来缩短学习时间是当务之急。这是标题。小批量（新元）（SB：小）由于随机噪声的影响，“批量学习”是一种具有较高泛化性能的解决方案。 SGD过程作为一种融合理论（Flat Minima）类似于随机电位的随机游动从理论上讲，SGD可以对参数进行近似的贝叶斯推断。调整SGD的噪声很好，因为它可以被认为是有研究报告认为可以推广。大包噪声适合在Chisize中学习（LB：大批量）由于局部解的一些参数波动，因此误差非常大。边缘处锐利的最小值无法避免，泛化性能报告说它恶化了，Keskar等人使用了SGD。当DNN的批次大小增加时，目标函数的梯度为正。由于确定性和较小的差异，泛化性能会下降应该是。在本研究中，在提高泛化性能之前数据增强是一种处理方法，具有较大的批处理大小。适用于（LB：Large Batch）中的学习，并伴随大规模并行化解决由于批量大小增加而导致泛化性能下降的问题检查这是一种方法还是具有平滑目标函数的效果作证。

著录项

来源
《情報処理学会;情報処理学会全国大会》|2019年|2.315-2.316|共2页
会议地点
作者
長沼大樹; 横田理央;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. MN-1から学hだこと：大規模並列深層学習向け計算機基盤の作り方 [J] . 土井裕介, 鈴木脩司, 福田圭祐, 電子情報通信学会技術研究報告. インターネットアーキテクチャ. Internet Architecture . 2017,第472期

机译：MN-1是学术H：如何为大规模平行深度学习制作计算机基础
2. MN-1から学hだこと：大規模並列深層学習向け計算機基盤の作り方 [J] . 土井裕介, 鈴木脩司, 福田圭祐, 電子情報通信学会技術研究報告. 技術と社会·倫理. Social Implications of Technology and Information Ethics . 2017,第471期

机译：MN-1是学术H：如何为大规模平行深度学习制作计算机基础
3. 大規模点群データの平滑化手法に関する研究（第2報）: 大規模点群平滑化のためのストリーミング処理 [J] . 増田　宏, rn村上　健治精密工学会誌 . 2010,第6期

机译：大规模点云数据的平滑方法研究（第二次报告）：大规模点云平滑的流处理
4. 大規模並列深層学習のための目的関数の平滑化 [C] . 長沼大樹, 横田理央情報処理学会全国大会 . 2019

机译：大规模平行深度学习的客观功能平滑
5. 大規模関係データベースの並列処理技術に関する研究 [D] . 佐藤, 哲司 1994

机译：大规模关系数据库并行处理技术研究
6. 深層学習に基づく音源情報推定のための確率論的目的関数の研究 [O] . 小泉悠馬 2017

机译：基于深度学习的声源信息估计概率目标函数研究

大規模並列深層学習のための目的関数の平滑化

摘要

著录项

相似文献

相关主题

期刊订阅