首页> 外文OA文献 >村田法のスレッド並列化によるマルチコアCPU上での実対称帯行列帯幅縮小操作の高速化
【2h】

村田法のスレッド並列化によるマルチコアCPU上での実対称帯行列帯幅縮小操作の高速化

机译:Murata的线程并行化在多核CPU上加速实际对称带宽矩阵带宽缩减操作

摘要

本論文は固有値計算における帯幅縮小操作において、高いデータ再利用効率を持つ村田法を複数の同期方式を用いて並列化した際の性能を比較し、特性についてまとめたものである。固有値計算は基礎的な数値計算であり多くの分野で使用されている。反復計算の内部で用いられることもあり、高速化は重要な課題である。一般的に固有値計算は三重対角行列を経由することで高速に計算を行う。Bischofらは三重対角化操作を帯行列化と帯幅縮小の二段階に分けることでデータ再利用性が高い行列-行列積を用いて実行する手法を提案し、現在主流の方法となりつつある。村田法はHouseholderを用いた帯幅縮小操作である。反復計算により変換を行い、反復の一部過程において計算範囲が重複しないため、並列に実行することが可能である。しかしながら、村田法の並列実行は頻繁にデータの同期処理が発生する。同期処理はコストが高く、性能に影響を与える可能性がある。そのため同期回数が異なる3種類の同期方式に基づき並列実装を行い、性能の比較を行った。また性能差が発生した場合の原因として考えられるキャッシュミス回数と同期処理回数、全体に占める同期処理の割合を測定することで原因の考察を行った。Intel Core i7 2600Kプロセッサ(4コア)上で性能を測定したところ、論文中で典型的なベンチマーク行列として扱っている行列サイズ10240、帯幅96において、村田法による縮小操作はLAPACKによる帯幅縮小操作より1.89倍高速化した。さらに村田法のスレッド並列実行を行うことで、8スレッド並列実行を行った場合は1スレッド逐次実行の場合より3.93倍高速化を行うことができた。また同期方式の違いにより4スレッド並列実行の時実行速度に1.12倍の差が発生し、8スレッド並列実行の時2.15倍差が発生した。一部同期方式では特定のスレッド数で同期処理が頻発し、低速化する事態が発生し、これらの結果から同期方式と実行時間の間に明確な相関があることが確認された。主な要因としてキャッシュミスによるペナルティが考えられ、性能分析からも関係が裏付けられている。また同期回数と同期処理の割合から、同期回数よりも、同期処理単体のオーバヘッドが性能に影響を与えることがわかった。今後の課題として本研究を反映させ、並列性を最大に高めた調歩方式による同期の実装、より大きな行列に対する計算を行うため並列化方法を変更したMPIによるプロセス並列化の適用が考えられる。
机译:在本文中,我们比较了具有高数据重用效率的村田方法与本征值计算中带宽减少操作中的多种同步方法的并行性能,并总结了其特点。特征值计算是一种基本的数值计算,并用于许多领域。由于它也在迭代计算中使用,因此加速是一个重要的问题。通常,通过穿过三对角矩阵来高速执行特征值计算。 Bischof等人提出了一种通过将三对角化操作分为带状矩阵形成和带宽减小两个阶段来使用具有高数据可重用性的矩阵矩阵乘积执行的方法,并且该方法正成为当前的主流方法。 ..村田方法是使用Householder的带宽减少操作。可以并行执行,因为转换是通过迭代计算执行的,并且计算范围在迭代过程的一部分中不会重叠。但是,村田方法的并行执行经常引起数据同步处理。同步处理非常昂贵,并且可能会影响性能。因此,基于三种具有不同同步次数的同步方法执行并行实现,并比较了性能。此外,通过测量高速缓存未命中的数量和同步处理的数量(这些被认为是性能差异的原因)以及同步处理相对于整体的比率来考虑原因。当在Intel Core i7 2600K处理器(4核)上测量性能时,Murata方法的缩减操作是LAPACK的带宽缩减操作,矩阵大小为10240,带宽为96,在本文中被视为典型的基准矩阵。快1.89倍。此外,通过执行Murata方法的线程并行执行,执行8线程并行执行的速度比执行1线程串行执行时的速度快3.93倍。另外,由于同步方法的差异,并行执行四个线程时执行速度的差异为1.12倍,并行执行八个线程时执行速度的差异为2.15倍。从这些结果可以确认,在同步方法和执行时间之间存在明显的相关性,这是因为在部分同步方法中,在一定数量的线程中频繁发生同步处理,并且情况变慢。主要原因被认为是由于高速缓存未命中而造成的损失,性能分析证实了这种关系。从同步的数量和同步处理的比率,发现同步处理的开销单独影响性能而不是同步的数量。作为未来的任务,我们将考虑通过最大化并行度的异步方法实现同步,并通过MPI应用进程并行化来改变并行化方法,以便对较大的矩阵进行计算。

著录项

  • 作者

    白澤 孝仁;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 ja
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号