首页> 外文期刊>電子情報通信学会技術研究報告. コンピュ-タシステム. Computer Systems >スレッドレベル投機的実行による依存距離不定運搬依存を持つループの並列化
【24h】

スレッドレベル投機的実行による依存距離不定運搬依存を持つループの並列化

机译:循环与线程级投机执行依赖性的并行化

获取原文
获取原文并翻译 | 示例
       

摘要

従来の並列化手法では、イテレーションをまたぐデータ依存(ループ運搬依存)が静的に解析できない場合、データ依存が存在すると仮定し解析を進めるため並列化できない。 しかし、このようなループに対してスレッドレベル投機的実行を適用することにより、プログラムを高速に実行することが可能となる。 本稿では、依存距離不定運搬依存を含むループに対し、従来考慮されてこなかった投機的実行失敗時の復帰処理に必要なオーバヘッドをパラメータとして取り入れ、投機的実行の効果が期待できる部分のみに選択的に投機的実行を適用する方式を提案した。 実際にSPECcpu95ベンチマークの129.compressに適用した結果、IBM pSeries690上において0.7-1.3倍の速度向上を得られることを確認した。
机译:在传统的并行化方法中,如果无法静态地分析迭代的数据相关(循环传递依赖性),则不能通过假设存在数据依赖性来平行以预先分析来预先分析。 然而,通过将线程级推测执行应用于这样的循环,可以高速执行程序。 在本文中,我们介绍了在尚未考虑的推测执行失败时返回处理所需的开销,其通常不可考虑,并且选择性地选择性地对可以预期推测性执行效果的部分。我们提出了一种将投机执行的方法。 由于将SPECCPU 95基准测试应用于129.CEMPRESS,确认在IBM PSERIES 690上可以获得0.7-1.3倍的速度改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号