首页> 外文OA文献 >Accélération de l'algorithme du lancer de rayons en environnement parallèle hétérogène
【2h】

Accélération de l'algorithme du lancer de rayons en environnement parallèle hétérogène

机译:异构并行环境中光线跟踪算法的加速

摘要

Le lancer de rayons permet d'obtenir une grande précision pour simuler des phénomènes de rayonnements physiques, et ce dans des domaines très variés. Malgré sa relative simplicité, celui-ci pose de multiples problèmes lorsqu'il s'agit de le rendre performant. Les architectures matérielles modernes proposent un parallélisme croissant, symbolisé par une augmentation du nombre de cœurs de calculs disponibles, que ce soit sur CPU ou sur GPU. L'algorithme du lancer de rayons se doit de tirer parti de cette puissance de calcul disponible. En effet, au lieu de traiter les rayons de manière séquentielle, les traiter parallèlement permet d'augmenter significativement les performances. Nos contributions s'étalent sur l'ensemble des éléments clefs pour l'accélération de l'algorithme du lancer de rayons. La première permet d'accélérer la construction d'une structure d'accélération : un KD-Tree. Cette méthode permet d'accélérer la construction en utilisant conjointement le CPU et le GPU, et se compare avantageusement aux méthodes précédemment publiées. Notre seconde contribution permet la répartition des tâches de traversées du KD-Tree entre les CPU et GPU de manière transparente pour l'utilisateur. Notre troisième contribution concerne le test d'intersection rayon-triangle appliqué au KD-Tree et permet de maximiser l'utilisation des instructions SIMD des CPU lors de l'intersection tout en maitrisant la consommation mémoire et préservant les performances sur GPU. Enfin, notre dernière contribution est plus générale, et permet de répartir automatiquement de manière parallèle et transparente des calculs entre les unités de calculs hétérogènes.
机译:光线跟踪使获得非常高的精度来模拟物理辐射现象,并且在非常不同的领域中也是如此。尽管它相对简单,但是在使其变得高效时却提出了多个问题。现代硬件体系结构提供了越来越多的并行性,其标志是CPU或GPU上可用处理内核数量的增加。光线跟踪算法必须利用这种可用的计算能力。实际上,代替顺序地处理射线,并行处理它们可以显着提高性能。我们的贡献分布在加速光线跟踪算法的所有关键要素上。首先是加速结构的加速:KD-Tree。这种方法可以通过联合使用CPU和GPU来加快构建速度,并且可以与以前发布的方法进行比较。我们的第二个贡献是使KD-Tree交叉任务以透明的方式在用户之间分布在CPU和GPU之间。我们的第三项贡献涉及应用于KD-Tree的半径-三角形相交测试,它使得可以在相交处最大程度地利用CPU的SIMD指令,同时控制内存消耗并保持GPU的性能。最后,我们的最后贡献是更一般的,并且允许以并行且透明的方式自动分布异构计算单元之间的计算。

著录项

  • 作者

    Roccia Jean-Patrick;

  • 作者单位
  • 年度 2013
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"fr","name":"French","id":14}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号