首页> 外文学位 >Cache-oblivious scientific computing.
【24h】

Cache-oblivious scientific computing.

机译:缓存可忽略的科学计算。

获取原文
获取原文并翻译 | 示例

摘要

Scientific computing is the field of constructing mathematical models from science and engineering problems and providing numerical solution techniques. The cache-oblivious paradigm is a novel technique for designing algorithms and analyzing algorithm efficiencies. One advantage of cache-oblivious analysis over the traditional RAM (Random Access Model) lies in the consideration of hierarchical structures of modern computers. In this dissertation, we develop new algorithms and data layouts for scientific computing with better cache performances. We construct cache-oblivious iterative linear solvers, cache-oblivious mesh generation algorithms, and cache-oblivious particle simulation algorithms. To our knowledge, our work is the first attempt to adapt the cache-oblivious paradigm to scientific computing.We describe our cache-oblivious mesh layout algorithms and cache-oblivious linear solver. We present a new algorithm for generating decomposition trees. We then show that our mesh layout algorithms---which run in near optimal time and nearest optimal memory transfers---enable optimal mesh update algorithms. We demonstrate an optimal cache-oblivious linear solver using our mesh update algorithm.We present two quadtree generation algorithms. These algorithms perform nearly optimally in both the time complexity and cache complexity. We then show how to generate meshes from point sets with near optimal cache complexity and optimal time complexity.We construct cache-oblivious particle simulation algorithms. We study methods of laying out input data for the Fast Multipole Method (FMM) on uniformly distributed particles and give an optimal algorithm solving FMM on such layout.
机译:科学计算是根据科学和工程问题构建数学模型并提供数值解法技术的领域。忽略缓存的范例是一种用于设计算法和分析算法效率的新颖技术。相对于传统RAM(随机访问模型)而言,缓存忽略分析的优势之一在于考虑了现代计算机的分层结构。本文为具有更好缓存性能的科学计算开发了新的算法和数据布局。我们构造了可忽略高速缓存的迭代线性求解器,可忽略高速缓存的网格生成算法和可忽略高速缓存的粒子模拟算法。据我们所知,我们的工作是将不懂缓存的范例应用于科学计算的第一次尝试。我们描述了不懂缓存的网格布局算法和不懂缓存的线性求解器。我们提出了一种生成分解树的新算法。然后,我们证明我们的网格布局算法-在接近最佳时间和最接近的最佳内存传输中运行-启用了最佳网格更新算法。我们使用网格更新算法演示了一种可以忽略缓存的最优线性求解器。我们提出了两种四叉树生成算法。这些算法在时间复杂度和缓存复杂度方面几乎都达到最佳性能。然后,我们展示了如何从具有最佳缓存复杂度和最佳时间复杂度的点集生成网格。我们构造了可忽略缓存的粒子模拟算法。我们研究了在均匀分布的粒子上为快速多极子方法(FMM)布置输入数据的方法,并给出了在这种布局上求解FMM的最佳算法。

著录项

  • 作者

    Wang, Kebin.;

  • 作者单位

    Boston University.;

  • 授予单位 Boston University.;
  • 学科 Computer Science.
  • 学位 Ph.D.
  • 年度 2010
  • 页码 99 p.
  • 总页数 99
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号