首页> 外文会议>2000 IEEE International Conference on Systems, Man, and Cybernetics, 2000 >Partitioning regular grid applications with irregular boundariesfor cache-coherent multiprocessors
【24h】

Partitioning regular grid applications with irregular boundariesfor cache-coherent multiprocessors

机译:对具有不规则边界的常规网格应用程序进行分区用于高速缓存一致性多处理器

获取原文

摘要

We consider the problem of partitioning applications that operateon a regular grid but have irregular boundaries for a cache-coherentmultiprocessor. Domain decomposition techniques such as RSB havecommonly been used to reduce interprocessor communication in messagepassing multiprocessors. We apply these partitioning algorithms oncache-coherent multiprocessors to reduce cache-coherency traffic. Wefind that the actual cache-coherency traffic is approximately double theestimated true coherency traffic, primarily due to false-sharing and theconsequent false coherency traffic. We devise two techniques thateliminate false sharing traffic in partitions produced using the commondomain decomposition algorithms. In our compensation algorithm, wemodify the partition produced by the domain decomposition to ensure thatall the nodes on a cache line are assigned to the same processor. In ourcoalescing algorithm, nodes belonging to the same cache line arecoalesced into a single node and the weights on nodes and arcs adjustedto represent the overall computation and communication costs of thecoalesced nodes. This coalesced graph is partitioned using a domaindecomposition algorithm and then the coalesced nodes in the partitionare expanded. Our experimental results using an Indian Ocean circulationapplication on the KSR1 multiprocessor demonstrate that compensationreduces coherency traffic by as much as 55% and execution time by up to18% and that graph coalescing reduces coherency traffic by up to 74%
机译:我们考虑对运行的应用程序进行分区的问题 在常规网格上,但对于不规则的缓存一致性具有不规则的边界 多处理器。诸如RSB之类的域分解技术具有 通常用于减少消息中的处理器间通信 传递多处理器。我们将这些划分算法应用于 高速缓存一致性多处理器,以减少高速缓存一致性流量。我们 发现实际的缓存一致性流量大约是 估计的真实相关流量,主要是由于虚假共享和 结果是虚假的一致性流量。我们设计了两种技术 消除使用通用产生的分区中的虚假共享流量 域分解算法。在我们的补偿算法中, 修改域分解产生的分区,以确保 高速缓存行上的所有节点都分配给同一处理器。在我们的 合并算法,属于同一缓存行的节点是 合并为一个节点,并调整节点和圆弧上的权重 代表 合并的节点。使用域对这个合并的图进行分区 分解算法,然后是分区中的合并节点 被扩展。我们使用印度洋环流的实验结果 KSR1多处理器上的应用程序证明了补偿 将一致性流量减少多达55%,并将执行时间减少多达 18%的图表合并减少了74%的一致性流量

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号