CMP结构下基于Cache感知线程级并行优化研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

多核时代的到来，处理器的运算能力得到了很大的提升.但由于处理器和主存之间的发展速度的不均衡，“存储墙”的问题越来越严重，成为影响系统性能的瓶颈。在多核体系结构下，多级存储器的出现缓解了这种压力。
　　在典型的CMP(Chip Muti-Processors)体系结构中，多个核共享Cache，不但改善了存储的性能，而且减小了硬件的使用面积。但在此结构下，由于Cache空间小，多个线程共享Cache，将会造成对Cache空间的竞争，使得共享线程的Cache缺失数增加，对系统的性能是非常不利的。本文的主要工作如下:
　　(1) Cache缺失数是衡量系统访存性能的重要指标，为了有效的利用Cache空间，本文通过收集各个线程的访存信息，使得共享线程的Cache空间的需求总和与共享Cache的空间大小相等并合理的划分线程组，在此问题上本文首先将线程的划分模型抽象为求解子集和的问题，并用快速求解子集和的方法求解子集，将其运用到本文的线程优化划分算法TOP(Thread Optimization Partition)中，获得优化的线程组，减少Cache的缺失数。最后通过simple-scalar仿真工具收集线程的数据信息，执行本文的划分算法，实验结果表明，本文提出的线程划分的优化算法(TOP)在程序的总的缺失数百分比相比贪婪的线程划分算法greedy平均减少了17.48％，相比于随机的线程划分算法Random平均减少了14.26％。
　　(2)在已划分的线程组的基础上，分析线程上的数据在程序执行时访存信息，建立数据分配的执行模型，通过一个实例分析并定义本文多核的数据分配问题，以此来描述线程上的数据优化分配，通过本文提出的多核结构下贪婪数据分配算法(M_GDA)和多核的动态规划算法M_DPA对数据进行优化分配，使得同时执行的线程的访存时间最短，减小程序执行时访存时间。最后在本文的数据分配优化模拟器上运行了10个标准的benchmark测试程序来进行验证。实验结果表明，通过多核的动态规划算法(M DPA)对数据进行优化分配后的访存开销相较于随机数据分配算法(Random)平均提高了16.11％，相较于多核贪婪数据(M GDA)分配算法的访存开销提高了14.08％，在能量开销上相较于随机数据分配算法提高了28.02％，相较于贪婪数据分配算法提高了14.40％。

著录项

作者
李兵;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科软件工程
授予学位硕士
导师姓名肖正,彭革刚;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类存贮器;
关键词
存储器; CMP体系结构; Cache空间; 共享线程; 数据分配; 动态规划算法;

相似文献

中文文献
外文文献
专利

1. 面向CMP体系结构的二级CACHE替换算法设计 [J] . 张骏 ,樊晓桠 ,刘松鹤 . 小型微型计算机系统 . 2007,第012期
2. 多核多线程处理器二级Cache预取结构的设计 [J] . 杨可 ,樊晓桠 ,王党辉 . 计算机工程与应用 . 2009,第010期
3. 可交换数据Cache结构的CMP:EDCA-CMP [J] . 陈建党 ,郭松柳 ,王海霞 . 小型微型计算机系统 . 2007,第007期
4. 用线程级推测技术在多核体系结构上并行化科学计算应用 [J] . 王耀彬 ,安虹 ,郭锐 . 小型微型计算机系统 . 2010,第002期
5. 针对子程序结构的线程级推测并行性分析 [J] . 梁博 ,安虹 ,王莉 . 小型微型计算机系统 . 2009,第002期
6. 基于存储级并行的同时多线程电压紧急容错技术 [C] . 胡杏 ,胡瑜 ,李晓维 . 第十四届全国容错计算学术会议 . 2011
7. CMP中一种动态线程划分算法及Cache共享数据的提取方法 [A] . 周灯 . 2012

CMP结构下基于Cache感知线程级并行优化研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅