首页> 中文学位 >基于DVFS技术的多核处理器性能和功耗预测模型研究
【6h】

基于DVFS技术的多核处理器性能和功耗预测模型研究

代理获取

目录

声明

缩略语与符号列表

第一章 绪论

1.1 课题背景

1.2 相关研究

1.3 课题研究内容

1.4 主要创新

1.5 论文结构

第二章 多核处理器性能和功耗相关背景

2.1 引言

2.2 多核处理器芯片的资源分布、供电方式与工作状态

2.3 处理器功耗的测量和评估技术

2.4 处理器性能计数器的使用

2.5 本章小结

第三章 跨越DVFS等级的性能预测模型LL-MAB

3.1 引言

3.2 程序执行时间与处理器核频率的关系

3.3 访存时间的估算

3.4 在商用处理器中实现的Leading Loads模型LL-MAB

3.5 实验结果及分析

3.6 LL-MAB的优势与不足

3.7 本章小结

第四章 跨越DVFS等级的功耗预测模型PPEP

4.1 引言

4.2 基于温度和性能计数器的处理器功耗估算模型

4.3 在商用处理器中实现跨越DVFS等级的功耗预测模型PPEP

4.4 线程级功耗模型的获取

4.5 本章小结

第五章 针对CMT体系结构处理器的性能预测模型SCP

5.1 引言

5.2 CMT体系结构简介

5.3 面向CMT体系结构的性能预测模型SCP

5.4 本章小结

第六章 PPEP模型与SCP模型的融合及其应用

6.1 引言

6.2 PPEP模型与SCP模型的融合

6.3 PPEP-SCP在Power Capping中的应用

6.4 本章小结

第七章 结束语

7.1 工作总结

7.2 未来工作

致谢

参考文献

作者在学期间取得的学术成果

附录A 模型中使用的系数列表

展开▼

摘要

随着半导体工艺技术的发展,处理器的片上资源不断增多。囿于单核结构难以通过资源的堆砌及主频的升高继续提高性能,且存在功耗升高过快的问题,多核处理器应运而生,并得到广泛应用。相对于单核处理器,多核处理器在一定程度上缓解了功耗问题,但效果有限。随着片上资源密度的进一步增加,功耗问题仍将变得越来越严重,成为限制处理器进一步发展的瓶颈。因此,功耗问题是当前多核处理器面临的首要挑战。
  动态电压频率调节(DVFS)技术和功耗门控(PG)技术是处理器产品用于调节性能和功耗的重要手段。DVFS技术通过改变处理器的频率和电压来调节处理器的性能和功耗。PG技术通过对供电进行门控来消除空闲处理器核的功耗,通常与线程迁移技术共同使用。本文探索了DVFS技术和PG技术对商用处理器性能和功耗的影响,并为其建立了性能和功耗预测模型。本文提出的模型具有良好的实用性,可在商用处理器平台上,应用于以DVFS和PG为手段的性能和功耗调整策略中。最后,本文以Power Capping场景为例讨论了模型的应用。本文取得的研究成果如下:
  1.提出了一种跨越DVFS等级的性能预测模型LL-MAB。LL-MAB模型是Leading Loads方法在商用处理器中的首次实现。根据AMD处理器Cache中MSHR部件的特点,利用处理器现有硬件事件,在程序执行过程中通过性能计数器统计Cache失效中所有Leading Load的累计时钟周期数。程序的执行时间包括计算时间和访存时间。通过Leading Load的总时钟周期数和处理器核的频率,可以得到访存时间。然后,通过执行时间和访存时间,可以得到计算时间。最终,通过访存时间、计算时间及其它各DVFS等级的频率,预测该程序在其它各DVFS等级的执行时间。LL-MAB模型具有易于实现的特点:无需进行数据拟合,且仅占用两个性能计数器。使用SPEC CPU2006、PARSEC、NPB、Rodinia测试程序集,在Phenom-II X61090T、Opteron4386、A10-5800K三款AMD处理器中进行实验,在2倍以上的频率差异下预测程序执行时间,LL-MAB模型的性能预测精度在94.7%至97.3%之间。
  2.提出了一种跨越DVFS等级的功耗预测模型PPEP。在多核处理器中,建立了适用于各个DVFS等级的功耗估算模型。功耗估算模型分为两部分,包括基于温度的空闲功耗估算模型和基于性能计数器的动态功耗估算模型。此后,依据两个实验观察(每条指令对应的各硬件事件计数值在不同的DVFS等级之间存在的若干相等关系),并将功耗估算模型和LL-MAB性能预测模型相结合,得到PPEP功耗预测模型。PPEP模型能够跨越DVFS等级预测处理器的功耗。在AMD FX-8320处理器中,以SPEC CPU2006、PARSEC、NPB组成测试用例进行实验,在5个DVFS等级间相互预测各用例的平均功耗,预测精度为95.8%。
  3.提出了一种针对聚合多线程(CMT)体系结构的性能预测模型SCP。CMT体系结构是处理器中硬件多线程的一种实现方式,首先出现在AMD Bulldozer处理器中。在这类处理器中,两个硬件线程构成一个计算单元(CU)。不同于同时多线程(SMT)体系结构中所有计算资源都被各硬件线程共享,CMT体系结构为CU中的每个硬件线程保留了部分私有计算资源,包括定点计算单元、L1数据Cache等。此外的其它资源,如浮点单元、L1指令Cache、L2 Cache等,被CU中的两个硬件线程共享。执行程序时,若一个线程独占CU,则称为分离态执行方式;若两个线程分享CU,则称为聚合态执行方式。通过CU间的线程迁移,可以改变程序与硬件资源的映射方式,从而调节处理器的性能和功耗。本文利用性能计数器监测各线程对多种共享资源的使用情况,以线性回归方式建立SCP性能预测模型。当两个线程共享CU运行时,通过SCP模型可以预测它们各自独占CU运行时的I PC;反之,当两个线程各自独占CU运行时,通过SCP模型也可以预测它们共享CU运行时的I PC。在AMD FX-8320处理器中,对29个SPEC CPU2006程序进行两两组合,验证SCP模型的预测精度。从分离态至聚合态的I PC预测精度为93.5%;从聚合态至分离态的I PC预测精度为93.8%。
  4.提出了一种适用于CMT体系结构、能够应对DVFS等级变化及CU间线程迁移的性能及功耗预测模型PPEP-SCP。PPEP-SCP模型通过PPEP模型和SCP模型融合而来,能够跨越DVFS等级,同时跨越线程的分离态与聚合态预测处理器性能与功耗。因此,基于PPEP-SCP可以建立能够同时利用DVFS、线程迁移+PG这两种处理器性能和功耗调节手段的策略。我们以Power Capping场景为例,建立了基于PPEP-SCP的Power Capping策略,该策略能够同时利用上述两种性能和功耗调整手段。同时,我们还建立了基于PPEP的Power Capping策略用于对比。实验表明,PPEP-SCP在利用DVFS的同时,还能通过线程迁移利用PCUPG技术来调节处理器性能和功耗。因此,基于PPEP-SCP的Power Capping策略相对于基于PPEP的Power Capping策略,能够使处理器实际功耗与目标功耗的吻合度更高,并获得更好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号