第一个书签之前
摘 要
ABSTRACT
绪论
课题背景
存储墙问题
功耗墙问题
众核和异构的发展趋势
相关研究
Cache功耗问题
CPU Cache 性能优化
GPGPU 存储性能优化
异构众核融合体系结构的研究
课题研究内容
Cache 功耗优化
Cache 性能优化
本文的工作与创新
论文结构
面向低功耗的Cache路划分方法
背景和研究动机
基于程序存储区的Cache路划分方法
基于程序存储区的Cache分区
基于程序存储区的路划分方法
实验结果和分析
模拟环境
性能分析
能耗分析
路划分策略分析
小结
消除标识检查的Cache功耗优化方法
研究动机
消除标识检查的Cache设计
CWR结构设计
TCE在流水线中的基本设计
TCE工作流程
一致性和准确性
Cache对TCE直接访问的支持
基本TCE设计下的CWR命中率
优化策略
能耗模型和仿真环境
能耗模型
系统配置
实验结果和分析
TCE性能分析
能耗分析
功耗和性能对比分析
灵敏度分析
ARM指令集实验
小结
众核体系结构Cache动态分配方法
背景和研究动机
GPGPU 体系结构
GPGPU编程模型
研究动机
SCA的基本算法和设计
重用信息收集
Cache概率分配方法
基于反馈的优化
实验结果和分析
实验配置
性能和分析
小结
面向Cache性能的众核处理器并发度分配
研究动机
Cache静态分配
静态Warp划分
访存模式和局部性
访存模式
Cache和并发线程的分配
设计概览
访问模式识别
局部性探测
数据足迹估计
确定缓存Warp的数量
确定运行Warp的数量
实验结果和分析
实验方法
程序中的访问模式
设计因素分析
动态CCA性能和分析
Cache失效率
小结
结束语
工作总结
未来研究方向
致谢
参考文献
作者在学期间取得的学术成果
缩略语与符号列表