文摘
英文文摘
图目录
表目录
第1章 绪论
1.1 高性能微处理器的发展
1.2 片上高速缓存管理
1.2.1 高速缓存的设计挑战
1.2.2 高速缓存的管理策略
1.3 本文的研究内容及意义
1.4 本文的主要贡献
1.5 本文的组织结构
第2章 高性能微处理器发展概述
2.1 构造高性能微处理器的传统技术
2.1.1 摩尔定律
2.1.2 流水线技术
2.1.3 指令级并行性
2.1.4 多处理器并行性
2.2 线程级并行性
2.2.1 指令级并行性的局限性
2.2.2 存储墙
2.2.3 功耗
2.2.4 线程级并行性
2.2.5 同时多线程
2.3 多核处理器
2.4 小结
第3章 高性能微处理器高速缓存研究现状
3.1 高速缓存
3.1.1 背景及相关术语
3.1.2 片上共享高速缓存
3.2 降低Cache缺失
3.2.1 减少冲突缺失
3.2.2 减少容量缺失
3.2.3 减少一致性缺失
3.3 优化Cache管理策略
3.3.1 优化替换策略
3.3.2 Cache旁路
3.3.3 数据及早淘汰
3.4 多核Cache划分
3.5 混合Cache设计
3.5.1 基于共享Cache的设计方案
3.5.2 基于私有Cache的设计方案
3.6 其他片上存储系统优化技术
3.6.1 高速缓存预取
3.6.2 提高Cache的访问带宽
3.6.3 操作系统级Cache性能优化
3.6.4 一致性协议的优化
3.6.5 内存控制器的优化
3.7 小结
第4章 面向公平性的共享高速缓存划分
4.1 引言
4.2 LRU策略的相关特性
4.2.1 LRU策略的不公平性
4.2.2 LRU策略的栈特性
4.3 SMT处理器二级Cache共享度的研究
4.4 ARP:自适应运行时Cache划分
4.4.1 ARP的硬件结构
4.4.2 ARP的算法描述
4.4.3 替换策略的修改
4.5 性能评价方法
4.6 实验结果及分析
4.6.1 二级Cache的共享度
4.6.2 ARP机制的吞吐量评测
4.6.3 ARP机制的公平性评测
4.6.4 ARP机制的开销
4.7 相关工作
4.8 小结
第5章 基于使用频率的插入提升策略
5.1 引言
5.2 背景
5.2.1 负载特性
5.2.2 Cache插入和提升
5.2.3 相关工作
5.3 无用块消除和低重用块过滤Cache管理
5.3.1 ELF硬件结构
5.3.2 ELF策略
5.4 性能评价方法
5.5 实验结果及分析
5.5.1 性能加速比
5.5.2 Cache块使用频率预测精度分析
5.5.3 对Cache容量的敏感度分析
5.5.4 插入和提升行为
5.5.5 硬件设计开销
5.6 小结
第6章 划 分感知淘汰线程感知插入提升策略
6.1 引言
6.2 背景
6.2.1 负载特性
6.2.2 Cache划分
5.2.3 Cache插入和提升
6.3 共享Cache管理
6.3.1 线程感知提升策略
6.3.2 划分感知淘汰
6.3.3 PAE-TIP
6.4 实验方法
6.5 实验结果及分析
6.5.1 性能加速比
6.5.2 划分控制
6.5.3 插入和提升行为
6.5.4 对流数据的感知
6.5.5 硬件开销
6.6 相关工作
6.7 小结
第7章 总结及未来工作
7.1 本文工作总结
7.2 未来研究工作
参考文献
附录 相关术语
致谢
在读期间发表的学术论文与取得的研究成果
在读期间参与的科研项目