首页> 中文学位 >乱序处理器访存行为建模
【6h】

乱序处理器访存行为建模

代理获取

目录

声明

摘要

第一章 绪论

1.1 背景和意义

1.1.1 背景

1.1.2 意义

1.2 国内外研究现状

1.3 论文的主要工作与研究目标

1.3.1 主要工作

1.3.2 研究目标

1.4 论文组织

第二章 Cache与传统的Cache模型

2.1 Cache简介

2.1.1 Cache的基本原理

2.1.2 Cache的设计参数

2.2 基于堆栈距离的Cache建模

2.2.1 堆栈距离

2.2.2 利用堆栈距离的Cache建模

2.3 乱序执行机制对访存流的影响

2.3.1 乱序执行的基本原理

2.3.2 乱序执行对访存流的影响因素

2.4 采用ANN对乱序处理器Cache建模

2.4.1 人工神经网络简介

2.4.2 应用ANN构建Cache模型

2.5 本章小结

第三章 基于ANN的乱序访存Cache建模

3.1 前期的基于ANN的Cache模型

3.2 采用聚类算法选取训练集

3.2.1 聚类算法类型介绍

3.2.2 采用K-means聚类算法优化训练集

3.3 采用Cache命中率作为模型输出

3.4 基于ANN的乱序访存Cache模型实现方法

3.4.1 使用Gem5仿真器获取训练数据

3.4.2 使用K-means聚类算法提取训练集

3.4.3 ANN模型训练

3.5 本章小结

第四章 实验结果与分析

4.1 实验环境设置

4.2 基于ANN的Cache模型精度验证

4.2.1 不同训练集对模型精度的影响

4.2.2 不同Cache配置下的模型精度验证

4.3 基于ANN的Cache模型时间分析

4.4 结果分析

4.5 本章小结

第五章 Cache行为模型工具的设计

5.1 Cache行为模型工具的整体架构

5.2 Cache行为模型工具的实现

5.2.1 数据采集模块

5.2.2 聚类模块

5.2.3 ANN模型训练模块

5.2.4 图形用户界面模块

5.2.5 Cache命中率预测模块

5.3 Cache行为模型工具的执行过程

5.3.1 模型训练执行流程

5.3.2 工具使用执行流程

5.3.3 工具的应用场景

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

致谢

参考文献

展开▼

摘要

各级Cache的命中率已经成为评估处理器性能的一个重要的性能参数。研究人员通常使用全仿真、硬件实测或者建立解析模型的方法获取某种配置下的Cache性能表现,但是前两种方法分别有着耗时较长和成本较大的缺点,而现存的解析模型在乱序处理器上跨程序预测精度较差,这使得模型的通用性大为降低。本文延续了本实验室前期基于人工神经网络(ANN)的Cache建模方法,通过对模型训练集的优化提高了模型预测Cache性能的精度。
  本文的主要工作分为了两个部分,第一部分建立了新的训练集选取方法。本文使用聚类算法提取程序内部含有不同访存特性的代码片段,并将其合并为一个训练集。使用该训练集训练的ANN模型有效的提升了跨程序预测Cache命中率的精度。第二部分是将模型实现为了一个完整的工具。前期的Cache解析模型都只是停留在研究性模型的层面,一个可以对Cache设计空间探索提供有效帮助的模型应该具有耗时短,易于操作的特点。为了简化Cache解析模型的使用操作,本文使用python将其实现为一个完整的工具,并留下可扩展接口,以便于之后添加新的功能。
  本文建立的模型在9种Cache配置下分别预测7组不同bench的Cache命中次数,与Gem5全仿真结果相比,模型的平均精度在93%左右,相比较前期的模型,平均精度提升了5%。在时间方面,模型与Gem5时钟精准型仿真相比,最高可以节省90%的时间。另外,本文构建的Cache行为工具脱离了对外部软件的依赖,大幅度地降低了建立和使用模型的操作难度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号