乱序处理器访存行为建模

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

各级Cache的命中率已经成为评估处理器性能的一个重要的性能参数。研究人员通常使用全仿真、硬件实测或者建立解析模型的方法获取某种配置下的Cache性能表现，但是前两种方法分别有着耗时较长和成本较大的缺点，而现存的解析模型在乱序处理器上跨程序预测精度较差，这使得模型的通用性大为降低。本文延续了本实验室前期基于人工神经网络(ANN)的Cache建模方法，通过对模型训练集的优化提高了模型预测Cache性能的精度。
　　本文的主要工作分为了两个部分，第一部分建立了新的训练集选取方法。本文使用聚类算法提取程序内部含有不同访存特性的代码片段，并将其合并为一个训练集。使用该训练集训练的ANN模型有效的提升了跨程序预测Cache命中率的精度。第二部分是将模型实现为了一个完整的工具。前期的Cache解析模型都只是停留在研究性模型的层面，一个可以对Cache设计空间探索提供有效帮助的模型应该具有耗时短，易于操作的特点。为了简化Cache解析模型的使用操作，本文使用python将其实现为一个完整的工具，并留下可扩展接口，以便于之后添加新的功能。
　　本文建立的模型在9种Cache配置下分别预测7组不同bench的Cache命中次数，与Gem5全仿真结果相比，模型的平均精度在93％左右，相比较前期的模型，平均精度提升了5％。在时间方面，模型与Gem5时钟精准型仿真相比，最高可以节省90％的时间。另外，本文构建的Cache行为工具脱离了对外部软件的依赖，大幅度地降低了建立和使用模型的操作难度。

著录项

作者
李宽;
展开▼
作者单位

东南大学;

展开▼
授予单位东南大学;
学科集成电路工程
授予学位硕士
导师姓名凌明,虞建立;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类运算器和控制器（CPU）;
关键词
乱序处理器; 访存行为; 堆栈距离分布; BP神经网络; Cache行为模型; 聚类分析;

相似文献

中文文献
外文文献
专利

1. 基于无冲突访存规则的高性能FFT处理器的设计与实现 [J] . 徐礼晗 ,景佳 ,许丁鸿 . 微电子学与计算机 . 2021,第1期
2. 面向图计算应用的处理器访存通路优化设计与实现 [J] . 张旭 ,常轶松 ,张科 . 国防科技大学学报 . 2020,第002期
3. 处理器访存子系统关键队列的性能建模 [J] . 李文青 ,吴畏 ,章隆兵 . 高技术通讯 . 2020,第007期
4. 众核处理器访存链路接口的FPGA验证 [J] . 周宏伟 ,徐实 ,王忠奕 . 国防科技大学学报 . 2018,第003期
5. 多核处理器系统I/O访存优化研究 [J] . 李鹏 ,曾露 ,王焕东 . 高技术通讯 . 2018,第006期
6. 多/众核处理器访存行为研究 [C] . 张昆 ,郝子宇 . 全国抗恶劣环境计算机第二十五届学术年会 . 2015
7. 多核处理器共享级Cache访存行为建模 [A] . 张凌峰 . 2017

乱序处理器访存行为建模

目录

摘要

著录项

相似文献

相关主题

期刊订阅