基于数据访问模式挖掘的磁盘数据预取技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

计算机系统计算单元与存储单元的性能差距越来越大。存储系统性能的优化对文件系统乃至计算机的整体性能提高有非常重要的作用。数据预取技术是重要的优化手段之一，它不仅用在CPU内部预取指令与数据，更是在数据存储领域得到广泛的研究与应用。
　　然而，大多数的缓存预取算法对应用程序的访问模式有较严格的前提或者假设，使得算法只能优化特定的一类应用程序。本文试图使用数据挖掘的手段从应用程序的数据访问历史中找到其访问模式，以此来帮助预取程序识别访问模式，并做出正确的预取决策。我们的算法不对应用程序做假设，只依赖挖掘出来的访问模式。
　　本文在回顾了一些具有代表性的研究成果和Linux内核所实现的预取算法的基础上，提出了在系统更底层实施预取算法的构想。
　　本文提出了面向预测的关联规则，讨论了这种规则的约束条件以及区别于一般关联规则的特点，重点讨论了时间约束条件对规则的挖掘和应用方面的影响。并指出磁盘的数据访问模式可以用这样的关联规则表示，同时它也能直接用于预取算法中对磁盘访问的预测。在第三章中我们详细讨论了规则挖掘算法设计要点与优化手段。
　　为了达到预取程序所需的实时性，规则的匹配也要求具有较强的实时性。在第四章我们讨论了基本的规则匹配算法以及实时性更佳的基于布隆过滤器的匹配算法。该方法可以避免几乎全部的无效查询。实验表明，每次规则匹配中，该算法几乎能保证一次查询就匹配到规则数据库中的结果。
　　最后文章给出了一个模拟仿真实验环境，在此环境中可以评估本文提出的挖掘、预取算法的性能指标。为了能获取任意真实应用程序的磁盘访问行为，本文还给出了一个在Linux内核中实现的磁盘访问记录抓取程序。作者使用这个工具分别记录下系统运行OLTPBench程序和编译一次Linux内核时，发生的所有磁盘访问记录。连同另外一个公共数据集[54]测试了算法的可行性与性能指标。实验表明，预取算法能够明显提升应用程序的响应时间，并达到了良好的实时性。

著录项

作者
朱凌宇;
展开▼
作者单位

西南大学;

展开▼
授予单位西南大学;
学科计算机系统结构
授予学位硕士
导师姓名肖国强;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
关联规则; 磁盘数据; 预取技术; 挖掘算法;

相似文献

中文文献
外文文献
专利

1. 基于深度优先序列模式挖掘的预取模型 [J] . 卫琳 ,石磊 . 计算机工程与应用 . 2007,第020期
2. S-RAID 5:一种适用于顺序数据访问的节能磁盘阵列 [J] . 李元章 ,孙志卓 ,马忠梅 . 计算机学报 . 2013,第006期
3. 基于线程的多路径数据预取技术研究 [J] . 欧国东 ,王永文 ,张民选 . 计算机研究与发展 . 2011,第0z1期
4. 基于云端的Web数据挖掘预取技术研究 [J] . 陈锋敏 . 统计与决策 . 2010,第22期
5. 基于Android的数据访问技术研究 [J] . 邢立国 ,褚龙现 . 电子设计工程 . 2014,第009期
6. 基于线程的多路径数据预取技术研究 [C] . 欧国东 ,王永文 ,张民选 . 第16届全国信息存储技术大会IST2010 . 2010
7. 基于预取的磁盘存储系统节能技术研究 [A] . 葛雄资 . 2012

基于数据访问模式挖掘的磁盘数据预取技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅