基于Ceph文件系统客户端元数据预取的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，由于生活水平的提高和互联网的发展，人们使用互联网的时间越来越多，频率越来越高，再加上物联网的发展，政府管理的需要等原因，产生了大量的数据。大量数据的出现对大规模数据的存储技术需求日益增大，技术要求日益提高。由此，出现了许多的分布式存储系统，而其中，Ceph文件系统由于其可扩展性和可靠性赢得不少青睐。Ceph文件系统从本地文件系统出发，它保留了本地文件系统中元数据的角色，并以目录树的形式对用户的文件进行管理，让用户很自然地从本地文件系统过渡到分布式文件系统。　　Ceph文件系统分为两大部分，一个是存储元数据的服务器端，为元数据服务器，另一个是供应用程序调用的客户端。现有的客户端将部分使用频繁的元数据缓存在客户端的缓存空间中，并使用最近最久未使用算法进行替换。Ceph文件系统客户端根据元数据的使用时间进行管理，并未考虑元数据内部的信息以及元数据在文件系统中的空间位置。根据上述提出的问题,本文在深入研究客户端对元数据缓存机制的基础上，做了如下工作：　　(1)对现有客户端中缓存的元数据进行聚类分析，以找出两个聚类中心。这两个聚类中心所包含的是冷和热元数据的时间特征。具体来说，本文通过设置元数据统计装置，并利用文件系统测试工具来统计某段时间内Dentry元数据的使用次数，同时获取的还有Dentry和Inode中包含的信息，将这些信息组成五元组，该五元组记录的是文件在当前时间段内各种属性。在收集到这些五元组后，利用聚类算法对这些五元组进行聚类，而聚类的结果为两个聚类中心，其中，一个聚类中心的使用次数比另外一个聚类中心高。而使用次数较高的聚类中心中的其他信息将会在后面的预取工作中指导Ceph文件系统客户端预取更合适的“热”数据。　　(2)在获得文件元数据的聚类中心的基础上，本文将根据两种情况进行缓存预取，这两种情况会激发预取模块工作。第一种情况是：在某次使用文件时，其文件的元数据离某一分类的聚类中心特别接近，本文认为该元数据应当被视为使用频繁的数据，利用该元数据指导客户端请求元数据服务器将其他相关元数据提前存入客户端缓存中。第二种情况是，如果元数据使用次数已经超过一定界限，同样，客户端将请求元数据服务器将其他元数据提前存入客户端缓存中。通过这两种措施来达到提高客户端缓存命中率的目的。　　本文在研究了Ceph客户端缓存机制的基础上，提出了缓存预取的方法，该方法能帮助客户端缓存系统对使用频繁的元数据做出更全面的预测，从而提高了缓存命中率，并通过实验证明了预取机制的有效性。

著录项

作者
朱锦涛;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机技术
授予学位硕士
导师姓名唐卓,吴炜;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
Ceph文件系统,缓存系统,聚类算法,缓存预取;

相似文献

中文文献
外文文献
专利

1. 基于Ceph文件系统的元数据缓存备份 [J] . 詹玲 ,方协云 ,李大平 . 计算机工程 . 2017,第004期
2. 蓝鲸分布式文件系统的客户端元数据缓存模型 [J] . 黄华 ,张建刚 ,许鲁 . 计算机科学 . 2005,第009期
3. 基于Ceph的小文件预取缓存算法 [J] . 陆小霞 . 电脑知识与技术 . 2020,第017期
4. Ceph云存储中基于混合文件系统的读写性能优化方法 [J] . 刘辉勇 ,王勇 ,俸皓 . 微电子学与计算机 . 2018,第5期
5. Ceph云文件系统中纠删码的应用研究 [J] . 刘莎 ,楚传仁 . 计算机时代 . 2016,第001期
6. 分布式文件系统客户端元数据交互性能的优化 [C] . Wang Fang ,王芳 ,Lv Wenruo . 第18届全国信息存储技术学术会议 . 2012
7. 基于ceph文件系统的元数据缓存备份技术的研究与实现 [A] . 方协云 . 2015

基于Ceph文件系统客户端元数据预取的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅