首页>中文会议>工业技术>自动化技术与计算机技术>NCIS2015第21届全国信息存储技术学术会议
NCIS2015第21届全国信息存储技术学术会议

NCIS2015第21届全国信息存储技术学术会议

  • 召开年:2015
  • 召开地:长沙
  • 出版时间: 2015-09-17

主办单位:中国计算机学会

会议文集:NCIS2015第21届全国信息存储技术学术会议论文集

会议论文

热门论文

全部论文

全选(0
  • 摘要:随着处理器和存储器之间性能差距越来越大,特别是处理器和外存之间的巨大差距使得I/O瓶颈问题日益突出.利用内存来缓解I/O瓶颈的传统做法是在内存中设置磁盘文件cache(buffer cache),从而减少访问外存的次数.但数据爆炸式的增长对内存容量的需求越来越大,传统方法通过增加cache容量带来的效益反而会减少,而且在内外存之间频繁交换数据会产生较大的开销,因此在内存上直接建立内存文件系统的方法应运而生.此外,随着工业技术的进步,新型非易失性存储介质逐渐出现在人们的视野中,它可字节寻址和非易失的特性使得数据在内存级就可以持久化存储.由于文件系统总是和介质本身紧密相连的,分别讨论了基于易失性内存和非易失性内存的文件系统,阐述了它们各自的主要特点,如存储特性、访问方法、读写性能等方面,并通过比较发现内存文件系统在性能上比磁盘文件系统有巨大的提升,将是一种缓解I/O瓶颈更有效的途径.
  • 摘要:随着多核、异构等计算机技术的飞速发展,高性能计算机的计算性能现已达到亿亿次量级。随着高性能计算机技术的成熟,高性能应用对系统内存产生不同的需求。超级计算机每个结点都按一定标准配置了内存,在实际使用中,因不同应用对于内存需求量的不同,很容易出现有的结点空闲内存较多,而有的结点内存紧张的情况。为较好地运行内存消耗量大的高性能应用,提出了一种基于网络块设备(network block device,NBD)机制使用远程结点内存构建page swap区的内存优化技术.该技术利用了超级计算机中通过网络访问远地内存性能优于访问本地磁盘性能的特点,采用了远程内存交换盘技术,使得本地节点在内存紧张时可将页面交换到远地节点的物理内存上.并将该技术应用到"天河一号"超级计算机系统上,以测试其性能并提高超级计算机的内存使用效率。
  • 摘要:计算机科学技术日新月异的发展,对存储器的集成度、读写速度、可靠性等方面提出了更高的要求.在这种形势下,一些传统存储器的缺陷逐步暴露出来,需要新一代存储器适应技术的发展和要求.与传统的存储器相比,磁阻式随机访问存储器(magnetic random access memory,MRAM)具有更好的性能,它同时具备静态随机访问存储器(static random access memory,SRAM)的高速读写性能、动态随机访问存储器(dynamic random access memory,DRAM)的高集成度与Flash存储器的非易失性等优点.为了研究MRAM用作主存时的各项性能,进一步探究MRAM作为DRAM主存替代品的可能性,根据MRAM的原理以及特点,设计并实现了一个MRAM仿真系统,由trace发生器、MRAM控制器和MRAM存储体3部分组成.MRAM仿真系统接收来自处理器(CPU)对主存的读写请求,并根据设计的地址映射算法,对请求进行调度,完成对MRAM存储器的读写请求.仿真结果表明,用MRAM做主存能够发挥出MRAM的优势,获得良好的请求响应时间、请求带宽等性能.
  • 摘要:近年来,闪存正被越来越广泛地应用到各种各样的存储系统当中.同时,闪存技术的革新促使单个设备存储容量剧增,这导致了基于固态硬盘的阵列(RAIS)系统中单设备失效的修复时间急剧增加,在其恢复过程中将有更高的概率影响到其他设备的可靠性,从而降低整个系统的可靠性.针对实际RAID6系统应用中较为广泛的RDP编码进行分析和问题抽象化,提出了一种基于固态硬盘阵列的编码算法RAIS+方法,并证明了其优越性.RAIS+方法通过添加一个冗余盘来减少大容量单盘失效的修复时间.RAIS+方法权衡了系统的可靠性、性能、写更新、负载情况以及可行性.例如,RAIS+方法在原8个设备的RAID6系统上,任意单个数据盘失效的修复时间能够减少约为18.5%.
  • 摘要:存储器与控制器的接口模块在如今多倍速率存储器(DDR,QDR等)中作为存储体和控制器之间信号的中转站起着至关重要的作用,接口模块通过时序的校准和数据的串并转换保证了高速数据有效的传输.研究了应用于网络设备的四字突发72Mb×36bQDR(4倍速率)Ⅱ+SRAM存储器接口的读写时序,针对其与控制器的接口协议详细论述了一种接口模块电路的实现方案,在500Mhz频率下完成了逻辑设计与验证以及版图物理设计工作.采用的移相时钟和延时校准机制提高了高速存储系统数据采集的可靠性.在tt,SS,ff三种不同器件端角下的验证结果满足四字突发QDRⅡ+SRAM存储器接口电路的时序和功能要求.该设计基于ASIC设计流程,模块面积小,功耗低,能够作为IP方便地应用于大型片上系统(system on chip,SOC)设计中,具有可移植性.
  • 摘要:在基于IP的SoC设计中,存在各IP协议不同、互联困难的问题,通用接口的设计成为IP核有效集成到系统中的关键技术.基于AMBA总线设计并实现了一款通用的存储控制器访问接口,高效地实现了异步传输、协议转换等基本功能,并对地址非对齐数据读写、数据拥塞等问题提出了有效的解决方案.经模拟验证,该接口成功完成了AMBA总线与存储控制器之间的协议转换与数据传输,从而实现了对存储控制器的系统整合.综合结果表明,该接口在时序、功耗与面积上均达到了设计要求.经实际性能测试,平均数据传输率达15.42 GBps,带宽利用率达到97%.
  • 摘要:随着海量存储数据的剧增,分布式存储系统逐渐得到广泛使用.分布式存储系统中存储节点数目的增加使得节点失效的机率增大.使用副本作为冗余的方式会带来很大的存储开销.为了减少存储开销,使用纠删码产生冗余是存储系统中一种主要的冗余策略.基于纠删码的数据修复过程中,需要在幸存节点中选择供应节点向新生节点传送数据,这就面临着修复节点的选择问题,需要设计一个节点选择机制来使得修复过程较快,提升存储系统的可靠性.结合实际数据修复过程中参与修复的节点对数据的计算速度不同,即存储节点存在计算能力异构的场景下,提出节点选择机制:星形拓扑修复算法S-SPAC和树形拓扑修复算法T-SPA-C,以加快失效节点的修复速度,从而减少整个修复过程中的修复时间.仿真结果表明,相对传统的随机节点选择策略,本文提出的选择机制可以有效减少数据修复时间.
  • 摘要:固态盘具有高性能、高可靠性、低功耗和重量轻等优势,被认为是下一代主流存储设备.但是现在的文件系统和设备级的I/O调度都是基于传统的旋转磁盘优化的,固态盘的性能优势没有得到充分的利用.针对固态盘,设计实现了MultiQ调度算法,该算法同时考虑了吞吐量和请求平均响应时间,在不降低I/O吞吐量的情况下尽量减少平均响应时间.该算法主要采取3种措施:基于请求地址的分队、基于请求类型的分类和基于请求大小的排队.充分利用了固态盘的并行性,避免读写干扰,降低了平均响应时间.采用MLC和TLC类型的固态盘进行试验,负载采用Iometer和filebench,结果表明MultiQ算法比Linux系统中的4种调度算法在效率上有小幅提升,而平均响应时间大大降低.在Iometer负载的测试中,该算法分别比Noop,Deadline,CFQ和Anticipatory算法在平均响应时间上减少了9.3%,10.2%,19.4%和12.2%.
  • 摘要:随着信息技术的迅猛发展,互联网数据迸发、海量互联网小文件的实时存储与处理成为越来越多互联网应用所面临的难题.相对于大文件而言,海量小文件的实时存取会给文件系统带来巨大的压力,传统的文件系统很难快速地存取海量小文件,这严重影响到互联网应用的实时性.内存数据库技术凭借其在数据处理速度上的优势,为海量互联网小文件的实时存储与处理提供了新的方法.基于Redis内存数据库进行面向海量小文件的实时存储与索引策略研究,一方面基于Redis键值数据库的特点,提出了互联网文件到Redis数据库的缩写映射优化算法;另一方面,面对不断涌入的海量互联网数据,提出了基于查询关键字的轻量级索引策略,在大数据量下的实验数据表明此索引策略的索引规模更小,维护代价更低,基于关键字的查询响应时间更短.
  • 摘要:传统磁盘存储设备因其固有的机械特性,已不能满足当前的数据密集型应用程序的需求.基于闪存的固态存储设备(solid state drive,SSD)的出现改善了这种情况,并被广泛用作缓存以降低内存与磁盘之间的性能差距.针对由DRAM和SSD构成的多级缓存,提出了一种可配置的历史信息感知的多级缓存替换策略Charm.Charm允许用户配置应用的访问模式、读写模式等多项内容,并且还可以根据应用对文件的历史访问信息来判断访问模式,从而能够适应访问模式的变化.此外,Charm过滤掉那些只访问一次的数据,将多次访问的热数据缓存至SSD,减少对SSD的写入次数,提升SSD寿命.使用MCsim对Charm与现有的多级缓存替换算法进行了对比测试,在实际的工作负载下,Charm优于其它多级缓存算法。
  • 摘要:随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysis and reporting technology)属性建立的包括应用统计学和机器学习等方法在内的各种硬盘故障预测模型,虽然取得了较好的效果,但其数据采集及处理等方面均存在不足之处.基于某真实的互联网大型数据中心环境,提取SMART属性数据,并提出了一种基于神经网络权值矩阵的方法,结合Rank Sum秩和检验、RAT反向安排测试、Z-Score评分3种无参统计学方法,对属性进行选择,应用CART决策树及BP神经网络2种机器学习方法,建立硬盘故障预测模型.实验表明描述的2种硬盘故障预测模型均具有很好的性能,这是机器学习算法在实际应用场景下很好的实践.此外,通过实验以及对实验的分析和解释,得出一些有益的结论,这为下一步的研究工作奠定了基础.
  • 摘要:数据安全问题是云存储系统中需要解决的关键问题之一,为保证云存储服务器中数据的完整性,数据的持有性证明就显得尤为重要.数据的持有性证明就是用户实时知道其数据是否仍然完整、有效、正确地保存在云存储系统中,以及是否可以随时、随地获取到该数据,这是云存储安全中的挑战性问题.DNA(Deoxyribonucleic Acid)是生物遗传信息,每个DNA都是由若干个RNA(Ribonucleic Acid)组成,研究基于第三方审计(third-party audits,TPA)数据持有性证明模型的基础上,利用这一生物学原理提出了一个高效的数据可持有性证明方案.实验结果表明,该方案在存储性能和计算性能方面与S-PDP方案相比,需额外存储开销较小,约为文件大小的1.17%;而计算开销比S-PDP和CS-PDP方案都小,特别是比S-PDP方案要小很多.
  • 摘要:大规模网络环境下,多样化网络攻击类型产生的高速警报数据流,对警报关联方法的通用性、实时性以及系统开销控制提出了很高的要求.目前警报关联技术相关研究多是基于集中式结构的算法设计,难以满足实时性的要求;而已有少数分布式警报关联系统未深入考虑负载均衡和系统开销控制.为此,提出了一种通用可扩展的在线警报关联方法CACDS(causal alert correlation on distributed system).CACDS在分布式流处理环境中采用"分派-汇聚"机制作为在线警报关联的基本框架.基于该框架,CACDS采用因果逻辑方法进行关联分析,松弛匹配警报之间的前因后果,能够对各种不同攻击类型进行有效检测.为了充分利用分布式环境下各节点资源,提出一种混合式关联图划分技术,以不同警报类型引起的计算开销和系统开销为依据,警报被映射至不同的关联进程中以实现并行警报关联,保证了系统实时性和低开销.基于Storm平台的原型系统实验表明,与其他方法相比,CACDS具有更好的可扩展性、更高的吞吐率和更低的系统开销.
  • 摘要:由于传统的磁盘甚至已广泛应用的Flash固态盘已无法很好地满足当前对存储器在集成度、读写速度、可靠性方面的需求,故须积极寻找新一代存储介质尝试与当前存储器混合使用甚至替代之.而磁阻随机存储器(magnetic random access memory,MRAM)作为一种非易失性存储器,拥有静态随机存储器(satic random access memory,SRAM)的高速读取写入能力,以及动态随机存储器(dynamic random access memory,DRAM)的高集成度,同时比DRAM更低的能耗,并具有无限的读写次数,这些优秀的特性使得MRAM拥有很好的潜力成为下一代主流存储介质.为了对MRAM的读写性能、功耗等有深入的理解,设计并实现了一个MRAM测试平台,完成对MRAM读写性能测试和特性数据采集.该测试平台主要由MRAM控制器设计、MRAM特性数据采集、读写性能测试3个方面组成,由MRAM控制器对MRAM芯片进行读写完成读写性能测试,采集MRAM在读、写、空闲等状态下的特性数据.实验表明,MRAM具有良好的读写性能和低功耗,有条件成为下一代主流存储介质.
  • 摘要:RAID-6被广泛应用于存储系统中对数据进行保护.其中基于XOR的RAID-6码具有计算复杂度低的优点,因而受到广泛的关注和应用.但是,这类编码的潜在并行能力还没有被充分地挖掘和发挥.分析了基于XOR的RAID-6码的编解码过程,把校验方程的计算分解为预计算和递归求解2个阶段,其中预计算阶段可以被并行执行.此外,还观察到多种RAID-6码具有z-turn性质——只要失效情况在该RAID-6码的容错能力范围内,就至少有1个校验方程只包含1个不可用的数据块.基于此,设计了一个并行的编解码算法EOPC(equation-oriented parallel coding),用以实现具有z-turn性质的基于XOR的RAID-6码的编解码过程.在RDP码和P-Code上的编解码实验表明,使用EOPC实现的编解码过程与传统串行实现方法相比,在编解码吞吐率上有超过50%的性能提升.
  • 摘要:海量小文件聚合存储技术大多以目录或逻辑目录为单位,将小文件聚合为实际存储的大文件并建立小文件的元数据信息,实现小文件的快速访问.传统小文件聚合存储技术读写操作性能受目录结构的影响差别较大.在现有研究成果的基础上,分析不同目录结构聚合空间的特征,提出大空间聚合存储技术和元数据分裂技术,为不同目录结构的海量小文件存储提供通用的解决方法,并基于开源分布式文件系统HDFS实现了一个分布式海量小文件系统SMDFS.测试表明,大空间聚合技术能有效支持不同目录结构的海量小文件数据,相较于SMDFS早期版本,小文件数据装载和访问性能均有很大程度的提高.
  • 摘要:近些年来,为了满足各种应用日益增长的I/O性能要求,存储子系统经历了巨大的变革.基于PCIe接口的SSD(solid state drive)凭借其高带宽,低延迟的特点逐渐成为主流的存储设备.包括I/O栈设计在内的针对PCIe SSD的研究,将成为存储领域的研究热点.目前涉及到PCIe SSD具体实现细节的文献相对缺乏,不利于相关研究的开展.归纳了PCIe SSD设计中需要考虑的问题与相关研究,并介绍了一个实际的PCIe SSD原型系统的实现方案.同时,对原型系统中的I/O栈驱动层的设计和优化技术也进行了分析,包括DMA(direct memory access)优化技术和多队列多中断技术.最后,对原型系统进行测试,并与商用PCIe SSD测试结果对比,表明原型系统具有更高的性能,有助于PCIe SSD的相关研究.
  • 摘要:随着社会数字网络信息化进程的不断推进,全球IT企业需要管理的数据量急剧增长.当前大规模数据中心对海量复杂数据管理在扩展性、性能和成本等方面要求的不断提升.为了减缓企业存储容量的增长速度,传统的重复数据删除存储管理技术和方法已无法满足大数据备份应用的服务质量需求,新的软硬件技术进步为大数据管理能力的提升带来机遇.提出了一种面向大数据备份的应用感知并行重删存储系统,它利用新型非易失性存储来提升块索引的并发查询能力,并通过应用层丰富的文件语义信息设计应用感知的数据路由机制.通过实验论证,该并行重删存储系统不仅能实现单个节点内高性能的并行数据重删处理,还能通过横向扩展提升集群数据重删的吞吐量.
  • 摘要:MapReduce编程模型在大规模并行化应用的设计和开发领域正在发挥越来越重要的作用.同时,Hadoop又是现在被广泛使用的云平台中数据密集型应用开发的开源MapReduce实现方式.众所周知,在云计算中最小的计算单元就是虚拟机,虚拟机有充分利用系统资源,使系统便于管理,提高系统可靠性和节省开销等多种优点.该文将通过一系列实验对不同虚拟化平台上Hadoop应用的I/O性能进行评测分析,这些实验的结果可以作为将来选择虚拟机类型的标准,以便Hadoop应用能够在虚拟化平台中获得最好的I/O性能.
  • 摘要:可重构体系结构因为丰富的硬件资源和可重构互连网络,可以提供接近专用集成电路的性能和接近通用处理器的灵活性.首先介绍了一种面向领域应用的应用定制可重构流水线体系结构,可带来计算性能的显著提升;其次介绍了面向应用定制可重构流水线的存储管理方法,存储问题对可重构体系结构性能发挥至关重要.该方法基于配置信息动态管理数据输入、地址计算与访存操作分离,可以实现多种寻址方式,使在硬件上运行的硬件流水线高效流动.实验证明,相对于设置专用访存单元的可重构系统,节省了计算资源同时保证了流水线效率.
  • 摘要:云计算作为创新性的商业计算模型,将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算力、存储空间和信息服务,它是构建新一代军用数据中心的核心基础.首先论述了基于云计算的军用数据中心的用户需求,提出了基于云计算的军用数据中心的体系结构和系统组成,同时指出建设基于云计算的军用数据中心的3个步骤.
  • 摘要:n-of-N Skyline查询关注于大小为N的滑动窗口上最近任意n(n≤N)个数据对象的Skyline查询结果,为用户的Skyline查询提供了高度的灵活性.在当前大数据的新环境下,数据流呈现出以下2个特征:1)数据流实时大规模高速到达;2)数据流工作负载的急剧变化性.这对n-of-N Skyline查询的实时性以及自适应扩展提出了更高的要求.而目前针对n-of-N Skyline查询相关的研究都是关注于单机环境下的集中式查询算法,难以同时满足当前新环境下查询的实时性与自适应扩展需求.为此,提出了一种弹性并行查询模型EPM,并且基于EPM模型提出了一种弹性可扩展的并行n-of-N Skyline查询算法(elastic parallel n-of N Skylline,EPnNS).实验证明,该算法在并行节点数增加1倍时,查询效率提升接近70%,而且在应对不同程度的负载变化时,该算法具有较好的自适应调整性能.
  • 摘要:云计算的快速发展、日益普及使得越来越多的企业将数据放入远程云存储端.然而,针对现在云存储的存在机密性、可用性、完整性方面的问题,公司并不能完全放心地将其内部的机密、关键数据存入云存储端.针对现今单云存储在使用中显露出许多问题,为了提高云存储服务的可用性,提出在多云存储条件下,基于纠删码算法提高数据冗余性,对数据进行分片编码、重组,提高数据安全性与可靠性;提出多云网关存储结构,通过多云网关将数据安全、可靠地存入各个云存储平台,多云网关可适配时下最流行的如百度云、阿里云、亚马逊S3等,为用户提供可无限扩展的安全云存储环境,具有很高的实用价值;设计实现的多云存储网关使用了云存储平台,通过对云平台的使用,将数据分片存入,同时在下载数据时能够对数据分片进行重组;最后证明了纠删码算法的加入对多云存储网关的时间延迟影响不大,同时能提高数据的可用性、降低存储的成本.
  • 摘要:针对拓扑结构确定的加权复杂网络抗毁性优化问题,提出了一种基于有限冗余资源的冗余容量优化模型.定义了3种不同的冗余容量分配策略,研究了不同分配策略对于加权无标度网络的有效性.结果表明,负荷偏好容量分配策略对于加权无标度网络的抗毁性优化效果最好,而负荷重点容量分配策略的优化效果最差,对于抑制加权复杂网络级联失效的传播,仅仅通过保护网络中负载较大的边优化效果并不明显.本文方法通过优化加权复杂网络中部分边的容量,可达到有效控制网络级联失效发生及传播的目的,具有较强的实用性,研究成果能够为实际加权复杂网络的抗毁性定性评估及优化设计提供有益的参考和指导.
  • 摘要:由于NVM器件集成度和DIMM接口数量的限制,大容量SCM系统中必然包含DIMM接口和PCIe接口NVM存储设备.这2类NVM存储设备在访问接口、访问方式、I/O性能、存储容量和内嵌处理能力等方面存在很大差异,这使得现有的内存和外存均难以直接应用与统一管理2类NVM存储设备;同时不同文件、文件数据与元数据、文件内各部分数据之间的访问特性和管理要求也不相同,这给高效管理大容量SCM系统带来了极大的挑战.提出了面向SCM的聚合文件系统SCMPFS,统一管理2类NVM存储设备.首先给出了聚合文件系统的结构;接着给出了元数据分层管理算法,具有元数据属性和NVM存储设备的特性,重构元数据的组织结构,将元数据属性合理分布到2类NVM存储设备中,提高元数据查找速度和管理效率;设计了数据聚合管理算法,通过打破文件数据的单一组织结构、通过文件数据在2类NVM存储设备之间的合理分布,提高访问文件的响应速度和文件系统的I/O性能,有效利用2类NVM存储设备中的存储容量;最后使用ramfs和PMBD分别模拟DIMM接口和PCIe接口NVM存储设备,在FUSE的基础上实现了SCMPFS的原型,使用postmark和Linux内核源码进行了测试与分析,验证了SCMPFS相比PMBD上Ext3能提高30%~63%的I/O性能,接近与PMFS,同时避免DIMM接口NVM存储设备容量的限制;此外测试也表明软件和接口开销成为影响大容量SCM系统性能的重要因素之一.
  • 摘要:数字信息长久化保存一直以来都是现代社会面临的一个重要问题,而传统的以磁带和磁盘作为存储介质的存储系统很难满足数据长久稳定保存的需求.人们需要一种专门面向归档的存储系统来减少存储成本和提高数据稳定性.光盘作为一种介质与读取驱动分离的存储介质,易保存,适合用在归档存储中.提出了一种基于光盘的大容量光盘库文件系统,其基本思想是将归档数据存放在较为廉价的光盘上,针对单张光盘容量小的缺陷,将大量的光盘虚拟成整个容量池,文件可以跨越光盘边界存储,光盘的刻录和读取完全实现自动化,并提供给用户通用文件访问接口.通过一系列读写测试,文件系统可以自动化读取和写入数据.
  • 客服微信

  • 服务号