首页> 外文OA文献 >Técnicas de deduplicación de datos y aplicación en librerías virtuales de cintas
【2h】

Técnicas de deduplicación de datos y aplicación en librerías virtuales de cintas

机译:虚拟磁带库中的重复数据删除和应用技术

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Las técnicas de deduplicación de datos son una serie de algoritmos y procedimientos computacionales que intentan localizar subconjuntos de datos repetidos ( duplicados ) dentro de un súper-conjunto de datos. Una vez localizados los subconjuntos duplicados, se pretende sustituirlos por referencias a la ocurrencia única de dicho subconjunto, reduciendo el espacio de almacenamiento necesario para alojar el conjunto de datos. Por ejemplo, supongamos un álbum de fotos en donde una de ellas se repite varias veces. La deduplicación del álbum de fotos consistiría en localizar las fotografías duplicadas y en la sustitución de las repeticiones por una indicación que dijera: Fotografía idéntica a la número xx. El proceso de deduplicación consiste tanto en la localización de datos duplicados como en su sustitución por referencias a la instancia única del objeto duplicado con objeto de reducir el espacio de almacenamiento requerido para alojar el conjunto de datos. Las técnicas de deduplicación son ideales para optimizar el uso del espacio de almacenamiento para conjuntos de datos que presenten un alto grado de duplicación. Por el contrario, si no existe duplicación en el conjunto de datos, las técnicas de deduplicación no podrán reducir dicho espacio. Los sistemas de copias de seguridad son claros candidatos donde encontrar duplicación (redundancia) en sus datos y por tanto, aprovecharse de sus beneficios en el ahorro de espacio de almacenamiento. Esto es debido a que las diferencias binarias entre las diferentes copias de seguridad de un sistema cliente suelen significar un porcentaje pequeño del espacio total (comparando los backups de un día y el siguiente, o los backups completos de un domingo y el domingo posterior). Adicionalmente, se encuentra duplicación de datos entre copias de seguridad de clientes diferentes pero de la misma tipología ( mismo sistema operativo, misma base de datos, etc. ). Las técnicas de deduplicación permiten ahorrar en el espacio de almacenamiento secundario puesto que en lugar de albergar dos copias de seguridad, se alberga una de ellas y los datos que diferencian la segunda de la primera. En la actualidad, las técnicas de deduplicación de datos están ampliamente adoptadas dentro de las librerías virtuales de cintas ( no así en las físicas ) siendo muy raro encontrar algún modelo que no las implemente en mayor medida o en su defecto, lo tenga en sus planes de evolución de producto. Es necesario también indicar que por el contrario, las técnicas de deduplicación de datos no suelen encontrarse ( salvo algunas excepciones ) en los almacenamientos primarios de los sistemas donde por razones del rendimiento de respuesta requerido, la carga computacional que los procedimientos de deduplicación añaden al almacenamiento no justifican el ahorro de espacio.
机译:重复数据删除技术是一系列算法和计算过程,试图在一组超数据中定位重复(重复)数据的子集。一旦找到了重复的子集,就打算将其替换为引用所述子集的唯一出现,从而减少承载数据集所需的存储空间。例如,假设有一个相册,其中一个重复了几次。相册的重复数据删除包括查找重复的照片,并用以下指示替换重复:图片等于数字xx。重复数据删除过程涉及查找重复数据并用对重复对象的单个实例的引用替换它,以便减少承载数据集所需的存储空间。重复数据删除技术是优化具有高度重复性的数据集的存储空间使用的理想选择。相反,如果数据集中没有重复项,则重复数据删除技术将无法减少该空间。备份系统是在数据中寻找重复(冗余)的明确候选人,因此可以利用其在节省存储空间方面的优势。这是因为客户端系统的不同备份之间的二进制差异通常只占总空间的一小部分(比较一天和第二天的备份,或星期日和下一个星期日的完整备份)。此外,在不同客户端但类型相同(相同的操作系统,相同的数据库等)的备份副本之间发现了数据重复。重复数据删除技术节省了辅助存储空间,因为存储了一个备份,而不是托管两个备份,并且将第二个备份与第一个备份区分开来的数据。当前,重复数据删除技术已在虚拟磁带库中广泛采用(而不是在物理磁带库中),很难找到一种无法在更大程度上实现或在其计划中无法实现的模型。产品进化。相反,还必须指出,在某些情况下,通常不会在系统的主存储中找到重复数据删除技术(有一些例外),在这些系统中,由于所需的响应性能,重复数据删除过程会增加存储的计算负荷他们没有理由节省空间。

著录项

  • 作者单位
  • 年度 2009
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"es","name":"Spanish","id":10}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号