首页> 中国专利> 为云中的灾难恢复动态选择最佳实例类型

为云中的灾难恢复动态选择最佳实例类型

摘要

一个示例包括:执行VM还原实例类型发现过程;创建测试VM,所述测试VM的VM还原实例类型与在发现期间识别的VM还原实例类型匹配;使用所述测试VM来在云存储站点处创建测试还原VM;使用所述测试还原VM在所述云存储站点处还原所述测试VM;基于所述测试VM的所述还原而生成4D基线向量,所述4D基线向量标识特定的VM还原实例类型;基于所述4D基线向量生成5D向量;将所述5D向量相对于其他5D向量进行排名,所述5D向量标识同一生产站点VM;以及在所述云存储站点处还原在所述5D向量中识别的所述生产站点VM,在所述云存储站点处还原的所述生产站点VM具有在排名最高的5D向量中识别的VM还原实例类型。

著录项

  • 公开/公告号CN113678106B

    专利类型发明专利

  • 公开/公告日2022-08-09

    原文格式PDF

  • 申请/专利权人 EMC IP控股有限公司;

    申请/专利号CN201980095323.4

  • 申请日2019-12-16

  • 分类号G06F11/14(2006.01);

  • 代理机构北京同达信恒知识产权代理有限公司 11291;北京同达信恒知识产权代理有限公司 11291;

  • 代理人黄志华;何月华

  • 地址 美国马萨诸塞州

  • 入库时间 2022-09-06 00:41:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-09

    授权

    发明专利权授予

说明书

技术领域

本发明的实施方式总体上涉及数据保护。更具体地,本发明的至少一些实施方式涉及用于根据各种竞争考虑因素为基于云的灾难恢复选择最佳虚拟机(VM)实例类型的系统、硬件、软件、计算机可读介质和方法。

背景技术

实体通常会生成并使用在某种程度上对其操作很重要的数据。该数据可以包括例如业务数据、财务数据和人员数据。如果该数据丢失或受损,则实体可能会产生重大不利的财务和其他后果。因此,许多实体选择备份其部分或全部数据,使得在发生自然灾难、未经授权的访问或其他事件时,实体可以恢复受损或丢失的任何数据,然后将该数据还原到一个或多个位置、机器和/或环境。

因此,灾难恢复(DR)(即,在出现问题或丢失后恢复和还原备份数据)是组织的一个重要过程。灾难恢复的一种方法是在云存储环境中创建临时还原VM。当被调用时,VM执行灾难恢复过程。然而,由于各种原因,这种方法已被证明是有问题的。

例如,对于大型VM,灾难恢复过程可能需要很长时间才能执行。同样,灾难恢复过程的成本也会相应地很高,因为云使用通常是按小时付费的。另一方面,可以替代地采用较小的VM进行DR,但是较小的VM将缺少较大VM的一些功能性。因此,该组织可能必须在例如要求执行DR过程的速度与执行该过程的成本之间取得平衡。

因此,组织面临的一个挑战是决定哪种云实例类型对于执行被指派给VM以供执行的各种还原任务将是最佳的。一种简单的方法可能是选择云中云使用成本最低的VM还原实例类型,使得由该VM执行的每小时还原活动的价格将最小化。然而,选择性能更高的VM还原实例类型尽管成本更高但仍有可能导致节省总体成本,因为还原工作将相对更快地完成。在这种假设情况下,客户可能会受益于更快完成DR和为还原活动支付的较低价格。

还有其他因素使关于将使用哪种VM类型用于DR过程的分析复杂化。此类因素包括但不限于不同的客户VM大小和/或类型,以及不同的客户对不同的相应VM的速度/成本权衡的偏好。

附图说明

为了描述可以获得本发明的至少一些优点和特征的方式,将通过参考在附图中示出的本发明的特定实施方式来呈现对本发明的实施方式的更具体描述。应当理解,这些附图仅描绘本发明的典型实施方式,并且因此不被认为是对其范围的限制,本发明的实施方式将通过使用附图以另外的特殊性和细节来描述和解释。

图1公开了本发明的一些实施方式的示例性操作环境的各方面。

图2公开了示例性主机配置的各方面。

图3是公开灾难恢复方法的一些一般方面的流程图。

具体实施方式

本发明的实施方式总体上涉及数据保护。更具体地,本发明的至少一些实施方式涉及用于根据各种竞争考虑因素为基于云的灾难恢复选择最佳虚拟机(VM)实例类型的系统、硬件、软件、计算机可读介质和方法。

更具体地,本发明的示例性实施方式尤其涵盖用于选择最佳还原实例类型以便优化客户的还原成本和时间同时还改善整体客户体验的自动化过程。根据以下假设示例,本发明的一些有用和有利的方面将是显而易见的。

本发明的示例性实施方式尤其非常适合处理必须选择最佳还原实例类型的复杂性。用于在发生DR事件时执行DR过程的临时还原VM可以执行还原过程,该还原过程包括但不限于创建大小与客户的受保护VM相同的磁盘、从云存储读取备份数据副本并将这些副本写入新创建的磁盘、然后在目标VM上安装所需的装置驱动程序。在至少一些情况下,临时还原VM驻留在云数据中心,而临时还原VM执行DR过程所针对的目标VM位于客户站点的本地。

对最佳还原实例(即,最佳临时还原VM)的选择可能取决于客户VM的原始大小。为了说明,对于2TB大小的VM,最佳还原实例可能与100GB的VM不同。而且,一些实例类型可能仅在某些云区域中可用。同样,一些客户的优先考虑可能是降低DR成本,而其他客户可能更喜欢更快的DR时间并且不太关心DR成本。例如,对成本与速度方面的客户偏好可能取决于需要恢复的特定VM的考虑因素,诸如RTO(恢复时间目标)。如这些示例所示,当必须就最佳还原实例类型做出决定时,可能会出现各种竞争考虑因素,因此增加复杂性。

由于增加了复杂性,因此至少在一些情况下,基于手动测试预定义最佳VM还原实例类型是困难的或不可能的。例如,主要云供应商不时推出新的VM还原实例类型。而且,云供应商定价模型可能会随时间而改变。因此,对跨多个区域的许多实例类型应重复执行VM还原实例类型评估,以确保采用最佳VM还原实例类型。由于这些原因,本发明的示例性实施方式涵盖用于为DR过程自动选择最佳VM还原实例类型的方法和过程。

考虑到这些点,本发明的示例性实施方式基于任何特定客户的速度/成本权衡解决策略(TR策略)为该特定客户VM提供每个该特定VM的最佳还原实例类型(RI类型)的选择的自动化。因此,所公开系统的一些示例性实施方式使用可供给定的云供应商使用的不同还原VM还原实例类型对预定义大小的小型基线测试VM周期性地执行自动还原活动,该给定的云供应商的一个示例是亚马逊网络服务(AWS)简单存储服务(S3)。基于利用特定还原实例类型完成基线测试VM的还原活动所需的时间,本发明的实施方式能够推导完成任何其他大小的任何客户VM的还原所需的时间。因此,可以计算每个特定实例类型还原任何客户VM所需的时间。同样,对于每个云供应商和每个区域,任何VM还原实例类型的每小时成本也是已知的。

因此,对于每个客户VM和每个VM还原实例类型,还原完成时间(RC时间)和还原完成价格(RC价格)是已知的。每个VM的速度/成本权衡解决策略(TR策略)将由客户提供。通过说明,一些简单的示例性策略包括“首选最低成本”或“首选最高(还原)速度”。

然后,对于每个客户VM和VM还原实例类型,基于还原时间和还原成本自变量应用解析函数。然后,为特定客户VM选择根据解析函数获得排名最高的实例类型。例如,排名=TR策略[RC时间,RC价格]。当针对该特定客户VM执行完整的DR测试或真实的DR故障转移时,将使用预定义的还原实例类型。

有利地,然后本发明的一些实施方式可以提供相对于常规硬件、软件、系统和方法的配置和操作的各种益处和改善。为了说明,本发明的实施方式可以提供用于基于多个竞争考虑因素自动配置还原VM实例的过程。此外,本发明的实施方式可以周期性地并且自动地评估操作环境以识别将在其中实现还原VM的环境参数的变化。最后,本发明的实施方式可以响应于此类参数变化中的一者或多者而自动配置/重新配置还原VM。

应当指出的是,各种实施方式的前述有利方面仅以示例的方式呈现,并且本发明的示例性实施方式的各种其他有利方面将从本公开中显而易见。应当进一步指出的是,没有必要任何实施方式都实现或启用本文公开的任何此类有利方面。

A.示例性操作环境的各方面

以下是对本发明的各种实施方式的示例性操作环境的各方面的讨论。该讨论不意图以任何方式限制本发明的范围或实施方式的适用性。

通常,本发明的实施方式可结合单独地和/或共同地实现和/或致使实现数据管理操作的系统、软件和部件一起来实现。此类数据管理操作可包括但不限于数据读取/写入/删除操作、数据备份操作、数据还原操作、数据克隆操作、数据存档操作和灾难恢复操作。因此,虽然本文的讨论在某些方面可针对数据保护环境和操作的讨论,但本发明的范围不限于此。于是更一般地,本发明的范围涵盖公开的概念可能有用的任何操作环境。以说明而非限制的方式,本发明的实施方式可结合数据备份和还原平台(诸如Dell-EMC NetWorker和Avamar平台)来采用。

数据保护环境可采取公共或私有云存储环境、本地存储环境以及包括公共元素和私有元素的混合存储环境的形式,但本发明的范围也扩展到任何其他类型的数据保护环境。这些示例性存储环境中的任一个可部分地或完全地虚拟化。存储环境可包括数据中心或由数据中心组成,该数据中心可操作以为一个或多个客户端发起的读取和写入操作提供服务。可以采用本发明的实施方式的存储环境的一些示例包括但不限于云数据中心,诸如亚马逊AWS、微软Azure和谷歌云。

除了存储环境之外,操作环境还可包括一个或多个主机装置,诸如例如客户端,每个主机装置托管一个或多个应用程序。因此,特定客户端可采用一个或多个应用程序中的每个应用程序的一个或多个实例,或以其他方式与其相关联。通常,客户端所采用的应用程序不限于任何特定功能或功能类型。例如,一些示例性应用程序和数据包括电子邮件应用程序(诸如MS Exchange)、文件系统以及数据库(诸如Oracle数据库和SQL Server数据库)。客户端上的应用程序可生成需要保护的新数据和/或修改后的数据。

根据本发明的各种实施方式,本文中公开的任何装置或实体可受到一个或多个数据保护策略的保护。可通过根据本发明的实施方式的数据保护策略来保护的装置的其他示例包括但不限于容器和VM。

操作环境中的任何装置(包括客户端、服务器和主机)都可采取软件、物理机或虚拟机(VM)或这些的任何组合的形式,但任何实施方式都不需要特定的装置实现方式或配置。类似地,数据保护系统部件(诸如例如数据库、存储服务器、存储卷(LUN)、存储磁盘、复制服务、备份服务器、还原服务器、备份客户端和还原客户端)也可采取软件、物理机或虚拟机(VM)的形式,但任何实施方式都不需要特定的部件实现方式。在采用VM的情况下,可采用管理程序或其他虚拟机监视器(VMM)来创建和控制VM。

如本文所用,术语“数据”的范围很广。因此,该术语以举例而非限制的方式涵盖诸如可由数据流分段过程产生的数据段、数据区块、数据块、原子数据、电子邮件、任何类型的对象、文件、通讯录、目录、子目录、卷以及上述一项或多项的任何组。

本发明的示例性实施方式适用于能够以模拟、数字或其他形式存储和处理各种类型对象的任何系统。尽管可以举例的方式使用术语(诸如文档、文件、块或对象),但本公开的原理不限于表示和存储数据或其他信息的任何特定形式。相反,此类原则同样适用于能够表示信息的任何对象。

现在注意图1,操作环境100可包括数据保护环境或由数据保护环境组成。数据保护环境可包括企业数据中心、或云数据中心、或两者。数据保护环境可支持各种数据保护过程,包括例如数据复制、重复数据删除、克隆、数据备份和数据还原。如本文所用,术语备份旨在广义地解释,并且包括但不限于部分备份、增量备份、完整备份、克隆、快照、连续复制和任何其他类型的数据副本,以及上述内容的任何组合。上述任何内容可能会被删除重复数据,也可能不被删除重复数据。

如图指示,图1中的示例性操作环境100的配置包括生产站点200、云存储站点300和还原实例类型评估器(RITE)站点400。所有这些元件都被配置为并且确实与本发明的各种实施方式的实现相结合地彼此通信。通常,一个或多个生产VM在生产站点200处和/或在云站点300处操作。为了在生产站点200处发生问题的情况下提供生产VM的灾难恢复,在云站点300处创建与生产VM相对应的临时还原VM。

在发生涉及与还原VM实例相关联的一个或多个生产VM的问题的情况下,临时还原VM(在本文中也可以被称为还原VM实例)驻留在云站点300处并且可操作以执行各种DR过程。还原VM实例的特定类型或还原VM还原实例类型由RITE 400至少部分地基于由管理员或其他用户识别的标准来确定。

由于灾难涉及生产站点200,因此驻留在云站点300处的还原VM实例在被调用时或者自动地执行各种DR操作。这些DR操作可以包括但不限于在云站点300处构建与还原VM实例所基于的生产VM相对应的VM。这样,尽管在生产站点200处发生问题,生产站点200VM的功能性仍在云站点300处还原并且可供使用。在一些情况下,在生产站点200的问题已经解决之后,由还原VM实例在云站点300处构建的VM可以另外或替选地还原到生产站点200。

因为由管理员或其他用户指定的特定类型的还原VM实例在云站点300处构建的VM,所以通过与由该管理员或其他用户设置的参数一致的方式还原该VM。此类参数包括但不限于还原VM的成本、还原VM的速度以及还原的VM中所需的功能性。特定类型的还原VM实例(其中该类型完全或部分由RITE 400确定)在本文中可以被称为最佳VM还原实例类型。单个最佳VM还原实例类型可以用于将单个VM或多个VM还原到云存储站点300和/或生产站点200。

现在特别参考图1,提供了关于示例性操作环境100和相关联的元件的各方面的进一步细节。如上所述,操作环境100可以包括生产站点200,其一个示例是企业或其他组织的本地站点。在生产站点200处生成新的和/或修改后的数据,生产站点200包括一个或多个VM实例,诸如VM实例202。VM实例202可以被称为生产VM,因为它是在生产站点200处创建和/或在生产站点200处操作的。生产站点200可以被视为数据源。本发明的实施方式可以结合任何数量或类型的数据源来操作。

在生产站点处生成的新的和/或修改后的数据可能需要受到保护,使得在发生以某种方式折损数据的问题(诸如例如数据丢失或损坏)的情况下可以在一个或多个站点还原此类数据。如上所述,本发明的实施方式提供了可操作以还原一个或多个对应VM的特定VM还原实例类型的规范。为此,生产站点200还包括通常小于生产VM202的基线测试VM 204。在一些实施方式中,基线测试VM 204可以包括在生产VM 202的客户群体中共有的部件。为了说明,基线测试VM 204可以包括与生产VM 202的群体中的VM相同类型和数量的磁盘。同样,基线测试VM 204可能缺乏尽管存在于一个或多个生产VM 202中但在生产VM 202的群体中不共有的部件和属性,和/或基线测试VM 204可以包括与生产VM 202中的任一者相比相对少的数据。因此,基线测试VM 204可以被认为是相对于群体中的生产VM 202的“最小公分母”VM。

通常并且如本文别处更详细地讨论的,使用不同的还原VM还原实例类型对基线测试VM 204执行自动还原过程。这样,可以对还原各种相应大小的客户VM可能涉及的时间量做出相对确定。关于基线测试VM 204执行的这些自动还原过程可以由RITE 400在临时或调度的基础上自动发起和/或执行,和/或响应于用户输入或发起而发起和/或执行。在一些情况下,每当例如云存储站点300的所有者/运营商实现新的VM还原实例类型时,RITE 400就可以对基线测试VM204执行自动还原过程。

如图1中进一步指示,RITE 400可以在云存储站点300处创建还原VM(测试)302。还原VM(测试)302是基于基线测试VM 204创建的,因而,还原VM(测试)302可操作以在云存储站点300处执行DR过程,诸如创建基线测试VM 204的测试VM实例304。由还原VM(测试)302创建测试VM实例304可能涉及由还原VM(测试)302执行各种过程,诸如但不限于创建与测试VM204的磁盘相同大小的磁盘、从云存储300中读取测试VM 204的备份数据副本并将这些副本写入新创建的磁盘、然后在测试VM实例304上安装所需的装置驱动程序。

还原VM(测试)302可以由RITE 400基于例如可以由用户指定或者例如由RITE 400自动指定的特定VM还原实例类型而创建。VM还原实例类型可以特定于特定的云存储300提供商或环境。RITE 400可以使用各种其他标准(诸如还原成本(RC价格)和还原时间(RC时间))作为创建还原VM(测试)302的基础。在已经创建了反映这些标准的还原VM(测试)302之后,然后可以运行还原VM(测试)302以创建测试VM实例304。

应当理解,可以创建任何数量的还原VM(测试)302,然后运行还原VM(测试)302以创建任何数量的测试VM实例304。此外,一个或多个还原VM(测试)302的创建和运行可以临时、反复地、自动地、不定期地、响应于事件的发生或未发生或在任何其他基础上执行。在一些实施方式中,诸如当云存储300提供商不再支持还原VM(测试)302的还原VM还原实例类型时,可以从云存储300中删除还原VM(测试)302。对于由该还原VM(测试)302创建的测试VM实例304,情况同样如此。

B.示例性还原实例类型评估器(RITE)的各方面

继续参考图1,提供了关于示例性RITE 400的进一步细节。通常,RITE 400可以驻留在生产站点200的本地,或者替选地,RITE 400可以是云存储站点300的元件。在又其他实施方式中,RITE 400可以驻留在除生产站点200或云存储站点300之外的站点处。

RITE 400就其操作而言可以创建并运行一个或多个选定的还原VM 306,每个还原VM 306可操作以创建与生产站点200的相应VM实例202相对应的对应VM 308。通常,在可与特定的VM还原实例类型相对应的各种标准(关于将由还原VM 306用于创建VM 308的过程)已经被指定之后,可以由RITE 400执行还原VM 306的创建。此类标准可以包括但不限于还原VM 306还原VM 308的成本(RC价格),以及还原VM 306还原VM 308所需的时间量(RC时间)。还原成本可以基于由存储站点300的运营商强加的价格结构,诸如$/GB。至少在一些情况下,尽管大型/复杂VM的还原成本可能相对较高,而小型/简单VM的还原成本可能相对较小,但是情况并非一定如此。

现在特别参考RITE 400,提供关于各种VM还原实例类型的评估的进一步细节,诸如可以由RITE 400执行该评估。通常,RITE 400操作以基于标准(诸如特定客户的速度/成本权衡解决策略(TR策略))针对每个任何特定客户VM为该特定VM自动选择最佳VM还原实例类型(RI类型)。

RITE 400将使用可供给定的云存储站点300供应商使用的不同还原VM还原实例类型对预定义大小的小型基线测试VM 204周期性地执行自动还原活动。即,并且如上文所解释,RITE 400将创建还原VM(测试)302,其可操作以将基线测试VM 204还原为云存储站点300处的测试VM 304。由于执行基线测试VM 204的还原,因此还原基线测试VM 204的时间和成本都是已知的。

基于利用特定还原实例类型完成基线测试VM 204的还原活动所需的时间,RITE400将至少大约推导完成任何其他大小的并且具有与结合基线测试VM 204的自动还原指定的类型相同的VM还原实例类型的任何客户VM 308的还原所需的时间。因此,可以基于基线测试VM 204的还原性能来计算还原特定的VM还原实例类型的任何客户VM 308所需的时间。同样,对于每个云供应商和每个地理区域,还原任何VM还原实例类型的每小时成本也是已知的。在已知该时间和成本信息的情况下,客户然后可以为其VM生成DR计划。

具体地,对于每个特定客户的关于该客户的每个区域的每个VM还原实例类型,还原完成时间(RC时间)和还原完成价格(RC价格)是已知的或确定的。因此,客户(即,生产站点200的运营商)可以针对客户的每个VM生成并提供速度/成本权衡解决策略(TR策略)。替选地,RITE 400可以基于从客户接收到的输入生成策略。如本文别处所述,针对任何特定VM的策略可能非常简单,诸如“首选最低成本”或“首选最高速度”,或者该策略可能源自该VM的保护策略设置,或VM还原实例类型。

更详细地,对于各自与对应的VM还原实例类型相关联的每个客户VM,基于还原时间和还原成本自变量应用解析函数。然后,为特定客户VM选择通过应用解析函数获得排名最高的VM还原实例类型(排名=TR策略[RC时间,RC价格]),并且将指定的VM还原实例类型的选定还原VM(诸如还原VM 306)存储在云存储站点300处。当针对该特定客户VM执行完整的DR测试或真实的DR故障转移时,还原VM创建对应的VM。

为了以示例进行简要说明,当针对VM 202执行完整DR测试或真实DR故障转移时,具有指定的还原VM还原实例类型的还原VM306然后运行各种DR过程以在云存储站点300处创建VM 308。因为还原VM 306具有指定的VM还原实例类型,所以VM 308是由还原VM 306根据由用户指定的并且在适用于VM 202的特定策略中捕获的属性而创建的。

如图1所示,可以使用一组部件来执行RITE 400的上述和其他功能。例如,RITE400可以包括调度器402。调度器402确定何时在系统中执行VM还原实例类型发现活动。基于由调度器402生成的调度来调用编排器404。

更具体地,编排器404与VM实例性能和成本评估器406交互。编排器404从VM实例性能和成本评估器406接收形式为[区域,RI类型,RC时间,RC价格]的4维向量,其中“RI类型”是指特定的VM还原实例类型。因此,4维向量对应于基线测试VM 204,而不对应于任何特定客户VM 202。可以为特定客户区域中的每个不同RI类型生成基线向量,即,4维向量。

如上所述,一种或多种VM还原实例类型可以由云存储提供商或其他实体指定。因此,4维向量指示客户区域、指定的VM还原实例类型以及还原时间和还原成本的还原参数,所述还原参数是在执行指定的客户区域中的指定的VM还原实例类型的测试VM 204的还原时测量的。如前所述,测试VM 204的还原包括由还原VM(测试)302创建测试VM 304。因此,4维向量可以被称为基线向量,因为它不特定于任何特定的VM,而是如下文所讨论用作创建各自特定于特定的相应VM的5维向量的基线。

具体地,基于与测试VM 204的还原相结合地生成的4维向量,编排器404生成5维向量[区域,VM,RI类型,RC时间,RC价格]。因此,每个5维向量尤其标识特定的客户VM和客户区域。即,给定区域中的每个客户VM都有特定的5维向量。同样,该特定客户VM的RC时间和RC价格由编排器404基于客户VM大小与测试VM大小的比率而定义,该比率诸如所获得的VM 202大小与测试VM 204大小的比率(即,[客户VM大小/测试VM大小])。

通过说明,约为基线测试VM 204的10倍大的客户VM 202可以预期具有约为基线测试VM 204的还原成本和还原时间的10倍高的相应的还原成本和还原时间。由于测试VM的还原成本和还原时间从测试VM过程已知,因此可以易于使用该信息与VM大小与测试VM大小的已知比率相结合地确定实际客户VM 202的还原成本和还原时间。如上述示例所示,每个5维向量因此包含特定于特定客户VM/区域的并且源自在基线测试期间收集的信息的还原时间(RC时间)和还原成本(RC成本)信息。

继续参考图1中的RITE 400,编排器404与规则引擎408交互,并且对于每个客户区域/VM,编排器404将向规则引擎408提供速度/成本权衡解决(TR)策略和特定条目,即,与特定客户区域中的特定客户VM相关联的特定5维向量。如本文别处所述,特定VM的条目(即,该VM的5维向量)可以采用以下形式:[区域,VM,RI类型,RC时间,RC价格]。TR策略或更一般地称为“权衡解决策略”可以由客户指定并提供给RITE 400。规则引擎408和/或RITE 400的一个、一些或全部其他元件可以由客户维护。

通常,权衡解决策略(TR策略)由客户提供,并且可以反映该客户在例如还原时间和还原成本方面的相对优先考虑。例如,TR策略可以包括还原时间(RC时间)和还原成本(RC价格)作为自变量。因而,TR策略可以由例如规则引擎408用作对用于特定客户VM的还原的特定VM还原实例类型进行排名和选择的基础。在至少一些实施方式中,将针对特定客户VM选择由于应用TR策略而被指派最高排名的VM还原实例类型,即,(排名或R=TR策略[RC时间,RC价格])。

因此,特定VM的TR策略实际上是将特定的5维VM条目作为参数或自变量并返回表示排名“R”的数字的函数。即,在展开形式下,该函数采用F[区域,VM,RI类型,RC时间,RC价格]=R的形式。规则引擎408应用该函数(该函数可以体现诸如下文讨论的公式)并返回表示排名的数字。

通常,由规则引擎408指派给特定条目的排名可以反映条目中的RC时间和RC价格与由客户针对指定的VM、RI类型和区域指定的RC时间和RC价格的匹配程度。以一个示例说明,客户可能指定还原时间的重要性权重为75%,而还原成本的重要性权重为25%。换句话说,对于该特定客户,还原时间的重要性是还原成本的3倍。因此,为了使规则引擎408生成分数以用于排名目的,使用上面的75/25示例,每个条目的RC时间可以乘以0.75并且每个条目的RC成本可以乘以0.25,并且然后将两个乘积相加((RC时间×0.75)+(RC成本×0.25))以产生总分数“AS”。

应当注意,尽管条目可以如上所述按它们相应的AS排名,但是本发明的范围不限于使用该AS公式。更一般地,可以使用任何其他公式对条目进行排名。因而,该AS公式仅作为说明而非限制的方式呈现。

因此,也可以使用其他公式和方法作为确定条目排名的基础。例如,可以采用使用以下排名函数选择最快VM还原实例类型的函数:F[区域,VM,RI类型,RC时间,RC价格]=R=1/RC时间。在该示例中,RC时间越高,将返回的排名就越低。作为另一示例,可以采用选择成本最低的VM还原实例类型的函数。更一般地,可以采用可以用作对一组条目进行排名的基础的任何函数。因此,本发明的范围不限于本文公开的示例。

在对每个区域/VM的所有条目进行迭代之后,编排器404然后选择具有如AS或其他公式所反映的最高排名的条目,并将与该最高排名相对应的三元组[区域,VM,RI类型]保存在系统数据存储库410中。该三元组然后可以用于还原其所对应的一个生产VM 202或多个生产VM 202。

继续参考图1,提供了关于RITE 400的各种部件的进一步细节。例如,性能和成本评估器406运行每个区域中可用的每个实例类型的预定义大小的基线测试VM的还原,并产生4维向量[区域,RI类型,RC成本,RC价格]。同样,规则引擎操作以基于以下各项而生成数字(排名):(i)由客户提供的所提供速度/成本权衡解决策略,和(ii)与区域中的客户VM相关的特定条目[区域,VM,RI类型,RC成本,RC价格]。最后,在例如由客户进行DR发起时,DR引擎310从系统数据存储库410获取适当的VM还原实例类型并且将创建该特定类型的VM还原实例。

C.示例性主机和服务器配置

现在简要参考图2,生产站点202、云存储站点300、RITE 400和这些元件的相应部件中的任何一者或多者可以采用物理计算装置的形式或者包括物理计算装置或者在物理计算装置上实现或者由物理计算装置托管,物理计算装置的一个示例用500表示。同样,在前述元件及其相应部件中的任一者包括虚拟机(VM)或由VM组成的情况下,该VM可以构成图2中公开的物理部件的任何组合的虚拟化。

在图2的示例中,物理计算装置500包括:存储器502,该存储器可以包括以下项中一个、一些或全部:随机存取存储器(RAM)、非易失性随机存取存储器(NVRAM)504、只读存储器(ROM)和永久性存储器;一个或多个硬件处理器506;非暂时性存储介质508;I/O装置510;以及数据存储装置512。物理计算装置500的存储器部件502中的一者或多者可以采用固态装置(SSD)存储装置的形式。同样,提供包括可执行指令的一个或多个应用程序514。此类可执行指令可以采用各种形式,包括例如可执行以执行本文公开的任何方法或其部分的指令,和/或可由存储站点(不管是企业本地,还是云存储站点)、客户端、数据中心、备份服务器、区块链网络或区块链网络节点中的任一者执行/可在上述任一者处执行以执行本文公开的功能的指令。同样,此类指令可执行以执行本文公开的任何其他操作,包括但不限于读取、写入、备份和还原操作和/或任何其他数据保护操作、审计操作、云服务操作、区块链操作、数据管理元素操作、区块链节点操作和区块链账本操作。

D.示例性方法

现在转向图3,公开了示例性方法的各方面。一种特定方法总体用600表示并且与涉及还原一个或多个客户VM的操作有关。

该方法可以开始于602,其中执行VM还原实例类型发现过程。该过程602可以例如由根据由调度引擎生成的发现调度而调用的编排器来执行。发现过程602涉及调查生产站点的一个或多个区域并识别存在于生产站点处的各种不同的VM还原实例类型。生产站点处可能存在任何数量的不同VM还原实例类型。过程602可以(i)根据调度自动地、(ii)响应于事件的发生或未发生、(iii)反复地、(iv)临时地或基于这些的任何组合被调用并执行。结合VM还原实例类型发现过程602,所发现的各种VM还原实例类型可以连同诸如但不限于客户身份、区域、每种类型的VM的数量和VM大小之类的信息一起存储在存储库中。

为还原604特定VM还原实例类型的一个或多个测试VM作准备,可以在生产站点处创建一个或多个测试VM。通常,测试VM可以采用基线或最小公分母VM的形式,其属性和特性是生产站点处的VM群体所共有的。因而,测试VM的大小可能小于它所表示的相应VM的大小。对于在生产站点处创建的每个测试VM,在云存储站点处创建对应的还原VM(测试)。还原VM(测试)可操作以执行导致在云存储站点处还原测试VM的DR过程。

在测试VM和对应的还原VM(测试)已经被创建之后,还原604测试VM中的一者或多者以便模拟DR过程。还原过程604导致在云存储站点处创建对应的测试VM。作为还原过程604的一部分,收集关于还原过程的测试信息。此类测试信息可以包括但不限于在云存储站点处还原测试VM所需要的时间以及还原该测试VM的成本。

然后使用测试信息来生成606特定于特定VM还原实例类型但不与生产站点的任何特定VM相关联的4D基线向量。即,4D基线向量对于全部共享同一VM还原实例类型的一个或多个VM实例是通用的。4D基线向量可以采用[区域,RI类型,RC时间,RC价格]的形式,其中“区域”是生产站点的特定区域,“RI类型”是VM还原实例类型,“RC时间”是还原测试VM的时间,并且“RC成本”是还原该测试VM的成本。

使用4D向量,然后生成608特定于生产站点的特定VM的5D向量。5D基线向量可以采用[区域,VM,RI类型,RC时间,RC价格]的形式,其中“区域”是生产站点的特定区域,“VM”标识生产站点的特定VM,“RI类型”是VM还原实例类型,“RC时间”是还原VM的预期时间,并且“RC成本”是还原该测试VM的预期成本。5D向量的预期RC时间和RC成本是基于以下各项而生成的:(i)VM还原实例类型与在5D向量中识别的特定VM相同的测试VM的RC时间和RC成本,以及(ii)VM大小与对应测试VM大小的关系。

如上所述,多个5D向量可以对应于给定的生产站点VM,其中每个5D向量表示不同的相应VM还原实例类型。因此,然后对5D向量进行排名610以确定哪种VM还原实例类型最适合还原在5D向量中识别的特定VM。对5D向量进行排名是基于5D向量并基于客户速度/成本权衡解决策略(TR策略)而执行610。因此,TR策略与5D向量相结合可以确定每个VM还原实例类型反映客户的需求的程度。在至少一些实施方式中,5D向量因此从高到低排名,其中排名最高的5D向量最好地反映了客户TR策略。

一旦对5D向量进行了排名610,就使用排名最高的5D向量的VM还原实例类型来还原612在5D向量中识别的VM。更详细地,与期望的VM还原实例类型相对应的还原VM在云存储站点处执行DR过程以在云存储站点处还原在5D向量中识别的VM。因此,当在生产站点处出现问题时,生产站点VM将在云存储VM处还原并且可供访问。

E.示例性计算装置和相关联的介质

本文公开的实施方式可包括使用包括各种计算机硬件或软件模块的专用或通用计算机,如下文更详细地讨论的。计算机可包括处理器和承载指令的计算机存储介质,这些指令在由处理器执行和/或导致由处理器执行时,执行本文公开的任一种或多种方法。

如上面所指出的,本发明的范围内的实施方式还包括计算机存储介质,该计算机存储介质是用于承载或具有存储在其上的计算机可执行指令或数据结构的物理介质。此类计算机存储介质可以是可由通用或专用计算机访问的任何可用物理介质。

以举例而非限制的方式,此类计算机存储介质可包括硬件存储装置,诸如固态磁盘/装置(SSD)、RAM、ROM、EEPROM、CD-ROM、闪存存储器、相变存储器(“PCM”)或其他光盘存储装置、磁盘存储装置或其他磁性存储装置,或任何其他硬件存储装置,其可用于以计算机可执行指令或数据结构的形式存储程序代码,该程序代码可由通用或专用计算机系统访问和执行以实现本发明公开的功能。上述各项的组合也应包括在计算机存储介质的范围内。此类介质也是非暂时性存储介质的示例,并且非暂时性存储介质还涵盖基于云的存储系统和结构,但本发明的范围不限于非暂时性存储介质的这些示例。

计算机可执行指令包括例如使通用计算机、专用计算机或专用处理装置执行特定功能或功能组的指令和数据。尽管已经以特定于结构特征和/或方法行为的语言描述了主题,但应当理解,所附权利要求中定义的主题不一定限于上述特定特征或行为。相反,本文公开的特定特征和行为是作为实现权利要求的示例形式公开的。

如本文所用,术语“模块”或“部件”可指在计算系统上执行的软件对象或例程。本文描述的不同部件、模块、引擎和服务可实现为在计算系统上执行的对象或过程(例如,作为单独的线程)。虽然本文描述的系统和方法可用软件来实现,但用硬件或软件和硬件的组合来实现也是可能的和所设想的。在本公开中,“计算实体”可以是如本文先前定义的任何计算系统,或者在计算系统上运行的任何模块或模块组合。

在至少一些情况下,提供了一种硬件处理器,该硬件处理器可操作以执行用于执行方法或过程(诸如本文公开的方法和过程)的可执行指令。硬件处理器可包括也可不包括其他硬件的元件,诸如本文公开的计算装置和系统。

就计算环境而言,本发明的实施方式可在客户端-服务器环境中执行,无论是网络环境还是本地环境,或者在任何其他合适的环境中执行。适于本发明的至少一些实施方式的操作环境包括云计算环境,其中客户端、服务器或其他机器中的一个或多个可驻留在云环境中并在云环境中操作。

本发明可在不脱离其精神或基本特征的情况下以其他特定形式实施。所描述的实施方式在所有方面仅被视为说明性的而非限制性的。因此,本发明的范围由所附权利要求书而不是前述描述来指示。在权利要求的等效物的意义和范围内的所有变化都包含在本权利要求的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号