首页> 中国专利> 用于通信系统路由组件级高度可用性的系统和方法

用于通信系统路由组件级高度可用性的系统和方法

摘要

本发明提供一种用于通信系统路由组件级高度可用性的系统和方法。一种用于提供路由组件级高度可用性的方法包含:使来自主用信息源的信息同步;检测路由组件中的故障;用备份路由组件代替所述出故障的路由组件;以及完成所述信息的同步。

著录项

  • 公开/公告号CN102754383A

    专利类型发明专利

  • 公开/公告日2012-10-24

    原文格式PDF

  • 申请/专利权人 华为技术有限公司;

    申请/专利号CN201180002894.2

  • 发明设计人 陈怀谟;赵强林;

    申请日2011-03-29

  • 分类号H04L1/22(20060101);H04L1/16(20060101);H04L29/06(20060101);

  • 代理机构

  • 代理人

  • 地址 518129 中国广东省深圳市龙岗区坂田华为总部办公楼

  • 入库时间 2023-12-18 07:11:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-11-05

    授权

    授权

  • 2012-12-19

    实质审查的生效 IPC(主分类):H04L1/22 申请日:20110329

    实质审查的生效

  • 2012-10-24

    公开

    公开

说明书

本发明要求2010年3月29递交的发明名称为“用于路由组件级高度可 用性的系统和方法”的第61/318,459号美国临时申请案的在先申请优先权, 且进一步要求2010年7月1日递送的发明名称为“用于通信系统路由组件级 高度可用性的系统和方法”的第12/829,315号美国非临时申请案的在先申 请优先权。所述临时申请案和非临时申请案两者在此以引入的方式并入本文 本中。

技术领域

本发明大体上涉及用于数字通信的系统和方法,且更特定来说,涉及用 于通信系统路由组件级高度可用性的系统和方法。

发明背景

许多服务提供商已开始通过提供商的通信系统向其客户提供实时网络 业务,例如,因特网语音协议(VoIP)、因特网协议(IP)电视等等。归因 于这些业务的实时性质,服务提供者以令人满意的水平向其客户提供连续服 务可非常关键。因此,服务提供商需要使其网络服务对于其客户始终可用。

路由器是在通信系统中将实时网络服务提供给客户的主要构造块。在路 由器中运行着许多路由协议,例如开放式最短路径优先(OSPF)和边界网关 协议(BGP)。这些协议维持着最新的网络拓扑且计算到通信系统中的每一目 的地的最佳路由。路由器中的路由表管理器(RTM)将每一路由协议所计算 的所有路由维持于路由表中,且选择具有到每一目的地的较高优先权的路由。 所有这些选定的路由被转发表管理器(FTM)存储在转发信息库(FIB)中以 供转发包。

通常,通信系统中的每一路由器通过执行路由协议以与其邻近的路由器 交换关于通信系统的信息而与通信系统中的任何其它路由器具有与通信系 统的拓扑一致的概观。因此,每一路由器与通信系统中的任何其它路由器具 有一致的FIB,且适当地将包转发到其目的地。如果在FIB或通信系统的拓 扑概观中存在任何不一致,则可发生路由循环,且实时网络服务可能被中断。

具有高度可用性的通用路由器由主用主板(AMB)和备用主板(SMB)组 成。RTM和路由协议,例如OSPF和BGP,运行于AMB和SMB上。在某些路由 器中,不同的软件组件,例如RTM和BGP,可作为单独过程运行。在通信系 统中可能发生的重要问题是,路由器通过技术从路由器中的故障,例如失败 的组件切换,恢复过来的时间可能较长,因为在某些过程之间的大量数据的 同步,例如,RTM与BGP之间的路由表中的数百万BGP路由,可能花费较长 时间。在恢复期间,路由器可能相对于网络中的其它路由器具有不一致的 FIB或对通信系统的拓扑的概观。不一致可导致路由循环,以及实时网络服 务降级或中断。

因此,需要用于从路由器中的故障快速恢复过来的系统和方法。因此, 出故障的路由器将在执行失败的组件切换后与网络中的其它路由器即时地 (或即刻)具有一致的FIB和对通信系统的概观。由通信系统提供的实时网 络服务将不会受路由器内的故障显著影响。

发明内容

通过提供用于通信系统路由组件级高度可用性的系统和方法的本发明 的优选实施例,一般地解决或回避了这些和其它问题,且一般地实现了技术 优点。

根据本发明的优选实施例,提供一种用于使来自主用信息源的信息同步 的方法。所述方法包含:检测信息中的改变;将关于所改变的信息的第一更 新发送到备份信息源;将第二更新发送到一个或一个以上主用信息消耗装置 中的每一者;以及向备份信息源提交所改变的信息。第二更新得自所改变的 信息。

根据本发明的另一优选实施例,提供一种用于提供路由组件级高度可用 性的方法。所述方法包含:使来自主用信息源的信息同步;检测出故障的路 由组件;用备份路由组件代替所述出故障的路由组件;以及完成信息的同步。

根据本发明的另一优选实施例,提供一种路由器。所述路由器包含:接 收器,其将耦合到数据输入端口;发射器,其将耦合到数据输出端口;主用 主板,其耦合到所述发射器和所述接收器;备用主板,其耦合到所述主用主 板;以及控制器,其耦合到所述主用主板和所述备用主板。所述接收器通过 所述数据输入端口接收传入信息,所述发射器通过所述数据输出端口发射传 出信息,所述主用主板提供路由管理并执行路由协议以将传入信息路由到其 既定接收方,且所述备用主板在所述主用主板中出故障的情况下提供对所述 主用主板的冗余。所述控制器检测所述主用主板中的故障,且当检测到故障 时用备用组件交换出故障的固件。

实施例的优点在于,显著减少了在检测到路由组件中的故障并代替出故 障的路由组件时必须在各种相关路由组件间进行交换以使相关路由信息同 步的数据量。因此,使相关路由信息同步花费实质上较少的时间,从而减少 了对实时服务的负面影响。

实施例的进一步优点是,可代替广泛多种路由组件,进而增加了在提供 多个路由组件高度可用性方面的灵活性。

上文已相当广泛地概述了本发明的特征和技术优点,以为了更好地理解 随后的对实施例的详细描述。下文将描述实施例的额外特征和优点,其形成 本发明的权利要求书的标的。所属领域的技术人员将了解,所揭示的概念和 特定实施例可容易用作用于修改或设计其它结构或过程以实行本发明的相 同目的的基础。所属领域的技术人员还应认识到,此类等效建构不偏离所附 权利要求书中所陈述的本发明的精神和范围。

附图简述

为了更完整地理解本发明及其优点,现在参考结合附图进行的以下描述, 附图中:

图1a是通信系统的图;

图1b是路由器的图;

图1c是图1b中所展示的控制件的详细视图的图;

图2a是路由器的一部分的图;

图2b是信息同步中的A-PRO操作的流程图;

图2c是用新组件交换出出故障的组件并使新组件服务的操作的流程图;

图3a是与A-OSPF相关的路由器的一部分的图;

图3b是LSA和路由同步中的A-OSPF操作的流程图;

图3c是用新组件交换出出故障的A-OSPF组件并使新组件服务的操作的 流程图;

图4a是与A-RTM相关的路由器的一部分的图;

图4b是路由同步中的A-RTM操作的流程图;

图4c是用新组件交换出出故障的A-RTM组件并使新组件服务的操作的 流程图;

图5a是路由器的另一部分的图;

图5b是信息同步中的A-PRO操作的流程图;

图5c是用新组件交换出出故障的A-PRO组件并使新组件服务的操作的 流程图;

图6a是与A-FTM相关的路由器的一部分的图;

图6b是路由同步中的A-FTM操作的流程图;以及

图6c是用新组件交换出出故障的A-FTM组件并使新组件服务的操作的 流程图。

具体实施方式

下文详细论述目前优选的实施例的制作和使用。然而,应了解,本发明 提供可以广泛多种具体环境体现的许多可适用的发明性概念。所论述的具体 实施例仅说明用以制作和使用本发明的具体方式,且不限制本发明的范围。

将在具体环境中相对于优选实施例,即在提供实时服务的通信系统中的 路由器,来描述本发明。然而,本发明还可适用于提供实时、准实时、时间 敏感、时间不敏感,或其组合的服务的其它通信中的路由器。

图1a说明通信系统100。通信系统100可包含一个或一个以上路由器, 例如路由器120、路由器121和路由器122。路由器可连接到一个或一个以 上其它路由器。举例来说,路由器120可连接到路由器121和路由器122。

一般来说,每一路由器具有关于通信系统的网络拓扑的信息。每一路由 器基于关于所述网络拓扑的信息而计算到目的地的最佳路由。可将最佳路由 写入路由表中,可将最佳路由从所述路由表传递到转发表,转发表用于将例 如IP包等数据转发到其目的地。

图1b说明路由器150。路由器150可为用于例如通信系统100的通信 系统中的路由器的一实施方案。路由器150可为有线路由器、无线路由器, 或其组合。本文中的论述不区分有线或无线路由器。因此,术语路由器的使 用可适用于有线路由器、无线路由器,或有线和无线路由器的组合。

路由器150包含可用于接收一般呈IP包的形式的传入信息的接收单元 155。路由器150还包含可用于发射传出信息的发射单元157。接收单元155 和发射单元157可耦合到主用主板(AMB)159。AMB 159可由执行例如路由 表管理等路由任务、执行路由协议等的单元组成,其可用于将所接收的传入 信息路由到其既定接收方。

作为一实例,AMB 159可用处理元件实施,例如通用处理器、专用处理 器、控制器、信号处理单元等。在替代性实施例中,AMB 159可用经特殊设 计以提供例如路由表管理等路由功能性、执行路由协议等的功能块实施。AMB 159还可包含专用存储器来存储例如路由等信息。

为了增加可用性,即可靠性,路由器150可包含一个以上主板。如图 1b中所示,路由器150还包含备用主板(SMB)161,其可实质上类似于AMB 159。根据一实施例,AMB 159和SMB 161可为等同的,从而意味着SMB 161 可提供与AMB 159等同的功能性。SMB 161可向路由器150提供冗余的度量。 根据替代性实施例,SMB 161可实施AMB 159的功能性的子集,从而仅提供 AMB 159的一些功能性。举例来说,AMB 159可包含未实施于SMB 161中的 主用信息消耗装置。

路由器150还包含可用于控制路由器150的操作的控制件163,所述操 作例如为检测故障、交换组件(例如,针对适当地操作的组件交换出故障的 组件)等。可使用通用处理器或专用处理器或控制器、组合逻辑、状态机或 其组合来实施控制件163。存储器165可用于存储配置信息、为路由数据提 供存储空间、清除存储器、缓冲空间等。存储器165可为只读存储器、随机 存取存储器、可编程只读存储器等的组合。

图1c说明控制件163的详细视图。控制件163包含用于检测AMB 159 中的故障的故障检测单元172,和用于用备用组件交换出故障的组件的组件 交换单元174。

故障检测单元173可检测AMB 159的组件中的故障。根据一替代性实施 例,不检测AMB 150的单一组件的故障,故障检测单元172可检测出整个 AMB 159出现故障。可使用多种技术来执行检测故障。举例来说,如果组件 在指定时间量之后不响应,则可认为组件是出故障的组件。或者,如果组件 对特定请求不作出响应,则可认为组件是出故障的组件。此外,如果组件未 在指定的参数内操作,则可认为组件是出故障的组件。检测出故障的组件可 超出实施例的范围,且将不在本文中进行进一步论述。

组件交换单元174可用于用备用组件交换出故障的组件。举例来说,如 果特定组件被检测为有故障,则组件交换单元174可执行用备用组件代替有 故障组件可为必需的操作,例如信号路径重新路由、旗标设定等。组件交换 单元仅可交换出有故障组件,与有故障组件相同类型的所有组件,或含有有 故障组件的整个板。

图2a说明路由器200的一部分。路由器200的AMB 205和SMB 207在 图2a中突出显示。图2a中展示从出故障的组件进行恢复以及用于在AMB 205 与SMB 207之间进行数据同步的技术。

在AMB 205中,可能有主用发生器(A-PRO)210在执行,而在SMB 207 中,备用发生器(S-PRO)212可能在执行。此外,可能有多个主用消耗装 置(A-CON),例如A-CON-1215和A-CON-N 217在AMB 205中执行,以及 多个备用消耗装置(S-CON),例如S-CON-1220和S-CON-N 222,在SMB 207 中执行。

可认为A-PRO 210是主用信息源,因为其产生供主用信息消耗装置,例 如A-CON,消耗的信息。可认为S-PRO 212是备份信息源,因为其既定为在 A-PRO 210出故障的情况下A-PRO 210的代替物。类似地,可认为S-CON是 备份信息消耗装置,万一A-CON中的一者或一者以上出故障,则备份A-CON。

A-PRO 210可与S-PRO 212以及A-CON通信,而每一A-CON可与A-PRO 210及其对应的S-CON通信。举例来说,A-CON-1215可与A-PRO 210和 S-CON-1220通信。S-PRO 212可与A-PRO 210通信,且每一S-CON可与其 对应的A-CON通信。作为一实例,S-CON-N 222可与A-CON-N 217通信。

图2a还说明AMB 205与SMB 207之间的用以使信息同步的传输序列。 在A-PRO 210发现已存在信息改变时,A-PRO 210向S-PRO 212发送更新(展 示为事件1“UPDATE”),而可开始信息同步。根据一实施例,信息改变可包 含一条新信息、对一条现有信息的修改、对一条现有信息的删除,或其组合。 更新含有信息改变。

S-PRO 212在成功地接收到更新之后可即刻在S-PRO 212处理了更新之 后将对更新的确认发送回A-PRO 210(展示为事件2“ACK”)。处理更新可包 含检查更新、解码更新、存储来自所解码更新的信息,等等。A-PRO 210还 可在从S-PRO 212接收到确认之后将得自信息改变的更新-d发送到A-CON, 例如A-CON-1215和A-CON-N 217(展示为事件3-1“UPDATE-D”和 3-N “UPDATE-D”)。根据一实施例,得自信息改变的更新-d可在一种情况下 含有信息改变,且在另一种情况下含有由信息改变产生的信息。根据另一实 施例,A-PRO 210可同时地或依次地将更新-d发送到A-CON。

在从A-PRO 210接收到更新-d且处理了更新之后,A-CON中的每一者可 将更新-d发送到其对应的S-CON,举例来说,A-CON-1 215可将更新-d发送 到S-CON-1 220等(展示为事件4-1“UPDATE-D”和4-N“UPDATE-D”)。S-CON 中的每一者在从其对应的A-CON接收到更新-d并处理了更新-d之后,可将 对更新-d的确认发送到其对应的A-CON(展示为事件5-1“ACK”和5-N“ACK”)。 作为一实例,S-CON-N 222可将确认发送到A-CON-N 217。

对于每一更新(或离散信息单元),存在用以指示S-PRO 212中的更新 状态的旗标。更新的一个状态可为“从A-PRO接收”,其指示S-PRO 212从 A-PRO 210接收到更新。在S-PRO 212接收到并处理了更新之后,用于更新 的旗标被S-PRO 212设定为“从A-PRO接收”。更新的另一状态可为“存储在 S-CON中”,其指示S-CON中的每一者接收到并存储了得自更新中所包含的 信息改变的更新-d。

在从其对应的S-CON接收到确认后,每一A-CON可即刻将对来自A-PRO 210的更新-d的确认发送回A-PRO 210(展示为事件6-1“ACK”和6-N“ACK”)。 在从所有其A-CON接收到确认之后,A-PRO 210可将更新提交发送到S-PRO 212(展示为事件7“COMMIT”)。根据一实施例,更新提交可为向S-PRO 212 的指示,其指示所有S-CON接收到并存储了得自更新中所包含的信息改变 的更新-d。实际上,所述提交告知S-PRO 212将旗标设定为“存储于S-CON 中”。S-PRO 212可随后在其处理了更新提交之后将提交确认发送到A-PRO 210(展示为事件8“COM-ACK”)。

图2b说明信息同步中的A-PRO操作250的流程图。A-PRO操作250可 指示A-PRO,例如A-PRO 210中发生的操作,如在A-PRO检测到信息改变时 A-PRO使信息与S-PRO、A-CON和S-CON同步。图2b中所展示的A-PRO操作 250可为A-PRO的角度下的图2a中所展示的事件的汇总,且其中未展示确 认。

A-PRO操作250可开始于A-PRO检测信息改变,且由于所检测到的信息 改变而更新S-PRO(方框255)。除了更新S-PRO之外,A-PRO还可更新A-CON (方框257)。在更新了S-PRO和A-CON之后,A-PRO可向S-PRO提交信息改 变(方框259)。A-PRO操作250可随后终止。

图2c说明用新组件交换出出故障的组件并使新组件服务的操作275的 流程图。操作275可指示当路由器检测到出故障的组件且使用组件交换以用 新组件代替出故障的组件时路由器的控制件,例如控制件163中发生的操作。

可以不同粒度进行组件交换。举例来说,在较细粒度下,组件交换仅可 用新组件代替出故障的组件。在中等粒度下,组件交换可用新组件代替出故 障的组件以及与出故障的组件相同类型(相同组件类型)的组件。而在较高 粒度下,组件交换可用新板代替含有出故障的组件的整个板。操作275可说 明在任何粒度水平下出现的操作。

操作275可开始于路由器检测故障(方框280)。可使用多种技术来执 行检测故障。在检测到出故障的组件之后,可用新组件交换出出故障的组件 (方框282)。所交换出的组件可取决于组件交换的粒度。举例来说,如果 A-PRO出故障,则可用S-PRO代替出故障的A-PRO,或用SMB代替含有出故 障的A-PRO的整个板,即AMB。类似地,如果A-CON出故障,则出故障的A-CON 被S-CON代替,所有A-CON(包含出故障的A-CON)可被S-CON代替,含有 出故障的A-CON的板可被代替,等等。

为了论述目的,考虑三个示范性情况:1)检测到AMB 205已出故障, 于是AMB 205被SMB 207代替,其中AMB 205的PRO 210和A-CON-1 215到 A-CON-N 217被SMB 207的S-PRO 212和S-CON-1 220到S-CON-N 222代替。 SMB 207的S-PRO 212和S-CON-1 220到S-CON-N 222现在变为A-PRO和A-CON。 2)检测到A-PRO 210已出故障,于是A-PRO 210可被S-PRO 212代替,其 中S-PRO 212变为A-PRO。3)检测到A-CON-1 215已出故障,于是所有A-CON (A-CON-1 215到A-CON-N 217)可被S-CON(S-CON-1 220到S-CON-N 222) 代替,其中S-CON变为A-CON。

在已用新组件交换出故障的组件(方框282)之后,A-PRO(原始A-PRO 或新A-PRO)可将存储于A-PRO的存储器、高速缓冲存储器、表格等中的具 有状态“从A-PRO接收”的所有数据发送到A-CON(方框284)。由于具有状态 “从A-PRO接收”的数据量通常较小,所以可非常快速地执行将所述数据发送 到A-CON。

如果出故障的组件是A-CON,则信息同步可正常进行(例如,如2a和 2b中所描述)。同步完成(方框286),路由器可重新开始正常操作且操作 275可随后终止。

虽然未图示,但为了让操作275尽可能快地完成,可能需要使用例如 图2a和2b中所示的技术的A-PRO 210、S-PRO 212、A-CON和S-CON的信息 同步。

图3a说明路由器300的一部分。路由器300的AMB 305和SMB 307在 图3a中突出显示。图3a中展示从出故障的组件进行恢复(具体来说,展示 路由器300中的开放式最短路径优先(OSPF)和路由表管理(RTM))以及用 于AMB 305与SMB 307之间的数据同步的技术。

在AMB 305中,可能有主用OSPF(A-OSPF)310在执行,而在SMB 307 中,备用OSPF(S-OSPF)312可能在执行。此外,可能有主用RTM(A-RTM) 315和备用RTM(S-RTM)317分别正在AMB 305和SMB 307中执行。A-OSPF 310与S-OSPF 312和A-RTM 315通信,而A-RTM 315与A-OSPF 310和S-RTM 317通信,且S-RTM 317与A-RTM 315通信。

可认为A-OSPF 310是主用信息源,因为其产生供主用信息消耗装置, 例如A-RTM 315,消耗的信息(例如,路由)。可认为S-OSPF 312是备份信 息源,因为其既定为在A-OSPF 310出故障的情况下A-OSPF 310的代替物。 类似地,可认为S-RTM 317是备份信息消耗装置,万一A-RTM 315出故障, 则备份A-RTM 315。

图3a还说明AMB 305与SMB 307之间的用以使信息(例如,链路状态 广告和路由)同步的传输序列。在A-OSPF 310发现已存在链路状态广告(LSA) 改变时,A-OSPF 310向S-OSPF 312发送LSA(展示为事件1“LSA”),而可 开始LSA同步。根据一实施例,LSA改变可包含新LSA、对现有LSA的修改、 对现有LSA的删除,或其组合。

在成功地接收到LSA之后,S-PRO 312可即刻在S-OSPF 312进一步处 理了LSA之后将对LSA的确认发送回A-OSPF 310(展示为事件2“ACK”)。 处理LSA可包含检查LSA、解码LSA、存储来自所解码LSA的信息,等等。 A-OSPF 310还可在从S-OSPF 312接收到确认之后将得自LSA改变的路由或 一组路由发送到A-RTM 315(展示为事件3“ROUTE”)。在从A-OSPF 310接收 到路由并处理了路由之后,A-RTM 315可将路由发送到S-RTM 317(展示为 事件4“ROUTE”)。S-RTM 317在从A-RTM 315接收到路由并处理了路由之后, 可将对路由的确认发送到A-RTM 315(展示为事件5“ACK”)。

在从S-RTM 317接收到确认后,A-RTM 315可即刻将对来自A-OSPF 310 的路由的确认发送回A-OSPF 310(展示为事件6“ACK”)。在从A-RTM 315接 收到对路由或一组路由的确认之后,A-OSPF 310可将LSA提交发送到S-OSPF 312(展示为事件7“COMMIT”)。根据一实施例,LSA提交可为向S-OSPF 312 的指示,其指示得自LSA的路由或一组路由存储于S-RTM中。此可通过设定 用于LSA的状态旗标(称为“存储于S-RTM中”)来表示。S-OSPF 312可随 后在其处理了LSA提交之后将提交确认发送到A-OSPF 310(展示为事件 8“COM-ACK”)。

对于每一LSA(或离散信息单元),存在用以指示S-OSPF 312中的LSA 状态的旗标。LSA的一个状态可为“从A-OSPF接收”,其指示S-OSPF 312从 A-OSPF 310接收到LSA。S-OSPF 312在其从A-OSPF 310接收到LSA之后设 定用于LSA的旗标“从A-OSPF接收”。LSA的另一状态可为“存储于S-RTM中”, 其指示接收到S-RTM 317且存储了得自LSA的路由或一组路由。S-OSPF 312 在其从A-OSPF 310接收到LSA的提交之后设定用于LSA的旗标“存储于S-RTM 中”并复位旗标“从A-OSPF接收”。

图3b说明LSA和路由同步中的A-OSPF操作350的流程图。A-OSPF操 作350可指示A-OSPF,例如A-OSPF 310中发生的操作,如在A-OSPF检测 到LSA改变时使LSA与S-OSPF同步,且使路由与A-RTM同步。图3b中所展 示的A-OSPF操作350可为A-OSPF的角度下的图3a中所展示的事件的汇总, 且其中未展示确认。

A-OSPF操作350可开始于A-OSPF检测LSA改变,且由于所检测到的LSA 改变而更新S-OSPF(方框355)。除了更新S-OSPF之外,A-OSPF还可更新 A-RTM(方框357)。在更新了S-OSPF和A-RTM之后,A-OSPF可向S-OSPF 提交LSA改变(方框359)。A-OSPF操作350可随后终止。

图3c说明用新组件交换出出故障的组件并使新组件服务的操作375的 流程图。操作375可指示当路由器检测到出故障的组件且使用组件交换以用 新组件代替出故障的组件时路由器的控制件,例如控制件163中发生的操作。

操作375可开始于路由器检测故障(方框380)。如先前所论述,可使 用多种技术执行检测故障的发生,且在本文中将不进行论述。在检测到出故 障的组件之后,可用新组件交换出出故障的组件(方框382)。如先前所论 述,可以不同粒度进行组件交换且所交换出的组件可取决于组件交换的粒度。 举例来说,如果A-OSPF出故障,则可用S-OSPF代替出故障的A-OSPF,或 用SMB代替含有出故障的A-OSPF的整个板,即AMB。类似地,如果A-RTM 出故障,则出故障的A-RTM可被S-RTM代替,含有出故障的A-RTM的板可被 代替,等等。

为了论述目的,考虑三个示范性情况:1)检测到AMB 305已出故障, 于是AMB 305可被SMB 307代替,其中AMB 305的A-OSPF 310和A-RTM 315 被SMB 307的S-OSPF 312和S-RTM 317代替。SMB 307的S-OSPF 312和S-RTM 317现在分别变为A-OSPF和A-RTM。2)检测到A-OSPF 310已出故障,于是 A-OSPF 310可被S-OSPF 312代替,其中S-OSPF 312变为A-OSPF。3)检测 到A-RTM 315已出故障,于是A-RTM 315可被S-RTM 317代替,其中S-RTM 317变为A-RTM。

在已用新组件交换出故障的组件(方框382)之后,A-OSPF(原始A-OSPF 或新A-OSPF)可将存储于A-OSPF的存储器、高速缓冲存储器、表格等中的 通过具有状态“从A-OSPF接收”的LSA得到的所有路由发送到A-RTM(方框 384)。由于具有状态“从A-OSPF接收”的LSA的数目通常较小,所以可非常 快速地执行A-OSPF将得自LSA的路由发送到A-RTM。

如果出故障的组件是A-RTM 315,则信息同步可正常进行(例如,如3a 和3b中所描述)。同步完成(方框386),路由器可重新开始正常操作且操 作375可随后终止。

虽然未图示,但为了让操作375尽可能快地完成,可能需要使用例如图 3a和3b中所示的技术的A-OSPF 310、S-OSPF 312、A-RTM 315和S-RTM 317 的信息同步。

图4a说明路由器400的一部分。路由器400的AMB 405和SMB 407在 图4a中突出显示。图4a中展示从出故障的组件进行恢复(具体来说,展示 路由器400中的路由表管理(RTM)和转发表管理(FTM))以及用于AMB 405 与SMB 407之间的数据同步的技术。

在AMB 405中,可能有主用RTM(A-RTM)410在执行,而在SMB 407中, 备用RTM(S-RTM)412可能在执行。此外,可能有主用FTM(A-FTM)415和 备用FTM(S-FTM)417分别正在AMB 405和SMB 407中执行。A-RTM 410与 S-RTM 412和A-FTM 415通信,而A-FTM 415与A-RTM 410和S-FTM 417 通信,且S-FTM 417与A-FTM 415通信。

可认为A-RTM 410是主用信息源,因为其产生供主用信息消耗装置,例 如A-FTM 415,消耗的信息(例如,路由)。可认为S-RTM 412是备份信息 源,因为其既定为在A-RTM 410出故障的情况下A-RTM 410的代替物。类似 地,可认为S-FTM 417是备份信息消耗装置,万一A-FTM 415出故障,则备 份A-FTM 415。

图4a还说明AMB 405与SMB 407之间的用以使信息(例如,路由)同 步的传输序列。在A-RTM 410发现已存在路由改变时,A-RTM 410向S-RTM 412 发送路由(展示为事件1“ROUTE”),而可开始路由同步。根据一实施例,路 由改变可包含新路由、对现有路由的修改、对现有路由的删除,或其组合。

S-RTM 412在成功地接收到路由之后可即刻在S-RTM 412进一步处理了 路由之后将对路由的确认发送回A-RTM 410(展示为事件2“ACK”)。处理路 由可包含检查路由、解码路由、存储来自所解码路由的信息,等等。A-RTM 410 还可在从S-RTM 412接收到确认之后将路由发送到A-FTM 415(展示为事件 3“ROUTE”)。在从A-RTM 410接收到路由并处理了路由之后,A-FTM 415可 将路由发送到S-FTM 417(展示为事件4“ROUTE”)。S-FTM 417在从A-FTM 415 接收到路由并处理了路由之后,可将对路由的确认发送到A-FTM 415(展示 为事件5“ACK”)。

在从S-FTM 417接收到确认后,A-FTM 415可即刻将对来自A-RTM 410 的路由的确认发送回A-RTM 410(展示为事件6“ACK”)。在从A-FTM 415接 收到确认之后,A-RTM 410可将路由提交发送到S-RTM 412(展示为事件 7“COMMIT”)。根据一实施例,路由提交可为向S-RTM 412的指示,其指示 S-FTM 417接收到并存储了路由。S-RTM 412可随后在其处理了路由提交之 后将提交确认发送到A-RTM 410(展示为事件8“COM-ACK”)。

对于每一路由(或离散信息单元),存在用以指示S-RTM 412中的路由 状态的旗标。路由的一个状态可为“从A-RTM接收”,其指示S-RTM 412从 A-RTM 410接收到路由。路由的另一状态可为“存储于S-FTM中”,其指示 S-FTM 417接收到并存储了路由。

图4b说明路由同步中的A-RTM操作450的流程图。A-RTM操作450可 指示A-RTM,例如A-RTM 410中发生的操作,如在A-RTM检测到路由改变时 A-RTM使路由与S-RTM、A-FTM和S-FTM同步。图4b中所展示的A-RTM操作 450可为A-RTM的角度下的图4a中所展示的事件的汇总,且未展示确认。

A-RTM操作450可开始于A-RTM检测路由改变,且由于所检测到的路由 改变而更新S-RTM(方框455)。除了更新S-RTM之外,A-RTM还可更新A-FTM (方框457)。在更新了S-RTM和A-FTM之后,A-RTM可向S-RTM提交路由改 变(方框459)。A-RTM操作450可随后终止。

图4c说明用新组件交换出出故障的组件并使新组件服务的操作475的 流程图。操作475可指示当路由器检测到出故障的组件且使用组件交换以用 新组件代替出故障的组件时路由器的控制件,例如控制件163中发生的操作。

操作475可开始于路由器检测故障(方框480)。如先前所论述,可使 用多种技术执行检测故障的发生,且在本文中将不进行论述。在检测到出故 障的组件之后,可用新组件交换出出故障的组件(方框482)。如先前所论 述,可以不同粒度进行组件交换且所交换出的组件可取决于组件交换的粒度。 举例来说,如果A-RTM出故障,则可用S-RTM代替出故障的A-RTM,或用SMB 代替含有出故障的A-RTM的整个板,即AMB。类似地,如果A-FTM出故障, 则出故障的A-FTM可被S-FTM代替,含有出故障的A-FTM的板可被代替,等 等。

为了论述目的,考虑三个示范性情况:1)检测到AMB 405已出故障, 于是AMB 405可被SMB 407代替,其中AMB 405的A-RTM 410和A-FTM 415 被SMB 407的S-RTM 412和S-FTM 417代替。SMB 407的S-RTM 412和S-FTM 417现在分别变为A-RTM和A-FTM。2)检测到A-RTM 410已出故障,于是 A-RTM 410可被S-RTM 412代替,其中S-RTM 412变为A-RTM。3)检测到 A-FTM 415已出故障,于是A-FTM 415可被S-FTM 417代替,其中S-FTM F17 变为A-FTM。

在已用新组件交换出故障的组件(方框482)之后,A-RTM(原始A-RTM 或新A-RTM)可将存储于A-RTM的存储器、高速缓冲存储器、表格等中的具 有状态“从A-RTM接收”的所有路由发送到A-FTM(方框484)。由于具有状态 “从A-RTM接收”的路由的数目通常较小,所以可非常快速地执行将所述路由 发送到A-FTM。

如果出故障的组件是A-FTM 415,则信息同步可正常进行(例如,如4a 和4b中所描述)。同步完成(方框486),路由器可重新开始正常操作且操 作475可随后终止。

虽然未图示,但为了让操作475尽可能快地完成,可能需要使用例如图 4a和4b中所示的技术的A-RTM 410、S-RTM 412、A-FTM 415和S-FTM 417 的信息同步。

图5a说明路由器500的一部分。路由器500的AMB 505和SMB 507在 图5a中突出显示。图5a中展示从出故障的组件进行恢复以及用于在AMB 505 与SMB 507之间进行数据同步的技术。

在AMB 505中,可能有主用发生器(A-PRO)510在执行,而在SMB 507 中,备用发生器(S-PRO)512可能在执行。此外,可能有多个主用消耗装 置(A-CON),例如A-CON-1515和A-CON-N 517,在AMB 505中执行。然 而,在SMB 507中没有备用消耗装置。A-PRO 510可与S-PRO 512以及A-CON 通信,而每一A-CON可与A-PRO 510通信。举例来说,A-CON-1515可与 A-PRO 510通信。S-PRO 512可与A-PRO 510通信。

可认为A-PRO 510是主用信息源,因为其产生供主用信息消耗装置,例 如A-CON,消耗的信息。可认为S-PRO 512是备份信息源,因为其既定为在 A-PRO 510出故障的情况下A-PRO 510的代替物。

图5a还说明AMB 505与SMB 507之间的用以使信息同步的传输序列。 在A-PRO 510发现已存在信息改变时,A-PRO 510向S-PRO 512发送更新(展 示为事件1“UPDATE”),而可开始信息同步。根据一实施例,信息改变可包 含一条新信息、对一条现有信息的修改、对一条现有信息的删除,或其组合。

S-PRO 512在成功地接收到更新之后可即刻在S-PRO 512进一步处理了 更新之后将对更新的确认发送回A-PRO 510(展示为事件2“ACK”)。处理更 新可包含检查更新、解码更新、存储来自所解码更新的信息,等等。A-PRO  510还可在从S-PRO 512接收到确认之后将得自信息改变的更新-d发送到 A-CON,例如A-CON-1 515和A-CON-N 517(展示为事件3-1“UPDATE-D”和 3-N“UPDATE-D”)。根据一实施例,得自信息改变的更新-d可在一种情况下 含有信息改变,且在另一种情况下含有由信息改变产生的信息。根据另一实 施例,A-PRO 510可同时地或依次地将更新-d发送到A-CON。

对于每一更新(或离散信息单元),存在用以指示S-PRO 512中的更新 状态的旗标。更新的一个状态可为“从A-PRO接收”,其指示S-PRO 512从 A-PRO 510接收到更新。在S-PRO 512从A-PRO 510接收到并处理了更新之 后,设定用于更新的状态“从A-PRO接收”的旗标。更新的另一状态可为“存 储在CON中”,其指示A-CON  接收到并存储了得自更新中所包含的信息改 变的更新-d。

在从A-PRO 510接收到更新-d并处理了所述更新-d之后,每一A-CON 可将对来自A-PRO 510的更新-d的确认发送回A-PRO 510(展示为事件 4-1“ACK”和4-N“ACK”)。在从所有其A-CON接收到确认之后,A-PRO 510可 将更新提交发送到S-PRO 512(展示为事件5“COMMIT”)。根据一实施例,更 新提交可为向S-PRO 512的指示,其指示所有A-CON  接收到并存储了得自 更新中所包含的信息改变的更新-d。S-PRO 512可随后在其接收到并处理了 更新提交之后将提交确认发送到A-PRO 510,其包含设定用于更新的状态“存 储于CON中”的旗标(展示为事件6“COM-ACK”)。

图5b说明信息同步中的A-PRO操作550的流程图。A-PRO操作550可 指示A-PRO,例如A-PRO 510中发生的操作,如在A-PRO检测到信息改变时 A-PRO使信息与S-PRO和A-CON同步。图5b中所展示的A-PRO操作550可 为A-PRO的角度下的图5a中所展示的事件的汇总,且未展示确认。

A-PRO操作550可开始于A-PRO检测信息改变,且由于所检测到的信息 改变而更新S-PRO(方框555)。除了更新S-PRO之外,A-PRO还可更新A-CON (方框557)。在更新了S-PRO和A-CON之后,A-PRO可向S-PRO提交信息改 变(方框559)。A-PRO操作550可随后终止。

图5c说明用新组件交换出出故障的组件并使新组件服务的操作575的 流程图。操作575可指示当路由器检测到出故障的组件且使用组件交换以用 新组件代替出故障的组件时路由器的控制件,例如控制件163中发生的操作。

操作575可开始于路由器检测故障(方框580)。如先前所论述,可使 用多种技术执行检测故障的发生,且在本文中将不进行论述。在检测到出故 障的组件之后,可用新组件交换出出故障的组件(方框582)。如先前所论 述,可以不同粒度进行组件交换且所交换出的组件可取决于组件交换的粒度。 举例来说,如果A-PRO出故障,则可用S-PRO代替出故障的A-PRO,或用SMB 代替含有出故障的A-PRO的整个板,即AMB。

为了论述目的,考虑若干示范性情况:1)检测到AMB 505已出故障, 于是SMB 507可代替AMB 505。然而,由于SMB 507不包含S-CON,所以ABM 505中的A-CON仍在使用。2)检测到A-PRO 510已出故障,于是A-PRO 510 可被S-PRO 512代替,其中S-PRO 512变为A-PRO。

在已用新组件交换出故障的组件(方框582)之后,A-PRO(原始A-PRO 或新A-PRO)可将存储于A-PRO的存储器、高速缓冲存储器、表格等中的具 有状态“从A-PRO接收”的所有更新发送到A-CON(方框584)。由于具有状态 “从A-PRO接收”的数据量通常较小,所以可非常快速地执行将所述数据发送 到A-CON。

虽然未图示,但为了让操作575尽可能快地完成,可能需要使用例如图 5a和5b中所示的技术的A-PRO 510、S-PRO 512和A-CON的信息同步。

图6a说明路由器600的一部分。路由器600的AMB 605和SMB 607在 图6a中突出显示。图6a中展示从出故障的组件进行恢复(具体来说,展示 路由器600中的转发表管理(FTM)和多个线卡(LC))以及用于AMB 605与 SMB 607之间的数据同步的技术。

在AMB 605中,可能有主用FTM(A-FTM)610在执行,而在SMB 607中, 备用FTM(S-FTM)612可能在执行。此外,可能有多个主用LC(A-LC),例 如A-LC-1 615和A-LC-N 617。然而,没有备用LC。A-FTM 610可与S-FTM 612 以及A-LC通信,而每一A-LC可与A-FTM 610通信。举例来说,A-LC-1 615 可与A-FTM 610通信。S-FTM 612可与A-FTM 610通信。

可认为A-FTM 610是主用信息源,因为其产生供主用信息消耗装置,例 如A-LC,消耗的信息(例如,路由)。可认为S-FTM 612是备份信息源,因 为其既定为在A-FTM 610出故障的情况下A-FTM 610的代替物。

图6a还说明AMB 605与SMB 607之间的用以使信息(例如,路由)同 步的传输序列。在A-FTM 610发现已存在路由改变时,A-FTM 610向S-FTM 612 发送路由(展示为事件1“ROUTE”),而可开始路由同步。根据一实施例,路 由改变可包含新路由、对现有路由的修改、对现有路由的删除,或其组合。

S-FTM 612在成功地接收到路由之后可即刻在S-FTM 612进一步处理了 路由之后将对路由的确认发送回A-FTM 610(展示为事件2“ACK”)。处理路 由可包含检查路由、解码路由、存储来自所解码路由的信息,等等。在从 S-FTM 612接收到确认之后,A-FTM 610还可将路由发送到A-LC,例如A-LC-1 615和A-LC-N 617(展示为事件3-1“ROUTE”和3-N“ROUTE”)。根据另一实施 例,A-FTM 610可同时地或依次地将路由发送到A-LC。

对于每一路由(或离散信息单元),存在用以指示S-FTM 612中的路由 状态的旗标。路由的一个状态可为“从A-FTM接收”,其指示S-FTM 612从 A-FTM 610接收到路由。在S-FTM 612从A-FTM 610接收到并处理了路由之 后,设定用于路由的状态“从A-FTM接收”的旗标。路由的另一状态可为“存 储于LC中”,其指示A-LC已接收到并存储了路由。

在从A-FTM 610接收到路由并处理了所述路由之后,每一A-LC可将对 来自A-FTM 610的路由的确认发送回A-FTM 610(展示为事件4-1“ACK”和 4-N“ACK”)。在从所有其A-LC接收到确认之后,AFTM 610可将路由提交发 送到S-FTM 612(展示为事件5“COMMIT”)。根据一实施例,路由提交可为向 S-FTM 612的指示,其指示A-LC已接收到并存储了路由。S-FTM 612可随后 在其接收到并处理了路由提交之后将提交确认发送到A-FTM 610,其包含设 定状态“存储于LC中”的旗标(展示为事件6“COM-ACK”)。

图6b说明路由同步中的A-FTM操作650的流程图。A-FTM操作650可 指示A-FTM,例如A-FTM 610中发生的操作,如在A-FTM检测到路由改变时 A-FTM使路由与S-FTM和A-LC同步。图6b中所展示的A-FTM操作650可为 A-FTM的角度下的图6a中所展示的事件的汇总,且未展示确认。

A-FTM操作650可开始于A-FTM检测路由改变,且由于所检测到的路由 改变而更新S-FTM(方框655)。除了更新S-FTM之外,A-FTM还可更新A-LC (方框657)。在更新了S-FTM和A-LC之后,A-FTM可向S-FTM提交路由改变 (方框659)。A-FTM操作650可随后终止。

图6c说明用新组件交换出出故障的组件并使新组件服务的操作675的 流程图。操作675可指示当路由器检测到出故障的组件且使用组件交换以用 新组件代替出故障的组件时路由器的控制件,例如控制件163中发生的操作。

操作675可开始于路由器检测故障(方框680)。如先前所论述,可使 用多种技术执行检测故障的发生,且在本文中将不进行论述。在检测到出故 障的组件之后,可用新组件交换出出故障的组件(方框682)。如先前所论 述,可以不同粒度进行组件交换且所交换出的组件可取决于组件交换的粒度。 举例来说,如果A-FTM出故障,则可用S-FTM代替出故障的A-FTM,或用SMB 代替含有出故障的A-FTM的整个板,即AMB。

为了论述目的,考虑若干示范性情况:1)检测到AMB 605已出故障, 于是SMB 607可代替AMB 605。2)检测到A-FTM 610已出故障,于是A-FTM 610可被S-FTM 612代替,其中S-FTM 612变为A-FTM。

在已用新组件交换出故障的组件(方框682)之后,A-FTM(原始A-FTM 或新A-FTM)可将存储于A-FTM的存储器、高速缓冲存储器、表格等中的具 有状态“从A-FTM接收”的所有路由发送到A-LC(方框684)。由于具有状态“从 A-FTM接收”的路由的数目通常较小,所以可非常快速地执行将所述路由发 送到A-LC。

一旦同步完成(方框686),路由器便可重新开始正常操作且操作675 可随后终止。

虽然未图示,但为了让操作675尽可能快地完成,可能需要使用例如图 6a和6b中所示的技术的A-FTM 610、S-FTM 612和A-LC的信息同步。

虽然已详细描述了本发明及其优点,但应理解,在不偏离由所附权利要 求书界定的本发明的精神和范围的情况下,可在本文中作出各种改变、替换 和更改。

另外,本申请案的范围无意限于说明书中所描述的过程、机器、制造、 物质组成、手段、方法和步骤的特定实施例。所属领域的技术人员将容易从 本发明的揭示内容了解,可根据本发明利用执行与本文中所描述的对应实施 例实质上相同功能或实现实质上相同结果的目前存在或以后待开发的过程、 机器、制造、物质组成、手段、方法或步骤。因此,所附权利要求书意在在 范围内包含此类过程、机器、制造、物质组成、手段、方法或步骤。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号