首页> 中国专利> 多站点环境中的性能监测

多站点环境中的性能监测

摘要

本文提供了多站点环境中的性能监测。在一个实施例中,一种方法包括:在接收网络站点处的网络设备处监测流量以判定性能阈值是否被违反;如果在网络设备处的路径处性能阈值被违反,则将报警传输到发送网络站点;以及将路径的流量信息从网络设备传输到发送网络站点。接收网络站点包括用于从发送网络站点接收流量的多个路径,并且如果性能阈值被违反,则每个路径的流量信息都被传输到发送网络站点。本文还公开了一种装置和逻辑。

著录项

  • 公开/公告号CN105141469A

    专利类型发明专利

  • 公开/公告日2015-12-09

    原文格式PDF

  • 申请/专利权人 思科技术公司;

    申请/专利号CN201510249541.2

  • 申请日2015-05-15

  • 分类号H04L12/26;

  • 代理机构北京东方亿思知识产权代理有限责任公司;

  • 代理人李晓冬

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-18 12:50:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-16

    授权

    授权

  • 2016-01-06

    实质审查的生效 IPC(主分类):H04L12/26 申请日:20150515

    实质审查的生效

  • 2015-12-09

    公开

    公开

说明书

相关申请的声明

本申请要求于2014年5月16日提交的名称为“THRESHOLD CROSSINGALERTSANDON-DEMANDEXPORTS(越限报警和按需输 出)”的美国临时申请No.61/994,536(代理案号CISCP1262+)的优先 权,该临时申请的内容通过引用以其整体合并于此。

技术领域

本公开一般地涉及通信网络,并且更具体地,本公开涉及监测网络性 能。

背景技术

在企业网络和其它网络中,监测应用性能是重要的,从而使得如果发 生性能下降则可以采取行动。

附图说明

图1示出了可以实现本文描述的实施例的网络的示例。

图2示出了可用于实现本文描述的实施例的网络设备的示例。

图3是根据一个实施例示出了网络设备处用于在性能阈值违反后传输 报警和流量信息的过程的流程图。

图4是根据一个实施例示出了控制器处用于处理报警和流量信息的过 程的流程图。

贯穿附图的几个视图,相应的标记表示相应的部分。

具体实施方式

概览

在一个实施例中,一种方法通常包括:在接收网络站点处的网络设备 处监测流量以判定性能阈值是否被违反;如果在网络设备处的路径处性能 阈值被违反则将报警传输到发送网络站点;以及将路径的流量信息从网络 设备传输到发送网络站点。接收网络站点包括用于从发送网络站点接收流 量的多个路径,并且对于这多个路径,如果性能阈值被违反,则相应路径 的流量信息被传输到发送网络站点。

在另一实施例中,一种方法通常包括:在发送网络站点中的网络设备 处接收对在接收网络站点处的路径处性能阈值已经被违反的报警;在网络 设备处接收接收网络站点处的多个路径的流量信息;以及处理报警和流量 信息以判定被传输到路径的流量是否应该被移动到替代路径。

在另一实施例中,一种装置通常包括:处理器,该处理器用于:在接 收网络站点处监测流量以判定性能阈值是否被违反,如果性能阈值被违反 则将报警传输到发送网络站点,并且将接收网络站点的流量信息传输到发 送网络站点。装置还包括用于存储流量信息的存储器。接收网络站点包括 用于从发送网络站点接收流量的多个路径。对于这多个路径,如果性能阈 值被违反,则相应路径的流量信息被传输到发送网络站点。

示例实施例

呈现下面的描述以使得本领域的普通技术人员能够做出和使用这些 实施例。特定实施例和应用的描述仅作为示例被提供,并且各种修改对于 本领域的技术人员来说将是显而易见的。在不脱离实施例的范围的情况 下,本文描述的一般原理可以被应用到其它应用中。因此,实施例不限于 示出的那些,而是被赋予与本文描述的原则和特征相一致的最宽的范围。 为了清楚的目的,未详细描述关于与实施例相关的技术领域中已知的技术 材料的细节。

在具有变化的流量条件的动态网络中,静态策略配置不能充分满足网 络的变化的需求。例如,企业网络应该监测应用性能并且基于来自网络的 反馈按需采取校正动作。当维护应用服务水平协议(SLA)时,信息技术 管理器经常被挑战为关键应用提供特定用户体验。

本文描述的实施例提供了在多站点环境中监测网络性能的可扩展的和 分布式的方法。一个或多个实施例提供了将性能违反报警传输到源的有效 且可扩展的方式。例如,实施例可以被用来将性能违反通知发送流量的 源,从而使得发送者可以采取校正动作。一个或多个实施例还可以在按需 的基础上被用来发送替代路径的性能测量。性能测量可以被发送者用来做 出关于应该采取什么校正动作(如果有的话)的明智决定。

如下所述,一个或多个实施例可以以每个DSCP(差分服务代码点) 为基础提供对接收测量和违反报警的可扩展性与灵活性。可扩展性可以通 过在接收站点上被动地测量性能测量并且仅将性能违反通知发送者来被提 供。这允许发送网络站点假设它在利用最好的链路直到接收器将违反通知 发送站点。报警和替代路径的性能测量的同步接收有利于发送网络站点用 于确定校正动作。

现在参照附图,并且首先参照图1,图1示出了可以实现本文描述的 实施例的网络。实施例操作在包括多个网络设备的数据通信网络环境中。 为了简化,仅示出了少量的节点。网络可以包括经由任意数量的节点(例 如,路由器、交换机或其它网络设备)进行通信的任意数量的网络设备, 其促进了数据在网络内的传递。

网络包括多个互连的网络站点。在图1中示出的示例中,网络站点10 (A、B和C)在多个WAN(广域网)(WAN1、WAN2、WAN3)上进 行通信。网络站点10之间的通信可以经由任意数量的网络12(例如,服 务提供商网络X、Y、Z)被提供。

在一个示例中,企业包括中心站点和两个分支站点(分支1和分支 2)。每个网络站点10可以与唯一的站点标识符相关联。在图1中示出的 示例中,中心与站点标识符(ID)A相关联,分支1与站点标识符B相关 联,并且分支2与站点标识符C相关联。例如,站点标识符可以被预定义 并且可以由网络管理员指定。

图1的示例中示出的网络包括通过链路16连接的多个路由器14。本 文使用的术语‘路由器’可以涉及被配置为执行路由功能的任何网络设备 (例如,路由器、交换机/路由器)。在图1中示出的示例中,每个网络站 点10包括一个或多个边界路由器14,边界路由器例如可以包括客户边缘 路由器。链路16可以穿过一个或多个网络(例如,广域网、局域网、城 域网、无线网、虚拟私有网、企业网、互联网、内联网、无线电接入网、 公共交换网或任何其它类型的网络)。网络站点10之间的数据路径可以 包括任意数量或任意类型的网路设备(例如,路由器、交换机、网关)。

流量可以经由边界路由器14进入和离开网络站点10。每个站点10可 以具有位于与将站点连接到服务提供商云12的接口(路径)13(例如, WAN接口)的数据路径中的一个或多个边界路由器14。边界路由器14可 以各自包括一个或多个接口13。例如,在图1中的网络站点A处,每个边 界路由器14被连接到一个WAN接口13。在网络站点B和C处,每个边 界路由器14被连接到三个WAN接口(WAN1、WAN2、WAN3)。

每个网络站点10可以包括一个或多个控制器18(本文中被称为主控 制器(MC))。主控制器18可以是独立的设备(例如,如图1中网络站 点A处所示)或与边界路由器14耦合(例如,如图1中网络站点B和C 处所示)。主控制器18可以在或可以不在数据路径中并且可以被称为网 络站点的‘大脑’。在一个实施例中,主控制器18可以负责(例如只负 责)处理所收集的统计和度量并且使用配置的策略来做出计算的重路由决 定。边界路由器14可以负责执行由主控制器18做出的重路由决定。

如下面所详细描述的,边界路由器14对在它们的接口13处被接收并 且目的地为它们的网络站点10的流量进行监测。监测例如可以被用来判 定应用的性能。如果一个或多个性能测量落在预定阈值之外(例如,超过 阈值、低于阈值、阈值范围外),则边界路由器14可以引起报警(本文 中被称为越限报警(ThresholdCrossingAlert,TCA))。在一个实施例 中,TCA被传输到发送者站点的主控制器18以将违反通知发送者,从而 使得发送者可以采取适当的校正动作。例如,阈值可以在中心处的MC18 处被配置并且被下推到其它站点MC。阈值可以针对一个或多个性能度量 被定义,性能度量例如包括分组损失率、延迟、抖动、比特损失率、或任 何其它度量或性能测量、或它们的组合。

除在发送者站点10处接收TCA外,接收综合性能测量不仅有利于检 测到性能违反的路径(例如,接口),而且有利于替代路径。路径的性能 测量的提取在本文被称为按需输出(ODE)。在一个实施例中,性能测量 的提取仅当报警针对特定监测间隔(即,按需)被接收时才做出。如下所 述,例如,可以针对特定WAN接口、DSCP和站点标识符组合提取度 量。发送站点10然后可以使用针对有性能违反的路径的TCA和针对包括 引起TCA的路径的所有路径的ODE来做出关于流量是否应该被重路由的 明智决定,而不是假设替代路径是更好的选择并且盲目地将流量移动到该 链路。报警和流量信息的结合提供了用于由发送网络站点10识别性能下 降并且做出缓解性能违反的明智决定的有效的机制。

下面在图1中提供了在网络站点A处启动并且指向网络站点C的呼叫 的示例(例如,远程呼叫)。在该示例中,用户定义了特定策略,其中应 用的容忍度被定义为分组损失≤2%。呼叫的性能可以在接收站点(例 如,监测数据分组15的站点C)处被测量。如果针对应用性能监测标识分 组损失大于2%,则它被分类为阈值违反,其结果是引起报警(例如,图1 中的TCA分组17)。TCA被发送到发送者站点的主控制器18来将违反通 知发送者,从而使得发送者可以采取适当的校正动作。如下所述,TCA分 组17还可以包括ODE信息。

在上述图1中所示出的示例中,呼叫穿过一个WAN接口13 (WAN2)和服务提供商云12(Y)。一旦TCA被引起,则违反的阈值经 由该报警被知道。网络站点C处的BR14还可以传输针对替代WAN接口 (WAN1、WAN3)的ODE信息(图1中的分组19)。利用从TCA和针 对所有可用路径的ODE分组中可获得的信息,发送站点(站点A)可以 在可用路径之间做出明智的选择,而不是在不了解链路的状态的情况下假 设替代路径运行正常并且将流量放在该链路上。来自接收站点10处的每 个接口(路径)13的ODE信息可以被用于决定应该采取什么校正动作 (如果有的话)。校正动作例如可以包括如果性能在替代路径(WAN1或 WAN3)中的一个路径处是更好的则重路由呼叫或如果性能在所有路径上 是相同的则将流量留在当前链路上并且继续监测来看性能是否继续变坏。

在上述的示例中,网络站点A是发送站点并且网络站点C是接收站 点。应该理解的是任何网络站点(包括站点B和C)可以是发送网路站点 并且任何网络站点(包括站点A)可以是接收网络站点。

数据、TCA或ODE分组15、17、19可以通过边界路由器14使用诸 如用户数据报协议(UDP)、传输控制协议(TDP)/互联网协议(IP)或 任何其它适当的协议之类的网络通信协议被传输。

应该理解的是上述图1中示出的网络仅是示例并且在不脱离实施例的 范围的情况下,本文描述的实施例可以在包括不同网络拓扑结构或网络设 备或使用不同的网络协议的网络中被实现。

图2示出了可以被用于实现本文描述的实施例的网络设备20(例如, 边界路由器14、主控制器18)的示例。在一个实施例中,网络设备是可 以在硬件、软件或任何其组合中被实现的可编程机器。网络设备20包括 一个或多个处理器22、存储器24、网络接口26和TCA(越限报警) /ODE(按需输出)组件28。

存储器24可以是易失性存储器或非易失性存储器,其存储各种应 用、操作系统、模块和供处理器22执行和使用的数据。例如,一个或多 个TCA/ODE组件28(例如,代码、逻辑、数据库、表等)可以被存储在 存储器24中。存储器24还可以包括路由表(例如,路由信息库 (RIB))、转发表(例如,转发信息库(FIB))或用于路由或转发分组 的任何其它数据结构。表还可以在硬件(例中,ASIC(专用集成电路)) 中被实现。网络设备20可以包括任意数量的存储器组件。

逻辑可以被编码在一个或多个有形的介质中以供由处理器22执行。 例如,处理器22可以执行被存储在诸如存储器24之类的计算机可读介质 中的代码。计算机可读介质例如可以是电子的(例如,RAM(随机存取存 储器)、ROM(只读存储器)、EPROM(可擦除可编程只读存储 器))、磁的、光学的(例如,CD、DVD)、电磁的、半导体技术、或 任何其它适当的介质。在一个示例中,计算机可读介质包括非暂态计算机 可读介质。网络设备20包括任意数量的处理器22。

网络接口26可以包括任意数量的接口(线卡、端口)用于接收数据 或向其它设备传输数据。网络接口26例如可以包括用于连接到计算机或 网络的以太网接口。

TCA/ODE组件28可以包括TCA模块和ODE模块。TCA模块可以位 于目的地站点的边界路由器14处并且能操作来生成性能TCA。ODE模块 也可以位于目的地站点的边界路由器14处并且能操作来执行针对性能度 量的按需提取。

应该理解的是上述图2中示出的网络设备仅是示例并且可以使用网络 设备的不同配置。例如,网络设备还可以包括能操作来促进本文中描述的 功能的硬件、软件、算法、处理器、设备、组件或元件的任何适当的组 合。

图3是根据一个实施例示出了用于生成和传输报警和流量信息的过程 的概览的流程图。在步骤30处,网络设备(例如,边界路由器14)监测 输入流量的性能。例如,在图1中站点C通过服务提供商Y在接口WAN2 处测量来自站点A的输入流量15。例如,数据可以按固定监测间隔被处 理以基于针对相应间隔的聚合性能测量来判定特定阈值是否已经被违反。 性能阈值的违反例如可以是超过预定义性能阈值的值、低于预定义性能阈 值的值、或在预定义性能阈值的范围之外的值(例如,低于范围的较低值 或高于范围的较高值)。如果阈值未被违反,则边界路由器14继续监测 输入流量(步骤32)。

如果一个或多个阈值被违反,则边界路由器14向发送站点传输报警 (例如,在图1中被传输到站点A的分组17)(步骤32和34)。针对每 个监测间隔,如果一个或多个阈值已经被违反,则接收站点的边界路由器 14上的TCA模块可以合并该时间段所检测到的所有违反、打包这些违 反、并且将它们经由消息发送到发送站点的主控制器18。边界路由器14 还可以发送边界路由器处的所有WAN接口的流量信息(例如,图1中在 WAN2接口上被传输的分组17和在WAN1和WAN3上的被传输分组 19)(步骤36)。例如,检测到性能违反的边界路由器14/接口13组合可 以使得按需输出针对该边界路由器的本地接口被输出。步骤34和36通常 可以同时发生。如上所指出的,ODE可以随针对引起报警的接口的TCA 在相同的分组中(例如,图1中的分组17)被传输。

如果在站点10处具有另外的边界路由器14从相同的发送者接收流 量,则生成报警的边界路由器还可以将消息发送到其它边界路由器,请求 它们输出它们的路径(接口)的流量信息(步骤38)。因此,检测到性能 违反的接收站点的边界路由器14将不仅发送该路由器上的本地接口13的 流量信息,而且将消息发送到包含WAN接口的其它边界路由器,请求这 些边界路由器输出那些接口的流量信息。

图4是根据一个实施例示出了用于接收和处理报警和流量信息的过程 的概览的流程图。在步骤40处,报警和流量信息在发送网络站点的网络 设备处被接收(例如,图1中在站点A处的主控制器18处被接收的TCA 和ODE)。如前所述,发送站点主控制器18可以接收针对在接收站点处 引起报警的路径和所有替代路径的性能测量。MC18处理报警(TCA)和 流量信息(ODE)(步骤42)。处理例如可以包括识别受TCA影响 (即,与报警相关联)的应用并且将当前路径上的性能与替代路径(或多 个替代路径)上的性能进行比较。如果基于所接收的流量信息,MC18识 别出替代路径具有更好性能,则MC可以选择将流量从接收到TCA的路 径重路由到替代路径(步骤44和46)。考虑路径上的性能测量,各种策 略可以被用于判定流量是否应该被重路由到替代路径上。

应该理解的是上述图3和图4中所示出的流程图仅是示例,并且在不 脱离实施例的范围的情况下,这些步骤可以被添加、合并、移除或修改。

在一个实施例中,被动的性能监测可以被用于测量性能并且度量中间 代理可以被用于计算任何阈值违反。在可以在边界路由器14的接口13上 被激活的入口监测器的帮助下,应用性能可以在接收侧被测量。性能测量 可以按每个站点、每个DSCP、每个WAN接口(或它们的任何组合)的 粒度被收集。在一个实施例中,所有站点10都知道针对特定DSCP或应 用的性能策略和阈值。例如,边界路由器14可以被配置为经由端点信令 或DSCP标记来识别应用。

在一个实施例中,入口监测器被设立从而使得它们可以按固定监测间 隔(例如,30秒或任何其它间隔)处理数据并且基于该间隔的总体性能测 量来做出特定阈值是否已经被违反的判定。如果阈值已经被违反,则度量 中间代理可以在该监测间隔结束时通知TCA模块。

来自度量中间代理的性能TCA的生成可以在正在从各种服务提供商 12接收流的目的地站点的边界路由器14上发生。目的地边界路由器14可 以被动地监测路径13上的入口流。一旦TCA在目的地站点的边界路由器 14上被引起,则知道在来自发送者站点10的输入数据中已经有某阈值的 违反。该违反被传送到发送者站点10,从而使得它可以针对所涉及的流量 采取校正动作。

在一个实施例中,TCA通知消息可以逐个站点、逐个DSCP、逐个 WAN接口(或它们的任何组合)地被发送。消息可以被打包到例如网络 流消息(例如,NFV9(网络流版本9))中并且经由UDP(用户数据报 协议)消息被发送到发送站点的主控制器18。应该理解的是这仅是示例并 且可以使用其它协议。

为了可靠性的目的,TCA通知消息可以经由所有可用的路径13被发 送到源站点的主控制器18。例如,如果接收站点具有跨一个或多个边界路 由器14的多个WAN接口13,则TCA将从这些接口中的每个接口被转 发。为了附加的可靠性,TCA通知分组例如可以标记有DSCPCS6。

在一个实施例中,按需输出模块可以针对特定WAN接口、DSCP和 站点ID组合执行性能度量的按需提取。聚合数据可以从路径13的入口监 测器针对监测间隔而被提取,在监测间隔结束时被打包并且与TCA一起 (例如,图1中的分组17)被发送到发送站点的主控制器18以供进一步 处理。按需输出可以经由UDP消息被发送到发送站点的主控制器18,或 可以使用其它协议。

在一个实施例中,诸如NBAR(基于网络的应用识别)之类的应用ID 可以被使用。NBARID被用于识别应用类型。

如上所述,性能TCA和ODE的消耗可以发生在源MC18上。从目的 地边界路由器14所接收的TCA通知以及性能统计可以被存储在相应的信 道下(例如,<dscp、服务提供商(例如,WAN链路)、目的地站点id> 的组合)。源站点的主控制器18可以等待特定的TCA处理延迟时间,用 于TCA通知和按需输出从所有边界路由器14/接口13到达。在定时消逝 过去后,主控制器18可以开始处理TCA和ODE。

分组17、19可以包括传统的头部信息字段,例如IP头部、源地址字 段(分组的起源地址)、目的地地址字段(分组去往的目标地址)以及报 警字段(用于报警分组)或输出字段(用于按需输出分组)、或报警字段 和输出字段这二者。

在一个实施例中,TCA分组17包括流量接收器的站点ID、服务提供 商、DSCP、输入接口、单向延迟、RTP(实时传输协议)到达抖动间平均 值(inter-arrival-jitter-mean)、比特损失率、分组损失率、不可达、开始 时间、或这些或其它数据字段的任何组合。单向延迟、RTP到达抖动间平 均值、比特损失率、分组损失率和不可达都是可以被监测并且可以按产品 需求而变化的不同的度量。开始时间提供监测间隔(针对该监测间隔这些 测量是有效的)的指示。

在一个实施例中,ODE分组19包括流量接收器的站点ID、服务提供 商、DSCP、输入接口、字节计数、分组计数、单向延迟、RTP到达抖动 间平均值、比特损失率、分组损失率、不可达、开始时间、或这些或其它 数据字段的任何组合。如上所指出的,单向延迟、RTP到达抖动间平均 值、比特损失率、分组损失率和不可达都是可以被监测并且可以按产品需 求而变化的不同的度量。开始时间提供监测间隔(针对该监测间隔这些测 量是有效的)的指示。

应该理解的是上述分组格式仅是示例并且在不脱离实施例的范围的情 况下,不同的分组格式或字段可以被使用。

虽然根据示出的实施例描述了方法和装置,但是本领域的普通技术人 员将容易理解的是在不脱离实施例的范围的情况下,可以做出变化。因 此,旨在上述描述中包含的和附图中示出的所有事物应该被理解为说明性 的而不是限制意义的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号