首页> 中国专利> 在通信网络中使用的模块化的基于演进的知识的诊断设备

在通信网络中使用的模块化的基于演进的知识的诊断设备

摘要

一种诊断设备,用于在包括网络设备的通信网络中使用,该诊断设备包括诊断装置,其适用于基于由该网络设备提供的信息来确定发生在该网络中的问题的原因。该诊断装置包括采取基本诊断单元形式的知识库,还包括处理装置,其适用于在知识库中所选定的基本诊断单元之间建立分级关联,以构成适用于确定问题原因的可配置诊断模型。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-10-19

    未缴年费专利权终止 IPC(主分类):H04L12/24 授权公告日:20110420 终止日期:20150829 申请日:20050829

    专利权的终止

  • 2011-04-20

    授权

    授权

  • 2006-05-03

    实质审查的生效

    实质审查的生效

  • 2006-03-08

    公开

    公开

说明书

相关申请的交叉引用

本专利申请基于2004年9月3日提交的第0451965号法国专利申请,在此引用该专利申请的全部公开内容以供参考,并且在此要求该专利申请的优先权。

技术领域

本发明涉及受管理的通信网络(managed communicationnetwork),并且更具体地涉及用于确定发生在这些网络中的问题的原因的诊断设备。

背景技术

本领域的普通技术人员应当知道,发生在通信网络中的问题可能有各种各样的原因,例如断电、断开连接、网络设备或其组件发生崩溃或出现故障、集成一种版本的网络设备或其组件的软件发生崩溃或出现故障或者与网络的其他组成部分不完全兼容的软件发生崩溃或出现故障。

以前已经提出了许多用于确定问题原因的诊断设备(也称为诊断工具)。一些诊断设备采用以面向对象的编程语言和/或基于规则的编程语言为基础的技术,基于规则的编程语言可以由规则引擎来管理。在这些设备中,需要提到的是例如用于根据人工定义的规则来构造警报关联树的ECXpert(事件关联专家)、来自ILOG公司的使用可编程规则引擎进行诊断的设备、来自惠普公司的采用基于故障模型的技术的设备特别是Network Node Manager(网络节点管理器)6.4版和Network Node Manager Extended Topology(网络节点管理器扩展布局设备)2.0版、来自安捷伦公司(Agilent)的用自动化的诊断方法代替受技术人员影响的故障诊断操作的FDDC(数据通信的故障检测设备)以及来自思科公司的作为问题检测辅助工具的TAC设备。

上述设备的主要缺点是其获取信息(也称为专业知识)的模式存在问题。如果诊断设备是为并非系统集成商的公司而开发的,则其知识库或专业知识库就不能很好地适用于某些特定的设备或设备的某些组合。

如果诊断设备是由系统集成商开发的,则其知识库或专业知识库就只包含基本信息,结果是没有把例如类型、制造方法、制造日期、版本和使用模式之类的特定于设备的某些特征考虑进去。通常不会把关键信息和诊断设备本身的信息传达给用户的客户机。

因此,已证实定义新的和特殊的诊断或者检验技术是非常困难的,而且有时甚至出现根本不能改动诊断工具的情况。换句话说,以上诊断设备具有缺乏灵活性的缺点。

阿尔卡特公司也提供了一种诊断设备,其基于贝叶斯概率理论,并用来定义用于基于附加证据和背景信息的概念来提炼假设的规则,由这些规则得出数字,每一个数字代表一个假设为真的概率,并且这些规则用于构造贝叶斯网络(也称为贝叶斯图表),其定义与统计权重或概率权重相关联的测试操作。

上述设备的主要缺点是其贝叶斯网络和与其相关联的测试一经集成就不能修改。因此,如果用户认识到贝叶斯网络并不完全适用于其网络或者特定设备必须进行特殊测试,则该诊断设备就不能适用了。因此,这类诊断设备也具有缺乏灵活性的缺点。

由于现有技术的诊断设备都不能使人完全满意,因此本发明的一个目的是改善这种状况。

发明内容

因此,本发明提出一种诊断设备,包括:诊断装置,包括采取基本诊断单元形式的知识库;处理装置,用于在从知识库中选出的单元之间建立选定的分级关联(hierarchical association),以便构成可配置的诊断模型,其适用于由所述诊断装置根据由其网络设备提供的信息而确定发生在该网络中的问题的原因。

特别地,诊断设备可以单独地或以组合形式具有以下附加特征:

-处理装置可以适用于通过选定规则来将基本诊断单元相关联;例如,在这种情况下,处理装置可以包括用于在选定单元之间建立选定分级关联的规则引擎;同样,至少一些规则可以是统计类型的规则;

-其处理装置可以适用于通过选定模型来将至少一些所述基本诊断单元相关联;

-其处理装置可以适用于将构成某种所述诊断模型的选定的树中的某些选定的基本诊断单元相关联;

-其处理装置可以适用于将选定的统计权重或概率权重与至少某些所述基本诊断单元和/或至少某些所述规则和/或至少某些所述模型相关联;

-其处理装置可以适用于将选定的管理成本与至少某些所述基本诊断单元和/或至少某些所述规则和/或至少某些所述模型相关联;

-至少某些所述诊断模型可以采取贝叶斯网络(或图表)的形式;

-至少某些所述基本诊断单元可以采取贝叶斯网络(或图表)的形式;

-至少某些所述基本诊断单元可以采取分级测试集合的形式;

-其处理装置可以适用于修改至少某些所述基本诊断单元和/或至少某些所述规则和/或至少某些所述模型和/或至少某些所述统计权重或概率权重和/或至少某些所述管理成本;

-其处理装置可以包括适用于使用户能够实现所述关联和/或所述修改的人/机接口。

通过阅读以下详细描述并研究附图,本发明的其他特征和优点将变得明显。

附图说明

图1是本发明的诊断设备的一个实施例的示图;

图2是贝叶斯网络的一个实例的示图,该实例适用于确定IP(网际协议)虚拟专用网中数据包丢失的原因。

具体实施方式

附图构成本发明说明书的一部分,如果有必要,附图还有助于定义本发明。

本发明的一个目的是用一个或多个诊断模型来确定已经发生在受管理通信网络中的问题的原因。

本发明涉及任意类型的受管理网络(并且尤其涉及IP(网际协议)网络)和受管理网络内的任意类型的服务。诊断可以涉及网络级(网络设备和配置)或者管理和服务级(网络设备、配置、服务质量(QoS)以及服务级协议(SLA))。

如图1所示,本发明提出一种诊断设备DD,包括用于根据网络设备提供的信息来确定问题的原因的诊断模型MD。例如,将这类设备DD安装在网络管理系统(NMS)内,或者在有待诊断的服务时将这类设备DD安装在该网络的服务管理系统内。

例如,来自网络设备的信息包括警报,如果网络设备检测到其自身内部(即影响到其组件之一,例如输入接口或输出接口)出现问题或其连接之一出现问题(发生崩溃或出现故障),则该网络设备自动地将警报发送到NMS。然而,来自网络设备的信息同样可以包括管理和/或操作信息,该管理和/或操作信息根据NMS的请求从某些网络设备获得,并通常存储在其管理信息库(MIB)中。来自网络设备的信息同样可以包括网络参数的测量值,例如用于某些连接或某些呼叫(业务分析)上的带宽或者某些连接或某些呼叫上的数据包丢失率,这些网络参数特别地使网络运营商能够监视和管理与每个用户的客户机(或每个服务)相关联并由服务级协议(SLA)定义的服务质量(QoS)。

一般来说,对诊断有用的任何信息都可以馈送给诊断设备DD的诊断模块MD。

根据本发明,诊断模块MD包括一个采取基本诊断单元形式的专业知识库BC,以及一个处理模块MT,其用于在从知识库BC中选定的单元之间建立选定分级关联,以便构造适用于确定问题原因的可配置诊断模型。

知识库BC优选地根据来自不同来源的数据(或信息)而构造,来自不同来源的数据(或信息)例如是设备设计数据(规范、配置、有效性等,以及已经遇到的问题和/或缺点),设备制造数据(所使用的组件、所使用的技术等,以及已经遇到的问题和/或缺点),来自在实验室中执行的设备测试的数据(关键故障、可靠性、程序错误(bug)、兼容性、使用寿命等),以及关于在现实生活条件下使用的信息(这种信息特别地来自用户、维修服务和故障报告,并且包括例如涉及可靠性和涉及设备和组件故障的时间表(timescale)的统计信息,最经常发生的设备故障与特定用法或特定制造过程、设备兼容性、使用寿命等有关)。

如图1所示,诊断设备DD包括分析模块MA,其用于从网络自身或者从网络运营商处收集数据和信息,并分析这些数据和信息,以便选择对选定诊断有用的数据和信息。

例如,分析模块MA分为三个分析子模块SMA1到SMA3,分别连接到相应的数据库BD1到BD3。

例如,分析子模块SMA1专用于分析设备设计和制造的数据和信息,分析子模块SMA2专用于分析设备的实验室测试数据和信息,并且分析子模块SMA3专用于分析关于在现实生活条件下使用的数据和信息。

将在由子模块SMAi(在本例中,i=1到3)实现的分析期间保留的专业知识数据存储在相关联的数据库BDi中。在数据库BD3中,关于在现实生活条件下使用的数据和信息通常随时间而变化,并且有利的做法是有规律地对这些数据和信息进行更新,例如定期对这些数据和信息进行更新。

在不同的分析子模块SMAi中可以用任意方法对数据进行分析,并且特别是可以通过诸如数据挖掘之类的统计方法或者学习技术、信号处理技术、预测/趋向技术或基于经验的技术等来对数据进行分析。分析优选地在专业人员的控制下执行。

如图1所示,当诊断设备DD包括分析模块MA时,该诊断设备DD还包括连接到分析模块MA(更准确地说是连接到其数据库BDi)并连接到诊断模块MD的知识库生成模块MGB。

例如,通过下文中指出的方法,知识库生成模块MGB可以生成一个或多个对于诊断模块MD来说必需的知识库BD。

例如,根据存储在数据库BD1中的设备设计和制造的数据和信息,知识库生成模块MGB首先构造形式为基本诊断单元的知识核心(knowledge core)。然后,MGB使用存储在数据库BD2中的实验室设备测试数据和信息来增强该知识库。最后,MGB将存储在数据库BD3中的关于在现实生活条件下使用的数据和信息加入到增强的知识核心,以构造知识库BC,其形式为适用于待诊断网络的基本诊断单元。

本领域的普通技术人员公知的任何技术都可以由知识库生成模块MGB用来生成形式为基本诊断单元的知识库BC。在这些技术中,需要特别提到的是统计技术、基于规则和/或模型的技术以及例如神经网络或Petri网(佩特里网)类型的学习技术。

通过知识库生成模块MGB生成每一个知识库BC的过程优选地在专业人员的控制下执行。

知识库BC一旦由知识库生成模块MGB生成,就与诊断模块MD进行通信。

由于通常的情况是存储在数据库BDi中的一些数据(特别是存储在数据库BD3中的数据)是随时间而变化的,因此有利的做法是有规律地更新与诊断模块MD进行通信的知识库BC,例如定期更新与诊断模块MD进行通信的知识库BC。可以相应地调整知识库生成模块MGB。

重要的是注意到,如果知识库BC是从别处提供给诊断设备DD的,则诊断设备DD就不必包括分析模块MA和知识库生成模块MGB。

诊断模块MD包括处理模块MT,其用于在知识库BC的选定程序块(block)之间建立选定分级关联,以构造可配置的诊断模型,其适用于确定发生在相关网络中的问题的原因。

在当前的上下文中,表述“分级关联”意指程序块的任何因果关联或组合,即程序块必须以可以预定的顺序相对于彼此而使用的关联或组合。

处理模块MT可以采用任何方法来将分级基本诊断单元相关联。该处理模块MT可以特别地采用选定规则和/或选定模型和/或统计方法来将分级基本诊断单元相关联。

下面描述三个程序块的分级关联的一个特别简单的实例,其可由处理模块MT实现,并且不构成对本发明的限制:

-执行知识库BC的程序块1;

-如果程序块1没有检测到故障,则执行程序块2;

-如果程序块2没有检测到故障,则执行程序块3。

重要的是注意到,至少一些规则可以是统计类型的。

图2示出了分级关联的一个更复杂的实例,这次该分级关联包括13个程序块,其可以由处理模块MT实现且不构成对本发明的限制。在本例中,处理模块MT已经建立了适用于确定IP虚拟专用网(IPVPN)中数据包丢失原因的诊断模型。

在本例中,诊断模型采取本领域普通技术人员熟悉的贝叶斯网络(或因果图表)的形式。为贝叶斯网络的每一个节点指定一个名称,该名称代表包括至少一个这样的测试的一组待执行的基本测试的输出变量。

应当记住,当执行贝叶斯网络时,该贝叶斯网络要检测可能存在的任何问题及其原因。

一个贝叶斯网络就是一个因果树。在图2的实例中,示出了数据包丢失的三个原因,为每一个原因分配了一个确定的概率:DropOnInputQueue(在输入队列上丢失)(具有概率X)、RouterMisconfiguration(路由器误配置)(具有概率Y)以及DropOnOutputQueue(在输出队列上丢失)(具有概率Z),这三个概率X、Y和Z的和等于1。

类似地,在每个从LossPacket(丢失数据包)导出的分支内,为每一个子分支分配一个概率。例如,分支DropOnInputQueue的一个原因是Throttle(限速),为其分配概率X1。

下面定义图2的实例中的贝叶斯节点。

LossPacket指定一个方案用于发现IP VPN中数据包丢失的根本原因。根据原因的概率执行各种测试。例如,LossPacket方案首先测试InterfaceInStatus(其通常是最有可能的原因)。然后,如果InterfaceInStatuS(入口接口状态)是“OK(正常)”,则测试InterfaceOutStatus(出口接口状态)(其通常是第二可能的原因)。如果InterfaceOutStatus是“NOK(不正常)”,则LossPacket发送“InterfaceOutStatus NOK”消息、问题的原因(例如一个接口不工作),并且如果能够确定所丢失的数据包的数目,则LossPacket还要发送该数目。

DropOnInputQueue是表明数据包是否已经在入口接口处丢失的变量。

RouterMisconfiguration是一个不能直接观察到的变量。其表明是否正确配置了路由器。

DropOnOutputQueue是表明数据包是否已经在出口接口处丢失的变量。

如前所述,在针对数据包丢失的贝叶斯网络内,为DropOnInputQueue分配概率X,其代表数据包丢失原因与输入队列(InputQueue)有关的概率,同时为RouterMisconfiguration分配概率Y,其代表数据包丢失原因与路由器的误配置有关的概率,并且为DropOnOutputQueue分配概率Z,其代表数据包丢失原因与输出队列(OutputQueue)有关的概率。

类似地,在与DropOnInputQueue相关联的分支内,数据包丢失原因与HighCPUUtilization(较高的CPU利用率)有关的概率为X1,数据包丢失原因与Throttle有关的概率为X2,以及数据包丢失原因与InterfaceInStatus有关的概率为X3。

因此,如果想要确定数据包丢失原因是否与输入队列(InputQueue)有关,就有必要确定HighCPUUtilization是“OK”还是“NOK”(不正常)和/或Throttle是“OK”还是“NOK”和/或InterfaceInStatus是“OK”还是“NOK”。

InterfaceInStatus是模拟输入接口状态的变量。

Throttle是一个变量,其表明端口是否停止工作,并提供关于路由器加载(过载)状态的指示。Throttle表明例如由于处理过载或缓冲过载,给定端口处的接收器停止工作的次数。

HighCPUUtilization是表明路由器的处理能力(或CPU能力)是否过载的变量。

BGP4MIB是表明边界网关协议(BGP)配置状态的变量。例如,如果BGP4MIB是“OK”,则BGP配置正确,而如果BGP4MIB是“NOK”,则BGP配置不正确。

IPForwardMIB是用于确定LSP(行同步脉冲)是否已经建立的测试变量。

ClassBasedQoSMIB是用于确定路由器中的服务质量(QoS)策略是否已经恰当地配置和实现的测试变量。

InterfaceOutStatus是模拟输出接口状态的变量。

BadConfOfWRED是检验加权的随机早期检测(WRED)算法配置的测试,如果已经定义了随机早期检测(RED)类型的排队策略,则该算法检验每个与输出标签(1able out)相关联的输出接口,之后收集所提取的数据包的总数目。

QueueMIB是用于检验在输出端口和输入端口中是否定义了策略模型(策略图)的变量。

在贝叶斯网络的本实例中,各节点位置代表与其所属的相应分支相关联的概率。

关于贝叶斯网络及其在诊断设备中使用的其他信息可以参阅UCL出版社1996年出版的F.Jensen的“An introduction to BayesianNetworks”(贝叶斯网络导论),(已经停印,2001年重新发行)。

重要的是注意到,用于诊断模型(无论是否为贝叶斯网络类型的模型)中的至少一些基本诊断单元也可以采取贝叶斯网络(或图表)的形式。

同样重要的是注意到,可以通过除测试以外的方法来实现诊断,并且这些方法特别是主动或被动的测量、警报关联、配置检验以及检验整个网络的服务配置的一致性和存储在管理信息库(MIB)中或在诸如路由器之类的特定网络设备中可用的设备特定的参数的读取的一致性。

获得用于生成涉及IP VPN中的服务质量(QoS)的诊断测试的信息的详细实例可参阅Gérard Delègue等人于2002年3月在第三届国际网络会议(3rd International Conference on Networking)上发表的论文“IP VPN Network Diagnosis:Technologies and Perspectives”(IP VPN网络诊断:技术和前景)。

处理模块MT可以包括规则引擎MR,用于优选地在专业人员的控制下在选定基本单元之间建立选定分级关联。

在借助于规则通过将基本测试单元相关联来构造贝叶斯网络类型的诊断模型的情况下,以及在借助于模型通过将基本测试单元相关联来构造诊断模型的情况下,处理模块MT可以适用于将选定统计权重或概率权重和/或选定管理成本与至少一些基本诊断单元和/或至少一些规则和/或至少一些模型相关联。

对统计权重或概率权重进行关联意味着可以使某些测试集合配置比诊断环境中其他测试集合更重要(或更不重要)。对管理成本进行关联意味着仅当诊断成本较为重要时才能使用某些测试集合。

对选定统计权重或概率权重和/或选定管理成本进行关联优选地在专业人员的控制下进行。

在这一变型中,有利的是使用上述类型的IHM(人/机接口),以在屏幕上显示由专业人员选定的空白树(blank tree),并使该专业人员用基本诊断单元填充该树(或其一部分)的节点。

基于由专业人员提供的指令,处理模块MT可以适用于自动建立关联。然而,处理模块MT同样可以适用于提出知识库BC的一些或全部基本单元和/或与所述基本单元相关的可以考虑的一些或全部规则,或者适用于使这些基本单元和/或规则可用,以便使专业人员定义拟用于构成诊断模型的关联。在这种情况下,处理模块MT还负责由用户定义的诊断模型的(物理)生成。

为使专业人员能够控制(或定义)每个关联,不管该关联是生成诊断模型的环境中的程序块的关联还是统计权重或概率权重和/或管理成本的关联,处理模块MT都包括人/机接口IHM,例如图形用户接口(GUI)。

在没有人/机接口IHM的情况下,专业人员可以通过任意类型的命令来发送指令给处理模块MT,例如通过命令行(CLI)类型或者代码类型的命令来发送指令给处理模块MT。

专业人员还可以用这类接口IHM来修改至少一些基本诊断单元和/或至少一些规则(和可应用其统计权重或概率权重的地方)和/或至少一些模型和/或至少一些统计权重或概率权重和/或至少一些管理成本。

在当前的上下文中,术语“修改”(modify)意指任何为了增加、删除或改变事物的干预动作。因此,一次修改可以包括增加或删除或改变知识库BC中或诊断模型中的一个或多个基本单元(或其一部分)和/或一个或多个规则和/或模型。

上面描述了一个实施例,其中处理模块MT通过规则和/或模型来实现分级关联。然而,可以考虑一种变型,其中处理模块MT实现选定树内的选定基本诊断单元的分级关联。在这种情况下,每一个完整的树最终构成一个诊断模型。

在这一变型中,有利的是使用上述类型的人/机接口IHM在屏幕上显示由专业人员选定的空白树,并使该专业人员用基本诊断单元来填充该树(或其一部分)的节点。

在这种情况下,关联仅仅在于将按照由相关的树所定义的次序来执行的基本单元串接,而不包括与相关联的基本单元相关的规则或模型。

诊断模型一旦由处理模块MT生成并激活,就可以由诊断模块MD的计算模块MC所使用。计算模块MC将例如警报之类的(直接地或间接地)来自网络设备的信息馈入到激活的诊断模型中,并向输出端发送诊断,即已经发生在网络中的问题的原因。

根据计算模块MC所使用的诊断模型来对其进行调整。因此,计算模块MC可以设计为运行诊断模型的方案,并使用诸如数据库、SNMP(简单网络管理协议)工具等,在输出端传送构成诊断的结果。

例如,计算模块MC可以连接到辅助模块,其用于向运营商提供用于补救诊断中所确定的每个原因的操作。

重要的是注意到,诊断设备DD可以包括除上述诊断模块(MD)之外的、具有不同设计的一个或多个辅助诊断模块或者一个或多个辅助诊断模型。在这种情况下,诊断模块MD的计算模块MC可以适用于使用每个激活的诊断模型,而不管其设计如何。

同样重要的是注意到,由诊断设备DD实现的诊断可以涉及任意类型的网络设备,不管是纯硬件(组件)、纯软件还是其组合。

本发明的诊断设备DD,并且特别是其分析模块MA、其知识库生成模块MGB及其诊断模块MD,可以用电子电路、软件(数据处理)模块或电路和软件的组合的形式来实现。

本发明不局限于上面仅通过实例来描述的诊断设备,并且涵盖了本领域普通技术人员可以考虑到的在以下权利要求范围内的所有变型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号