首页> 中国专利> 一种电信业务的故障识别与定位的方法及系统

一种电信业务的故障识别与定位的方法及系统

摘要

本发明提供了一种电信业务的故障识别与定位的方法及系统,所述方法包括:根据代表故障源的业务特征值和故障现象之间的相关系数,从样本数据中选择作为反向传递BP神经网络训练的业务特征值;为已选择出的每个业务特征值确定一个基于BP神经网络的弱分类器,并将弱分类器进行线性组合,得到对应的强分类器;按照各个业务特征值与故障现象之间的相关系数的大小顺序,将各个业务特征值对应的强分类器串联,并对串联后的强分类器进行训练,得到用于多故障源识别的层分类器;利用所述层分类器对电信业务过程中产生的业务数据和/或网络数据进行故障识别及定位。本发明能够减少神经网络所需的训练样本量,提高故障检测实时性,并便于定位故障原因。

著录项

  • 公开/公告号CN104052612A

    专利类型发明专利

  • 公开/公告日2014-09-17

    原文格式PDF

  • 申请/专利权人 中国移动通信集团广东有限公司;

    申请/专利号CN201310080584.3

  • 申请日2013-03-13

  • 分类号H04L12/24(20060101);

  • 代理机构11243 北京银龙知识产权代理有限公司;

  • 代理人许静;黄灿

  • 地址 510623 广东省广州市珠江新城珠江西路11号广东全球通大厦13楼

  • 入库时间 2023-12-17 01:39:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-25

    授权

    授权

  • 2014-10-22

    实质审查的生效 IPC(主分类):H04L12/24 申请日:20130313

    实质审查的生效

  • 2014-09-17

    公开

    公开

说明书

技术领域

本发明涉及电信网络中的核心网、网管及业务支撑领域,具体涉及一种电 信业务的故障识别与定位的方法及系统。

背景技术

随着电信业和信息服务技术业的发展,电信业务量也快速增长,所发生的 故障数量也就会随之提升,这成为提升用户满意度、增强运营商公司的通信服 务与用户之间的黏性的一个巨大障碍。

当前,解决故障的一个重要步骤是进行故障识别和定位,确定故障。这一 步骤通常的实现方法是:人工识别故障,即根据业务数据和维护工作人员的经 验,判定哪个方面存在故障,具体的判断的流程如下图1所示。

图1中,OCS为在线计费系统(Online Charging System);HLR为归属位 置寄存系统(Host Location Register);BOSS为Business Operating Support  System。上述三个系统统称为业务系统。对业务系统运行过程中产生的数据进 行采样,可以得到业务数据。当业务系统出现故障时,当前的处理方式为:前 台的客服人员收到客户提交的故障信息后,将故障处理任务交给后台维护人 员,后台维护人员根据客户和前台客服人员提供的信息来确认故障,并定位故 障的原因,然后解决问题。这是一种被动的、延迟的模式,即必须在客户投诉 后或者前台提供相关的报错信息时才能发现故障。显然,这种处理故障的方式 就不会及时,从而影响到客户的满意度,降低用户对运营商服务的认同度。

神经网络又称为人工神经网络、神经计算,连接主义人工智能,并行分布 处理等。一个神经网络是一个由简单处理元构成的规模宏大的并行分布处理 器,具有存储经验知识和使之可用的特性。通过采用图2所示的神经网络,可 以对故障进行实时检测,以缩短故障发生时处理的时间。

图2中,系统从OCS、HLR、BOSS和网络中采集的数据,通过神经网络 输入层实时输入到经过训练的神经网络中,根据预测的故障的种类,输出层的 不同的输入神经元产生的输入表明不同的系统故障。

图1所示的采用人工识别的故障识别方式是一种被动的、延迟的模式,即 必须在客户投诉后或者前台有相关的报错时才去发现故障,那么这样处理故障 就不会及时,从而影响用户对服务的认同。而图2所示基于神经网络的故障检 测模型则存在着以下问题:

(1)所有的故障都在一个神经网络中检测,导致用于训练的样本数据量 极大,这阻碍了该类模型的实用性。

用于检测故障的神经网络的输入接入了所有系统运行数据,而输入则产生 所有的代表故障现象的故障信号。在训练时,任何一类现象的产生都需要所有 的输入的数据,从输入和输出的维度来看,要确定任何一类的故障所需要的样 本数据量都极大,这使得要训练好这样的一个检测神经网络需要大量的样本数 据,这对于一个处于建设初期的故障检测系统和才关注故障检测的运行机构来 说,难度较大。

(2)对于训练好的神经网络来说,由于其结构复杂,同时要计算各类故 障,导致计算量大极具增大,这使得实时检测的延时较大。

故障检测的目的在于尽量缩短故障的响应时间,因此,包括故障识别和故 障定位两个过程的故障检测的实时性非常重要。如果神经网络结构复杂,则需 要计算的复杂度增大,计算时间将延长,这将不利于缩短故障识别和故障定位 的时间。

(3)用于识别和定位故障的检测神经网络没有在故障现象(输出)和故 障原因(输入)之间建立起明确的关系,这样导致不容易定位故障原因。

发明内容

有鉴于此,本发明实施例的目的是提供一种电信业务的故障识别与定位的 方法及系统,能够减少神经网络所需的训练样本量,提高故障检测实时性,并 便于定位故障原因。

为解决上述技术问题,本发明实施例提供方案如下:

本发明实施例提供了一种电信业务的故障识别与定位的方法,包括:

根据代表故障源的业务特征值和故障现象之间的相关系数,从样本数据中 选择相关系数大于预设阈值的业务特征值,作为反向传递BP神经网络训练的 业务特征值;

为已选择出的每个业务特征值确定一个基于BP神经网络的弱分类器,并 将所确定的弱分类器进行线性组合,得到该业务特征值对应的一个强分类器;

按照各个业务特征值与故障现象之间的相关系数的大小顺序,将各个业务 特征值对应的强分类器串联,并采用包括多故障源数据和故障现象的样本数据 对串联后的强分类器进行训练,得到用于多故障源识别的层分类器;

利用所述层分类器对电信业务过程中产生的业务数据和/或网络数据进行 故障识别及定位。

进一步地,上述方案中,所述利用所述层分类器对电信业务过程中产生的 业务数据和/或网络数据进行故障识别及定位,包括:将电信业务过程中产生 的业务数据和/或网络数据输入所述层分类器,根据各个强分类器产生的输出, 定位故障原因。

进一步地,上述方案中,所述为已选择出的每个业务特征值确定一个基于 BP神经网络的弱分类器,包括:

为已选择出的各个业务特征值,建立一个基于BP神经网络的弱分类器;

采用预先得到的包含正反业务数据的样本数据组合,训练所述弱分类器识 别单故障源,直至达到预定的训练次数,得到训练后的弱分类器,其中,每执 行一次训练后估算训练目标误差,选择其中误差最小的分类器并降低该分类器 的权值。

进一步地,上述方案中,所述采用包括多故障源数据和故障现象的样本数 据分别对串联后的强分类器进行训练,得到用于多故障源识别的层分类器,包 括:

采用包括多故障源数据和故障现象的样本数据,对串联后的强分类器进行 训练,直至达到预定的训练次数,得到所述层分类器,其中,每执行一次训练 后估算训练目标误差,选择其中误差最小的分类器并降低该分类器的权值。

进一步地,上述方案中,进一步选择与故障现象之间的相关系数大于预设 阈值的业务特征值,将所选择的业务特征值对应的强分类器进行所述串联。

本发明实施例还提供了一种电信业务的故障识别与定位的系统,包括:

特征值选取单元,用于根据代表故障源的业务特征值和故障现象之间的相 关系数,从样本数据中选择相关系数大于预设阈值的业务特征值,作为反向传 递BP神经网络训练的业务特征值;

单故障源识别单元,用于为已选择出的每个业务特征值确定一个基于BP 神经网络的弱分类器,并将所确定的弱分类器进行线性组合,得到该业务特征 值对应的一个强分类器;

多故障源识别单元,用于按照各个业务特征值与故障现象之间的相关系数 的大小顺序,将各个业务特征值对应的强分类器串联,并采用包括多故障源数 据和故障现象的样本数据对串联后的强分类器进行训练,得到用于多故障源识 别的层分类器;

业务处理单元,用于利用所述层分类器对电信业务过程中产生的业务数据 和/或网络数据进行故障识别及定位。

进一步地,上述方案中,所述业务处理单元,进一步将电信业务过程中产 生的业务数据和/或网络数据输入所述层分类器,根据各个强分类器产生的输 出,定位故障原因。

进一步地,上述方案中,所述单故障源识别单元,进一步用于为已选择出 的各个业务特征值,建立一个基于BP神经网络的弱分类器;采用预先得到的 包含正反业务数据的样本数据组合,训练所述弱分类器识别单故障源,直至达 到预定的训练次数,得到训练后的弱分类器,其中,每执行一次训练后估算训 练目标误差,选择其中误差最小的分类器并降低该分类器的权值。

进一步地,上述方案中,所述多故障源识别单元,进一步用于采用包括多 故障源数据和故障现象的样本数据,对串联后的强分类器进行训练,直至达到 预定的训练次数,得到所述层分类器,其中,每执行一次训练后估算训练目标 误差,选择其中误差最小的分类器并降低该分类器的权值。

进一步地,上述方案中,所述多故障源识别单元,进一步用于选择与故障 现象之间的相关系数大于预设阈值的业务特征值,将所选择的业务特征值对应 的强分类器进行所述串联。

从以上所述可以看出,本发明实施例提供的电信业务的故障识别与定位的 方法及系统,能够准确的识别出故障并定位,可以减少人为检查业务数据的工 作量。本发明实施例还具有训练样本量不大、故障检测实时性高和故障原因定 位快速等优点。

附图说明

图1为现有技术中人工识别故障的示意图;

图2为应用神经网络进行故障识别的示意图;

图3为本发明实施例所述方法的流程示意图;

图4为本发明实施例所述系统的结构示意图;

图5为本发明实施例中的层叠神经网络集成结构的示意图;

图6为本发明实施例提供的层分类器的结构示意图。

具体实施方式

从现有的故障规避(故障解决)的经验来看,最容易降低用户满意度的环 节,也是最花费时间的环节是故障定位,即不能快速地找到故障的原因,把故 障消除。因此,如果能在短时间内能够识别到故障、定位故障,这将大大缩短 解决故障的时间,提高用户的满意度。同时,如果在故障现象和故障原因之间 确立明确的关系,对于缩短故障解决时间,也具有非常重要的意义。

基于以上分析,本发明实施例提供了一种电信业务的故障识别与定位的方 法及系统,能够减少所需的训练样本量,提高故障检测实时性,并便于定位故 障原因。本发明实施例的方法,能够主动的去分析现有的业务数据或网络数据, 从而能够发现故障,并快速确定故障原因,以帮助维护人员快速地解决故障问 题。这里,业务数据是从业务系统输出的数据,网络数据是电信网络(如接入 网、核心网等)运行过程中产生的数据。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实 施例对本发明进行详细描述。

请参照图3,本发明实施例所述的电信业务的故障识别与定位的方法,包 括以下步骤:

步骤31,根据代表故障源的业务特征值和故障现象之间的相关系数,从 样本数据中选择相关系数大于预设阈值的业务特征值,作为反向传递(BP, Back Propagation)神经网络训练的业务特征值。

本步骤中,通过相关系数对样本数据进行降维处理,选取合适的特征值进 行后续计算,以减少计算工作量,提高计算速度。

步骤32,根据AdaBoost算法,为已选择出的每个业务特征值确定一个基 于BP神经网络的弱分类器,并将所确定的弱分类器进行线性组合,得到该业 务特征值对应的一个强分类器。

本步骤中,为已选择出的各个业务特征值,建立一个基于BP神经网络的 弱分类器;采用预先得到的包含正反业务数据的样本数据组合,训练所述弱分 类器识别单故障源,直至达到预定的训练次数,得到训练后的弱分类器,其中, 每执行一次训练后估算训练目标误差,选择其中误差最小的分类器并降低该分 类器的权值;然后,对训练后的弱分类器进行线性的组合,得到一个强分类器。

步骤33,按照各个业务特征值与故障现象之间的相关系数的大小顺序, 将各个业务特征值对应的强分类器串联,并采用包括多故障源数据和故障现象 的样本数据对串联后的强分类器进行训练,得到用于多故障源识别的层分类 器。

本步骤中,进一步选择与故障现象之间的相关系数大于预设阈值的业务特 征值,将所选择的业务特征值对应的强分类器进行所述串联。然后,通过采用 包括多故障源数据和故障现象的样本数据,对串联后的强分类器进行训练,直 至达到预定的训练次数,得到所述层分类器,其中,每执行一次训练后估算训 练目标误差,选择其中误差最小的分类器并降低该分类器的权值。

步骤34,利用所述层分类器对电信业务过程中产生的业务数据和/或网络 数据进行故障识别及定位。

本步骤中,通过将电信业务过程中产生的业务数据和/或网络数据输入所 述层分类器,然后根据各个强分类器产生的输出,定位故障原因。

从以上方法可以看出,本发明实施例通过相关性分析,对训练和检测的数 据降维,降低了对训练样本数量的要求,使得本发明实施例中提出的故障检测 技术实际可行。而且,本发明实施例通过分层的故障检测器的设计安排,将复 杂的计算分解成简单的计算,提高了故障检测的实时性。最后,本发明实施例 提供了一种分层结构的层分类器,该层分类器的每个强分类器的输出对应于一 个故障,这样,在某个强分类器产生输出时即可以定位到对应的故障原因,提 高了故障原因定位的速度。

基于以上方法,本发明实施例还相应的提供了一种电信业务的故障识别与 定位的系统,如图4所示,该系统包括:

特征值选取单元,用于根据代表故障源的业务特征值和故障现象之间的相 关系数,从样本数据中选择相关系数大于预设阈值的业务特征值,作为反向传 递BP神经网络训练的业务特征值;

单故障源识别单元,用于根据AdaBoost算法,为已选择出的每个业务特 征值确定一个基于BP神经网络的弱分类器,并将所确定的弱分类器进行线性 组合,得到该业务特征值对应的一个强分类器;

多故障源识别单元,用于按照各个业务特征值与故障现象之间的相关系数 的大小顺序,将各个业务特征值对应的强分类器串联,并采用包括多故障源数 据和故障现象的样本数据对串联后的强分类器进行训练,得到用于多故障源识 别的层分类器;

业务处理单元,用于利用所述层分类器对电信业务过程中产生的业务数据 和/或网络数据进行故障识别及定位。

优选地,所述业务处理单元,进一步将电信业务过程中产生的业务数据和 /或网络数据输入所述层分类器,根据各个强分类器产生的输出,定位故障原 因。

优选地,所述单故障源识别单元,进一步用于为已选择出的各个业务特征 值,建立一个基于BP神经网络的弱分类器;采用预先得到的包含正反业务数 据的样本数据组合,训练所述弱分类器识别单故障源,直至达到预定的训练次 数,得到训练后的弱分类器,其中,每执行一次训练后估算训练目标误差,选 择其中误差最小的分类器并降低该分类器的权值。

优选地,所述多故障源识别单元,进一步用于采用包括多故障源数据和故 障现象的样本数据,对串联后的强分类器进行训练,直至达到预定的训练次数, 得到所述层分类器,其中,每执行一次训练后估算训练目标误差,选择其中误 差最小的分类器并降低该分类器的权值。

优选地,所述多故障源识别单元,进一步用于选择与故障现象之间的相关 系数大于预设阈值的业务特征值,将所选择的业务特征值对应的强分类器进行 所述串联。

为更好地理解以上方法,下面将通过更为详细的说明,对本发明的具体实 施例作进一步阐述。

请参照图5,图5提供了本发明实施例用于故障的识别和定位的层叠神经 网络集成结构。该神经网络集成结构主要实现三个功能:(1)分析故障源和故 障现象数据的相关性,分故障现象确定样本数据;(2)训练神经网络(分类器) 用于单故障源(单特征值)的识别;(3)集成神经网络,形成层叠分类器,用 于多故障源(多特征值)的识别。以下分别进行说明。

(1)相关性分析,确定样本数据的输入特征值

样本数据的特征值(维度)众多,为了减少神经网络的计算量,本发明实 施例对样本数据的输入进行降维处理,即选择合适的特征值。

作为一种优选实施方式,采用如下公式的相关性分析来选择特征值。

rXY=Σi=1N(Xi-X)(Yi-Y)Σi=1N(Xi-X)2Σi=1N(Yi-Y)2

式中,X为待选的特征值,Y为与故障有关的输出值。例如,X为服务器 硬盘的剩余空间与标准空间的比值,Y为每秒内查询的次数。下标i表示不同 的时间点,N表示样本数据采样的数量,表示Xi的平均值,表示Yi的平均 值,rXY表示X与Y之间的相关性。

在这一步骤中,本实施例选择rXY为0.5作为阈值,即选择大于等于0.5 的特征值,进入后续训练计算。

(2)单故障源识别器

在本实施例中,采用BP神经网络,建立一个有三层的网络模型:输入层、 隐层、输出层。首先,在输入层输入预先获得的作为样本数据的业务数据或网 络数据,经过隐层的作用函数的作用,在输出端就可以输出值,本实施例中, 输出值只有两种:1和0,其中1代表该数据有故障,0代表没有,然后根据 误差计算函数计算出误差,与预期误差相比,如果没有达到预期误差的要求, 将刚才输出的信息反馈到输入层和隐层,从而作用于输入层和隐层,调节权值 和相关的函数,来达到优化输出值的作用。

根据神经网络集成理论,通过单独训练多个神经网络,并将其结果合成, 可以显著地提高神经网络的泛化能力,在本实施例中,这种泛化能力即为故障 识别能力。这里采用的结果合成方法是AdaBoost算法,即为每一个特征值确 定一个弱分类器,然后将这些弱分类器进行线性的组合,就组成了一种强分类 器。在该算法中,每一个业务特征值被赋予一个权值,如果某个样本没有被正 确分类,它的权值就会被提高,相反则会降低,其算法描述如下:

1)针对所选择的特征值,获得一定数量的正反业务数据的样本,作为训练 分类器的样本数据,这里假定有正反数据样本各有若干条。

2)初始化训练分类器组合的权值w,将正反业务数据样本按照预设的不同 比例(例如,10:1、10:2、10:3、…、10:10)进行样本组合生成多个样本 组合。通常,负样本比正样本少很多,因此,每类样本组合的正样本不减少, 而负样本的生成可以采用重复生成的方式来进行样本数量补齐;

3)为每个样本组合建立一个分类器(BP神经网络算法),针对每个样本组 合,进行预定次数(如100次训练),然后,对执行完训练的分类器进行模拟 误差估算,误差为:训练模拟输出与实际输出的差值;

4)选择所有样本组合对应的分类器中误差最小的预设数量的分类器,例如 选择误差最小的3个分类器;

5)将分类器的模拟正确识别率作为组合权重,对上述选择的分类器进行 线性组合,得到该业务特征值对应的强分类器。

经过上面的过程就可以得到一个强分类器,该分类器可以很快的分辨出该 条数据是否故障,提高了故障识别的效率,但是只能针对具有单一特征值的故 障的情况。

(3)多故障源识别器

前面得到单个的强分类器,而当特征值的数量超过一个的时候,无法采用 前面的单故障源识别器。因此,本实施例提供了如图6所示的一种层分类器的 模型,该层分类器是用串联的方式将多个神经网络(即上文的强分类器)进行 组合。根据相关系数来安排各神经网络在层分类器中的位置。采用多故障源数 据和正常数据的所有故障源X与故障现象Y分别对各个神经网络进行训练。具 体步骤为:

1)采用(1)中的相关性分析的步骤,选择大于相关系数阈值0.5的所有 与某一故障现象Y相关的特征值X;一个故障现象可能由若干个故障源引起, 一个故障源对应于一个特征值;这里的某一故障现象Y可以从需要定位的故障 现象中任选。

2)按各个特征值与所选择的故障现象Y之间的相关系数的大小顺序,将 各个特征值所表示的故障源对应的神经网络排入层分类器(如图6所示)中; 相关系数的大小反映了引起故障现象的故障源的可能性的大小;相关系数大的 神经网络,排序在更接近输入端的位置(如图6中更靠右的位置);

3)分别用样本数据对神经网络进行训练,训练的过程与(2)单故障源识 别器1)、2)和3)步相同。

通过这样的安排,每一层故障分类器就可以排除一个故障源,层次越高的 分类器(排序越靠近输入端位置的分类器),其对应的特征值引起故障的可能 性越大,因此,这类组合可以高效地检测和定位故障,第一层分类器只用到了 一个就可以筛选出不是故障的信息,然后依次将剩下的没有筛选出的业务数据 经过其他的分类器去执行,这样就可以很高效地识别故障并通过神经网络产生 出的输出定位故障原因(故障源)。

经实验得出的结论:使用该分层结构比不用分层的单个神经网络结构的识 别故障的效率平均可以提高数倍。

综上,本发明实施例根据电信业务的故障定位的需求及其特点,提出了分 类器的级联模式,在业务特征值的选取时,本发明实施例将业务数据中的故障 现象与故障源(故障原因)所代表的数据之间做关联分析,确定故障的考察范 围(选择相关系数大于阈值的特征值),从而可以降低维度,减小后续计算的 计算复杂度,提高计算速度;并且,本发明实施例采用分类器的分层结构模式, 分层结构的优势在于:(1)处理效率高。分层结构分类器的处理效率高于由单 个神经网络构成的分类器,经实验验证:输入相同的特征值,分层结构模式的 分类器模型的效率可以提高数倍;(2)快速定位故障:通过分层结构中神经网 络的输出即可定位故障源。

以上所述仅是本发明的实施方式,应当指出,对于本技术领域的普通技术 人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些 改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号