技术领域
本发明涉及通信铁塔维护技术领域,尤其涉及一种基于决策树的通信铁塔故障诊断方法。
背景技术
在现有的通信铁塔维护工作中,对通信铁塔的故障诊断方法经常需要人为经验去制定,同时随着物联网监测技术的不断发展,铁塔的监测数据出现了数据量大,属性冗杂等特点,这些因素都给铁塔的故障诊断增加了难度。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于决策树的通信铁塔故障诊断方法。利用大数据处理技术和机器学习算法生成故障诊断规则,能有效的对通信铁塔进行故障诊断与预测。
为了解决上述技术问题,本发明实施例提供了一种基于决策树的通信铁塔故障诊断方法,包括以下步骤:
S1:选取通信铁塔相关监测参数和故障类型;
S2:基于SPSS分析软件对监测数据进行预处理,包括数据筛选和离散化处理,得到离散化数据;
S3:根据C4.5算法建立决策树模型;
S4:使用肯德尔和谐系数对C4.5算法进行优化,并生成优化之后的决策树模型,建立诊断规则;
S5:利用建立的诊断规则进行通信铁塔故障的诊断和预测。
其中,所述步骤S1中监测参数包括风速,倾角,振动幅度,三轴振动加速度。
其中,所述步骤S2中还包括对所述监测数据使用SPSS分析软件进行变量的分类与标准化。
其中,所述步骤S3具体包括步骤:
S31:计算各判断属性的信息熵;
S32:计算信息增益;
S33:使用所述信息增益率来判断最优属性作为决策树根节点;
S34:选取特征增益率最大的特征作为根节点,该特征在不再参与下面的计算,剩下的特征重复以上计算步骤,直到构建出一颗完整的决策树;
S35:进行决策树后剪枝,从下而上对所有的内部节点进行剪枝性能分析,并与未剪枝之前进行性能比较,直至呈现出一棵合适的决策树。
其中,所述步骤S4具体包括步骤:
S41:引入肯德尔和谐系数;
S42:根据等价无穷小原理In(1+x)≈x及换底公式将C4.5算法优化。
其中,所述步骤S5具体包括步骤:
将生成的决策树模型使用Python语言实现之后首先输入训练集进行训练,然后将实时监测的数据输入,获得对应的故障分类结果。
实施本发明实施例,具有如下有益效果:
附图说明
图1为本发明的流程示意图;
图2为本发明的C4.5决策树算法结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,本发明提供一种基于决策树的通信铁塔故障诊断方法,包含步骤:
S1:选取通信铁塔相关监测参数,基于SPSS软件对监测数据进行分析;
随着通信铁塔监测技术的不断完善,如今的监测技术可以监测到铁塔的各类属性。主要监测的性能参数包括:风速、风向、温度、倾角、振动幅度和三轴振动加速度等,要对这些数据进行分析,需要明确相应的故障类型,目前通信铁塔的故障类型主要有:倾斜,裂纹,形变,螺栓松动等。
S2:基于SPSS软件对监测数据进行筛选和离散化处理;
对于监测系统产生的大量数据,在构建算法模型之前需要对数据进行预处理和简单的分析。数据的筛选需要考虑是否和日常维护相关,因此重点选用风速,倾角,振动幅度,三轴振动加速度作为判断属性。同时使用SPSS对数据进行K均值聚类分析,实现连续型数据的离散化,SPSS软件具有内置的聚类分析模型,可以计算变量之间的和谐关系,将类似变量归为一类,展示分类结果,并且对数据本身进行标准化。
连续值处理:采用K均值聚类分析方法,将样本D分为几个子集,计算各个子集之间的距离,将距离相近的子集划分到一起,其定义为:
给定样本集D{x
S3:根据C4.5决策树算法建立决策树模型;具体包括:
S31:计算各判断属性信息熵;
假设一个随机变量X的取值为X={x
S32:根据S31,计算信息增益;
特征A对训练数据集S的信息增益g(S,A),定义为集合S的信息熵H(S)与特征A给定条件下S的信息条件熵H(S|A)之差,信息增益定义式为g(S,A)=H(S)-H(S|A)。
S33:根据S32,计算信息增益率来判断最优属性作为决策树根节点;
特征A的信息增益率可以用如下公式表示:
S34:根据S33的结果,选取特征增益率最大的特征作为根节点,该特征在不再参与下面的计算,剩下的特征重复以上计算步骤,直到构建出一颗完整的决策树。
S35:在S34的基础上进行决策树后剪枝,需要从下而上对所有的内部节点进行剪枝性能分析,并与未剪枝之前进行性能比较,直至呈现出一棵合适的决策树。
S4:C4.5决策树算法的进一步优化;具体包括:
S41:引入肯德尔和谐系数;
肯德尔和谐系数用来判断多个变量之间的和谐程度,设Z为数据集,由N个特征变量A和S个决策变量B组成,设C
当W的值趋向于-1时,表明变量之间存在对立的相关性,当W的值趋向与1时,表明变量之间存在一致的相关性,当W=0时,表明变量之间相互独立。
S42:算法优化;
将W代入S3中公式得:信息增益定义式为g(S,A)=H(S)-H(S|A)×W。
再根据等价无穷小原理In(1+x)≈x及换底公式得:信息熵公式为
根据特征A将数据集S划分为n个子集:(A
信息增益
其中
如图2所示,引入肯德尔和谐系数对上述算法的计算过程进行优化,建立决策树模型,可以使得分类结果更加精确,提高算法的效率。
S5:利用建立的诊断规则进行通信铁塔故障的诊断和预测;
将生成的决策树模型使用Python语言实现之后首先输入训练集进行训练,然后将实时监测的数据输入,即可获得对应的故障分类结果,管理人员即可根据该分类结果作出相应的风险评价。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
机译: 基于经验模式分解和决策树RVM的三电平逆变器故障诊断方法
机译: 基于经验模式分解和决策树RVM的三电平逆变器故障诊断方法
机译: 基于经验模态分解和决策树RVM的三级逆变器故障诊断方法