技术领域
本发明涉及一种滚动轴承故障诊断方法,具体涉及一种基于GA随机森林的滚动轴承故障诊断方法。
背景技术
滚动轴承是机械设备动力传动装置中至关重要的机械元件。它的主要作用是将运行轴与轴座之间的滑动摩擦变为滚动摩擦,以减少摩擦和磨损。滚动轴承具有结构简单、摩擦系数小、运动精度高、制造成本低等优点。但是,由于工作环境复杂多变,容易出现磨损、腐蚀、裂纹等各种形式的缺陷,影响设备运行,甚至造成巨大损失,因此对滚动轴承故障监测与识别在工程应用中具有重要的作用。
轴承故障诊断首先要获取设备的特征信号,然后通过一定的手段进行处理,最终得到滚动轴承相关的故障信息。这样可以在技术上监控设备的运行状态,判断异常情况,为后续的维修计划提供参考。目前用于故障分类识别的故障诊断方法主要有聚类分析、支持向量机(SVM)、人工神经网络(ANN)、卷积神经网络(CNN)等。然而这些算法又存在一定的局限,例如聚类分析通常适用于低维数据的分类,对高维数据分类不敏感,支持向量机(SVM)在解决大规模训练样本和多重分类问题时需要大量的计算时间,人工神经网络(ANN)运算效率低、收敛数度慢、网络结构选择适应性差,卷积神经网络(CNN)需要大的样本空间,对于小批量样本集表现不佳,卷积操作带来计算开销增加。
发明内容
本发明所要解决的技术问题是,克服现有技术的不足,提供一种诊断效率高的基于GA随机森林的滚动轴承故障诊断方法。
本发明解决其技术问题采用的技术方案是,一种GA随机森林的滚动轴承故障分类方法,步骤如下:
步骤一:获取故障滚动轴承振动信号作为样本集合,对信号样本进行处理,得到样本特征集合L={L
步骤二:根据编码规则初始化种群基因序列,繁殖代数,种群数量和染色体长度,构建初始随机森林模型;
(1)根据种群数量随机初始化种群,产生种群基因型,每一个种群个体的基因型为一串二进制编码,代表着随机森林决策树数量、决策树最大深度和决策树训练时的最大特征数量;
(2)优化过程随机森林的训练集采用Bootstrap方法,从原始特征样本集中有放回抽取n个样本得到特征样本子集;
步骤三:采用遗传算法和随机森林相结合,对随机森林的参数调优;
(1)定义当前迭代次数为x,对于x=1,以当前基因型为参数的随机森林模型为当前迭代的初始模型;
(2)利用当前基因型构建第x次迭代随机森林模型,对特征样本子集进行分类,得到第x次迭代随机森林模型的分类准确率,并以此次得到的分类准确率作为遗传算法的第x次迭代的适应度值;
(3)以第x次迭代的适应度值最大的个体基因型表示的参数作为模型的局部最优解,并对适应度较低的个体进行淘汰;
(4)对种群中保留的个体基因型进行随机交叉和变异,产生新的个体基因型;
(5)判断x是否达到x
(6)选出x
步骤四:对参数调优后的随机森林诊断模型进行训练和测试,得到轴承故障诊断结果。
本发明具有以下积极效果:
1、本发明采用遗传算法和随机森林建立了故障诊断模型,提高了诊断模型故障诊断的准确率,与传统方法相比,诊断效率更高。
2、优化了参数调整过程,与传统网格寻优过程相比,本发明解决了计算量大的问题,降低了数据冗余,提高了模型运行效率。
附图说明
图1为本发明实施例的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细说明。
参照附图1,本实施例的步骤如下:
第一步:获取故障滚动轴承振动信号特征样本集合;
1.1使用小波包分解提取振动信号的能量谱值,将能量值按尺度顺序排列组成N个特征向量并进行归一化处理,得到样本特征集合L={L
1.2从原始样本集合中按一定比例不放回随机抽取,将原始样本集合分为训练集和测试集;
第二步:根据编码规则初始化种群基因序列,繁殖代数,种群数量和染色体长度,构建初始随机森林模型;
2.1根据种群数量随机初始化种群,产生种群基因型,每一个种群个体的基因型为一串二进制编码,代表着随机森林决策树数量、决策树最大深度和决策树训练时的最大特征数量;
2.2优化过程随机森林的训练集采用Bootstrap方法,从原始特征样本集中有放回抽取n个样本得到特征样本子集;
第三步:采用遗传算法和随机森林相结合,对随机森林的参数调优;
3.1定义当前迭代次数为x,对于x=1,以当前基因型为参数的随机森林模型为当前迭代的初始模型;
3.2利用当前基因型构建第x次迭代随机森林模型,对特征样本子集进行分类,得到第x次迭代随机森林模型的分类准确率,并以此次得到的分类准确率作为遗传算法的第x次迭代的适应度值;
3.3以第x次迭代的适应度值最大的个体基因型表示的参数作为模型的局部最优解,并对适应度较低的个体进行淘汰;
3.4对种群中保留的个体基因型进行随机交叉和变异,产生新的个体基因型;
3.5判断x是否达到x
3.6选出x
第四步:对参数调优后的随机森林诊断模型进行训练和测试,得到轴承故障诊断结果。
为验证本方法的有效性,选择SVM、KNN、RF进行比较。使用不同特征集对模型进行测试,所得结果如下表所示。
表1不同算法分类效果
在表1中可以看出,4种模型中GA-RF模型在不同数据集上的诊断准确率高于其他种模型,说明本实施例的算法对于随机森林模型的优化有明显的效果。
本领域的技术人员可以对本发明进行各种修改和变型,倘若这些修改和变型在本发明权利要求及其等同技术的范围之内,则这些修改和变型也仍在本发明专利的保护范围之内。
说明书中未详细描述的内容为本领域技术人员公知的现有技术。
机译: 基于功率谱熵随机森林的航空发动机滚动轴承故障诊断方法
机译: 基于功率谱熵随机森林的航空发动机滚动轴承故障诊断方法
机译: 基于改进的随机森林算法的光伏阵列故障诊断方法