首页> 中国专利> 基于改进的K-Means聚类的煤矿安全评价系统

基于改进的K-Means聚类的煤矿安全评价系统

摘要

本发明提出一种改进的K-Means聚类的煤矿安全评价系统,包括矿井安全数据输入模块、基于改进的K-Means聚类的数据分析模块、结果输出模块;矿井安全数据输入模块接收用户提交的矿井安全状态数据,基于改进的K-Means聚类的数据分析模块根据矿井安全状态数据,采用改进的K-Means聚类方法进行数据分析,结果输出模块显示数据分析的结果,为煤矿企业的安全管理决策提供辅助依据。采用本发明的煤矿安全评价系统后,可以对煤炭企业所属矿井安全评价的打分结果进行分析,实现煤矿安全评价的全面管理,其评价结果可为煤矿企业的管理决策提供重要的技术依据。

著录项

  • 公开/公告号CN103729798A

    专利类型发明专利

  • 公开/公告日2014-04-16

    原文格式PDF

  • 申请/专利权人 河南理工大学;

    申请/专利号CN201410041849.3

  • 申请日2014-01-29

  • 分类号G06Q50/02;

  • 代理机构

  • 代理人

  • 地址 454000 河南省焦作市高新区世纪大道2001号河南理工大学

  • 入库时间 2024-02-19 23:28:07

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-01-11

    授权

    授权

  • 2015-07-08

    实质审查的生效 IPC(主分类):G06Q50/02 申请日:20140129

    实质审查的生效

  • 2014-04-16

    公开

    公开

说明书

技术领域

本发明属于煤矿安全领域。

 

背景技术

煤炭生产是一个多工序、多环节的综合性过程,而且煤矿生产过程复杂、环境恶劣,常常受到水、火、瓦斯、煤尘和冒顶等各种灾害事故的威胁。因此,煤矿安全问题一直是产业安全中一个尤为重要的问题。

对矿井的安全状况进行准确、全面评估是煤矿生产过程中非常关键的环节。煤矿矿井的安全状况受多个因素影响,如通风安全监控、瓦斯和粉尘防治、井下爆破安全、矿井防冒顶、矿井防透水等。研究这些因素之间的组合关系对矿井安全状况的影响,就可以采取合理的防范措施以降低生产中的安全风险,确保安全生产。

 

发明内容

基于上述各因素之间的相关性,本发明提出了一种基于改进K-Means算法的煤矿安全评价系统,对煤炭企业所属矿井安全评价指标结果进行分析。在煤矿安全管理中需要对通风安全监控、运输和提升、瓦斯和粉尘防治等多个因素进行综合考虑,在本系统中,针对煤矿安全管理中的通风安全监控、运输和提升、瓦斯和粉尘防治、矿井防火、井下爆破安全、矿井防冒顶、矿井防透水等7个因素进行综合分析,分析后的评价结论可以为煤矿企业的安全管理决策提供技术依据。

一种基于改进K-Means算法的煤矿安全评价系统,包括矿井安全数据输入模块、基于改进的K-Means聚类的数据分析模块、结果输出模块;矿井安全数据输入模块接收用户提交的矿井安全状态数据,基于改进的K-Means聚类的数据分析模块根据矿井安全状态数据,采用改进的K-Means聚类方法进行数据分析,结果输出模块显示数据分析的结果。

优选的,基于改进的K-Means聚类的数据分析模块采用以下方法进行聚类:

(1)数据准备:将第                                                个矿井表示为向量形式,其中分别表示矿井的通风安全监控数值、运输和提升数值、瓦斯和粉尘防治数值、矿井防火数值、井下爆破安全数值、矿井防冒顶数值、矿井防透水数值,得到N个矿井所对应的向量,将其记录为一个矿井向量空间,其中1≤iNi为自然数,N为矿井个数。

(2)对数据使用改进的K-Means算法:针对N个矿井向量使用改进的K-Means聚类算法进行聚类,步骤如下:

1)使用余弦定理计算矿井向量空间中两两之间的余弦相似度,即,确定任意两个矿井向量之间的相似度,其中1≤iN,1≤jNij均为自然数。

相似度评价标准为:两条矿井向量之间夹角的余弦值越接近于1,则这两个矿井安全评价数值的相似度越高;如果两条矿井向量之间夹角的余弦值越接近于0,则这两个矿井安全评价数值之间的相似度越低。

2)设置密度半径Eps,计算矿井向量空间中各个矿井向量的密度。其中密度半径Eps采用自适应方法产生,步骤如下:

考虑到人们期望样本的最大密度应该等于或者小于一个类中样本点的个数,用N/k得到一个类中的近似平均样本数,乘以一个系数(例如0.8或0.5),使得最大密度控制在和之间,其中k为聚类的簇数目。

赋给Eps一个初始值,然后计算矿井向量空间中各个样本的密度,如果最大密度大于,则将Eps减去一个固定值(例如0.05),如果最大密度小于,则将Eps加上一个固定值,然后再次计算各个样本的密度,直至最大密度控制在和之间时结束。此时得到的Eps值为最终的Eps值。以该Eps值为密度半径计算并记录矿井向量空间中各个矿井向量的密度。

3)找出矿井向量空间中密度最大的样本点,记为aq,并将其加入到数据集合Aq中,并将其从矿井向量空间中删除。

4)根据中各个矿井向量与向量空间U中各个矿井向量之间的相似度,将向量空间U中与中样本相似度最高的样本加入到集合中去,同时将该样本从矿井向量空间U中删除,直到中的样本个数不少于某一给定阈值,该阈值一般用β×N/k表示.其中0<β<1。

5)重复执行3)、4),并且规定,在第二次确定密度最大的样本点时,必须与第一次所确定的样本点之间相似度大于Eps,同样,在确定第三个密度最大的样本点时,必须要与前两次所确定的最大密度样本点之间相似度均大于Eps,以此类推确定其余的aq。每执行一次步骤3)和4),值加1,直至值大于k时结束,最终可得到这k个数据集合。

6)分别对各个数据集合计算其平均值,计算公式为,其中且为数据集合中的样本个数,可得这k个向量。将这k个数据作为K-Means算法的初始聚类中心。

7)以作为初始聚类中心,分配。使用余弦相似度方法计算矿井向量空间中各个矿井向量与这些聚类中心之间的相似度,确定时的,则将加入到聚类中心所标明的类簇中。

8)重新计算聚类中心。使用,其中且为数据集合中的样本个数,即将得到的每个类簇中的所有样本点的均值作为新的聚类中心。 

同时使用平方误差准则函数作为准则函数。

9)判断准则函数是否收敛,如果收敛则算法结束,否则返回7)继续执行。

最终可以得到k个类簇,即完成对矿井向量空间的聚类。在该算法中对于初始聚类中心的选取着重从高密度点处出发,并且按照一定的顺序进行选取,从而初始聚类中心的选取更为准确。

利用本发明的系统最终得到的簇,将矿井进行了重新分组,且聚类效果比普通的聚类方法更准确,能够为煤矿企业的安全生产提供更可靠的技术依据。

采用本发明的煤矿安全评价系统后,可以对煤炭企业所属矿井安全评价的打分结果进行分析,实现煤矿安全评价的全面管理,其评价结果可为煤矿企业的管理决策提供重要的技术依据。

 

附图说明

图1是基于改进的K-Means聚类的煤矿安全评价系统。

 

具体实施方式

如图1所示,在矿井安全数据输入模块中输入通风安全监控、运输和提升、瓦斯和粉尘防治、矿井防火、井下爆破安全、矿井防冒顶、矿井防透水7个影响因子, 基于改进的K-Means聚类的数据分析模块根据本发明提出的聚类方法对这些数据进行聚类分析,并在结果输出模块中输出最终分析结果。

基于改进的K-Means聚类的数据分析模块是该系统的核心部分,具体的数据处理过程如下:

(1)数据准备:将第个矿井表示为向量形式,其中分别表示矿井的通风安全监控数值、运输和提升数值、瓦斯和粉尘防治数值、矿井防火数值、井下爆破安全数值、矿井防冒顶数值、矿井防透水数值,得到N个矿井所对应的向量,将其记录为一个矿井向量空间,其中1≤iNi为自然数,N为矿井个数。

(2)对数据使用改进的K-Means算法:针对N个矿井向量使用改进的K-Means聚类算法进行聚类,步骤如下:

1)使用余弦定理计算矿井向量空间中两两之间的余弦相似度,即,确定任意两个矿井向量之间的相似度,其中1≤iN,1≤jNij均为自然数。

相似度评价标准为:两条矿井向量之间夹角的余弦值越接近于1,则这两个矿井安全评价数值的相似度越高;如果两条矿井向量之间夹角的余弦值越接近于0,则这两个矿井安全评价数值之间的相似度越低。

2)设置密度半径Eps,计算矿井向量空间中各个矿井向量的密度。其中密度半径Eps采用自适应方法产生,步骤如下:

考虑到人们期望样本的最大密度应该等于或者小于一个类中样本点的个数,用N/k得到一个类中的近似平均样本数,乘以一个系数(例如0.8或0.5),使得最大密度控制在和之间,其中k为聚类的簇数目。

赋给Eps一个初始值,然后计算矿井向量空间中各个样本的密度,如果最大密度大于,则将Eps减去一个固定值(例如0.05),如果最大密度小于,则将Eps加上一个固定值,然后再次计算各个样本的密度,直至最大密度控制在和之间时结束。此时得到的Eps值为最终的Eps值。以该Eps值为密度半径计算并记录矿井向量空间中各个矿井向量的密度。

3)找出矿井向量空间中密度最大的样本点,记为aq,并将其加入到数据集合Aq中,并将其从矿井向量空间中删除。

4)根据中各个矿井向量与向量空间U中各个矿井向量之间的相似度,将向量空间U中与中样本相似度最高的样本加入到集合中去,同时将该样本从矿井向量空间U中删除,直到中的样本个数不少于某一给定阈值,该阈值一般用β×N/k表示.其中0<β<1。

5)重复执行3)、4),并且规定,在第二次确定密度最大的样本点时,必须与第一次所确定的样本点之间相似度大于Eps,同样,在确定第三个密度最大的样本点时,必须要与前两次所确定的最大密度样本点之间相似度均大于Eps,以此类推确定其余的aq。每执行一次步骤3)和4),值加1,直至值大于k时结束,最终可得到这k个数据集合。

6)分别对各个数据集合计算其平均值,计算公式为,其中且为数据集合中的样本个数,可得这k个向量。将这k个数据作为K-Means算法的初始聚类中心。

7)以作为初始聚类中心,分配。使用余弦相似度方法计算矿井向量空间中各个矿井向量与这些聚类中心之间的相似度,确定时的,则将加入到聚类中心所标明的类簇中。

8)重新计算聚类中心。使用,其中且为数据集合中的样本个数,即将得到的每个类簇中的所有样本点的均值作为新的聚类中心。 

同时使用平方误差准则函数作为准则函数。

9)判断准则函数是否收敛,如果收敛则算法结束,否则返回7)继续执行。

最终可以得到k个类簇,即完成对矿井向量空间的聚类。在该算法中对于初始聚类中心的选取着重从高密度点处出发,并且按照一定的顺序进行选取,从而初始聚类中心的选取更为准确。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号