首页> 中国专利> 融合事故文本报告的事故根原因推荐方法及系统

融合事故文本报告的事故根原因推荐方法及系统

摘要

本发明公开了融合事故文本报告的事故根原因推荐方法及系统,其中所述方法包括:获取事故文本报告;对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;将事故的文本特征矩阵视为事故的事故隐向量;获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;对预测的评分矩阵,按照评分由高到低的顺序对指标进行排序,将排序最高的指标作为事故的根原因输出。利用推荐系统的思想解决安全指标体系评分稀疏性问题,对新发生的化工事故,根据历史数据的分析对其进行事故根原因的推荐。

著录项

  • 公开/公告号CN114818697A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 青岛科技大学;

    申请/专利号CN202210467890.1

  • 申请日2022-04-29

  • 分类号G06F40/289;G06N3/04;G06N3/08;G06K9/62;G06Q10/06;G06Q50/04;

  • 代理机构济南圣达知识产权代理有限公司;

  • 代理人黄海丽

  • 地址 266100 山东省青岛市崂山区松岭路99号

  • 入库时间 2023-06-19 16:09:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及化工安全领域的数据处理技术领域,特别是涉及融合事故文本报告的事故根原因推荐方法及系统。

背景技术

本部分的陈述仅仅是提到了与本发明相关的背景技术,并不必然构成现有技术。

化学工业是现代文明发展的基石,化学品已成为人类生产和生活不可缺少的物品,极大地改善了人们的生活质量。然而,化工企业处理和生产的化学品绝大多数属于危险化学品,由于其所具有的易燃、易爆等危险特性,决定了在生产、经营等过程中,如果相关人员管理不当,可能会造成严重的化工事故,给人们的生命财产安全和生存环境带来了极大危害。美国安全专家海因里希通过大量的事故调研得出结论“每100起事故,只有2起是难以预防的”,企业安全管理存在隐患是导致化工事故产生的根本原因,因此,加强企业安全管理,提升安全管理水平是减少化工事故发生的根本途径。

在化工事故发生后,相关部门会迅速成立化工事故调查组对发生的事故进行调查和论证,形成化工事故报告。造成事故发生的原因一般分为直接原因、间接原因和根原因,设备不良或人的不安全行为是引发事故的直接原因,间接原因则是个人因素及与工作有关的因素,而根本原因多是企业安全管理存在隐患。事故发生的直接原因和间接原因,由于涉及企业生产的各个环节错综复杂的人、物、设备、环境等复杂交互,既有共性问题又呈事故个性特点,很难全面综合分析。安全评估指标体系是企业安全生产量化评估的参考标准,该指标体系是由行业确定的可能导致事故的企业安全生产各类事故隐患的要素集合,因此,结合安全评估指标体系进行根原因分析,其一能够规范事故根原因分析,对发生事故的企业实现安全生产管理隐患的全面检测;其二也能够通过大量事故根原因统计分析,发现行业企业安全管理的共性问题,有利于给出针对性的改机措施,从而实现生产过程安全极大避免事故的发生;其三也可以汇集大量的事故根原因分析为新事故根原因分析提供智能推荐服务。因此,基于安全评估指标体系进行化工事故根原因的分析,不仅可以极大提升事故根原因分析的准确性,也能够实现新事故根原因的智能推荐,可以极大保障化工生产的安全。

基于安全评估指标体系,相关领域专家进行化工事故的根原因分析,并依据事故调查分析评判出事故成因关联的安全指标项的得分,即该指标项代表的管理要素对事故形成的重要性。大量事故的根原因评判得分构成了评分矩阵,矩阵的行代表事故,矩阵的列代表评价指标项。由于指标体系的指标项数目众多且根原因评分得分受制于专家经验,专家难以全面评判事故的所有关联评价指标要素,造成评分矩阵的数据缺失。

现有的推荐技术,多通过协同过滤思想对评分矩阵的缺失数据进行补全,然而该技术仅利用评分数据,没有利用到事故报告描述信息,存在识别准确率低且难以实现新事故推荐的冷启动问题。

发明内容

为了解决现有技术的不足,本发明提供了融合事故文本报告的事故根原因推荐方法及系统;通过利用矩阵分解算法和文本特征提取模型,结合事故文本信息,从而将专家评分相对不完整的稀疏矩阵进行分值的补充和完善,即利用推荐系统的思想解决安全指标体系评分稀疏性问题,又可以对新发生的化工事故,根据历史数据的分析对其进行新事故根原因的推荐。

第一方面,本发明提供了融合事故文本报告的事故根原因推荐方法;

融合事故文本报告的事故根原因推荐方法,包括:

获取事故文本报告;

对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;将事故的文本特征矩阵视为事故的事故隐向量;

获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;

基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;

对预测的评分矩阵,按照评分由高到低的顺序对指标进行排序,将排序最高的指标作为事故的根原因输出。

第二方面,本发明提供了融合事故文本报告的事故根原因推荐系统;

融合事故文本报告的事故根原因推荐系统,包括:

第一获取模块,其被配置为:获取事故文本报告;

特征提取模块,其被配置为:对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;将事故的文本特征矩阵视为事故的事故隐向量;

第二获取模块,其被配置为:获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;

评分模块,其被配置为:基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;

输出模块,其被配置为:对预测的评分矩阵,按照评分由高到低的顺序对指标进行排序,将排序最高的指标作为事故的根原因输出。

第三方面,本发明还提供了一种电子设备,包括:

存储器,用于非暂时性存储计算机可读指令;以及

处理器,用于运行所述计算机可读指令,

其中,所述计算机可读指令被所述处理器运行时,执行上述第一方面所述的方法。

第四方面,本发明还提供了一种存储介质,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行第一方面所述方法的指令。

第五方面,本发明还提供了一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行的时候用于实现上述第一方面所述的方法。

与现有技术相比,本发明的有益效果是:

1.本发明通过利用矩阵分解与文本特征提取模型,将化工事故报告融入化工事故原因评分表中,全面又准确识别化工事故的根本原因,且精确完成对每一个事故所关联的所有评价指标的评分,修复了评分缺失、不准确问题。

2.本发明可以在存在新的事故报告时,会根据历史数据的分析对新事故的根原因进行推荐。

3.本发明提出一种融合事故文本报告和评分信息的推荐方法,不仅可以实现事故根原因分析的评分补全而且可以实现新事故根原因的推荐。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。

图1和图2是本发明所提出的融合事故文本报告的事故根原因推荐方法的流程图;

图3是本发明所提出的文本特征提取模型的内部网络结构示意图。

具体实施方式

应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。

实施例一

本实施例提供了融合事故文本报告的事故根原因推荐方法、修复根据事故报告对事故产生原因的评分不准确问题与评分缺失问题的方法;

如图2所示,融合事故文本报告的事故根原因推荐方法,包括:

S101:获取事故文本报告;

S102:对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;将事故的文本特征矩阵视为事故的事故隐向量;

S103:获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;

S104:基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;

S105:对预测的评分矩阵,按照评分由高到低的顺序对指标进行排序,将排序最高的指标作为事故的根原因输出。

进一步地,所述文本特征提取模型,具体网络结构包括:依次连接的数据输入层、卷积层、最大池化层和线性层。网络内部结构如图3所示。

进一步地,所述数据输入层,首先将事故文本报告中的句子划分为若干个单词,其次,设

长度为n(必要时将补齐)的句子表示为:

其中,

进一步地,所述卷积层,用于实现卷积运算;卷积运算有一个滤波器filter,

特征c

c

其中,

将filter(滤波器)应用于句子中每个可能的分词窗口{x

c=[c

其中,

进一步地,所述最大池化层,用于对特征映射进行最大池化操作,并取最大值

进一步地,所述线性层,用于将特征处理得到最终的文本特征矩阵P={m

其中,

进一步地,如图1所示,所述训练后的文本特征提取模型;训练过程包括:

S1021:构建训练集;所述训练集为原始的待补全真实评分矩阵,和历史事故文本报告;

S1022:对每个历史事故文本报告,采用文本特征提取模型进行特征提取,得到每个历史事故的事故隐向量;

S1023:对历史事故的指标项隐向量进行初始化随机设置;

S1024:将每个历史事故的事故隐向量与当前历史事故的指标项隐向量进行点乘,得到预测的评分矩阵;

S1025:将预测的评分矩阵与真实评分矩阵计算损失函数值,将损失函数值进行损失反向传播,更新文本特征提取模型的模型参数;采用梯度下降法对历史事故的指标项隐向量进行优化;返回S1022,采用下一个历史事故文本报告对模型进行训练;

S1026:当迭代次数达到设定的迭代次数时,停止训练,得到训练后的文本特征提取模型、修复后的评分矩阵和最后一轮优化后的事故指标项隐向量。

基于此方案,能够同时修复历史事故报告中对事故产生原因的评分不准确问题和评分缺失问题,并可对新事故报告推荐对应的根原因。

示例性地,所述S1022:对每个历史事故文本报告,采用文本特征提取模型进行特征提取,得到每个历史事故的事故隐向量;具体包括:

为了融入事故文本信息,通过文本特征提取,将事故案例文本报告转化为文本特征矩阵P,事故案例m映射到k维隐式空间的向量为:

p

其中,p

示例性地,所述S1023:对历史事故的指标项隐向量进行初始化随机设置;包括:

假设所有事故案例m对所有评价指标项n对应的评分对(m,n)组成集合U,

q

其中,q

进一步地,所述S1024:将每个历史事故的事故隐向量与当前历史事故的指标项隐向量进行点乘,得到预测的评分矩阵;具体包括:

将评分矩阵R中的每个真实评分r

其中,p

进一步地,所述S1025:将预测的评分矩阵与真实评分矩阵计算损失函数值,将损失函数值进行损失反向传播,更新文本特征提取模型的模型参数;采用梯度下降法对历史事故的指标项隐向量进行优化;具体包括:

预测评分与真实评分之间的误差量化为

为了保证误差尽可能小,针对r

同时,为避免因评分矩阵R稀疏而导致的过拟合现象,向模型中引入了对于p

最终,将矩阵分解等价为最小值的优化问题:

其中,r

进一步地,所述S102:对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;具体包括:

当存在事故案例u,采用训练后的文本特征提取模型进行文本特征提取,将事故案例文本报告转化为文本特征矩阵P

进一步地,所述S103:获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;具体包括:

评价指标项L映射到k维隐式空间的向量q

进一步地,所述S104:基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;具体包括:

通过事故u的文本特征与第j个评价指标项的指标因子的点积

其中,p

从而得到事故根原因推荐结果。

实施例二

本实施例提供了融合事故文本报告的事故根原因推荐系统;

融合事故文本报告的事故根原因推荐系统,包括:

第一获取模块,其被配置为:获取事故文本报告;

特征提取模块,其被配置为:对事故文本报告,采用训练后的文本特征提取模型进行文本特征提取,得到事故的文本特征矩阵;将事故的文本特征矩阵视为事故的事故隐向量;

第二获取模块,其被配置为:获取事故指标项隐向量;所述事故指标项隐向量,是采用历史事故文本报告对文本特征提取模型训练的过程中得到的;

评分模块,其被配置为:基于事故的事故隐向量和事故的指标项隐向量,得到预测的评分矩阵;

输出模块,其被配置为:对预测的评分矩阵,按照评分由高到低的顺序对指标进行排序,将排序最高的指标作为事故的根原因输出。

此处需要说明的是,上述第一获取模块、特征提取模块、第二获取模块、评分模块和输出模块对应于实施例一中的步骤S101至S105,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

上述实施例中对各个实施例的描述各有侧重,某个实施例中没有详述的部分可以参见其他实施例的相关描述。

所提出的系统,可以通过其他的方式实现。例如以上所描述的系统实施例仅仅是示意性的,例如上述模块的划分,仅仅为一种逻辑功能划分,实际实现时,可以有另外的划分方式,例如多个模块可以结合或者可以集成到另外一个系统,或一些特征可以忽略,或不执行。

实施例三

本实施例还提供了一种电子设备,包括:一个或多个处理器、一个或多个存储器、以及一个或多个计算机程序;其中,处理器与存储器连接,上述一个或多个计算机程序被存储在存储器中,当电子设备运行时,该处理器执行该存储器存储的一个或多个计算机程序,以使电子设备执行上述实施例一所述的方法。

应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。

在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。

实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。

本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元及算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

实施例四

本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一所述的方法。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号