法律状态公告日
法律状态信息
法律状态
2022-08-09
授权
发明专利权授予
技术领域
本发明涉及数据处理技术领域,具体地,涉及一种基于事件日志的可配置流程挖掘方法及系统。
背景技术
目前的业务需求变化快速,企业必须不断地设计新的变体来提高其流程的适应性。在高度动态的环境中,流程设计成为一项复杂、耗时且效率低下的任务。
可配置流程通过可配置元素将一系列流程变体集成到一个统一的模型中,简化了对流程变体的管理。基于规则的可配置流程由模型和事件-条件-动作(Event,Condition,Action(ECA))规则两部分构成,实现了流程模型和配置元素(规则)的分离,使得模型更加简洁和容易理解;而且,ECA规则灵活高效,具有较强的可拓展性。
针对上述现有技术,在最近的十几年中,流程挖掘技术得到了广泛的关注。该技术从各类信息系统记录的事件日志中挖掘出一个流程模型,旨在分析流程、优化模型。尽管一些流程挖掘技术已经支持基于配置选项的可配置流程模型的创建和派生,但尚未存在可配置流程挖掘方法。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于事件日志的可配置流程挖掘方法及系统,该方法从流程的执行频率入手,将高频率的活动融入流程模型中,将执行频率低于预设值的事件转化为ECA规则,流程模型和ECA规则共同构成了一个可配置流程。
根据本发明提供的一种基于事件日志的可配置流程挖掘方法及系统,所述方案如下:
第一方面,提供了一种基于事件日志的可配置流程挖掘方法,所述方法包括:
所述可配置流程包括流程模型和ECA规则两部分,该方法包括:
从标准XES格式的事件日志中挖掘出一个流程树;
根据事件日志计算流程树中各个节点的执行频率;
对执行频率低于预设值的节点进行裁剪,并将被裁剪活动转化为ECA规则;
把裁剪后的流程树转化为普通的流程模型。
优选的,所述流程模型和ECA规则包括:
流程模型:定义流程执行的主要逻辑;
ECA规则:包括事件、条件和动作,用于修改流程模型并形成新的流程变体。
优选的,其特征在于,所述根据事件日志计算流程树中各个节点的执行频率包括:
记∣x>
对于普通活动t,其执行频率为∑
对于空活动τ,其执行频率为∑
对于顺序节点,其执行频率为该节点第一个子节点的执行频率;
对于选择节点,其执行频率为该节点所有子节点的执行频率之和;
对于并行节点,其执行频率为该节点所有子节点的执行频率的最大值,同时为每个子节点过滤掉日志中其他子节点中的活动;
对于循环节点,其执行频率为该节点的do子节点的执行频率。
优选的,所述执行频率低于预设值节点的判断方法包括:
对于选择节点,将满足式的子节点判定为执行频率低于预设值的节点;
其中,freq
对于循环节点,将满足式的redo子节点判定为执行频率低于预设值的节点;
其中,freq
优选的,所述将被裁剪活动转化为ECA规则包括:
对于事件,遍历事件日志,找出被裁剪活动发生时一定发生的事件,若不存在这样的事件,取“start”,即流程开始时的事件;
对于条件,把活动出现与否作为分类类别,以被裁剪活动之前的活动为输入,被裁剪活动为输出,构建决策树;那么,从树的根到代表被裁剪活动发生的叶子节点的路径转化为一个符号表达式,作为ECA规则的条件;
对于动作,为“添加活动”的操作。
第二方面,提供了一种基于事件日志的可配置流程挖掘系统,所述系统包括:
模块1:从标准XES格式的事件日志中挖掘出一个流程树;
模块2:根据事件日志计算流程树中各个节点的执行频率;
模块3:对执行频率低于预设值的节点进行裁剪,并将被裁剪活动转化为ECA规则;
模块4:把裁剪后的流程树转化为普通的流程模型。
优选的,所述流程模型和ECA规则包括:
流程模型:定义流程执行的主要逻辑;
ECA规则:包括事件、条件和动作,用于修改流程模型并形成新的流程变体。
优选的,所述模块2包括:
记∣x>
对于普通活动t,其执行频率为∑
对于空活动τ,其执行频率为∑
对于顺序节点,其执行频率为该节点第一个子节点的执行频率;
对于选择节点,其执行频率为该节点所有子节点的执行频率之和;
对于并行节点,其执行频率为该节点所有子节点的执行频率的最大值,同时为每个子节点过滤掉日志中其他子节点中的活动;
对于循环节点,其执行频率为该节点的do子节点的执行频率。
优选的,所述模块3中执行频率低于预设值节点的判断方法包括:
对于选择节点,将满足式的子节点判定为执行频率低于预设值的节点;
其中,freq
对于循环节点,将满足式的redo子节点判定为执行频率低于预设值的节点;
其中,freq
优选的,所述模块3中将被裁剪活动转化为ECA规则包括:
对于事件,遍历事件日志,找出被裁剪活动发生时一定发生的事件,若不存在这样的事件,取“start”,即流程开始时的事件;
对于条件,把活动出现与否作为分类类别,以被裁剪活动之前的活动为输入,被裁剪活动为输出,构建决策树;那么,从树的根到代表被裁剪活动发生的叶子节点的路径转化为一个符号表达式,作为ECA规则的条件;
对于动作,为“添加活动”的操作。
与现有技术相比,本发明具有如下的有益效果:
在保持较高的拟合度和精确度的情况下,降低了模型的复杂度,提高了模型的可理解性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的整体流程图;
图2为本发明的用例示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
本发明实施例提供了一种基于事件日志的可配置流程挖掘方法,本发明挖掘的可配置流程的特征是:由流程模型和ECA规则两部分构成,流程模型是流程变体的公共部分,定义了流程执行的主要逻辑;ECA规则起到了配置作用,可以修改流程模型的执行逻辑,是流程模型的补充。
ECA规则的语义是:当一个事件发生后,系统检测该事件,判断条件是否成立,如果条件满足,则执行相应的动作。ECA规则支持的动作包括:增加活动、删除活动、跳转活动、增加角色、修改角色、删除角色和传递消息等。
如图1所示,可配置流程挖掘方法的主要步骤为:从标准XES格式的事件日志中挖掘出一个流程树,计算该流程树中各个节点的执行频率,裁剪执行频率低于预设值节点并将其转化为ECA规则,转换裁剪后的流程树为普通的流程模型。
本发明中挖掘的可配置流程由流程模型和ECA规则两部分构成,在模型上应用不同的ECA规则,可以得到不同的流程变体。如图2所示,ECA规则1要求在活动b前添加活动e,ECA规则2要求删除活动b,应用到相同的模型上,分别生成了变体1和变体2。对于变体2,还可以继续添加新的ECA规则(ECA规则3),生成新的变体(变体3)。
挖掘的可配置流程的ECA规则可由目标、操作、位置和上下文等部分构成,它们的取值示例如下:
计算流程树节点执行频率的具体方法如下:
记∣x>
对于普通活动t,其执行频率为∑
对于空活动τ,其执行频率为∑
对于顺序节点,其执行频率为该节点第一个子节点的执行频率;
对于选择节点,其执行频率为该节点所有子节点的执行频率之和;
对于并行节点,其执行频率为该节点所有子节点的执行频率的最大值,同时为每个子节点过滤掉日志中其他子节点中的活动;
对于循环节点,其执行频率为该节点的do子节点的执行频率。
执行频率低于预设值节点的判断方法包括:
对于选择节点,将满足式的子节点判定为执行频率低于预设值的节点;
其中,freq
对于循环节点,将满足式的redo子节点判定为执行频率低于预设值的节点;
其中,freq
将被裁剪活动转化为ECA规则方法如下:
对于事件,遍历事件日志,找出被裁剪活动发生时一定发生的事件,若不存在这样的事件,取“start”,即流程开始时的事件;
对于条件,把活动出现与否作为分类类别,以被裁剪活动之前的活动为输入,被裁剪活动为输出,构建决策树;那么,从树的根到代表被裁剪活动发生的叶子节点的路径可以转化为一个符号表达式,即可作为ECA规则的条件;
对于动作,操作和目标分别为“添加”和“活动”。在×节点中,若裁剪后仅剩下唯一的分支c,该×节点将被移除,动作的位置为Xor(c);否则,动作的位置为In(×)。在
本发明实施例提供了一种基于事件日志的可配置流程挖掘方法,在保持较高的拟合度和精确度的情况下,降低了模型的复杂度,提高了模型的可理解性。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
机译: 事件日志管理服务器,事件管理系统,事件日志收集服务器,事件日志累积服务器,事件日志管理方法及其程序
机译: 网络事件日志的归档系统管理和更新方法,其中在子系统级别过滤事件日志可确保减少事件日志文件的大小以及减少网络流量
机译: 基于B树索引向量的Web日志高速搜索,大规模Web日志挖掘和Web攻击检测的方法以及基于B树的索引日志处理器