法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):G06Q30/02 专利申请号:2022105748028 申请日:20220525
实质审查的生效
技术领域
本发明涉及流程挖掘技术领域,尤其是指一种基于事件日志的多维度流程变体差异分析方法与系统。
背景技术
市场竞争促使企业改变传统的管理运作方式,在企业内部建立信息系统管理机制,以支持流程挖掘,帮助企业提供新的监测和改进手段,以更好的适应和满足不断变更的市场需求。
流程挖掘技术允许企业监控和优化流程。通过比较不同情况下的流程行为,如时间和其它参数,有助于确定模型和流程性能差异的原因。此外,比较两个流程的行为还有助于研究其中一个业务流程在预设特征或绩效指标等方面表现更好的原因,并提取其模式或附加信息来提高另一业务流程的表现。
流程比较有两种类型:基于模型的比较和基于日志的比较。基于模型的比较使用模型作为输入,首先通过流程发现技术从事件日志中生成模型,然后检查所有模型中存在哪些活动,或者其中一个模型中不存在哪些活动。基于模型的比较主要基于输入模型的结构,无法分析其它流程指标(如频率或时间性能),而基于日志的比较却没有这样的限制。
为了能在特定条件下可视化多个业务流程,以查找具有显著差异的流程行为和其它统计信息,潜在的改进在于创新一种通用的技术,能够在性能或频率等多维度的属性层面比较流程的行为,为后续业务过程的建模及瓶颈分析等实践过程提供指导。
发明内容
本发明的第一目的在于克服现有技术的缺点与不足,提出了一种基于事件日志的多维度流程变体差异分析方法,能够利用流程图算法对流程变体间的多维度属性进行可视化和差异分析,为后续业务流程的管理及优化奠定基础。
本发明的第二目的在于提供一种基于事件日志的多维度流程变体差异分析系统。
本发明的第一目的通过下述技术方案实现:基于事件日志的多维度流程变体差异分析方法,包括以下步骤:
1)获取标准化事件日志L1、L2,该标准化事件日志L1、L2中记载了相关的业务流程,包含轨迹、活动、事件、资源和时间戳信息;
2)以事件日志L1为输入,利用流程图算法将事件日志L1转化为能清晰展示业务流程执行路径的过程模型,具体为直接跟随图M1,其中,直接跟随图是过程模型的最简单表示;
3)添加需要与事件日志L1进行差异对比的事件日志L2,并利用流程图算法将事件日志L2转化为能清晰展示业务流程执行路径的过程模型,具体为直接跟随图M2;
4)在流程比较窗口中根据要比较和可视化的内容选择列及其对应属性,进而过滤两个事件日志L1、L2中满足条件的变体,并选择要在有向边上显示的值的类型,能够是频率或者时间性能,以生成能识别二者显著差异的活动和活动边的可视化过程模型,并显示二者的统计信息,即变体的轨迹数、实例数和平均运行时间信息;
5)将步骤4)中显示差异的可视化过程模型和完整的比较信息导出为PDF格式保存。
进一步,在步骤1)中,所有事件日志均通过4TU平台来获取。
进一步,在步骤2)中,在直接跟随图中,每个节点代表一个活动,有向边描述各种活动之间的直接跟随关系,具体步骤如下:
2.1)以事件日志L1为输入,设定流程图算法的3个参数,即τ
2.2)从事件日志L1中移除所有轨迹频率低于τ
2.3)从新的事件日志L1’中移除所有频率低于τ
2.4)为事件日志L1”中剩余的每个活动添加一个节点,并连接满足τ
2.5)输出直接跟随图M1,节点用活动频率L1”(a)表示,而有向边用有直接跟随关系的活动频率L1”(a,b)表示,节点和有向边也能够用时间信息表示。
进一步,所述步骤4)包括以下步骤:
4.1)根据要比较和可视化的内容,在流程比较窗口中有针对性的选择两个事件日志L1、L2中的列和其对应属性值来过滤生成的过程模型,并选择过滤出除所选值之外的其它值,其中,与输入的事件日志有关的列能够是时间戳、资源、实例名称或活动名称,属性值与所选列值对应;
4.2)选择要在有向边上可视化的值的类型,能够显示活动发生的频率或时间性能,生成能识别二者显著差异的活动和活动边的可视化过程模型,其中,用灰度线条标记与被比较过程模型相比的过程模型中存在的不常见活动,用有向边的粗细程度表示活动关系在事件日志中发生的频次,计算并显示两个变体的统计信息,即变体的轨迹数、实例数和平均运行时间信息。
本发明的第二目的通过下述技术方案实现:基于事件日志的多维度流程变体差异分析系统,包括:
日志获取模块,用于获取标准化事件日志,包含轨迹、活动、事件、资源和时间戳属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
流程表示模块,将日志中的活动跟随关系用基于有向图的形式来表示,即直接跟随图,其中,所述活动跟随关系依赖活动间发生的先后顺序,在有向图中用有向箭头来表示;
流程比较模块,在流程比较窗口中,根据要比较和可视化的内容选择列及对应属性来过滤满足条件的变体,并选择要在有向边上显示的值的类型,以生成能识别二者显著差异的活动和活动边的可视化过程模型,同时显示二者的统计信息;
结果导出模块,根据流程比较结果,将显示差异的可视化过程模型和完整的比较信息导出。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明通过基于日志的比较工具来可视化特定条件下的业务流程,相较于传统的方法,提供了多属性维度的视角比较,从而为业务过程管理人员提供更有利的决策依据。
2、本发明利用流程图算法对流程变体间的多维度属性进行差异分析,并利用颜色标记或有弧线厚度来突出显示差异,使用户能够快速查看两个事件日志的不同行为。
3、本发明具有强互动性,能够基于用户的使用意愿,选取事件日志中用来比较及可视化的相关值及其属性,帮助用户对流程进行精准分析。
4、本发明在不增加计算成本的情况下,能够帮助业务流程管理人员查看有用知识,为后续业务过程的建模及瓶颈分析等实践过程提供指导。
5、本发明在业务过程管理及优化任务中具有广泛的使用空间,操作简单、可扩展性强,在比较性流程挖掘方面有广阔前景。
附图说明
图1为本发明方法逻辑流程示意图。
图2为本发明变体间时间性能差异的分析对比图。
图3为本发明变体间频率差异的分析对比图。
图4为本发明系统架构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1所示,本实施例公开了一种基于事件日志的多维度流程变体差异分析方法,包括以下步骤:
1)获取标准化事件日志L1、L2,该标准化事件日志L1、L2中记载了相关的业务流程,包含轨迹、活动、事件、资源和时间戳信息;
在本步骤中,标准化事件日志L1、L2是来自道路交通罚款信息系统的真实事件日志,所选事件日志L1和事件日志L2的规模不同,事件日志L2包含了比L1更多行为。选取的事件日志详细信息如表1所示。
表1.事件日志数据集基本信息统计
2)以事件日志L1为输入,利用流程图算法将日志L1转化为能清晰展示业务流程执行路径的过程模型,具体为直接跟随图M1,其中,直接跟随图是过程模型的最简单表示,在直接跟随图中,每个节点代表一个活动,有向边描述各种活动之间的直接跟随关系,包括以下步骤:
2.1)以事件日志L1为输入,设定流程图算法的3个参数,即τ
在事件日志L1中,变体数量为10,将τ
2.2)遍历并标记事件日志L1中全部轨迹,当轨迹频率低于设定值τ
2.3)遍历步骤2.2)获得的新事件日志L1’,记录L1’中存在的事件,当事件数量低于设定值τ
2.4)遍历事件日志L1”中的剩余活动,为每个活动添加一个节点,并连接满足τ
2.5)根据步骤2.4)的结果输出直接跟随图M1;其中,节点用活动频率L1”(a)表示,而有向边用有直接跟随关系的活动频率L1”(a,b)表示,节点和有向边也可以用时间信息表示。
3)添加需要与事件日志L1进行差异比较的事件日志L2,根据步骤2)同样方法(流程图算法)将其转化为能清晰展示业务流程执行路径的过程模型,具体为直接跟随图M2。
4)在流程比较窗口中根据要比较和可视化的内容选择列及其对应属性,进而过滤两个事件日志中满足条件的变体,并选择要在有向边上显示的值的类型,可以是频率或者时间性能,以生成能识别二者显著差异的活动和活动边的可视化过程模型,并显示二者的统计信息,即变体的轨迹数、实例数和平均运行时间信息,具体步骤如下:
4.1)根据要比较和可视化的内容,在流程比较窗口中有针对性的选择两个事件日志中的列和其对应属性值来过滤生成的过程模型,并可以选择过滤出除所选值之外的其它值,其中,与输入的事件日志有关的列可以是时间戳、资源、实例名称、活动名称等信息,属性值与所选列值对应;
4.2)选择要在有向边上可视化的值的类型,可以显示活动发生的频率或时间性能,生成能识别二者显著差异的活动和活动边的可视化过程模型,其中,用红色线条标记与被比较过程模型相比的过程模型中存在的不常见活动,用有向边的粗细程度表示活动关系在事件日志中发生的频次,计算并显示两个变体的统计信息,即变体的轨迹数、实例数和平均运行时间信息。
附图2为两个事件日志间的时间性能差异分析结果,附图3为两个事件日志的频率差异分析结果,其中,灰度线条标记为变体2中存在但在变体1中不存在的活动,且有向边上数字分别表示活动发生的频次或耗费的时间,线条越粗表明活动间的直接跟随关系越频繁发生或时间越长,如变体1中创建“罚款”>>“支付”,其中,>>表示活动间的直接跟随关系。
5)根据步骤4)的可视化结果,可以将显示差异的可视化过程模型和完整的比较信息导出为PDF格式保存。
实施例2
如图4所示,本实施例公开了一种基于事件日志的多维度流程变体差异分析系统,包括以下功能模块:
日志获取模块,用于获取标准化事件日志,包含轨迹、活动、事件、资源和时间戳属性信息;其中,所述事件日志本质上是一组活动序列的有限集合,记录了业务操作的执行情况;
流程表示模块,将日志中的活动关系用直接跟随图的形式来表示,其中,活动关系为直接跟随关系,依赖活动间发生的先后顺序,在有向图中用有向箭头来表示;直接跟随图则是通过设置频率阈值来移除节点和边以生成过程模型,从而达到流程简化的目的;
流程比较模块,在流程比较窗口中,根据要可视化和比较的内容选择列及对应属性来过滤满足条件的变体,并选择要在有向边上显示的值的类型(如频率或时间性能),以生成能识别二者显著差异的活动和活动边的可视化过程模型,其中,用灰度线条标记与被比较过程模型相比的过程模型中存在的不常见活动,用有向边的粗细程度表示活动关系在事件日志中发生的频次,同时显示二者的统计信息,如变体的轨迹数、实例数和平均运行时间信息;
结果导出模块,根据流程比较结果,将显示差异的可视化过程模型和完整的比较信息导出保存。
综上所述,在采用以上方案后,本发明提出了一种基于事件日志的多维度流程变体差异分析方法与系统,以事件日志为输入,通过在比较窗口中选择相关信息和对应属性来直观显示不同变体之间发生显著差异的行为,能够帮助业务流程管理人员查看有用知识,从而为后续业务过程的建模及瓶颈分析等实践过程提供指导,具有实际推广价值,值得推广。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其它的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
机译: 日志消息分析和基于机器学习的系统和方法,用于预测计算机软件流程故障
机译: 基于事件轨迹之间差异的计算机系统行为分析系统和方法
机译: 在分布式日志分析系统中对日志/事件消息进行采样的方法和系统