首页> 中文学位 >过程挖掘一致性检验算法研究
【6h】

过程挖掘一致性检验算法研究

代理获取

目录

第一个书签之前

摘 要

Abstract

目 录

Contents

1绪 论

1.1过程挖掘介绍

1.2一致性检验研究现状

1.3研究内容

1.4本文结构

2相关概念与方法

2.1事件日志

2.2Petri网

2.3校准

3基于Petri网模型的精确度计算方法

3.1拟合度介绍

3.2精确度自动机算法

3.3LMA算法

4基于Petri网模型的泛化度计算方法

4.1泛化度自动机算法

4.2泛化度自动机算法实例分析

4.3简洁度

5仿真实验

5.1拟合度算法分析

5.2精确度算法对比分析

5.3泛化度算法对比分析

6总结与展望

参考文献

致谢

攻读硕士期间主要成果

展开▼

摘要

随着企业的业务过程变得越来越复杂,业务过程所记录的日志数据以惊人的速度在增长,如何利用这些日志信息改进企业的业务过程,对企业来说越来越重要。过程挖掘主要分析业务过程的事件日志,根据业务过程产生的真实的事件日志发现、检测和改进系统业务过程。
  一致性检验用于检验过程模型与事件日志之间是否存在偏差,主要的度量标准有拟合度、精确度、泛化度、简洁度。精确度是度量模型精确表达日志行为程度的一种度量标准,现有精确度算法普遍存在计算结果不够准确的问题。泛化度是过程挖掘中防止过程模型出现过拟合的一种度量标准,因为计算泛化度需要考虑未知的行为,现有的泛化度算法还存在很多问题。
  针对精确度自动机算法不能充分探索偏离状态的缺点,提出日志自动机与模型自动机相结合计算精确度的LMA算法。根据过程模型中循环结构不可能无限次执行的事实,对Petri网模型的完整变迁引发序列的最大长度进行限制。由校准后完全拟合的事件日志构建日志自动机,然后根据日志自动机和Petri网模型的完整变迁引发序列构建模型自动机。偏离状态是在模型自动机中出现而在日志自动机中没有出现的状态,由偏离状态所占比率确定精确度。LMA算法没有根据事件日志重演过程模型,可以比精确度自动机算法探索更多的偏离状态,得到的精确度值更加准确。
  针对现有基于校准的泛化度算法依赖于贝叶斯分布和时间复杂度高的缺点,借鉴过程树算法根据树中结点被访问频率计算泛化度和基于校准的泛化度算法根据状态计算泛化度的思想,提出基于泛化度自动机的泛化度算法。将完全拟合的迹在过程模型上重演,根据Petri网中标识状态变化情况创建泛化度自动机,并记录状态的被访问次数和状态发生的活动集合。状态的被访问次数与状态发生的活动数之间的比越高则状态越可靠,下次再访问该状态的时候引发新的活动的可能性越小,则泛化度越高。泛化度自动计算法不依赖于任何概率分布,并且没有将每个事件单独处理,时间复杂度比其他算法要低。
  根据本文所提出的两个算法,设计了同一模型和不同结构模型的仿真实验,计算精确度、泛化度和算法所用时间,给出了与其他经典算法的对比分析,例证了算法的正确性和实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号