法律状态公告日
法律状态信息
法律状态
2017-05-31
授权
授权
2015-02-18
实质审查的生效 IPC(主分类):G06Q10/06 申请日:20140731
实质审查的生效
2015-01-21
公开
公开
技术领域
本发明涉及一种基于企业流程管理系统的组织结构信息挖掘方法,属于流程管理信息挖掘技术领域。
背景技术
随着信息化技术的发展,大多数企业都建立了自己的ERP(Enterprise Resource Planning,企业资源计划)、CRM(Customer Relationship Management,客户关系管理)、WfMS(Workflow Management System,工作流管理系统)等管理信息系统。随着业务的不断执行,系统产生了大量日志信息。这些日志都是对企业实际业务执行情况的记录,包括活动、参与者、时间、资源等。工作流挖掘就是以工作流日志信息为基础,通过分析工作流日志的数据和结构实现对工作流程的重构、监控和改进。通过数据挖掘技术分析日志记录可以再现和优化企业业务流程、辅助决策者对工作流进行监控和评价、实现业务角色和职能部门的优化配置。
目前,工作流挖掘中的大部分成果集中在从工作流日志中重构工作流的运行模型,通过将重构的工作流模型与设计阶段的模型进行对比,实现对工作流的柔性管理。相对于模型重构,面向组织结构方面的挖掘研究很大程度上被忽略了。目前,只有少数研究成果探讨工作流角色识别和工作流角色协作。如何实现工作流角色间的有效协作是面向工作流研究的核心。目前,学术界对角色关系的研究尚处于起步阶段,主要集中在社会关系网络图、角色工程等领域。Bussler等人提出了一种通用的组织元模型;Bertino等人提出了一种基于工作流运行实例的组织建模方法同时支持静态和动态的授权约束;ZurMuhlen开发 了多种组织模型并对基于组织模型的工作流设计提出了设计原则;Ly等人研究了从工作流日志中挖掘企业员工分配规则并定义了一种企业组织模型。赵卫东等人扩展了URPA(user-role-permission-act)模型,分析了基于角色块USPA(user-sub role-permission-act)的模型,在此基础上,根据RAD(role activity diagram)建模思想,提出了一种基于角色的工作流模型挖掘算法。高昂等人通过分析工作流日志中的活动执行者的信息,并引入多种距离公制用于刻画执行者之间各种关系度的强弱,提出了三种组织结挖掘方法。
其中,基于角色块的工作流模型挖掘方法,其实现步骤如下:
数据清理;
确定工作流中每个参与者的活动集;
生成元角色;
产生流程管理者;
产生流程管理者的子角色;
生成基于角色块的工作流模型;
该方法的缺点是角色的生成过程复杂,角色之间的协作关系缺少度量标准,角色关系最终表达为活动关系。
其中,基于工作流日志的组织结构挖掘方法分为两种:
第一种是基于活动相似度的挖掘方法,其实现步骤如下:
计算每一个执行者执行指定活动的频率
创建执行者活动矩阵
使用距离公制测量执行者之间的距离。其中,距离公制可以是闵可夫斯基距离、海明距离、Person相关系数中的一种
根据执行者两两之间的距离值绘制基于执行者关系的组织网络。计算得出 的两个执行者Pi和Pj的距离值则为从Pi指向Pj的弧的权值。
第二种是基于过程实例相似度的挖掘方法,过程实例相似度,简单的说就是计算两个不同的执行者同时执行相同的过程实例的频率。其实现步骤如下:
定义过程实例相似度计算函数;
计算执行者两两之间的过程实例相似度。
绘制基于执行者过程实例相似度的组织网络。计算得出的Pi和Pj的相似度值则为从Pi指向Pj的弧的权值。
两种方法的缺点是考虑的都只是执行者之间的两两关系,导致组织网络结构复杂,可理解性较弱,没有对执行者之间的协助关系进行分析,无法进行有效的角色划分和构建基于角色的组织网络。
发明内容
为解决上述技术问题,本发明提供了一种基于企业流程管理系统的组织结构信息挖掘方法,该方法包括:
步骤(1)系统中的处理单元对从存储单元发送来的日志数据进行预处理;
步骤(2)处理单元建立活动参与者依赖关系矩阵DP;
步骤(3)处理单元根据活动参与者依赖关系矩阵DP生成基于活动参与者的组织结构关系信息图,并显示在显示单元中;
步骤(4)处理单元根据存储单元发送的直接移交关系矩阵DT建立角色依赖关系矩阵RP以及根据角色依赖关系矩阵RP建立角色依赖关系信息图,并发送到显示单元进行显示。
优选的是,步骤(1)具体为:数据选择,即处理单元选择与组织结构挖掘任务相关的日志记录的数据项;数据转换,即处理单元将选择出的数据项表达为适合于挖掘的数据形式;数据清理,即处理单元过滤掉重复的工作流运行轨 迹。
另外,步骤(2)具体为:处理单元对于预处理阶段得到的工作流日志,标识出所有具有直接工作移交关系的组合,构成直接移交关系集合;求出每一组满足直接移交关系ri>rj的移交距离;确定影响因子β的值并建立直接移交关系矩阵DT;根据直接移交关系矩阵DT建立活动参与者依赖关系矩阵DP;处理单元把上述各个步骤处理后得到的结果发送到存储单元进行存储管理。
更进一步的,步骤(3)具体为:存储单元首先向处理单元发送输入参与者集合P和参与者依赖关系矩阵DP;处理单元将参与者集合按照其所参与的活动开始的先后时间进行排序n=PS(W),之后排列DP中的元素,并存入二维数组DP[n][n];判断每一个二维数组DP[n][n]的值,若(DP[i][j]≠0),则绘制一条从pi到pj得弧,并将元素DP[i][j]的值标注在弧上,最终得到多个DP[n][n]元素的组织结构关系信息图G,并发送到显示单元;显示单元输出用户组织结构关系信息图G。
更进一步的,步骤(4)具体为:处理单元确定工作流日志中每个活动的参与者,生成原角色信息;之后,处理单元合并原角色信息,形成新的角色信息;处理单元根据直接移交关系矩阵DT生成角色依赖关系矩阵RP;并根据角色依赖关系矩阵RP建立角色依赖关系信息图。
优选的是,步骤(4)中根据直接移交关系矩阵DT生成角色依赖关系矩阵RP,具体为:根据活动集计算得到一个直接移交关系集;之后对直接移交关系集中的每一个元素查找直接依赖关系矩阵DT,得到满足对应移交关系的直接依赖度DT[m][n];对求出的直接移交关系集中所有元素的直接依赖度求和,作为角色之间的依赖度,写入矩阵RP中,作为元素RP[i][j]的值。
优选的是,步骤(4)中根据角色依赖关系矩阵RP建立角色依赖关系信息图,具体为:处理单元首先接收存储单元输入的角色集,角色依赖关系矩阵RP;将 矩阵RP中的元素值存入二维数组RP[n][n],n为角色数;判断每一个二维数组RP[n][n]的值,若(DP[i][j]≠0),则绘制一条从rolei到rolej得弧,并将元素RP[i][j]的值标注在弧上,最终得到多个RP[n][n]元素的组角色依赖关系信息图G’,并发送到显示单元;显示单元显示角色依赖关系信息图G’。
附图说明
附图1是本发明方法流程图。
具体实施方式
下面结合说明书附图和具体实施方式对本发明作进一步的描述。
首先对相关的处理方法和参数进行定义:
定义1(活动,Activity)
设Task是所有任务的有限非空集合,Time为时间域。活动集合 A={a|a=(task,ts,te),task∈Task,ts∈Time,te∈Time}。其中,task表示该活动对应的任务,ts表示活动开始时间,te表示活动结束时间。元组a的三个分量分别用a.task,a.ts,a.te相应表示。
定义2(关系AP)
设Activity是所有活动的有限非空集合,Person是所有活动参与者的有限非空集合。集合R={r|r=(a,p),a∈Activity,p∈Person}。
定义3
用σ表示一个工作流执行的轨迹。|σ|=m表示该工作流轨迹中执行的活动个数。本发明假设工作流中不存在循环,则任何工作流轨迹中不存在重复活动。σ记录了工作流程一次执行中的各活动执行的先后顺序。σ=r1,r2,…rm∈R+,对于1≤i<j≤m,有ri.a.ts<rj.a.ts。另外,AS(σ)表示工作流执行轨迹中的活动集合,PS(σ)为工作流轨迹中的参与者集合,RS(σ)为工作流轨迹中的活动与参与者的二元关 系集合。表示工作流日志,表示日志W中的第i条工作流运行轨迹。
定义4(直接移交)
ri∈RS(σ)∧rj∈RS(σ)∧ri.p=pi∧rj.p=pj,对于1≤i≤j≤|σ|,ria.te<rja.ts,若 使得ri.a.te<rk.a.ts<rk.a.te<rj.a.ts成立,则称ri与参与rj存在直接移交关系,记为ri>rj。其中,ri.a为前趋活动,rj.a为后继活动,并称pi和pj是基于活动ri.a和rj.a的直接移交,记为pi(ri.a)>pj(rj.a)。
显然,
定义5(移交距离d)
若W是工作流日志,使得直接移交关系ri>rj成立,则其移交距离d=|{r|ri.a.te<r.a.ts<rj.a.ts}|,记为ri>drj。
定义6对于预处理阶段得到的工作流日志W,其对应的n阶直接移交关系矩阵为DT=(dij),n=|RS(W)|。其中,如果则dij=0;否则
定义7对于预处理阶段得到的工作流日志W,其对应的n阶活动参与者依赖关系矩阵为DP=(dij),n=|PS(W)|。其中,如果使得ri.p=pi∧rj.p=pj,则dij=0;否则dij=ΣDT[m][n],其中rm.p=pi,rn.p=pj,rm为元素DT[m][n]所对应的行向量的取值,rn为元素DT[m][n]所对应的列向量的取值。
本发明的基于企业流程管理系统的组织结构信息挖掘方法中,以存储单元中的工作流日志W作为输入,处理单元经过一系列的运算和处理得到企业的组织结构信息,并在显示单元进行显示。其中处理单元用于实现以下步骤:
步骤(1)系统中的处理单元对从存储单元发送来的日志数据进行预处理。
企业流程管理系统所生成的日志记录存在记录不完整、活动信息不明显以 及噪声等问题。所以,在进行组织结构挖掘之前处理单元需要首先对日志数据进行数据选择、数据转换和数据清理等预处理步骤,这样,在保证日志记录一致性的同时将日志信息表达为适合于挖掘的数据形式。本发明对在日志获取阶段得到的完整的日志记录进行处理,处理过程分为三个阶段:
(1.1)数据选择
处理单元选择与组织结构挖掘任务相关的日志记录的数据项。
上述日志记录的数据项通常包括活动、参与者、时间、资源等。本发明的主要目的是为了挖掘企业的组织结构信息,所以忽略日志中其它数据属性,选择“活动”、“参与者”和“时间”三个数据项作为后续挖掘过程的数据对象。
(1.2)数据转换
处理单元将选择出的数据项表达为适合于挖掘的数据形式。
首先,根据定义1将“活动”表达为一个三元组a=<task,times,timee>的形式。
其次,根据定义2将活动与参与者之间的关系表达为一个二元关系集合R,简称为关系AP。
最后,按照定义3的方法对工作流运行轨迹进行形式化,经过形式化后的工作流日志中的每一条执行轨迹可以表示为以下形式:σ(i)={<a1,p1>,<a2,p2>,…<am,pm>}={r1,r2,…,rm}。
(1.3)数据清理
处理单元过滤掉重复的工作流运行轨迹。
工作流日志中存在大量重复的工作流运行轨迹,为了减少后续挖掘过程中处理的数据量,提高挖掘的效率,将重复出现的运行轨迹过滤掉。在判断工作流运行轨迹是否重复时,利用如下方法:如果RS(σ(i))=RS(σ(j)),且σ(i)和σ(j)各活动的开始时间和结束时间有相同的序列,则认为σ(i)和σ(j)是重复的。
步骤(2)处理单元建立活动参与者依赖关系矩阵DP。
本发明通过活动参与者之间工作移交的情况来衡量参与者之间的依赖关系,工作移交分为直接移交和间接移交。由于间接移交可由直接移交传递表达,本发明只针对直接移交计算参与者的依赖关系。
(2.1)处理单元按照定义4的方法对于预处理阶段得到的工作流日志W,标识出所有具有直接工作移交关系的组合,构成直接移交关系集合TRF。
(2.2)处理单元按照定义5的方法求出每一组满足直接移交关系ri>rj的移交距离。
对于直接移交关系ri>rj,工作流日志W上将可能存在多个不同d值的移交距离,且d≥0。求出满足ri>rj的所有可能的d取值,记为D={d1,d2,…dn}。
(2.3)处理单元确定影响因子β的值。
影响因子β指的是不同移交距离d值对ri和rj之间的依赖度的影响值。如果ri和rj之间的距离等于n,那么其影响值则为βn。
(2.4)处理单元按照定义6的方法建立直接移交关系矩阵DT。矩阵中的行向量和列向量均表示活动与参与者之间的二元关系r,元素dij则为满足直接移交关系ri>drj的关联度。
(2.5)处理单元按照定义7的方法根据直接移交关系矩阵DT建立活动参与者依赖关系矩阵DP。矩阵的行向量和列向量代表活动参与者p,矩阵元素代表参与者pi和pj之间的依赖度。
处理单元把上述各个步骤处理后得到的结果发送到存储单元进行存储管理。
步骤(3)处理单元根据活动参与者依赖关系矩阵DP生成基于活动参与者的组织结构关系信息图,并显示在显示单元中。
(3.1)存储单元首先向处理单元发送输入参与者集合P和参与者依赖关系矩阵DP。
(3.2)处理单元将参与者集合按照其所参与的活动开始的先后时间进行排序n=PS(W);
(3.3)按照(3.2)的顺序排列DP中的元素,并存入二维数组DP[n][n];
(3.4)判断每一个二维数组DP[n][n]的值,若(DP[i][j]≠0),则绘制一条从pi到pj得弧,并将元素DP[i][j]的值标注在弧上,最终得到多个DP[n][n]元素的组织结构关系信息图G,并发送到显示单元。
(3.5)显示单元输出用户组织结构关系信息图G。
步骤(4)处理单元根据存储单元发送的直接移交关系矩阵DT建立角色依赖关系矩阵RP以及根据角色依赖关系矩阵RP建立角色依赖关系信息图,并发送到显示单元进行显示,方法如下:
(4.1)处理单元确定工作流日志中每个活动的参与者。
在工作流日志中一般都会记录下相关的活动信息,如活动和执行者等。提取出日志中所有执行过的活动a1,a2,…,am,以及所有的活动参与者{p1,p2,…,pk}。
(4.2)处理单元生成原角色信息。
对于活动集中的每一个活动ai(1≤i≤m),分析工作流日志,得到所有执行过该活动ai的参与者集合{p1,p2,…,pn},作为原角色信息,记为显然,集合 中的所有执行者都参与执行过活动ai。并且,同一个执行者pi可以参与执行多项活动,即出现在多个角色信息中。
(4.3)处理单元合并原角色信息,形成新的角色信息。
分析(4.2)中生成的原角色信息,找出具有相同参与者集合的原角色信息,并将这些原角色信息进行合并,方法为:
W是日志,a是活动,若
简化起见,将新形成的角色划分标记为role1,role2,…,rolek,用ARS(rolei)表示角色rolei参与执行的活动集,用PRS(rolei)表示该角色的参与者。
以上合并过程可反复执行多次,合并之后的结果是将具有相同参与者集合的角色合并在一起。即,若
(4.4)处理单元根据直接移交关系矩阵DT生成角色依赖关系矩阵RP。
角色依赖关系矩阵RP是一个n阶的矩阵,其中,n为步骤(3)中形成的角色的数目。元素RP[i][j]的值为角色rolei和rolej的依赖度。角色rolei和rolej的依赖度由以下方法求得:
(4.4.1)定义集合ARi和ARj,ARi=ARS(rolei),ARj=ARS(rolej);定义集合PRi,PRj,PRi=PRS(rolei),PRj=PRS(rolej)。
(4.4.2)定义一个直接移交关系集SUB_TRF,其元素为在角色rolei和rolej上成立的所有直接移交关系:SUB_TRF={P0(A0)>P1(A1)|P0(A0)>P1(A1)∈TRF,P0∈PRi,P1∈PRj,A0∈ARi,Ai∈ARj},其中,TRF为在工作流日志W上成立的所有直接移交关系。显然,
(4.4.3)对SUB_TRF中的每一个元素P0(A0)>P1(A1),即R0>R1,其中R0.a=A0,R0.p=P0,R1.a=A1,R1.p=P1,查找直接依赖关系矩阵DT,得到R0>R1上的直 接依赖度DT[m][n]。
(4.4.4)对第三步中求出的SUB_TRF中所有元素的直接依赖度求和,作为角色rolei和rolej的依赖度,写入矩阵RP中,作为元素RP[i][j]的值。
(4.5)处理单元根据角色依赖关系矩阵RP建立角色依赖关系信息图。
具体步骤如下:
(4.5.1)处理单元首先接收存储单元输入的角色集{role1,role2,…,rolen},角色依赖关系矩阵RP。
(4.5.2)将矩阵RP中的元素值存入二维数组RP[n][n],n为角色数;
(4.5.3)判断每一个二维数组RP[n][n]的值,若(DP[i][j]≠0),则绘制一条从rolei到rolej得弧,并将元素RP[i][j]的值标注在弧上,最终得到多个RP[n][n]元素的组角色依赖关系信息图G’,并发送到显示单元。
(4.5.4)显示单元显示角色依赖关系信息图G’。
本发明带来的有益效果有如下几个方面:
在企业流程管理系统中日志数据得到充分的利用。现有的进行企业组织结构挖掘的技术方案中,大多只使用日志中的“活动”和“参与者”两项基本信息,而忽略了“时间”信息。本发明充分利用参与者执行活动是的时间信息,挖掘执行者之间的依赖关系,提高了挖掘的准确性。
企业流程管理系统根据参与者所执行的活动的不同进行角色的划分,简化了角色划分的方法,提高了挖掘的效率。
企业流程管理系统定义了直接移交关系和直接移交关系矩阵DT,量化了每组直接移交关系间的关联度,进而为活动参与者之间以及角色之间的协助关系提供了统一的度量标准。
企业流程管理系统根据直接移交关系矩阵DT建立活动参与者依赖关系矩 阵DP和角色依赖关系矩阵RP,为基于活动参与者的组织结构关系信息图的生成和基于角色的组织结构关系信息图的生成提供了依据。
本发明所述并不限于具体实施方式所述的实施例,只要是本领域技术人员根据本发明方案得出其他的实施方式,同样属于本发明的技术创新及保护的范围。
机译: 公司根据他们为满足业务需求而实施的新IT技术解决方案定义解决方案体系结构。典型的组织以文档形式使用基于文档的解决方案体系结构,称为SAD(解决方案体系结构文档)。没有软件解决方案能够以有意义的方式轻松管理或捕获解决方案体系结构信息的元素。 SAM(解决方案架构管理器)是一种在线软件解决方案,允许公司在Web门户中开发和管理所有解决方案架构。
机译: 基于矩阵的组织环境中的组织交互式任务管理和承诺管理系统
机译: 基于训练集的企业内容管理系统中提供相关内容组织的系统和方法