首页> 中国专利> 一种对历史流程数据进行分类的方法及装置

一种对历史流程数据进行分类的方法及装置

摘要

本发明公开一种对历史流程数据进行分类的方法和装置,所述方法包括:按照节点执行顺序,从数据库中读取一条历史流程数据,包括各个节点的属性值,各个属性值具有标准长度值;依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值;将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的;经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。本发明能够自动化的对历史流程数据进行分类,分类效率更高,同时成本较低。

著录项

  • 公开/公告号CN106022374A

    专利类型发明专利

  • 公开/公告日2016-10-12

    原文格式PDF

  • 申请/专利权人 中国农业银行股份有限公司;

    申请/专利号CN201610331367.0

  • 发明设计人 王超;张德慧;张刚;时晓书;尹鑫;

    申请日2016-05-18

  • 分类号G06K9/62;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人王雪

  • 地址 100005 北京市东城区建国门内大街69号

  • 入库时间 2023-06-19 00:38:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-09

    授权

    授权

  • 2016-11-09

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20160518

    实质审查的生效

  • 2016-10-12

    公开

    公开

说明书

技术领域

本发明涉及大数据分析领域,具体涉及一种对历史流程数据进行分类的方法及装置。

背景技术

随着现代信息技术的迅猛发展,越来越多的大型企业使用信息技术进行业务流程管理。规范的使用业务流程管理,让企业人员能够基于相同的理解来描述和解释企业的各个业务流程。这有助于消除不同企业人员的理解歧义,达到对业务流程描述的明确性和一致性。

但是,随着时间的累积,企业在处理业务流程时可能已经产生了大量的历史流程数据,这些历史流程数据可能未被规范的管理。

为了实现对历史流程数据的分析管理,首先需要对历史流程数据进行分类。但是由于历史流程数据量较大,使用人工分类方式成本较高,且分类效率低。所以,目前亟需一种高效的低成本的对历史流程数据进行分类的方式。

发明内容

本发明提供了一种对历史流程数据进行分类的方法及装置,可以自动化的对历史流程数据进行分类,分类效率更高,同时成本较低。

本发明提供了一种对历史流程数据进行分类的方法,所述方法包括:

按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值;

依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;

根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值;

将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的;

经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。

优选地,所述依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整,包括:

当所述历史流程数据中任一节点的属性值的长度小于所述属性值具有的标准长度值时,在所述属性值之前补零,使得补零后的属性值的长度与所述属性值具有的标准长度值相同。

优选地,所述将所述历史流程数据的编码值转换为向量,包括:

将所述历史流程数据中的各个属性值的编码连接到前一个属性值的编码后面,得到所述历史流程数据的向量。

优选地,所述方法还包括:

获取多个已分类的历史流程数据对应的向量,并将所述分量作为训练样本;

将所述训练样本输入所述SVM分类器,对所述SVM分类器进行训练。

优选地,所述经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果,包括:

经过所述SVM分类器的处理后,获取所述历史流程数据的决策值;

根据所述决策值,确定对所述历史流程数据进行分类的结果。

本发明还提供了一种对历史流程数据进行分类的装置,所述装置包括:

读取模块,用于按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值;

调整模块,用于依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;

编码模块,用于根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值;

转换模块,用于将所述历史流程数据的编码值转换为向量;

输入模块,用于将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的;

分类模块,用于经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。

优选地,所述调整模块,包括:

补零子模块,用于当所述历史流程数据中任一节点的属性值的长度小于所述属性值具有的标准长度值时,在所述属性值之前补零,使得补零后的属性值的长度与所述属性值具有的标准长度值相同。

优选地,所述转换模块,具体用于:

将所述历史流程数据中的各个属性值的编码连接到前一个属性值的编码后面,得到所述历史流程数据的向量。

优选地,所述装置还包括:

获取模块,用于获取多个已分类的历史流程数据对应的向量,并将所述分量作为训练样本;

训练模块,用于将所述训练样本输入所述SVM分类器,对所述SVM分类器进行训练。

优选地,所述分类模块,包括:

获取子模块,用于经过所述SVM分类器的处理后,获取所述历史流程数据的决策值;

确定子模块,用于根据所述决策值,确定对所述历史流程数据进行分类的结果。

本发明提供的对历史流程数据进行分类的方法中,首先按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值。其次,依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值。然后,将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的。最终,经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。与现有技术比,本发明提供了一种自动化的对历史流程数据进行分类的方法,对历史流程数据的分类效率更高,同时成本较低。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种对历史流程数据进行分类的方法流程图;

图2为本发明实施例提供的一种对历史流程数据进行分类的举例方法流程图;

图3为本发明实施例提供的一种对历史流程数据进行分类的装置结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下进行实施例具体内容的介绍。

本发明实施例提供了一种对历史流程数据进行分类的方法,参考图1,为本发明实施例提供的一种对历史流程数据进行分类的方法流程图。所述方法具体包括:

S101:按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值。

数据库中存储系统处理业务流程产生的历史流程数据,在系统处理任一业务流程后产生一条历史流程数据,在处理该业务流程的过程中存在若干执行节点,在执行各个节点时产生的数据为该条历史流程数据中的属性值。实际操作中,按照节点执行顺序,从数据库中读取由各个属性值组成的历史流程数据,以使属于同一类的历史流程数据中的属性值的顺序相同。

本发明实施例的数据库中属于同一类的历史流程数据具有固定个数的属性值,同时,属于同一类的历史流程数据包括的属性值分别设置有标准长度值。

S102:依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整。

本发明实施例中,将读取到的历史流程数据中各个节点的属性值的长度调整为与该属性值具有的标准长度值相同。

实际应用中,如果任一属性值的长度小于自身具有的标准长度值,则按照该属性值的标准长度值,在该属性值前方补0,使得该属性值的长度与标准长度值相同。

S103:根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值。

实际操作中,在得到各个属性值的长度均与自身具有的标准长度值相同的历史流程数据后,对该历史流程数据进行编码。具体使用的编码规则可以为UTF-8编码规则,ASCII编码规则等。

S104:将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的。

本发明实施例是利用SVM分类器对历史流程数据进行分类的,由于SVM分类器的输入参数为向量,所以,将得到的历史流程数据的编码值转换为向量,并将该向量作为SVM分类器的输入。

具体的,将编码值转换为向量的方法包括:

首先获取历史流程数据的编码值,其次将该历史流程数据的各个属性值的编码连接到前一个属性值的编码后面,得到该历史流程数据的向量。

S105:经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。

在所述SVM分类器对该历史流程数据的向量进行处理后,获取该历史流程数据的决策值,根据决策值,确定对该历史流程数据进行分类的结果。具体的,获取决策值后,可以根据决策值,并利用一对多(One Versus All,OVA)方法确定对历史流程数据进行分类的结果。其中,一对多方法为现有技术,在此不再详细描述。

实际操作中,本发明实施例使用的SVM分类器是经过训练的,具体的,利用已经完成分类的历史流程数据作为训练样本,对SVM分类器进行训练。经过训练的SVM分类器中具有用于为各类历史流程数据打分的打分函数,当所述SVM分类器接收到任一历史流程数据后,所述SVM分类器中的各个打分函数分别为该历史流程数据进行打分,最终将该条历史流程数据分类为分数最高的打分函数对应的类型。

为了便于理解本发明实施例提供的对历史流程数据进行分类的方法,本发明实施例通过举例说明分类过程。参见图2,为本发明实施例提供的一种对历史流程数据进行分类的举例方法流程图。

S201:按照节点执行顺序,从数据库中读取一条历史流程数据:请病假;批准申请;感冒。该历史流程数据包括3个属性值,且将各个属性值的标准长度值均设置为5。

S202:依据标准长度值5,在该历史流程数据的各个属性值前面补零:00请病假;0批准申请;000感冒。

S203:使用UTF-8编码规则对补零后的历史流程数据进行编码:00请病假=00233;0批准申请=07898;000感冒=00022。

S204:将编码后的历史流程数据中的各个属性值的编码连接到前一个属性值的编码后面,得到所述历史流程数据的向量:G=002330789800022。

S205:将向量G作为SVM分类器的输入,经过所述SVM分类器的分类处理后,输出对所述历史流程数据进行分类的结果。

其中,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的。

总之,本发明实施例提供的对历史流程数据进行分类的方法中,首先按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值。其次,依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值。然后,将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的。最终,经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。与现有技术比,本发明实施例提供了一种自动化的对历史流程数据进行分类的方法,对历史流程数据的分类效率更高,同时成本较低。

本发明还提供了一种对历史流程数据进行分类的装置,参考图3,为本发明实施例提供的一种对历史流程数据进行分类的装置结构示意图。所述装置包括:

读取模块301,用于按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值;

调整模块302,用于依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;

编码模块303,用于根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值;

转换模块304,用于将所述历史流程数据的编码值转换为向量;

输入模块305,用于将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的;

分类模块306,用于经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。

一种优选实施方式中,所述调整模块,包括:

补零子模块,用于当所述历史流程数据中任一节点的属性值的长度小于所述属性值具有的标准长度值时,在所述属性值之前补零,使得补零后的属性值的长度与所述属性值具有的标准长度值相同。

具体的,所述转换模块,具体用于:

将所述历史流程数据中的各个属性值的编码连接到前一个属性值的编码后面,得到所述历史流程数据的向量。

所述装置还包括:

获取模块,用于获取多个已分类的历史流程数据对应的向量,并将所述分量作为训练样本;

训练模块,用于将所述训练样本输入所述SVM分类器,对所述SVM分类器进行训练。

具体的,所述分类模块,包括:

获取子模块,用于经过所述SVM分类器的处理后,获取所述历史流程数据的决策值;

确定子模块,用于根据所述决策值,确定对所述历史流程数据进行分类的结果。

本发明实施例提供的对历史流程数据进行分类的装置能够实现以下功能:按照节点执行顺序,从数据库中读取一条历史流程数据,所述历史流程数据包括各个节点的属性值,各个属性值具有标准长度值。依据各个属性值具有的标准长度值,将所述历史流程数据中各个节点的属性值的长度进行调整;根据预设的编码规则,为所述历史流程数据进行编码,得到所述历史流程数据的编码值。将所述历史流程数据的编码值转换为向量,并将所述向量作为支持向量机SVM分类器的输入,所述SVM分类器是基于已分类的历史流程数据训练样本进行训练的。经过所述SVM分类器的处理后,得到对所述历史流程数据进行分类的结果。与现有技术比,本发明实施例提供了一种自动化的对历史流程数据进行分类的装置,对历史流程数据的分类效率更高,同时成本较低。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本发明实施例所提供的一种对历史流程数据进行分类的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号