公开/公告号CN112215513A
专利类型发明专利
公开/公告日2021-01-12
原文格式PDF
申请/专利权人 国网辽宁省电力有限公司营销服务中心;
申请/专利号CN202011139663.3
申请日2020-10-22
分类号G06Q10/06(20120101);G06Q40/04(20120101);G06Q50/06(20120101);G06F16/28(20190101);G06F16/2458(20190101);
代理机构11363 北京弘权知识产权代理事务所(普通合伙);
代理人逯长明;许伟群
地址 110000 辽宁省沈阳市浑南区浑南东路19甲-1号903室
入库时间 2023-06-19 09:32:16
技术领域
本申请涉及电力系统技术领域,尤其涉及一种电力系统用户行为事件的离线分析方法和系统。
背景技术
电能是当今社会应用性最广的一种能源,与人们的生活和工作都息息相关。随着电网信息化建设和移动互联网应用的快速发展,人们可以在网络中实现电力交易等行为。网上电力系统积累庞大的人群基数,而人们在使用网络时会产生大量的用户行为信息,这些用户行为信息中蕴含着大量有价值、有意义的信息,例如:用户的行为说明该用户存在信用风险。因此,从用户行为信息进行分析数据中所蕴含的价值是当前研究的一大热点。
现有的用户行为事件的分析方法一般为实时分析信息的方式,实时分析时动态采集并分析用户行为,以充分的考虑到当前用户行为的影响。然而本申请的发明人发现,现有的实时分析方法也具有一定的缺点:由于网络中的信息量过多,因此实时分析用户行为事件的时间相对较少,信息分析的程度比较浅;同时用户行为事件中会包含多种属性的信息,而实时分析的方式只能对用户行为事件进行整体分析,无法对多种属性进行并行分析。因此现有技术存在分析用户行为事件时存在准确性较差的缺点。
发明内容
本申请提供了一种电力系统用户行为事件的离线分析方法和系统,以解决现有技术在分析用户行为事件时存在准确性较差的问题。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
第一方面,本申请提供了一种电力系统用户行为事件的离线分析方法,所述方法包括:
获取电力系统中多个用户的用户行为事件;
基于预先构建的行为分析模型对所述用户行为事件进行解析处理,得到行为解析数据;
对所述行为解析数据进行关联处理,得到用户关联数据;
获取所述用户关联数据之间的关联关系;并基于所述关联关系确定用户风险行为;
基于所述风险用户行为判定风险用户;
将所述用户关联数据和所述关联关系绘制数据图谱,进行可视化显示,并将所述风险用户加入黑名单。
优选的,所述用户行为事件包括:用户注册行为、缴纳电费行为和虚假交易行为。
优选的,所述用户注册行为中的信息包括:用户注册次数、用户注册时间和用户注册内容。
优选的,所述缴纳电费行为中的信息包括:用户缴纳电费金额、用户缴纳电费时间和用户缴纳电费的设备终端。
优选的,所述虚假交易行为中的信息包括:虚假交易信息、虚假交易IP地址和虚假交易用户。
优选的,所述对所述行为解析数据进行关联处理,包括:
基于矩阵交集算法对所述行为解析数据进行关联处理。
优选的,所述获取所述用户关联数据之间的关联关系,包括:
对于用户关联数据X和Y,计算X和Y之间的支持度以及置信度;
当所述支持度大于预设的支持度阈值,且所述置信度大于预设的置信度阈值,则判定为用户关联数据X和Y是相关联的。
优选的,所述支持度的计算方法包括:
supp(X)=occur(X)/count(D)=P(X)
其中:
supp(X)为用户关联数据X的支持度;
occur(X)为用户关联数据X的发生个数,count(D)为用户关联数据的个数;
P(X)为用户关联数据X出现的概率;
所述置信度的计算方法包括:
conf(X->Y)=supp(X∪Y)/supp(X)=P(Y|X)
其中:
conf(X->Y)为置信度;
supp(X∪Y)为包含用户关联数据X与Y的支持度;
P(Y|X)为条件概率。
优选的,所述基于所述关联关系确定用户风险行为,包括:
将相关联的用户关联数据所对应的用户行为设定为用户风险行为;
所述基于所述风险用户行为判定风险用户,包括:
确定所述风险用户行为所对应的全部用户,并将所述全部用户判定为风险用户。
第二方面,本申请提供了一种电力系统用户行为事件的离线分析系统,所述系统包括:
信息获取模块,被配置为获取电力系统中多个用户的用户行为事件;
信息解析模块,被配置为基于预先构建的行为分析模型对所述用户行为事件进行解析处理,得到行为解析数据;
数据关联模块,被配置为对所述行为解析数据进行关联处理,得到用户关联数据;
风险行为获取模块,被配置为获取所述用户关联数据之间的关联关系,并基于所述关联关系确定用户风险行为;
风险用户确定模块,被配置为基于所述风险用户行为判定风险用户;
数据显示模块,被配置为将所述用户关联数据和所述关联关系绘制数据图谱,进行可视化显示,并将所述风险用户加入黑名单。
与现有技术相比,本申请的有益效果为:
本申请提供了一种电力系统用户行为事件的离线分析方法和系统,包括:获取多个用户的用户行为事件;基于预先构建的行为分析模型对用户行为事件进行解析处理,得到行为解析数据;对行为解析数据进行关联处理,得到用户关联数据,并基于用户关联数据获取多个用户之间的关联关系;基于用户关联数据和所述关联关系确定风险用户;将用户关联数据和关联关系绘制数据图谱,进行可视化显示,并将风险用户加入黑名单。本发明通过离线分析的方式分析用户行为事件,可以快速解析出用户行为事件中的多种属性信息,并进行智能分析和关系挖掘,实现对数据中多种属性的并行分析,从而识别出风险用户。进而为不同的业务场景提供识别欺诈和风险的策略,全面提高数据价值。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的电力系统用户行为事件的离线分析方法的整体流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
参见图1,为本申请实施例提供的电力系统用户行为事件的离线分析方法的整体流程图。该方法包括以下步骤:
S1、获取电力系统中多个用户的用户行为事件;
S2、基于预先构建的行为分析模型对所述用户行为事件进行解析处理,得到行为解析数据;
S3、对所述行为解析数据进行关联处理,得到用户关联数据;
S4、获取所述用户关联数据之间的关联关系;并基于所述关联关系确定用户风险行为;
S5、基于所述风险用户行为判定风险用户;
S6、将所述用户关联数据和所述关联关系绘制数据图谱,进行可视化显示,并将所述风险用户加入黑名单。
下面对各个步骤进行详细描述:
在步骤S1中,获取电力系统中多个用户的用户行为事件。
具体的,本发明实施例获取电力系统中若干个用户的各种行为对应的用户行为事件。
例如,用户行为事件包括:用户注册行为、缴纳电费行为和虚假交易行为。
其中,用户注册行为中至少包括以下信息:用户注册次数、用户注册时间和用户注册内容。
缴纳电费行为中至少包括以下信息:用户缴纳电费金额、用户缴纳电费时间和用户缴纳电费的设备终端。
虚假交易行为中至少包括以下信息:虚假交易信息、虚假交易IP地址和虚假交易用户。
在步骤S2,基于预先构建的行为分析模型对所述用户行为事件进行解析处理,得到行为解析数据。
具体的,本发明实施例中,行为分析模型是预先构建的,用于在用户注册行为的各种信息中抽取需要的数据,并用于后续的离线分析。
例如,当用户行为事件为用户注册行为时,抽取的数据可以为:用户注册次数和用户注册时间。
本发明实施例通过将用户行为事件输入到预先构建的行为分析模型中,实现对用户行为事件的解析,以得到用户行为事件中的各个属性的信息。
在步骤S3中,对所述行为解析数据进行关联处理,得到用户关联数据。
本发明实施例通过对行为解析数据进行关联处理,实现对多个属性信息的并行分析,从而可以深度挖掘信息的价值。
关联处理的方法包括:矩阵交集算法。具体的,该算法通过构造有效的数据矩阵并且通过对数据矩阵的有效裁剪,达到查找数据交集的目的。
在一个实施例中,以实际情况为例进行分析。用户行为事件为:用户注册行为。
对用户行为信息进行解析后得到的行为分析数据为:注册时间、注册IP和注册频率。
将行为分析数据进行关联处理后,得到的用户关联数据为:注册时间为凌晨;注册IP为国外IP;注册频率为一分钟十次。
在步骤S4中,包括以下步骤:
S401、获取所述用户关联数据之间的关联关系。
对于用户关联数据X和Y,计算X和Y之间的支持度以及置信度;
当所述支持度大于预设的支持度阈值,且所述置信度大于预设的置信度阈值,则判定为用户关联数据X和Y是相关联的。
其中,支持度的计算方法包括:
supp(X)=occur(X)/count(D)=P(X)
其中:
supp(X)为用户关联数据X的支持度;
occur(X)为用户关联数据X的发生个数,count(D)为用户关联数据的个数;
P(X)为用户关联数据X出现的概率。
置信度的计算方法包括:
conf(X->Y)=supp(X∪Y)/supp(X)=P(Y|X)
其中:
conf(X->Y)为置信度;
supp(X∪Y)为包含用户关联数据X与Y的支持度;
P(Y|X)为条件概率。
需要说明的是,在获取多个用户关联数据的关联关系时,每个关联关系对应的数据数量可以根据需要自行设定。可以为:设定每个关联关系包括三个用户关联数据。例如:“注册时间为凌晨、注册IP为国外IP,注册频率一分钟十次”三个用户关联数据是相关联的。
S402、基于所述关联关系确定用户风险行为。
具体的,将相关联的用户关联数据所对应的用户行为设定为用户风险行为。
例如:注册时间为凌晨、注册IP为国外IP并且注册频率一分钟十次的用户行为是用户风险行为。
在步骤S5中,基于所述风险用户行为判定风险用户。
具体的,确定风险用户行为所对应的全部用户,并将这些用户判定为风险用户。
在步骤S6中,包括以下步骤:
S601、将所述用户关联数据和所述关联关系绘制数据图谱,进行可视化显示。
具体的,本发明实施例以数据图谱的形式将用户关联数据和关联关系提供给用户,实现可视化显示,方便用户进行查询、分析和探索。
S602、将所述风险用户加入黑名单。
具体的,将所有风险用户进行统计,并制作成黑名单。本发明实施例还包括:
根据黑名单中的风险用户,制作风险策略,以提供不同业务场景的风险数据分析,基于当前风险数据分析得出有效的应对措施。
本发明实施例还提供了一种电力系统用户行为事件的离线分析系统,所述系统包括:
信息获取模块,被配置为获取电力系统中多个用户的用户行为事件;
信息解析模块,被配置为基于预先构建的行为分析模型对所述用户行为事件进行解析处理,得到行为解析数据;
数据关联模块,被配置为对所述行为解析数据进行关联处理,得到用户关联数据;
风险行为获取模块,被配置为获取所述用户关联数据之间的关联关系,并基于所述关联关系确定用户风险行为;
风险用户确定模块,被配置为基于所述风险用户行为判定风险用户;
数据显示模块,被配置为将所述用户关联数据和所述关联关系绘制数据图谱,进行可视化显示,并将所述风险用户加入黑名单。
由于以上实施方式均是在其他方式之上引用结合进行说明,不同实施例之间均具有相同的部分,本说明书中各个实施例之间相同、相似的部分互相参见即可。在此不再详细阐述。
综上所述,与现有技术相比,具备以下有益效果:
本申请实施例通过获取多个用户的用户行为事件;基于预先构建的行为分析模型对用户行为事件进行解析处理,得到行为解析数据;对行为解析数据进行关联处理,得到用户关联数据,并基于用户关联数据获取多个用户之间的关联关系;基于用户关联数据和所述关联关系确定风险用户;将用户关联数据和关联关系绘制数据图谱,进行可视化显示,并将风险用户加入黑名单。本发明通过离线分析的方式分析用户行为事件,可以快速解析出用户行为事件中的多种属性信息,并进行智能分析和关系挖掘,从而识别出风险用户。进而为不同的业务场景提供识别欺诈和风险的策略,全面提高数据价值。
需要说明的是,在本说明书中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或暗示这些实体或操作之间存在任何这种实际的关系或顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的电路结构、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种电路结构、物品或者设备所固有的要素。在没有更多限制的情况下,有语句“包括一个......”限定的要素,并不排除在包括所述要素的电路结构、物品或者设备中还存在另外的相同要素。
本领域技术人员在考虑说明书及实践这里发明的公开后,将容易想到本申请的其他实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求的内容指出。以上所述的本申请实施方式并不构成对本申请保护范围的限定。
机译: 使用Beacon离线提供事件的系统和分析方法
机译: 检测并干扰影响通信系统的事件以及其他事件,一种分析方法和设备
机译: 一种测量序列的分析方法,用于检测系统的信号特征以检测可用于系统状况的事先诊断的任何重复性行为