首页> 中国专利> 一种融资平台账户分类方法和系统

一种融资平台账户分类方法和系统

摘要

本发明公开了一种融资平台账户分类方法和系统,系统包括:源数据管理模块、分类模型运算模块、分类结果管理模块;同时提出一种融资平台账户分类的方法:设定账户的分类业务,采集各账户与该分类业务相关的各维度数据信息,对采集的账户数据利用Kmeans聚类算法进行分类运算,根据观察在运算过后得到的每个簇类别中数据集的特征并与实际业务中账号特点比照,对各账号进行分类定义;本发明通过系统算法实现了将账户作为辅助风险防控的一项考核项,为监管督查工作提供了技术和数据支撑;加大了对融资平台的监管力度,并有效解决了时下依靠人工核查方式带来的耗时长、效率低,不能满足科学防控的问题。

著录项

  • 公开/公告号CN113129018A

    专利类型发明专利

  • 公开/公告日2021-07-16

    原文格式PDF

  • 申请/专利权人 无锡航吴科技有限公司;

    申请/专利号CN202110536238.6

  • 发明设计人 徐衡锐;张明松;

    申请日2021-05-17

  • 分类号G06Q20/40(20120101);G06Q40/04(20120101);G06K9/62(20060101);

  • 代理机构11676 北京华际知识产权代理有限公司;

  • 代理人李帅

  • 地址 214000 江苏省无锡市新吴区震泽路17-18号无锡软件园双子座B座503室

  • 入库时间 2023-06-19 11:52:33

说明书

技术领域

本发明涉及系统软件开发技术领域,具体为一种融资平台账户分类方法和系统。

背景技术

目前,加大对融资平台的监管力度是一项迫在眉睫的任务。本着着眼细节、防患未然、多措并举的思路,将平台账户作为辅助风险防控考核项的重要内容之一正是加大对融资平台的监管力度的有效途径。面对平台账户数量众多,类型多样,银行分布广泛的实际情况,目前对于平台账号的风险防控考核仅依靠人工核查的方式来实现,这种方式耗时长、效率低,并不能很好地满足科学防控的需要。

基于上述问题,亟待提出一种融资平台账号分类方法和系统,采集包括账户周期性交易次数、资金转出次数、最近一笔交易距离今天的天数等账户相关数据信息,利用聚类算法对账户自有数据维度的探索发现账户内部的特征结构,对账号进行分类判断,找出可能存在问题的平台账户,如僵尸账户,为监管督查工作提供技术和数据支撑,实现切实有效地风险防控

发明内容

本发明的目的在于提供一种融资平台账户分类方法和系统,以解决上述背景技术中提出的问题。

为了解决上述技术问题,本发明提供如下技术方案:

一种融资平台账户分类方法,其特征在于,对采集的账户数据利用Kmeans聚类算法进行分类运算,包括以下步骤:

W100:获取账户信息包括账户各维度的数据;

W200:设定账户分类业务,即确定分类的数量P;

W300:依据设定的账户分类业务,随机选取P个账户作为初始簇中心;

W400:依据设定的账户分类业务,提取各账户与分类业务相关的维度变量;

W500:对账号各维度变量数据做标准化处理;

W600:选取其他账号,并计算每个账号到所述初始簇中心的距离,形成账号簇别;

W700:用每一簇中所有账户的中心点替代原先的中心点,计算新中心点;

W800:重复步骤W6和步骤W7,直到中心点不变或者达到预先设定的迭代次数,算法终止,得到账户的簇类别分类。

进一步的,步骤W500中的标准化处理如下:

其中,X代表该账户在某个数据维度的值,X

进一步的,步骤W600包括以下:

W610:每个账户需要与P个中心点都计算一次距离,选择距离最短的中心点作为该账号的簇别;

W620:根据距离的计算公式:

其中,x

进一步的,步骤W700根据公式:

得到新的中心点位置,其中,n代表某簇中的账户个数,

进一步的,步骤W800之后还包括:当判断某个账户的类型时,获取该账户所在的簇类别,根据该账户所在的簇类别的账户类型特征确定该账户的类型,上述过程使得最终选定的簇中心更精准、更具有代表性。

为实现上述算法本发明还提供了一种融资平台账户分类系统,其特征在于:包括源数据管理模块、分类模型运算模块、分类结果管理模块;

源数据管理模块,用于采集账户信息及其各维度数据,包括账户周期性交易次数、资金转出次数、最近一笔交易距离今天的天数,源数据管理模块支持数据库访问的方式,支持数据导入的方式;

分类模型运算模块,用于根据设定的账户分类业务,调取源数据管理模块中的账户信息,依据各账户的各维度数据进行分类运算,并显示分类模型运算的状态;

分类结果管理模块,依据分类模型运算模块的分类运算结果,对各账户进行分类,得出分类结果,并向用户展示分类结果,支持用户对分类结果进行纠正,该系统可解决目前需核查的平台账户数量庞大,各账户数据类型众多的难题,有益于科学有效的对账户进行分类排查,提高效率,为监管督查工作提供技术和数据支撑。

进一步的,分类模型运算模块包括以下单元:

参数设定单元,参数设定单元用于设定账户分类业务,确定分类的数量;

调取单元,调取单元用于获取与分类业务相关的账户信息包括账户各维度的数据;

运算单元,运算单元用于对提取的账号及其与分类业务相关的各维度特征变量利用聚类算法进行分类运算,该操作流程可实现对源数据管理模块所采集的账户信息进行科学的管理,并进行业务要求的运算过程,为实现账户分类提供参考数据;

操作单元,操作单元可显示分类模型运行的状态为成功还是失败、每一种算法模型的最近一次运行时间、对每一账户进行分类运算所调取的维度数据。

进一步的,分类结果管理模块包括以下单元:

接收单元,结果接收单元用于提取所述分类模型运算模块的分类运算结果;

展示单元,展示单元用于显示各簇族的账户分类情况,根据各簇族中账户的特征得出各个账户的分类结果;

调整单元,调整单元用于客户对所述展示单元所显示的账户状态进行纠正,修改后的状态包括休眠状态、活跃状态、僵尸状态。

该模块的建立有益于人为的对账户排查进行监督,从而加大对账户分类排查的监督效果,增加了系统的灵活性。

与现有技术相比,本发明所达到的有益效果是:本发明通过系统算法实现了将账户作为辅助风险防控的一项考核项,为监管督查工作提供了技术和数据支撑;加大了对融资平台的监管力度,并有效解决了时下依靠人工核查方式带来的耗时长、效率低,不能满足科学防控的问题,本发明提供的分类方法中很好的利用Kmeans聚类算法,在没有样本标记的前提下,通过对各个账号自身各维度数据的探索实现了对账户的分类。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是本发明一种融资平台账户分类系统的结构示意图;

图2是本发明一种融资平台账户分类方法步骤图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-2,本发明提供技术方案:

如图1所示,一种融资平台账户分类系统包括源数据管理模块、分类模型运算模块、分类结果管理模块;

源数据管理模块,用于采集账户信息及其各维度数据,包括账户周期性交易次数、资金转出次数、最近一笔交易距离今天的天数,支持数据库访问的方式,支持数据导入的方式;

分类模型运算模块,用于根据设定的账户分类业务,调取所述源数据管理模块中的账户信息,依据各账户的各维度数据进行分类运算,并显示分类模型运算的状态,该模块包括参数设定单元、调取单元、运算单元、操作单元:

参数设定单元,用于设定账户分类业务,确定分类的数量;

调取单元,用于获取与分类业务相关的账户信息包括账户各维度的数据;

运算单元,用于对提取的账号及其与所述分类业务相关的各维度特征变量利用聚类算法进行分类运算;

操作单元,用于显示分类模型运行的状态为成功还是失败、每一种算法模型的最近一次运行时间、对每一账户进行分类运算所调取的维度数据

分类结果管理模块据分类模型运算模块的分类运算结果,对各账户进行分类,得出分类结果,并向用户展示分类结果,支持用户对分类结果进行纠正,分类结果管理模块包括包括接收单元、展示单元、调整单元;

接收单元,用于提取所述分类模型运算模块的分类运算结果;

展示单元,用于显示各簇族的分类情况,根据各簇组的特征得出各个账户的分类结果;

调整单元,用于客户对展示单元所显示的账户状态进行纠正,修改后的状态包括休眠状态、活跃状态、僵尸状态;

分类模型运算模块的具体操作流程如下:

设定对账号进行僵尸账号和活跃账号的分类,根据设定的分类业务,调取所述源数据管理模块中的账户以及该账号与所述分类业务相关的各维度特征变量,调取账户的14天账户交易次数、14天账户资金转出次数、14天账户资金转入次数、30天账户交易次数、30天账户资金转出次数、30天账户资金转入次数、90天账户交易次数、90天账户资金转出次数、90天账户资金转入次数、最近一笔交易距离分析当天的间隔天数这10个维度的数据字段,对提取的账号及其与所述分类业务相关的各维度特征变量利用聚类算法进行分类运算。

分类结果管理模块的具体操作流程如下:

提取分类模型运算模块的分类运算结果,打开数据集;根据设定的分类业务对账号进行僵尸账号和活跃账号判定,得出各个账户的分类结果。

如图2所示,一种融资平台账户分类方法包括以下步骤:

W100:获取账户信息包括账户各维度的数据;

W200:设定对账号进行僵尸账号和活跃账号的分类,即确定分类的数量为P=2;

W300:依据设定的账户分类业务,随机选取2个账户作为初始簇中心,;

W400:依据设定的账户分类业务,提取各账户的14天账户交易次数、14天账户资金转出次数、14天账户资金转入次数、30天账户交易次数、30天账户资金转出次数、30天账户资金转入次数、90天账户交易次数、90天账户资金转出次数、90天账户资金转入次数、最近一笔交易距离分析当天的间隔天数这10个维度的数据字段;

W500:对账号各维度变量数据做标准化处理,根据公式:

其中,X代表该账户在某个数据维度的值,X

W600:选取其他账号,并计算每个账号到初始簇中心的距离,形成账号簇别,具体过程如下:

W610:每个账户需要与2个中心点都计算一次距离,选择距离最短的中心点作为该账号的簇别;

W620:根据距离的计算公式:

其中,x

步骤W700的具体过程如下:

根据公式:

得到新中心点,其中,n代表某簇中的账户个数,

步骤W800的过程如下:

重复步骤W600和步骤W700,直到中心点不变或者达到预先设定的迭代次数,算法终止,得出两个簇类别。

步骤W800之后还包括:当判断某个账户的类型时,获取该账户所在的簇类别,根据该账户所在的簇类别的账户类型特征确定该账户的类型。操作如下:打开原始数据集,可以看到有两个簇类别,选定的账户所在的簇类别具有以下特征:在过去14,30,90天这些历史天数中在某些字段或全部字段上统计到了交易记录,根据生活经验将其认为该簇类别属于活跃账户簇别,所选定的账户是活跃账户;在另外一个簇别中的账户在过去14,30,90天很少甚至没有交易记录,所以认定其簇类别属于僵尸账户簇别,簇别中的所有账户是僵尸账户。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号