首页> 中国专利> 识别被盗账号的方法及装置

识别被盗账号的方法及装置

摘要

本申请公开了一种识别被盗账号的方法及装置,涉及互联网领域,以解决相关技术中挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题。所述识别被盗账号的方法包括:获取满足指定策略的目标账号;将所述目标账号与预先生成的反盗号预备库中的账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号;在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。本申请用于识别被盗账号。

著录项

  • 公开/公告号CN112667706A

    专利类型发明专利

  • 公开/公告日2021-04-16

    原文格式PDF

  • 申请/专利权人 微梦创科网络科技(中国)有限公司;

    申请/专利号CN202011541662.1

  • 发明设计人 蔡薇;龙湖珺;郑啟发;宁德金;

    申请日2020-12-23

  • 分类号G06F16/2458(20190101);G06F16/33(20190101);G06F21/62(20130101);

  • 代理机构11315 北京国昊天诚知识产权代理有限公司;

  • 代理人黎雷

  • 地址 100080 北京市海淀区东北旺西路中关村软件园二期(西扩)N-1、N-2地块新浪总部科研楼2层

  • 入库时间 2023-06-19 10:38:35

说明书

技术领域

本申请涉及互联网领域,尤其涉及一种识别被盗账号的方法及装置。

背景技术

随着互联网的发展,越来越多的社交软件进入人们的生活,人们在各种社交软件上记录和分享自己的生活。然而,随着社交软件的普及,社交软件账号被盗的问题也层出不穷,很多不法分子通过盗取他人账号来发布不良广告或用于非法行为(如盗取他人账号中的资金和利用他人账号进行诈骗等)。

相关技术在识别疑似被盗账号的过程中会先验证账号的密码,并在密码正确的情况下进一步验证在一定时间内用户使用账号登录时所对应的设备信息。

但是,这种识别被盗账号的方式会导致挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出。

发明内容

本申请实施例提供一种识别被盗账号的方法及装置,能够解决挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题。为了实现上述目的,本申请实施例采用下述技术方案:

第一方面,提供了一种识别被盗账号的方法,所述方法包括:

获取满足指定策略的目标账号;

将所述目标账号与预先生成的反盗号预备库中的账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号;

在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。

第二方面,提供了一种识别被盗账号的装置,所述装置包括:

获取模块,用于获取满足指定策略的目标账号;

匹配模块,用于将所述目标账号与预先生成的反盗号预备库中的账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号;

确定模块,用于在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。

在本申请实施例中,当获取到满足指定策略的目标账号后,将所述目标账号与反盗号预备库中的疑似被盗账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号;若所述反盗号预备库中存在与所述目标账号匹配的账号,则确定所述目标账号为被盗账号。由于反盗号预备库中包括大量基于用户行为特征挖掘出的疑似被盗账号,大大扩展了疑似被盗账号的数量,因此在将目标账号与反盗号预备库中的疑似被盗账号进行匹配的过程中,可以提高目标账号的命中率,从而确定出更多的被盗账号,解决相关技术挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是本申请实施例提供的一种识别被盗账号的方法的流程图。

图2是本申请实施例提供的一种生成反盗号预备库的过程的流程图。

图3是本申请实施例提供的一种确定疑似被盗账号的方法的流程图。

图4是本申请实施例提供的另一种确定疑似被盗账号的方法的流程图。

图5是本申请实施例提供的另一种识别被盗账号的方法的流程图。

图6是本申请实施例提供的一种识别被盗账号的装置的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

针对上述如何解决现有的识别被盗账号的方法因挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题,本申请提出一种解决方案,旨在提供一种可以解决因挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题的识别被盗账号的方法。

图1是本申请实施例提供的一种识别被盗账号的方法的流程图。如图1所示,本申请实施例提供的识别被盗账号的方法可以包括:

步骤110,获取满足指定策略的目标账号。

可以理解的是,所述指定策略是用于判断用户账号可能为疑似被盗账号的基本策略。例如,满足指定策略的账号为密码验证通过的账号。所述指定策略可以为现有的识别疑似被盗账号中的部分策略,也可以是其他新设立的策略。

步骤120,将所述目标账号与预先生成的反盗号预备库中的账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号。

步骤130,在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。

本申请实施例提供的识别被盗账号的方法,由于反盗号预备库中包括大量基于用户行为特征挖掘出的疑似被盗账号,大大扩展了疑似被盗账号的数量,因此在将目标账号与反盗号预备库中的疑似被盗账号进行匹配的过程中,可以提高目标账号的命中率,从而确定出更多的被盗账号,解决相关技术挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题。

可选地,在上述步骤130中所述将所述目标账号与预先生成的反盗号预备库中的账号进行匹配之前,参照图2,本申请实施例提供的识别被盗账号的方法中的所述反盗号预备库的生成过程还可以包括以下步骤:

步骤1310,获取每一个用户的行为特征信息,所述行为特征信息包括上行操作信息和用户信息;

步骤1320,基于所述行为特征信息,确定疑似被盗账号;

步骤1330,将挖掘出的疑似被盗账号放入所述反盗号预备库中。

可选地,上述步骤1310中的上行操作信息可以包括用户发文信息、评论信息、转发信息、简介信息及点赞信息等信息中的一种或多种。所述用户信息可以包括账号信息、设备信息及位置信息等信息中的一种或多种。

可以理解的是,上述用户的上行操作信息和用户信息可以反映用户的行为特征,从所述用户的行为特征信息中可以确定所述用户的账号是否为疑似被盗账号。例如,当用户的行为特征突然发生较大改变,即与用户平时的行为特征不符,则可以判断登录该用户账号的人可能不是用户本人,即该用户的账号可能被盗。基于用户的行为特征信息得到疑似被盗账号后,将上述疑似被盗账号放入反盗号预备库。

可选地,在将上述疑似被盗账号放入反盗号预备库之前,所述反盗号预备库中可以包括基于传统方式挖掘到的疑似被盗账号的数据,还可以包括通过其他策略得到的疑似被盗账号的数据。

可选地,在本申请的一个实施例中,所述上行操作信息还可以包括用户反馈的被盗数据,步骤1310中所述获取每一个用户的行为特征信息可以包括获取社交软件上每一个用户反馈的被盗数据。相应地,步骤1320中所述基于所述行为特征信息,确定疑似被盗账号可以包括:基于所述社交软件上用户反馈的被盗数据,确定疑似被盗账号。

通过上述基于所述社交软件上用户反馈的被盗数据,确定疑似被盗账号的方法可以及时根据用户自己反馈的信息,确定出疑似被盗账号,并且由于用户自己反馈的被盗数据较为真实,因此基于用户反馈的被盗数据,确定疑似被盗账号的准确率较高。

在本申请实施例中,用户可以通过社交软件的用户简介来反馈被盗数据。当然,用户也可以直接通过社交软件的发文内容反馈被盗数据。例如,用户可发一条微博反馈账号被盗等。也就是说,在本申请实施例中,基于所述社交软件上用户反馈的被盗数据,确定疑似被盗账号可以包括:针对任一个用户:判断用户的简介内容中是否包含所述用户反馈的被盗数据;若所述用户的简介内容中包含所述用户反馈的被盗数据,则确定所述用户的账号为疑似被盗账号;若所述用户的简介内容中不包含所述用户反馈的被盗数据,则滤除所述用户的非原创发文内容;并判断所述用户的发文内容中是否包含用户反馈的被盗数据;若所述用户的发文内容中包含所述用户反馈的被盗数据,则确定所述用户的账号为疑似被盗账号。

其中,用户在简介内容和发文内容中反馈的被盗数据可以是简介内容和发文内容中包含如“被盗”、“账号被盗”和“盗号”等表示用户账号可能被盗的词语。所述发文内容可以为原创发文内容。

可以理解的是,当用户发现自己的账号被盗后,通常会通过在简介中注明自己的账号被盗,或者通过发文来告知好友自己的账号被盗。

用户的简介内容和发文内容往往可以直接地反映出用户当前想表达的信息,因此,根据用户的简介内容和原创发文内容中是否包含用户反馈的被盗数据可以快速且准确地确定该用户的账号是否为疑似被盗账号。

可选地,所述用户在发文内容中反馈的被盗数据还可以是用户在发文内容中提及到官方列表。所述提及可以是用户在社交软件上通过@(@XXX表示,向昵称为XXX的用户说,昵称为XXX的用户可以看到带有“@XXX”的发文内容)字符提及到其他账号,所述官方列表可以包括官方客服、安全中心及官方小秘书等官方管理账号。

可以理解的是,当用户发现自己账号被盗时,通常还会及时告知官方管理账号自己的账号被盗,请求官方管理账号为自己提供帮助。

图3是本申请实施例提供的一种确定疑似被盗账号的方法的流程图。如图3所示,在一可选的实施例中,上述基于所述社交软件上用户反馈的被盗数据,确定疑似被盗账号可以通过以下步骤实现:

判断用户的用户简介的内容中是否包含“被盗”;

若所述用户简介的内容中包含“被盗”,则将该用户的账号确定为疑似被盗账号;

若所述用户简介的内容中不包含“被盗”,则滤除用户的发文中的非原创发文后,判断用户的原创发文内容中是否包含“被盗”;

若用户的原创发文内容中包含“被盗”,则判断用户的原创发文内容中是否@官方列表;

若用户的原创发文内容中不包含“被盗”,则将该用户的账号丢弃;

若用户的原创发文内容中有@官方列表,则将该用户的账号确定为疑似被盗账号;

若用户的原创发文内容中没有@官方列表,则将该用户的账号丢弃。

可选地,若用户的原创发文内容中没有@官方列表,还可以进行以下步骤:

滤除用户的原创发文内容中的反向关键词A后,判断用户的原创发文内容中是否包含“微博被盗”;

若用户的原创发文内容中包含“微博被盗”且不包含反向关键词B,则判断用户的原创发文内容中是否包含“怀疑”;

若用户的原创发文内容中包含“怀疑”,则进一步判断用户的原创发文内容中是否包含“怀疑本人”或“怀疑自己”;

若用户的原创发文内容中包含“怀疑本人”或“怀疑自己”,且没有@任何人,或者@某账号且原创发文内容中包含“小号”或“新号”,则将该用户的账号确定为疑似被盗账号;

若用户的原创发文内容中不包含“怀疑”,且没有@任何人,或者@某账号且原创发文内容中包含“小号”或“新号”,则将该用户的账号确定为疑似被盗账号。

可以理解的是,上述步骤中的所述反向关键词为表示否定意义的关键词,所述反向关键词A和所述反向关键词B为表示否定意义的不同关键词。若用户的原创发文内容中包含“怀疑本人”或“怀疑自己”,且没有@任何人,则表明用户怀疑自己的账号被盗。若用户的原创发文内容中包含“怀疑本人”或“怀疑自己”,@某账号且原创发文内容中包含“小号”或“新号”,则表明用户怀疑自己的账号被盗,且用户@的账号为自己的另一个账号。

可选地,所述上行操作信息可以包括用户在单位周期内上行操作的次数,步骤1310中所述获取每一个用户的行为特征信息可以包括获取每一个用户在指定周期内的各个单位周期的上行操作的次数,所述指定周期包括至少一个单位周期。相应地,步骤1320中所述基于所述行为特征信息,确定疑似被盗账号可以包括以下步骤:

基于用户在所述指定周期内的各个单位周期内的上行操作次数,确定每一个用户的上行操作次数在所述指定周期内的变异系数,其中,所述变异系数为所述用户在所述指定周期内上行操作的次数的标准方差值与所述用户在所述指定周期内上行操作的次数的平均值之间的比值;

将所述变异系数在预设比率阈值之上的用户的账号确定为疑似被盗账号。

所述单位周期可以是半天或一天等单位周期。

所述变异系数是概率分布离散程度的一个归一化量度,在本申请实施例中,所述变异系数可以表示用户上行操作行为轨迹变化的情况。

可以理解的是,被盗的账号多被用于用于发布不良广告或用于非法行为等。盗来的账号最直接的变现方式就是贩卖出去,卖给从事各种违法犯罪活动的组织、个人。然后从事各种违法犯罪活动的组织、个人再用买来的账号,更换低俗头像,发布涉黄、涉赌、或贩卖枪支等博文和评论,传播违法有害信息,给违法网站引流进行营利。或进行恶意营销,给营销账号涨粉、转发、点赞,采用不正当手段提高博文的曝光量,牟取非法利益。

而每个用户都有自己常规的上行操作行为轨迹,轨迹的趋势也相对稳定,当然也会伴有偶发的活跃出现一波小的峰值。那么当一个账号被盗号后,用于发布不良广告或非法行为,那么行为轨迹就会异常突变。因此,对用户指定周期内上行操作的趋势变化的监控,能够及时的发现疑似被盗账号。

上述基于用户在单位周期上行操作的次数,确定疑似被盗账号的方法可以根据用户在单位周期的上行操作的次数得到用户在单位周期的上行操作次数的变异系数,从而有所述变异系数看出用户的行为轨迹是否发生异常变化,若用户的行为轨迹异常突变,则可以确定该用户的账号为疑似被盗账号。

如前文所提及,所述上行操作可以为发文操作、转发操作、评论操作及点赞操作中的一种或多种。

可选地,本申请实施例中的用户信息可以包括用户类型,所述用户类型可以包括追星用户、V用户以及活跃用户,所述追星用户为与经过官方认证的明星用户的互动次数超过预设第一门限值的社交软件用户,所述V用户为经过官方认证且拥有的粉丝数目超过预设第二门限值的社交软件用户,所述活跃用户为社交软件上的发文在多个时间周期内均连续的用户;

所述将所述变异系数在预设比率阈值之上的用户的账号确定为疑似被盗账号可以包括:

从所述变异系数在预设比率阈值之上的用户中滤除目标类型的用户,其中,所述目标类型包括追星用户、V用户以及活跃用户中的至少一种;

将所述变异系数在预设比率阈值之上的用户中经过滤除操作后剩下的用户的账号确定为疑似被盗账号。

例如,所述在多个时间周期均连续中的时间周期可以是,一天、一周以及一年中的任意一种。所述时间周期也可以是除一天、一周以及一年以外的其他时间周期,本申请实施例不限定所述时间周期的具体含义。

可以理解的是,所述追星用户、V用户以及活跃用户在社交软件上通常较为活跃,即上行操作次数较多,因而通过所述追星用户、V用户以及活跃用户的上行操作次数的变异系数来判断所述追星用户、V用户以及活跃用户是否疑似被盗的准确率较低,故将其滤除。

因此,上述从所述变异系数在预设比率阈值之上的用户中滤除目标类型的用户,将所述变异系数在预设比率阈值之上的用户中经过滤除操作后剩下的用户的账号确定为疑似被盗账号可以提高确定疑似被盗账号的准确率。

图4是本申请实施例提供的另一种确定疑似被盗账号的方法的流程图。在一可选的实施例中,如图4所示,步骤1320中基于所述行为特征信息,确定疑似被盗账号具体可以通过以下步骤实现:

步骤1321,统计每个用户每日上行操作的次数。

步骤1322,筛选出七日内上行操作次数的总和在阈值之上,且连续七日均有上行操作的用户;

步骤1323,计算上述筛选出的用户七日内上行操作次数的平均值和七日内上行操作次数的标准方差值;

步骤1324,根据所述平均值和所述标准方差值计算出用户七日内上行操作次数的变异系数;

步骤1325,筛选出所述变异系数在预设比率阈值之上的用户集合;

步骤1326,从所述变异系数在预设比率阈值之上的用户中滤除追星用户、V用户以及活跃用户中的至少一种;

步骤1327,将所述变异系数在预设比率阈值之上的用户中经过滤除操作后剩下的用户的账号确定为疑似被盗账号。

可以理解的是,账号被不法分子盗取后,不法分子通常会对该被盗账号进行大量操作,如发布大量广告等,因此上述步骤中筛选出七日内上行操作次数的总和在阈值之上,且连续七日均有上行操作的用户,即上述筛选出的用户的账号可能为疑似被盗账号。

此外,所述上行操作信息还可以包括用户在社交软件上的发文信息;步骤1310中获取每一个用户的行为特征信息可以包括获取每一个用户在社交软件上预设数目的发文内容。相应地,步骤1320中所述基于所述行为特征信息,确定疑似被盗账号可以包括:

针对任一个用户:

基于所述预设数目的发文内容,确定特殊话题,其中,所述特殊话题包括推广广告、违法内容中的至少一种,所述违法内容包括:色情内容、暴力内容以及赌博内容中的至少一种;

基于所述特殊话题,确定疑似被盗账号。

所述基于所述特殊话题,确定疑似被盗账号可以为,将用户的发文内容中的话题与所述特殊话题进行匹配,若用户的发文内容与所述特殊话题成功匹配,则将该用户的账号确定为疑似被盗账号。

通过对被盗账号的数据分析,发现当账号被盗后,盗号者会将盗来且当前状态正常的账号用于养号,即保持账号的活跃度。其养号的方式之一是发布带有相同或相似话题的内容,且话题是定期改变的。虽然话题是不断变化的,但是每天的话题固定。盗号者养号一段时间后,则会将被盗账号用于发布不良广告或用于非法行为。一旦被盗账号被用于发布不良广告或用于非法行为,发文内容中话题的变化频率就会变大。及时发现新的话题,并捕捉数据,即可识别出疑似被盗账号。

上述基于用户在社交软件上预设数目的发文内容,确定疑似被盗账号可以捕捉到用户的发文内容中的特殊话题,然后基于所述特殊话题确认出疑似被盗账号。

可选地,基于所述特殊话题,确定疑似被盗账号还可以包括以下步骤:

对用户的发文内容进行初步筛选,筛选出用户最近预设数目的发文内容中带有多条特殊话题的发文内容;

对预设时间段内筛选出的带有多条特殊话题的发文内容的特殊话题进行汇总;

通过人工在所述汇总的特殊话题中确认出,表示用户大概率被盗的被盗特殊话题;

将用户的发文内容中的话题与所述被盗特殊话题进行匹配;

若用户的发文内容中的话题与所述被盗特殊话题成功匹配;则将该用户的账号确定为疑似被盗账号。

可选地,上述步骤中的所述将用户的发文内容中的话题与所述被盗特殊话题进行匹配中的用户的发文内容可以是用户的实时发文内容,也可以是用户预设天数内的发文内容,还可以是用户的实时发文内容和用户预设天数内的发文内容。

可以理解的是,为避免在所述基于特殊话题,确定疑似被盗账号的过程中存在遗漏的情况,可以将用户的实时发文内容和用户预设天数内的发文内容均与所述被盗特殊话题进行匹配,将用户预设天数内的发文内容与所述被盗特殊话题进行匹配即是一种补救上述遗漏情况的方法。

考虑到基于多种用户行为特征挖掘出更多的疑似被盗用户,所述上行操作信息还可以包括用户在社交软件上的互动信息;步骤1310中所述获取每一个用户的行为特征信息可以包括获取每一个用户在社交软件上的互动信息,所述互动信息可以包括转发信息、评论信息和点赞信息中的至少一种。相应地,步骤1320中所述基于所述行为特征信息,确定疑似被盗账号可以包括:

针对任一个用户;

基于所述互动信息,确定互动对象账号;

确定所述互动对象账号是否具有欺诈特征;

在所述互动对象账号具有欺诈特征的情况下,确定所述用户的账号为疑似被盗账号。

可以理解的是,所述欺诈特征指的是不良广告或非法行为等特征。正常的用户是不会和具有欺诈特征的账号有任何互动行为的。所以和具有欺诈特征的账号有互动行为的账号只有两种可能,一种盗号者自己的账号,另一种就是盗号者盗来的账号。因此若某账号与具有欺诈特征的账号互动,且该账号不是盗号者自己的账号,则该账号为疑似被盗账号。

上述基于用户在社交软件上的互动信息,确定疑似被盗账号的方法可以根据用户在社交软件上的互动信息判断用户是否与盗号者账号进行互动,若用户在社交软件上与盗号者互动,则可以将该用户的账号确定为疑似被盗账号。

可选地,所述在所述互动对象账号具有欺诈特征的情况下,确定所述用户的账号为疑似被盗账号可以包括以下步骤:

确定用户与具有欺诈特征的账号之间的互动是否有时间间隔;

若用户与具有欺诈特征的账号之间的互动有时间间隔,则判断用户的历史发文内容或发文间隔时间是否具有原创特征;

若用户的历史发文内容或发文的时间间隔具有原创特征,则将该用户的账号确定为疑似被盗账号;

若用户的历史发文内容或发文间隔时间不具有原创特征,则判断是否能获取到用户的账号注册时间,

若无法获取到用户的账号注册时间,则将该用户的账号确定为疑似被盗账号;

若获取到的用户的账号注册时间小于预定年份且没有原创发文内容,则将该用户的账号确定为疑似被盗账号;

若获取到的用户的账号注册时间小于预定年份且有原创发文内容,且最近的原创发文内容的发文时间小于另一预设年份,则将该用户的账号确定为疑似被盗账号。

可以理解的是,所述时间间隔为具有欺诈特征的账号发文时间到所述用户与其进行互动的时间之间的时间间隔。若用户与具有欺诈特征的账号之间的互动没有时间间隔,则说明该用户为盗号者自己,该用户的账号为盗号者自己的小号,故可以在自己大号发文后立即通过自己的小号与大号互动。并且,通常盗号者的发文内容都是广告等内容,故都是统一的或相似的,不具备原创发文内容特征,盗号者发文的时间间隔通常也是固定的,不具备原创发文时间间隔特征。所述判断是否能获取到用户的账号注册时间是为了判断所述用户的账号是否被冻结,若无法获取用户的账号注册时间则表明用户的账号已被冻结。账号被冻结一般是指用户向官方管理账号反馈自己账号被盗后,官方管理账号将该账号冻结。所述用户的账号注册时间小于预定年份可说明该账号不是新建的小号,所述最近的原创发文内容的发文时间小于另一预设年份,可说明在该预设年份之后该账号可能被盗。

可选地,所述用户信息可以包括用户的地理位置信息、用户的认证信息、用户的发文频率;步骤1310中所述获取每一个用户的行为特征信息还可以包括获取每一个用户的上行操作信息,以及用户的地理位置信息、用户的认证信息、用户的发文频率中的至少一种。

步骤1320中基于所述行为特征信息,确定疑似被盗账号还可以包括:基于所述用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号。

可以理解的是,每个用户都具有自己特有的行为特征,当用户的行为特征改变时,该用户的账号可能被盗。例如,每个用户都有自己常用的地理位置信息,当用户的账号登录位置发生改变时,该用户的账号可能被盗;每个用户都有自己常用的登录设备,当用户的账号登录设备发生改变时,该用户的账号可能被盗。当然,也存在是同一用户在另一位置采用另一设备登录的情况,故为了保证识别疑似被盗账号的准确性,可以在所述用户的上行操作信息、所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的多个信息满足预设条件时,将该满足条件用户的账号确定为疑似被盗用户。

上述基于用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号的方法进一步丰富了确定疑似被盗账号的方法,根据用户的多种行为特征信息确定疑似被盗用户,可以挖掘到更多的疑似被盗账号。

可选地,所述基于所述用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号可以包括以下步骤:

在所述用户的简介内容或原创发文内容中包含所述用户反馈的被盗数据的情况下,获取每一个用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种;

判断所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种是否满足预设条件,所述预设条件与上述信息一一对应(如判断所述用户当前的地理位置信息与用户的常用地理位置信息是否相同);

若所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种满足对应的预设条件,则将所述用户的账号确定为疑似被盗账号。

可选地,所述常用地理位置信息可以为用户在预设天数内的常用的账号登录的地理位置信息,所述用户的认证信息可以为所述用户的身份信息或用户的等级信息等。

可选地,所述基于所述用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号可以包括以下步骤:

在所述用户的上行操作次数在所述指定周期内的变异系数在预设比率阈值之上的情况下,获取所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种;判断所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种是否满足预设条件;若所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种满足对应的预设条件,则将所述用户的账号确定为疑似被盗账号。

可选地,所述基于所述用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号可以包括以下步骤:

在所述用户的发文内容与所述特殊话题成功匹配的情况下,获取所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种;判断所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种是否满足预设条件;若所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种满足对应的预设条件,则将所述用户的账号确定为疑似被盗账号。

可选地,所述基于所述用户的上行操作信息,以及所述用户的地理位置信息、所述用户的认证信息、所述用户的发文频率中的至少一种,确定疑似被盗账号可以包括以下步骤:

在所述用户的所述互动对象账号具有所述欺诈特征的情况下,获取所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种。判断所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种是否满足预设条件;若所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种满足对应的预设条件,则将所述用户的账号确定为疑似被盗账号。

可选地,在上述获取所述用户的地理位置信息、所述用户的认证信息以及所述用户的发文频率中的至少一种之前,还可以滤除冻结用户或等级过低的用户。

根据上述针对本申请实施例的描述可看出,本申请实施例可以在确定疑似被盗账号之后,将确定的疑似被盗账号放入反盗号预备库中,并将目标账号与反盗号预备库中的账号进行匹配,在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。并且,因为本申请实施例所提供的的识别被盗账号的方法在确定疑似被盗账号时,可通过用户的多种行为特征信息确定疑似被盗账号,即上述确定疑似被盗账号的方法覆盖的范围较广,可以得到大量的疑似被盗账号,因此在将目标账号与反盗号预备库中的疑似被盗账号进行匹配的过程中,可以提高目标账号的命中率,从而确定出更多的被盗账号,解决相关技术挖掘出的疑似被盗账号的数目过低,进而造成一些疑似被盗账号仍无法挖掘出的问题。

可选地,在通过上述方法识别到疑似被盗账号后,本申请实施例中的识别被盗账号的方法还可以包括:对识别到的疑似被盗账号进行实时监控。

可以理解的是,对识别到的疑似被盗账号进行实时监控,可以通过监控得到的数据统计疑似被盗账号的特征,还可以根据监控得到的数据对本申请实施例中的识别被盗账号的方法的成果进行展示以及总结,以便后续进行改进。

图5是本申请实施例提供的另一种识别被盗账号的方法的流程图。如图5所示,本申请实施例提供的识别被盗账号的方法可以包括如下步骤:

步骤510,获取每一个用户的行为特征信息,所述行为特征信息包括上行操作信息和用户信息。

步骤520,基于所述行为特征信息,确定疑似被盗账号。

步骤530,将挖掘出的疑似被盗账号放入所述反盗号预备库中。

步骤540,获取满足指定策略的目标账号。

步骤550,将所述目标账号与预先生成的反盗号预备库中的账号进行匹配。

步骤560,在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。

可以理解的是,上述步骤520,基于用户的行为特征信息,确定疑似被盗账号的方法可以包括前面所述基于用户的多种上行操作信息和/或多种用户信息,确定疑似被盗账号的方法中的一种或多种。并且,上述基于用户的多种上行操作信息和/或多种用户信息,确定疑似被盗账号的方法均为并列关系。

本申请实施例提供的识别被盗账号的方法,可以基于用户的多种行为特征信息,如用户反馈的被盗数据、用户的上行操作次数、用户发文内容中的话题以及用户与他人在社交软件上的互动信息等,确定疑似被盗账号,并将疑似被盗账号放入反盗号预备库。当获取到满足指定策略的目标账号后,将所述目标账号与所述反盗号预备库中的账号进行匹配,若所述反盗号预备库中存在与所述目标账号匹配的账号,则确定所述目标账号为被盗账号。

由于本申请实施例提供的识别被盗账号的方法中,可以根据用户的行为特征信息确定疑似被盗账号,并且确定疑似被盗账号的条件较多,因此可以挖掘出较多的疑似被盗账号,当目标账号与反盗号预备库中的疑似被盗账号进行匹配时,可以提高目标账号的命中率,从而确定出更多的被盗账号。

与上文描述的识别被盗账号的方法相对应,本申请实施例还提供一种识别被盗账号的装置,上文描述的识别被盗账号的方法可应用于本申请实施例提供的识别被盗账号的装置。

图6是本申请实施例提供的一种识别被盗账号的装置的结构框图。如图6所示,本申请实施例提供一种识别被盗账号的装置600,包括获取模块601、匹配模块602、确定模块603。

其中,所述获取模块601用于:用于获取满足指定策略的目标账号。

所述匹配模块602,用于将所述目标账号与预先生成的反盗号预备库中的账号进行匹配,所述反盗号预备库包括基于用户行为特征挖掘出的疑似被盗账号号。

所述确定模块603,用于在所述反盗号预备库中存在与所述目标账号匹配的账号的情况下,确定所述目标账号为被盗账号。

可选地,所述获取模块601还可以用于获取每一个用户的行为特征信息,所述行为特征信息包括上行操作信息和用户信息。所述确定模块603还可以用于基于所述行为特征信息,确定疑似被盗账号,将所述疑似被盗账号放入所述反盗号预备库中。

可选地,所述上行操作信息可以包括用户反馈的被盗数据。在获取每一个用户的行为特征信息的过程中,所述获取模块601用于:获取社交软件上每一个用户反馈的被盗数据。相应地,在基于所述行为特征信息,确定疑似被盗账号的过程中,所述确定模块603用于:基于社交软件上所述用户反馈的被盗数据,确定疑似被盗账号。

可选地,在基于社交软件上所述用户反馈的被盗数据,确定疑似被盗账号的过程中,所述确定模块603用于:针对任一个用户:判断用户的简介和/或原创发文内容中是否包含所述用户反馈的被盗数据;在用户的简介和/或原创发文内容中包含用户反馈的被盗数据的情况下,确定所述用户的账号为疑似被盗账号。

可选地,所述上行操作信息可以包括用户在单位周期内上行操作的次数。在获取每一个用户的行为特征信息的过程中,所述获取模块601用于获取每一个用户在指定周期内的各个单位周期的上行操作的次数,所述指定周期包括至少一个单位周期。相应地,在基于所述行为特征信息,确定疑似被盗账号的过程中,所述确定模块603用于:基于每一个用户在所述指定周期内的各个单位周期内的上行操作次数,确定每一个用户的上行操作次数在所述指定周期内的变异系数,其中,所述变异系数为所述用户在所述指定周期内上行操作次数的标准方差值与所述用户在所述指定周期内上行操作次数的平均值之间的比值,;将所述变异系数在预设比率阈值之上的用户的账号确定为疑似被盗账号。

可选地,所述用户信息可以包括用户类型,所述用户类型包括追星用户、V用户以及活跃用户,所述追星用户为与经过官方认证的明星用户的互动次数超过预设第一门限值的社交软件用户,所述V用户为经过官方认证且拥有的粉丝数目超过预设第二门限值的社交软件用户,所述活跃用户为社交软件上的发文按年计均连续的用户。

在将所述变异系数在预设比率阈值之上的用户的账号确定为疑似被盗账号的过程中,所述确定模块603用于:从所述变异系数在预设比率阈值之上的用户中滤除目标类型的用户,其中,所述目标类型包括追星用户、V用户以及活跃用户中的至少一种;将所述变异系数在预设比率阈值之上的用户中经过滤除操作后剩下的用户的账号确定为疑似被盗账号。

可选地,所述上行操作信息可以包括用户在社交软件上的发文信息。在获取每一个用户的行为特征信息的过程中,所述获取模块601用于:获取每一个用户在社交软件上预设数目的发文内容。相应地,在基于所述行为特征信息,确定疑似被盗账号的过程中,所述确定模块603用于:针对任一个用户:基于所述预设数目的发文内容,确定特殊话题,其中,所述特殊话题包括推广广告、违法内容中的至少一种,所述违法内容包括:色情内容、暴力内容以及赌博内容中的至少一种;基于所述特殊话题,确定疑似被盗账号。

可选地,所述上行操作信息可以包括用户在社交软件上的互动信息。在获取每一个用户的行为特征信息的过程中,所述获取模块601用于:获取每一个用户在社交软件上的互动信息,所述互动信息包括转发信息、评论信息和点赞信息中的至少一种。相应地,在基于所述行为特征信息,确定疑似被盗账号的过程中,所述确定模块603用于:针对任一个用户:基于所述互动信息,确定互动对象账号;确定所述互动对象账号是否具有欺诈特征;在所述互动对象账号具有欺诈特征的情况下,确定所述用户的账号为疑似被盗账号。

可选地,所述用户信息可以包括用户的地理位置信息、用户的认证信息及用户的发文频率中的至少一种。在获取每一个用户的行为特征信息的过程中,所述获取模块601用于:获取每一个用户的上行操作信息,以及用户的地理位置信息、用户的认证信息、用户的发文频率中的至少一种。需了解的是,上文描述的识别被盗账号的方法可应用于本申请实施例提供的识别被盗账号的装置,故而这里针对识别被盗账号的装置的内容可参照上文方法部分的描述。

通过以上的实施方式的描述,本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号