首页> 中国专利> 社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截系统

社交网络拓扑模型及构建方法、用户置信度和亲密度计算方法及电信诈骗智能拦截系统

摘要

本发明公开了一种社交网络拓扑模型,包括该拓扑模型是以每个目标用户为中心构建的三层二阶星状结构,包含一层节点、二层节点和三层节点;一层节点是目标用户,二层节点是直接被叫用户,三层节点由每个二层节点产生的邻居节点模块化获得;社交网络拓扑模型节点值是户置信度,社交网络拓扑模型边权值是用户间亲密度。本发明还公开了所述社交网络拓扑模型的构建方法以及一种用户置信度和亲密度计算方法和一种电信诈骗智能拦截系统。本发明的社交网络拓扑模型不会随时间推移无限增加数据量。本发明要电信诈骗智能拦截系统以用户历史数据为基础,能避免系统数据量随时间推移无限增加,能精准识别原有和新增诈骗用户。

著录项

  • 公开/公告号CN111917574B

    专利类型发明专利

  • 公开/公告日2023.06.20

    原文格式PDF

  • 申请/专利号CN202010702998.5

  • 发明设计人 陆炜;魏玮;瞿亚蝶;杨浩波;戴浩;

    申请日2020.07.21

  • 分类号H04L41/14(2022.01);H04L41/12(2022.01);H04L9/40(2022.01);H04W12/12(2021.01);H04W12/80(2021.01);

  • 代理机构上海浦一知识产权代理有限公司 31211;

  • 代理人焦天雷

  • 地址 200120 上海市浦东新区福山路380号

  • 入库时间 2023-07-07 01:38:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-20

    授权

    发明专利权授予

说明书

技术领域

本发明涉及电信领域,特别是涉及一种基于电信通话记录的社交网络拓扑模型。本发明还涉及一种所述社交网络拓扑模型的构建方法,还涉及一种利用所述社交网络拓扑模型的用户置信度迭代更新子系统,以及一种具有用户置信度迭代更新子系统的电信诈骗智能拦截系统。

背景技术

随着社会的不断发展、科学技术的更新和互联网技术的广泛应用,电信诈骗已成为目前最常见的诈骗手段之一,引起了社会各方的广泛重视。目前,各运营商正积极地研究各种方法来应对电信诈骗问题,以减少经济损失。目前电信运营商的一种电信诈骗识别方案是通过涉诈号码存在区域聚集,通过对用户号码群体进行分类,对有嫌疑的号码进行重点追踪,分析其行为。这种方法的优点是在一定程度上提高了预测诈骗号码的精确度,减少了对正常用户的误判。缺点在于对可疑号码的追踪过程需要耗费较大的人力和财力,难以应对用户基数很大的情况。

除此之外,很多企业利用手机管家等应用,基于已标记的诈骗号码做出判断。虽然可以使用户共享诈骗号码标记,但这种方法依托于大量的公共诈骗号码的数据,此类安全软件后台数据库更新不及时,就很可能出现诈骗号码未被标记的情况,对用户形成安全隐患。诈骗团伙的技术手段越来越先进,高技术的诈骗团伙可以不断的生成的新的诈骗号码和新的归属地,这无疑会给此类通过电话号码标记的技术带来巨大的挑战。

随着深度学习的快速发展,出现了一种新的电信诈骗识别方法,这种方法提取用户每天的通话,如通话时间、通话次数、通话地点等等。利用深度学习技术对这些通话数据进行挖掘分析,判断用户是否为诈骗用户。这种技术的优势在于可以根据用户的行为表现灵活地检测诈骗用户,缺点在于没有考虑到用户间长期的社交关系及用户历史行为的信任度,在普通用户数量远远超过诈骗用户的情况下,模型的表现会受到较大局限。

中国专利(CN201710721594.9)公开了一种基于深度学习的电信诈骗识别与防御系统,其存在的技术缺陷是:现有的电信诈骗识别系统利用了语音识别技术检测通话内容中的异常信息,这种方式需要手机安装指定的App,该App会对用户的所有通话内容进行录音并且转成文字后上传到服务器。在手机安装App的做法有一定的操作门槛,而且对用户通话录音并识别成文字上传到服务器的方式在一定程度上侵犯了用户的隐私。在诈骗识别的技术上,只考虑了当前通话中的文字内容信息,没有综合考虑呼叫号码历史行为、与被叫号码的亲密度关系等,因此可能会造成误判。

中国专利(CN201910110374.1)公开了一种通信诈骗识别方法及系统,其存在的技术缺陷是:现有的诈骗用户识别技术以用户通话频率、终端位置和被叫方是否属于易诈骗群体为依据,识别通话主叫方是否为通信诈骗。这种识别技术局限性比较大,在判断通话频率方面仅用了事先规定好的阈值进行筛选,不能合理区分诈骗用户、骚扰用户以及通话量较大的普通用户。在终端位置方面,易受新型诈骗手段的影响,若诈骗用户通话地难以和普通用户区分,则无法筛选出诈骗用户。在判断被叫号码是否属于易诈骗群体方面,对于运营商无法掌握基本信息的被叫用户无法进行判断,实用性不强,影响诈骗用户预测。

中国专利(CN201610872103.6)公开了一种用于预防电信诈骗的装置和方法,其存在的技术缺陷是:现有的预防电信诈骗的方法的实现基于对收到的语音及文字信息的分析,需针对每个话单的具体通话内容进行训练和分析。这种方法需要对每条通话记录的内容进行详细的分析,运算量非常大,不适用于处理海量的通话数据。除此之外,目前出于对用户隐私的保护,很难获取用户通话的具体内容或者用户间发送信息的内容,因此在实际应用过程中,有较大局限性。

中国专利(CN201710211148.3)公开了一种基于大数据和机器学习的防范电信诈骗系统及方法,其存在的技术缺陷是:现有的基于大数据和机器学习的防范电信诈骗系统过度依赖移动端的举报,某个诈骗用户被多人举报往往意味着其已经通过诈骗行为获取了不法收益,此时将号码停机、进行诈骗阻隔已经无法挽回产生的经济损失。除此之外,依赖机器学习模型分别对文本、语言及行为进行统计分析,在要处理海量数据的情况下,会存在数据处理所需时间过长的问题。

发明内容

在发明内容部分中引入了一系列简化形式的概念,该简化形式的概念均为本领域现有技术简化,这将在具体实施方式部分中进一步详细说明。本发明的发明内容部分并不意味着要试图限定出所要求保护的技术方案的关键和必要技术,更不意味着试图确定所要求保护的技术方案的保护范围。

本发明要解决的第一个技术问题是提供一种用于电信网络,用户社交网络拓扑模型和用户数据量不会随时间推移无限增加的社交网络拓扑模型。

本发明要解决的第二个技术问题是提供一种用于电信网络,用户社交网络拓扑模型和用户数据量不会随时间推移无限增加的社交网络拓扑模型的构建方法。

本发明要解决的第三个技术问题是提供一种用于所述社交网络拓扑模型的用户置信度计算方法。

本发明要解决的第四个技术问题是提供一种用于所述社交网络拓扑模型的用户间亲密度计算方法。

本发明要解决的第五个技术问题是提供一种以用户历史数据为基础,能避免系统数据量随时间推移无限增加,能精准识别原有和新增诈骗用户(黑名单用户)的电信诈骗智能拦截系统。

为解决上述技术问题,本发明提供用于电信网络的社交网络拓扑模型,包括:

该拓扑模型是以每个目标用户为中心构建的三层二阶星状图结构,包含一层节点、二层节点和三层节点;

一层节点是目标用户,二层节点是直接被叫用户,三层节点由每个二层节点产生的邻居节点模块化获得,节点可以包含用户的信息;

其中,两节点之间的边是用户之间的通话行为,边可以包含通信行为的信息,社交网络拓扑模型节点值是户置信度,社交网络拓扑模型边权值是用户间亲密度。

本发明提供一种所述社交网络拓扑模型的构建方法,包括以下步骤:

S1,节点定义,选取目标用户为一层节点,将目标用户的直接被叫用户作为二层节点,查询二层节点的直接被叫用户产生二层节点,查询二层节点的直接被叫用户产生三层节点;

S2,正常用户节点选取,选取第一预设周期通信数据,从每天通信数据中随机选取固定数量的用户,构建选取用户的初始社交网络拓扑模型;

如果某用户的被叫用户大于第一阈值,则认为该用户是非正常用户,停止构建初始社交网络拓扑模型;

以相同方式查询各选取用户初始社交网络拓扑模型中二层节点和二层节点,并删除二层节点和二层节点中的非正常用户;

用户筛选是将通话数据异常的用户筛选出去,筛选出去用户不生成社交拓扑图,如果某个非诈骗用户的被叫用户超过第一阈值,此用户很可能是通话过于频繁的潜在骚扰用户,不能作为典型的普通用户样本进行训练。保留正常用户是指保留通话数据无异常的普通用户作为训练样本。

S3,诈骗用户节点选取,选取第一预设周期通信数据,以诈骗用户为中心,建立各诈骗用户的初始社交网络拓扑模型;

如果某诈骗用户呼叫次数小于第二阈值,则认为该用户是非诈骗用户,停止构建初始社交网络拓扑模型;

以相同方式查询各诈骗用户初始社交网络拓扑模型中二层节点和二层节点,并删除二层节点和二层节点的非诈骗用户;

利用第二阈值对用户进行了筛选。若诈骗用户的呼叫次数小于第二阈值,那么可以认为此用户的行为没有具备诈骗用户的典型特征,将没有具备诈骗用户的典型特征用户筛选出去是为了获得更有代表性的训练样本。

S4,保留所有的二层节点,删除冗余的二层节点和三层节点:如果节点只有一条边,则该节点是稀疏的;

S5,对每个二层节点产生的邻居节点模块化形成三层节点。

可选择的,第一预设周期范围为20天-40天,优选为35天,第一阈值范围为300次-600次,优选为500次,第二阈值范围为5次-20次,优选为10次。

本发明提供一种用于所述社交网络拓扑模型的用户间亲密度计算方法,包括以下步骤:

S6,获取目标用户通话关系,目标用户通话关系是根据目标用户长期的通话行为提取的数据,包括:通话次数和通话时长;

S7,若目标用户通话关系存在较强关联性,则筛选出单向通话后执行单向通话重要性分析;若目标用户通话关系不存在较强关联性,则直接执行单向通话重要性分析;

其中,计算用户通话关系的皮尔逊系数,若获得的皮尔逊系数大于第一预设皮尔逊系数阈值则判断目标用户通话关系存在较强关联性;

单向通话重要性分析对象是用户间的单向通话关系,使用lgb模型输出单向通话关系重要性系数;

S8,将单向通话关系重要性系数作为单向通话权重,加权求和计算获得单向亲密度;

S9,若用户间存在双向通话,则指定亲密度差值衰减系数,将两个单向的亲密度合并为用户间的双向亲密度;

单向亲密度S合并为双向亲密度D公式如下

用户x和用户y的双向亲密度D:

D=a

其中:T是x、y用户通话天数跨度,S(x,y)是xy方向的单向通话亲密度,S(y,x)是yx方向的单向通话亲密度,α是加权系数。

若用户间不存在双向通话,则用户间亲密度的取值直接映射为低于第四阈值的双向亲密度。

本发明提供一种用于所述社交网络拓扑模型的用户置信度计算方法,包括以下步骤:

S10,获取目标用户固有属性和目标用户双向亲密度,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

S11,若目标用户固有属性存在相关性较强,则筛选固有属性后计算目标用户固有属性权重;若目标用户固有属性不存在相关性较强,则直接计算目标用户固有属性权重;通过目标用户固有属性权重计算目标用户固有置信度;

其中,计算目标用户固有属性的皮尔逊系数获得,若计算得到的皮尔逊系数大于第二预设皮尔逊系数阈值则判断目标用户固有属性存在较强关联性;

使用lgb模型输出的目标用户固有属性重要性系数,将目标用户固有属性重要性系数作为目标用户固有属性权重,加权求和计算出目标用户固有置信度;

S12,若被叫用户具有固有属性,则计算被叫用户固有置信度,根据被叫用户固有置信度计算被叫用户固有属性权重;若被叫用户不具有固有属性,则被叫用户固有属性权重均分;通过用户固有属性权重计算目标用户通话置信度;

通过整合目标用户及其所有被叫用户间的双向亲密度,计算出目标用户的通话置信度。由于目标用户与它的每个被叫用户都计算出了双向亲密度,把所有的双向亲密度值合并就涉及到了权重的分配。被叫用户分为了两种:第一种是曾作为主叫有过外呼行为的用户,这部分用户可以获取他们的固有属性特征;第二种是只作为被叫出现的用户,这些用户是没有固有属性特征的,因为固有属性特征的计算结果只包含有过外呼行为的用户。所以在合并双向亲密度值的时候,需要先判断被叫用户是否有固有属性特征,若有固有属性特征,则可以根据用户固有置信度的值分配权重,用户固有置信度越高分配到的权重就越高。对于没有固有属性特征的用户,就无法根据特征计算固有置信度,只能平均分配权重。最后对所有的双向亲密度进行加权求和得到目标用户的通话置信度。

目标用户双向亲密度D是由用户两个方向的单向亲密度计算得出的,两个用户间的双向亲密度越高,代表他们的联系越紧密,由于诈骗用户的通话行为通常是单向的,因此诈骗用户与其他用户的双向亲密度较低,双向亲密度的计算对诈骗用户的识别有着很大的作用。

S13,将目标用户固有置信度和目标用户通话置信度通过加权求和计算获得目标用户置信度。

本发明提供一种具有所述社交网络拓扑模型的电信诈骗智能拦截系统,包括:

实时智能拦截决策与拦截控制系统,其用于存储用户黑名单和用户灰名单,将目标用户的用户灰名单和新用户的第二预设周期全量日志分别提供给基础评价子系统和用户置信度迭代更新子系统,接收用户置信度迭代更新子系统的黑名单用户和灰名单用户筛选结果,将黑名单用户视为拦截号码反馈给运营商;

基础评价子系统,将用户通话关系转换为用户间亲密度,并依据目标用户固有属性和目标用户与其他用户间亲密度计算目标用户置信度初值,筛选获得可信用户白名输出至白名单计算子系统;

其中,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

用户通话关系是根据用户长期的通话行为提取的数据,包括:通话次数和通话时长;

基础评价子系统收集全量用户或上一周期遗留的灰名单用户长时间的话单数据进行数据处理,最终筛选出用户白名单,剩下的用户自动默认是灰名单用户。

用户置信度迭代更新子系统,其用于计算新用户和目标用户的亲密度并对所有用户亲密度进行更新,以更新后亲密度值和基础评价子系统提供的置信度初值对每个用户进行置信度的迭代更新,将用户置信度的更新值导入社交网络拓扑模型,将用户类型划分为用户黑名单、用户灰名单和用户白名单,将用户白名单发送至白名单计算子系统,将用户黑名单和用户灰名单发送至实时智能拦截决策与拦截控制系统;

用户置信度迭代更新子系统会收集灰名单用户和新用户的短时间话单数据,对这些用户的置信度进行迭代计算,最终经社交网络拓扑模型用户类别划分模块识别出用户黑名单,将可信用户划分为白名单,其余用户即为灰名单用户,实时智能拦截决策与拦截控制系统会持续收集灰名单用户的话单数据,并在下一周期通过基础评价子系统进行白名单的筛选。

白名单计算子系统,用于存储白名单。

可选择的,用户白名单用于存储正常用户名单,用户黑名单用于存储拦截目标用户名单,用户灰名单用于存储疑似诈骗用户名单。

可选择的,第一预设周期范围为20天-40天,优选为35天,第二预设周期范围为5天-10天,优选为7天。

可选择的,基础评价子系统包括:

异常数据清洗模块,其用于清洗短号或短时间呼叫次数大于第三阈值的号码;

用户的原始话单数据可能出现部分数据缺失和数据冗余的情况,因此需要基于时间进行数据清洗,并完成缺数据的丢弃或补全,清洗冗余数据。由于用户的话单中存在一些短号或短时间内呼叫次数过多的号码,这些用户不应在预测范围内。只保留表现在正常范围内的、通话值较为相似的普通和诈骗用户。

用户固有属性提取模块,其用于统计用户固有属性;用户属性提取模块主要统计有代表性的用户固有属性,如用户开户时长、用户当前活跃的时间跨度、号码所属地等等,这些用户固有信息不会随用户新的通话行为而改变,将作为用户的固有为用户置信度评价提供依据。

用户通话关系提取模块,其用于统计用户间通话关系;用户通话关系提取模块主要统计了两两用户间的双向社交关系,包括用户A呼叫用户B次数和平均通话时长、用户B呼叫用户A的次数和平均通话时长等。用户通话关系的提取强调的是用户间一对一的双向社交关系,它体现了一定时间粒度下用户间联系的紧密程度,为亲密度计算模块提供支持。

用户间亲密度计算模块,其用于根据用户通话关系计算用户间的亲密度;

首先基于用户通话关系提取模块输出的用户通话关系,分析用户通话关系间相关性,若多个用户通话关系间相关性较强,需进一步进行单向通话筛选。对筛选后的通话进行重要性分析,以分析结果为依据计算各个单向通话所占权重。按各个对应的权重对单向社交关系进行合并,进而计算出用户间单向亲密度。

对于仅有单向通话关系的用户,亲密度的取值应直接映射为低于某阈值的双向亲密度。对于有双向通话关系的用户,由于正常的社交关系中,用户间单向亲密度差值不会很大,因此定义了亲密度差值衰减系数来调节不对等通话关系的亲密度,以保证单向亲密度差值过高的用户间没有较高的双向亲密度。最后,利用亲密度差值衰减系数将两个方向的亲密度合并为用户间的双向亲密度

用户置信度计算模块,其用于根据目标用户固有属性和目标用户双向亲密度计算目标用户置信度;用户置信度计算模块基于用户属性提取模块和用户通话关系提取模块的输出结果,将用户自身的属性和用户与相邻节点的通话整合在一起。根据目标用户固有属性和目标用户与其他用户间的亲密度,计算出目标用户的可信程度。

通过分析目标用户固有属性相关性,对进行筛选,根据所选重要性计算固有属性权重,进而将用户属性整合为用户固有置信度。若目标用户的被叫用户有固有属性,通过计算被叫用户的固有置信度,对目标用户与每个被叫用户间的双向亲密度所占权重进行重分配,合并为目标用户的通话置信度。最后,以目标用户的固有置信度和通话置信度为依据,得到目标用户置信度。

用户置信度计算模块的输出将为用户置信度迭代更新子系统提供置信度初值。

可信用户筛选模块,其用于将置信度大于第五阈值的用户筛选出,形成白名单输入白名单计算子系统。

可选择的,用户间亲密度计算模块采用以下方式计算用户间亲密度;

获取目标用户通话关系,目标用户通话关系是根据目标用户长期的通话行为提取的数据,包括:通话次数和通话时长;

若目标用户通话关系存在较强关联性,则筛选出单向通话后执行单向通话重要性分析;若目标用户通话关系不存在较强关联性,则直接执行单向通话重要性分析;

单向通话重要性分析结果计算各单向通话权重,按各单项通话权重计算单向亲密度;

若用户间存在双向通话,则指定亲密度差值衰减系数,将两个单向的亲密度合并为用户间的双向亲密度;

若用户间不存在双向通话,则用户间亲密度的取值直接映射为低于第四阈值的双向亲密度。

可选择的,用户置信度计算模块采用以下方式计算用户置信度;

获取目标用户固有属性和目标用户双向亲密度,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

若目标用户固有属性存在相关性较强,则筛选固有属性后计算目标用户固有属性权重;若目标用户固有属性不存在相关性较强,则直接计算目标用户固有属性权重;通过目标用户固有属性权重计算目标用户固有置信度;

若被叫用户具有固有属性,则计算被叫用户固有置信度,根据被叫用户固有置信度计算被叫用户固有属性权重;若被叫用户不具有固有属性,则被叫用户固有属性权重均分;通过用户固有属性权重计算目标用户通话置信度;

将目标用户固有置信度和目标用户通话置信度计算获得目标用户置信度。

可选择的,用户置信度迭代更新子系统包括:

新用户间亲密度计算模块,其用于对每日日志中新用户和现存灰名单用户进行通话关系的提取,计算用户间双向亲密度作为用户亲密度更新模块的初值。通话关系提取的数据包括:通话次数和通话时长;

用户间亲密度更新模块,其用于根据亲密度更新规则更新用户间亲密度;。

亲密度更新规则:当用户间指定时间段内没有交互行为时降低用户间亲密度,亲密度的降低量可以指定;当用户间亲密度到达预设值,则用户间亲密度不再下降;长期具有交互行为的两用户,即使交互行为不频繁,用户间的亲密度也设定为相对高值。

实现社交拓扑图中边权更新的同时,为置信度的更新提供了依据。

用户置信度更新模块,其用于以输入置信度为初值和用户间亲密度更新值为依据计算用户置信度更新值;用户置信度更新模块以基础评价子系统中置信度计算模块的输出作为初值,以用户亲密度更新值为依据计算用户置信度更新值。由此实现用户置信度的迭代计算,为社交网络拓扑模型提供每个目标节点的节点更新值。

社交网络拓扑模型用户类别划分模块,其用于以用户置信度更新值和亲密度更新值构建所述社交网络拓扑模型,将社交网络拓扑模型用户类型划分为黑名单、灰名单和白名单,将用户白名单输出至白名单计算子系统,将用户黑名单和用户灰名单输出至实时智能拦截决策与拦截控制系统。社交网络拓扑模型用户类别划分模块以用户置信度和亲密度的周期更新值为输入,以用户间的社交关系为依据建立以每个目标用户为中心的二阶星状图。用户类型的预测是通过消息传递网络来实现的。模型将根据筛选结果,把用户分为黑、灰、白三类。其中,白名单用户将传入白名单计算子系统以便后续的调用和维护;灰名单用户将继续作为疑似诈骗的对象,与新用户一同提取日志,随着数据的累积进行新一轮的预测;黑名单用户将作为拦截目标反馈给运营商。

本发明从下述三个角度从原理上解决现有技术存在的问题;

1)基于用户长期社交关系的可信度评价问题

考虑到社交网络拓扑模型生成目标用户拓扑图的速度较慢,本发明的基础评价子系统需要基于用户长期的通话日志对全量用户的置信度进行评估,将通话行为正常的普通用户筛选出来,最大限度地减小社交网络拓扑模型需要预测的用户基数。然而,在用户类型多样的情况下,用户的通话行为也存在不规律性和不确定性,这为用户的可信度评价带来了难题。因此,想要解决社交网络拓扑模型用户基数过大的问题,应当设计一个合理的用户各类特征的整合方法,并提出基于用户长期社交关系的可信度评价方案。

考虑到用户特征的多样性,本发明分别提取了用户固有属性和用户通话关系。其中用户间的双向通话关系将被整合为两两用户的亲密度,用来表示一定时间粒度内用户间联系的紧密程度。用户置信度将以目标用户与其他用户间的亲密度为依据并参照目标用户自身的固有属性特征计算得出。本发明针对用户长期的社交特征,对用户可信度评价问题提出了解决方案,很大程度上减小了普通用户基数,为基于社交网络拓扑模型的诈骗用户预测奠定了基础。

2)基于置信度和亲密度的社交网络用户信息维护问题;

目标用户的社交网络拓扑模型(图)除了反映出用户间的通话结构,还应当反映出每个用户的可信程度以及用户间联系的紧密程度,如何合理地利用每天的全量日志对已有的用户亲密度和置信度迭代更新,并将更新后的数据同步到社交网络拓扑模型的拓扑图中,实现对拓扑图节点值和边权的实时维护。社交网络拓扑模型(图)中的置信度和亲密度需要每隔一定的时间周期进行迭代更新,在社交网络拓扑模型(图)中加入新的较为活跃的用户。本发明提供了针对性的解决方案,用户置信度迭代更新子系统将获取灰名单用户与新用户每日的全量日志,对新出现用户进行亲密度的初值计算。根据当日的数据对所有老用户的亲密度进行更新,以更新后的亲密度值和基础评价子系统提供的置信度初值为基础,对每个用户进行置信度的更新。

3)社交网络拓扑模型(图)的构建问题;

在社交网络拓扑模型对目标用户社交网络拓扑图进行维护的过程中,随着时间的推移,用户总数据量越来庞大,以某个用户为一层节点的社交拓扑图会可能会以很快的速度扩大,将会导致巨大的计算图。两两用户间的亲密度计算量也会越来越大,这种扩张趋势会给系统的实际应用带来很大的局限性。本发明基于电信诈骗的用户特点,定义了社交拓扑网络的构建方法,通过社交网络拓扑模型(图)的构造,可以建立不局限于用户行为特征的用户之间长期的互动关系。通过自定义选点方式分别对普通和诈骗用户建图后,为了减少原始三阶社交网络的冗余,进一步删除了冗余节点并对每个二层节点产生的邻居节点模块化形成三层节点。

本发明至少能实现以下技术效果:通过深度学习模型对用户话单数据进行特征提取虽然可以根据用户的行为表现灵活地检测诈骗用户,但不能长时间持续地观察某个用户的社交关系。在实际应用场景下,往往普通用户的数量过于庞大,在这种情况下只用深度学习模型来对诈骗用户进行预测,很可能产生精确率较低的筛选结果,模型的表现会受到较大局限。利用社交网络系统学习和预测诈骗用户,就可以先根据用户的长期表现将置信度较高/较低的用户筛选出去,减少普通用户基数,更有针对性地训练模型。相比于现有技术,本发明创新性地利用了社交网络的特点,克服了深度学习模型的局限性,降低了系统处理数据负担,提高了系统的处理速度和准确度。

附图说明

本发明附图旨在示出根据本发明的特定示例性实施例中所使用的方法、结构和/或材料的一般特性,对说明书中的描述进行补充。然而,本发明附图是未按比例绘制的示意图,因而可能未能够准确反映任何所给出的实施例的精确结构或性能特点,本发明附图不应当被解释为限定或限制由根据本发明的示例性实施例所涵盖的数值或属性的范围。下面结合附图与具体实施方式对本发明作进一步详细的说明:

图1是本发明用户间亲密度计算方法流程示意图。

图2是本发明用户置信度计算方法流程示意图。

图3是本发明电信诈骗智能拦截系统系统结构示意图。

具体实施方式

以下通过特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所公开的内容充分地了解本发明的其他优点与技术效果。本发明还可以通过不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点加以应用,在没有背离发明总的设计思路下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的可以相互组合。本发明下述示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的具体实施例。应当理解的是,提供这些实施例是为了使得本发明的公开彻底且完整,并且将这些示例性具体实施例的技术方案充分传达给本领域技术人员。

第一实施,本发明提供一种用于电信网络的社交网络拓扑模型,包括:

该拓扑模型是以每个目标用户为中心构建的三层二阶星状结构,包含一层节点、二层节点和三层节点;

一层节点是目标用户,二层节点是直接被叫用户,三层节点由每个二层节点产生的邻居节点模块化获得;

其中,社交网络拓扑模型节点值是户置信度,社交网络拓扑模型边权值是用户间亲密度。

第二实施,本发明提供一种上述第一实施例社交网络拓扑模型的构建方法,包括以下步骤:

S1,节点定义,选取目标用户为一层节点,将目标用户的直接被叫用户作为二层节点,查询二层节点的直接被叫用户产生二层节点,查询二层节点的直接被叫用户产生三层节点;

S2,采用35天的数据构建社交网络拓扑图,先从每天通信数据中,随机产生固定数量的用户号码。以这些用户为中心,建立各自的通信社交网络。

查询中心用户的呼叫用户,并将被叫用户作为二层节点。如果被叫用户超过500,则认为该用户不是典型的正常用户,停止构建社交网络拓扑图。

以同样的方式,查询一阶用户并筛选二层节点,之后查询二阶用户并筛选三层节点。查询二阶用户时,如果被叫用户超过500,则认为该用户不是典型的正常用户,并删除该节点。

S4,采用35天的数据构建社交网络拓扑图,以诈骗用户为中心,建立各自的社交通信网络;

呼叫次数不超过10的诈骗用户,停止构建社交网络拓扑图。

与正常用户构建社交网络拓扑图相同,建立原始的三阶社交网络。

S5,保留所有的二层节点,删除冗余的二层节点和三层节点:如果节点只有一条边,则该节点是稀疏的;

S6,对每个二层节点产生的邻居节点模块化形成三层节点。

其中,第一预设周期范围为20天-40天,第一阈值范围为300次-600次,第二阈值范围为5次-20次。

第三实施,如图1所示,本发明提供一种用于第一实施例社交网络拓扑模型的用户间亲密度计算方法,包括以下步骤:

S6,获取目标用户通话关系,目标用户通话关系是根据目标用户长期的通话行为提取的数据,包括:通话次数和通话时长;

S7,若目标用户通话关系存在较强关联性,则筛选出单向通话后执行单向通话重要性分析;若目标用户通话关系不存在较强关联性,则直接执行单向通话重要性分析;

其中,计算用户通话关系的皮尔逊系数,若获得的皮尔逊系数大于第一预设皮尔逊系数阈值则判断目标用户通话关系存在较强关联性;

单向通话重要性分析对象是用户间的单向通话关系,使用lgb模型输出单向通话关系重要性系数;

S8,将单向通话关系重要性系数作为单向通话权重,加权求和计算获得单向亲密度;

S9,若用户间存在双向通话,则指定亲密度差值衰减系数,将两个单向的亲密度合并为用户间的双向亲密度;

单向亲密度S合并为双向亲密度D公式如下

用户x和用户y的双向亲密度D:

D=a

其中:T是x、y用户通话天数跨度,S(x,y)是xy方向的单向通话亲密度,S(y,x)是yx方向的单向通话亲密度,α

若用户间不存在双向通话,则用户间亲密度的取值直接映射为低于第四阈值的双向亲密度。

第四实施,如图2所示,本发明提供一种用于第一实施例社交网络拓扑模型的用户间置信度计算方法,包括以下步骤:

S10,获取目标用户固有属性和目标用户双向亲密度,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

S11,若目标用户固有属性存在相关性较强,则筛选固有属性后计算目标用户固有属性权重;若目标用户固有属性不存在相关性较强,则直接计算目标用户固有属性权重;通过目标用户固有属性权重计算目标用户固有置信度;

其中,计算目标用户固有属性的皮尔逊系数获得,若计算得到的皮尔逊系数大于第二预设皮尔逊系数阈值则判断目标用户固有属性存在较强关联性;

使用lgb模型输出的目标用户固有属性重要性系数,将目标用户固有属性重要性系数作为目标用户固有属性权重,加权求和计算出目标用户固有置信度;

S12,若被叫用户具有固有属性,则计算被叫用户固有置信度,根据被叫用户固有置信度计算被叫用户固有属性权重;若被叫用户不具有固有属性,则被叫用户固有属性权重均分;通过用户固有属性权重计算目标用户通话置信度;

S13,将目标用户固有置信度和目标用户通话置信度通过加权求和计算获得目标用户置信度。

第五实施,如图3所示,本发明提供一种第一实施例所述社交网络拓扑模型的电信诈骗智能拦截系统,包括:

实时智能拦截决策与拦截控制系统,其用于存储用户黑名单和用户灰名单,将目标用户的用户灰名单和新用户的第二预设周期全量日志分别提供给基础评价子系统和用户置信度迭代更新子系统,接收用户置信度迭代更新子系统的黑名单用户和灰名单用户筛选结果,将黑名单用户视为拦截号码反馈给运营商;

基础评价子系统,将用户通话关系转换为用户间亲密度,并依据目标用户固有属性和目标用户与其他用户间亲密度计算目标用户置信度初值,筛选获得可信用户白名输出至白名单计算子系统;

其中,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

用户通话关系是根据用户长期的通话行为提取的数据,包括:通话次数和通话时长;

用户置信度迭代更新子系统,其用于计算新用户和目标用户的亲密度并对所有用户亲密度进行更新,以更新后亲密度值和基础评价子系统提供的置信度初值对每个用户进行置信度的迭代更新,将用户置信度的更新值导入社交网络拓扑模型,将用户类型划分为用户黑名单、用户灰名单和用户白名单,将用户白名单发送至白名单计算子系统,将用户黑名单和用户灰名单发送至实时智能拦截决策与拦截控制系统;

白名单计算子系统,用于存储白名单。用户白名单用于存储正常用户名单,用户黑名单用于存储拦截目标用户名单,用户灰名单用于存储疑似诈骗用户名单。

可选择的,进一步改进上述第五实施例,所述基础评价子系统包括:

异常数据清洗模块,其用于清洗短号或短时间呼叫次数大于第三阈值的号码

用户固有属性提取模块,其用于统计用户固有属性;

用户通话关系提取模块,其用于统计用户间通话关系,用户通话关系是根据用户长期的通话行为提取的数据,包括:通话次数和通话时长;

用户间亲密度计算模块,其用于根据用户通话关系计算用户间的亲密度;

用户置信度计算模块,其用于根据目标用户固有属性和目标用户双向亲密度计算目标用户置信度;

可信用户筛选模块,其用于将置信度大于第五阈值的用户筛选出,形成白名单输入白名单计算子系统。

其中,用户间通话关系包括:用户A呼叫用户B次数和平均通话时长以及用户B呼叫用户A的次数和平均通话时长。

可选择的,进一步改进上述第五实施例,用户间亲密度计算模块采用以下方式计算用户间亲密度;

获取目标用户通话关系,目标用户通话关系是根据目标用户长期的通话行为提取的数据,包括:通话次数和通话时长;

若目标用户通话关系存在较强关联性,则筛选出单向通话后执行单向通话重要性分析;若目标用户通话关系不存在较强关联性,则直接执行单向通话重要性分析;

单向通话重要性分析结果计算各单向通话权重,按各单项通话权重计算单向亲密度;

若用户间存在双向通话,则指定亲密度差值衰减系数,将两个单向的亲密度合并为用户间的双向亲密度;

若用户间不存在双向通话,则用户间亲密度的取值直接映射为低于第四阈值的双向亲密度。

可选择的,进一步改进上述第五实施例,用户置信度计算模块采用以下方式计算用户置信度;

获取目标用户固有属性和目标用户双向亲密度,用户固有属性是从每个用户的基本信息中提取的,是与用户通话行为无关且不会随用户新的通话行为而改变的用户固有信息;

若目标用户固有属性存在相关性较强,则筛选固有属性后计算目标用户固有属性权重;若目标用户固有属性不存在相关性较强,则直接计算目标用户固有属性权重;通过目标用户固有属性权重计算目标用户固有置信度;

若被叫用户具有固有属性,则计算被叫用户固有置信度,根据被叫用户固有置信度计算被叫用户固有属性权重;若被叫用户不具有固有属性,则被叫用户固有属性权重均分;通过用户固有属性权重计算目标用户通话置信度;

将目标用户固有置信度和目标用户通话置信度计算获得目标用户置信度。

可选择的,进一步改进上述第五实施例,用户置信度迭代更新子系统包括:

新用户间亲密度计算模块,其用于对每日日志中新用户和现存灰名单用户进行通话关系的提取,计算用户间双向亲密度作为用户亲密度更新模块的初值。通话关系提取的数据包括:通话次数和通话时长;

用户间亲密度更新模块,其用于根据亲密度更新规则更新用户间亲密度;

用户置信度更新模块,其用于以输入置信度为初值和用户间亲密度更新值为依据计算用户置信度更新值;

社交网络拓扑模型用户类别划分模块,其用于以用户置信度更新值和亲密度更新值构建所述社交网络拓扑模型,将社交网络拓扑模型用户类型划分为黑名单、灰名单和白名单,将用户白名单输出至白名单计算子系统,将用户黑名单和用户灰名单输出至实时智能拦截决策与拦截控制系统。

除非另有定义,否则这里所使用的全部术语(包括技术术语和科学术语)都具有与本发明所属领域的普通技术人员通常理解的意思相同的意思。还将理解的是,除非这里明确定义,否则诸如在通用字典中定义的术语这类术语应当被解释为具有与它们在相关领域语境中的意思相一致的意思,而不以理想的或过于正式的含义加以解释。

以上通过具体实施方式和实施例对本发明进行了详细的说明,但这些并非构成对本发明的限制。在不脱离本发明原理的情况下,本领域的技术人员还可做出许多变形和改进,这些也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号