首页> 中国专利> 动态社会关系网络社区演化识别以及稳定社区提取方法

动态社会关系网络社区演化识别以及稳定社区提取方法

摘要

本发明涉及网络技术领域,特别是涉及一种动态社会关系网络社区演化识别以及稳定社区提取方法,方法包括:采集原始数据,根据数据之间的关联关系按照第一预定时间周期建立每个时间周期的社会网络,并利用派系过滤方法划分每个时间周期的社区,再获取相邻两个时间周期的社区作为社区对,获取每一个社区对的相对重叠度值,比较所述相对重叠度值,将具有相对重叠度值最高的社区对作为具有继承演化关系的社区对。应用本发明的方法,无需将一段时间的动态社会关系网络映射为一个时间点的静态社会关系网络,而是直接对预定时间周期内的各社会网络的节点进行社区提取处理,比静态的映射方法更加准确,并且能够确定社区对之间的演化继承关系。

著录项

  • 公开/公告号CN103853739A

    专利类型发明专利

  • 公开/公告日2014-06-11

    原文格式PDF

  • 申请/专利权人 中国移动通信集团公司;

    申请/专利号CN201210501138.0

  • 发明设计人 陶振武;

    申请日2012-11-29

  • 分类号G06F17/30(20060101);

  • 代理机构11227 北京集佳知识产权代理有限公司;

  • 代理人王宝筠

  • 地址 100032 北京市西城区金融大街29号

  • 入库时间 2024-02-20 00:07:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-17

    授权

    授权

  • 2014-07-09

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20121129

    实质审查的生效

  • 2014-06-11

    公开

    公开

说明书

技术领域

本发明涉及网络技术领域,特别是涉及一种动态社会关系网络社区演化 识别以及稳定社区提取方法。

背景技术

社会网络是用来表示网络中各个个体之间相互联系的网络。目前的社交 网站、微博、论坛等都可以被看作为一个社会网络。在社会网络中,人与人 之间关联形成的社会网络存在结构涌现现象,即相同类型的节点之间存在的 连接较多,不同类型节点之间存在的连接较少。而社区是指网络中满足同一 类型的节点以及这些节点之间的连接构成的子图。而在网络中寻找稳定的社 区具有重要的实用价值。特别是随着微博等互联网应用的普及,如何快速找 到庞大的社会关系网络中的稳定社区,对于开展精准广告投放、引导舆论导 向具有重要意义。

现有技术存在一种社区发现方法,其基本思想是采用静态社会关系网络 分析的方法处理动态社会关系网络的问题。其将一段时间的动态网络映射到 一个时间点上的静态网络,再基于派系过滤的社区发现方法找出其中的社区。 但实际的社会关系网络是动态的,网络中的社区结构会从一种稳定状态达到 另一种稳定状态,如何识别当前网络中的社区是前一次稳定状态的社区演化 而来的,利用现有技术是无能为力的。

发明内容

为解决上述技术问题,本发明实施例提供了一种动态社会关系网络社区 演化以及稳定社区的提取方法,可以确定社区的演化关系,以及提取稳定社 区。

根据本发明实施例的第一方面,公开了一种动态社会关系网络社区演化 识别方法,所述方法包括:

采集原始数据,根据数据之间的关联关系按照第一预定时间周期建立每 个时间周期的社会网络;

利用派系过滤方法划分每个时间周期的社区;

获取相邻两个时间周期的社区作为社区对,获取每一个社区对的相对重 叠度值;比较所述相对重叠度值,获取具有相对重叠度值最高的社区对,确 定所述具有相对重叠度值最高的社区对为具有继承演化关系的社区对。

较佳地,所述获取相邻两个时间周期的社区作为社区对,获取每一个社 区对的相对重叠度值具体包括:

获取相邻两个时间周期的社区Di和Ej作为社区对;

将相邻两个时间周期的社区对按照相同节点进行连接关系的叠加,获取 叠加后的社会网络;

利用派系过滤方法划分叠加后的社会网络中的社区Vk;

根据以下公式计算每一个社区对的相对重叠度值

Ci,jk=|DikEjk||DikEjk|

其中,为社区Di中的节点在社区Vk中存留的节点数目,为社区Ej中的节点在社区Vk中存留的节点数目。

较佳地,所述方法还包括:

根据确定的社区演化继承关系,对不同社区的节点执行不同的处理策略。

较佳地,所述根据确定的社区演化继承关系,对不同社区的节点执行不 同的处理策略具体包括:

对于具有继承演化关系的社区对,获取所述社区对中的两个社区的节点 数量;

比较社区对中的两个社区的节点数量,获取比较结果;

当所述比较结果表明所述具有继承演化关系的社区对中,处于后一时间 周期的社区的节点的数量小于处于前一时间周期的社区的节点的数量时,获 取处于后一时间周期的社区的各节点的地址信息,向处于后一时间周期的社 区的各节点发送第一内容;

当所述比较结果表明所述具有继承演化关系的社区对中,处于后一时间 周期的社区的节点的数量大于处于前一时间周期的社区的节点的数量时,获 取处于后一时间周期的社区的各节点的地址信息,向处于后一时间周期的社 区的各节点发送第二内容;

其中,所述第一内容和所述第二内容不同。

较佳地,所述方法还包括:

获取预定时间窗口内具有继承演化关系的社区对的相对重叠度值;

根据获取的相对重叠度值获取社区规模稳定度值;

获取社区分裂值;

根据获取的社区规模稳定度值和社区分裂值判断社区是否符合预设的条 件,当判断社区满足预设的条件时,确定所述社区为稳定社区。

根据本发明实施例的第二方面,公开了一种动态社会关系网络稳定社区 提取方法,所述方法包括:

将相邻两个时间周期的社区作为社区对,获取预定时间窗口内各个社区 对的相对重叠度值;

根据获取的相对重叠度值获取社区规模稳定度值;

获取社区分裂值;

根据获取的社区规模稳定度值和社区分裂值判断社区是否符合预设的条 件,当判断社区满足预设的条件时,确定所述社区为稳定社区。

较佳地,所述根据获取的相对重叠度值获取社区规模稳定度值具体为:

根据以下公式获取社区规模稳定度值:

ξ=Σt=0tmax-1C(t,t+1)tmax-t-1

其中,ξ为社区规模稳定度值,C(t,t+1)为相邻两个时间周期的社区对对 应的相对重叠度值,tmax为预定时间窗口(t0,tmax)中最大时间周期值。

较佳地,所述获取社区分裂值具体为:

获取社区内各节点的分裂度值;

将社区内各节点的分裂度值的平均值作为社区分裂值。

较佳地,所述获取社区内各节点的分裂度值具体包括:

获取社区中各节点对应的出度值和各节点对应的入度值;

获取所述各节点的出度值与入度值之和;

将各节点对应的出度值除以所述出度值与入度值之和得到的比值作为各 节点的分裂度值。

较佳地,所述方法还包括:

当确定社区是稳定社区时,获取所述社区内各节点的地址,向各节点发 送第三内容;

当确定社区是不稳定社区时,获取所述社区内各节点的地址,向各节点 发送第四内容;

其中,所述第三内容和第四内容不同。

根据本发明实施例的第三方面,公开了一种动态社会关系网络社区演化 识别装置,所述装置包括:

数据处理模块,用于采集原始数据,根据数据之间的关联关系按照第一 预定时间周期建立每个时间周期的社会网络;

社区发现模块,用于利用派系过滤方法划分每个时间周期的社区;

社区演化识别模块。用于获取相邻两个时间周期的社区作为社区对,获 取每一个社区对的相对重叠度值;比较所述相对重叠度值,获取具有相对重 叠度值最高的社区对,确定所述具有相对重叠度值最高的社区对为具有继承 演化关系的社区对。

较佳地,所述社区演化识别模块具体包括重叠度获取单元和比较单元, 其中,所述重叠度获取单元具体包括:

社区对获取子单元,用于获取相邻两个时间周期的社区Di和Ej作为社区 对;

叠加子单元,用于将相邻两个时间周期的社区对按照相同节点进行连接 关系的叠加,获取叠加后的社会网络;

划分子单元,用于利用派系过滤方法划分叠加后的社会网络中的社区Vk;

计算子单元,用于根据以下公式计算每一个社区对的相对重叠度值

Ci,jk=|DikEjk||DikEjk|

其中,为社区Di中的节点在社区Vk中存留的节点数目,为社区Ej中的节点在社区Vk中存留的节点数目。

较佳地,所述装置还包括:

执行模块,用于根据确定的社区演化继承关系,对不同社区的节点执行 不同的处理策略。

较佳地,所述装置还包括:

稳定社区提取模块,用于获取预定时间窗口内具有继承演化关系的社区 对的相对重叠度值;根据获取的相对重叠度值获取社区规模稳定度值;获取 社区分裂值;根据获取的社区规模稳定度值和社区分裂值判断社区是否符合 预设的条件,当判断社区满足预设的条件时,确定所述社区为稳定社区。

根据本发明实施例的第四方面,公开了一种动态社会关系网络稳定社区 提取装置,所述装置包括:

重叠度获取模块,用于将相邻两个时间周期的社区作为社区对,获取预 定时间窗口内各个社区对的相对重叠度值;

稳定度值获取模块,用于根据获取的相对重叠度值获取社区规模稳定度 值;

分裂值获取模块,用于获取社区分裂值;

判断模块,用于根据获取的社区规模稳定度值和社区分裂值判断社区是 否符合预设的条件,当判断社区满足预设的条件时,确定所述社区为稳定社 区。

较佳地,所述稳定度值获取模块具体用于根据以下公式获取社区规模稳 定度值:

ξ=Σt=0tmax-1C(t,t+1)tmax-t-1

其中,ξ为社区规模稳定度值,C(t,t+1)为相邻两个时间周期的社区对对 应的相对重叠度值,tmax为预定时间窗口(t0,tmax)中最大时间周期值。

较佳地,所述分裂值获取模块具体包括:

节点分裂值获取单元,用于获取社区内各节点的分裂度值;

平均值获取单元,用于将社区内各节点的分裂度值的平均值作为社区分 裂值。

较佳地,所述装置还包括:

第一发送单元,用于当确定社区是稳定社区时,获取所述社区内各节点 的地址,向各节点发送第三内容;

第二发送单元,用于当确定社区是不稳定社区时,获取所述社区内各节 点的地址,向各节点发送第四内容。

本发明实施例能够达到的有益效果为:在本发明实施例中,通过采集原 始数据,根据数据之间的关联关系按照第一预定时间周期建立每个时间周期 的社会网络,并利用派系过滤方法划分每个时间周期的社区,再获取相邻两 个时间周期的社区作为社区对,获取每一个社区对的相对重叠度值,比较所 述相对重叠度值,获取具有相对重叠度值最高的社区对,确定所述具有相对 重叠度值最高的社区对为具有继承演化关系的社区对。这样,应用本发明提 供的方法,无需将一段时间的动态社会关系网络映射为一个时间点的静态社 会关系网络,而是直接对预定时间周期内的各社会网络的节点进行社区提取 处理,比静态的映射方法更加准确,并且能够通过重叠度计算确定社区对之 间的演化继承关系,为社区节点的处理提供了精确的依据。

另一方面,本发明还提供了一种稳定社区的提取方法,可以准确的提取 出稳定社区,为精准广告投放、引导舆论等提取了明确的对象。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员 来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的动态社会关系网络社区演化识别方法第一实 施例示意图;

图2为本发明实施例提供的动态社会关系网络社区演化识别第二实施例 示意图;

图3为社区示意图;

图4为社区叠加示意图;

图5为本发明实施例提供的动态社会关系网络稳定社区提取方法第一实 施例示意图;

图6为本发明实施例提供的动态社会关系网络稳定社区提取方法第二实 施例示意图;

图7为本发明实施例提供的动态社会关系网络稳定社区提取方法第三实 施例示意图;

图8为本发明实施例提供的动态社会关系网络社区演化识别装置示意图;

图9为本发明实施例提供的动态社会关系网络稳定社区提取装置示意图。

具体实施方式

现有技术的社区发现方法其基本思想是采用静态社会关系网络分析的方 法处理动态社会关系网络的问题,其将一段时间的动态网络映射到一个时间 点上的静态网络,再基于派系过滤的社区发现方法找出其中的社区。但由于 在动态网络中,节点和边的数量、映射函数的形状以及其他一些属性都可能 随着时间而变化,但静态网络中,节点和边的数量、映射函数的形状均不会 发生变化。因此,直接利用静态网络分析动态社会网络是不准确的。

本发明应用派系过滤的方法提取出社会网络中的社区,再通过相邻两个 时间周期的社区对的相对重叠度值的计算,识别出具有演化继承关系的社区 对,可以准确地区分出一个稳定社区是由哪个稳定社区演变而来。进一步地, 还可以通过稳定度和分裂度的计算,判断出社区是否是稳定社区,并执行相 应的处理策略。

为了使本技术领域的人员更好地理解本发明中的技术方案,下面结合一 些基本概念以及实施例对本发明进行详细的介绍。显然,所描述的实施例仅 仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都应当属于本发明保护的范围。

一般可以用一个时变三元组来描述动态网络:G(t)=[N(t),L(t),f(t): R],其中N(t)为一组节点,L(t)为一组边,f(t)为将边映射到节点对的映射 函数。N(t)、L(t)和f(t)是随着时间变化的,因此G(t)为动态网络。网络 的形状可以由函数f(t)来定义,它可能随着时间的推移在删除、添加和重连 节点时变化。

假设网络G(0)在它的初始状态,将规则集合R中的一个多个局部规则在 每个时间步应用到G上面,就从G(0)到G(1)、G(1)到G(2)…迁移,直到达到 最终状态G(tf)为止,或者是重复之前的状态,即:

G(t+1)=R{G(t),E(t)}

这里E(t)是作用在G上的外力。如果G(t)达到了终态G(tf),对于所有仍 然保持不变,那么G是收敛的,否则就是发散的。

目前,一般是采用静态社会关系网络分析的方法来处理动态社会关系网 络的问题。即将一段时间内所有出现在社会关系网络中的节点作为节点集合 N。只要在这段时间内,任何两个节点之间发生过直接联系,就将其加到边的 集合L,同时更新边的权重。这样,就将上述的动态网络G(t)=[N(t),L(t), f(t):R]简化为一个静态有向图G=[N,L],然后再用基于图挖掘的方法找出 其中有意义的社区。

由于现实中很多社会关系网络并不存在绝对的彼此独立的社区结构,相 反它们是由许多彼此重叠相互关联的社团构成。例如,在通信和互联网的社 会关系网络中,真正相互分离的社区比较少,一个人很有可能同时属于不同 的社区(例如公司、家庭、兴趣小组等),即出现了重叠社区的概念。而派系 过滤(clique percolation,CP)的方法可以用来分析这种重叠的社区结构, 本发明即是基于派系过滤的方法来识别社区的演化继承关系以及提取稳定社 区的。

参见图1,为本发明提供的动态社会关系网络社区演化识别方法第一实施 例示意图。

S101,采集原始数据,根据数据之间的关联关系按照第一预定时间周期 建立每个时间周期的社会网络。

S102,利用派系过滤方法划分每个时间周期的社区。

S103,获取相邻两个时间周期的社区作为社区对,获取每一个社区对的 相对重叠度值;比较所述相对重叠度值,获取具有相对重叠度值最高的社区 对,确定所述具有相对重叠度值最高的社区对为具有继承演化关系的社区对。

参见图2,为本发明提供的动态社会关系网络社区演化识别方法第二实施 例示意图。

S201,采集原始数据,根据数据之间的关联关系按照第一预定时间周期 建立每个时间周期的社会网络。

具体实现时,可以从运营商话单、计费系统、经营分析系统、互联网产 品(例如微博、圈子)等采集原始数据,本发明不限定原始数据的采集方式。 例如,从运营商话单提取数据时,如果用户A在2012年1月1日18:00给 用户B打过电话,则采集的数据格式可以为(A,B,2012-09-29,18:00)。 以上仅为一个示例,具体的数据格式可以根据需要设定,本发明不进行限定。 一般地,采集的原始数据应该包括节点的ID(地址或用户名或手机号等)以 及时间信息。然后,根据采集的原始数据,将其处理为统一的格式,并根据 数据之间的关联关系按照第一预定时间周期建立每个时间周期的社会网络。 例如,A给B打过电话,则认为A和B是有关联关系的,则在节点A和节点B 之间具有一个公共边,用来标识两个节点之间的关系。最终建立的社会网络, 是以用户数据为节点,节点之间的关系为边组成的网络。较佳地,可以预先 设置一个预设条件,当节点之间的关系满足预设条件时,则保留节点之间的 边,否则删除这个边。例如,可以设置当两个用户之间的通话频率在一个月 内大于2次时,才保留两个节点之间的边。与现有技术不同的是,在本发明 实例中,建立社会关系网络时,是以第一预定时间周期建立的。例如以周、 月、年等作为第一预定时间周期,建立每周的社会网络、每月的社会网络、 每年的社会网络等。

S202,利用派系过滤方法划分每个时间周期的社区。

前面提到,可以采用派系过滤的方法划分每个时间周期的社区。具体实 现时,步骤S202可以通过以下步骤实现:

S202A,获取每个时间周期的社会网络中的所有派系。

具体实现时,包括以下步骤:

A,根据所处理的网络中各节点的度判断网络中可能存在的最大全耦合网 络的大小s。

B,从网络中一个节点出发,找到所有包含该节点的大小为s的派系。

C,删除该节点及连接它的边,以避免多次找到同一个派系。

D,再选择一个节点,重复步骤B和步骤C,直到网络中没有节点为止。

E,输出网络中大小为s的所有派系;如果s>1,则令s=s-1,重复步骤 A步骤E直至找到网络中所有的不同大小的派系。

S202B,将获取的网络中的所有派系映射为这些派系的重叠矩阵。

具体实现时,矩阵的每一行或列对应一个派系,对角线上的元素表示相 应派系所包含节点数,非对角线元素代表两个派系之间的公共节点数。

S202C,获取k-派系的社区结构连接矩阵。

由于k-派系社区就是由共享k-1个节点的相邻k-派系构成的连通图,因 此在派系重叠矩阵中将对角线上小于k、非对角线上小于k-1的元素置0,其 他元素置1,就可得到k-派系的社区结构连接矩阵。

S202D,矩阵中的各个连通部分分别代表各个k-派系社区。

至此,即可通过派系过滤方法划分中网络中的社区。

S203,获取相邻两个时间周期的社区Di和Ej作为社区对。

如图3所示,在t=1时间周期内,存在两个社区D1(如图3A所示)和社 区D2(如图3B所示),在t=2时间周期内,存在一个社区E1(如图3C所示)。 则将(D1,E1)和(D2,E1)作为社区对。

S204,将相邻两个时间周期的社区对按照相同节点进行连接关系的叠加, 获取叠加后的社会网络。

如图4所示,将(D1,E1)社区对中的社区内的节点按照相同节点进行 连接关系的叠加,则获取了叠加后的网络。将(D2,E1)社区对中的社区内 的节点按照相同节点进行连接关系的叠加,则获取了叠加后的社区网络。

S205,利用派系过滤方法划分叠加后的社会网络中的社区Vk

同样地,利用步骤S202提供的派系过滤方法获取叠加后的社会网络中的 社区。

S206,获取每一个社区对的相对重叠度值。

具体实现时,根据以下公式计算每一个社区对的相对重叠度值

Ci,jk=|DikEjk||DikEjk|

其中,为社区Di中的节点在社区Vk中存留的节点数目,为社区Ej中的节点在社区Vk中存留的节点数目。

在图3和图4中,当k=1,i=1,j=1时,

C1,11=|{B,H,G}{A,B,C,D,G,H}||{B,H,G}{A,B,C,D,G,H}|=36

当k=2,i=2,j=1时,

C2,12=|A,B,C,D,E}{A,B,C,D,G,H}||{A,B,C,D,E}{A,B,C,D,G,H}|=47

S207,比较所述相对重叠度值,获取具有相对重叠度值最高的社区对, 确定所述具有相对重叠度值最高的社区对为具有继承演化关系的社区对。

将获取的相对重叠度值进行降序排列,则Cmax对应的(Di,Ej)社区对即为 演化前后的社区对。

以图3和图4所示为例,而4/7所对 应的是则社区演化关系是从D2到E1,该演化对为(D2,E1),也就是说, D2和E1是具有继承演化关系的社区对。

进一步地,在本发明另一实施例中,所述方法还包括根据确定的社区演 化继承关系,对不同社区的节点执行不同的处理策略。

具体实现时,对于前后有继承关系的社区,可以根据社区对中的两个社 区的节点的数量,判断社区是发生了膨胀还是萎缩,并执行不同的处理策略。 具体地,对于具有继承演化关系的社区对,获取所述社区对中的两个社区的 节点数量;比较社区对中的两个社区的节点数量,获取比较结果;当所述比 较结果表明所述具有继承演化关系的社区对中,处于后一时间周期的社区的 节点的数量小于处于前一时间周期的社区的节点的数量时,可以确定前一时 间周期的社区发生了萎缩,这时,获取处于后一时间周期的社区的各节点的 地址信息,向处于后一时间周期的社区的各节点发送第一内容。其中,第一 内容可以根据具体的需要设置。例如,对于运营商而言,可以通过邮件、短 信的方式发送挽留客户的信息。当所述比较结果表明所述具有继承演化关系 的社区对中,处于后一时间周期的社区的节点的数量大于处于前一时间周期 的社区的节点的数量时,确定前一时间周期的社区发生了膨胀,这时,获取 处于后一时间周期的社区的各节点的地址信息,向处于后一时间周期的社区 的各节点发送第二内容,其中,所述第一内容和所述第二内容不同。第二内 容也可以根据需要设置,例如运营商发送的新的优惠信息等。本发明对此不 进行限定。

前面描述了如何确定社区的膨胀、萎缩,为了数据处理的需要,本发明 也提供了如何确定社区消亡的方法。具体实现时,对于消亡的社区,其判断 标准为,对于一个给定的社区,在下一代的划分的所有社区中,无法通过计 算Cmax值的方法找到一个社区与之对应形成前后的继承关系,则判断所述社 区为消亡的社区。

此外,对于有前后继承关系的社区,对社区包含的节点之间连接强度(对 应于边的权值)较弱部分可以通过外部刺激进行强化,或者在这些节点之间 建立之前不存在的关系,以便最大可能延续社区不会消亡或者萎缩。例如在 电信运营商企业,为了避免用户社区的解体而导致社区中的用户离网而到达 其他运营商网络,可以仅针对社区中节点之间连接强度低的各节点执行对应 的处理策略,例如发送套餐推荐信息等。

参见图5,为本发明提供的动态社会关系网络稳定社区提取方法第一实施 例示意图。所述方法包括:

S501,将相邻两个时间周期的社区作为社区对,获取预定时间窗口内各 个社区对的相对重叠度值。

S502,根据获取的相对重叠度值获取社区规模稳定度值。

具体实现时,计算社区规模稳定度的社区的前提条件为这两个社区是确 定具有前后继承关系的社区对,反映在相对重叠度值C上,就是C取最大值 时所对应的下标对(i,j)所对应的前后两个社区。

S503,获取社区分裂值。

S504,根据获取的稳定度值和社区分裂值判断社区是否符合预设的条件, 当判断社区满足预设的条件时,确定所述社区为稳定社区。

参见图6,为本发明提供的动态社会关系网络稳定社区提取方法第二实施 例示意图。

S601,获取预定时间窗口内,具有继承演化关系的社区对对应的相对重 叠度值。

在判断一个社区是否为稳定社区时,应用前面提到的社区演化识别方法, 确定出具有继承演化关系的社区对。这样,在判断一个社区是否为稳定社区 时,首先确定其在一个时间窗口(t0,tmax)内,各个时间周期对应的具有继承演 化关系的社区对。例如,在t0时间周期内,存在社区D1,其在t1时间周期内 演化为社区E1,在t2时间周期内演化为社区F1,在t3时间周期内演化为社区 G1。其中,则在(t0,t3)时间窗口内,获取各个时间周期内具有演化继承关 系的社区对,则为(D1,E1),(E1,F1),(F1,G1);接着,获取这些社区对 对应的相对重叠度值。

S602,根据获取的相对重叠度值获取社区规模稳定度值。

具体实现时,根据以下公式获取社区规模稳定度值:

ξ=Σt=0tmax-1C(t,t+1)tmax-t-1

其中,ξ为社区规模稳定度值,C(t,t+1)为相邻两个时间周期的社区对对 应的相对重叠度值,tmax为预定时间窗口(t0,tmax)中最大时间周期值。

其中,社区规模即社区包含节点的数量。社区规模稳定度值ξ表示社区 每一次演化时社区中成员(节点)保持不变的平均比例,用于描述时间窗口(t0, tmax)内一个社区稳定性。在给定的时间窗口(t 0,tmax)内,如果ξ*为边界值, 例如ξ*=0.85,我们认为在连续多次迭代中,社区的成员数保持不变的平均比 例高于85%,则认为该社区在tmax-t0次迭代中达到了稳定状态。

S603,获取社区分裂值。

步骤S603可以通过以下步骤实现:

S603A,获取社区内各节点的分裂度值。

其中,社区内各节点的分裂度值pi通过以下公式计算:

pi=ΣwioutΣ(wiout+wiin)

其中,为节点的出度,即某一节点与社区外部的节点连接的边的数 量;为节点的入度,即某一节点与社区内部的节点连接的边的数量。 为某一节点的出度和入度之和。

则计算社区内各节点的分裂度值具体包括:

获取社区中各节点对应的出度值和各节点对应的入度值;

获取所述各节点的出度值与入度值之和;

将各节点对应的出度值除以所述出度值与入度值之和得到的比值作为各 节点的分裂度值。

S603B,将社区内各节点的分裂度值的平均值作为社区分裂值。

PA(t)=Σpi|A|

其中,Pi为节点的分裂度值,A为社区内节点的数量。

PA是一种未来社区分裂的指标来为预测社区下一步还是否继续稳定,指标 是通过预测个体离开社区的倾向性的指标来描述社区结构的稳定性。

S604,当判断获取的稳定度值大于第一预设阈值,分裂度值小于第二预 设阈值时,则判断社区为稳定社区;否则,确定社区为不稳定社区。

具体实现时,如果(p*为社区分裂的阈值),且ξ≥ξ*,则说明该 社区结构处于稳定状态,且在接下来的演化过程中,也不会很快被打破。这 时可以得到哪些社区是在动态社会关系网络中的稳定社区。

S605,当确定社区是稳定社区时,获取所述社区内各节点的地址,向各 节点发送第三内容。

具体实现时,在社会网络中保存了各节点的ID,例如手机号、邮箱、IP 地址等,则根据保存的节点的ID,向各节点发送对应的内容。对应于稳定社 区的节点和处于不稳定社区的节点,发送的内容是不同的,即执行了不同的 处理策略。

S606,当确定社区是不稳定社区时,获取所述社区内各节点的地址,向 各节点发送第四内容。

参见图7,为本发明提供的动态社会关系网络稳定社区提取方法第三实施 例示意图。

S701,采集原始数据,根据数据之间的关联关系按照第一预定时间周期 建立每个时间周期的社会网络。

S702,利用派系过滤方法划分每个时间周期的社区。

S703,获取相邻两个时间周期的社区Di和Ej作为社区对。

S704,将相邻两个时间周期的社区对按照相同节点进行连接关系的叠加, 获取叠加后的社会网络。

S705,利用派系过滤方法划分叠加后的社会网络中的社区Vk

S706,获取每一个社区对的相对重叠度值。

S707,比较所述相对重叠度值,获取具有相对重叠度值最高的社区对, 确定所述具有相对重叠度值最高的社区对为具有继承演化关系的社区对。

S708,获取预定时间窗口内,具有继承演化关系的社区对对应的相对重 叠度值。

S709,根据获取的相对重叠度值获取社区规模稳定度值。

S710,获取社区分裂值。

S711,当判断获取的社区规模稳定度值大于第一预设阈值,分裂度值小 于第二预设阈值时,则判断社区为稳定社区;否则,确定社区为不稳定社区。

S712,当确定社区是稳定社区时,获取所述社区内各节点的地址,向各 节点发送第三内容;当确定社区是不稳定社区时,获取所述社区内各节点的 地址,向各节点发送第四内容。

参见图8,为本发明实施例提供的动态社会关系网络社区演化识别装置示 意图。

所述装置包括:

数据处理模块801,用于采集原始数据,根据数据之间的关联关系按照第 一预定时间周期建立每个时间周期的社会网络。

社区发现模块802,用于利用派系过滤方法划分每个时间周期的社区。

社区演化识别模块803,用于获取相邻两个时间周期的社区作为社区对, 获取每一个社区对的相对重叠度值;比较所述相对重叠度值,获取具有相对 重叠度值最高的社区对,确定所述具有相对重叠度值最高的社区对为具有继 承演化关系的社区对。

较佳地,所述社区演化识别模块具体包括重叠度获取单元和比较单元, 其中,所述重叠度获取单元具体包括:

社区对获取子单元,用于获取相邻两个时间周期的社区Di和Ej作为社区 对;

叠加子单元,用于将相邻两个时间周期的社区对按照相同节点进行连接 关系的叠加,获取叠加后的社会网络;

划分子单元,用于利用派系过滤方法划分叠加后的社会网络中的社区Vk;

计算子单元,用于根据以下公式计算每一个社区对的相对重叠度值

Ci,jk=|DikEjk||DikEjk|

其中,为社区Di中的节点在社区Vk中存留的节点数目,为社区Ej中的节点在社区Vk中存留的节点数目。

较佳地,所述装置还包括:

执行模块,用于根据确定的社区演化继承关系,对不同社区的节点执行 不同的处理策略。

较佳地,所述装置还包括:

稳定社区提取模块,用于获取预定时间窗口内具有继承演化关系的社区 对的相对重叠度值;根据获取的相对重叠度值获取社区规模稳定度值;获取 社区分裂值;根据获取的社区规模稳定度值和社区分裂值判断社区是否符合 预设的条件,当判断社区满足预设的条件时,确定所述社区为稳定社区。

参见图9,为本发明实施例提供的动态社会关系网络稳定社区提取装置示 意图。

所述装置包括:

重叠度获取模块901,用于将相邻两个时间周期的社区作为社区对,获取 预定时间窗口内各个社区对的相对重叠度值。

稳定度值获取模块902,用于根据获取的相对重叠度值获取社区规模稳定 度值。

分裂值获取模块903,用于获取社区分裂值。

判断模块904,用于根据获取的社区规模稳定度值和社区分裂值判断社区 是否符合预设的条件,当判断社区满足预设的条件时,确定所述社区为稳定 社区。

较佳地,所述稳定度值获取模块具体用于根据以下公式获取社区规模稳 定度值:

ξ=Σt=0tmax-1C(t,t+1)tmax-t-1

其中,ξ为社区规模稳定度值,C(t,t+1)为相邻两个时间周期的社区对对 应的相对重叠度值,tmax为预定时间窗口(t0,tmax)中最大时间周期值。

较佳地,所述分裂值获取模块具体包括:

节点分裂值获取单元,用于获取社区内各节点的分裂度值;

平均值获取单元,用于将社区内各节点的分裂度值的平均值作为社区分 裂值。

较佳地,所述装置还包括:

第一发送单元,用于当确定社区是稳定社区时,获取所述社区内各节点 的地址,向各节点发送第三内容;

第二发送单元,用于当确定社区是不稳定社区时,获取所述社区内各节 点的地址,向各节点发送第四内容。

进一步的,与图7所示的动态社会关系网络稳定社区提取方法对应的, 本发明实施例还提供了一种动态社会关系网络稳定社区提取装置,其包含了 如图8所示的动态社会关系网络社区演化识别装置所示的各功能模块以及如 图9所示的动态社会关系网络稳定社区提取装置的各功能模块。上述两个装 置实施例中的各功能子模块可以结合地包含在这一稳定社区提取装置中。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来 将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示 这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、 “包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要 素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列 出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要 素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除 在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述, 例如程序单元。一般地,程序单元包括执行特定任务或实现特定抽象数据类 型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中 实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处 理设备来执行任务。在分布式计算环境中,程序单元可以位于包括存储设备 在内的本地和远程计算机存储介质中。

以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普 通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润 饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号