法律状态公告日
法律状态信息
法律状态
2022-07-29
公开
发明专利申请公布
技术领域
本发明属于智能方法和传播动力学领域,特别是涉及一种基于多层社交平台的谣言传播源溯源方法。
背景技术
对于一个社交平台,谣言在其上的传播过程可以用SI(Susceptible-Infected)模型和SIR(Susceptible-Infected-Recovery)模型来模拟。对于SI模型,初始网络中的每个节点都处于未感染状态,即都不知道该谣言,从某时刻开始,网络中的一个或多个节点开始向与自己存在联系的节点传播谣言,这些最开始传播谣言的节点被认为是传播源;之后的每个时刻,受感染的节点都会向与自己存在联系的节点传播该谣言,并且一个未感染的节点被感染的概率为p。对于SIR模型,与SI模型的不同点在于节点可以“恢复”(Recovery),即一个被感染了的节点证实了该条消息是谣言,从此便不再相信该消息,也不再参与传播过程。
针对单个系统,即单层社交网络;Pinto等人提出通过在网络中布置“观察点”记录感染时间的方法定位传播源(Physical Review Letters),具体做法:首先在网络中选取一部分节点作为观察点,在谣言开始传播之后记录这些节点的感染时间并且将其记为观测时间向量d;在定位过程中,遍历网络中的每一个节点,假设其是传播源并触发传播过程,谣言传播到各观察点的时间组成另一个理论时间向量μ;利用多元正态分布概率密度函数计算这两个向量的相似性,使得相似性最高的节点被认为是传播源。Wang等人基于传播源中心性原理(Source Centrality),提出用标签值迭代的方法使感染区域中心节点的标签值局部最大从而定位传播源(Thirty-First AAAI Conference on ArtificialIntelligence),具体做法:在网络中一定比例的节点受到感染时停止传播,获取此时的网络快照,根据每个节点的状态赋予其标签值(感染节点赋予+1,未感染则赋予-1)。之后遍历网络中的每个节点进行标签值迭代过程,直到网络中每个节点的标签值不再发生变化,选出局部标签值最大的节点作为传播源。
现有的大多数传播源定位方法都是针对单一社交平台的,然而现实世界中许多不同的社交媒体是相互依赖、相互影响的,比如:一个人可能有不同的社交帐号(例如微信和QQ,Facebook和Twitter等);一个人可能在不同的社交圈子中扮演不同角色(例如家人,朋友,同事等)。因此,社交网络平台上的多通道传播特征使得传播源定位问题更具研究和实用价值。
可以将上述社交网络多通道交互平台抽象为“multiplex网络”形式。Multiplex网络是多层网络的一种特殊形式,在multiplex网络中,不同层的拓扑结构可能不同,每一层包含相同的节点并且不同层之间的节点一一对应。针对多层网络,Paluch等人将多元正态分布概率密度函数计算相似性的方法扩展到了多层(Physica A:Statistical Mechanicsand its Applications)。与单层上的定位方法不同之处在于:他们考虑了层间传播并且分析了层间感染率对定位结果的影响。
尽管有许多方法都被提出用于谣言传播源溯源,然而,现有方法存在以下不足:
1.现有的方法大多数都是针对单层网络的,多层上的传播源定位方法很少有人研究;
2.Paluch等人提出的方法只能用于单一传播源定位,不能用于解决多个传播源情况下的溯源定位;
3.现实世界中谣言传播的概率是相对较低的,传播路径具有很高的随机性;这使得现有方法的适用性不高。
发明内容
本发明的目的是提供一种基于多层社交平台的谣言传播源溯源方法,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了一种基于多层社交平台的谣言传播源溯源方法,包括:
构建多层社交网络;在所述多层社交网络中选取随机节点作为观察点记录谣言传播情况,基于所述谣言传播情况对所有节点赋予初始标签值;
对所述初始标签值进行迭代,获得迭代标签值;基于所述迭代标签值获得感染源位置。
可选地,所述多层社交网络包括若干层不同社交平台,所述多层社交网络的构建方法为:
将所述社交平台中的每个用户设定为节点,将节点之间的联系设定为边,在不同社交平台上相同的节点之间构建连接边,在相同社交平台上,基于不同节点之间的联系构建连接边,基于所述节点与构建的所述连接边构建所述多层社交网络。
可选地,所述多层社交网络的构建方法还包括:
每个节点周围存在若干个邻居,所述邻居包括:与所述节点在相同层有连接边相连的节点和与所述节点在不同层有连接边相连的节点。
可选地,在所述多层社交网络中选取随机节点作为观察点记录谣言传播情况的过程中包括:
在收到谣言时,基于所述观察点记录谣言散播者的位置以及获取所述多层社交网络在谣言爆发时刻的网络快照。
可选地,所述网络快照包括:所述多层社交网络的拓扑结构、所述多层社交网络中每个节点的状态。
可选地,所述初始标签值的赋予方法为:对已收到谣言的节点赋予+1,未收到谣言的节点赋予-1。
可选地,对所述初始标签值进行迭代,获得迭代标签值的过程中,基于每个所述节点与邻居之间谣言的传播情况进行计算,获得计算结果后进行迭代。
可选地,基于每个所述节点与邻居之间谣言的传播情况进行计算包括:
式(1)中α∈(0,1),β∈(α,1),T
W=D
式(2)中A为multiplex网络的超邻接矩阵;若节点i和节点j之间相互联系,则A中第i行第j列的元素为1,否则为0;D是A的度矩阵,D中第i行第i列的元素等于A第i行不为零的元素个数之和;
式(1)表示了节点i在时刻t从邻居处得到的标签值,与此同时节点i会保留一部分自己的初始标签值,那么节点i在t+1时刻的标签值用式(3)表示:
式(3)中
可选地,获得计算结果后进行迭代的过程中包括:在每一次所述迭代中遍历所有节点,当网络中所有节点的迭代标签值停止变化时,则停止迭代,否则继续执行迭代。
可选地,所述迭代标签值停止变化后,遍历所述社交网络中所有节点,对于每一个节点,若满足以下条件,则判断所述节点为谣言传播源:
停止传播时节点的初始标签值为正1;
在单源定位中,判断迭代标签值最大的节点为谣言传播源;
在多源定位中,判断迭代标签值大于所有邻居的节点为谣言传播源。
本发明的技术效果为:
本申请在多层社交网络上,通过观察点记录真实多通道传播路径,使得低传播率条件下传播路径随机性高的问题得到解决,从而提高了谣言传播源溯源精度。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例中的方法总流程图;
图2为本发明实施例中的双层multiplex网络示意图及其超邻接矩阵;
图3为本发明实施例中的经过观察点的标签值流动方向示意图;
图4为本发明实施例一的过程图;
图5为本方法在Citeseer网络上单源定位的结果图;
图6为本方法在Citeseer网络上多源定位的结果图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
实施例一
如图1-6所示,本实施例中提供一种基于多层社交平台的谣言传播源溯源方法,包括:
模型的具体实现过程如下:
S1.构建多层社交网络:
对于包含相同节点的不同社交平台,将每一个社交平台上的节点抽象为一个节点,把节点之间的联系抽象为边,不同社交平台上的相同节点默认由一条边连接。在这里规定一个节点i的邻居包括:与i在相同层有连边的节点和与i在不同层有连边的节点,即网络中所有与i有连边的节点。
S2.提前选取观察点:
在未爆发谣言之前,在网络中随机选取一定比例(θ%)的节点作为观察点,需要注意的是不同层上的相同节点有可能被同时选作观察点,因为现实中可以调查相同节点的不同社交账号的消息转发情况。这些观察点会在收到谣言时记录谣言散播者的ID地址。
S3.实时监控收到谣言的观察点数量:
谣言爆发后,当网络中η%的观察点收到谣言时获取此时的网络快照,快照中包含的信息有:网络的拓扑结构、网络中每个节点的状态(是否收到谣言)、观察点记录的谣言散播者ID地址。
S4.给每个节点赋予标签值:
根据每个节点的状态对其赋予标签值,已收到谣言的节点赋予+1,未收到谣言的节点赋予-1。
S5.标签值迭代过程:
给节点赋予标签值之后进行标签值迭代过程,在每一次迭代中遍历所有节点,对于节点之间的不同关系,规定迭代规则如下:
对于节点i和他的邻居j;如果j是一个观察点,并且他是被i感染的,那么节点i将从节点j那里得到式(1)中情况1对应的标签值。
在1)不成立的前提下,如果i不是观察点,或者i是观察点但不是被j感染的。那么节点i从j那里得到式(1)中情况2对应的标签值。
如果上述1)和2)的情况都不成立,那么节点i从节点j那里得到的标签值为0,即式(1)中的情况3。
综上,节点i从他的邻居j处得到的标签值可以用下式概括:
式(1)中α∈(0,1),β∈(α,1),T
W=D
式(2)中A为multiplex网络的超邻接矩阵,multiplex网络的超邻接矩阵如图2(b)所示;若节点i和节点j之间可以相互联系,则A中第i行第j列的元素为1,否则为0;D是A的度矩阵,也是一个对角矩阵,D中第i行第i列的元素等于A第i行不为零的元素个数之和。
式(1)表示了节点i在时刻t从他的邻居处得到的标签值,与此同时节点i会保留一部分自己的初始标签值,那么节点i在t+1时刻的标签值可以用式(3)表示:
式(3)中
S6.判断标签值是否收敛
当网络中所有节点的标签值都收敛,即不变时停止迭代过程,否则继续执行S5步骤。
S7.根据标签值选出传播源:
标签值收敛后,遍历网络中所有节点,对于每一个节点i,若i满足以下条件,则认为i是定位得到的传播源:
Y
在单源定位中,G
在多源定位中,节点i的标签值G
S8.测试分析:
测试采用与现有方法对比的方式来验证本模型的有效性。测试方法选取为第一节中提到的多层网络上的传播源定位方法。首先定义S是真实的传播源集合,
测试结果分析:无论是单源定位还是多源定位,定位的准确性都随着感染率的增大或者观察点比例的增大而提高。在单源定位中,本方法在基于观察点记录感染时间方法的基础上错误距离降低了22%左右。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
机译: 基于类别的数据分析系统,用于处理存储的数据单元并以示例性的精度计算其与主题领域的相关性,以及一种计算机实现的方法,用于从广泛的数据源中识别执行社交影响者功能的社交实体
机译: 社交网络关系信息提供服务器,用于跟踪和提供从市场平台和内容平台接收的数据的社交网络关系,以基于成员在服务环境中制作社交图,其信息提供方法
机译: 社交网络关系信息提供服务器,用于跟踪和提供从市场平台和内容平台接收的数据的社交网络关系,以基于成员在服务环境中制作社交图,其信息提供方法