首页> 中国专利> 基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法

基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法

摘要

本发明提出了一种基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,包括如下步骤:S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;S2,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;S3,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析,从而提高网络信息数据发展趋势的准确度。

著录项

  • 公开/公告号CN109508443A

    专利类型发明专利

  • 公开/公告日2019-03-22

    原文格式PDF

  • 申请/专利权人 重庆理工大学;

    申请/专利号CN201811352797.6

  • 发明设计人 刘小洋;何道兵;唐婷;

    申请日2018-11-14

  • 分类号

  • 代理机构重庆天成卓越专利代理事务所(普通合伙);

  • 代理人路宁

  • 地址 400054 重庆市巴南区红光大道69号

  • 入库时间 2024-02-19 08:11:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-10-11

    专利权的转移 IPC(主分类):G06F17/18 专利号:ZL2018113527976 登记生效日:20220923 变更事项:专利权人 变更前权利人:重庆理工大学 变更后权利人:北京天虞数智科技有限公司 变更事项:地址 变更前权利人:400054 重庆市巴南区红光大道69号 变更后权利人:100000 北京市海淀区黑泉路8号1幢1层1061

    专利申请权、专利权的转移

  • 2019-11-19

    授权

    授权

  • 2019-04-16

    实质审查的生效 IPC(主分类):G06F17/18 申请日:20181114

    实质审查的生效

  • 2019-03-22

    公开

    公开

说明书

技术领域

本发明涉及大数据分析领域,尤其涉及一种基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法。

背景技术

随着移动互联网的发展、5G时代的来临,在线社交网络越来越流行,人们的日常工作和生活已经离不开这些社交网络,随之产生的大量信息也充斥着网络,无论是谣言还是商品广告信息等都会在网络上蔓延,因而了解信息背后的传播机理能够帮助人们更好地管理和控制网络上信息的传播。

在线社交网络上的信息传播在诸多因素的影响下进行演化,既包括传播速度和扩散范围的演化也包括信息自身内容的演化。影响因素有很多,但归结起来不外乎信息自身特征、传播信息的网络用户的特征与行为、承载信息传播的社交网络的拓扑结构,以及信息传播的宏观环境。此外,社交媒体上信息传播有时还受到社会媒体服务所提供的信息推送功能的影响,比如Facebook的News Feed、新浪微博的即时推、腾讯视频的消息推荐等。这几个方面是在线社交网络中信息传播的关键因素,它们共同决定了信息传播与演化的行为与模式。

基于传染病的多信息建模方法是从用户的角度出发,认为用户以一定概率传播事件信息,传染病模型是信息传播领域公认比较成熟的模型,传统模型有SI、SIR、SIS,其中SIR模型是将人群分为易感者S状态、感染者I状态和治愈者R状态,信息从感染者传到易感者,易感者收到信息并成功转发后,自身转变为治愈者,完成个体状态的转换,直至系统达到一种稳定态。SIS和SIR模型产生了很多变体,如SIRS、SIDR和SAIR。但是这些模型均无法反映S状态节点转化为I状态节点之前有一个潜伏期的事实,为此将潜伏状态引入SIR模型,产生了SEIR模型。在此基础上,为了刻画信息传播中广泛存在的点到群的传播模式,提出了e-SEIR模型。随着研究工作的不断深入,传染病模型在许多实际应用领域得到了进一步的发展,例如,研究新产品在社交网络中扩散的Bass-SIR模型,恢复时间是幂律分布的SIR生命动力学模型,基于情感交流的HIT-SCIR模型和具有两个时滞和垂直转移的SEIRS模型。

但是,这些研究工作基本上都是将网络信息抽象为一种单一信息或同一类型的多信息在在线社交网络上传播,但现实网络中往往存在多种类型信息同时传播的情形,这些信息间可能具有合作或竞争的关系,即呈现出正相关或负相关的外在表现。现有技术所构造的模型无法实现相应的关联关系。

发明内容

本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法。

为了实现本发明的上述目的,本发明提供了一种基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,包括如下步骤:

S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;

S2,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;

S3,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析,从而收集训练网络信息数据发展趋势的准确度。

所述的基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,优选的,所述S1包括:

S1-1,假设在竞争性信息传播模型中,网络上同时存在A信息数据和B信息数据两种不同类型的信息,随着时间的变化进行竞争性传播;

S1-2,按信息传播过程中网络节点所处的状态,将网络节点划分为四类,分别为未传播任何信息节点的S状态、已经收到A信息并积极传播的节点的IA状态、已经收到B信息并积极传播的节点的IB状态、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点的R状态。

所述的基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,优选的,所述S1还包括:

S1-3,在线社交网络数据的网络节点状态空间为C={S,IA,IB,R},每一个网络节点的状态转换是一个相对随机的过程,下一时刻的状态与该节点的历史状态无关,只与当前状态有关,用分布函数来描述节点状态转换的马尔可夫性,用X表示网络节点状态转换的随机变量,随机过程{X(t),t∈T}的状态空间为C,T为离散的时间序列集合,在条件X(ti)=xi,xi∈C下,X(tn)的条件分布函数恰等于在条件X(tn-1)=xn-1下X(tn)的条件分布函数,下标n=1,2,3...i,即

P{X(tn)≤xn|X(t0)=x0,X(t1)=x1,…,X(tn-1)=xn-1}

=P{X(tn)≤xn|X(tn-1)=xn-1}

网络节点从状态u迁移到状态v的转移概率记为pij

pij=P{X(tn)=v|X(tn-1)=u}

S1-4,获得转移概率矩阵P;

X(tn)的状态

将竞争性信息数据传播模型的节点状态规则代入,则转移概率矩阵P简化为:

X(tn)的状态

在竞争性信息数据传播过程,一个网络节点从S随机状态X(ts)=S出发,在ti时刻转化为IA状态X(ti)=IA或IB状态X(ti)=IB,再经过若干个时间步的竞争,最后在tn时刻转化为R状态X(tn)=R,从此退出竞争而网络节点状态不再改变,直至传播过程结束;

在t∈(ti,tn)期间,由于A信息和B信息相互竞争,一个IA网络状态节点可能转化为IB网络状态节点,或者一个IB网络状态节点可能转化为IA网络状态节点;在这个随机过程中,转移概率矩阵P只与节点状态和时间t有关,节点状态的n步转移概率矩阵P(n)为P(n)=Pn,即竞争性信息传播过程中,n步转移概率矩阵P(n)是一步转移概率矩阵P的n次方。

所述的基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,优选的,所述S2包括:

S2-1,对于在线社交网络数据的传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件信息所引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的数据传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触数据并逐渐形成遗忘数据或者不活跃数据,转化为R状态;最终,在线社交网络数据将处于稳定状态,在整个信息传播过程中,A信息和B信息之间相互博弈、对抗竞争和持续影响。

所述的基于在线社交网络数据的竞争性信息宏观传播模型工作方法,优选的,所述S2还包括:

S2-2,在属于竞争性信息异步传播模式下,在t1时刻A信息出现在网络上并迅速扩散传播,被A信息覆盖的网络节点处于IA状态;在某i时刻ti,B信息也在网络上传播,被B信息覆盖的节点处于IB状态,B信息会抑制A信息的进一步蔓延,后期会取代A信息,即能够使IA状态转化为IB状态,竞争过程中也存在IB状态节点转化为IA状态的情形;在线社交网络数据信息传播过程被划分为两个阶段,第一阶段是网络上只有A信息的单一信息传播阶段,在单一信息传播阶段,CISIR模型退化为普通SIR模型。

所述的基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,优选的,所述S2还包括:

S2-3,第二阶段是网络同时存在A信息和B信息的信息竞争传播阶段,即在线社交网络数据信息竞争传播阶段,传播行为与竞争性信息同步传播模式相同,

设定在线社交网络是封闭网络,信息在网络中产生,而且仅在该网络中传播,期间网络上节点总量为N是稳定的,每个时刻变化的是网络中各种状态类型节点所占的比例,t时刻网络中S,IA,IB,R状态节点的数量分别为S(t),IA(t),IB(t),R(t),用表示一个节点在某一时刻的状态,对于整个网络则有

其中,S(t)+IA(t)+IB(t)+R(t)=N,N为常数

根据平均场理论,CISIR信息传播宏观模型在在线社交网络中传播演化过程表示的微分方程组所示:

λ12分别表示A信息、B信息的传播概率;θ12分别表示A信息、B信息被对方信息取代的置换率;δ1和δ2分别表示节点对A信息、B信息的遗弃率。

所述的基于在线社交网络数据的竞争性信息宏观传播模型工作方法,优选的,所述S3包括:

S3-1,对于CISIR信息传播模型微分方程组,将四个方程两端分别相加,得

从而使模型满足

S(t)+IA(t)+IB(t)+R(t)=N,其中N为常数,

根据不含R状态下的计算方法,得到如下公式:

假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有

所述的基于在线社交网络数据的竞争性信息宏观传播模型提取工作方法,优选的,所述S3还包括:

S3-2,用P(k)表示在线社交网络的度分布函数,该分布函数表示选定一个在线社交网络数据信息节点,其度值恰好为k的概率,也就是该节点恰有k条边连接的概率,即公式:

设平衡点E=(S,IA,IB)T,求解上式得到方程组的三个解E0,En,Et,这三个解都是CISIR传播模型的平衡点,E0,En,Et的具体表示分别为:

S-A,E0=(1,0,0)T,初始状态,无信息传播时的平衡点;

S-B,终止状态,信息已经传遍整个网络后的平衡点;

S-C,在前提下,表示信息在竞争传播过程中,系统达到暂时稳定状态的平衡点;

为了描述的方便,对

中的部分表达式进行变量替换,令

其中,μ1为A信息传播率与在线社交网络的度分布函数的乘积,μ2为B信息传播率与在线社交网络的度分布函数的乘积,v1为A信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,v2为B信息被对方信息取代的置换率与在线社交网络的度分布函数的乘积,

然后再对

的每个变量求偏导数,得到方程组的对应矩阵:

综上所述,由于采用了上述技术方案,本发明的有益效果是:

提出的竞争性信息传播宏观模型CISIR是合理、有效的,为解决在线社交网络上不同类型信息的竞争性传播这一类问题提供了一种新的科学方法和研究途径,具有较高的应用价值,能够很好地描述复杂网络的传播特性,通过该CISIR宏观传播模型挖掘出在线网络数据的正相关关联数据,对于数据收集整理提供了极大的帮助,形成独特的数据流分析效果,同时对于在线网络数据的各项信息因素在传播中所具有的影响力提供了初步判断,并发现该信息因素的发展规律,通过进行稳定性分析之后能够对在线社交网络数据进行更加精确筛选,保证数据的鲁棒性。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是本发明数据结构节点状态转换示意图;

图2是本发明节点状态转化过程图;

图3是本发明单一信息传播阶段的节点状态转换关系图;

图4是本发明总体流程图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

本发明是基于在线社交网络的竞争性信息传播宏观模型CISIR(CompetitiveInformation Susceptible Infected Recovered)提出的技术方案。

假设在竞争性信息传播模型中,网络上同时存在A信息和B信息两种不同类型的信息,随着时间的变化进行竞争性传播。按信息传播过程中网络节点所处的状态,可将节点划分为四类,分别为未传播任何信息节点(S状态)、已经收到A信息并积极传播的节点(IA状态)、已经收到B信息并积极传播的节点(IB状态)、已失去信息传播兴趣对所有信息持抵制态度的遗弃状态节点(R状态)。

如图1-3所示,λ1和λ2分别表示A信息和B信息的信息传播概率,刻画一个未传播任何信息状态下的节点对某种类型信息的响应程度,传播率越高,表示该节点有更高的可能性去选择传播该条信息。δ1和δ2分别表示对A信息和B信息的遗弃率,随着时间的推移,节点会逐渐对传播过的信息失去兴趣,在沉寂中慢慢遗忘。θ1和θ2分别表示A信息和B信息的置换率,即相互影响力,θ1越大,则表示B信息的吸引力更大,能把传播A信息的节点状态转化为传播B信息;反之,θ2越大,则表示A信息的吸引力更大,能把传播B信息的节点状态转化为传播A信息。

如图4所示,本发明提供了一种基于在线社交网络数据的竞争性信息宏观传播模型工作方法,包括如下步骤:

S1,获取在线社交网络信息数据,对于A信息数据处于在线社交网络上传播扩散时,匹配B竞争性的信息数据来抑制A信息数据的蔓延,遏制A信息的进一步传播扩散,对A信息数据和B信息数据进行竞争性信息数据分析;

S2,建立竞争性信息宏观传播模型,选择B信息数据的时间点和空间节点以最大限度地抑制A信息数据传播,将A信息数据和B信息数据共同传播时的规律以及传播过程中的影响发送到远程终端;

S3,将在线网络数据经过宏观传播模型筛选后的数据进行网络数据稳定性分析,从而收集训练网络信息数据发展趋势的准确度。

由上述转化规则可知,网络节点的状态空间C={S,IA,IB,R},每一个节点的状态转换是一个相对随机的过程,下一时刻的状态与该节点的历史状态无关,只与当前状态有关,也就是说节点的“将来”不依赖于“过去”,仅由“现在”决定,整个传播过程可以看成一个马尔可夫随机过程。因此,可用分布函数来描述节点状态转换的马尔可夫性,用X表示节点状态转换的随机变量,随机过程{X(t),t∈T}的状态空间为C,T为离散的时间序列集合,在条件X(ti)=xi,xi∈C下,X(tn)的条件分布函数恰等于在条件X(tn-1)=xn-1下X(tn)的条件分布函数,即

因此,竞争性信息传播过程本质上是每一个网络节点在状态空间C中不断进行状态转换的马尔可夫链。节点从状态u迁移到状态v的转移概率记为pij

pij=P{X(tn)=v|X(tn-1)=u}(14)

由此可获得转移概率矩阵P。

X(tn)的状态

将竞争性信息传播模型的节点状态规则代入(15)式,则转移概率矩阵P可简化为

X(tn)的状态

在竞争性信息传播过程,一个节点从S状态X(ts)=S出发,在ti时刻转化为IA状态X(ti)=IA或IB状态X(ti)=IB,再经过若干个时间步的竞争,最后在tn时刻转化为R状态X(tn)=R,从此退出竞争而节点状态不再改变,直至传播过程结束,如图3所示。

在t∈(ti,tn)期间,由于A信息和B信息相互竞争,一个IA状态节点可能转化为IB状态,或者一个IB状态节点可能转化为IA状态。在这个随机过程中,转移概率矩阵P只与节点状态和时间t有关,因此,竞争性信息传播过程是齐次的马尔可夫链,根据C-K方程(Chapman-Kolmogorov>n。

也就是说,竞争性信息传播过程中,n步转移概率矩阵P(n)是一步转移概率矩阵P的n次方。从而可知,竞争性信息传播过程中网络节点状态的分布可由初始分布与一步转移概率完全确定。

宏观传播模型就是用统计的方法从系统层面去构建CISIR信息传播过程的模型。传播初始状态是网络中所有节点均处于未传播任何信息状态,即S状态;在某时刻由外部事件引发的A信息和B信息同时注入网络,随即在网络上分别沿各自的传播路径进行扩散传播,被A信息覆盖的节点处于IA状态,被B信息覆盖的节点处于IB状态,当两种类型的信息在IA状态或IB状态节点上相遇后,会在该节点上形成竞争和驱逐关系;随着时间的推移,节点慢慢对信息失去兴趣,进入信息传播疲惫期,开始产生抵触心理并逐渐遗忘,转化为R状态,最终,网络系统将处于一个稳定状态。在整个信息传播过程中,两种类型信息之间相互博弈、对抗竞争和持续影响。容易看出,这种传播方式本质上属于竞争性信息同步传播模式。

在现实环境中,更多的情况属于竞争性信息异步传播模式,在t1时刻A信息出现在网络上并迅速扩散传播,被A信息覆盖的节点处于IA状态;在某一时刻ti,B信息也在网络上传播,被B信息覆盖的节点处于IB状态,B信息会抑制A信息的进一步蔓延,甚至有可能会取代A信息,即能够使IA状态节点转化为IB状态,当然,竞争过程中也存在IB状态节点转化为IA状态的情形;随着时间的推移,节点逐渐转化为R状态,最终,网络系统会达到一个稳定状态。

从竞争性信息异步传播模式可以看出,信息传播过程被划分为两个阶段,第一阶段是网络上只有A信息的单一信息传播阶段,第二阶段是网络同时存在A信息和B信息的信息竞争传播阶段。在单一信息传播阶段,CISIR模型退化为普通SIR模型,此时网络节点的状态转换关系如图3所示为单一信息传播阶段的节点状态转换关系。

在传播过程的第二阶段,即信息竞争传播阶段,传播行为与竞争性信息同步传播模式相同。

假设在线社交网络是一个封闭网络,信息在网络中产生,而且仅在该网络中传播,期间网络上节点总量为N是稳定的,每个时刻变化的是网络中各种状态类型节点所占的比例。t时刻网络中S,IA,IB,R状态节点的数量分别为S(t),IA(t),IB(t),R(t)。用表示一个节点在某一时刻的状态,对于整个网络则有

其中,S(t)+IA(t)+IB(t)+R(t)=N。

根据平均场理论,CISIR信息传播宏观模型在在线社交网络中传播演化过程可表示成微分方程组所示:

λ12分别表示A信息、B信息的传播率;θ12分别表示A信息、B信息被对方信息取代的置换率;δ1和δ2分别表示节点对A信息、B信息的遗弃率。

容易看出,宏观CISIR概率模型揭示了内在传播规律和演化机制。

形成模型稳定性分析方法,在受到的在线社交网络数据扰动作用消除后,经过一段过渡过程以后能否回到原来的平衡状态或足够准确地返回到之前的平衡态。如果系统能够恢复到此前的平衡状态,那么称该系统是稳定的;若扰动消失后系统不能恢复到原来的平衡状态,反而偏差变得更大,则称该系统是不稳定的。

其中步骤3包括:S3-1,对于CISIR信息传播模型微分方程组,将四个方程两端分别相加,得

从而使模型满足

S(t)+IA(t)+IB(t)+R(t)=N,其中N为常数,

根据不含R状态下的计算方法,得到如下公式:

假设在t时刻网络达到平衡点,那么网络将处于平衡态,因此有

优选的,S3-2,用P(k)表示在线社交网络的度分布函数,该分布函数表示选定一个在线社交网络数据信息节点,其度值恰好为k的概率,也就是该节点恰有k条边连接的概率,即公式:

设平衡点E=(S,IA,IB)T,求解上式得到方程组的三个解E0,En,Et,这三个解都是CISIR传播模型的平衡点,E0,En,Et的具体表示分别为:

A,E0=(1,0,0)T,初始状态,无信息传播时的平衡点;

B,终止状态,信息已经传遍整个网络后的平衡点;

C,在前提下,表示信息在竞争传播过程中,系统达到暂时稳定状态的平衡点;

为了描述的方便,对

中的部分表达式进行变量替换,令

然后再对

的每个变量求偏导数,得到方程组的对应矩阵:

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号