法律状态公告日
法律状态信息
法律状态
2023-02-03
公开
发明专利申请公布
技术领域
本发明属于网络舆情分析领域,具体涉及一种基于辟谣和促谣信息的谣言传播预测方法。
背景技术
随着互联网技术的快速发展,网络已经取代传统媒体成为信息传播的重要媒介。由于社交网络的复杂性和便利性,容易形成谣言传播的蝴蝶效应,在短时间内使得谣言迅速传播,对公共社会的危害呈几何倍数增长。在传统的谣言传播研究中,并未考虑促谣信息以及谣言话题内多消息的相互作用对谣言传播过程的影响。因此,研究社交网络中谣言传播过程,建立合适的网络谣言传播模型,更好的挖掘影响多类型谣言信息传播的因素,对有效控制网络舆情具有重大意义。
近年来,学者们已经针对谣言的传播模型进行广泛的研究,主要是基于SIR传染病模型和机器学习算法模型。基于SIR传染病的预测模型主要是将用户状态分为三类:易感者(S),感染者(I),免疫者(R)。S状态表示不知道谣言并容易被谣言传染的用户,I状态表示接触过谣言并且积极传播谣言的用户,R状态表示接触过谣言但不传播谣言的用户。基于机器学习算法模型从用户行为模式出发,通过提取传播网络中用户的特征,将问题转化为分类或回归问题来构建谣言传播预测模型。
由于社交网络上的谣言传播可以看作是一种特殊的传染病传播,因此使用SIR传染病模型进行谣言传播的预测有极好的效果。Liu等人在(Liu F,Buss M.Optimal controlfor heterogeneous node-based information epidemics over social networks[J].IEEE Transactions on Control of Network Systems,2020,7(3):1115-1126.)提出了一种基于异质节点的SIRS模型,该模型考虑了网络结构的异质性和个体特征的异质性,并针对阻止谣言传播的情景提出了最优控制框架。
学者们围绕谣言传播预测模型展开了一系列的研究,并取得了相当不错的成功,但仍存在一些技术问题:
1.多类型谣言信息的共存和对立性。同一话题下的谣言、辟谣和促谣信息在传播过程中产生的共存和对抗性必然会影响谣言的传播速度和传播态势,如何衡量消息之间的竞争与合作关系是一个难点。
2.用户认知的差异性。在社交网络中,用户在接触到多类型谣言信息时会因为认知的差异而产生不同的传播状态,因此需要考虑辟谣和促谣信息的对用户状态特征的影响。
发明内容
为了解决背景技术中存在的问题,本发明提供一种基于辟谣和促谣信息的谣言传播预测方法,包括:
S1:通过社交网络提供的API接口获取目标话题数据以及参与目标话题的用户信息数据;所述目标话题数据包括:谣言博文数据、辟谣博文数据、促谣博文数据、常规博文数据、谣言博文的发布时间、辟谣博文的发布时间和促谣博文的发布时间;所述用户信息数据包括:用户之间的好友关系、用户对谣言博文、辟谣博文、促谣博文和常规博文的转发次数和转发时间、用户发布的博文数据和用户发布博文的时间;
S2:根据谣言博文发布之前用户对常规博文的转发次数和用户发布的博文数量计算用户的积极度;
S3:利用TF-IDF算法提取用户发布的博文中的高频词汇、谣言博文中的关键词、辟谣博文中的关键词以及促谣博文中的关键词并计算用户与谣言博文、辟谣博文以及促谣博文的兴趣吻合度;
S4:根据用户好友的积极度;用户与谣言博文、辟谣博文以及促谣博文的兴趣吻合度;用户对谣言博文、辟谣博文、促谣博文的转发次数和转发时间利用多元线性回归模型计算谣言博文、辟谣博文和促谣博文对用户的影响力;
S5:根据谣言博文、辟谣博文、促谣博文对用户的影响力和用户的好友中转发谣言博文、辟谣博文、促谣博文的用户数量利用博弈论原理和二项分布计算得到用户转发谣言博文、辟谣博文、促谣博文的概率;
S6:根据用户转发谣言博文、辟谣博文和促谣博文的概率利用平均场理论构建传播动力学模型预测谣言博文的传播趋势。
本发明至少具有以下有益效果
本发明提出一种基于辟谣和促谣信息的谣言传播预测方法,将辟谣和促谣信息引入到谣言传播过程中,不仅可以更准确的预测出谣言的传播趋势,还可以分析出辟谣和促谣信息对整个谣言话题传播态势的影响,通过构建谣言-辟谣-促谣三方博弈驱动机制,刻画用户在认知过程中产生的心理博弈过程并量化用户状态转换驱动力,综合考虑用户好友的影响作用,计算最终的谣言、辟谣和促谣转发概率,通过传染病模型建立基于辟谣、促谣信息的谣言传播预测模型,该模型表示多类型谣言信息的传播态势以及用户是否参与谣言话题转发,可应用于社交网络中谣言传播预测和控制,舆情部门可以更及时和精确的对网络谣言进行监控和控制,并在合理的时间进行引导和抑制。也可用于企业产品和服务的推广,有助于广告在目标群体的快速推广和扩散,提升广告的曝光度以及品牌知晓度,以此获得良好的经济社会效益。
说明书附图
图1为本发明的方法流程图;
图2为本发明谣言博文、辟谣博文、促谣博文对用户的影响力示意图;
图3本发明用户转发谣言博文、辟谣博文、促谣博文的驱动力示意图。
具体实施方法
为了更好地阐述本发明的技术方案并使优点更加简明清晰,下面先对本发明要解决的问题进行具体解释,再参照说明书附图,对本发明的具体实施方式做进一步详细说明。
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1,本发明提供一种基于辟谣和促谣信息的谣言传播预测方法,包括:
S1:通过社交网络提供的API接口获取目标话题数据以及参与目标话题的用户信息数据;所述目标话题数据包括:谣言博文数据、辟谣博文数据、促谣博文数据、常规博文数据、谣言博文的发布时间、辟谣博文的发布时间和促谣博文的发布时间;所述用户信息数据包括:用户之间的好友关系、用户对谣言博文、辟谣博文、促谣博文和常规博文的转发次数和转发时间、用户发布的博文数据和用户发布博文的时间;所述目标话题包括:军事、体育、娱乐等话题;
例如,谣言博文表示为在军事话题下用户发表的与事实不符合的博文;所述辟谣博文表示在军事话题下用户发表的对谣言博文澄清的博文即证实谣言博文与事实不相符合的博文;所述促谣博文表示在军事话题下用户发表的与谣言博文和辟谣博文都不符合但相关的博文;
对获取的目标话题数据进行简单的数据清洗,包括删除原始谣言数据中的空值或异常值;通常获取数据都是非结构化的,不能直接用于数据分析,通过简单的数据清洗可以使大部分非结构化数据结构化,例如对数据的时间格式进行统一,删除部分数据为空值或异常值。
将已经清洗过的原始谣言数据存储在本地数据库中,通过表结构对数据进行统一规范化存储和命名,提高对原始谣言数据的检索复用效率以及表间关系的映射。
S2:根据谣言博文发布之前用户对常规博文的转发次数和用户发布的博文数量计算用户的积极度;
Active(v
其中,Act(v
S3:利用TF-IDF算法提取用户发布的博文中的高频词汇、谣言博文中的关键词、辟谣博文中的关键词以及促谣博文中的关键词并计算用户与谣言博文、辟谣博文以及促谣博文的兴趣吻合度;
其中,A表示用户发布的所有博文中的高频词汇,B
S4:根据用户好友的积极度;用户与谣言博文、辟谣博文以及促谣博文的兴趣吻合度;用户对谣言博文、辟谣博文、促谣博文的转发次数和转发时间利用多元线性回归模型计算谣言博文、辟谣博文和促谣博文对用户的影响力;
S41:根据用户好友的积极度;用户与谣言博文、辟谣博文以及促谣博文的兴趣吻合度计算用户受谣言博文、辟谣博文以及促谣博文的推动力;
Push
Push
Push
其中,Mat
S42:根据用户对谣言博文、辟谣博文、促谣博文的转发次数和转发时间计算谣言博文、辟谣博文、促谣博文的流行度;
其中,RumNum(t)表示在t时刻谣言博文的转发次数,RumNum(t-1)表示在t-1时刻谣言博文的转发次数,AntNum(t)表示在t时刻辟谣博文的转发次数,AntNum(t-1)表示在t-1时刻辟谣博文的转发次数,ProNum(t)表示在t时刻促谣博文的转发次数,ProNum(t-1)表示在t-1时刻促谣博文的转发次数,t
请参阅图2,S43:根据用户的积极度、用户受谣言博文的推动力、用户受辟谣博文的推动力、用户受促谣博文的推动力、谣言博文的流行度、辟谣博文的流行度和促谣博文的流行度利用多元线性回归模型计算谣言博文、辟谣博文、促谣博文对用户的影响力:
Eff
Eff
Eff
其中,ρ
S5:根据谣言博文、辟谣博文、促谣博文对用户的影响力和用户的好友中转发谣言博文、辟谣博文、促谣博文的用户数量利用博弈论原理和二项分布计算得到用户转发谣言博文、辟谣博文、促谣博文的概率;
S51:根据谣言博文、辟谣博文和促谣博文对用户的影响力和用户的好友中转发谣言博文、辟谣博文、促谣博文的用户数量利用博弈论原理计算得到用户转发谣言博文、辟谣博文、促谣博文的收益;
其中,N为用户v
请参阅图3,S52:根据用户转发谣言博文、辟谣博文、促谣博文的收益利用博弈论原理计算用户转发谣言博文、辟谣博文、促谣博文的驱动力;
其中,Pro
S53:根据用户对谣言博文、辟谣博文、促谣博文的驱动力,用户的好友中转发谣言博文、辟谣博文、促谣博文的用户数量利用二项分布计算用户转发谣言博文、辟谣博文、促谣博文的概率:
其中,m
S6:根据用户转发谣言博文、辟谣博文和促谣博文的概率利用平均场理论构建传播动力学模型预测谣言博文的传播趋势。
S61:根据用户在社交网络中对博文的转发状态将用户划分为易感状态、传谣状态、辟谣状态、促谣状态、免疫状态;当易感用户接触谣言博文时有概率成为传谣状态、当易感用户接触辟谣博文时有概率成为辟谣状态、当易感用户接触促谣博文时有概率成为促谣状态、促谣用户有几率变成传谣状态和辟谣状态、并且传谣用户、辟谣用户、促谣用户有几率免疫状态,可以根据实际情况和本领域技术人员设置变化几率,将用户按照比例进行划分。
S62:基于平均场理论构建传播动力学模型;
S63:根据用户转发谣言博文、辟谣博文、促谣博文的概率利用传播动力学模型预测当前时刻转发谣言博文、辟谣博文、促谣博文用户的比例得到谣言博文的传播趋势:
其中,S(t)表示t时刻处于免疫状态的用户占比,I(t)表示t时刻处于传谣状态的用户占比,A(t)表示t时刻处于辟谣状态的用户占比,P(t)表示t时刻处于促谣状态的用户占比,R(t)表示t时刻处于免疫状态的用户占比,m
通过本发明的预测模型的输出结果,能够对当前谣言话题下的谣言、辟谣和促谣信息的传播趋势进行预测,并且得到每个时刻参与话题用户的状态比例。
相关舆情部门可以通过预测的态势图对谣言话题的传播趋势进行了解,并通过不同时间的用户状态比例来选择合适的时间发布辟谣信息,或限制发布促谣信息中影响力较大的用户转发信息来抑制谣言的传播。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其各种各样的改变,而不偏离本发明权利要求书所限定的范围。
机译: 基于谣言预测模型的信息发送方法和装置和计算机设备
机译: 一种用于确定当前块的运动信息的方法,一种用于构建和更新基于历史的运动矢量预测器的列表的方法,以及用于编码/解码视频的非暂时性计算机可读存储介质的方法和装置
机译: 一种通过将经由V2V通信获取的信息与经由摄像头获取的信息融合而更精确地执行摄像头的俯仰校准,从而提供基于摄像头的鲁棒物距预测的方法。设备使用