首页> 中国专利> 一种基于普遍认知与个体认知的虚假新闻检测系统及方法

一种基于普遍认知与个体认知的虚假新闻检测系统及方法

摘要

本发明公开了一种基于普遍认知与个体认知的虚假新闻检测系统及方法,包括:输入虚假新闻内容序列和若干相关文章序列;捕获一致性句子级序列并将其整合,生成自洽的全局证据序列;捕获相关文章的高层表示,并对其进行过滤,筛选出前k个具有差异性的相关文章,使得虚假新闻与每个筛选的相关文章进行互相交互,挖掘局部证据片段;惩罚生成的全局证据序列与局部证据片段之间的不一致性,实现可解释性虚假新闻的检测。本发明从普遍认知视角来探索相关文章中的全局自洽的证据,从个体认知视角挖掘相关文章中关键证据片段,借助一致性损失对两种证据特征进行约束,从而捕获公共可用的证据来进行可解释性虚假新闻检测。

著录项

  • 公开/公告号CN112966069A

    专利类型发明专利

  • 公开/公告日2021-06-15

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN202110045007.5

  • 发明设计人 饶元;吴连伟;孙菱;陈顺;

    申请日2021-01-13

  • 分类号G06F16/33(20190101);G06F40/211(20200101);G06F40/284(20200101);G06F40/30(20200101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构61200 西安通大专利代理有限责任公司;

  • 代理人朱海临

  • 地址 710049 陕西省西安市咸宁西路28号

  • 入库时间 2023-06-19 11:26:00

说明书

技术领域

本发明涉及一种基于普遍认知与个体认知的虚假新闻检测系统及方法。

背景技术

由于社交媒体上广泛传播的低可信度新闻,已经严重地影响了社交媒体中受 众群体的正常的网络分享与社交活动,以及社交媒体的健康发展,并受到了IT与 数字网络行业的广泛关注。因此,如何对社交媒体中传播的虚假新闻进行及时有 效地检测,已经成为社交媒体领域的亟需解决的问题。

当前的虚假新闻检测研究可大致分为两类:第一种类型是借助包括SVM、 决策树等算法传统机器学习模型以及CNN、RNN在内的深度学习模型来围绕虚 假新闻内容捕获其N元语法、深层语义、情感、写作风格以及立场等特征,或者 通过学习社交上下文的元数据中基于用户的和基于传播的特征来进行虚假新闻 检测。这类方法所具有的优势是能够充分挖掘出有效特征来提高模型的性能,但 普遍存在的缺点是很难提供一个合理的证据来对虚假新闻的检测结果进行解释。 为了解决这一关键问题,许多研究者进一步致力于可解释的虚假新闻检测方法研 究,通常的做法是通过建立虚假新闻与相关文章的交互模型来探索两者之间的交 互关系,包括一致性序列、相似性语义、显著词特征、相关冲突语义等来作为证 据从而解释虚假新闻的检测结果。这些方法体现了一定的可解释性,但同样存在 着一些缺陷。由于不同的相关文章体现的是不同用户个体的认知,虚假新闻与相 关文章的直接交互通常局限在个体认知视角,而个体认知存在着比较大的局限性, 如认知偏差、确认偏差等片面性。因此,这种直接交互所捕获到的语义包含了许 多主观的、有偏见的、甚至有误导性的证据片段,影响模型检测结果的可解释性。 因此,如何从一个更加全局的视角挖掘出相关文章中的证据片段,并对检测结果 提供合理的解释,则是目前基于可解释性的虚假新闻检测领域中的一个关键问题。

发明内容

本发明的目的在于解决现有技术中的问题,提供一种基于普遍认知与个体认 知的虚假新闻检测系统及方法,本发明从普遍认知视角来探索相关文章中的全局 自洽的证据,从个体认知视角来挖掘相关文章中关键证据片段,借助一致性损失 对两种证据特征进行约束,从而捕获公共可用的证据来进行对虚假新闻检测提供 可解释性。

为达到上述目的,本发明采用以下技术方案予以实现:

一种基于普遍认知与个体认知的虚假新闻检测方法,包括以下步骤:

步骤1,输入虚假新闻内容序列和若干相关文章序列;

步骤2,捕获一致性句子级序列并将其整合,生成自洽的全局证据序列;

步骤3,捕获相关文章的高层表示,并对其进行过滤,筛选出前k个具有差 异性的相关文章,使得虚假新闻与每个筛选的相关文章进行互相交互,挖掘局部 证据片段;

步骤4,惩罚生成的全局证据序列与局部证据片段之间的不一致性,实现可 解释性虚假新闻的检测。

本发明进一步的改进在于:

所述步骤1中,通过预训练模型BERT嵌入表示虚假新闻内容序列

所述步骤2的具体方法如下:

构建基于虚假新闻内容指导的编码器来捕获一致性句子级序列,整合这些句 子级序列到层次注意力解码器中生成自洽的全局证据序列。

所述虚假新闻内容指导的编码器包括序列编码层和基于注意力的匹配层;序 列编码层用于学习所有相关文章序列以及虚假新闻序列的上下文表示;基于注意 力的匹配层用于将虚假新闻内容的相关内容聚合到相关文章的上下文中,输出每 个相关文章的最后一个词对应的隐藏层特征作为一致性句子级表示;

序列编码层利用BiLSTM网络编码所有相关文章序列以及虚假新闻序列,获 得其上下文表示;针对相关文章的隐藏状态

基于注意力的匹配层的聚合操作

其中,a

所述层次注意力解码器采用单向LSTM并行地计算基于句子级注意力权重β 以及基于词级注意力权重α:

其中,β

计算在所有单词表V上生成的当前步骤的词的概率:

其中,W

生成长度为o的全局自洽的全局证据序列G={g

所述步骤3的具体方法如下:

采用句子级表示单元捕获相关文章的高层表示特征,采用选择机制单元筛选 前k个具有高度差异性的代表性的相关文章,采用共同交互单元使虚假新闻内容 与筛选的文章进行交互,挖掘局部证据片段。

所述句子级表示单元利用BiLSTM网络来编码每个相关文章并捕获该网络 的最后隐藏状态作为句子级的表示;

所述选择机制单元学习并优化一个内部句子级注意力矩阵

其中,1≤m,n≤R且m≠n,u

共同交互单元通过交互使得虚假新闻内容聚焦第i篇文章,第i篇文章通过交 互更多的关注虚假新闻内容的出错部分;最终将这两种交互结果合成基于个体认 知视角的关键证据序列:

对于前k篇文章,通过拼接操作整合所有的局部证据片段I:

I=[I

所述步骤4中,采用KL差分算法作为全局证据序列G与局部证据片段I之间 的不一致损失函数:

其中,D

对这全局证据序列G和局部证据片段I进行融合,并采用softmax激活函数得 到概率分布,然后与真值标签与比较,借助最小化的交叉熵误差作为损失:

F=[G;I] (18)

p=softmax(W

Loss=-∑ylogp (20)

其中,F为全局证据与局部证据的整合语义,y为新闻序列的真实标签,p为 概率向量,W

将所有损失联合进行训练,得到进行虚假新闻检测的总损失L:

L=Loss+αLoss

其中,α为超参数。

一种基于普遍认知与个体认知的虚假新闻检测系统,包括:

输入表示模块,所述输入表示模块用于输入虚假新闻内容序列和若干相关文 章序列;

基于普遍认知视角的编解码模块,所述基于普遍认知视角的编解码模块用于 捕获一致性句子级序列并将其整合,生成自洽的全局证据序列;

基于个体认知视角的选择性交互模块,所述基于个体认知视角的选择性交互 模块用于捕获相关文章的高层表示,并对其进行过滤,筛选出前k个具有差异性 的相关文章,使得虚假新闻与每个筛选的相关文章进行互相交互,挖掘局部证据 片段;

基于双视图的分类模块,所述基于双视图的分类模块用于惩罚生成的全局证 据序列与局部证据片段之间的不一致性,实现可解释性虚假新闻的检测。

与现有技术相比,本发明具有以下有益效果:

本发明是一种基于普遍认知与个体认知双视图的虚假新闻可解释性检测方 法,本发明受跨学科知识的启发,从一个全新的视角,提出了一种基于普遍认知 与个体认知双视图的虚假新闻可解释性检测方法(UICD),其从普遍认知视角来 探索相关文章中的全局自洽的证据,从个体认知视角挖掘相关文章中关键证据片 段,借助一致性损失对两种证据特征进行约束,从而捕获公共可用的证据来进行 可解释性虚假新闻检测。本发明不仅提高了虚假新闻检测性能,还提供了有效的 证据实现检测结果的可解释性。

进一步的,本发明将跨学科知识有机融合到神经网络模型中来探索可解释性 虚假新闻检测,其中跨学科知识能够作为虚假新闻检测的可解释性理论依据。

进一步的,本发明从普遍认知视角与个体认知视角两个角度分别探索了全局 自洽证据以及局部关键性证据,其能够有效地解释虚假新闻的检测结果。

进一步的,本发明基于普遍认知视角的模块生成的全局自洽的证据借助不一 致损失能够有效地弱化基于个体视角捕获的局部证据序列片段中的偏差语义。

进一步的,本发明在两个具有竞争力的虚假新闻检测数据集上进行广泛的实 验证实了本发明的有效性以及可解释性。

附图说明

为了更清楚的说明本发明实施例的技术方案,下面将对实施例中所需要使用 的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此 不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳 动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明的架构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实 施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所 描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中 描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求 保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施 例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一 项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本发明实施例的描述中,需要说明的是,若出现术语“上”、“下”、“水平”、 “内”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发 明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述, 而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和 操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于 区分描述,而不能理解为指示或暗示相对重要性。

此外,若出现术语“水平”,并不表示要求部件绝对水平,而是可以稍微倾 斜。如“水平”仅仅是指其方向相对“竖直”而言更加水平,并不是表示该结构 一定要完全水平,而是可以稍微倾斜。

在本发明实施例的描述中,还需要说明的是,除非另有明确的规定和限定, 若出现术语“设置”、“安装”、“相连”、“连接”应做广义理解,例如,可以是固 定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连 接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连 通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明 中的具体含义。

下面结合附图对本发明做进一步详细描述:

参见图1,本发明实施例公开了一种基于普遍认知与个体认知的虚假新闻检 测系统,包括:

输入输出表示模块:包含两种类型的输入,即虚假新闻内容序列以及不同的 单个相关文章序列,主要通过预训练模型进行嵌入表示;

基于普遍认知视角的编解码模块(UED):通过虚假新闻指导的编码器来捕 获一致性句子级序列,并将它们整合到层次性注意力解码器中,从而生成自洽的 证据序列;

基于个体认知视角的选择性交互模块(ISC):通过句子级表示模块来捕获相 关文章的高层表示,然后通过选择机制对相关文章进行过滤,从而筛选出前k个 具有高度差异性的且有代表性的相关文章,最后利用共同交互单元使得虚假新闻 与每个筛选的代表性的文章进行互相交互,从而挖掘局部的关键的证据片段;

基于双视图的分类模块:利用非一致性损失来惩罚生成的全局证据以及局部 证据片段之间的差异,从而缓解基于个体认知证据片段中的偏见。

本发明实施例还公开了一种基于普遍认知与个体认知的虚假新闻检测方法, 包括以下步骤:

步骤1:对于本实施例的输入表示,基于普遍认知视角的编解码模块(UED) 以及基于个体认知视角的选择性交互模块(ISC)都是由两种类型的输入序列特 征,即分别为虚假新闻内容序列以及R个相关文章序列。

步骤2:对于任意一个长度为l的序列,其可表示为X={x

步骤3:对于本发明的输出特征,UED模块的输出特征是生成长度为o的全 局自洽的证据序列G={g

步骤4:为了从相关文章中捕获全局自洽的证据序列,本发明首先构建了基 于虚假新闻内容指导的编码器来学习一致性句子级序列,然后整合这些序列到层 次注意力解码器中从而生成自洽的序列。

步骤5:在虚假新闻内容指导的编码器中,涉及到了一个序列编码层以及一 个基于注意力的匹配层。具体地,序列编码层用来分别学习所有相关文章序列以 及虚假新闻序列的上下文表示。基于注意力的匹配层借助虚假新闻序列来关注并 汇聚与所有相关文章中一致的序列部分,而后输出每个相关文章的最后隐藏层的 输出作为他们的一致性句子级表示。

步骤6:在序列编码层中,本发明借助BiLSTM网络编码所有相关文章序列 以及虚假新闻序列从而获得他们的上下文表示。这样,针对相关文章的隐藏状态

步骤7:基于注意力的匹配层用于将虚假新闻内容的相关内容聚合到相关文 章的上下文中,聚合操作

其中,a

步骤8:使用虚假新闻内容来指导相关文章序列编码的目的包含两个方面:

1)强化相关文章中与虚假新闻内容一致性序列的关联;

2)过滤到与虚假新闻内容无关的噪声特征,从而使得编码的相关文章序列 更加纯洁。

步骤9:输出每个相关文章的最后一个词对应的隐藏层特征,从而形成一致 性句子级表示。其中,

步骤10:为了从相关文章中捕获普遍认知视角的证据序列,本发明设计了层 次注意力解码器考虑了相关文章中不同粒度下的一致性序列特征从而生成全局 自洽证据序列。具体地,单向LSTM作为解码器在每个解码步上,本发明并行地 计算基于句子级注意力权重β以及基于词级注意力权重α。其计算公式可表示为:

其中,

步骤11:上下文向量c

其中,W

步骤12:解码器在所有单词表V上生成的当前步骤的词的概率分布可计算为:

其中W

步骤13:这样,生成的序列G={g

步骤14:为了从个体认知视角捕获证据片段,本发明设计了选择性的共同交 互模块,该模块包含三个单元,句子级表示单元用来捕获相关文章的高层表示特 征,选择机制单元用来筛选前k个具有高度差异性的代表性的相关文章,以及共 同交互单元使得虚假新闻内容与筛选的文章进行交互从而然所局部关键的证据 片段。

步骤15:在句子级表示单元中,利用BiLSTM网络来编码每个相关文章并 捕获该网络的最后隐藏状态作为句子级的表示,该编码过程与步骤6中序列编码 层的编码过程是相似的,这里,捕获到的第i篇文章的句子表示为

步骤16:在选择机制中,为了捕获具有代表性的前k个相关文章,选择机制 以一种自动的方式计算任意两个相关文章的差异性。具体地,选择机制学习并优 化一个内部句子级注意力矩阵

其中,

步骤17:在共同交互单元中,为了探索局部关键证据片段,本发明设计了共 同交互单元。具体地,该单元通过交互使得虚假新闻内容聚焦第i篇文章从而探 索具体的证据片段,而第i篇文章通过交互更多的关注虚假新闻内容的出错部分。 最终本发明将这两种交互结果合成基于个体认知视角的关键证据序列。这个过程 可表达为:

步骤18:对于前k篇文章,本发明通过拼接操作整合所有的局部证据片段。

I=[I

步骤19:在双视图分类模块中,为了缓解基于个体认知视角证据片段的偏差, 设计的不一致损失被用来惩罚生成的全局证据与局部证据片段之间的不一致性, 从而促进两者之间公共的可用的证据的捕获,进而进行可解释性虚假新闻检测。 在这里,本发明采用KL差分算法作为基于全局认知视角生成的序列G与局部关 键证据序列I之间的不一致损失函数。

其中,G′

步骤20:更进一步,对这两种被惩罚的证据序列进行融合,并采用softmax激 活函数得到概率分布,然后与真值标签与比较,借助最小化的交叉熵误差作为损 失。其过程可表达为:

F=[G;IN] (18)

p=softmax(W

Loss=-∑ylogp (20)

其中,W

步骤21:为了确保这两种认知视角的有效协同,本发明将所有损失联合在一 起进行训练。

L=Loss+aLoss

其中,α为超参数。

本发明方法适用于社交网络环境,且能够提供广泛讨论虚假新闻的评论(或 相关文章)的社交媒体网络环境中。

由表1可知,本发明(UICD)相比于现有基线模型实现了更优异的性能, 具体地,比最新基线模型EHIAN模型在Snopes和PolitiFact数据集上分别实现 了1.5%和1.8%的性能提升,这证实了本发明性能的优越性。

表1本发明在Snopes和PolitiFact两个数据集下的实验性能

由表2可知,本发明的各个模块的消融分离都使得发明主体造成了不同程度 的性能下降,这证实了本发明各个模块的有效性且说明了该发明的各个模块是一 个有机的整体。

表2本发明的不同模块在Snopes和PolitiFact两个数据集下的分离性能对比

以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技 术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所 作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号