首页> 中国专利> 一种多元异构数据共享行为的可信度动态度量的方法

一种多元异构数据共享行为的可信度动态度量的方法

摘要

本发明公开了一种多元异构数据共享行为的可信度动态度量的方法,包括以下步骤:获取用户节点和目标节点的交互记录,交互记录表示为T(DS,U,t,R,D);交互记录预处理,保证数据正确性;在时刻t对数据源分别进行主观可信度SubTrust(U,B,t)、全局可信度GloTrust(B,t)和本地可信度LocalTrust(U,B,t)分析计算。本发明将数据可信度分为主观可信度、全局可信度和本地可信度三个部分进行计算,根据实际情况对主观可信度、全局可信度和本地可信度赋予不同权重系数,再进行综合考虑进行数据可信度计算,实现建立数据可信度分析中各个决策属性之间的关联制约关系,实现全面性进行数据可信度计算。

著录项

  • 公开/公告号CN113836106A

    专利类型发明专利

  • 公开/公告日2021-12-24

    原文格式PDF

  • 申请/专利权人 北京创安恒宇科技有限公司;

    申请/专利号CN202111147178.5

  • 发明设计人 安琪;周发桂;刘锡明;

    申请日2021-09-29

  • 分类号G06F16/176(20190101);G06F16/16(20190101);

  • 代理机构34167 滁州创科维知识产权代理事务所(普通合伙);

  • 代理人洪余节

  • 地址 100089 北京市海淀区碧桐园6号楼4层417

  • 入库时间 2023-06-19 13:49:36

说明书

技术领域

本发明涉及数据可信度量技术领域,尤其涉及一种多元异构数据共享行为的可信度动态度量的方法。

背景技术

近年来,随着大数据概念的提出,数据规模的爆炸式增长和数据模式的高度复杂化,也就难以避免的造成了数据产生、数据传播和数据接收过程中产生的数据不一致、数据缺失等问题,也即产生了不可信的数据,这些不可信的数据给大数据的应用制造很大的麻烦,如果对不可信的数据进行应用还有可能造成巨大的经济损失,目前,数据的可信度量方法主要分为两大类,主观信任分析和客观信任分析,但面对大数据效果并不是很好。主观信任分析是主观的概念,是一个主体对另外一个主体或者另外一个主体提供的信息进行判断进而对该主体或者信息的真实程度进行量化的认知过程,这种判断建立在一定的数据支撑上,同时也会具有一定的不确定性和模糊性。目前针对主观信任分析已经有很多文献提出了基于概率论、模糊理论和云理论等计算主观信任值的方法。而客观信任则不同,客观信任是一个全局的概念,是对一个主体是否可信的客观评价。客观信任需要根据主体自身的行为、特征等进行评价,是基于证据的,大多数可信计算研究只考虑一部分决策属性,具有不全面性,忽略了环境之间的影响,没有建立数据之间的依赖、制约、关联关系,不能很好地计算数据可信值。

发明内容

本发明的目的在于提供一种多元异构数据共享行为的可信度动态度量的方法,以解决上述现有技术中的不足之处。

为了实现上述目的,本发明采用了如下技术方案:一种多元异构数据共享行为的可信度动态度量的方法,包括以下步骤:

S1:获取用户节点和目标节点的交互记录,交互记录表示为T(DS,U,t,R,D);

S2:交互记录预处理,保证数据正确性;

S3:在时刻t对数据源分别进行主观可信度SubTrust(U,B,t)、全局可信度GloTrust(B,t)和本地可信度LocalTrust(U,B,t)分析计算,获取主观可信度、全局可信度和本地可信度数值;

S4:将获取的主观可信度、全局可信度和本地可信度数值采用加法原则通过参数和大数据可信计算模型进行数据可信度Trust(U,B,D,t)计算。

作为上述技术方案的进一步描述:

所述交互记录T(DS,U,t,R,D)中的DS为数据源是发布或产生交互数据的主体,U为用户是对交互数据进行处理的主体,t为交互时间即交互结果的生成时间,R为交互结果是指用户是否认可数据,即用户对交互数据肯定与否,D为交互数据是数据源发布或者产生的数据,也是被用户进行评定的数据。

作为上述技术方案的进一步描述:

所述获取用户节点和目标节点的交互记录具体包括用户和数据源之间的上下文交互历史记录、数据源与多个用户的上下文交互记录和数据源自己发布数据的历史记录。

作为上述技术方案的进一步描述:

所述交互记录预处理包括以下步骤:

S2.1:缺失值清洗,对获取用户节点和目标节点的交互记录的每个字段计算其缺失值比例,当缺失值比例超过阈值时,去除该字段;

S2.2:无效数据清洗,对获取用户节点和目标节点的交互记录的字段进行权重分析,对无效数据进行删除。

作为上述技术方案的进一步描述:

所述主观可信度、全局可信度和本地可信度分析计算具体包括以下步骤:

S3.1:通过用户和数据源之间的上下文交互历史记录根据EigenTrust算法进行分析计算获取主观可信度SubTrust(U,B,t);

S3.2:通过数据源与多个用户的上下文交互记录根据PeerTrust算法进行分析计算获取全局可信度GloTrust(B,t);

S3.3:通过数据源自己发布数据的历史记录根据模糊理论算法进行分析计算获取本地可信度LocalTrust(U,B,t)。

作为上述技术方案的进一步描述:

所述数据可信度Trust(U,B,D,t)计算公式为:

Trust(U,B,D,t)=α·SubTrust(U,B,t)+β·GlobTrust(B,t)+θ·LocalTrust(D);

其中α+β+θ=1。

作为上述技术方案的进一步描述:

所述α,β,θ分别为主观可信度SubTrust(U,B,t)、全局可信度GloTrust(B,t)以及本地可信度LocalTrust(U,B,t)的权重系数。

作为上述技术方案的进一步描述:

所述数据可信度Trust计算时具体为先根据用户节点和目标节点的交互记录,然后计算主观可信值;接着根据目标节点与其他节点的交互记录,进行全局可信值计算;之后根据目标节点根据自身的数据记录,进行本地可信值计算;最后,通过参数和大数据可信计算模型进行数据的可信值计算。

本发明提供了一种多元异构数据共享行为的可信度动态度量的方法。具备以下有益效果:

该多元异构数据共享行为的可信度动态度量的方法实现将数据可信度分为主观可信度、全局可信度和本地可信度三个部分进行计算,并可以根据实际情况对主观可信度、全局可信度和本地可信度赋予不同权重系数,再进行综合考虑进行数据可信度计算,实现建立数据可信度分析中各个决策属性之间的关联制约关系,实现全面性进行数据可信度计算。

附图说明

图1为本发明提出的一种多元异构数据共享行为的可信度动态度量的方法的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

参照图1,一种多元异构数据共享行为的可信度动态度量的方法,包括以下步骤:

S1:获取用户节点和目标节点的交互记录,交互记录表示为T(DS,U,t,R,D);

S2:交互记录预处理,保证数据正确性;

S3:在时刻t对数据源分别进行主观可信度SubTrust(U,B,t)、全局可信度GloTrust(B,t)和本地可信度LocalTrust(U,B,t)分析计算,获取主观可信度、全局可信度和本地可信度数值;

S4:将获取的主观可信度、全局可信度和本地可信度数值采用加法原则通过参数和大数据可信计算模型进行数据可信度Trust(U,B,D,t)计算。

通过将数据可信度分为主观可信度、全局可信度和本地可信度三个部分进行计算,并可以根据实际情况对主观可信度、全局可信度和本地可信度赋予不同权重系数,再进行综合考虑进行数据可信度计算,实现建立数据可信度分析中各个决策属性之间的关联制约关系,实现全面性进行数据可信度计算

交互记录T(DS,U,t,R,D)中的DS为数据源是发布或产生交互数据的主体,U为用户是对交互数据进行处理的主体,t为交互时间即交互结果的生成时间,R为交互结果是指用户是否认可数据,即用户对交互数据肯定与否,D为交互数据是数据源发布或者产生的数据,也是被用户进行评定的数据。

获取用户节点和目标节点的交互记录具体包括用户和数据源之间的上下文交互历史记录、数据源与多个用户的上下文交互记录和数据源自己发布数据的历史记录。

交互记录预处理包括以下步骤:

S2.1:缺失值清洗,对获取用户节点和目标节点的交互记录的每个字段计算其缺失值比例,当缺失值比例超过阈值时,去除该字段;

S2.2:无效数据清洗,对获取用户节点和目标节点的交互记录的字段进行权重分析,对无效数据进行删除。

数据可信度Trust计算时具体为先根据用户节点和目标节点的交互记录,然后计算主观可信值;接着根据目标节点与其他节点的交互记录,进行全局可信值计算;之后根据目标节点根据自身的数据记录,进行本地可信值计算;最后,通过参数和大数据可信计算模型进行数据的可信值计算。

主观可信度、全局可信度和本地可信度分析计算具体包括以下步骤:

S3.1:通过用户和数据源之间的上下文交互历史记录根据EigenTrust算法进行分析计算获取主观可信度SubTrust(U,B,t);

主观可信度来自于用户和数据源之间的上下文交互历史记录,主观可信度表示用户对数据源的信赖度,通过获取用户与数据源之间的历史交互记录进行计算,假设在此次可信计算之前,用户已经与该数据源有过交互记录T。人们总是更愿意相信持续提供可信数据的数据源,因此如果在交互记录T中,有持续可信子序列即从交互序列中获取的包含一个或一个以上可信服务的序列,这样的数据源更容易得到用户的信任,可信值也就越高。

S3.2:通过数据源与多个用户的上下文交互记录根据PeerTrust算法进行分析计算获取全局可信度GloTrust(B,t);

全局可信度来自于与数据源有上下文交互的数据源或者用户,全局可信度是对数据源的客观评价,通过全体用户与数据源的历史交互信息进行计算,假设在此次计算之前,数据源与其他用户或者数据源有交互记录T,全局可信度由与发布数据数据源有交互记录的数据源或者用户决定,在对所有的信任值进行综合时,用户更愿意相信信任值分布比较均匀的节点,对于极差比较大的,其可信度比较低。

S3.3:通过数据源自己发布数据的历史记录根据模糊理论算法进行分析计算获取本地可信度LocalTrust(U,B,t)。

本地可信度表示数据源自身的可信度,它与数据源自己发布数据的历史记录有关,同时也和本次发布的数据有关,本地可信度是对数据源发布或产生不同数据类型可信度的评判,数据源第一次发布数据时,其本地可信值是由其他节点全局可信度的平均值决定的。

数据可信度Trust(U,B,D,t)计算公式为:

Trust(U,B,D,t)=α·SubTrust(U,B,t)+β·GlobTrust(B,t)+θ·LocalTrust(D);

其中α+β+θ=1。

α,β,θ分别为主观可信度SubTrust(U,B,t)、全局可信度GloTrust(B,t)以及本地可信度LocalTrust(U,B,t)的权重系数。

其中α,β,θ的具体数值为分析人员根据数据源实际情况进行赋予不同权重比例数值。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号