首页> 中国专利> 基于自适应本地差分隐私的群智感知数据流隐私保护方法

基于自适应本地差分隐私的群智感知数据流隐私保护方法

摘要

本发明公开了基于自适应本地差分隐私的群智感知数据流隐私保护方法,涉及群智感知网络技术领域,解决了现有技术无法保证多源群智感知数据流的安全性和可用性的技术问题;本发明包括:步骤1:基于自适应采样机制,自适应动态调整采样频率;步骤2:采用非线性隐私预算分配方法为不同采样点个性化分配隐私预算;步骤3:基于多重哈希的自适应桶划分方法,将高相关性的数据流划分到相同桶内;步骤4:提出自适应本地差分隐私机制,将桶内数据流进行随即应答扰动;基于差分隐私的特性,本发明扰动的满足ϵ‑本地差分隐私,在确保多源群智感知数据流的自适应保护的前提下,实现高数据可用性。

著录项

  • 公开/公告号CN114884682A

    专利类型发明专利

  • 公开/公告日2022-08-09

    原文格式PDF

  • 申请/专利权人 湖南工商大学;

    申请/专利号CN202210795795.4

  • 申请日2022-07-07

  • 分类号H04L9/32(2006.01);H04L9/40(2022.01);G06F21/62(2013.01);G06K9/62(2022.01);

  • 代理机构湖南正则奇美专利代理事务所(普通合伙) 43105;

  • 代理人张继纲

  • 地址 410000 湖南省长沙市岳麓区岳麓大道569号

  • 入库时间 2023-06-19 16:20:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-13

    授权

    发明专利权授予

  • 2022-08-26

    实质审查的生效 IPC(主分类):H04L 9/32 专利申请号:2022107957954 申请日:20220707

    实质审查的生效

  • 2022-08-09

    公开

    发明专利申请公布

说明书

技术领域

本发明属于信息安全领域,涉及群智感知网络技术,具体是基于自适应本地差分隐私的群智感知数据流隐私保护方法。

背景技术

随着群智感知网络和移动感知的快速兴起,群智感知服务作为一种流行的感知模式,收集感知用户大规模感知数据数据流进行挖掘分析,如智能交通、环境监测和光谱感应等,有力推动了智慧城市建设;面对群智感知服务场景,结合众包思想和激励机制,请求者和移动工作者外包感知数据流给群智感知服务器如云服务器,以执行任务分配。

然而,群智感知服务在广泛应用的同时,也引起感知用户对个人群智感知数据流隐私泄露的关注;外包群智感知数据流给群智感知服务器可能会导致严重的用户数据流隐私泄露问题:不同于一般的仅包含少数个人信息的静态感知数据,持续外包的群智感知数据流包含任务和移动工作者的位置信息和出价等动态相关性信息;群智感知服务器在受到攻击或谋求私利时将变得不可信,根据获取的群智感知数据流,基于推理攻击、机器学习、深度学习等手段可推断用户的敏感隐私信息,包括用户的日常活动、身体状态、兴趣爱好和工作模式等;因此,为提供安全和高质量的群智感知服务,保护感知数据流隐私已成为感知用户非常关注和迫切需要解决的问题。

为保护群智感知数据隐私,传统隐私保护方案主要包括K-匿名方法、加密方法和差分隐私方法;匿名方法尽管对感知数据进行匿名化,但不能抵御最大背景知识攻击和推理攻击;面对大规模群智感知数据流,加密方法的加秘密过程开销较大,且阻碍了可信但无密钥用户对数据的可获取性;传统差分隐私方法主要关注静态感知数据隐私,直接应用于动态感知数据流存在较大的扰动误差;因此,需要研究适合群智感知数据流的隐私保护技术。

现有基于感知数据流的差分隐私方案(如user-级、event-级和w-event级)主要基于中心化的模型,关注单源数据流(如移动工作者的位置)的统计查询隐私;然而,由于采用中心化模型的可信第三方收集和保护单源感知数据流,一旦第三方被攻击,则所有移动工作者的数据隐私可能被泄露;在实际应用中,感知用户更愿意在本地保护个人群智感知数据流隐私而不依赖可信第三方;此外,在真实的群智感知应用中,群智感知服务器会持续收集多源(即多个感知用户)感知数据流;例如,Uber和Waze会收集请求者外包的任务位置和移动工作者的位置、出价等多源感知数据流;传统单源感知数据流隐私保护方案主要保护移动工作者的数据流隐私,难以自适应感知数据流的动态变化且没有考虑保护请求者的感知数据流隐私;然而,公开请求者任务位置感知数据流会泄露移动工作者的位置隐私和请求者的职业信息;因此,急需一种适合群智感知数据流的隐私保护技术。

发明内容

本发明旨在解决现有隐私保护技术没有考虑多源群智感知数据流的本地化隐私问题;为此,本发明提出了一种基于自适应本地差分隐私的群智感知数据流隐私保护方法,实现安全有效的群智感知应用服务。

本发明面向多源群智感知数据流场景,研究感知数据流的本地自适应保护隐私和数据可用性问题,提出一种基于自适应本地差分隐私的群智感知数据流隐私保护方法,包括:

步骤1:在本地将感知用户的多源群智感知数据流划分成若干个采样窗口,在若干所述采样窗口内自适应调整采样频率,并获取对应的采样数据流;

步骤2:基于非线性隐私预算分配模型,根据采样点的动态变化,为不同采样点分配个性化分配隐私预算;

步骤3:基于多重哈希的自适应桶划分方法,计算所述采样数据流的时空相关性,并采用多重哈希映射将所述采样数据流映射成哈希表;基于所述哈希表确定桶号,将具有相关性的所述采样数据流划分到相同桶中;

步骤4:基于多重哈希自适应本地差分机制,采用随机应答概率方法对多重哈希映射获取的桶数据流进行扰动;通过滤波器过滤修正扰动的所述桶数据流,将处理之后的多源感知数据流进行发布。

其中,步骤1包括:

在本地感知用户的多源群智感知数据流划分成若干个w采样窗口,在所述w采样窗口内计算相邻采样点之间的绝对误差,并获取对应的采样数据流

结合PID控制原理,定义自适应采样频率计算公式为:

根据自适应采样频率计算公式调整所述采样窗口对应的所述采样频率,并获取所述采样数据流。

其中,步骤2包括:

基于非线性隐私预算分配方法,建立采样点对应的所述采样频率和所述隐私预算的函数关系:

在所述采样窗口内,当前采样点之前剩余的隐私预算

则当前采样点个性化分配的隐私预算

其中,步骤3包括:

基于多重哈希的自适应桶划分方法,采用欧几里得距离和Pearson相关性系数确定所述采样数据流之间的时空相关性:

根据所述的两个采样数据流

基于欧几里得距离方法,采样数据流

基于Pearson相关性系数,采样数据流

根据时间相关性和空间相关性计算采样数据流

基于多重哈希映射,具有时空相关性的所述采样数据流采用相同的空间映射函数进行映射,获取对应的哈希表,将哈希表的唯一向量作为桶号;

通过哈希函数计算所述哈希表每行数据的哈希值;根据所述哈希值将对应的所述采样数据流划分至对应的桶中。

其中,步骤4包括:

提出多重哈希自适应本地差分隐私机制,对多重哈希映射获取的桶数据流进行扰动;给定所述划分桶

其中,

根据步骤3所述,桶

为确保所述扰动的多源采样群智感知数据流可用性,采用卡尔曼滤波器对其进行过滤和修正,将处理后的扰动多源群智感知数据流进行发布。

本申请设计一种基于自适应本地差分隐私的群智感知数据流隐私保护方法对应的装置,包括:数据流自适应采样模块、隐私预算个性化分配模块、多重哈希桶划分模块、本地差分隐私扰动模块以及搭建的群智感知服务模型机。

其中,数据流自适应采样模块,用于对多源群智感知数据流进行自适应采样,产生采样数据流模式;

隐私预算个性化分配模块,采用非线性隐私预算分配方法,根据采样数据流的动态变化,为不同采样数据流分配不同的隐私预算;

多重哈希桶划分模块,基于欧几里得距离和Pearson相关性系数,计算采样数据流的时空相关性;基于多重哈希映射产生哈希表,将具有时空相关性的采样数据流聚类到相同的桶中;

本地差分隐私扰动模块,将划分桶内的数据流进行随机应答扰动,将具有最大扰动概率的多源群智感知数据流作为扰动结果;为提高数据可用性,采用卡尔曼滤波器对扰动的多源群智感知数据流进行滤波和修正。

为保护未采样多源数据流隐私,基于贝叶斯近似计算方法,计算未采样数据流的后验近似估计值;包括:给定未采样感知数据流

搭建的群智感知服务模型机,包括:群智感知用户和群智感知服务器两个实体;群智感知用户通过个人移动设备对感知服务APP产生的多源群智感知数据流进行采集,通过所述数据流自适应采样模块和隐私预算个性化分配模块产生采样数据流和分配隐私预算,基于时空相关性的采样数据流,产生多重哈希桶划分模块后,基于所述本地差分隐私扰动模块将划分桶内的采用数据流进行扰动,对未采样数据流进行所述近似计算,和扰动修正的数据流一起发布给群智感知服务器进行挖掘分析,所述群智感知服务器将挖掘分析结果返回给感知用户,实现感知用户本地化保护个人数据流隐私并具有高可用性。

与现有技术相比,本发明的有益效果是:

1、本发明相较于传统的差分隐私方法,基于自适应的采样机制和非线性隐私预算分配方法,动态调整采样频率和为不同采样点分配不同隐私预算,降低了系统开销和实现个性化隐私保护水平;基于多重哈希的自适应桶划分方法,将高相关性的数据流划分到相同桶内,确保了数据流的可用性;提出自适应本地差分隐私机制本地化保护隐私。

2、本发明基于差分隐私的特性,每个采样窗口的群智感知数据流满足

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于自适应本地差分隐私的群智感知数据流保护方法的流程图;

图2为本发明基于自适应本地差分隐私的群智感知数据流保护装置的框架图;

图3为本发明实施例与传统本地差分保护方法在不同隐私预算

图4为本发明实施例与传统本地差分保护方法在不同自适应相关性阈值

图5为本发明实施例与传统本地差分保护方法在不同采样频率

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1至图5,本申请第一方面实施例提供了基于自适应本地差分隐私的群智感知数据流隐私保护方法,包括:

步骤1:在本地将感知用户的多源群智感知数据流划分成若干个采样窗口,在若干所述采样窗口内自适应调整采样频率,并获取对应的采样数据流;

步骤2:基于非线性隐私预算分配模型,根据采样点的动态变化,为不同采样点分配个性化分配隐私预算;

步骤3:基于多重哈希的自适应桶划分方法,计算所述采样数据流的时空相关性,并采用多重哈希映射将所述采样数据流映射成哈希表;基于所述哈希表确定桶号,将具有相关性的所述采样数据流划分到相同桶中;

步骤4:基于多重哈希自适应本地差分机制,采用随机应答概率方法对多重哈希映射获取的桶数据流进行扰动;通过滤波器过滤修正扰动的所述桶数据流,将处理之后的多源感知数据流进行发布。

具体来说,步骤1中的多源群智感知数据流的特点是:直接对多源群智感知数据流的每个时间点添加噪声,会导致数据可用性较低;本发明专利提出自适应采样机制,自适应调整采样频率;因此,本实施例对多源群智感知数据流做如下处理:

(1)基于PID控制器思想,每个感知用户在本地对多源群智感知数据流划分w窗口,即采样窗口;群智感知数据流变化越大,则认为越需要进行采样;本申请用当前采样点和上一个采样点之间的绝对误差评估群智感知数据流的变化程度,绝对误差越大,说明群智感知数据流变化幅度越大;计算采样数据流之间的绝对误差公式为:

其中,

(2)为自适应采样多源群智感知数据流,基于PID控制器原理,定义一种新的自适应采样频率计算方法:

其中,

步骤2中基于非线性自适应隐私预算分配方法对采样窗口中采样点分配个性化的隐私预算。

由于采样的多源群智感知数据流包含感知用户隐私,需要进行保护;然而,传统的差分隐私方法为每个采样点分配相同的隐私预算,难以适应群智感知数据流的动态变化,导致扰动的采样群智感知数据流可用性低;实际中,在w窗口内,较大的采样频率会产生更多的采样点数据,攻击者会猜测数据变化的比较明显(即隐私敏感性较强),将对这些较强敏感性的数据流进行攻击,推断出用户隐私;本发明出一种自适应隐私预算分配方法,为采样频率较大的采样点分配较小的隐私预算,以提供更强的隐私保护;同时,将较大的隐私预算分配给动态变化较小的采样点,提高数据可用性。

由于采样频率和隐私预算分配成反比,本申请采用非线性函数,定义当前时刻

其中,

给定总隐私预算

步骤3中多源群智感知数据流具有时空相关性,例如多源感知用户的位置数据流具有固定的移动模式;传统的隐私保护技术没有考虑其较强的时空相关性,直接扰动数据流,无法确保较高的数据可用性。

本发明提出基于多重哈希的自适应桶划分方法,计算采样数据流的时空相关性,将采样数据流映射成哈希表,将具有时空相关性的群智感知数据流聚类到相同的桶内;同时,设定自适应相关性阈值,实现多源群智感知数据流的自适应动态更新;具体步骤如下:

1)时空相关性计算:为提高数据的可用性,计算采样数据流之间的时空相关性;本申请基于欧几里得距离和Pearson相关性系数分别评估两个采样数据流之间的空间相关性和时间相关性;给定采样数据流

给定欧几里得距离

当两个采样数据流

2)多重哈希映射:为保证具有时空相关性的多源群智感知数据流(采样数据流)能够划分到相同的桶内,给定一组空间映射函数集

假设w窗口内的采样数据流为

基于多重哈希,w窗口内的多源采样群智感知数据流被映射为一个

3)桶划分:为降低存储开销,将二进制哈希表

4)自适应相关性阈值设定:由于多源群智感知数据流在不断变化,其采样数据流绝对误差会随之改变,且每个采样点分配的隐私预算也不同;为满足多源群智感知数据流的动态自适应性,需要设定自适应相关性阈值;采样数据流的绝对误差

基于自适应相关性阈值计算方法,当

步骤4中为了实现采样的多源群智感知数据流本地化地私保护,满足不同的隐私要求,本申请提出一种多重哈希本地差分隐私机制;基于随机应答概率扰动机制,对多重哈希映射的二进制桶内数据流进行扰动。

给定桶

其中,

基于多重哈希,采样群智感知数据流

为确保多源采样群智感知数据流的隐私,需要理论证明设计的随机应答扰动概率机制满足

证明:基于多重哈希本地差分隐私机制,采样群智感知数据流

为保护未采样多源数据流隐私,基于贝叶斯近似计算方法,计算未采样数据流的后验近似估计值;具体步如下:

给定未采样感知数据流

为评估本发明实施例的方案性能,基于真实的多源群智感知数据集T-Drives,采用不同的隐私参数:隐私预算

基于不同参数下的实验性能结果分析,本实施例对扰动的多源群智感知数据流分析的数据可用性高达92.84%,优于已有传统的本地差分隐私机制对扰动单源群智感知数据的可用性;因此,本实施例在实现多源群智感知数据本地化隐私的情况下,可以取得高数据可用性。

为实现多源群智感知服务隐私保护的推广应用,本发明的另一个实施例是设计一种基于自适应本地差分隐私的群智感知数据流隐私保护方法对应的装置,包括:数据流自适应采样模块、隐私预算个性化分配模块、多重哈希桶划分模块、本地差分隐私扰动模块以及搭建群智感知服务模型机。

其中,数据流自适应采样模块,用于对多源群智感知数据流进行自适应采样,产生采样数据流模式;

隐私预算个性化分配模块,基于非线性隐私预算分配方法,根据采样数据流的动态变化,为不同采样数据流分配不同的隐私预算;

多重哈希桶划分模块,基于欧几里得距离和Pearson相关性系数,计算采样数据流的时空相关性;基于多重哈希映射产生哈希表,将具有时空相关性的采样数据流聚类到相同的桶中;

本地差分隐私扰动模块,将桶内的数据流进行随机应答扰动,选择具有最大扰动概率的多源群智感知数据流作为扰动结果;为提高数据可用性,采用卡尔曼滤波器对扰动的多源群智感知数据流进行滤波和修正;为保护未采样多源数据流隐私,基于贝叶斯近似计算方法,计算未采样数据流的后验近似估计值。

搭建群智感知服务模型机,包括:群智感知用户通过个人移动设备对感知服务APP产生的多源群智感知数据流进行采集,通过所述数据流自适应采样模块和隐私预算个性化分配模块产生采样数据流和分配隐私预算,基于时空相关性的采样数据流,产生多重哈希桶划分模块后,基于所述本地差分隐私扰动模块将划分桶内的采用数据流进行扰动,对未采样数据流进行所述近似计算,和扰动修正的数据流一起发布给群智感知服务器进行挖掘分析,所述群智感知服务器将挖掘分析结果返回给感知用户,实现感知用户本地化保护个人数据流隐私并具有高可用性。

上述公式中的部分数据均是去除量纲取其数值计算,公式是由采集的大量数据经过软件模拟得到最接近真实情况的一个公式;公式中的预设参数和预设阈值由本领域的技术人员根据实际情况设定或者通过大量数据模拟获得。

本实施例基于非线性隐私预算分配方法,对不同采样数据流分配不同的隐私预算,满足了不同感知用户的个性化隐私需求;考虑多源群智感知数据流的时空相关性,采用基于多重哈希的自适应桶划分算法,将具有时空相关性的采样数据流划分到相同桶内,提高了数据可用性;设计自适应相关性阈值,实现了多源群智感知数据流动态更新的自适应性;基于多重哈希本地差分隐私机制,采用随机应答扰动机制扰动桶内采样数据流,确保了多源群智感知数据流的本地化隐私保护和数据可用性之间的平衡。

基于随机应答概率扰动机制,对多重哈希映射获取的桶数据流进行扰动;通过滤波器过滤修正经过扰动的桶数据流,发布处理之后的多源感知数据流。

以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号