首页> 中国专利> 基于语义的个性化轨迹数据隐私保护方法

基于语义的个性化轨迹数据隐私保护方法

摘要

本发明提供了一种基于语义的个性化轨迹数据隐私保护方法,根据用户提供的每个敏感位置点,分别构造包含若干相似兴趣点的泛化区域,选择一个相似兴趣点替代敏感位置点,并在泛化区域内构造合理的替代轨迹路径和替代位置点序列。本发明在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹路径数据具有较高的效用性。

著录项

  • 公开/公告号CN104680072A

    专利类型发明专利

  • 公开/公告日2015-06-03

    原文格式PDF

  • 申请/专利权人 福建师范大学;

    申请/专利号CN201510114588.8

  • 发明设计人 叶阿勇;郑永星;李晴;

    申请日2015-03-16

  • 分类号

  • 代理机构福州市鼓楼区博深专利代理事务所(普通合伙);

  • 代理人林志峥

  • 地址 350000 福建省福州市仓山区上三路8号福建师范大学仓山校区

  • 入库时间 2023-12-18 09:13:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-03

    未缴年费专利权终止 IPC(主分类):G06F21/60 专利号:ZL2015101145888 申请日:20150316 授权公告日:20171107

    专利权的终止

  • 2017-11-07

    授权

    授权

  • 2015-07-01

    实质审查的生效 IPC(主分类):G06F21/60 申请日:20150316

    实质审查的生效

  • 2015-06-03

    公开

    公开

说明书

技术领域

本发明涉及通信领域中的数据发布,特别涉及一种基于语义的个性化轨迹 数据隐私保护方法。

背景技术

近年来,随着RFID、GPS和智能手机等位置感知设备的广泛应用,越来越 多的位置数据被收集,这些位置数据以轨迹的形式存储在数据库中。轨迹数据 蕴含着丰富的知识,发布这些数据,供相关部门进行挖掘和研究可支持多种相 关的应用,例如交通规划、基于位置的广告和野生动物跟踪等。然而,这些轨 迹数据中往往包含了关系到个人敏感信息的隐私数据,若未对这些轨迹数据进 行处理就直接发布,会造成严重的隐私泄露。轨迹数据发布过程中存在的隐私 泄露情况大致可分为两类:一类是由于轨迹上敏感或频繁访问的位置的泄露而 导致移动对象的隐私泄露,轨迹上的敏感或频繁访问的位置很可能暴露其个人 兴趣爱好、健康状况和宗教信仰等个人隐私;另一类是在大数据环境背景下, 攻击者通过将轨迹数据与外部知识相关联,从而造成的隐私泄露情况。

要使发布的轨迹数据对个人的隐私进行保护,在数据进行发布时,一方面 要使得发布的数据不泄露个体的隐私信息,即保证攻击者不能以高置信度推测 出目标个体的敏感信息;另一方面需要保证发布的数据具有高可用性,即仍然 能够根据发布的数据进行较准确的数据分析,如集合查询等,这就要求发布的 数据效用要尽可能的高。

轨迹数据一般包含用户在地图背景知识下的经度与纬度等位置点信息,还 包含时间信息,时间信息一般包含用户的停留时间、时间概率等。公开号为 CN20141008673的中国发明专利公开了一种基于频率的轨迹抑制数据发布隐私 保护的系统及其方法,采用特定的轨迹局部抑制法进行匿名处理,先从原始轨 迹数据集中找到不满足用户的隐私容忍度的有问题的投影集,然后将有问题的 投影集按在原始轨迹数据集中出现的频率进行排序,并将结果保存到新的数据 集中,接下来,找到新的数据集中最小的违反隐私需求的轨迹序列集,将该轨 迹序列集中与用户隐私关联度和数据效用度达到一定设定值的数据去除,虽然 考虑到了频率问题来划分位置点的敏感程度,抑制敏感程度高的位置点,提高 了匿名后的数据效用,但是抑制法已经被证明并不足以保护移动用户的隐私, 攻击者可通过关联外部知识重新确认轨迹所属用户的身份,进而通过轨迹获得 用户的隐私信息。为了解决这种关联攻击,基于泛化思想的轨迹k-匿名被提了 出来,将满足k-匿名的轨迹放在同一个匿名集中,然而当数据来源于交易记录, RFID数据及购买记录时,k-匿名的数据效用有待考验。除了抑制法和泛化方法 外,假数据法也是常用的轨迹数据发布隐私保护方法,假数据方法通过人为的 构造一定数量的假轨迹,降低真实轨迹的披露风险,但目前出现的假数据法主 要以轨迹数据中敏感点周围的位置点来替代原先的敏感点,数据效用度不高。

发明内容

本发明所要解决的技术问题是提供一种数据效用度高,能有效保护用户隐 私的基于语义的个性化轨迹数据隐私保护方法。

为了解决上述技术问题,本发明采用的技术方案为提供了一种基于语义的 个性化轨迹数据隐私保护方法,所述方法包括以下步骤:

S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护 的敏感位置点序列;

S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择 敏感位置点的兴趣阀值;

S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似 兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值, 将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量, 停止扩大半径区域;

S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩 形转化为泛化区域;

S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;

S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径 规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替 代轨迹路径;

S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将 所述的替代轨迹路径转化为替代位置点序列;

S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选 择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所 述敏感位置点序列的敏感点替代完毕。

本发明的有益效果在于提供的基于语义的个性化轨迹数据隐私保护方法, 以地图为背景,用相似兴趣点来构造泛化区域,将相似兴趣点作为用户敏感位 置点的替代敏感点,并在泛化区域内构造合理的替代轨迹路径和替代位置点序 列,在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹路径数 据具有较高的效用性。

附图说明

图1为本发明实施例提供的基于语义的个性化轨迹数据隐私保护方法的泛 化区域构造示意图;

图2为本发明实施例提供的基于语义的个性化轨迹数据隐私保护方法流程 图;

图3为本发明实施例一的在泛化区域内的原始位置点序列示意图;

图4为本发明实施例一的在泛化区域内的替代位置点序列示意图。

标号说明:

1、第一敏感点;2、第一相似敏感点;3、第二相似敏感点;4、第三相似 敏感点;5、泛化区域。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并 配合附图予以说明。

本发明最关键的构思在于在地图背景下,以用户的相似兴趣点来替代原始 轨迹数据中的敏感位置点,起到保护用户隐私的作用的同时,提高了替代轨迹 数据的效用度。

本发明涉及的技术术语解释见表1:

表1

请参照图1至图4,本发明提供了一种基于语义的个性化轨迹数据隐私保护 方法,所述方法包括以下步骤:

S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护 的敏感位置点序列;

S2依照所述敏感位置点序列的次序,选择一个敏感位置点,并预设所选择 敏感位置点的兴趣阀值;

S3以所选择敏感位置点为中心,在地图中逐步扩大半径区域,并预设相似 兴趣点数量和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预设的兴趣阀值, 将其确定为相似兴趣点;若半径区域内的相似兴趣点达到预设相似兴趣点数量, 停止扩大半径区域;

S4将步骤S3中包含达到预设相似兴趣点数量的相似兴趣点的最小边界矩 形转化为泛化区域;

S5在所述的泛化区域中随机选择一个相似兴趣点作为替代敏感点;

S6确定原始轨迹路径在所述的泛化区域中的入口点和出口点,并通过路径 规划算法在泛化区域内构造一条通过所述的入口点、替代敏感点和出口点的替 代轨迹路径;

S7根据用户在所述的泛化区域中的停留时间和平均速率,在泛化区域内将 所述的替代轨迹路径转化为替代位置点序列;

S8依照所述敏感位置点序列的次序,选择下一个敏感位置点,并预设所选 择的下一个敏感位置点的兴趣阀值,重复步骤S3~S7,直至将原始轨迹路径中所 述敏感位置点序列的敏感点替代完毕。

从上述描述可知,本发明的有益效果在于提供的基于语义的个性化轨迹数 据隐私保护方法,以地图为背景,用相似兴趣点来构造泛化区域,将相似兴趣 点作为用户敏感位置点的替代敏感点,并在泛化区域内构造合理的替代轨迹路 径和替代位置点序列,在满足用户个性化轨迹数据隐私保护需求的同时,可保 证替代轨迹路径数据具有较高的效用性。

进一步的,步骤S3中所述相似兴趣点的选取方法:

假定某次访问疑似兴趣点u的时间和停留时间分别为t和T,则所述疑似兴 趣点u的兴趣集S(t,T)定义为:

S(t,T)=Pv(u,t)*Ps(u,T)

若S(t,T)的值大于所预设的兴趣阀值,则所述疑似兴趣点u为相似兴趣点; 反之,则所述疑似兴趣点u不是相似兴趣点;

其中,

Pv(u,t)为疑似兴趣点u的访问概率,Num(t)为一天中在 t时间段内访问疑似兴趣点u的平均人数,N为一天中访问疑似兴趣点u的平均 总人数;

Ps(u,T)为疑似兴趣点u的停留概率,Ps(u,T)采用正态分布来计算,即Ps~N(μ, σ),其中μ等于疑似兴趣点u的平均停留时间,σ为预设的固定参数。

由上述描述可知,本发明提供的基于语义的个性化轨迹数据隐私保护方法, 对疑似兴趣点是否是相似兴趣点进行确定时,主要考虑访问概率和停留概率的 乘积要达到预设的兴趣阀值,使相似兴趣点具有高的数据效用度,可有效保护 轨迹数据隐私。

进一步的,步骤S6中所述路径规划算法为A*算法、Dijkstra算法、Fallback 算法、Floyd算法中的任意一种。

由上述描述可知,本发明提供的基于语义的个性化轨迹数据隐私保护方法, A*算法、Dijkstra算法、Fallback算法、Floyd算法一般具有较强的路径搜索能 力,能够很好地在离散的路径拓扑网络中发挥作用,可有效保证替代轨迹路径 构造的合理性和快速性。

进一步的,若步骤S6中得到的替代轨迹路径为多条,则选择与原始轨迹路 径的距离最接近的替代轨迹路径;

其中,两条轨迹路径之间距离的计算方法为:

假设两条轨迹路径分别为R={(p1,p2,...,pn)}和R'={(p1',p2',...,pn')},令 dist(pi,pi’)表示pi和pi’两点间的欧式距离,则R和R'两个轨迹路径之间距离为:

D(R,R)=Σi=1ndist(pi,pi)n

由上述描述可知,本发明提供的基于语义的个性化轨迹数据隐私保护方法, 在多条替代轨迹路径中选择一条与原始轨迹路径最接近的替代轨迹路径,可有 效保证替代轨迹路径的效用性。

进一步的,步骤S7中将所述替代轨迹路径转化为替代位置点序列的方法包 括以下步骤:

S7.1将所述替代轨迹路径分为R0、R1、R2三部分,其中R0为从泛化区 域入口点到替代敏感点的路径,R1为用户在替代敏感点的停留路径,R2为替代 敏感点到泛化区域出口点之间的路径;

S7.2根据用户在泛化区域内的平均移动速率v,以及系统的采样频率分别 在R0和R2上选取相应的新位置点序列Q0和Q2;根据用户在泛化区域内停留 的总时间T,扣除用户经过R0和R2路径的时间,在替代敏感点附近随机选取 若干位置点构成新位置点序列Q1;

S7.3新位置点序列Q0、Q1、Q2依次排序组合成替代位置点序列。

由上述描述可知,本发明提供的基于语义的个性化轨迹数据隐私保护方法, 将替代轨迹路径转化为替代位置点序列的过程中,充分考虑了用户在泛化区域 内的停留时间、平均移动速率以及系统的采样频率,保证替代位置点序列构造 的合理性,提高数据效用度。

请参照图1至图4,本发明的实施例一为:

本发明提供了一种基于语义的个性化轨迹数据隐私保护方法,参见图2,所 述方法包括以下步骤:

S1根据用户自设定的敏感位置点参数,获得原始轨迹路径数据中需要保护 的敏感位置点序列中,若所述敏感位置点序列为空,则直接输出原始轨迹路径, 若所述敏感位置点序列不为空,则继续执行后续步骤;

S2依照所述敏感位置点序列的次序,选择一个敏感位置点为第一敏感点1, 并预设第一敏感点1的兴趣阀值;

S3(参见图1)以第一敏感点1为中心,在地图中逐步扩大半径区域,并 预设相似兴趣点数量为3个和疑似兴趣点,若疑似兴趣点的兴趣相似性达到预 设的兴趣阀值,将其确定为相似兴趣点;当半径区域内的相似兴趣点达到3个, 分别为第一相似敏感点2、第二相似敏感点3、第三相似敏感点4,停止扩大半 径区域;

S4将步骤S3中包含第一敏感点1、第一相似敏感点2、第二相似敏感点3、 第三相似敏感点4的最小边界矩形转化为泛化区域5;

S5在泛化区域5中选择第二相似敏感点3作为替代敏感点;

S6(参见图3)确定原始轨迹路径在所述的泛化区域5中的入口点和出口 点,并通过A*路径规划算法在泛化区域5内构造一条通过所述的入口点、第二 相似敏感点3和出口点的替代轨迹路径;

S7(参见图3和图4)根据用户在泛化区域5中的停留时间T和平均速率 v,在泛化区域5内将替代轨迹路径转化为替代位置点序列,具体步骤如下:

S7.1将步骤S6中得到的替代轨迹路径分为R0、R1、R2三部分,即为 {R0,R1,R2},其中R0为从泛化区域5入口点到第二相似敏感点3的路径,R1 为用户在第二相似敏感点3的停留路径,R2为第二相似敏感点3到泛化区域5 出口点之间的路径;

S7.2根据用户在泛化区域5内的平均移动速率v,以及系统的采样频率分 别在R0和R2上选取相应的新位置点序列Q0和Q2;根据用户在泛化区域5内 停留的总时间T,扣除用户经过R0和R2路径的时间,在第二相似敏感点3附 近随机选取若干位置点构成新位置点序列Q1;

S7.3新位置点序列Q0、Q1、Q2依次排序组合成替代位置点序列 {Q0,Q1,Q2};

S8依照所述敏感位置点序列的次序,没有下一个敏感位置点,将替代位置 点序列输出,然后退出程序。

综上所述,本发明提供的基于语义的个性化轨迹数据隐私保护方法,以地 图为背景,根据访问概率和停留概率的乘积大小来确定是否满足相似兴趣点, 并用相似兴趣点来构造泛化区域,将相似兴趣点作为用户敏感位置点的替代敏 感点,泛化区域内的替代轨迹路径采用路径规划算法进行构造,替代位置点序 列的构造充分考虑了用户在泛化区域内的停留时间、平均移动速率以及系统的 采样频率,在满足用户个性化轨迹数据隐私保护需求的同时,可保证替代轨迹 路径数据具有较高的效用性。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利 用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术 领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号