首页> 中国专利> 一种基于多维桶的多敏感属性隐私保护方法

一种基于多维桶的多敏感属性隐私保护方法

摘要

本发明提供了一种使得l‑多样性分组是完备的基于多维桶的多敏感属性隐私保护方法,其特殊之处在于:该方法包括:1)对于待发布数据表,根据各个敏感属性的各个敏感属性值生成多维桶,其中每个多维桶包含所有具有相同敏感属性值的记录;2)根据贪婪策略,执行一系列l‑多样性分组过程,直到不能生成新的l‑多样性分组或新的多维桶规避分组为止;3)对于每个多维桶中剩余的每条记录,若将它加入至一个已生成的l‑多样性分组后仍然使得该l‑多样性分组遵循l‑多样性模型,则将它加入至该l‑多样性分组;4)隐匿每个多维桶中剩余的每条记录,并根据各个l‑多样性分组生成基于有损连接的准标识属性表和敏感属性表进行发布。

著录项

  • 公开/公告号CN113010913A

    专利类型发明专利

  • 公开/公告日2021-06-22

    原文格式PDF

  • 申请/专利权人 西安邮电大学;

    申请/专利号CN202110229309.8

  • 发明设计人 肖跃雷;余林;

    申请日2021-03-02

  • 分类号G06F21/62(20130101);

  • 代理机构

  • 代理人

  • 地址 710061 陕西省西安市雁塔区长安南路563号

  • 入库时间 2023-06-19 11:32:36

说明书

技术领域

本发明涉及数据隐私保护领域,更具体地,涉及一种基于多维桶的多敏感属性隐私保护方法。

背景技术

随着社会信息化和网络化的发展,数据呈现爆炸式增长,大数据时代已经到来。目前,大数据已成为学术界和产业界的研究热点,正影响着人们日常生活、工作习惯及思维方式。在数据发布应用中,如何保护数据的用户隐私已成为当前面临的重大挑战。最简单的保护用户隐私的方法就是在发布原始数据时直接通过删除姓名、身份证号码等标识属性来达到防范用户隐私泄露。但是由于以这种方式发布的数据集中的某些属性值集合能够联合该数据集外的相关信息精确或较精确地重新标识某个体,称之为链接攻击。

为了解决这种链接攻击,研究者们提出了

但是,

为了实现

发明内容

为了解决背景技术中存在的上述技术问题,本发明提供了一种使得

本发明的技术解决方案是:本发明提供了一种基于多维桶的多敏感属性隐私保护方法,其特殊之处在于:该方法包括。

1)对于待发布数据表,根据各个敏感属性的各个敏感属性值生成多维桶,其中每个多维桶包含所有具有相同敏感属性值的记录。若一个多维桶包含的记录大于0条,则该多维桶为非空多维桶。

2)根据贪婪策略,执行一系列

3)对于每个多维桶中剩余的每条记录,若将它加入至一个已生成的

4)隐匿每个多维桶中剩余的每条记录,并根据各个

上述步骤2)中一个

步骤21)若存在未屏蔽的非空多维桶,则执行步骤22),否则执行步骤28)。

步骤22)若已选择的非空多维桶数小于

步骤23)若存在未屏蔽且未规避的非空多维桶,则执行步骤24),否则执行步骤28)。

步骤24)根据贪婪策略选择一个未屏蔽且未规避的非空多维桶,将该非空多维桶加入至一个临时的多维桶规避分组中,并从该非空多维桶中抽取一条记录加入至一个临时的

步骤25)屏蔽包含该非空多维桶中记录的任意一个敏感属性值的所有未屏蔽的非空多维桶。

步骤26)若已选择的非空多维桶数等于

步骤27)若已选择的非空多维桶数小于

步骤28)若步骤21)~步骤27)中一直不存在未屏蔽且未规避的非空多维桶,则中止这个

步骤29)若步骤21)~步骤27)中一直存在未屏蔽且未规避的非空多维桶,则步骤24)中临时的

上述步骤24)中贪婪策略可以是最大多维桶大小贪婪策略、最大多维桶单维容量贪婪策略或最大多维桶多维容量贪婪策略,其中最大多维桶大小贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶大小为最大的非空多维桶,最大多维桶单维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶单维容量为最大的非空多维桶,最大多维桶多维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶多维容量为最大的非空多维桶。对于一个非空多维桶,多维桶大小为该非空多维桶包含的记录条数,多维桶单维容量为包含该非空多维桶中记录的一个敏感属性值的所有非空多维桶的多维桶大小之和,多维桶多维容量为该非空多维桶的所有多维桶单维容量之和。

本发明的优点是:在

附图说明

图1为待发布数据表示意图。

图2为待发布数据表的多维桶示意图。

图3为本发明所提供的多敏感属性隐私保护方法示意图。

具体实施方式

参见图1,待发布数据表包含年龄、性别、肤色和邮政编码4个准标识属性和主治医生和疾病2个敏感属性,以及包含9条记录,其中每条记录由4个准标识属性值和2个敏感属性值构成。

参见图2,待发布数据表的多维桶的最左列为主治医生这个敏感属性的各个敏感属性值,最上端为疾病这个敏感属性的各个敏感属生值,中间为各个多维桶,每个非空多维桶中包含相应的记录。

参见图3,本发明提供了一种基于多维桶的多敏感属性隐私保护方法,该方法包括。

1)对于待发布数据表,根据各个敏感属性的各个敏感属性值生成多维桶,其中每个多维桶包含所有具有相同敏感属性值的记录。若一个多维桶包含的记录大于0条,则该多维桶为非空多维桶。

2)根据贪婪策略,执行一系列

上述步骤2)中一个

步骤21)若存在未屏蔽的非空多维桶,则执行步骤22),否则执行步骤28)。

步骤22)若已选择的非空多维桶数小于

步骤23)若存在未屏蔽且未规避的非空多维桶,则执行步骤24),否则执行步骤28)。

步骤24)根据贪婪策略选择一个未屏蔽且未规避的非空多维桶,将该非空多维桶加入至一个临时的多维桶规避分组中,并从该非空多维桶中抽取一条记录加入至一个临时的

步骤25)屏蔽包含该非空多维桶中记录的任意一个敏感属性值的所有未屏蔽的非空多维桶。

步骤26)若已选择的非空多维桶数等于

步骤27)若已选择的非空多维桶数小于

步骤28)若步骤21)~步骤27)中一直不存在未屏蔽且未规避的非空多维桶,则中止这个

步骤29)若步骤21)~步骤27)中一直存在未屏蔽且未规避的非空多维桶,则步骤24)中临时的

3)对于每个多维桶中剩余的每条记录,若将它加入至一个已生成的

4)隐匿每个多维桶中剩余的每条记录,并根据各个

上述步骤24)中贪婪策略可以是最大多维桶大小贪婪策略、最大多维桶单维容量贪婪策略或最大多维桶多维容量贪婪策略,其中最大多维桶大小贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶大小为最大的非空多维桶,最大多维桶单维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶单维容量为最大的非空多维桶,最大多维桶多维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶多维容量为最大的非空多维桶。对于一个非空多维桶,多维桶大小为该非空多维桶包含的记录条数,多维桶单维容量为包含该非空多维桶中记录的一个敏感属性值的所有非空多维桶的多维桶大小之和,多维桶多维容量为该非空多维桶的所有多维桶单维容量之和。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号