技术领域
本发明涉及数据隐私保护领域,更具体地,涉及一种基于多维桶的多敏感属性隐私保护方法。
背景技术
随着社会信息化和网络化的发展,数据呈现爆炸式增长,大数据时代已经到来。目前,大数据已成为学术界和产业界的研究热点,正影响着人们日常生活、工作习惯及思维方式。在数据发布应用中,如何保护数据的用户隐私已成为当前面临的重大挑战。最简单的保护用户隐私的方法就是在发布原始数据时直接通过删除姓名、身份证号码等标识属性来达到防范用户隐私泄露。但是由于以这种方式发布的数据集中的某些属性值集合能够联合该数据集外的相关信息精确或较精确地重新标识某个体,称之为链接攻击。
为了解决这种链接攻击,研究者们提出了
但是,
为了实现
发明内容
为了解决背景技术中存在的上述技术问题,本发明提供了一种使得
本发明的技术解决方案是:本发明提供了一种基于多维桶的多敏感属性隐私保护方法,其特殊之处在于:该方法包括。
1)对于待发布数据表,根据各个敏感属性的各个敏感属性值生成多维桶,其中每个多维桶包含所有具有相同敏感属性值的记录。若一个多维桶包含的记录大于0条,则该多维桶为非空多维桶。
2)根据贪婪策略,执行一系列
3)对于每个多维桶中剩余的每条记录,若将它加入至一个已生成的
4)隐匿每个多维桶中剩余的每条记录,并根据各个
上述步骤2)中一个
步骤21)若存在未屏蔽的非空多维桶,则执行步骤22),否则执行步骤28)。
步骤22)若已选择的非空多维桶数小于
步骤23)若存在未屏蔽且未规避的非空多维桶,则执行步骤24),否则执行步骤28)。
步骤24)根据贪婪策略选择一个未屏蔽且未规避的非空多维桶,将该非空多维桶加入至一个临时的多维桶规避分组中,并从该非空多维桶中抽取一条记录加入至一个临时的
步骤25)屏蔽包含该非空多维桶中记录的任意一个敏感属性值的所有未屏蔽的非空多维桶。
步骤26)若已选择的非空多维桶数等于
步骤27)若已选择的非空多维桶数小于
步骤28)若步骤21)~步骤27)中一直不存在未屏蔽且未规避的非空多维桶,则中止这个
步骤29)若步骤21)~步骤27)中一直存在未屏蔽且未规避的非空多维桶,则步骤24)中临时的
上述步骤24)中贪婪策略可以是最大多维桶大小贪婪策略、最大多维桶单维容量贪婪策略或最大多维桶多维容量贪婪策略,其中最大多维桶大小贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶大小为最大的非空多维桶,最大多维桶单维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶单维容量为最大的非空多维桶,最大多维桶多维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶多维容量为最大的非空多维桶。对于一个非空多维桶,多维桶大小为该非空多维桶包含的记录条数,多维桶单维容量为包含该非空多维桶中记录的一个敏感属性值的所有非空多维桶的多维桶大小之和,多维桶多维容量为该非空多维桶的所有多维桶单维容量之和。
本发明的优点是:在
附图说明
图1为待发布数据表示意图。
图2为待发布数据表的多维桶示意图。
图3为本发明所提供的多敏感属性隐私保护方法示意图。
具体实施方式
参见图1,待发布数据表包含年龄、性别、肤色和邮政编码4个准标识属性和主治医生和疾病2个敏感属性,以及包含9条记录,其中每条记录由4个准标识属性值和2个敏感属性值构成。
参见图2,待发布数据表的多维桶的最左列为主治医生这个敏感属性的各个敏感属性值,最上端为疾病这个敏感属性的各个敏感属生值,中间为各个多维桶,每个非空多维桶中包含相应的记录。
参见图3,本发明提供了一种基于多维桶的多敏感属性隐私保护方法,该方法包括。
1)对于待发布数据表,根据各个敏感属性的各个敏感属性值生成多维桶,其中每个多维桶包含所有具有相同敏感属性值的记录。若一个多维桶包含的记录大于0条,则该多维桶为非空多维桶。
2)根据贪婪策略,执行一系列
上述步骤2)中一个
步骤21)若存在未屏蔽的非空多维桶,则执行步骤22),否则执行步骤28)。
步骤22)若已选择的非空多维桶数小于
步骤23)若存在未屏蔽且未规避的非空多维桶,则执行步骤24),否则执行步骤28)。
步骤24)根据贪婪策略选择一个未屏蔽且未规避的非空多维桶,将该非空多维桶加入至一个临时的多维桶规避分组中,并从该非空多维桶中抽取一条记录加入至一个临时的
步骤25)屏蔽包含该非空多维桶中记录的任意一个敏感属性值的所有未屏蔽的非空多维桶。
步骤26)若已选择的非空多维桶数等于
步骤27)若已选择的非空多维桶数小于
步骤28)若步骤21)~步骤27)中一直不存在未屏蔽且未规避的非空多维桶,则中止这个
步骤29)若步骤21)~步骤27)中一直存在未屏蔽且未规避的非空多维桶,则步骤24)中临时的
3)对于每个多维桶中剩余的每条记录,若将它加入至一个已生成的
4)隐匿每个多维桶中剩余的每条记录,并根据各个
上述步骤24)中贪婪策略可以是最大多维桶大小贪婪策略、最大多维桶单维容量贪婪策略或最大多维桶多维容量贪婪策略,其中最大多维桶大小贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶大小为最大的非空多维桶,最大多维桶单维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶单维容量为最大的非空多维桶,最大多维桶多维容量贪婪策略是指从各个未屏蔽且未规避的非空多维桶中选择一个多维桶多维容量为最大的非空多维桶。对于一个非空多维桶,多维桶大小为该非空多维桶包含的记录条数,多维桶单维容量为包含该非空多维桶中记录的一个敏感属性值的所有非空多维桶的多维桶大小之和,多维桶多维容量为该非空多维桶的所有多维桶单维容量之和。
机译: 将基于个人资料的电子广告定向到其他互联网媒体属性的基于条件的,对隐私敏感的媒体属性选择方法
机译: 为语音到文本转换提供匿名和安全机制的新颖创新方法。本发明提供了一种通用且可扩展的隐私层,其利用了现有的基于云的自动语音识别(ASR)服务,并且可以适应新兴的语音到文本技术,例如自然语言处理(NLP),语音机器人和其他基于语音的人工语言。智能接口。本发明还允许在不牺牲法律,医学,金融和其他隐私敏感领域的情况下应用最新和最好的语音技术。
机译: 基于自定义硬件安全属性的内核敏感数据保护方法