差分隐私
差分隐私的相关文献在2012年到2023年内共计1029篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、预防医学、卫生学
等领域,其中期刊论文453篇、会议论文8篇、专利文献20557篇;相关期刊157种,包括电子学报、通信学报、计算机科学等;
相关会议6种,包括第33届中国数据库学术会议(NDBC2016 )、2016年全国通信软件学术会议、第32届中国数据库学术会议等;差分隐私的相关文献由2161位作者贡献,包括李先贤、张顺、陈志立等。
差分隐私—发文量
专利文献>
论文:20557篇
占比:97.81%
总计:21018篇
差分隐私
-研究学者
- 李先贤
- 张顺
- 陈志立
- 王金艳
- 仲红
- 张啸剑
- 杨庚
- 张兴
- 王豪
- 郑啸
- 孟小峰
- 刘鹏
- 吴英杰
- 王利娥
- 史伟
- 徐正全
- 夏英
- 孙岚
- 崔杰
- 张旭
- 张磊
- 李万杰
- 王汝传
- 白云璐
- 康海燕
- 张亚玲
- 李晖
- 黄海平
- 傅星珵
- 刘树波
- 彭长根
- 李凤华
- 李晓会
- 熊金波
- 程祥
- 蔡剑平
- 蔡朝晖
- 金凯忠
- 吴振强
- 唐朋
- 张东军
- 熊涛
- 王修君
- 皮德常
- 袁健
- 龙士工
- 于东然
- 仲盛
- 刘洋
- 刘高源
-
-
郑剑;
杨立聪
-
-
摘要:
针对基于随机投影的差分隐私算法中存在直接对降维数据直接添加噪声导致基于欧氏距离数据挖掘中数据可用性较差的问题,提出了一种基于奇异值分解的差分隐私算法。该算法首先对高维社交网络的数据利用随机投影进行降维,然后对降维后的数据进行奇异值分解并对奇异值加入高斯噪声,最后通过奇异值分解逆运算生成待发布矩阵。该算法利用的奇异值矩阵是一个仅有主对角线上有值的矩阵,值的个数为矩阵的秩,与直接对降维后的数据直接添加高斯噪声相比,对奇异值矩阵中的值添加高斯噪声能有效地降低噪声的加入量。理论证明该算法满足差分隐私,并设计了欧氏距离差实验和谱聚类实验用于分析算法的数据可用性,实验结果表明该算法的数据可用性高于基于奇异值分解的差分隐私算法。
-
-
石聪聪;
高先周;
黄秀丽;
毛云龙
-
-
摘要:
联邦学习这一类分布式机器学习技术旨在保证使用大数据进行机器学习训练时保护本地数据不泄露.然而一系列机器学习隐私攻击表明,即使不直接暴露本地数据,仅仅通过获取机器学习模型的参数就可以进行数据隐私的窃取.从训练时参与者和聚合端之间传递的中间模型到最后发布的聚合模型,联邦学习的模型发布过程存在诸多隐私威胁.由此出现了大量相关的保护技术,包括基于差分隐私以及基于密码学的联邦学习隐私保护技术.本文针对联邦学习本地模型和聚合模型发布过程中可能出现的各种隐私威胁和敌手模型进行了简要介绍,并且对相关的防御技术和研究成果进行系统性综述.同时也对相关技术在联邦学习隐私保护中的发展趋势进行了展望.
-
-
刘宇涵;
陈红;
刘艺璇;
赵丹;
李翠平
-
-
摘要:
如今,图数据已经被广泛地应用于现实生活与科学研究当中,有巨大的使用和研究价值.但与此同时,针对图数据的收集与发布中也存在巨大的隐私风险.如何在保护图隐私的同时,发布与收集可用图数据,是目前个人、企业、政府等面临的重大挑战.本文首先从隐私信息所包含的内容、不同的隐私泄露场景,以及敌手模型三个方面深入地剖析了图数据在使用中存在的隐私风险,然后重点从攻击和防御两个角度展开介绍.针对攻击而言,本文分析了当前可行的图数据隐私攻击与攻击量化算法及其算法原理.针对防御而言,本文总结了简单匿名、图修改、聚类,以及差分隐私四种图数据隐私防御技术;分析了集中与分布两种数据存储场景下,不同类型图数据使用的各类隐私防御算法,以及数据隐私性与可用性度量方法.最后本文综合已有的研究成果,指出了图数据上隐私保护研究当前存在的问题、面临的挑战,及未来的研究方向.
-
-
王美珊;
姚兰;
高福祥;
徐军灿
-
-
摘要:
信息技术和医疗健康信息化的不断发展使医疗数据大规模涌现,为数据分析、数据挖掘、智能诊断等更深层次的应用提供了条件。医疗数据集庞大且涉及大量病人隐私,如何在使用医疗数据的同时保护病人隐私极具挑战性。目前应用于医疗领域的隐私保护技术主要以匿名化技术为主,但当攻击者具有强大的背景知识时,此类方法无法兼顾数据集的隐私性和可用性。因此提出了一种优化分类树算法,并改进了Diffpart分区算法,以数据间关联性为前提,挑选出医疗集值数据集中的适当数据,利用差分隐私保护技术进行加噪处理,满足差分隐私干扰并支持统计查询。最后在24万余条真实医疗数据集上进行测试。实验结果表明,所提算法满足差分隐私分布,并且相比Diffpart算法具备更高的隐私性和效用。
-
-
梁晨;
王利斌;
李卓群;
薛源
-
-
摘要:
近年来,生成对抗网络(generative adversarial networks, GANs)技术研究成果呈指数级增长,生成对抗网络使用零和博弈论将2个相互竞争的神经网络结合起来,使其能够产生更加清晰、离散的输出.在计算机视觉、医疗、金融等领域的图像和视频处理及生成、数据集增强、时间序列预测等方面已取得重大进展.主要介绍了生成对抗网络的基本框架、理论以及实现过程,分析了近年来主流研究现状,通过回顾生成对抗网络变体及其应用场景列举了亟待改进的问题.此外,还着重讨论了如何采用生成对抗网络隐私措施与处理敏感数据,以及生成对抗网络技术在相关领域的未来发展趋势.
-
-
李晓会;
陈潮阳;
张兴;
伊华伟
-
-
摘要:
推荐系统存在用户隐私安全性低、推荐服务质量差的问题。为此,文中提出一种基于差分隐私的个性化服务推荐算法DPk⁃median。该算法针对推荐系统服务器中生成的推荐列表,首先利用k⁃median聚类算法将推荐数据中具有相同属性的数据进行聚类;然后根据不同簇的风险级别,添加相应的拉普拉斯噪声机制,同一簇中的隐私预算参数是相同的,在保证隐私的前提下,可合理控制噪声的加入并提高噪声的利用率,保证推荐的质量损失减小,同时增加算法的执行效率。相关实验结果表明,与以往的基于差分隐私的个性化服务推荐系统相比,文中所提出的算法在保证系统安全性的同时,提高了服务推荐的质量和算法的执行效率。
-
-
胡韵;
刘嘉驹;
李春国
-
-
摘要:
随着深度学习在各个领域的广泛应用,数据收集和训练过程中产生的隐私泄露问题已成为阻碍人工智能进一步发展的原因之一.目前已有很多研究将深度学习与同态加密或者差分隐私等技术结合以实现对深度学习中的隐私保护.从另一个角度尝试解决这个问题,即在一定程度上保证训练数据集隐私性的基础上,实现对训练数据计算节点的可追踪性.提出了一种基于差分隐私的可追踪深度学习分类器,结合差分隐私和数字指纹技术,在为训练数据集提供隐私保护的同时保证在出现非法传播的训练模型或者数据集时,能根据其中的指纹信息定位到问题训练节点.该分类器既能保证安全判定分类功能,又能保证指纹的不可感知性、鲁棒性、可信度和可行性等基本特征.从后续的公式推导、理论分析和在真实数据的仿真结果表明,该方案能够满足深度学习中对隐私信息的安全可追踪性的需求.
-
-
袁泉;
晏飞扬;
文志云;
张振康
-
-
摘要:
针对权重社交网络差分隐私保护算法中噪声添加量过大以及隐私保护不均衡问题,提出了一种结合谱聚类算法与差分隐私保护模型的隐私保护算法SCDP。首先针对传统差分隐私保护算法直接向社交网络边权重添加噪声方式带来的噪声添加量过大的问题,结合谱聚类算法,将权重社交网络聚类成为不同的簇,对不同的簇采取随机添加噪声的方式,降低噪声的添加量,提高数据的可用性;其次设计新的隐私预算参数,根据社交网络边权重的大小决定噪声的添加量,实现更均衡的隐私保护;最后通过理论推导和实验证明了SCDP算法处理后的数据可用性更高。
-
-
粟勇;
刘文龙;
刘圣龙;
江伊雯
-
-
摘要:
联邦学习可以在保证数据隐私安全及合法合规的基础上实现共同建模,但保证联邦学习模型发布的隐私性以及保证用户对模型的效用仍是亟待解决的问题.提出一种基于安全洗牌和差分隐私的联邦学习模型安全防护方法SFLSDP.联邦模型拥有者利用差分隐私技术对联邦学习的模型参数进行加噪声,生成带噪声的模型参数,之后利用用户授权密钥和安全洗牌算法加密模型参数,并将加密的联邦学习模型参数发送给用户;用户在本地使用联邦学习模型时,利用用户授权密钥和安全洗牌算法解密模型参数密文,得到带噪声的联邦学习模型,将自己的数据作为该模型的输入就能得到期望的输出结果.实验证明该方法可以保护原始学习模型的隐私性,同时获得较高的效用.
-
-
张学典;
周圣英
-
-
摘要:
差分隐私是能够提供严谨数学证明的隐私保护模型,针对传统差分隐私保护方法在混合型数据集中应用效果差、处理后破坏数据可用性等问题,提出一种面向混合型数据集自适应聚类的差分隐私保护算法。结合快速聚类及k-prototype聚类算法的特点,首先根据混合数据集的不同数据类型属性,采用不同的相异度计算方式实现对不同数据类型属性的距离计算;然后针对聚类后簇中心分别采用Laplace机制及指数机制进行分类处理,最后结合差分隐私的组合性质实现对混合型数据集的差分隐私保护。实验结果表明,该方法相较于传统方法处理混合型数据集时,在相同隐私预算下数据误差率下降15%,证明处理结果的可用性。在固定隐私预算下,改变初始聚类簇数,该方法的隐私保护程度能够达到96%,证明了该算法处理混合型数据集的有效性。
-
-
- 《第33届中国数据库学术会议(NDBC2016 )》
| 2016年
-
摘要:
频繁序列模式挖掘是数据挖掘领域的一个基本问题,然而,当数据集含有敏感信息时,发布频繁序列模式本身及其支持度计数都有可能泄露用户隐私信息.为此,本文提出了一种满足差分隐私的频繁序列模式挖掘算法DP-FSM.该算法结合向下封闭性质与智能截断方法从候选模式中挑选出频繁的序列模式;采用几何机制对所选出来的模式的真实支持度添加噪音扰动.除此之外,为了提高挖掘结果的可用性,本文设计了一个阈值修正的策略来减小由于截断序列数据库导致某些序列支持度损失而产生的截断误差,以及如果一个频繁序列模式被错误的标注为不频繁的模式,则它的任何超序列在不计算其支持度的情况下即被判定为不频繁的序列模式而导致的传播误差.实验结果证明了该算法具有较高的数据可用性.
-
-
CHENG Xiang;
程祥;
XIAO Ke;
肖恪;
TANG Peng;
唐朋;
SU Sen;
苏森
- 《2016年全国通信软件学术会议》
| 2016年
-
摘要:
频繁项集挖掘是一项重要的数据挖掘任务,具有广泛的应用.然而,如果输入数据集中包含用户敏感信息,直接发布或分享挖掘结果可能会造成严重的个人隐私泄露.为了解决上述问题,提出了一种两阶段的满足差分隐私的频繁项集挖掘算法(记为TPFIM).在算法的第一阶段中,为了发现数据集中的频繁项集,提出了一种基于指数机制的频繁项集确定方法.在算法的第二阶段中,为了计算所发现的频繁项集的噪音支持度,提出了一种基于网格的噪音支持度计算方法.分析结果表明所提出的算法满足ε-差分隐私.实验结果表明,与现有算法相比,所提出的算法可以获得更好的数据效用.
-
-
KANG Jian;
康健;
WU Yingjie;
吴英杰;
HUANG Siyong;
黄泗勇;
CHEN Hong;
陈鸿;
SUN Lan;
孙岚
- 《第32届中国数据库学术会议》
| 2015年
-
摘要:
现有基于区间树结构的差分隐私直方图发布方法大多采用同方差的加噪方式,对其进一步研究可发现,若采用异方差的加噪策略,可进一步提升发布直方图的区间计数查询精度;然而,当前基于异方差加噪的差分隐私直方图发布方法对区间树结构却有着严格的要求,导致方法的灵活性与实用性较低.为此,提出一种异方差加噪下面向任意区间树结构的差分隐私直方图发布算法LUE-DPTree.算法首先根据区间计数查询的分布计算区间树中节点的覆盖概率,并据此分配各节点的隐私预算,从而实现异方差加噪;接着通过分析指出该异方差加噪策略适用于任意区间树结构下的差分隐私直方图发布,且从理论上进一步证明,对于任意区间树结构下基于异方差加噪的差分隐私直方图发布,仍然可在一致性约束下利用最优线性无偏估计进一步降低区间计数查询的误差.实验对算法LUE-DPTree所发布直方图数据的区间计数查询精度及算法效率与同类算法进行比较分析.实验结果表明,算法LUE-DPTree是有效可行的.
-
-
CAI Jianping;
蔡剑平;
WU Yingjie;
吴英杰;
WANG Xiaodong;
王晓东
- 《第32届中国数据库学术会议》
| 2015年
-
摘要:
现有绝大多数差分隐私算法只考虑数据的一次静态发布,而实际许多数据分析应用却涉及连续数据发布.为此,本文在深入分析连续数据发布问题的特点的基础上,结合矩阵机制的理论成果,提出一种基于矩阵机制的差分隐私连续数据发布方法.该方法的核心思想是首先利用树状数组构建连续数据发布问题的策略矩阵,然后利用策略矩阵的性质进行优化以提高发布数据的精确性,并针对现有基于矩阵机制的优化算法复杂度极高的问题,提出了时间复杂度为O(lgN)的快速对角阵优化算法FDA,可满足大规模连续数据发布的要求.实验对算法FDA所发布数据的精确度与同类算法进行比较分析.实验结果表明,算法FDA是有效可行的.
-
-
Zhang Xiaojian;
张啸剑;
Wang Miao;
王淼;
Meng Xiaofeng;
孟小峰
- 《第30届中国数据库学术会议》
| 2013年
-
摘要:
频繁模式挖掘是分析事务数据集常用技术.然而,当事务数据集合有敏感数据时(如用户行为记录、电子病例等),直接发布频繁模式及其支持度计数会给个人隐私带来相当大的风险.对此提出了一种满足ε-差分隐私的top-k频繁模式挖掘算法DP-topkP(differentially private top-k pattern mining).该算法利用指数机制从候选频繁模式集合中挑选出top-k个携带真实支持度计数的模式;采用拉普拉斯机制产生的噪音扰动所选模式的真实支持度计数;为了增强输出模式的可用性,采用后置处理技术对topk个模式的噪音支持度计数进行求精处理.从理论角度证明了该算法满足ε-差分隐私,并符合(λ,δ)-useful要求.实验结果证明了DP-topkP算法具有较好的准确性、可用性和可扩展性.
-
-
JIN Kaizhong;
金凯忠;
ZHANG Xiaojian;
张啸剑;
PENG Huili;
彭慧丽
- 《第33届中国数据库学术会议(NDBC2016 )》
| 2016年
-
摘要:
基于KD-树与差分隐私保护的空间数据分割得到了研究者的广泛关注,空间数据的大小与拉普拉斯噪音的多少直接制约着空间分割的精度.针对现有基于KD-树分割方法难以有效兼顾大规模空间数据与噪音量的不足,首先提出了一种满足差分隐私的KD-树分割方法SKD-Tree(Sampling-based KD-Tree),该方法利用满足差分隐私的伯努利随机抽样技术,抽取空间样本作为分割对象.然而,该方法却没有摆脱利用树高度控制拉普拉斯噪音.启发式设定合适的树高度非常困难,树高度过大,导致结点的噪音值过大;树高度过小,导致空间分割粒度太粗劣.为了弥补SKD-Tree方法的不足,提出了一种基于稀疏向量技术(Sparse Vector Technology,SVT)空间分割方法KD-TSS(KD-Tree with Sampling and SVT),该方法通过SVT判断树中结点是否继续分割,不再依赖KD-树高度来控制结点中的噪音值.SKD-Tree、KD-TSS与KD-Stand、KD-Hybrid在真实的大规模空间数据集上实验结果表明,其分割精度以及响应范围查询效果优于同类算法.
-
-
-
-