首页> 中文期刊> 《软件学报》 >差分隐私的数据流关键模式挖掘方法

差分隐私的数据流关键模式挖掘方法

         

摘要

频繁模式挖掘是数据挖掘的重要任务之一,在数据流上挖掘简洁的关键模式比频繁模式更有优势,因为关键模式既可以避免频繁模式里包含的冗余信息以减少内存存储空间,又可以高效无损地提取频繁模式.但是由于相邻时间戳的统计信息可以作为背景知识增强攻击者的推理能力,所以从包含个人信息的数据流中挖掘关键模式比静态场景下更容易泄露隐私.分析指出了数据流关键模式挖掘的隐私泄露问题及原理,并提出了一种满足差分隐私的数据流关键模式挖掘算法DP-CPM,该算法在每个时间戳设计一种两阶段机制:差异计算阶段和噪音挖掘阶段.该机制既考虑了隐私和数据效用之间的权衡,又考虑了挖掘时间和维护开销之间的权衡.为了提高数据流中连续发布时的数据效用性,在第1阶段通过计算差异来决定当前时间戳是返回低噪音统计值还是精确的近似统计值.如果是返回低噪音统计值,算法进入噪音挖掘阶段.在噪音挖掘阶段,首先通过判断查询集筛选出关键模式候选集,然后通过给筛选出的候选集里的模式支持度加入服从拉普拉斯分布的随机噪音,得到最终的噪音支持度.最后,给出了严格的理论分析和大量的实验,表明DP-CPM算法的有效性和执行效率.

著录项

  • 来源
    《软件学报》 |2019年第3期|648-666|共19页
  • 作者单位

    广西多源信息挖掘与安全重点实验室(广西师范大学);

    广西桂林541004;

    广西师范大学计算机科学与信息工程学院;

    广西桂林541004;

    广西师范大学计算机科学与信息工程学院;

    广西桂林541004;

    广西师范大学计算机科学与信息工程学院;

    广西桂林541004;

    广西多源信息挖掘与安全重点实验室(广西师范大学);

    广西桂林541004;

    广西师范大学计算机科学与信息工程学院;

    广西桂林541004;

    广西多源信息挖掘与安全重点实验室(广西师范大学);

    广西桂林541004;

    广西师范大学计算机科学与信息工程学院;

    广西桂林541004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 人工智能理论;
  • 关键词

    关键模式; 数据流; 差分隐私; 数据挖掘; 隐私泄露;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号