首页> 中文学位 >面向实时数据流的匿名化隐私保护发布技术研究
【6h】

面向实时数据流的匿名化隐私保护发布技术研究

代理获取

摘要

数据发布中的隐私保护是将数据发布与隐私保护技术相结合,在保护隐私的前提下,发布较为准确的数据,提高信息的利用水平。匿名化限制发布是其主要的技术实现手段。当前以数据流形式呈现的数据信息大量涌现,数据流环境下的隐私保护发布问题成为学术界的研究新热点之一。
   CASTLE算法是第一个完整提出的数据流隐私保护发布框架,本文在该算法的基础上,设计并实现了一种基于均衡思想的数据流匿名化隐私保护发布算法:B-CASTLE,同时,将Anatomy发布方法扩展至数据流环境下,称之为SAnatomy。本文的研究内容依次包括了隐私保护发布过程中的三个阶段:
   第一,研究了混合属性的同一度量映射问题。混合属性的同一度量映射是数据流隐私保护发布的基础,本文对三种不同类型的准标识符属性进行同一处理,在范畴属性语义泛化树的基础上,给出了一种语义距离的计算方法,为聚类提供了良好的度量准则,提高了聚类簇的内聚性。
   第二,研究了待发布等价类的动态调整和更新重组问题。本文在CASTLE算法的聚类簇调整模型基础上,构建面向数据流的动态聚类和实时调整算法模型,对单个聚类簇的元组最大数目进行了控制,同时调整了元组重聚类的策略,通过“部分合并”的方式产生符合要求的等价类,从而提升算法的整体效率。
   第三,研究了等价类和元组的预处理与发布问题。首先介绍了CASTLE算法的泛化发布策略,然后对B-CASTLE发布算法进行了改进和优化,并给出了相应的实验对比结果。此外,由于泛化技术会损失较多的分布和关联信息,本文给出了一种数据流的Anatomy发布方案:SAnatomy,在提高数据精度的同时对敏感数据提供了较好的保护,最后通过实验验证了SAnatomy的可行性和有效性。
   本文的主要贡献是给出了基于语义泛化树的同一度量映射方法和数据流的B-CASTLE发布算法,它们对提高数据流隐私保护发布的效果和效率具有重要的意义。另外,本文给出的数据流Anatomy发布方法也为其它方面类似的应用提供了借鉴。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号