首页> 中文学位 >用于k-匿名数据的关联规则集化简与可视化技术
【6h】

用于k-匿名数据的关联规则集化简与可视化技术

代理获取

目录

声明

1 引言

1.1研究背景和意义

1.2研究内容

1.3研究现状

1.4 本文组织结构

2 相关基础知识

2.1 k-匿名数据相关知识

2.2关联规则基础知识

2.3 K-匿名数据关联规则集的生成

3 K-匿名数据关联规则集的化简和可视化方法

3.1 K-匿名数据关联规则的特点与确定化

3.2 K-匿名关联规则结果集的化简方法

3.3基于矩阵的可视化技术的改进

3.4支持度和置信度的展示

3.5用户交互

4 基于矩阵的关联规则3D可视化系统

4.1基于矩阵的关联规则3D可视化系统简介

4.2关联规则映射的准备过程

4.3关联规则的选择和观点展示

4.4可视化系统的用户交互接口

5 基于矩阵的关联规则3D可视化系统的测试与评估

5.1 可用性的测试

5.2 用户交互能力测试

6 总结与展望

参考文献

致谢

展开▼

摘要

随着互联网的快速发展,网络逐渐成为人们日常生活中不可或缺的一部分。人们在享受网络带来便利的同时,也在网络应用的服务器上留下了大量的个人生活、消费、习惯等信息,而这些信息极有可能包含那些人们不愿意泄露的个人隐私信息。随着人们隐私保护意识的提高,隐私泄露问题也越来越受到人们的重视。通过不断的发展和完善,k-匿名隐私保护模型已经逐渐成为数据发布者可信赖的隐私保护模型,网络上也将会涌现出越来越多的k-匿名数据。k-匿名数据作为一种特殊的不确定性数据,是通过泛化树对精确数据进行泛化而得到的,因此使得k-匿名数据的关联规则挖掘结果集不同于传统的确定数据的关联规则集。k-匿名数据关联规则的挖掘无论是基于等概率展开等概率可能世界,还是通过了解泛化值的特征直接进行关联规则挖掘,得到的关联规则结果集均包含与k-匿名数据形式相同的关联项。若将关联规则的泛化值还原到确定的值域空间,需要通过大量的计算实现,会导致用户的等待时间增加,极其不利于用户的体验。与此同时,如若原始数据量增加,则关联规则结果集也将随之逐渐增大;且由于关联规则自身复杂的特性,即生成的关联规则包含项目的个数不确定,每条关联规则还有两个重要参数支持度和置信度,从而使得用户想要在大量关联规则集中探索发现自己感兴趣的关联规则变得越来越困难。因此,如何帮助用户有效的探索和研究关联规则结果集是一个亟待解决的问题。
  目前,经过众多学者研究发现,在人类的视觉神经系统的帮助下,信息图形化的表达能够给人们提供一种更好的获取和寻找信息的方式。因此,运用可视化技术对庞大而复杂的关联规则进行可视化将是帮助用户实现对关联规则结果集研究和学习的有效方法之一。
  本文通过学习k-匿名数据的关联规则集和可视化技术,提出并实现了基于矩阵的关联规则3D可视化系统,用于帮助用户探索和研究确定化后的k-匿名数据关联规则。该系统所使用的可视化技术采用的是新型的基于矩阵的可视化技术,该技术使用规则-项目的映射代替了传统的项目-项目的映射,通过规则-项目映射将原始的关联规则结果集转化为能够直接进行可视化表达的数据形式,该技术可以有效的解决含有多个前项的关联规则的可视化重叠问题;同时,基于对蕴含相同右边项集的关联规则的左边不同项目的重要性的考虑,本文提出一种应用于确定化后的k-匿名数据关联规则集的化简的方法。该方法通过研究确定化后的k-匿名数据关联规则的右边项集,将属于同一组的关联规则进行归并,同时为新生成的关联规则的项目指派权重。实验证明,通过这种归并方法可以有效的化简确定化后的k-匿名数据关联规则结果集,并且可以帮助用户比较确定化后的k-匿名数据关联规则左边项目的重要性。此外,本文研究的基于矩阵的关联规则3D可视化系统提供了简单实用的交互功能,包括对确定化后的k-匿名数据关联规则的支持度、置信度和权重的排序和过滤,对三维矩阵可视化图形的缩放和旋转以及与可视化图形实时交互并展示更详细的信息等。这些交互功能的实现帮助用户从不同的角度深入的探索确定化后的k-匿名数据关联规则结果集。最后,通过参考可视化系统的评估和软件测试的方法,对整个系统的功能进行讨论。结果表明,本系统可以有效的解决可视化技术导致的图形重叠问题,并且能够清晰的解释确定化后的k-匿名数据关联规则包含的全部项目之间的关系,以及两个重要参数支持度和置信度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号