首页> 中文学位 >高效用数据起源过滤机制及评估模型研究
【6h】

高效用数据起源过滤机制及评估模型研究

代理获取

目录

第一个书签之前

展开▼

摘要

互联网技术的飞速发展为数据的产生、修改与共享带来极大便利,但同时数据质量变得难以保证。数据起源作为记录数据从产生到消亡的整个演变过程的一种元数据,可用于分析数据质量、数据处理过程反演、错误究责等。数据起源可能蕴含敏感信息,因此在不同组织间交换或共享数据起源时有必要保证起源安全。起源过滤是一种通过隐藏或删除敏感信息实现起源安全的新兴技术。 针对现有起源过滤研究中的缺乏对过滤视图效用的定量评估、仅关注底层节点的过滤忽略依赖关系的过滤、过滤视图效用低下等问题,本文构建了过滤视图效用评估模型,并在此基础上提出了一种高效用数据起源过滤机制。本文的主要研究内容包括以下方面: 第一,扩展了PROV起源模型,作为开展起源过滤机制评估与研究的理论基础。首先,形式化地定义了起源图等基本概念。其次,依据数据溯源的内涵定义溯源结果,并深入探究数据溯源与起源过滤之间的关系,介绍了基本的起源过滤操作,提出起源过滤约束。然后,定义不确定的依赖关系并证明引入不确定依赖关系对起源图进行修复的可行性。最后,将PROV 起源模型中原有的依赖关系泛化为不确定的依赖关系,并基于此提出了修复操作,用于提高过滤视图效用。 第二,阐明了过滤视图效用的本质内涵并对其进行形式化定义,构建了过滤视图效用评估模型,为衡量过滤视图的效用提供了评估标准。该评估模型通过量化原始起源图与起源过滤视图之间的差异评估过滤视图的效用,考虑了应用不同过滤操作所得起源元素的效用不同,对过滤视图中的节点、边以及连通路径按其效用进行细分作为评估指标,综合权重构建了过滤视图评估模型,设计并实现过滤视图效用评估算法,通过实验验证了该算法的性能与起源图大小负相关,与过滤视图和原始起源图之间的差异大小无关。 第三,基于扩展的PROV起源模型,提出了高效用数据起源过滤机制。高效用数据起源过滤机制不仅实现了对底层节点的过滤,同时可实现对节点间依赖关系的过滤。该机制针对PROV数据起源模型中的三类节点和七类依赖关系分别制定了基于“删除+修复”的过滤规则,首先删除起源图中的敏感元素实现起源安全,然后根据敏感元素的类型以及敏感元素在起源图中的所在位置,引入扩展的PROV起源模型中的不确定依赖关系修复起源图。设计并实现高效用数据起源过滤算法,使用过滤视图效用评估模型验证了本文机制的有效性。实验结果证明本文过滤机制所得过滤视图相较ProvAbs机制所得过滤视图效用提高了15.26%,且性能高于ProvAbs机制。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号