首页> 中文学位 >数据挖掘隐私保护在医疗信息系统中的研究
【6h】

数据挖掘隐私保护在医疗信息系统中的研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章绪论

1.1 数据挖掘隐私保护研究背景

1.2数据挖掘隐私保护在医疗信息系统中的研究意义

1.3国内外研究现状

1.4本文主要工作

1.5本文组织结构

第二章PPDM基础算法分析

2.1PPDM的概念及分类

2.2PPDM下的ARH

2.3本文实验环境和工具介绍

2.4 本章小结

第三章启发式ARH

3.1算法方案及流程

3.2算法核心代码及分析

3.3 算法验证与结果分析

3.4本章小结

第四章精确信息隐藏的ARH

4.1 算法概要及流程

4.2算法方案

4.3算法核心代码

4.4算法验证与结果分析

4.5本章小结

第五章ARH在医疗信息系统中的仿真实现

5.1 系统架构与流程

5.2仿真实验与结果分析

5.3本章小结

第六章总结与展望

6.1本文总结

6.2展望

致谢

参考文献

攻读硕士学位期间取得的成果

展开▼

摘要

随着数据挖掘在医疗领域越来越广泛的应用,电子病历的隐私泄露也造成了很多病人的困扰,因此数据挖掘隐私保护(PPDM)技术在医疗领域也成为了人们一个关注的重点。
  关联规则隐藏(ARH)是数据挖掘隐私保护领域下一个较新的子领域,不同于过去的针对本身就是隐私的数据进行隐藏的技术,关联规则隐藏主要针对在数据挖掘过程中可能挖掘出的敏感规则进行隐藏,该技术正受到越来越多的关注与研究。本文着重对关联规则隐藏算法进行了详细介绍,并对现有算法进行了改进,以提高算法在隐藏精确性和运行效率方面的表现。
  启发式隐藏算法是关联规则隐藏算法中一类运算速度较快、但对数据集造成的影响较大的算法。本文对现有的多种启发式隐藏算法进行改进,并结合在医疗信息系统的实际应用情景,提出了一种启发式双聚类(HBC)算法,算法通过双聚类使具有相似数据结构的敏感规则能同时被隐藏,以提高隐藏准确性,减小对数据集的影响,并在隐藏每一个数据项之前用公式计算出最小迭代次数,以减少不必要的运算,提高运算效率。本文通过算法在真实数据集下的测试证明了HBC算法在隐藏精确性和减小副作用两个标准下有所提高。
  精确信息隐藏算法是一类能够准确隐藏信息、对数据集影响较小、但运算复杂度较高的算法,这类算法多是先将隐藏问题转换为限制满足问题(CSP),再对CSP进行求解,而算法的主要运行时间就是用于解决 CSP。本文通过分析和研究这类问题在医疗信息系统中的应用,提出了一种二进制隐枚举法(BIE),该算法首先对不等式组的系数矩阵进行矩阵分解,大大降低了CSP的问题规模,再通过对未知变量进行排序,以及二进制增长式的隐枚举法,使得算法有可能在很短的时间内找到问题的最优解。本文通过算法在真实数据集下的测试,对比改进前的算法,证明了BIE算法有较大的概率能够快速找到最优解。
  最后本文针对关联规则隐藏算法在医疗信息系统中的应用提出了一个新的系统架构,以及三种数据角色,分别是数据提供者、数据收集者和数据用户。最后本文将上述两个算法在真实的医疗数据集下进行仿真验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号