首页> 中文学位 >基于RSA隐私保护的分布式关联规则挖掘方法研究
【6h】

基于RSA隐私保护的分布式关联规则挖掘方法研究

代理获取

摘要

随着计算机网络与数据挖掘技术的飞速发展,海量数据的收集,知识“金块”的挖掘变得越来越方便、快捷,这在商务决策、科学以及医学研究等各领域中发挥着积极的作用。然而,在现实中数据挖掘不可回避的一个重要问题是隐私保护,如顾客的购买喜好、病人的电子病情信息、银行卡客户的交易行为等极其敏感信息将会泄露,这些问题的出现向数据共享和传统数据挖掘提出了挑战。在数据挖掘过程中如何解决好隐私保护的问题,已经成为数据挖掘界的一个研究热点。
   本文主要研究内容是基于RSA隐私保护的分布式关联规则挖掘方法。传统隐私保护的关联规则挖掘算法主要基于特定的集中式数据库设计,针对分布式环境下的隐私保护关联规则挖掘尚不多见。目前,通常把分布式环境下的隐私保护关联规则挖掘归结为安全多方计算问题,但需要付出高额的计算与通信代价。因此,研究并设计高效隐私保护的分布式关联规则挖掘方法是本文研究的主要目标。
   本文主要要研究内容与创新点如下:
   1.在深入分析经典Apriori算法基础上,针对Apriori算法瓶颈问题,设计一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘ARBSM算法。该算法是在压缩事务布尔矩阵基础上构建一个事务相似矩阵,跨越了从低向高逐阶查找频繁项集的限制,有效地解决了Apriori算法由于逐层搜索的迭代产生大量候选项集的问题。经实验验证该算法具有较好的准确性和效率性。
   2.引入密码管理服务器(CMS)和数据挖掘服务器(DMS),构建一个分布式安全体系总体框架,并结合RSA公钥加密和伪随机数生成器技术优势,在ARBSM算法基础上,设计一种隐私保护的分布式关联规则挖掘PPD-ARBSM算法。理论分析与实验结果表明,该算法具有较好的隐私性、准确性和效率性,但同时存在一个明显瓶颈问题:存在大量指数运算,极大影响算法执行效率。
   3.进一步优化CMS和DMS功能,构建一个改进的分布式安全体系总体框架,并结合RSA公钥加密和HES同态加密机制的优势,在ARBSM算法基础上,采用密码分级管理机制,设计一种基于RSA隐私保护的分布式关联规则挖掘PPDM-ARBSM算法。它有效地解决PPD-ARBSM算法的瓶颈问题,理论分析与实验结果表明,该算法具有更好的隐私性、准确性性高效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号