首页> 中文学位 >电子商务中数据挖掘技术的研究与应用
【6h】

电子商务中数据挖掘技术的研究与应用

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景

1.2 相关研究的发展现状

1.2.1 电子商务的发展概况

1.2.2 数据挖掘概述

1.2.3 数据挖掘的主要功能

1.3 Web数据挖掘技术

1.3.1 Web数据挖掘概述

1.3.2 Web数据挖掘技术的特点与分类

1.4 基于隐私保护的数据挖掘

1.5 本文主要研究内容及结构安排

1.5.1 主要研究内容

1.5.2 结构安排

第2章 分布式数据挖掘中的隐私保护问题

2.1 分布式数据挖掘引发的隐私问题

2.1.1 一般数据挖掘中的隐私保护问题

2.1.2 分布式数据挖掘中的隐私保护

2.2 隐私保护数据挖掘算法研究现状

2.2.1 修改原始值

2.2.2 量化隐私

2.2.3 重构原始分布

2.2.4 通过划分加快计算速度

2.2.5 停止计算的标准

2.3 基于隐私保护的关联规则挖掘算法

2.3.1 频繁项集与Apriori算法

2.3.2 MWFI算法

2.3.3 基于RRPH的频繁项集生成算法

2.4 安全多方计算综述

2.4.1 安全求和计算

2.4.2 安全求并集算法

2.4.3 安全计算交集

2.4.4 安全数量积计算

2.5 本章小结

第3章 基于随机应答的关联规则挖掘技术

3.1 引言

3.2 数据预处理

3.2.1 Web数据过滤

3.2.2 反蜘蛛化

3.2.3 用户识别

3.2.4 会话识别

3.2.5 路径补全

3.3 基于随机应答的隐私保护算法

3.3.1 基于访问时间的会话集生成算法

3.3.2 基于隐私保护的会话集转换算法

3.3.3 隐私保护算法

3.3.4 隐私保护的关联规则挖掘算法

3.4 算法分析

3.4.1 关联算法复杂度分析

3.4.2 模拟测试

3.5 本章小结

第4章 基于列置换的隐私保护关联规则挖掘技术

4.1 引言

4.2 数据预处理

4.2.1 Web数据过滤

4.2.2 用户识别

4.2.3 会话识别

4.3 访问路径会话集的布尔矩阵表示

4.4 基于列置换的伪列随机回答方法

4.5 基于位运算的频繁项集生成算法

4.6 模拟测试

4.7 本章小结

参考文献

致谢

附录A 攻读硕士研究生期间所发表的学术论文目录

附录B 攻读硕士研究生期间参与的项目

展开▼

摘要

随着网络、通信和信息技术的突破性进展,电子商务作为一种新颖的商务模式受到人们广泛关注。电子商务给人们带来了价廉物美的商品和快速便捷的网上交易,同时,由于电子商务本身存在着安全问题以及移动网络环境的开放性给电子商务活动带来的潜在安全问题,也给人们带来了隐私可能被泄露的问题。很多大型电子商务网站为了系统的安全和稳定,一些大型的数据库以分布式形式存放在不同的站点上,这在一定程度也增加了隐私保护的难度。分布式环境中基于隐私保护的数据挖掘技术是近年来数据挖掘领域中的研究热点之一,如何在保证高质量数据挖掘结果的同时达到隐私保护的目的是本文所要研究的重点。
   基于以上问题,在前人研究的基础上,本文首先分析了电子商务快速发展的形势下分布式数据挖掘引发的隐私问题,如何在不泄露个人隐私的前提下建立一个较为精确地模型来完成数据挖掘的任务,是数据挖掘隐私保护算法主要讨论的问题。
   本文分析了前人提出的一些经典关联规则算法,比如被修改用于实现数据挖掘中的隐私保护的Apriori算法、MWFI算法等,和一些广泛用于挖掘前的原始数据变换的重构原始数据分布和离散化属性数据的方法。另外本文也分析了安全多方计算理论在隐私保护数据挖掘中的应用。在对已有研究成果分析的基础上,本文研究了用户访问Web网站可能带来Web日志泄露个人隐私的问题,用户访问电子商务网站的Web页面,所访问网站的Web服务器日志自动记录了用户的访问足迹,访问足迹成为泄露隐私的重要途径。针对这类问题,本文首先研究了将电子商务网站Web服务器记录的日志信息转换成二维表,采用随机化回答方式生成干扰数据,然后提供给数据使用者进行频繁项集以及强关联规则的挖掘算法,从而得到实现隐私保护的网上购物篮商品间的关联规则。针对Web日志中包含的隐私信息,本文研究了采用填充信息对原始数据进行干扰的方法,结合列置换的伪随机化回答方式先对原始日志信息进行变换,在此基础上研究了基于位运算的频繁项集生成算法,实现对原始数据及挖掘结果均进行隐私保护的关联规则挖掘。
   最后,本文分析和评价了已做的研究工作,并提出了日后改进的方向。

著录项

  • 作者

    周国富;

  • 作者单位

    湖南大学;

  • 授予单位 湖南大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 白树仁,朱湘有;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据挖掘技术; Web日志; 隐私保护; 电子商务;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号