首页> 中文学位 >基于商空间粒度计算的点击流数据仓库的构建及挖掘算法研究
【6h】

基于商空间粒度计算的点击流数据仓库的构建及挖掘算法研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 论文的安排

第2章 点击流数据仓库的构建

2.1 数据仓库

2.1.1 数据仓库的定义

2.1.2 数据仓库的体系结构

2.1.3 数据仓库的数据组织

2.1.4 数据仓库的数据模型

2.1.5 数据仓库的ETL

2.1.6 数据仓库工具

2.2 数据挖掘

2.2.1 Web数据挖掘

2.2.2 Web数据预处理

2.3 点击流与点击流数据仓库

2.3.1 点击流的定义

2.3.2 将数据仓库引入Web

2.3.3 点击流数据仓库的定义

2.4 点击流数据仓库的ETL设计

2.4.1 传统数据抽取方法

2.4.2 点击流数据抽取

2.4.3 确认数据源

2.4.4 基本概念

2.4.5 算法描述

2.5 数据的转换和装载

2.5.1 数据转换

2.5.2 数据装载

2.6 小结

第3章 基于商空间粒度的点击流数据仓库的设计

3.1 粒度计算

3.2 粒度计算的主要模型

3.2.1 基于模糊集合论的词计算模型

3.2.2 基于粗糙集理论的粒度计算模型

3.2.3 基于商空间的粒度计算模型

3.3 基于粒度计算的点击流数据仓库的性能分析

3.3.1 网站信息分析

3.3.2 Web日志预处理的几个阶段

3.3.3 粒度计算挖掘用户偏爱页面及最佳路径

3.3.4 点击流数据仓库的性能分析

3.4 本章小结

第4章 基于商空间粒度计算的WEB日志关联规则挖掘

4.1 关联规则挖掘技术简介和研究现状

4.1.1 关联规则定义

4.1.2 关联规则的种类

4.2 关联规则的挖掘算法

4.2.1 经典的频集算法

4.2.2 FP-树频集算法

4.2.3 多层关联规则挖掘

4.3 基于粒度计算的关联规则挖掘算法

4.3.1 粒度计算

4.3.2 Web日志

4.4 相关的工作

4.4.1 基于商空间粒度计算的关联规则挖掘算法

4.4.2 运用算法Apriori对以上数据进行关联规则的挖掘

4.4.3 利用基于粒计算的关联规则进行挖掘

4.5 试验分析论证

4.6 结束语

第5章 基于用户兴趣度的频繁路径挖掘算法

5.1 相关定义

5.2 频繁路径挖掘算法过程

5.3 频繁路径挖掘算法描述

5.4 购物网站点击流数据分析结果的Web展示

5.5 结论

结论

参考文献

致谢

附录A 攻读学位期间所发表的学术论文

展开▼

摘要

随着电子商务的迅猛发展,点击流数据仓库的研究越来越引起重视。点击流数据包含许多对企业非常有用的信息,包括客户的来源、消费行为、访问兴趣、访问意。图等。通过研究这些信息,能够对电子网站的建设起指导作用,同时也可以了解客户的购买行为,进而优化网站拓扑结构,提高点击流数据仓库的性能,预测产品销售,提升服务质量。
   本文构建点击流数据仓库的数据源来自某购物网站。从数据仓库的整体框架、设计模型、ETL构建等方面对购物网站中点击流数据仓库的构建过程进行了整体概述,通过实验验证整个构建过程,最后得到一个可用的点击流数据仓库的解决方案。点击流数据仓库的处理问题更多是数据源的问题,针对点击流数据源的多样性,采用基于时间特征的数据抽取策略进行数据预处理;针对点击流数据源的复杂性,采用基于商空间粒度计算的数据挖掘算法。处理过程中重点关注用户在网站上停留时间较长的站点,关注用户频繁访问的站点。通过基于商空间粒度计算的关联规则挖掘技术发现购物网站中不同站点之间的关联程度,多层次、多角度分析挖掘数据源,简化了数据收集的流程,然后结合Web关联规则的数据挖掘技术,改进了的用户频繁偏爱路径挖掘算法。利用寻找到的用户兴趣度,有目的的优化购物网站的网络拓扑结构,改进服务质量,进而增加网站产品销售量。
   该点击流数据仓库构建方案不仅支持点击流网站信息的日常数据分析,同时支持数据仓库Web日志基础上的用户使用模式的深层次挖掘,进一步分析销售情况。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号