声明
摘要
第1章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.2 日志挖掘研究现状
1.2.3 Web日志分析现状
1.3 研究内容和组织结构
第2章 分布式技术与Web日志挖掘的研究
2.1 分布式技术的研究
2.1.1 Hadoop生态系统
2.1.2 HDFS的架构
2.1.3 MapReduce编程模型
2.1.4 HBase数据库
2.2 日志挖掘技术的研究
2.2.1 数据挖掘的研究
2.2.2 Web挖掘的分类
2.2.3 Web日志挖掘的流程
2.3 本章小结
第3章 电信系统Web日志采集预处理模块的设计
3.1 电信系统Web日志结构分析
3.2 Web日志数据采集的设计
3.3 Web日志数据预处理的设计
3.4 本章小结
第4章 电信系统Web日志存储模块的设计
4.1 Web日志存储目标
4.2 Web日志存储模块结构设计
4.3 Web日志存储的具体实现
4.4 本章小结
第5章 电信系统Web日志挖掘及聚类算法的设计
5.1 电信系统Web日志挖掘模块的流程
5.2 基于电信系统Web日志的用户建模
5.3 改进的K-means算法的并行化设计与实现
5.3.1 K-means聚类算法的研究
5.3.2 Canopy算法的研究
5.3.3 FCM算法的研究
5.3.4 K-means算法的改进与优化
5.3.5 改进的K-means算法并行化设计与实现
5.4 本章小结
第6章 电信系统日志分析平台实现与结果分析
6.1 实验环境的搭建与配置
6.1.1 测试环境的部暑
6.1.2 软件安装及配置
6.1.3 系统运行过程及注意事项
6.2 系统运行结果分析
6.2.1 Hadoop平台并行处理高效性
6.2.2 改进K-means算法的优越性
6.3 本章小结
结论
致谢
参考文献
攻读学位期间取得学术成果
成都理工大学;