基于数据仓库技术的运营统计分析系统的设计与实现
THE DESIGN AND IMPLEMENTATIONOF THE OPERATING STATISTICAL ANALYSIS SYSTEM BASED ON DATA WAREHOUSE TECHNOLOGY
摘 要
Abstract
第1章 绪 论
1.1 课题的背景及研究目的
1.2 与课题相关的国内外研究综述
1.3 论文研究的主要内容
1.4 论文的内容组织
第2章 运营统计分析系统及关键技术
2.1 运营统计分析系统的概念
2.2 数据仓库
2.2.1 数据仓库出现的背景
2.2.2 联机事务处理系统与联机分析处理系统的区别
2.2.3 数据仓库系统的查询特点
2.3 数据分析
2.3.1 联机分析处理
2.3.2 数据挖掘
2.4 数据预处理方法
2.5 运营统计分析算法
2.5.1多表连接算法
2.5.2基于分组序号的聚集算法
2.5.3 K-means算法
2.6 本章小结
第3章 运营统计分析系统的设计
3.1 系统需求分析
3.2 系统体系结构
3.3 系统总体功能结构设计
3.4 系统开发平台
3.5 系统数据仓库的构建
3.5.1 数据仓库主题的确定
3.5.2 逻辑模型设计
3.5.3 物理模型设计
3.5.4 多维数据模型设计
3.6 ETL过程
3.6.1 数据抽取
3.6.2 数据的转换
3.6.3 数据的清洗
3.6.4 数据的载入
3.7 系统主要功能模块
3.7.1 统计报表模块
3.7.2 主题分析模块
3.7.3 客户分群专题分析模块
3.8 本章小结
第4章 运营统计分析系统的实现
4.1 系统实现
4.1.1 统计报表模块的实现
4.1.2 主题分析的实现方法
4.1.3 客户分群模块的聚类算法实现
4.2 系统测试
4.2.1 测试环境
4.2.2 测试内容
4.3 系统部分应用效果验证
4.3.1 多表连接和分组聚集效果分析
4.3.2 主题分析模块的分析效果评价
4.3.3 客户分群的聚类结果分析与应用
4.4 本章小结
结 论
参考文献
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢
个人简历
哈尔滨工业大学;