文摘
英文文摘
声明
第一章绪论
1.1数据挖掘的现状
1.2电信运营行业背景
1.3防止客户流失的重要意义
1.4现行方式不足及课题的提出
1.5主要研究内容和贡献
1.6论文的内容安排
第二章数据挖掘的基础知识
2.1数据仓库概述
2.2数据仓库与数据挖掘
2.3 ETL过程
2.4数据挖掘的含义
2.5数据挖掘技术的主要算法
2.5.1决策树
2.5.2决策树算法的缺陷及改进方法
2.5.3神经网络
2.6 CRISP-DM数据挖掘方法论
2.7 SPSS Clementine
第三章数据挖掘的分析过程
3.1商业理解阶段
3.1.1商业目标
3.1.2数据挖掘目标
3.2数据理解阶段
3.2.1确定数据的来源
3.2.2确定数据存储的粒度
3.2.3数据仓库的建模结构
3.2.4维度设计
3.2.5构建逻辑模型
3.3数据准备阶段
3.3.1 ETL数据抽取
3.3.2数据清理
3.4建立模型阶段
3.4.1选择建模算法
3.4.2输入属性选择和属性构造
3.4.3过抽样
3.4.4组合打分模型
3.5模型评估阶段
3.5.1预测命中率与预测覆盖率
3.5.2 Gains图
3.5.3 Lift图
3.6模型发布
第四章电信客户流失预测模型的设计与实现
4.1基于数据挖掘的系统架构
4.2客户流失分析的简要过程
4.3构建数据仓库物理模型
4.3建模前期数据准备
4.3.1客户流失的标准和流失点的界定
4.3.2确定时间窗口
4.3.3数据规范化
4.3.4属性剔除
4.3.5属性构造和衍生变量
4.3.6离群点的处理
4.4建立模型
4.4.1模型分析
4.4.2 C5.0决策树算法
4.4.3分类树的构造
4.4.4树的剪枝
4.4.5模型训练
4.4.6模型测试和评估
4.4.7综合评分模型
第五章电信客户流失预测模型改进
5.1模型参数调整
5.2属性约简
5.3时间窗口调整
5.4属性调整
5.5改进后的模型结果
5.6综合评分模型最终结果
总结和展望
参考文献
致谢