文摘
英文文摘
声明
第一章 绪论
1.1研究背景及意义
1.2数据挖掘的研究现状和发展趋势
1.3课题的提出
1.4论文的研究内容和框架
第二章 总体业务架构
2.1客户流失预测模型构架
2.2问题的定义
2.3模型应用时间窗口
2.4流失与流失异常状态
第三章 分类算法及相关理论
3.1分类算法综述
3.2决策树
3.2.1建立决策树
3.2.2信息增益
3.2.3剪枝前应该考虑的问题
3.2.4修剪决策树
3.2.5决策树分类规则的获取
3.3神经网络
3.3.1人工神经元模型
3.3.2神经网络学习过程
3.3.3BPN算法
3.4决策树与神经网络比较
3.5集成学习
3.6Bagging算法
3.6.1Bootstrap介绍
3.6.2Bagging算法描述
3.7Boosting算法
3.7.1Boosting介绍
3.7.2Adaboost算法描述
第四章 试验数据生成逻辑
4.1CRISP-DM参考模型
4.2ETL处理逻辑
4.2.1源数据的分析和验证
4.2.2ETL抽取接口与时间窗口的确定
4.2.3ETL加载周期、方式与策略的制定
4.2.4ETL处理的实现
4.3数据抽样
4.4数据预处理
4.4.1数据集成
4.4.2数据清洗
4.4.3数据规约
4.4.4数据离散化
4.5试验数据集描述
第五章 分类模型性能评价指标
5.1分类算法准确率的评估
5.2基本评估方法的不足
5.3ROC曲线
第六章 客户流失预测试验
6.1整体试验流程
6.2试验步骤与结果分析
6.2.1决策树系列方法实证研究
6.2.2神经网络系列方法实证研究
6.3各种分类器性能比较分析
6.4建立预测模型
6.5客户挽留策略
第七章 结束语
7.1论文总结
7.2未来的工作
参考文献
致谢
硕士期间发表的论文