首页> 中文学位 >基于集成分类算法的电信客户流失预测研究
【6h】

基于集成分类算法的电信客户流失预测研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1研究背景及意义

1.2数据挖掘的研究现状和发展趋势

1.3课题的提出

1.4论文的研究内容和框架

第二章 总体业务架构

2.1客户流失预测模型构架

2.2问题的定义

2.3模型应用时间窗口

2.4流失与流失异常状态

第三章 分类算法及相关理论

3.1分类算法综述

3.2决策树

3.2.1建立决策树

3.2.2信息增益

3.2.3剪枝前应该考虑的问题

3.2.4修剪决策树

3.2.5决策树分类规则的获取

3.3神经网络

3.3.1人工神经元模型

3.3.2神经网络学习过程

3.3.3BPN算法

3.4决策树与神经网络比较

3.5集成学习

3.6Bagging算法

3.6.1Bootstrap介绍

3.6.2Bagging算法描述

3.7Boosting算法

3.7.1Boosting介绍

3.7.2Adaboost算法描述

第四章 试验数据生成逻辑

4.1CRISP-DM参考模型

4.2ETL处理逻辑

4.2.1源数据的分析和验证

4.2.2ETL抽取接口与时间窗口的确定

4.2.3ETL加载周期、方式与策略的制定

4.2.4ETL处理的实现

4.3数据抽样

4.4数据预处理

4.4.1数据集成

4.4.2数据清洗

4.4.3数据规约

4.4.4数据离散化

4.5试验数据集描述

第五章 分类模型性能评价指标

5.1分类算法准确率的评估

5.2基本评估方法的不足

5.3ROC曲线

第六章 客户流失预测试验

6.1整体试验流程

6.2试验步骤与结果分析

6.2.1决策树系列方法实证研究

6.2.2神经网络系列方法实证研究

6.3各种分类器性能比较分析

6.4建立预测模型

6.5客户挽留策略

第七章 结束语

7.1论文总结

7.2未来的工作

参考文献

致谢

硕士期间发表的论文

展开▼

摘要

客户频繁流失是苏州电信发展中所面临的一个严重问题,为减少或避免客户的流失所带来的高额利润损失,论文介绍了一种行之有效的解决方案:首先,利用分类算法建立客户流失预测模型,然后用此模型挖掘出哪些客户将会流失,并分析出为什么他们要流失,最后,根据这些客户的特征采取针对性的措施加以挽留。 在数据处理阶段,从苏州电信的业务模型中梳理出流失相关业务表,通过合适的ETL处理,运行存储过程实现把数据经过抽取、转换和加载后自动导入需要的数据挖掘来源表。然后对数据进行预处理,经过数据集成、数据清洗、数据规约等处理,把基础数据经过预处理后得到试验数据。 选择决策树和神经网络作为基本分类算法,通过Bagging或者Boosting算法进行集成,产生的集成分类算法能显著提高分类性能,并将其应用在苏州电信经营分析系统的客户流失预测主题上。在分别对C4.5、C4.5+Bagging、C4.5+AdaBoost、BPN、BPN+Bagging、BPN+AdaBoost这六种分类算法的混淆矩阵与ROC曲线进行比较分析的基础上,使用性能较好的集成分类算法C4.5+AdaBoost建模。 把试验数据输入Weka系统,由C4.5+AdaBoost算法生成模型,产生多个决策树。利用存储过程实现这些决策树的功能,预测出客户流失状态,列出高流失趋向客户名单,制定相应的营销策略挽留客户。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号