首页> 中文学位 >数据挖掘技术在电信客户流失分析上的研究与应用
【6h】

数据挖掘技术在电信客户流失分析上的研究与应用

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1数据挖掘的现状

1.2电信运营行业背景

1.3防止客户流失的重要意义

1.4现行方式不足及课题的提出

1.5主要研究内容和贡献

1.6论文的内容安排

第二章数据挖掘的基础知识

2.1数据仓库概述

2.2数据仓库与数据挖掘

2.3 ETL过程

2.4数据挖掘的含义

2.5数据挖掘技术的主要算法

2.5.1决策树

2.5.2决策树算法的缺陷及改进方法

2.5.3神经网络

2.6 CRISP-DM数据挖掘方法论

2.7 SPSS Clementine

第三章数据挖掘的分析过程

3.1商业理解阶段

3.1.1商业目标

3.1.2数据挖掘目标

3.2数据理解阶段

3.2.1确定数据的来源

3.2.2确定数据存储的粒度

3.2.3数据仓库的建模结构

3.2.4维度设计

3.2.5构建逻辑模型

3.3数据准备阶段

3.3.1 ETL数据抽取

3.3.2数据清理

3.4建立模型阶段

3.4.1选择建模算法

3.4.2输入属性选择和属性构造

3.4.3过抽样

3.4.4组合打分模型

3.5模型评估阶段

3.5.1预测命中率与预测覆盖率

3.5.2 Gains图

3.5.3 Lift图

3.6模型发布

第四章电信客户流失预测模型的设计与实现

4.1基于数据挖掘的系统架构

4.2客户流失分析的简要过程

4.3构建数据仓库物理模型

4.3建模前期数据准备

4.3.1客户流失的标准和流失点的界定

4.3.2确定时间窗口

4.3.3数据规范化

4.3.4属性剔除

4.3.5属性构造和衍生变量

4.3.6离群点的处理

4.4建立模型

4.4.1模型分析

4.4.2 C5.0决策树算法

4.4.3分类树的构造

4.4.4树的剪枝

4.4.5模型训练

4.4.6模型测试和评估

4.4.7综合评分模型

第五章电信客户流失预测模型改进

5.1模型参数调整

5.2属性约简

5.3时间窗口调整

5.4属性调整

5.5改进后的模型结果

5.6综合评分模型最终结果

总结和展望

参考文献

致谢

展开▼

摘要

随着信息技术的发展和人民生活水平的不断提高,电脑的普及率越来越高,许多人都使用了数据接入业务。数据接入业务(例如ADSL/LAN宽带接入)正在成为电信运营商新的利润增长点。广东省全省的用户数已经达到数百万级别,用户渗透率已经接近发达国家的水平。市场的激烈竞争导致“发展新用户、保持旧用户”成为ISP运营商的重点话题,随之而来的就是面向市场营销和客户服务的数据仓库的建设以及数据挖掘技术的应用。 本文从数据挖掘的角度,根据流失的客户和没有流失的客户特征和消费行为,建立客户流失预测模型,分析哪些客户的流失概率较大,流失客户的消费行为如何,为市场经营和决策人员制定相应的策略和留住客户提供决策依据。 本文以CRISP-DM(Cross—Industry Standard Process for Data Mining)作为数据挖掘方法论的参考模型,主要围绕客户流失预测模型的六个步骤进行了分析,包括:商业理解、数据理解、数据准备、模型建立、模型评估、模型改进。在实施数据挖掘过程中,优选预测模型的建模算法,根据神经网络和决策树方法各自固有的优点,将神经网络和决策树用于产生预测模型,并对属性进行约简。并根据实际改进模型,使建立的模型无论在生成速度上,还是在预测的准确性以及易理解方面都得到了进一步的改进。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号