首页> 中文学位 >基于电信大数据挖掘的高价值移动用户预测研究
【6h】

基于电信大数据挖掘的高价值移动用户预测研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3.1 内容与思路

1.3.2 章节安排

第2章 电信大数据挖掘技术介绍

2.1 电信大数据挖掘的概念

2.2 大数据挖掘方法与流程

2.2.1 大数据挖掘方法

2.2.2 大数据挖掘流程

2.3 大数据挖掘平台

2.4 本章小结

第3章 基于电信大数据的高价值移动用户预测模型

3.1 数据采集及预处理

3.1.1 高价值移动用户的判定

3.1.2 特征提取与数据抽样

3.1.3 数据预处理

3.2 模型评估指标

3.3 模型建立

3.3.1 Cart决策树建模

3.3.2 XGBoost建模

3.3.3 随机森林建模

3.4 模型选择

3.5 本章小结

第4章 基于一种有效特征选择方法的预测模型优化

4.1 模型优化概念的提出

4.2 面向高维不平衡数据集的有效特征选择方法

4.2.1 Pearson相关性分析

4.2.2 随机森林特征重要性

4.2.3 PREFS方法描述

4.3 实验与结果分析

4.3.1 实验方案

4.3.2 特征选择结果分析

4.3.3 模型优化结果分析

4.4 本章小结

第5章 总结与展望

5.1 工作总结

5.2 工作展望

致谢

参考文献

附录1攻读学位期间发表的论文

附录2攻读学位期间参加的科研项目

展开▼

摘要

随着“互联网+”商业模式的快速推广以及4G通信市场竞争的愈发激烈,高价值移动用户的保有及发展等营销业务逐渐成为各大电信运营商的关注焦点。基于电信大数据挖掘技术,通过对海量移动用户诸如消费、流失等数据的深度分析,确定一种高价值移动用户的判定准则并建立相应的预测模型,对企业增收并提升市场竞争力有着重要的研究意义。
  本文结合Teradata数据仓库、R数据挖掘工具和CRISP-DM流程,从某电信公司提取了具有高贡献度和低流失率等特性的高价值移动用户数据,经过数据预处理、多算法建模和模型评估之后,选取基于随机森林算法的预测模型用于进一步研究。
  针对随机森林算法处理在高维不平衡数据集上的二分类问题时容易偏向多数类的局限性,本文设计了一种有效特征选择方法去优化预测模型。利用欠采样方式从初始不平衡数据集提取多个平衡训练集,使用结合Pearson相关性分析和随机森林特征重要性评估的特征选择策略,在集成学习方法中嵌入加权和投票机制获得最优的特征子集,再采用随机森林算法建立最终的预测模型。实验结果表明,该优化方法可以有效地降低特征集的维度,提升高价值移动用户预测模型的预测精度以及泛化能力,从而较好地为企业决策提供服务。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号