声明
摘要
1.1.1研究背景
1.1.2研究意义
1.2国内外研究现状
1.2.1用户流失预测模型
1.2.2不平衡数据分类问题
1.2.3特征选择
1.3研究目的及创新点
1.3.1研究目的
1.3.2创新点
1.4本文主要研究内容及组织架构
第二章相关理论及技术基础
2.1 用户流失预测问题定义
2.2数据挖掘
2.2.1数据挖掘概述
2.2.2数据挖掘流程
2.3不平衡数据分类问题的处理方法
2.3.1 数据层面—重采样技术
2.3.2算法层面
2.4常见机器学习方法
2.4.1逻辑回归
2.4.2支持向量机
2.4.3决策树
2.4.4 KNN
2.4.5随机森林
2.5模型选择及参数优化
2.6本章小结
第三章实验数据集及特征工程
3.1实验数据集
3.2数据预处理
3.2.1数据清洗
3.2.2数据变换
3.3特征工程
3.3.1特征构建
3.3.2特征提取
3.3.3特征选择
3.4模型评价指标
3.4.1准确率、召回率、F1-score
3.4.2 ROC曲线及AUC值
3.5本章小结
第四章基于OSEEN-gcForest算法的用户流失预测模型
4.1 gcForest算法
4.1.1 多粒度滑动窗口
4.1.2级联森林
4.2 基于EasyEnsemble思想的OSEEN-gcForest算法
4.2.1 EasyEnsemble算法
4.2.2 SMOTE算法
4.2.3 ENN降噪
4.2.4 OSEEN-gcForest算法
4.3实验结果与分析
4.3.1基于公开数据集
4.3.2基于运营商用户流失数据集
4.4本章小结
第五章总结与展望
5.1本文工作总结
5.2未来研究工作展望
参考文献
致谢
山东大学;