声明
摘要
第1章绪论
1.1研究的背景、意义和目的
1.1.1研究的背景
1.1.2研究目的
1.1.3理论意义和实际应用价值
1.2国内外研究现状
1.2.1移动用户交往圈研究现状
1.2.2虚假用户的研究现状
1.3本文研究内容
第2章相关技术介绍
2.1 Hadoop技术
2.1.1 Hadoop的关键技术
2.1.2 Hadoop的优缺点
2.1.3基于Hadoop的运营商大数据平台建设情况
2.2数据挖掘
2.3线性回归介绍
2.3.1多元线性回归的定义
2.3.2多元线性回归分析的运用
2.3.3多元线性回归的预测模型
2.3.4参数的估计方法
2.4决策树相关介绍
2.4.1决策树生成过程
2.4.2决策最优属性选择
2.4.3决策树的剪枝
2.5 GBase 8a数据库介绍
2.6本章小结
第3章基于多元线性回归移动用户交往圈研究
3.1交往圈概述
3.2运营商基础数据的处理
3.2.1运营商数据简介
3.2.2数据仓库的建立
3.2.3数据预处理
3.3稳定交往模型构建
3.3.1建模方法
3.3.2选取训练集
3.4计算稳定交往指数
3.4.1建立交往痕迹表
3.4.2计算用户间的稳定交往值
3.5结果分析
3.6本章小结
第4章基于决策树的虚假移动用户识别
4.1运营商数据准备及预处理
4.1.1运营商数据简介
4.1.2特征值选择
4.1.3数据预处理
4.1.4交往圈计算
4.2 C4.5算法简介
4.3 C4.5算法优化
4.3.1关联规则对决策树优化
4.3.2基于代价敏感的决策树
4.4 C4.5算法优化在虚假用户识别的应用
4.4.1实验环境
4.4.2算法评估
4.4.3实验结果分析
4.5本章小结
5.1总结
5.2进一步工作展望
参考文献
攻读硕士学位期间发表的学术论文
致谢
青岛理工大学;