声明
第 1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 数据层面
1.2.2 算法层面
1.2.3 不平衡大数据的分类研究
1.3 本文研究内容
1.4 本文组织结构
第 2章 相关理论
2.1 不平衡数据分类
2.1.1 不平衡数据分类的影响因素
2.1.2 不平衡数据分类方法
2.1.3不平衡数据分类的性能评价标准
2.2 模糊 C-均值聚类算法(Fuzzy c-means clustering,FCM)
2.3 K近邻(k-nearest neighbor,K-NN)分类器
2.4 层次聚类算法
2.5 随机森林(Random Forest,RF)
2.6 Hadoop分布式计算框架
2.6.1 MapReduce
2.6.2 HDFS
2.7 本章小结
第 3章 基于 FCM的簇内欠采样算法
3.1 算法原理
3.2 实验设计及结果分析
3.3.1实验环境和数据
3.3.2实验结果分析
3.3 本章小结
第 4章 改进的 Cluster Based Under Sampling算法
4.1 KNN-CBUS算法原理
4.2 实验设计及结果分析
4.2.1实验环境和数据
4.2.2实验结果分析
4.3 本章小结
第 5章 FCMUSIC算法的分布式研究
5.1 Mahout机器学习框架
5.2 PFCMUSIC-RF算法设计
5.3 实验环境和数据
5.4 实验分析
5.5 本章小结
第 6章 总结与展望
6.1 总结
6.2 展望
致 谢
参考文献
南昌大学;