第一个书签之前
Abstract
第1章绪 论
1.1引言
1.2国内外研究现状分析
1.2.1 非平衡数据集分类算法的国内外研究现状
1.2.2 基于云平台下非平衡数据集分类算法的国内外研究现状
1.3本文主要内容
1.4论文结构
第2章相关理论
2.1 非平衡数据集分类困难的原因
2.2 数据层面
2.2.1 SMOTE算法
2.2.2 Tomek links算法
2.3 集成学习
2.3.1 AdaBoost算法
2.3.2 Bagging算法
2.4 代价敏感学习
2.5 非平衡数据集的评价标准
2.6 本章小结
第3章基于NKSMOTE算法的非平衡数据集分类方法
3.1 NKSMOTE基本原理及算法
3.1.1 NKSMOTE基本原理
3.1.2 核距离
3.1.3 NKSMOTE算法
3.2 实验设计及性能分析
3.2.1 实验数据集
3.2.2 近邻参数K的选取
3.2.3 高斯核参数σ的选取
3.2.4 NKSMOTE算法性能分析
3.3 本章小结
第4章基于NIBoost算法的非平衡数据集分类方法
4.1 NIBoost基本原理及算法
4.1.1权值更新
4.1.2NIBoost算法
4.2 实验设计及性能分析
4.2.1 实验数据集
4.2.2 NIBoost算法性能分析
4.3 本章小结
第5章 基于MapReduce框架NIBoost算法并行化研究
5.1 Hadoop平台
5.1.1 HDFS分布式存储系统
5.1.2 MapReduce技术简介
5.2 PNIBoost算法设计及性能分析
5.2.1 PNIBoost算法设计
5.2.2 实验数据集
5.2.3 实验环境
5.2.4 性能分析
5.3 本章小结
第6章 非平衡数据集分类系统设计与实现
6.1 系统架构
6.1.1 系统开发环境
6.1.2 系统总体设计
6.2系统模块设计
6.2.1 过采样算法
6.2.2 分类算法
6.2.3 并行分类算法
6.3 本章小结
总结与展望
致 谢
参考文献
攻读硕士学位期间发表的论文及科研成果