声明
摘要
第1章 绪论
1.1 研究背景与意义
1.2 本文组织结构
1.3 本文主要研究内容与创新点
第2章 相关知识与理论
2.1 分类概述
2.1.1 分类技术
2.1.2 欠拟合和过拟合
2.2 类别不平衡分类问题概述
2.2.1 类别不平衡分类问题的定义与难点
2.2.2 类别不平衡分类问题的研究现状与常用解决方法
2.3 代价敏感分类问题概述
2.3.2 代价敏感问题的研究现状与常用解决方法
2.4 类别不平衡问题与代价敏感问题的联系
2.5 本章小结
第3章 基于重采样技术的集成学习研究
3.1.1 刀切法和自助法
3.1.2 重采样技术在类别不平衡和代价敏感数据中的应用
3.2 集成学习
3.2.1 Boosting
3.2.2 Bagging
3.2.3 不平衡数据的集成分类方法
3.3 xEnsemble算法
3.3.1 基本原理
3.3.2 XGBoost
3.3.3 算法分析
3.4 RSEnsemble算法
3.4.1 基本原理
3.4.2 随机子空间算法
3.4.3 算法分析
3.5 本章小结
第4章 实验设计与结果分析
4.1 评价标准
4.2 实验环境
4.3 数据集及预处理
4.3.1 数据集简介
4.3.2 数据清洗
4.3.3 缺失值处理
4.3.4 数据变换
4.3.5 特征工程
4.3.6 生成样本
4.4 不同类别比例和错分代价对分类影响
4.4.1 实验目的与设计
4.4.2 实验结果与分析
4.4.3 实验结论
4.5 采样子集数量、采样方式以及特征子集规模对分类影响
4.5.1 实验目的与设计
4.5.2 实验结果与分析
4.5.3 实验结论
4.6 类别不平衡和代价敏感数据集分类
4.6.1 实验目的
4.6.2 实验设计
4.6.3 实验结果与分析
4.6.4 实验结论
4.7 本章小结
第5章 总结与展望
5.1 本文研究内容总结
5.2 进一步的工作
参考文献
致谢
在读期间发表的学术论文与取得的研究成果