首页> 中文学位 >TrAdaBoost算法在结构化数据异常点的改进
【6h】

TrAdaBoost算法在结构化数据异常点的改进

代理获取

目录

声明

1.绪论

1.1研究背景和意义

1.2研究内容与创新点

1.3本文章节安排

2.文献综述

2.1国内外研究现状

2.2文献评述

3.理论与假设

3.1迁移学习概述

3.2 TrAdaBoost算法

3.2.1基本思想

3.2.2基本定义

3.2.3算法流程

3.2.4问题分析

3.3本章小结

4.研究设计

4.1改进算法基本思路

4.2改进算法流程

4.3本章小结

5.实证分析

5.1阈值设定实验

5.2真实数据集实验

5.2.1Mushroom数据集

5.2.2前海征信数据集

5.3随机模拟数据实验

5.3.1低维模拟数据

5.3.2十五维模拟数据

5.4本章小结

6.总结与展望

6.1本文总结

6.2未来展望

参考文献

致谢

展开▼

摘要

迁移学习因为其可以在一定程度上解决传统机器学习算法由于有标签的目标域数据较少而带来的问题在近年来一直都备受关注。TrAdaBoost是Dai等人在2007年所提出的一种基于实例的迁移学习方法,同时利用了与目标任务相同分布但有标签的数据量极少的目标域训练数据以及不同分布的辅助域训练数据帮助我们的训练。近年来,该算法被不断的用于图像分类、文本挖掘等问题中,但其在结构化数据中的应用较少。  本文将该算法运用于结构化数据,并发现该算法在其原文中所使用的的结构化数据集Mushroom数据集上所存在的误差激增的问题,基于该问题提出了改进算法。并且将改进算法与只使用目标域数据的SVM算法、同时使用目标域数据和辅助域数据共同训练的SVM_t算法以及TrAdaBoost算法在Mushroom数据集、现实的信贷业务前海征信数据集以及随机模拟的二维和十五维的数据集上进行了对照实验。发现我们的改进算法在各个数据集的各个评价指标上相较于另外三种算法都有明显的提升。  认为我们的改进算法可以适用于结构化数据中基于实例的迁移学习问题中,并且相较TrAdaBoost算法得到提升。因此认为该算法可以运用于结构化数据中,是一种在结构化数据中有效的迁移学习方法,能够取得良好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号