首页> 中文学位 >基于样本加权的多示例多标记迁移学习方法研究
【6h】

基于样本加权的多示例多标记迁移学习方法研究

代理获取

目录

声明

专用术语注释表

第一章 绪论

1.1机器学习的发展背景及现状

1.2多示例多标记学习研究背景

1.3迁移学习发展背景及研究现状

1.4论文的研究意义与内容

1.5论文的组织结构

第二章 多示例多标记学习相关技术

2.1多示例多标记学习的提出及定义

2.2多示例多标记学习的主要算法

2.3多示例多标记学习的主要评价指标

2.4本章小结

第三章 迁移学习相关技术

3.1迁移学习的定义和分类

3.2迁移学习的分类及算法介绍

3.3本章小结

第四章 基于样本加权的多示例多标记迁移学习算法

4.1 MIMLTR算法框架

4.2基于Fisher向量的miFV算法

4.3基于MMD的核均值匹配算法

4.4 MIMLTR算法的实现与分析

4.5本章小结

第五章 MIMLTR算法仿真和分析

5.1面向基因组水平的蛋白质功能预测数据集的MIMLTR算法实验

5.2本章小结

第六章 总结与展望

参考文献

附录1 攻读硕士学位期间撰写的论文

附录2 攻读硕士学位期间申请的专利

附录3 攻读硕士学位期间参加的科研项目

致谢

展开▼

摘要

多示例多标记学习框架作为一种强大的新型机器学习技术,集成了多标记学习与多示例学习的优点,对于现实世界中的复杂对象有着更强大的表达能力,因此受到了越来越多的科研及实际应用领域的关注。目前的大多数多示例多标记算法通常假设训练数据与测试数据服从相同的分布,而且需要足够的训练样本才能学习出一个可靠的分类模型。然而很多现实应用并不满足这个假设,并且多示例多标记训练集的获取通常代价比较昂贵。当数据分布发生变化时,如果重新收集训练样本,不仅费时费力,而且对于原有标记样本也是极大的浪费。
  在这样的情况下,如果使用迁移学习的方法,充分利用原有的标记样本,就可以极大地提升多示例多标记学习算法的效力和效率,同时避免了昂贵的样本标注的行为。因此,本文提出了一种适用于多示例多标记框架下的迁移学习算法——MIMLTR算法。该算法通过核均值匹配方法对源领域样本进行加权,使得源领域样本与目标领域样本分布趋于一致;另外,为了加快核均值匹配的计算,算法使用一组Fisher向量表示原始的多示例样本,完成多示例单示例化。
  本文在七种物种的宏基因组蛋白质功能数据集上分别对MIMLTR算法框架进行了实验和仿真。本文设计的MIMLTR算法是一个开放性的框架,可以选择不同的多示例多标记学习算法,本文选择三种经典的多示例多标记算法,与MIMLTR算法框架结合,并与原始算法进行对比,实验证明了MIMLTR算法框架在大多数情况下优于原始算法。另外,为了探究不同数据集的相关性强弱对于MIMLTR算法迁移效果的影响,本文还设计了不同亲缘物种的迁移实验。结果证明了,数据集相关性越大,MIMLTR算法迁移效果越好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号