面向不平衡二分类准则的稀疏模型构造算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

社会的进步，科学的发展，给人们生活带来了日新月异的变化。与此同时各种数据信息的不断积累，在方便人们的同时，也带来了新的挑战。如何从这些大量数据中发现有用信息成为当前急需解决的迫切问题。机器学习的出现为解决上述挑战提供了一种有效的手段，其中的分类学习特别是二分类学习由于在众多领域的广泛应用更是成为当前的研究热点。然而在现实的生活中，很多应用（如网络搜索引擎、个性化推荐系统等）都是不平衡二分类问题，且具有数据维度高的特点，已有面向小数据的传统二分类算法很难直接应用在上述问题中。对此，近些年有学者提出研究直接优化不平衡准则的稀疏二分类模型构造算法，并取得了较好的效果。但这些研究考虑的不平衡准则都是AUC或F1等简单易分解的标准，对于其他较复杂的不平衡准则，如何获得相应的稀疏模型，则研究较少。本文就是在这样的背景下，主要研究了面向复杂不平衡准则的稀疏模型构造算法。
　　全文的主要工作如下:
　　(1)文中从二分类学习入手，首先介绍了传统二分类和不平衡二分类在评估准则的差异，然后总结了面向不平衡二分类算法的研究现状，重点分析了不平衡稀疏模型构造算法的进展，在此基础上，提出研究基于L1范式的复杂不平衡稀疏模型构造算法。
　　(2)不同于已有不平衡稀疏模型构造算法多关注AUC或F1等简单准则，本文研究了面向复杂不可分QM准则的稀疏模型构造算法。算法首先定义了基于QM的新目标函数，针对该目标非光滑难以直接优化，提出使用割平面算法进行求解，不仅解决上述问题，且算法的外围迭代次数仅为O(1/ε)。不平衡基准数据集上的实验结果表明，当用QM为评价标准时，本文提出的算法不仅有很好的精度还有较高的稀疏度。
　　(3)针对已有不平衡稀疏模型构造算法都采用批学习，当面对大规模数据集时，计算效率较差，本文提出一种基于随机学习的稀疏模型构造算法。更具体的说，我们关注的不是某一个具体的不平衡标准，而是具有一类通用特性（如伪线性）的评价准则。文中首先将直接优化伪线性准则问题变成一个代价敏感问题。针对新问题，如果直接使用随机梯度法求解难以获得满意的稀疏度，因此提出使用COMID算法作为优化方法，确保了解的稀疏性。同时针对已有COMID算法即使是强凸目标函数，也仅能获得O(logT/T)收敛速度，给出一种基于多项式衰减的改进方法，并从理论上证明了所提新方法具有0(1/T)的最优收敛效率。不平衡基准数据集上的实验证明了本文所提算法的高效性和有效性。

著录项

作者
王莹;
展开▼
作者单位

安徽大学;

展开▼
授予单位安徽大学;
学科计算机应用技术
授予学位硕士
导师姓名程凡;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
不平衡二分类; 稀疏模型; 割平面算法; 伪线性; 机器学习;

相似文献

中文文献
外文文献
专利

1. 超几何-正态模型在稀疏二分类数据Meta分析中的应用及R软件实现 [J] . 张天嵩 . 中国循证儿科杂志 . 2020,第005期
2. 高分辨距离像稀疏表示的原子构造与算法研究 [J] . 杜小勇 ,胡卫东 ,郁文贤 . 信号处理 . 2006,第002期
3. 面向不平衡数据分类的复合SVM算法研究 [J] . 刘东启 ,陈志坚 ,徐银 . 计算机应用研究 . 2018,第004期
4. 面向对象编程中稀疏线性方程类构造研究 [J] . 郭庆阳 ,伍叶凯 ,郁惟镛 . 电力自动化设备 . 2001,第008期
5. 稀疏二分类数据贝叶斯Meta分析方法及实现 [J] . 张天嵩 . 中国循证儿科杂志 . 2020,第004期
6. 基于模型残差稀疏性控制的转子系统不平衡量稳健识别方法 [C] . Tingpeng Zang ,臧廷朋 ,Guangrui Wen . 第十一届全国随机振动理论与应用学术会议 . 2015
7. 基于进化多目标优化的不平衡二分类算法研究 [A] . 付广龙 . 2019

面向不平衡二分类准则的稀疏模型构造算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅