基于代价敏感SVM的直接优化F-measure算法研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

随着社会的发展、科学的进步，数据挖掘和机器学习等领域的研究正逐渐改变我们的生活。数据分类作为机器学习和数据挖掘领域的重要组成部分，成为众多学者的研究重点，人们提出了不同的分类算法来构建不同的分类器。以二分类为例，当样本数据分布不平衡时，为了更准确的度量分类器的性能，一般选用查准率和查全率的调和平均——F-measure作为评估标准。由于F-measure在不平衡分类的广泛应用，如何设计出有效的面向F-measure的分类器是近年来的研究热点。但是由于F-measure的非凸性，直接优化起来较为困难，现有的优化算法主要通过代价敏感算法或者直接优化算法构造面向F-measure的学习器。不同于已有的研究，本文以SVM为工具，提出一种结合代价敏感和直接优化F-measure的新型算法。
　　本文的主要工作如下:
　　(1)文中从二分类入手，介绍了基于支持向量机的二分类学习及不平衡二分类的度量标准F-measure，并在此基础上，分析了现有代价敏感算法和直接优化F-measure算法的研究现状，提出了一种将二者相融合的新方法。
　　(2)新方法首先给出了从最大化F-measure到代价敏感SVM的一个直接转换。针对新的目标函数具备非光滑从而导致传统梯度优化算法难以直接使用的特点，提出使用基于次梯度的束方法进行求解。不仅可以解决上述问题，且算法的迭代次数仅为O（1/ε），不依赖于样本数。不平衡数据集上的实验表明:相比起已有面向F-measure的分类器，本文所提算法得到的模型明显更加精确。
　　(3)针对束方法在求解主问题最小值时是通过转换成对偶问题来解决的，而算法内部的每次迭代只能保证对偶问题的单调递增，并不能保证主问题的单调递减，可能降低算法的收敛速度。提出一个高效的线性搜索算法，确保了主问题的单调递减，消除了主问题的波动，进一步提高了算法的效率。大规模数据集上的实验表明，该算法不仅能获得高精度的二分类模型，且相比起已有其他直接优化F-measure算法也更为高效。

著录项

作者
周源;
展开▼
作者单位

安徽大学;

展开▼
授予单位安徽大学;
学科软件工程
授予学位硕士
导师姓名程凡;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;算法理论;
关键词
支持向量机; 不平衡二分类; 代价敏感; 束方法; 线性搜索; 机器学习; F-measure算法;

相似文献

中文文献
外文文献
专利

1. 基于代价敏感SVM优化组合算法的微钙化簇识别 [J] . 曹鹏 ,李博 ,刘鑫 . 东北大学学报（自然科学版） . 2013,第008期
2. 期望损失代价敏感优化的借贷预测算法研究 [J] . 孟志青 ,姜琦 . 浙江工业大学学报 . 2020,第004期
3. 基于F-measure的生活垃圾分类效果评价指标优化研究 [J] . 杨龑 ,陈海滨 ,杨禹 . 环境卫生工程 . 2018,第003期
4. 基于代价敏感结构化SVM的目标跟踪 [J] . 袁广林 ,孙子文 ,秦晓燕 . 电子与信息学报 . 2021,第011期
5. 基于代价敏感SVM的个人信用评估模型 [J] . 束加俊1 . 计算机科学与应用 . 2017,第012期
6. 基于一种优化的DSVM的异步电动机直接转矩控制 [C] . 杨兴武 ,李瑞平 . 2006年西南三省一市自动化与仪器仪表学术年会 . 2006
7. 基于结构化SVM的直接优化不平衡准则算法研究 [A] . 杨康 . 2016

基于代价敏感SVM的直接优化F-measure算法研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅