基于MapReduce的非线性支持向量机分类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

支持向量机（SupportVectorMachine，SVM）算法是数据挖掘及机器学习领域中健壮性和稳定性较好的高精度算法，能够非常成功地处理分类和回归问题。然而，非线性SVM分类算法是一个计算密集型算法，仅适用于小样本统计学习问题。面对当今实际问题中的大数据集，本文旨在保持非线性SVM算法分类精度的基础上提高其处理能力及运行效率。
　　在对标准SVM算法及MapReduce编程模型进行深入分析的基础上，本文进行了如下研究工作并取得了一定的成果。
　　首先，为了提高串行非线性SVM算法的数据处理能力及运行效率，提出了基于MapReduce的并行SVM(MR-SVM)算法。通过均匀划分数据集，在各数据分片上利用map任务并行求解支持向量集SVs，而后联合各分布式训练结果利用一个reduce任务执行SVM重训练得出SVM分类器。其中联合重训练使得算法能自动收敛。
　　其次，为了弥补MR-SVM算法中分布式训练带来的精度损失，提出了基于MapReduce的并行迭代SVM(MR-C-SVM)算法。引入了迭代计算机制，通过反馈循环训练直至算法收敛于全局最优解。迭代过程中利用KKT条件筛选数据集的操作减少了重复计算。
　　再次，为了满足在线学习的需求及克服集群存储容量无法满足需求的难题，在MR-SVM算法和MR-C-SVM算法的基础上，提出了基于MapReduce的并行增量迭代SVM(MR-Ⅱ-SVM)算法。
　　此外，对MapReduce进行了支持迭代的扩展及针对MR-C-SVM算法的改进。
　　最后，在理论上证明了MR-C-SVM算法收敛于全局最优解。对MR-(Ⅱ)-SVM算法的各项流水线性能指标进行了计算分析。基于SpamBase数据集及MINIST数据集的实验表明，MR-C-SVM算法在保持标准SVM算法精度的同时提高了数据处理能力及运行效率，并超过了其它基于MapReduce的并行SVM算法的精度;MR-(Ⅱ)-SVM算法在加速比和运行效率方面比同类高精度算法具有明显优势。

著录项

作者
马莹莹;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机软件与理论
授予学位硕士
导师姓名王黎明;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
非线性支持支持向量机; MapReduce编程模型; 并行计算; 收敛性; 增量学习; 分类算法;

相似文献

中文文献
外文文献
专利

1. 基于MapReduce改进K-NN的大数据分类算法研究 [J] . 蒋华 ,韩飞 ,王鑫 . 微电子学与计算机 . 2018,第10期
2. 基于MapReduce编程模型的改进KNN分类算法研究 [J] . 邱宁佳 ,郭畅 ,杨华民 . 长春理工大学学报（自然科学版） . 2017,第001期
3. 基于MapReduce和分布式缓存的KNN分类算法研究 [J] . 涂敬伟 ,皮建勇 . 微型机与应用 . 2015,第002期
4. 基于MapReduce的SVM分类算法研究 [J] . 秦军 ,戴新华 ,童毅 . 计算机技术与发展 . 2015,第006期
5. 基于MapReduce的并行KNN分类算法研究 [J] . 王睿 . 计算机与数字工程 . 2013,第011期
6. 基于支持向量机的非线性卫星信道盲均衡算法研究 [C] . Li Jinming ,李金明 ,Zhao Junwei . 2006航空宇航科学与技术全国博士生学术论坛 . 2006
7. 基于MapReduce的并行模糊规则分类算法研究及应用 [A] . 杨志浩 . 2018

基于MapReduce的非线性支持向量机分类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅