基于属性选择算法和支持向量机的组合预测模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在移动互联网高速发展的今天，人类已经不可避免地生活在了海量数据日积月累的年代，诸如社交网络、证券交易以及气象变化等领域每天都有千兆兆字节（Peta-Byte，PB）的数据注入我们的计算机网络、万维网和计算机存储设备。面对洪流般的数据，数据挖掘、机器学习和人工智能等学科蓬勃发展，这些工具帮助我们从海量数据中发现有价值的信息。其中，使用特定的学习模型根据已知数据来预测将来未知数据是目前研究的热点，这使得我们可以使用预测的结果对事物做出更加正确的决策。但是实践中产生的大量数据通常具有不完整、冗余性、有噪声等特性，如果不对数据进行预处理就直接使用模型方法进行处理，那么我们得到的结果肯定是受到一定损失的。以属性选择算法为代表的数据预处理则可以在一定程度上解决这一问题。通过属性选择，对数据的预测精度以及学习的效率都有诸多好处。　　本文正是基于这一理论基础，将目前比较流行的支持向量机学习器和几种属性选择算法结合起来，设计出一种预测数据的组合模型并得到了不错的结果。本文具体工作如下：（1）研究了常见的三种属性选择算法：邻域粗糙集属性选择算法、基于灰度关联分析的属性选择算法以及基于线性相关性分析的属性选择算法。使用属性选择方法将高维度数据中冗余的属性、对决策结果影响极弱的属性以及某些噪声属性删除，这对后续分析处理大有益处。（2）研究了支持向量机学习模型。支持向量机基于自身完善的理论基础能够很好的解决小样本情况下的非线性学习问题，并最终得到全局最优解。但是当样本数据量过大、样本维度过高时，则会导致学习时间过长甚至可能由于冗余数据产生过度拟合的情况，由此造成学习的精度和效率受到一定程度的折扣。（3）本文结合属性选择算法和支持向量机各自的优点将两者结合起来得到组合预测模型“属性选择-PSO-SVM”：分别将邻域粗糙集、灰度关联分析和线性相关分析这三种属性选择算法作为支持向量机学习模型的前端，首先将待处理的数据进行降维操作，然后将预处理得到的结果作为支持向量机学习模型的输入并得到学习结果。（4）本文使用来自UCI机器学习数据库的10组数据集对设计的组合模型进行了验证，实验证明“属性选择-PSO-SVM”组合模型相比于单一的支持向量机学习模型，在预测精度和学习效率两方面都有很大程度的改善。（5）本文通过实验对邻域粗糙集、灰度关联分析和线性相关性分析三种属性选择算法做了分析比较。实验证明：邻域粗糙集属性选择算法对应的组合模型在预测精度方面具有最大程度的提高；线性相关性分析属性选择算法对应的组合模型对预测精度提高最小，但是该组合模型的整体学习时间却是最少的；灰度关联分析对应的组合模型对预测精度的提高介于前两者之间，其对应的运行时间是最多的。

著录项

作者
周永胜;
展开▼
作者单位

兰州大学;

展开▼
授予单位兰州大学;
学科计算机技术
授予学位硕士
导师姓名陈文波;
年度 2017
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
数据处理,组合预测模型,属性选择,支持向量机;

相似文献

中文文献
外文文献
专利

1. 一种基于支持向量机预分类的属性选择算法 [J] . 周蓉 . 计算机应用与软件 . 2013,第011期
2. 基于支持向量机的股市组合预测模型研究 [J] . 李蓬宁 . 经济研究导刊 . 2009,第022期
3. 基于支持向量机的机械系统状态组合预测模型研究 [J] . 王红军 ,张建民 ,徐小力 . 振动工程学报 . 2006,第002期
4. 基于多属性决策的异构网络选择算法比较研究 [J] . 陶剑骅 ,武向农 ,蒋祥鹏 . 电视技术 . 2015,第017期
5. 基于模糊多属性综合权重的异构网络选择算法研究 [J] . 齐新光 ,梁俊 ,肖楠 . 现代防御技术 . 2013,第006期
6. 基于最小二乘支持向量机的需水量组合预测模型 [C] . 王德智 ,张鹏 ,洪成 . 第十六届海峡两岸水利科技交流研讨会 . 2012
7. 基于属性选择算法和支持向量机的组合预测模型研究 [A] . 周永胜 . 2017

基于属性选择算法和支持向量机的组合预测模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅