首页> 中文学位 >面向高维数据的并行非线性最小二乘分类器研究
【6h】

面向高维数据的并行非线性最小二乘分类器研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景及意义

1.1.1 研究背景

1.1.2 研究意义

1.2 研究内容及主要贡献

1.3 论文结构

2 相关分类方法的研究

2.1 分类的相关概念

2.2 分类算法的分析

2.2.1 分类的基本算法

2.2.2 改进的分类方法

2.2.3 分析与小结

2.3 高维数据分类算法的分析

2.3.1 特征选择

2.3.1 特征提取

2.3.3 特征选择与特征提取方法比较

2.4 本章小结

3 并行非线性最小二乘分类算法

3.1 最小二乘法分类器

3.2 并行非线性最小二乘法(PNLS)

3.2.1 非线性最小二乘法的思想及其算法描述

3.2.2 PNLS的时间复杂度

3.2.3 PNLS的收敛性

3.3 PNLS的随机版本

3.4 本章小结

4 实验

4.1 基准数据集

4.2 运行效率实验

4.3 分类性能评估

4.4 本章小结

5 总结与展望

5.1 总结

5.2 展望

参考文献

个人简历及在学期间所有成果

致谢

展开▼

摘要

随着大数据时代的到来以及云计算等先进数据技术的发展,高维数据处理已经渗透到科研和生活的各个方面,在诸如科学研究、生物医学、网络通信等众多领域起到至关重要的作用。作为经典的数据分析方法之一,传统分类方法在面向高度复杂的高维数据时已捉襟见肘,许多处理低维数据运行良好的分类算法在高维数据中的分类效果亟待提高。因此,如何构建面向于高维数据的有效分类算法成为数据挖掘等领域的热点问题。
  本文系统地介绍并分析了几种基本分类算法及相应改进算法的优缺点,同时对高维数据分类的通用特征降维方法进行了总结,讨论了这些方法在应用时的一些局限性。本文结合传统算法的优点,提出了一种适用于高维数据分类的新算法——并行非线性最小二乘法,并在新算法的基础上提出改进的随机版本,最后,基于以上算法的性能评估实验表明新算法具有更好的性能和精确度。本文的主要研究成果可归纳如下:
  1、为解决最小二乘法处理高维数据效率低下的问题,结合并行分类方法提出了一种处理高维数据的并行非线性最小二乘分类算法。该方法平均地划分数据维,并行计算局部模型参数,整合后形成全局参数,通过一个迭代优化过程,可以大幅提升参数的性能。
  2、在并行非线性最小二乘分类算法的基础上提出改进的随机版本。通过将迭代过程开始时的平均划分数据维变成随机地分割数据,可在时间复杂性基本不变的情况下,进一步提高了并行非线性最小二乘分类算法的性能。
  3、完成了新算法的性能评估实验。以最小二乘法作为基准方法,选择共同的高维数据集作为实验样本,对新方法的学习效率和预测性能进行了评估。实验结果表明:本文所提出的新算法能够很好收敛,同时与最小二乘法相比,具有较好的时间优势,并能达到更好的预测精度。尤其是随机版本的新算法,表现出更优的时间优势,此两种方法均可被视为处理高维数据分类的重要候选方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号