首页> 中文学位 >基于Hessian正则化的数据可视化算法研究
【6h】

基于Hessian正则化的数据可视化算法研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 研究背景

1.2 研究目的和意义

1.3 国内外研究现状

1.4 本文研究内容与结构

第二章 高维复杂数据可视化

2.1 复杂网络可视化

2.1.1 ClueGo可视化

2.1.2 clusterMaker2可视化

2.1.3 Rinalyzer可视化

2.2 高维复杂数据降维算法

2.2.1 PCA算法

2.2.2 基于重建权值的LLE

2.2.3 基于神经网络的自动编码

2.3 高维复杂数据可视化

2.3.1 t-SNE算法

2.3.2 多图的t-SNE算法

2.3.3 基于拉普拉斯正则化的多图t-SNE

2.4 复杂数据可视化算法评价标准

2.4.1 NRP测评方法

2.4.2 准确度损失率

2.4.3 可视化算法时间复杂度

2.5 本章小结

第三章 基于Barnes-Hut的多图t-SNE算法研究

3.1 Barnes-Hut算法及树的构建

3.1.1 Barnes-Hut算法介绍

3.1.2 Barnes-Hut树的构建

3.1.3 Barnes-Hut树中节点相互作用

3.2 基于Barnes-Hut的多图t-SNE算法

3.3 实验仿真结果及分析

3.4 本章小结

第四章 Hessian正则化的多图t-SNE算法

4.1 Hessian正则化

4.2 基于Hessian正则化的多图t-SNE算法

4.3 Word可视化实验结果与分析

4.3.1 实验步骤

4.3.2 实验结果及分析

4.4 NIPS数据可视化的实验结果与分析

4.4.1 实验步骤

4.4.2 实验结果及分析

4.5 表型相似数据可视化分析

4.5.1 实验步骤

4.5.2 实验结果及分析

4.6 基于Hessian正则化的多图t-SNE算法软件实现

4.7 本章总结

第五章 总结与展望

5.1 本文总结

5.2 展望

参考文献

致谢

展开▼

摘要

面对日益复杂的海量数据及其挖掘和分析结果,如何结合人的视觉优点和主观认知,使数据挖掘和分析的结果具有直观性和可交互性,从而有助于用户从不同可视化角度对复杂数据进行深刻理解,成为许多数据挖掘和分析研究人员研究的热点。本文针对大规模复杂数据可视化的研究中经常遇到的相似性传递、数据的高度集中等难题,尤其是针对复杂数据可视化中的高度集中问题展开研究。探索基于多图的复杂数据可视化算法。主要工作如下:
  随着复杂数据量的增加,数据可视化的效率往往越来越低,本文在深入分析Barnes-Hut加速算法优缺点的基础上,提出基于Barnes-Hut加速的多图t-SNE算法。多图t-SNE算法中的时间复杂度为指数级,这很大程度上地限制了数据可视化的规模,而利用本文提出的Barnes-Hut加速策略,可将每个时间步的时间复杂度降低为O(NlogN)。在保证算法的邻居保持率NRP的情况下,多图的t-SNE算法使得复杂数据的可视化效率得到明显的提高。实验仿真结果表明,针对不同测试数据集,基于Barnes-Hut加速的多图t-SNE算法可以通过选择合理的阈值来实现复杂数据的可视化,在获得理想的运行速度的同时可以保证可视化的精度。
  针对复杂数据可视化中的数据高度集中,不同维度数据相互影响,从而导致的可视化效果较差的问题。本文提出基于Hessian正则化的多图的t-SNE算法。Hessian正则化比拉普拉斯正则化具有更好的推断能力,能够更好的保持可视化数据的局部流形结构。本文将Hessian正则化引入到多图的t-SNE算法中,通过Hessian正则化有效防止数据降维之后的过拟合,从而提升算法的可视化的效果。实验结果表明,基于Hessian正则化的多图的t-SNE算法不仅较好的解决了相似性传递问题,而且可以有效防止复杂数据可视化效果的过拟合。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号