首页> 中文学位 >鲁棒非负矩阵分解算法研究
【6h】

鲁棒非负矩阵分解算法研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 研究背景

1.2 国内外研究现状

1.3 论文主要工作

1.4 论文组织结构

1.5 本章总结

2 矩阵分解

2.1 主成分分析

2.2 独立成分分析

2.3 奇异值分解

2.4 非负矩阵分解

2.5 本章总结

3 截断式鲁棒非负矩阵分解算法

3.1 基于L2,1范数的鲁棒非负矩阵分解

3.2 截断参数的引入

3.3 截断式鲁棒非负矩阵分解算法

3.3.1 算法原理

3.3.2 算法流程

3.3.3 算法时间复杂度分析

3.4 实验及结论

3.4.1 模拟数据实验

3.4.2 真实数据实验

3.4.3 实验结论

3.5 本章总结

4 双重截断式鲁棒非负矩阵分解算法

4.1 Ridge Leverage Score的引入

4.2 噪声属性的处理

4.3 双重截断式鲁棒非负矩阵分解算法

4.3.1 算法原理

4.3.2 算法流程

4.4 实验及结论

4.4.1 模拟数据实验

4.4.2 真实数据实验

4.4.3 实验结论

4.5 本章总结

5 结论和展望

5.1 研究内容及思想总结

5.1.1 研究内容总结

5.1.2 研究思想总结

5.2 创新点

5.3 实验结果评价

5.4 算法可改进点

5.5 工作展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

随着互联网的发展,大数据时代悄无声息地走到了我们身旁,每天用户各种各样的行为产生了数以亿计的数据,这其中就包括了社交信息,购物信息以及浏览信息等。大量数据中包含着很多我们平常并不可见的用户行为规律,这些规律往往能带来更好的经济效益或者更高的工作效率等。因此,如何从海量的数据中找到对于自己来说有价值的信息成为了大数据时代的热点,数据挖掘正是在这种迫切的需求下应运而生。
  矩阵分解是数据挖掘中的一个重要研究领域,它被广泛地应用于图像和文本的挖掘中。但在实际应用中矩阵分解往往要面临图像像素值不能为负以及文档统计中负值没有意义等问题,如果不能对负值进行一个很好的处理,就会使算法的可解释性大大降低。为了增强可解释性,非负矩阵分解慢慢地进入了人们的视线。
  非负矩阵分解为分解后的基矩阵和系数矩阵增加了非负约束,这一约束很好地契合了一些实际应用场景中负值没有意义的特点,增强了算法的可解释性。除此之外,其还具有求解过程收敛速度快以及占用存储空间小的特点,这些优势使其非常适合作为大数据的处理方法。但是,经典的非负矩阵分解算法对于噪声数据的控制并不是很好,它对于误差的平方计算放大了噪声数据对算法结果的影响,限制了其在实际场景中的应用。在后续改进中,通过不再对数据点之间的冗余进行平方计算,只是进行简单地累加,在一定程度上降低了噪声数据的影响,但其不能很好地适应数据集中噪声数据比例的变化,致使其在一些数据集中不能得到理想的结果。本文针对此问题提出了两个非负矩阵分解算法,分别是截断式鲁棒非负矩阵分解算法以及双重截断式鲁棒非负矩阵分解算法。
  截断式鲁棒非负矩阵分解算法在基于L2,1范数的鲁棒非负矩阵分解算法的基础上引入了数据点个数截断参数,用计算出的每个数据点的冗余与之进行比较,比之大者,截断为零,反之继续进行计算。这样就将误差大的噪声数据点剔除了出去,减小了对算法结果的影响,同时可以通过截断参数对数据集中噪声数据比例变化进行适应,增强了算法的鲁棒性。
  双重截断式鲁棒非负矩阵分解算法在截断式鲁棒非负矩阵分解算法的基础上更进一步,其更好地考虑了数据的本质结构,引入Ridge Leverage Score对识别噪声数据的计算标准进行了改进,同时增加了对噪声属性的处理,引入了用于控制噪声属性个数的截断参数。这些改进提高了结果的准确性,增强了算法的鲁棒性,使其能适应复杂的实际应用场景,得以广泛应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号