鲁棒非负矩阵分解算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的发展，大数据时代悄无声息地走到了我们身旁，每天用户各种各样的行为产生了数以亿计的数据，这其中就包括了社交信息，购物信息以及浏览信息等。大量数据中包含着很多我们平常并不可见的用户行为规律，这些规律往往能带来更好的经济效益或者更高的工作效率等。因此，如何从海量的数据中找到对于自己来说有价值的信息成为了大数据时代的热点，数据挖掘正是在这种迫切的需求下应运而生。
　　矩阵分解是数据挖掘中的一个重要研究领域，它被广泛地应用于图像和文本的挖掘中。但在实际应用中矩阵分解往往要面临图像像素值不能为负以及文档统计中负值没有意义等问题，如果不能对负值进行一个很好的处理，就会使算法的可解释性大大降低。为了增强可解释性，非负矩阵分解慢慢地进入了人们的视线。
　　非负矩阵分解为分解后的基矩阵和系数矩阵增加了非负约束，这一约束很好地契合了一些实际应用场景中负值没有意义的特点，增强了算法的可解释性。除此之外，其还具有求解过程收敛速度快以及占用存储空间小的特点，这些优势使其非常适合作为大数据的处理方法。但是，经典的非负矩阵分解算法对于噪声数据的控制并不是很好，它对于误差的平方计算放大了噪声数据对算法结果的影响，限制了其在实际场景中的应用。在后续改进中，通过不再对数据点之间的冗余进行平方计算，只是进行简单地累加，在一定程度上降低了噪声数据的影响，但其不能很好地适应数据集中噪声数据比例的变化，致使其在一些数据集中不能得到理想的结果。本文针对此问题提出了两个非负矩阵分解算法，分别是截断式鲁棒非负矩阵分解算法以及双重截断式鲁棒非负矩阵分解算法。
　　截断式鲁棒非负矩阵分解算法在基于L2,1范数的鲁棒非负矩阵分解算法的基础上引入了数据点个数截断参数，用计算出的每个数据点的冗余与之进行比较，比之大者，截断为零，反之继续进行计算。这样就将误差大的噪声数据点剔除了出去，减小了对算法结果的影响，同时可以通过截断参数对数据集中噪声数据比例变化进行适应，增强了算法的鲁棒性。
　　双重截断式鲁棒非负矩阵分解算法在截断式鲁棒非负矩阵分解算法的基础上更进一步，其更好地考虑了数据的本质结构，引入Ridge Leverage Score对识别噪声数据的计算标准进行了改进，同时增加了对噪声属性的处理，引入了用于控制噪声属性个数的截断参数。这些改进提高了结果的准确性，增强了算法的鲁棒性，使其能适应复杂的实际应用场景，得以广泛应用。

著录项

作者
卢文凯;
展开▼
作者单位

北京交通大学;

展开▼
授予单位北京交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名景丽萍;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 非负矩阵分解算法; 噪声抑制; 鲁棒性;

相似文献

中文文献
外文文献
专利

1. 稀疏限制的增量式鲁棒非负矩阵分解及其应用 [J] . 杨亮东 ,杨志霞 . 计算机应用 . 2019,第005期
2. 基于增量式鲁棒非负矩阵分解的短文本在线聚类 [J] . 贺超波 ,汤庸 ,张琼 . 电子学报 . 2019,第005期
3. 截断式鲁棒非负矩阵分解算法 [J] . 卢文凯 ,景丽萍 ,杨柳 . 南京大学学报：自然科学版 . 2016,第4期
4. 基于非负矩阵分解的鲁棒哈希函数验证性研究 [J] . 吴荣玉 ,樊丰 ,舒建 . 电子技术应用 . 2012,第001期
5. 一种基于非负矩阵分解的鲁棒零水印算法 [J] . 刘竞杰 ,陶亮 . 计算机工程与应用 . 2012,第016期
6. 基于鲁棒一步集的Tube不变集鲁棒模型预测控制 [C] . 秦伟伟 ,刘刚 ,王剑 . 2011年中国自动化大会暨钱学森诞辰一百周年及中国自动化学会五十周年会庆 . 2011
7. 基于托攻击检测的鲁棒非负矩阵分解推荐算法 [A] . 陈建民 . 2017

鲁棒非负矩阵分解算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅