基于MSF模型的数据流聚类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近些年来，随着无线传感网络和网络流量监控等行业的飞速发展，流数据逐渐地成为主流的数据形式之一。流数据与传统数据库中所存储的静态数据不同，它是一种实时到达的数据序列，数据到达的次序是独立的，数据规模理论上可以认为是无限的等等特点。这些与众不同的特点也导致流数据的处理方面出现了新的挑战。因此，如何从这些高速变化的流数据中挖掘出用户感兴趣的信息也成为了数据挖掘领域中的一个研究热点问题。在数据挖掘研究领域中，聚类分析作为其中非常重要技术之一，流数据的聚类挖掘算法的改进研究成为当下学术研究的关注点之一。
　　本文通过对流数据聚类算法DenStream的研究，将其与MSF(Multiple Species Flocking)模型相结合，提出了一种聚类效果更优化的MSFS(Multiple Species Flocking on Stream)算法。MSF模型是一种用于文本聚类的群智能模型，我们对模型中的相似性原则加以利用，使其适用于流数据的聚类分析。
　　MSFS算法将虚拟空间中的代理与特征空间中的数据点相关联，代理在虚拟空间中存在一个预定义的可见范围和代理相互之间的一个最小距离。当某一个代理在它的可见范围内遇到另一个代理，算法将根据相似性的原则判断二者是否具有一定的相似度，从而决定是否可以形成聚类。算法借鉴了基于密度的聚类算法——DenStream算法的基础上，但是却在避免了其中的离线聚类阶段的同时提高了聚类纯度。
　　通过实验验证分析，在真实数据集和仿真数据集上，基于仿生计算的MSFS算法的聚类纯度更高，即能够在产生更好的聚类效果。

著录项

作者
李敏;
展开▼
作者单位

哈尔滨师范大学;

展开▼
授予单位哈尔滨师范大学;
学科计算机技术
授予学位硕士
导师姓名李英梅;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
流数据; 聚类算法; 群智能模型; 相似性原则;

相似文献

中文文献
外文文献
专利

1. 基于离群点检测的不确定数据流聚类算法研究 [J] . 叶福兰 . 中国电子科学研究院学报 . 2019,第010期
2. 一种基于质量估算的空间数据流聚类算法研究 [J] . 樊超 ,李宏伟 ,朱燕 . 计算机应用研究 . 2017,第009期
3. 基于近邻传播的文本数据流聚类算法研究 [J] . 李一鸣 ,倪丽萍 ,方清华 . 计算机科学 . 2016,第005期
4. 基于Hadoop MapReduce的分布式数据流聚类算法研究 [J] . 蔡斌雷 ,任家东 ,朱世伟 . 信息工程大学学报 . 2014,第004期
5. 基于混合差分进化的滑动窗口数据流聚类算法研究 [J] . REN Yong-gong ,HU Zhi-dong ,YANG Xue . 计算机应用研究 . 2014,第004期
6. 基于Hadoop MapReduce的分布式数据流聚类算法研究 [C] . 蔡斌雷 ,任家东 ,朱世伟 . 第19届全国信息存储技术学术会议 . 2013
7. 基于元组聚类特征的不确定性数据流聚类算法研究 [A] . 梁达鹏 . 2010

基于MSF模型的数据流聚类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅