首页> 中文期刊>计算机仿真 >时间序列下超大规模数据流聚类方法研究

时间序列下超大规模数据流聚类方法研究

     

摘要

研究超大规模数据流聚类效率优化问题.时间序列下的数据流中元素的访问是单次线性的,即数据元素只能按其流入顺序依次读取一次.传统的方法对时间序列数据流聚类时,只是在方向上按照时间序列数据流元素的顺序进行聚类,效率较低.提出了基于微簇距离加权和属性信息贡献度的时序数据流聚类算法.在该算法中,首先以时间滑块窗口为时间单位对数据流数据进行实时获取,在线阶段对其数据流信息进行微簇的实时生成,并根据微簇的更新和删除对微簇集合进行维护;然后在离线阶段对微簇样本数据集合,依据样本数据的属性信息贡献度及其与样本类别的距离加权,对微簇进行实时聚类.实验证明,改进算法具有较高的执行效率,较高的吞吐量,并有效的降低了内存负载.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号