首页> 外文期刊>东南大学学报(英文版) >一种基于谱分量相似度的多数据流聚类算法
【24h】

一种基于谱分量相似度的多数据流聚类算法

机译:一种基于谱分量相似度的多数据流聚类算法

获取原文
获取原文并翻译 | 示例
       

摘要

A new algorithm for clustering multiple data streams is proposed. The algorithm can effectively cluster data streams which show similar behavior with some unknown time delays.The algorithm uses the autoregressive (AR) modeling technique to measure correlations between data streams. It exploits estimated frequencies spectra to extract the essential features of streams. Each stream is represented as the sum of spectral components and the correlation is measured component-wise.Each spectral component is described by four parameters,namely, amplitude, phase, damping rate and frequency. The ε-lag-correlation between two spectral components is calculated. The algorithm uses such information as similarity measures in clustering data streams. Based on a sliding window model, the algorithm can continuously report the most recent clustering results and adjust the number of clusters. Experiments on real and synthetic streams show that the proposed clustering method has a higher speed and clustering quality than other similar methods.%提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.
机译:提出了一种用于聚类多个数据流的新算法。该算法可以有效地纳入数据流,其显示具有一些未知时间延迟的类似行为。算法使用自回归(AR)建模技术来测量数据流之间的相关性。它利用估计的频率光谱来提取流的基本特征。每个流被表示为光谱分量的和,并且测量的相关性分量。频谱分量由四个参数,即幅度,相位,阻尼率和频率描述。计算两个光谱分量之间的ε-滞后相关性。该算法在聚类数据流中使用这种信息作为相似度量。基于滑动窗口模型,该算法可以不断地报告最新的聚类结果并调整群集数。实验对实际和合成溪流的实验表明,所提出的聚类方法具有比其他类似方法更高的速度和聚类质量。%提出了一种新的多数言法。该该法可以有条学。时间延迟的多数据流进行。算法使用自给式技术资料数码空间的延迟相关系,利用频谱估计来计算数据量词的特价。每一击数码用途其征。对数据空间的相关关截词。每每分量用振幅,相位,衰减率,频率4个数来描述。算法计算谱谱对词的ε-延计算为基因来得到聚类分类中数量空间距离的量子。户外,算法使用动力传播技术更多数码流进行聚类,实时得出流结果且动词地区调节聚类的数。在人工数码和实际码集上面的实验实验说明,所提出的算法比比其他的算法的算法有着更快的速度和好的的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号