一种基于谱分量相似度的多数据流聚类算法

邹凌君; 陈峻; 屠莉

首页> 外文期刊>东南大学学报（英文版） >一种基于谱分量相似度的多数据流聚类算法

【24h】

一种基于谱分量相似度的多数据流聚类算法

机译：一种基于谱分量相似度的多数据流聚类算法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

A new algorithm for clustering multiple data streams is proposed. The algorithm can effectively cluster data streams which show similar behavior with some unknown time delays.The algorithm uses the autoregressive (AR) modeling technique to measure correlations between data streams. It exploits estimated frequencies spectra to extract the essential features of streams. Each stream is represented as the sum of spectral components and the correlation is measured component-wise.Each spectral component is described by four parameters,namely, amplitude, phase, damping rate and frequency. The ε-lag-correlation between two spectral components is calculated. The algorithm uses such information as similarity measures in clustering data streams. Based on a sliding window model, the algorithm can continuously report the most recent clustering results and adjust the number of clusters. Experiments on real and synthetic streams show that the proposed clustering method has a higher speed and clustering quality than other similar methods.%提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.

机译：提出了一种用于聚类多个数据流的新算法。该算法可以有效地纳入数据流，其显示具有一些未知时间延迟的类似行为。算法使用自回归（AR）建模技术来测量数据流之间的相关性。它利用估计的频率光谱来提取流的基本特征。每个流被表示为光谱分量的和，并且测量的相关性分量。频谱分量由四个参数，即幅度，相位，阻尼率和频率描述。计算两个光谱分量之间的ε-滞后相关性。该算法在聚类数据流中使用这种信息作为相似度量。基于滑动窗口模型，该算法可以不断地报告最新的聚类结果并调整群集数。实验对实际和合成溪流的实验表明，所提出的聚类方法具有比其他类似方法更高的速度和聚类质量。％提出了一种新的多数言法。该该法可以有条学。时间延迟的多数据流进行。算法使用自给式技术资料数码空间的延迟相关系，利用频谱估计来计算数据量词的特价。每一击数码用途其征。对数据空间的相关关截词。每每分量用振幅，相位，衰减率，频率4个数来描述。算法计算谱谱对词的ε-延计算为基因来得到聚类分类中数量空间距离的量子。户外，算法使用动力传播技术更多数码流进行聚类，实时得出流结果且动词地区调节聚类的数。在人工数码和实际码集上面的实验实验说明，所提出的算法比比其他的算法的算法有着更快的速度和好的的。

著录项

来源
《东南大学学报（英文版）》 |2008年第3期|264-266|共3页
作者
邹凌君; 陈峻; 屠莉;
展开▼
作者单位

扬州大学信息工程学院,扬州225009;

扬州大学信息工程学院,扬州225009;

南京航空航天大学信息科学与技术学院,南京210016;

南京航空航天大学信息科学与技术学院,南京210016;

展开▼
收录信息
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
数据流; 聚类; AR模型; 谱分量;

相似文献

外文文献
中文文献
专利

1. A Clustering Algorithm for Multiple Data Streams Based on Spectral Component Similarity [C] . S.C. Chen, rnH.Y. Wu, rnS.H. Peng ICCSE2008;International Conference on Computer Science & Education . 2008

机译：基于谱分量相似度的多数据流聚类算法
2. SYNCHRONOUS NETS FOR SINGLE INSTRUCTION STREAM - MULTIPLE DATA STREAM COMPUTERS [D] . KRYGIEL, ANNETTE JEAN. 1980

机译：单一指令流的同步网络-多数据流计算机
3. An Algorithm for Early Outbreak Detection in Multiple Data Streams [O] . Sesha K. Dassanayake, Joshua French Online Journal of Public Health Informatics . 2019

机译：多数据流中的早期爆发检测算法
4. Precise deadlock detection for polychronous data-flow specifications [O] . Ngo, Van Chan, Talpin, Jean-Pierre, Gautier, Thierry 2014

机译：精确的死锁检测可满足多数据流规范
5. Development of Techniques for Multiple Data Stream Analysis and Short-Term Forecasting. Volume I. Multiple Data Stream Analysis. [R] . Rubin, T. J., Moore, J., Moore, V. 1975

机译：多数据流分析和短期预测技术的发展。第一卷。多数据流分析。

一种基于谱分量相似度的多数据流聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅