...
首页> 外文期刊>Datenbank-Spektrum >Data Change Exploration Using Time Series Clustering
【24h】

Data Change Exploration Using Time Series Clustering

机译:使用时间序列聚类的数据更改探索

获取原文
获取原文并翻译 | 示例
           

摘要

Analysis of static data is one of the best studied research areas. However, data changes over tirhe. These changes may reveal patterns or groups of similar values, properties, and entities. We study changes in large, publicly available data repositories by modelling them as time series and clustering these series by their similarity. In order to perform change exploration on real-world data we use the publicly available revision data of Wikipedia Infoboxes and weekly snapshots of IMDB. The changes to the data are captured as events, which we call change records. In order to extract temporal behavior we count changes in time periods and propose a general transformation framework that aggregates groups of changes to numerical time series of different resolutions. We use these time series to study different application scenarios of unsupervised clustering. Our explorative results show that changes made to collaboratively edited data sources can help find characteristic behavior, distinguish entities or properties and provide insight into the respective domains.
机译:静态数据分析是研究最好的研究领域之一。但是,数据随时间变化。这些更改可能会揭示出具有相似值,属性和实体的模式或组。我们通过将大型数据仓库建模为时间序列并通过它们的相似性对其进行聚类来研究大型公共数据仓库中的变化。为了对真实数据进行更改探索,我们使用Wikipedia信息框的公开可用修订数据和IMDB的每周快照。数据的更改被捕获为事件,我们称为更改记录。为了提取时间行为,我们对时间段内的变化进行计数,并提出了一个通用的转换框架,该框架将变化的集合聚合为不同分辨率的数字时间序列。我们使用这些时间序列来研究无监督集群的不同应用场景。我们的探索性结果表明,对经过协作编辑的数据源进行的更改可以帮助发现特征行为,区分实体或属性并提供对相应域的洞察力。

著录项

  • 来源
    《Datenbank-Spektrum》 |2018年第2期|79-87|共9页
  • 作者单位

    Hasso-Plattner-Institut, Universität Potsdam, Prof.-Dr.-Helmert-Straße 2-3, 14482 Potsdam, Germany;

    Hasso-Plattner-Institut, Universität Potsdam, Prof.-Dr.-Helmert-Straße 2-3, 14482 Potsdam, Germany;

    AT&T Labs - Research, Bedminster, New Jersey, USA;

    Hasso-Plattner-Institut, Universität Potsdam, Prof.-Dr.-Helmert-Straße 2-3, 14482 Potsdam, Germany;

    AT&T Labs - Research, Bedminster, New Jersey, USA;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 ger
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号