首页> 外文期刊>電子情報通信学会技術研究報告. 情報論的学習理論と機械学習 >無限長モデル距離を用いた異種時系列クラスタリング
【24h】

無限長モデル距離を用いた異種時系列クラスタリング

机译:使用无限长模型距离的异构时间序列聚类

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

本稿では長さと位相が異なる時系列のクラスタリング(異種時系列クラスタリング)の問題を取り扱う。時系列クラスタリングは、基礎的かつ応用範囲の広い分析手法である。他のクラスタリング問題を扱う場合と比べて、時系列クラスタリングで特に問題となるのが時系列間の距離である。異なる長さと位相を持つ時系列(異種時系列)をどのように比較すれば良いかは自明ではなく、不適切な距離を採用すれば無意味な結果しか得られない。特に、位相差を無視して時系列をクラスタリングするとデータに含まれる特徴的なパターンの情報を含まない無意味なクラスター中心が得られるという問題は「正弦波問題」としてよく知られている。本稿では異種時系列クラスタリングの手法を提案する。提案手法の核となるアイデアは時系列間の距離として観測されたデータ間の距離ではなくデータから学習されたモデル間の距離(KL距離)を用いてクラスタリングを実行することである。この方法を採用する利点は以下の二点である:(1)KL距離を計算する際の積分範囲を揃えることで異なる長さの観測データを直接比較でき、(2)KL 距離の積分範囲の端(初期状態·境界条件)を固定することで位相を揃えた比較ができる。このため、提案手法によって長さと位相の異なる時系列のクラスタリングを実現できる。
机译:本文研究了具有不同长度和相位的时间序列聚类(异构时间序列聚类)问题。时间序列聚类是一种基本且通用的分析方法。与处理其他聚类问题相比,时间序列之间的距离是时间序列聚类中的一个特殊问题。如何比较具有不同长度和相位的时间序列(异构时间序列)尚不明显,如果采用不适当的距离,则只能获得毫无意义的结果。特别地,众所周知的是,通过在忽略相位差的同时对时间序列进行聚类,可以获得不包含数据中包括的特征图案信息的无意义的聚类中心的问题,被称为“正弦波问题”。本文提出了一种异构时间序列聚类方法。所提出方法的核心思想是使用从数据中学到的模型之间的距离(KL距离)而不是观察到的数据之间的距离作为时间序列之间的距离来执行聚类。采用该方法的优点有以下两点:(1)通过在计算KL距离时对齐积分范围,可以直接比较不同长度的观测数据,(2)KL距离的积分范围。通过固定边缘(初始状态/边界条件),可以进行相位对齐的比较。因此,该方法可以实现不同长度和相位的时间序列聚类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号