首页> 中文学位 >数据归约方法在时序数据分类中的应用研究
【6h】

数据归约方法在时序数据分类中的应用研究

代理获取

摘要

时间序列数据(Time Series Data)广泛地存在生活中的各个领域,越来越多的数据挖掘研究者关注于时间序列的挖掘方法和技术,而时间序列的分类是时间序列数据挖掘的重要任务之一。数据归约用来得到数据集的归约表示,比原始数据量小,但仍然近似地保持原始数据的完整性,在归约后的数据集上进行挖掘将更有效,并产生相同或几乎相同的分析结果。时间序列数据往往具有大数据集的特点,所以数据归约成为预处理中不可或缺的步骤,并且直接影响后期分类的准确率,因此,时间序列的数据归约是现阶段时间序列数据分析的重要研究热点。
   针对时间序列数据归约这一研究热点,本论文以一元时间序列数据为主要研究对象,重点研究适用于分类任务的时间序列数据归约方法。本论文完成的工作主要有:
   首先,本论文分析了现阶段常用于时间序列分类挖掘的数据归约方法,并归纳为四大类,它们分别是基于基本统计方法的数据归约、基于模型的数据归约、基于变换的数据归约、基于分形维数的数据归约。同时,针对每一类的数据归约方法,进一步研究了与它相适应的分类方法和它在时间序列数据中的应用邻域。其次,将聚类的思想引入到数据归约当中,形成了基于聚类的时间维度归约方法(TDRBC)。该方法的基本思想是对时序数据的时间维度进行聚类,聚类使用K-均值算法,提取聚类后的聚类中心作为新的数据集,因而能有效地减少数据量,数据归约后的数据集可直接利用分类方法进行分类。文中称这一方法为基本的TDRBC。再次,在基本的TDRBC基础上,引入信息熵的思想,改进原有算法,形成了基于聚类的自适应时间维度归约算法,简称为自适应的TDRBC。该算法的基本思想是:在时间序列的时间采样点上计算信息熵,根据熵值的大小初始化聚类中心,然后再利用聚类时间维度归约方法进行数据归约。最后,为了验证本论文提出的两种新方法的可行性,本论文设计了一套仿真实验,采用具有代表性的四组数据分别进行数据归约,归约方法除了上述的两种新方法外,实验采用现阶段常用的LPCC数据归约作为参照方法。归约后的数据将进行分类识别,得出分类准确率。实验表明:本论文提出的两种数据归约方法,不仅能够有效地降低数据量,达到数据归约的目的,同时还能提高分类的准确率,并具有很强的实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号