数据归约方法在时序数据分类中的应用研究

代理获取

页面导航

摘要
著录项
相似文献
相关主题

摘要

时间序列数据(Time Series Data)广泛地存在生活中的各个领域,越来越多的数据挖掘研究者关注于时间序列的挖掘方法和技术,而时间序列的分类是时间序列数据挖掘的重要任务之一。数据归约用来得到数据集的归约表示,比原始数据量小,但仍然近似地保持原始数据的完整性,在归约后的数据集上进行挖掘将更有效,并产生相同或几乎相同的分析结果。时间序列数据往往具有大数据集的特点,所以数据归约成为预处理中不可或缺的步骤,并且直接影响后期分类的准确率,因此,时间序列的数据归约是现阶段时间序列数据分析的重要研究热点。
　　针对时间序列数据归约这一研究热点,本论文以一元时间序列数据为主要研究对象,重点研究适用于分类任务的时间序列数据归约方法。本论文完成的工作主要有:
　　首先,本论文分析了现阶段常用于时间序列分类挖掘的数据归约方法,并归纳为四大类,它们分别是基于基本统计方法的数据归约、基于模型的数据归约、基于变换的数据归约、基于分形维数的数据归约。同时,针对每一类的数据归约方法,进一步研究了与它相适应的分类方法和它在时间序列数据中的应用邻域。其次,将聚类的思想引入到数据归约当中,形成了基于聚类的时间维度归约方法(TDRBC)。该方法的基本思想是对时序数据的时间维度进行聚类,聚类使用K-均值算法,提取聚类后的聚类中心作为新的数据集,因而能有效地减少数据量,数据归约后的数据集可直接利用分类方法进行分类。文中称这一方法为基本的TDRBC。再次,在基本的TDRBC基础上,引入信息熵的思想,改进原有算法,形成了基于聚类的自适应时间维度归约算法,简称为自适应的TDRBC。该算法的基本思想是:在时间序列的时间采样点上计算信息熵,根据熵值的大小初始化聚类中心,然后再利用聚类时间维度归约方法进行数据归约。最后,为了验证本论文提出的两种新方法的可行性,本论文设计了一套仿真实验,采用具有代表性的四组数据分别进行数据归约,归约方法除了上述的两种新方法外,实验采用现阶段常用的LPCC数据归约作为参照方法。归约后的数据将进行分类识别,得出分类准确率。实验表明:本论文提出的两种数据归约方法,不仅能够有效地降低数据量,达到数据归约的目的,同时还能提高分类的准确率,并具有很强的实用性。

著录项

作者
林珠;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科控制理论与控制工程
授予学位硕士
导师姓名邢延;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类人工智能理论;
关键词
时间序列; 数据归约; 信息熵; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 数据挖掘中适用于分类的时序数据特征提取方法 [J] . 林珠 ,邢延 . 计算机系统应用 . 2012,第010期
2. 基于MODIS时序数据的Landsat8影像选取及面向对象分类方法的农作物分类 [J] . 刘明月 ,王宗明 ,满卫东 . 土壤与作物 . 2017,第002期
3. 基于MODIS时序数据的Landsat8影像选取及面向对象分类方法的农作物分类 [J] . 刘明月12 ,王宗明1 ,满卫东12 . 土壤与作物 . 2017,第002期
4. 一种利用Landsat年度时序数据的土地覆盖分类方法 [J] . 肖京格 ,乔彦友 ,王成波 . 遥感信息 . 2019,第002期
5. 基于MOD IS-NDV I时序数据集的r面向对象分类提取广西耕地面积的方法研究 [J] . 童新华 ,毛碑裙 ,韦燕飞 . 广西师范学院学报（自然科学版） . 2017,第004期
6. 适用于时间序列分类的数据归约方法 [C] . 林珠 ,邢延 . 2009年中国智能自动化会议 . 2009
7. 时序数据维归约方法的研究 [A] . 杨仕博 . 2008

数据归约方法在时序数据分类中的应用研究

摘要

著录项

相似文献

相关主题

期刊订阅