首页> 中文学位 >基于偏序的频繁序列模式压缩算法研究
【6h】

基于偏序的频繁序列模式压缩算法研究

代理获取

目录

文摘

英文文摘

论文说明:图目录、表目录

第1章绪论

1.1简介

1.2数据挖掘研究与发展

1.2.1数据挖掘的定义

1.2.2数据挖掘研究的主要内容

1.2.3数据挖掘的主要过程

1.2.4数据挖掘的应用及发展

1.3数据挖掘技术

1.3.1频繁模式挖掘

1.3.2聚类分析

1.4本文的主要内容与工作

1.5文章结构

1.6本章小结

第2章相关工作综述

2.1序列模式及序列模式挖掘

2.1.1序列模式的定义

2.1.2序列模式挖掘相关算法

2.2偏序及偏序挖掘

2.2.1偏序概念

2.2.2偏序挖掘相关算法

2.3模式压缩及其算法

2.3.1模式压缩概论

2.3.2闭合模式

2.3.3最大模式

2.3.4最新研究成果

2.4本章小结

第三章基于偏序的频繁序列模式压缩算法

3.1算法概述

3.2算法结构

3.3相关定义

3.3.1支持度列表

3.3.2近似偏序

3.3.3距离函数

3.4模式总结

3.4.1基于k-中心聚类的算法

3.4.2基于层次聚类的算法

3.5本章小结

第四章从序列聚类中生成近似偏序

4.1实现方法概述

4.2具体实现过程

4.3偏序实例分析

4.4本章小结

第五章实验结果和分析

5.1数据准备

5.2效率比较

5.2.1时间计算方法

5.2.2结果比较分析

5.3算法质量评估

5.3.1评估方法

5.3.2结果比较分析

5.4本章小结

第六章总结与展望

6.1 工作总结

6.2未来展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

伴随计算机应用的普及,特别是网络技术的高速发展,人们利用信息技术产生和搜集数据的能力大幅度提高,而现实世界中的数据也是越来越丰富,从大量的数据中提取知识也变得越来越困难。数据挖掘的发展大大的方便了知识的提取,但随着计算处理速度的提高,目前很多数据挖掘问题的研究瓶颈已不是在数据挖掘的效率,而是在挖掘的模式的质量上。 频繁模式挖掘是数据挖掘中的一项很关键的技术,为了提高频繁模式挖掘的质量,本文针对序列模式的特点,提出了基于偏序的频繁序列模式压缩算法ApproxPO(Towards Frequent Sequential Paaem Mining Compression Using Ap-proximate Partial Order)。它以频繁序列模式为输入,可视化的偏序为输出。算法充分利用了序列之间的关联性和偏序在知识表达上的优越性,使得算法不但能够对序列模式进行精简,而且能够方便的分析所得到的挖掘结果。它主要包括如下的几个步骤: ●数据预备:生成,清理实验数据,使所得数据能够被算法所直接使用,本文一共对三种数据进行了清理。 ●距离定义:本文根据序列模式和偏序的特点,提出了三种序列模式间的距离,并对它们进行相关的比较和测试。 ●模式总结:以常用的k-中心聚类和层次聚类的方法为基础对模式进行了总结。 ●近似偏序生成:提出了近似偏序的概念,说明了生成近似偏序的过程,并对部分的近似偏序挖掘实例进行了分析●效果评估:定义了时间效率的评估和质量的评估方法,并将算法在多个的数据集上进行了实验,对所得的实验结果进行了分析。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号