基于偏序的频繁序列模式压缩算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

伴随计算机应用的普及，特别是网络技术的高速发展，人们利用信息技术产生和搜集数据的能力大幅度提高，而现实世界中的数据也是越来越丰富，从大量的数据中提取知识也变得越来越困难。数据挖掘的发展大大的方便了知识的提取，但随着计算处理速度的提高，目前很多数据挖掘问题的研究瓶颈已不是在数据挖掘的效率，而是在挖掘的模式的质量上。频繁模式挖掘是数据挖掘中的一项很关键的技术，为了提高频繁模式挖掘的质量，本文针对序列模式的特点，提出了基于偏序的频繁序列模式压缩算法ApproxPO(Towards Frequent Sequential Paaem Mining Compression Using Ap-proximate Partial Order)。它以频繁序列模式为输入，可视化的偏序为输出。算法充分利用了序列之间的关联性和偏序在知识表达上的优越性，使得算法不但能够对序列模式进行精简，而且能够方便的分析所得到的挖掘结果。它主要包括如下的几个步骤： ●数据预备：生成，清理实验数据，使所得数据能够被算法所直接使用，本文一共对三种数据进行了清理。 ●距离定义：本文根据序列模式和偏序的特点，提出了三种序列模式间的距离，并对它们进行相关的比较和测试。 ●模式总结：以常用的k-中心聚类和层次聚类的方法为基础对模式进行了总结。 ●近似偏序生成：提出了近似偏序的概念，说明了生成近似偏序的过程，并对部分的近似偏序挖掘实例进行了分析●效果评估：定义了时间效率的评估和质量的评估方法，并将算法在多个的数据集上进行了实验，对所得的实验结果进行了分析。

著录项

作者
但红卫;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机应用
授予学位硕士
导师姓名徐从富;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 频繁序列模式; 数据压缩; 偏序; 知识提取;

相似文献

中文文献
外文文献
专利

1. 基于偏序压缩技术的频繁序列模式数据挖掘 [J] . 程舒通 ,徐从富 ,但红卫 . 计算机工程与应用 . 2008,第003期
2. 基于频繁序列模式压缩技术的网站结构优化 [J] . 程舒通 ,徐从富 ,但红卫 . 计算机工程与应用 . 2007,第030期
3. 压缩频繁序列模式集 [J] . 王涛 . 小型微型计算机系统 . 2008,第003期
4. 基于并发序列模式的偏序模式挖掘 [J] . 逄玉俊 ,刘英 ,陈未如 . 沈阳化工大学学报 . 2011,第004期
5. 基于并发序列模式的偏序模式挖掘 [J] . 逄玉俊 ,刘英 ,陈未如 . 沈阳化工大学学报 . 2011,第004期
6. 基于最大频繁序列模式树的个性化页面推荐 [C] . 谭小球 ,姚敏 ,顾沈明 . 2006年全国开放式分布与并行计算学术会议 . 2006
7. 基于偏序的序列模式挖掘算法研究 [A] . 冯树凯 . 2017

基于偏序的频繁序列模式压缩算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅