一种基于全局频繁模式的数据挖掘算法及系统实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在国际一体化大背景下，行业内及行业间的事务往来空前频繁，信息交流频率呈爆炸式增长。信息源由以往的单一环境、较小数据量、静态存储方式向分布式环境、流数据形式、动态处理逐渐转换。如何利用有限的硬软件资源从源源不断的数据流中提取出有价值的信息是目前IT行业炙手可热的研究课题。
　　分布式环境赋予数据流频繁模式挖掘新的特性。单主机参与数据频繁项挖掘已经不适合目前海量数据实时产生的特征。传统的分布式数据流全局频繁模式挖掘保留的候选项过多，导致内存占用较大、计算资源浪费过多，进而造成网络通信代价较高，使得资源的合理利用率大打折扣。基于改进后的频繁模式挖掘模型能将候选项的规模控制在一定范围内，从而提高模式挖掘效率。由于采取了比较合适的保留候选项的条件，模式挖掘的正确性也可以得到保障。
　　在分布式环境下，针对多源数据流全局频繁模式挖掘利用多站点的计算能力，将异信息源数据分别在本地挖掘。通过改进频繁模式树（FP-树）结构，减小数据项存储空间。利用网络通信技术将一次挖掘后的数据互通融合，实现了前端处理引擎向后端发送较小的约束模式信息。同时，通过前后处理引擎的信息交互，实现了动态控制约束模式信息的量级，从而大大缓解了模式信息频繁更新的通信压力。

著录项

作者
谭越;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名殷贤亮;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
多源数据流; 全局频繁模式; 数据挖掘; 计算能力; 多级处理引擎;

相似文献

中文文献
外文文献
专利

1. 基于层次频繁模式树的关联分类规则数据挖掘算法 [J] . 杜永生 . 济宁学院学报 . 2011,第006期
2. 一种数据挖掘算法子系统的设计及实现方法 [J] . 汪一琛 . 微型电脑应用 . 2006,第009期
3. 一种基于关联规则的数据挖掘算法实现与应用 [J] . 俞经善 ,王雪岩 . 应用科技 . 2005,第007期
4. 一种基于频繁模式有向无环图的数据流频繁模式挖掘算法 [J] . 任家东 ,王倩 ,王蒙 . 燕山大学学报 . 2011,第002期
5. 基于全局图遍历的加权频繁模式研究 [J] . 王栓杰 ,李华 ,陈智博 . 中国新通信 . 2016,第019期
6. 基于粗糙集的数据挖掘算法在电力系统中的实现 [C] . 吴红 ,曹磊 ,商琳 . 第十一届中国人工智能学术年会 . 2005
7. 基于频繁模式的数据挖掘算法分析与改进 [A] . 贾嘉 . 2007

一种基于全局频繁模式的数据挖掘算法及系统实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅