基于频繁模式的数据挖掘算法分析与改进

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在面临数据爆炸的年代，数据挖掘已经体现出它越来越重要的作用。近年来涌现出很多数据流的应用，比如网络日志、传感器网络等，流数据挖掘是数据挖掘的一个新的研究方向，已逐渐成为许多领域的有用工具。由于这些数据的数据量大，数据分布变化更新快，结构类型较多等特点使得传统的数据挖掘方法很难有效的处理新的模式。发现最大频繁项目集是多种数据挖掘应用中的重要问题，是许多挖掘方法的基础。在应用中用户需要调整最小支持度，以发现更有用的最大频繁项目集。频繁模式的挖掘已有很多成熟的算法，其中Apriori算法和FP TREE算法就是其代表。Apriori算法的特点就是在于其对于频繁模式的挖掘从单项开始，每次剪裁一点，利用Apriori性质，有效避免了对很多不可能的项的搜索过程。而Apriori算法的一个有问题的方面是其候选项集的生成，而另一种算法FP tree则使用分而治之的策略，将数据中的信息压缩成一个描述频繁项相关信息的频繁模式树，递归地增长频繁模式借助模式和数据库划分。这里在FP tree算法的基础上提出一些改进，并与其他算法进行比较分析。此算法通过数据流中的频繁模式进行分类，在压缩数据的同时保存了数据中的分类信息。实验证明，这种算法比其他算法在进行模式分析时有更高的准确性．并且可以很好地处理训练集包含大量缺失取值的应用。综上，改进的FP tree算法在面对大数据量的流数据挖掘中，应用频繁模式的数据挖掘技术可以很好的解决大数据量的流入，融合问题。而且由于窗口机制的引入，数据归类无论是准确性还是运行时间都有了较大的提高，而窗口的大小也有一个很好的控制。

著录项

作者
贾嘉;
展开▼
作者单位

太原理工大学;

展开▼
授予单位太原理工大学;
学科计算机应用
授予学位硕士
导师姓名冯秀芳;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
数据挖掘; 流数据; 频繁模式; 数据库;

相似文献

中文文献
外文文献
专利

1. 基于层次频繁模式树的关联分类规则数据挖掘算法 [J] . 杜永生 . 济宁学院学报 . 2011,第006期
2. 一种基于频繁模式有向无环图的数据流频繁模式挖掘算法 [J] . 任家东 ,王倩 ,王蒙 . 燕山大学学报 . 2011,第002期
3. 基于频繁模式树的最大频繁模式挖掘算法 [J] . 缪裕青 . 桂林电子科技大学学报 . 2004,第003期
4. 基于频繁模式挖掘的接触网故障关联规则推荐模型 [J] . 宇占军 . 电气化铁道 . 2021,第002期
5. 基于解耦概要图的图数据频繁模式挖掘算法 [J] . 李洁 . 内蒙古民族大学学报（自然科学版） . 2021,第005期
6. 基于Spark机器学习实现医疗保险关联频繁模式的欺诈行为挖掘技术探讨 [C] . LIU Peng ,刘鹏 . 2019中华医院信息网络大会 . 2019
7. 一种基于全局频繁模式的数据挖掘算法及系统实现 [A] . 谭越 . 2011

基于频繁模式的数据挖掘算法分析与改进

目录

摘要

著录项

相似文献

相关主题

期刊订阅