首页> 中文学位 >关联规则数据挖掘频繁项目集发现算法的研究
【6h】

关联规则数据挖掘频繁项目集发现算法的研究

代理获取

目录

文摘

英文文摘

哈尔滨工程大学学位论文原创性声明

第1章绪论

1.1课题目的和意义

1.2国际国内研究现状及进展

1 3课题的主要工作与论文组织

1.3.1课题的主要工作

1.3.2论文的组织

第2章数据挖掘理论研究

2.1数据挖掘的提出与定义

2.1.1数据挖掘的提出

2.1.2数据挖掘的定义

2.2数据挖掘的数据来源

2.3数据挖掘所发现的知识

2.4数据挖掘分类与方法

2.4.1数据挖掘的分类

2.4.2数据挖掘方法

2.5数据挖掘的体系结构与数据挖掘的步骤

2.5.1数据挖掘的体系结构

2.5.2数据挖掘步骤

2.6与数据挖掘相关技术

2.6.1数据仓库

2.6.2知识发现

2.6.3联机分析处理

2.6.4客户关系管理

2.6.5与数据挖掘的其它相关技术

2.7数据挖掘在行业中的应用

2.8本章小结

第3章关联规则挖掘与频繁项目集发现算法

3.1引言

3.2关联规则挖掘的基本概念

3.3关联规则的挖掘过程

3.4关联规则的挖掘算法

3.4.1 Apriori算法

3.4.2 AprioriTid算法

3.4.3算法Apriori与算法AprioriTid的说明

3.5本章小结

第4章频繁项目集发现算法的改进

4.1引言

4.2减少候选项目集数量的方法

4.3不断减小事务数据库D的长度

4.4减少数据库D的扫描次数的改进

4.4.1一次扫描数据库的方法及其改进

4.4.2动态自适应方式减少数据库扫描次数

4.5逐渐减少事务记录的长度

4.6 Apriori_Auto算法

4.7改进的算法总结

4.8本章小结

第5章基于Apriori_Auto算法的关联规则挖掘实验系统

5.1系统整体结构

5.2系统主要数据结构设计

5.2.1数据库的结构设计

5.2.2频繁k项目集的数据结构

5.3频繁项目集生成算法Apriori_Auto的实现

5.4关联规则的生成

5.5本实验系统运行说明与实例

5.6本章小结

附图

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

个人简历

展开▼

摘要

数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而频繁项目集的发现是关联规则数据挖掘的核心问题。  本文充分论述了典型的频繁项目集发现算法Apriori算法、Apriori_Tid算法,及已有的对于频繁项目集发现算法相关的改进措施的优缺点。在此基础上,本文给出了对于频繁项目集发现算法的一些新的、有效的改进措施。首先提出了动态自适应的方法,明显减少了事务数据库的扫描次数;其次提出了逐渐减小事务数据库中事务记录长度的方法,大大地提高了频繁项目集发现算法的时间效率;最后在项目集的搜索方面,根据项目集的有序性,采用了二分法查找的方法,大大节省了系统在项目集搜索方面的时间。根据以上所提出的改进措施,又综合已有的改进算法的优点,本文给出了一个频繁项目集发现的新的算法——Apriori_Auto算法。该综合算法在减小数据库扫描次数、减少候选项目集的数量及提高算法用于搜索的时间效率等方面都得到了明显的有效的改进。

著录项

  • 作者

    顾泽元;

  • 作者单位

    哈尔滨工程大学;

  • 授予单位 哈尔滨工程大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 杨静;
  • 年度 2005
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    数据挖掘; 关联规则; Apriori算法; 人工智能; 数据库;

  • 入库时间 2022-08-17 10:36:40

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号