首页> 中文学位 >基于USI及项集相关重要性的频繁集挖掘算法
【6h】

基于USI及项集相关重要性的频繁集挖掘算法

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1课题背景

1.2数据挖掘技术相关算法的概念及核心

1.3论文结构

第二章 数据挖掘与关联规则技术概述

2.1数据挖掘基础知识

2.1.1数据挖掘技术的定义

2.1.2数据挖掘的流程

2.1.3数据挖掘承担的任务

2.2关联规则挖掘基础知识

2.2.1关联规则的定义

2.2.2关联规则挖掘的基本名词释意

2.2.3关联规则挖掘的基本步骤

2.2.4关联规则算法的种类及国内外基本应用现状

第三章 Apriori算法及本文对其改进的动因及思路

3.1 Apriori算法

3.1.1 Apriori算法的基本思想

3.1.2 Apriori算法核心分析

3.1.3 Apriori核心算法实例

3.1.4可视化关联规则实例

3.2本文对Apriori算法的新改进

3.2.1Apriori算法的主要缺陷

3.2.2目前流行的几种Apriori算法改进方式

3.2.3本文对“经典的”Apriori算法继续进行改进的动因

3.2.4本文对Apriori算法继续进行改进的新思路

第四章 基于USI及项集相关重要性的Apriori改进算法

4.1依感兴趣阈值(USI)及项集相关重要性对Apriori进行改进

4.2算法改进的几个关键点

4.2.1用户感兴趣项目集的产生

4.2.2项集相关重要性

4.2.3设计支持度函数

4.3改进算法流程

4.4改进型算法的基本特点

4.5改进型算法的伪代码形式化描述

第五章 仿真实验设计与分析

5.1数据结构与实验设计说明

5.1.1数据结构定义

5.1.2实验设计说明

5.2实验的程序实现

5.2.1程序说明

5.2.2实验程序实现

5.3改进型算法的性能比较与分析

5.3.1改进型算法相对FP-growth算法在时间性能上的比较

5.3.2改进后的算法相对于经典Apriori算法在空间性能上的改进

5.4对于本文所提出的改进算法的结论

结语

参考文献

致谢

展开▼

摘要

作为信息科学领域的前沿研究课题之一,数据挖掘技术是解决如何在海量数据中提取有效信息的关键技术。与数据挖掘技术相关的研究与应用已经极大的提高了人们的决策支持能力。本文描述了数据挖掘的概念、功能以及模式的分类,并将文章聚焦在数据挖掘领域中的关联规则挖掘方面。 本文的主要内容,先是对Apriori算法的流程思路进行了梳理,然后对目前关于Apriori算法的几种改进思路进行了归纳性总结,最后提出了一种基于用户感兴趣度阈值(USI)和项集重要性的改进型Apriori算法。本文改进算法的思路,是抓住用户对项集感兴趣程度与项集相关重要性两个要素,对Apriori算法进行一种复合式改进:首先从数据库中利用某些用户感兴趣的项从数据库所有项的集合中选择出一个子集作为挖掘对象,然后对数据库进行一次扫描,实现用事务标识号来表示项目集。在产生项目集后,依项集相关重要性原则,对项目集中的元素赋以权值,然后利用引入了权值的支持度函数计算项集的支持度以产生频繁项集,最后从这些频繁项集中产生关联规则。 之后,论文以仿真实验将本文提出的改进思路在时间性能、空间性能上分别与FP-growth算法及原始Apriori算法进行了对比,实验结果验证本文提出的改进算法在性能上的优化提高。

著录项

  • 作者

    邓涛;

  • 作者单位

    天津师范大学;

  • 授予单位 天津师范大学;
  • 学科 教育技术学
  • 授予学位 硕士
  • 导师姓名 张桂芸;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    USI; 频繁集挖掘; 频繁项集; 关联规则挖掘;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号