首页> 中文学位 >基于兴趣度的关联规则挖掘算法研究
【6h】

基于兴趣度的关联规则挖掘算法研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪 论

1.1研究背景

1.2拟解决问题

1.3本文所做的主要工作

第二章 关联规则挖掘研究

2.1关联规则基本概念

2.2关联规则挖掘的分类

2.3基本算法—Apriori算法

2.4基于频繁的算法改进

2.5关联规则挖掘中存在的问题

第三章 关联规则的评价及规则有趣性

3.1关联规则的评价指标

3.2关联规则的有趣性度量

3.3兴趣度研究现状

第四章 基于兴趣度的关联规则挖掘

4.1协方差和相关系数

4.2兴趣度的形式定义

4.3基于兴趣度的关联规则挖掘算法

4.4实验

第五章 结论与展望

5.1总结

5.2下一步工作

参考文献

致 谢

在学期间公开发表论文及著作情况

展开▼

摘要

数据挖掘是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的过程,关联规则挖掘是数据挖掘的一个重要分支。目前,该技术在商业、金融、科学研究、情报分析等方面得到广泛应用。关联规则挖掘中大多数使用的是Agrawal的Aprior算法,该算法基本思想使用支持度、置信度两个阈值从事务数据库中寻找概率比较高的模式,利用一个层次顺序搜索的循环方法来完成频繁项集的挖掘工作。经研究发现,支持度可以表示规则统计意义上的普遍性,可置信度却不能很好的表示规则的可信程度,可信度实际上就是一个条件概率,在一定程度上掩盖了规则的关联属性,另外层次顺序搜索的循环方法对数据库的频繁访问大大的降低了挖掘工作的效率。 本文引入统计学测量相关性的方法,采用相关系数作为兴趣度,并且将兴趣度作为第一阈值,它可以有效地反映数据本身的关联特征:关联方向和关联强弱,并且避免了由支持度作为第一阈值所带来的尴尬,如果支持度设置太低,会增加规则冗余,支持度设置太高,会过滤大量有效规则,由此对经典算法加以改进,给出了基于兴趣度的关联规则挖掘算法,该算法经过实验验证,在同等条件下生成了质量更好,意义更加明确的关联规则。另外,在算法可行的前提下,根据挖掘的实际情况,对基于兴趣度的关联规则挖掘算法在性能方面进行优化,尽量降低数据存储和数据访问过程中的成本,以达到提高挖掘效率的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号