首页> 中文学位 >数据挖掘中基于兴趣度的关联规则研究
【6h】

数据挖掘中基于兴趣度的关联规则研究

代理获取

目录

摘要

1 绪论

1.1 研究的背景及意义

1.2 数据挖掘技术研究现状

1.3 课题来源与研究内容

1.4 本文的组织

2 关联规则相关理论

2.1 关联规则研究背景

2.2 关联规则基本概念

2.3 关联规则挖掘算法

2.3.1 经典算法

2.3.2 Apriori算法

2.3.3 Apriori算法的评价

2.4 本章小结

3 兴趣度度量的改进

3.1 支持度-置信度框架的不足

3.2 关联规则兴趣度的提出

3.3 几种比较重要的兴趣度度量

3.3.1 提升度lift度量

3.3.2 基于差异思想的兴趣度模型

3.3.3 相关分析

3.3.4 IS度量

3.3.5 PS度量

3.4 新兴趣度度量

3.4.1 新兴趣度量的提出

3.4.2 新兴趣度量的性质

3.4.3 实验与结果分析

3.5 本章小结

4 关联规则挖掘算法的改进

4.1 负相关关联规则

4.2 正负相关关联挖掘

4.2.1 已有算法的提出

4.2.2 引入最大支持度

4.3 正负关联挖掘算法的改进

4.3.1 改进算法的提出

4.3.2 实验结果及分析

4.4 负关联规则挖掘改进算法

4.4.1 负关联规则挖掘改进算法的提出

4.4.2 实验结果及分析

4.5 本章小结

5 改进算法在股票问的若干应用

5.1 关联规则在股票间的一些应用

5.2 股票间关联规则改进算法运用

5.2.1 股票数据的预处理

5.2.2 实验结果与分析

5.3 本章小结

6 总结与展望

6.1 总结

6.2 展望

参考文献

一、公开申请的专利或软件著作权

二、参与的科研项目

后记

声明

展开▼

摘要

数据挖掘作为是人工智能的一个分支,正逐步的被应用到各个方面,从初级应用到目前的大量而广泛的应用,人们对此学科的发展,耗费了许多努力,提出了许多研究方法,极大的发展了这门学科。在发展的过程中,数据挖掘针对不同应用,分别发展出聚类、分类、关联规则等不同的挖掘方法。在初期的关联规则的研究过程中,大部分集中在支持度-置信度阈值的研究上,但在实际应用过程中,易产生许多虚假误导的规则。为此关联规则的生成在考虑支持度和置信度阈值的同时,还需引入兴趣度度量,来检验结果是不是具有价值。目前许多人提出了不同的兴趣度度量方法,但并没有被广泛接受的兴趣度度量标准,在此研究的方面仍需要完善。因此,针对传统支持度-置信度这一框架不足这一问题,结合对部分已有兴趣度度量进行分析研究,提出了新的兴趣度的度量,并用实例证明了该度量的有效性。同时在利用兴趣度挖掘有价值的正负关联规则时,负关联规则的有效挖掘面临着规则爆炸问题,虽然人们已经从不同方面提出了挖掘正负相关关联规则的算法,但对减少负关联规则爆炸性问题仍有许多问题未解决。
  本文从减少非频繁项的角度,结合新的兴趣度度量,引入了最大支持度模型,提出了一种挖掘正负关联规则的算法,并通过Mushroom数据集上的实验证明具有减少无关规则和误导规则的有效性能。由于负关联规则不仅需要规则有意义而且还应具有可读性,因此本文在已有挖掘算法上更进一步提出了一种新的负关联挖掘算法,不仅可以大幅减少无关和误导的规则,而且通过实验与已有算法相比还具有良好的可读性。最后将改进的算法应用到股票间涨跌联动的研究之上,研究股票个股与个股之间涨跌之间的正负关联关系,一方面通过此实例验证验证算法的实用性,另一方面也在研究中获得了一些有价值的关联规则。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号