首页> 中文学位 >基于剪枝概念格模型的频繁项集表示及挖掘研究
【6h】

基于剪枝概念格模型的频繁项集表示及挖掘研究

代理获取

目录

文摘

英文文摘

论文说明:插图清单、表格清单

独创性声明及学位论文版权使用授权书

致谢

第一章绪论

1.1引言

1.2知识发现的基本概念及一般步骤

1.2.1基本概念

1.2.2 KDD过程

1.3知识发现的核心——数据挖掘

1.3.1数据挖掘的任务

1.3.2数据挖掘的典型方法及工具

1.3.3数据挖掘系统的发展

1.4 KDD面临的挑战

1.5本文的主要内容及组织

1.6本章小结

第二章概念格与扩展概念格

2.1概念格理论及其研究现状

2.1.1基本概念

2.1.2概念格的建造

2.2扩展概念格

2.2.1扩展概念格

2.2.2内涵约简概念格

2.2.3外延约简概念格

2.2.4量化概念格

2.3本章小结

第三章关联规则挖掘研究

3.1引言

3.2关联规则定义及术语

3.3经典关联规则挖掘算法描述与分析

3.3.1 Apriori算法

3.3.2 DHP算法

3.3.3 Partition算法

3.3.4 Sampling算法

3.3.5 FP-Growth算法

3.4本章小结

第四章基于概念格的项目集表示与求解

4.1引言

4.2经典的项集求解算法

4.3基于概念格模型的项目集表示与求解

4.3.1事务集与概念格间的映射

4.3.2相关的性质

4.3.3项目集的表示与求解

4.4本章小结

第五章基于剪枝概念格模型的频繁项集表示与求解

5.1引言

5.2剪枝概念格

5.2.1剪枝概念格的定义

5.2.2剪枝概念格的构造

5.3基于剪枝概念格的频繁项目集表示和求解

5.3.1频繁项目集的表示和求解

5.3.2基于剪枝概念格的频繁项集挖掘算法

5.5.3基于剪枝概念格求解频繁项目集算法实例

5.4实验及性能分析

5.4.1基于概念格求解频繁概念数量的分析

5.4.2算法时空性能的分析和比较

5.5本章小结

第六章总结及展望

6.1总结

6.2展望

参考文献

附录一攻读硕士学位期间主要科研工作及成果

展开▼

摘要

数据挖掘是涉及人工智能和数据库等学科的一门新兴交叉性学科.在当今数字化时代,各种商业、政治、科学数据库和数据量的急剧增长,远远超过了人类目前已有的分析和理解能力.因此,从大量数据中智能地、自动地提取出有价值的信息,即对数据库进行知识的挖掘,具有十分重要的理论意义和现实意义. 作为数据挖掘的一种重要模式,关联规则一直受到广泛的关注.发现频繁项集是关联规则挖掘的关键步骤.然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率.本文将具有完备特性的概念格模型引入到频繁项集挖掘的研究,主要研究内容如下: 1.提出了基于概念格模型的项目集表示和求解方法.研究表明,每个项目集一定作为概念格中某个概念的内涵或内涵的子集出现,借助于概念之间的关系可从每个概念导出多个项目集,因此,概念格中概念的数量比事务数据库中项目集的实际数量有显著的减少. 2.提出了基于剪枝概念格(PCL)模型的频繁项集表示和求解方法.利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模.在此基础上提出基于PCL模型的频繁项集求解算法,该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能.实验证实了算法良好的性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号