声明
摘要
1.1 课题研究的背景及意义
1.2 国内外研究现状
1.3 论文的主要工作及组织结构
第2章 相关技术介绍
2.1 基于确定数据库的频繁项集
2.1.1 确定事务数据库介绍
2.1.2 基于确定数据库的频繁项集
2.2 基于不确定数据库的频繁项集
2.2.1 不确定数据库介绍
2.2.2 可能世界语义
2.2.3 概率频繁项集
2.2.4 极大概率频繁项集
2.3 现有算法概述
2.3.2 分治算法介绍(DC)
2.3.3 自顶向下继承挖掘方法介绍(TODlS)
2.4 本章小结
第3章 极大概率频繁项集挖掘算法
3.1 算法整体思路
3.2 候选集生成算法
3.2.1 基于切诺夫界的剪枝方法
3.2.2 基于剪枝的候选集生成算法
3.3 极大概率频繁项集挖掘算法
3.3.1 APF I-MAX算法
3.3.2 频繁度估计方法
3.3.3 频繁度估计中的继承性证明
3.3.4 方差和期望的估计
3.4 本章小结
第4章 实验结果与分析
4.1 实验环境配置
4.1.2 实验数据集
4.2 实验对比方案
4.3 候选集生成算法和Apriori算法对比
4.3.1 数据库规模的影响
4.3.2 支持度的影响
4.4 PMFl和TODIS-MAX对比
4.4.1 数据库规模对运行时间的影响
4.4.2 最小相对支持度运行时间的影响
4.4.3 频繁概率阈值对运行时间的影响
4.5 精确度分析
4.5.1 数据库规模对精度的影响
4.5.2 期望和方差对精度的影响
4.5 本章小结
第5章 总结与展望
5.1 论文工作总结
5.2 未来工作展望
参考文献
攻读学位期间公开发表论文
致谢