首页> 中文学位 >基于显现模式的懒惰式贝叶斯分类方法
【6h】

基于显现模式的懒惰式贝叶斯分类方法

代理获取

目录

文摘

英文文摘

声明

致谢

1 引言

1.1 课题背景

1.2 本文所完成的工作

1.3 论文组织安排

2 分类及关联规则

2.1 数据挖掘

2.1.1 数据挖掘的概念

2.1.2 数据挖掘的功能和方法

2.2 分类及贝叶斯方法

2.2.1 分类概述

2.2.2 贝叶斯分类方法概述

2.3 关联规则

2.3.1 关联规则概述

2.3.2 Apriori算法

2.3.3 FP—Tree算法

3 显现模式及其应用

3.1 显现模式的概念和定义

3.2 常见特殊形式的EP

3.3 挖掘显现模式的基本方法

3.3.1 发现EP的Apriori法

3.3.2 基于边界表示的显现模式的挖掘

3.3.3 树型法

3.4 应用显现模式构造分类器

3.4.1 仅使用EP构造分类器

3.4.2 利用EP的特殊性质结合其他分类技术构造分类器

4 基于EP的分类算法实现及其改进

4.1 基于显现模式的分类算法

4.1.1 基于集成显现模式的分类器

4.1.2 基于跳跃显现模式的分类器

4.1.3 基于显现模式的决策分类

4.1.4 基于显现模式的贝叶斯分类器

4.2 显现模式与懒惰式分类方法

4.2.1 懒惰式学习方法

4.2.2 DeEPs中显现模式的选取及挖掘

4.2.3 显现模式的应用

4.2.4 DeEPs算法全过程

4.3 显现模式与懒惰式贝叶斯分类方法

4.3.1 选择eEP的优点

4.3.2 eEP的挖掘

4.3.3 使用eEP分类

4.3.4 最小支持度和最小增长率阈值的确定

4.3.5 eEP分类器的构造与使用

5 实验结果与分析

5.1 实验环境

5.2 数据预处理

5.3 数据集描述

5.4 实验结果及分析

5.5 本章小结

6 结论

6.1 研究工作总结

6.2 进一步研究的方向

参考文献

作者简历

展开▼

摘要

分类是数据挖掘的一个重要课题.随着数据规模与维数的增加,建立高效的、适用于大型数据集的分类算法已成为数据挖掘的一项挑战性任务,基于显现模式(Emerging Patterns,EP)的分类方法是针对大型数据集的分类提出的一种有效方法.EP作为一种新的知识模式,其能够捕获目标类和非目标类上多组属性之间的差异,具有很好的分类性能. 本文首先介绍了分类的相关概念及基本技术:随后详细介绍了显现模式的基本概念、性质,显现模式的挖掘算法以及应用显现模式进行分类的一般方法;进而,深入比较了目前已有的几种基于EP的分类方法.在此基础上详细地设计与实现了一种基于显现模式的决策分类(DeEPs)方法,并以此算法为基础提出了改进策略,提出了一种新的基于EP的分类算法,即基于基本显现模式的懒惰式贝叶斯分类算法(Lazy Bayesian Classification based on essential Emerging Patterns,LBCeEP),并分析了算法的可行性和正确性.该算法使用懒惰式学习技术进行训练数据集的约简,并使用了一种特殊形式的EP,这种模式更能有效地反映类标属性,同时采用贝叶斯方法应用这种EP来进行分类,并且解决了参数的自适应选择等问题.通过实验进行了与NB,C4.5,TAN以及DeEPs算法广泛的比较与分析,实验结果表明该算法具有较好的分类性能。

著录项

  • 作者

    杨迪;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 王志海;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    数据挖掘; 分类法; 显现模式; 贝叶斯网络;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号