首页> 中文学位 >基于NSJEP-list的强跳跃显露模式的挖掘方法及应用
【6h】

基于NSJEP-list的强跳跃显露模式的挖掘方法及应用

代理获取

目录

声明

第1章 绪 论

1.1 研究背景及研究意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文的组织结构

第2章 相关工作

2.1 显露模式的基本概念

2.2 显露模式的挖掘算法

2.3 基于显露模式的分类算法

2.4 显露模式的应用

2.5 不平衡数据集概述

2.6 本章小结

第3章 基于一种新数据结构NSJEP-list的SJEP挖掘算法

3.1 引言

3.2 相关的模式挖掘算法

3.3 基于NSJEP-list的SJEP挖掘算法

3.4 实验结果及分析

3.5 本章小结

第4章 一种基于extend-SJEP的不平衡数据集分类算法

4.1 引言

4.2 面向不平衡数据集的分类算法

4.3 基于extend-SJEP的不平衡数据集的分类算法

4.4 实验结果及分析

4.5 本章小结

结论

参考文献

附录A 攻读硕士学位期间发表的学术论文

致谢

展开▼

摘要

强跳跃显露模式(Strong Jumping Emerging Pattern,SJEP)是近年来提出的一种具有良好区分能力的区分模式,基于SJEP的分类算法能取得较高的分类准确度,因此SJEP逐渐成为分类算法中一个重要的研究方向。由于目前SJEP的挖掘算法大部分都是基于树结构的,因此造成挖掘算法在时间和空间上消耗较大的问题;同时,在不平衡数据集的领域,SJEP无法表现出在普通数据集中展现出的良好的区分能力,特别是在正类的分类中。因此,本文针对SJEP的挖掘及分类算法进行了相关研究,主要工作如下:
  针对基于树结构的SJEP挖掘算法存在的时间和空间消耗较大的问题,设计了一种新的数据结构——NSJEP-list,并基于该结构,提出一种新的SJEP挖掘算法——PPSJEP。该算法首先遍历数据集构建一颗PPSJEP-树,然后构造满足条件的1-项集的NSJEP-lists以代替PPSJEP-树,最后,通过对1-项集的NSJEP-lists的交叉迭代得到更长项集的NSJEP-lists,从而挖掘出所有的强跳跃显露模式。实验表明,基于NSJEP-list的挖掘算法可以有效地过滤掉冗余的JEP,并且,挖掘效率较传统的基于树结构的SJEP挖掘算法更高。
  在不平衡数据集中,由于从正类样本中挖掘出的模式不仅数量少,而且所对应的支持度也较负类偏小,这使得在分类过程中对正类的分类十分不利。针对这一问题,提出一种扩展的SJEP模式(extend-SJEP),该模式在正类中可以挖掘到一些额外的具有良好区分能力的模式;基于上述模式,提出一种改进的基于SJEP的分类算法,该算法通过对大类和小类分别赋予不同的权值,来降低传统的基于SJEP的分类算法中分类结果过度倾向于大类的问题。实验表明,这种扩展的SJEP模式和改进后的分类算法在类不平衡的情况下都表现出更优的区分能力,特别是在对少数类的分类中。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号