首页> 中文学位 >关于粗集的不完备信息系统数据挖掘方法研究
【6h】

关于粗集的不完备信息系统数据挖掘方法研究

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1本文的研究背景和意义

1.2不完备信息系统下的数据挖掘

1.2.1不完备信息系统的研究现状及分析

1.2.2数据离散化的研究现状及分析

1.3本文的研究内容及主要创新点

1.4本文的组织结构

第2章粗糙集理论基础

2.1粗糙集理论的研究现状

2.2粗糙集的基本概念

2.3变精度粗糙集

第3章不完备信息系统的粗糙集拓展模型

3.1不完备信息系统

3.1.1不完备信息系统的概念

3.1.2空值的常见常见处理方法及局限性

3.2不完备信息系统下的粗糙集模型

3.3基于改进型限制容差关系的粗糙集模型

3.4本章小结

第4章基于粗糙集的连续属性离散化

4.1连续属性离散化

4.1.1离散化的意义

4.1.2离散化问题的描述

4.2现有的离散化方法

4.2.1离散化方法的分类

4.2.2几种主要的离散化方法

4.3改进的基于信息增益的连续属性离散化算法

4.3.1信息熵

4.3.2基于信息增益的连续属性离散化算法

4.3.3实验分析

4.4本章小结

第5章结论

5.1本文工作总结

5.2未来工作的思考

参考文献

攻读学位期间公开发表论文

致谢

研究生履历

展开▼

摘要

粗糙集理论是上世纪八十年代初由波兰数学家Pawlak首先提出的一种新的处理不精确、不完全与不相容知识的数学理论。其主要思想是利用已知的知识或信息来近似不精确的概念或现象。自上世纪九十年代以来,粗糙集在理论上不断完善,在应用上广泛扩展,己逐渐成为国际学术界的研究热点之一。 在经典粗糙集中,论域上的等价关系起着至关重要的作用。但在现实中,论域上的二元关系经常不是等价的,此时经典粗糙集模型的应用受到限制。在不完备信息系统中,建立一种什么样的二元关系,是进一步研究不完备信息系统的粗计算、知识约简以及规则提取的基础。本文从经典粗糙集模型中的等价关系入手,把多数包含关系引入到不完备信息系统中定义了一种变精度模型,对不完备信息系统的粗糙集模型进行了扩充,这种扩展模型是原来模型的推广和改进,既保留了原来模型的优点又丢弃了原来模型的缺陷,增强了粗糙集模型的抗噪声的能力。 实际数据库中存在较多的连续型数值属性,而现有的很多数据挖掘方法只能处理离散型的属性,因而需要对连续属性进行离散化,已经出现了多种连续属性离散化算法,且各有特色和优劣。本文以信息增益作为属性重要性的度量方法,以基于最小描述长度原理的决策系统信息熵作为离散化过程的评价函数,提出了一种改进的连续属性离散化算法。该算法不仅考虑了连续属性的属性值之间的序关系,也考虑了属性值之间的相对距离关系。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号