首页> 中文学位 >基于粗糙集理论的数据挖掘方法及其在电力营销决策支持系统中的应用
【6h】

基于粗糙集理论的数据挖掘方法及其在电力营销决策支持系统中的应用

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1问题的提出

1.2选题背景

1.3本文的主要工作

1.4参加的科研项目

第二章基于粗集理论的数据挖掘方法综述

2.1引言

2.2粗集数据分析的基本思想、基本概念及基本问题

2.2.1粗集数据分析的基本思想

2.2.2粗糙集的基本概念

2.2.3粗糙集数据挖掘中若干基本问题

2.3数据挖掘中不确定性问题的研究综述

2.3.1问题背景和领域知识中的不确定性问题

2.3.2原始数据中的不确定性及来自数据处理和分析算法的不确定性

2.4数据挖掘中属性化简问题的研究综述

2.4.1问题背景

2.4.2决策表化简问题综述

2.5粗糙集方法与其它软计算方法的结合综述

2.6小结

第三章粗糙决策规则及其不确定性研究

3.1引言

3.2基于标准粗糙集的粗糙决策规则

3.3以近似度因子作为粗糙决策规则的不确定性量度

3.4以准确度和覆盖度作为粗糙决策规则的不确定性量度

3.5基于信息熵的规则不确定性量度

3.5.1信息熵

3.5.2熵与划分的粒度

3.5.3标准粗糙集意义下的信息熵量度

3.6粗糙决策规则不确定性量度比较分析

3.7粗糙决策规则挖掘过程实例

3.8小结

第四章粗集数据挖掘中属性化简问题研究

4.1引言

4.2属性约简问题的数学描述

4.3基于决策属性支持度的相对属性约简算法

4.3.1条件属性对决策属性的支持度

4.3.2条件属性对决策属性重要性的度量

4.3.3基于决策支持度的属性约简算法的实施

4.4基于遗传算法的属性相对约简算法

4.4.1遗传算法的基本原理

4.4.2遗传约简算法的实施

4.4.3基于信息熵量度的遗传约简算法

4.5基于区分函数与强等价集的属性约简算法

4.5.1区分矩阵与区分函数

4.5.2强等价集与相对属性约简算法

4.6连续属性值离散化方法

4.6.1离散化问题的数学表述及其分类

4.6.2几种常用的简单离散化方法

4.6.3基于决策属性支持度的连续属性离散化方法

4.7基于粗糙集理论的属性值约简算法

4.8实验对比分析

4.9小结

第五章变精度粗集模型及其规则挖掘算法

5.1引言

5.2可变精度粗糙集模型

5.2.1变精度粗糙集模型中的近似集合

5.2.2变精度粗糙集中近似集合的性质

5.2.3集合的相对可区分性

5.3基于VPRS模型的粗糙决策规则

5.3.1β-粗糙决策规则集合

5.3.2变精度粗糙规则集的阈值稳定性

5.3.3β-粗糙规则集的信息熵量度

5.3.4基于变精度粗集模型的粗糙规则挖掘算法

5.4 小结

第六章辽宁电力营销DSS的设计及粗集数据挖掘方法在客户信用分析中的应用

6.1应用背景

6.2电力营销中数据仓库应用系统设计

6.2.1数据仓库技术的产生

6.2.2数据仓库系统的框架结构

6.2.3电力营销系统的功能层次结构

6.2.4系统的总体架构

6.3电力营销系统中数据仓库应用系统的分析

6.3.1 LNDLMIS中业务数据库结构分析

6.3.2数据仓库应用系统的分析主题

6.4粗集数据挖掘方法在LNDLMIS客户信用分析中的应用

6.4.1 LNDLMIS客户信用分析

6.4.2基于粗糙集方法的LNDLMIS客户信用分析

6.5小结

第七章问题与展望

参考文献

致 谢

作者简介

攻读博士学位期间发表的论文

展开▼

摘要

粗糙集理论是由Paw1ak教授于20世纪80年代初提出的一种用于处理不确定性和含糊性知识的数学工具,其基本思想是在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则。它无需提供相关数据集合以外的任何先验信息,适合于发现数据中隐含的、潜在有用的规律,即知识。数据挖掘是20世纪90年代中期兴起的一项新技术,是知识发现过程中的关键步骤,它是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的信息的过程。粗集理论由于其本身具有的一些特点,比如它是数据驱动的方法、无需任何辅助信息,易于处理离散数据并容易与关系型数据库相融和等,因此特别适合于知识发现和数据挖掘的任务。 本文首先介绍了标准粗糙集模型以及基于标准粗糙集模型的粗糙规则集。在粗糙集理论中,粗糙规则集合的不确定性一般是由近似度来度量的,但是以近似度作为粗糙规则集不确定性的量度,仅反映了规则集合的一致性,而未考虑其随机性。鉴于此,我们引进了规则准确度和覆盖度的概念,规则的准确度主要反映的是规则一致性(或不一致性)的情况,而覆盖度反映的是规则随机性的情况。在数据挖掘过程中,我们希望得到既有高准确度又有高覆盖度的规则。进而本文讨论了一类基于信息熵的不确定性量度问题,以信息熵Hdet作为规则不确定性量度,可以使不一致性和随机性这两种不确定性均在一定程度上得到消除,从而可使所获得的规则集具有更好的分类、预测性能。 其次,本文还深入研究了属性化简问题,属性化简是粗集数据挖掘中的核心问题之一,它包括属性约简、属性值约简及连续属性离散化等问题。属性化简的问题是NP-Hard问题,其算法的效率决定了数据挖掘算法的效率。关于属性约简本文提出了几种方法,其中有基于决策属性支持度的启发式约简算法,带有惩罚函数的遗传约简算法,以及基于区分函数与强等价集的属性约简算法等,这些算法的提出均以提高算法效率和改善收敛性为主要目标。另外,本文还提出了改进的属性值约简算法和连续属性离散化方法,用本文所提出的属性值约简算法会使最终的值约简结果得到更进一步的简化,从而使决策规则更加简洁。若将属性约简问题看成是决策表在横向上的化简,那么连续属性离散化即可看成是决策表在纵向上的化简,本文提出的连续属性离散化方法会使划分后的决策表既保持原始分类能力不变又具备较高的约简效率。 标准粗糙集模型在处理某些实际问题过程中经常表现出一定的局限性,如对数据噪声过于敏感,对连续取值或属性值过多的情况不易处理等。针对这些局限,出现了不少标准粗糙集的扩展模型,可变精度粗糙集模型就是其中之一,它通过预置近似精度因子,放松了标准粗糙集的严格的边界定义,从而使模型具有抗噪声的能力。受变精度粗糙集模型的启发,本文构造了变精度粗糙规则集,并给出了其不确定性的信息熵量度HVPRS,HVPRS将不一致性较弱的规则等同于一致性规则,对数据中的少量不一致性忽略不计,克服了标准粗糙规则集对数据噪声过于敏感的缺点,具有一定的容错能力。 最后,本文的研究工作结合了辽宁电力有限公司管理信息系统(LNDLMIS)的开发、设计过程,对于数据仓库环境下的新型电力营销辅助决策支持系统给出了总体设计思想和实现的手段,并结合客户信用分析主题详细论述了粗集数据挖掘方法在客户信用分析中的具体应用过程。通过本文的分析方法,可使客户信用评价问题,不仅面向简单处理层面,而且面向规则获取和知识发现的层面,从而能够更加有效的完成决策支持的任务。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号