首页> 中文学位 >代价敏感粒计算若干方法的研究
【6h】

代价敏感粒计算若干方法的研究

代理获取

目录

廖淑娇--博士毕业论文20180704

廖淑娇--博士论文封面署名版

廖淑娇独创声明扫描(修改版)

第一章 绪论

第二章 预备知识

第三章 混合型数据的属性与属性值粒度同步选择的方法

第四章 多粒度的属性与属性值粒度同步选择的方法

第五章 邻域粗糙集中基于不一致邻域的属性约简方法

第六章 决策粗糙集中代价敏感的属性约简方法

第七章 全文总结与展望

致 谢

参考文献

展开▼

摘要

代价敏感学习是数据挖掘和机器学习领域的一大挑战性问题,由于其在数据处理过程中考虑了现实的代价信息,因此具有较强的实际意义。粒计算是信息处理和知识发现的一种新的研究方法,它能把一个复杂的问题转化为若干比较简单的问题,从而有助于复杂问题的分析和解决。 将代价敏感学习与粒计算相结合,是解决实用性问题的一个有效途径。本文主要基于邻域和粗糙集理论,对代价敏感粒计算的若干关键问题进行研究,主要的创新性研究成果概述如下: 1.提出了一系列基于观测误差和可变代价的属性与属性值粒度同步选择的方法(为了方便,本文中有时简记“属性与属性值粒度”为“属性&粒度”)。现有的代价敏感属性选择(在粗糙集中也称属性选择为属性约简)研究中只有极少数同时考虑了属性值粒度的选择,并且它们都只考虑了单重的粒度,也没有涉及到混合型数据和代价受限的情况。此外,已有的代价敏感学习中经常假设属性的测试代价和对象的误分类代价都是固定不变的,但现实中测试代价往往是可变的,它们和属性值的粒度之间存在着密切的关系,而误分类代价的可变性则跟所考虑的对象有关。本文根据现实情况,用属性值的观测误差的置信水平来衡量其粒度,充分考虑了该误差置信水平与测试代价和误分类代价这三者之间的关系,并讨论了数据处理中平均总代价(即论域中对象的总代价的平均值)的计算方法。在此基础上,以最小化平均总代价为目标,基于观测误差和可变代价分别研究了单粒度和多粒度的属性与属性值粒度同步选择的方法,具体如下: (1)针对混合型数据建立了一个基于误差置信水平的自适应邻域模型,并根据实际情况讨论了几种可变的测试代价和误分类代价函数;在此基础上分别针对测试代价受限和不受限两种情形提出了较为高效的单粒度的属性与属性值粒度同步选择的算法;在多个UCI数据集上的实验结果验证了算法的有效性。特别地,文中同时探讨了不同的代价背景对所选择的最优属性子集和最优属性值粒度的影响,从而为决策制定提供了可行的方案。(第3章) (2)考虑到实际应用中对不同的属性可能有不同的属性值粒度要求,首次探讨了多粒度的代价敏感的属性与属性值粒度同步选择的方法。首先建立了基于误差置信水平向量的邻域粗糙集模型,并给出了属性&粒度对(即属性与属性值粒度的有序对)的重要度函数,从而提出了高效的多粒度的属性与属性值粒度同步选择的算法。实验结果验证了所提出的多粒度方法相比已有的单粒度方法在解决实际问题方面具有明显的优越性。(第4章) 2.提出了邻域粗糙集中基于不一致邻域的属性约简方法。首先介绍了不一致邻域的概念,并探讨它跟邻域粗糙集中已有的基本概念的关系,从而得到上下近似集、正区域、边界区域等的新表示方式,再利用不一致邻域的性质分别设计了高效的代价不敏感和测试代价敏感的属性约简算法。通过理论和实验分析发现,相比运用传统的邻域,用不一致邻域来进行邻域粗糙集中的相关计算具有一定的优越性。(第5章) 3. 提出了决策粗糙集中代价敏感的属性约简方法。由于决策粗糙集中正区域有可能随着属性的增加反而缩小,这给该粗糙集中的属性约简带来了一定的困难。本文根据决策粗糙集的这一特点,在综合考虑决策代价和测试代价的基础上,建立了该粗糙集中代价敏感的属性约简方法的理论模型,特别是给出了代价敏感的属性子集重要度函数,并以最小化平均总代价为目标分别提出了回溯的和启发式的属性约简算法。实验结果验证了所提出算法的有效性。(第6章) 综上所述,本文研究了代价敏感粒计算的若干关键问题。 对于每个问题,分别建立了相应的理论模型,并提出了有效的算法,再做实验加以验证。 该研究丰富了代价敏感粒计算的理论与方法体系,也为今后的研究工作奠定了重要基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号