首页> 中文学位 >代价敏感的决策粗糙集属性约简研究
【6h】

代价敏感的决策粗糙集属性约简研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 本课题的研究背景和意义

1.2 国内外的研究现状

1.2.1 粗糙集研究现状

1.2.2 决策粗糙集研究现状

1.2.3 模糊粗糙集研究现状

1.2.4 代价敏感研究现状

1.3 本文的主要工作

1.4 本文的组织结构

第二章 相关理论和关键技术

2.1 数据预处理

2.2 粗糙集模型

2.2.1 经典粗糙集模型

2.2.2 变精度粗糙集模型

2.2.3 决策粗糙集模型

2.2.4 模糊决策粗糙集模型

2.3 属性约简理论

2.3.1 粗糙集属性约简基本理论

2.3.2 Pawlak粗糙集属性约简

2.3.3 决策粗糙集属性约简

2.3.4 模糊决策粗糙集属性约简

2.4 朴素贝叶斯算法

2.5 模拟退火算法

2.5.1 模拟退火算法的产生

2.5.2 模拟退火算法

2.6 模糊集理论

2.7 本章小结

第三章 测试代价敏感的决策粗糙集正域约简

3.1 代价敏感

3.1.1 代价敏感基础理论

3.1.2 代价敏感粗糙集基本概念

3.2 PRDTRS算法

3.3 测试代价敏感

3.4 TCSPR算法

3.5 实验设计与结果分析

3.5.2 来源数据选择

3.5.3 评价标准

3.5.4 实验结果分析

3.6 本章小结

第四章 模糊决策粗糙集代价敏感属性约简

4.1 QuickReduct算法

4.2 模糊决策粗糙集模型代价计算

4.3 COSAR算法

4.4 实验设计与结果分析

4.5 本章小结

第五章 基于TCSPR算法的邮件分类应用

5.1 TCSPR邮件分类主要步骤

5.2 TCSPR邮件分类算法

5.3 实验设计与结果分析

5.3.1 评价标准

5.3.2 来源数据选择

5.3.3 实验结果分析

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

决策粗糙集分类中的关键技术包括数据预处理、属性约简、分类算法等,在这些关键技术之中,属性约简占据着最重要的位置,属性约简的效果很大程度上影响着数据的最终分类效果。鉴于此,本文着重研究了分类中的决策粗糙集属性约简和模糊决策粗糙集属性约简两个关键技术,以及具有实际意义的代价敏感方法。  通过研究代价敏感的相关理论,将基于测试代价和误差代价的代价敏感方法融入到决策粗糙集正域约简PRDTRS(Positive Region-based heuristic reduction algorithm for DTRS)模型中,并结合模拟退火算法,提出了一种基于测试代价的决策粗糙集正域约简方法—TCSPR算法。实验结果表明,该正域约简方法能在多项式时间内找到一个属性更少、测试代价更小的正域约简。  经典的决策粗糙集属性约简算法PRDTRS只能处理离散型数据,而模糊决策粗糙集正域约简算法(The Fuzzy-rough QuickReduct Algorithm,QuickReduct)存在着运行时间长,并且没有考虑属性的代价,只从数学的角度考虑约简等缺陷。为弥补这些不足之处,提出了一种集代价敏感和模糊思想的模糊决策粗糙集属性约简算法COSAR。本算法将相似度隶属函数引入到决策粗糙集的上下近似集计算中,再结合代价敏感方法,进行模糊决策粗糙集代价敏感属性约简。通过仿真实验,验证了本算法能在更短的时间内找到总代价更低的约简属性集。  通过对邮件分类技术的研究,结合前文提出的TCSPR算法,提出了TCSPR邮件分类方法,并以UCI数据库的电子邮件数据集Spambase为基础,随机选取训练样本和测试样本进行了仿真实验,并给出了实验结果。实验结果表明,本文提出的TCSPR邮件分类算法不仅能有效降低获取特征词的测试代价,并能在对邮件进行较为正确的分类情况下节省大量时间。实验验证了TCSPR邮件分类算法在邮件分类领域的有效性,并且能提高分类效率,为邮件分类提供了一种新的方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号