首页> 中文学位 >三支决策粗糙集风险最小化阈值自动设置和邮件分类研究
【6h】

三支决策粗糙集风险最小化阈值自动设置和邮件分类研究

代理获取

目录

声明

摘要

第一章 绪论

1.1 本课题的研究背景和意义

1.2 国内外研究现状

1.2.1 研究现状

1.2.2 问题的提出和目标

1.3 本文的主要工作

1.4 论文的组织结构

第二章 相关理论和关键技术

2.1 经典粗糙集

2.2 概率粗糙集模型

2.3 贝叶斯公式与决策过程

2.3.1 贝叶斯公式

2.3.2 贝叶斯决策过程

2.4 决策粗糙集

2.4.1 决策粗糙集模型及公式推导

2.4.2 三支决策的决策粗糙集理论

2.4.3 决策风险最小化问题

2.5 两种基于风险最小化求解三支决策粗糙集阈值算法

2.5.1 自适应算法求解阈值

2.5.2 模拟退火算法求解阈值

2.6 人工鱼群算法

2.6.1 鱼群行为描述

2.6.2 人工鱼群算法寻优的基本原理

2.7 本章小结

第三章 利用人工鱼群算法求三支决策粗糙集阈值

3.1 基于人工鱼群的风险最小化三支决策粗糙集阈值求解

3.1.1 数据的预处理

3.1.2 解空间

3.1.3 明氏距离

3.1.4 距离的表示以及与阈值的关系

3.1.5 人工鱼的几种行为的算法描述

3.2 具体过程

3.3 仿真实验

3.3.1 实验环境

3.3.2 实验数据

3.3.3 评价标准

3.3.4 实验结果与分析

3.4 本章小结

第四章 基于风险最小化的三支决策邮件分类

4.1 基于风险最小化的DTRS模型的邮件分类算法

4.2 仿真实验

4.3 实验评价指标

4.4 实验结果与分析

4.5 本章小结

第五章 总结与展望

5.1 总结

5.2 本文贡献和创新之处

5.3 展望

参考文献

致谢

攻读硕士学位期间发表的论文

展开▼

摘要

粗糙集理论是一种有效的数学工具,能针对模糊和不确定性数据进行分析和处理,在数据挖掘和机器学习等领域得到了广泛的应用。而经典的粗糙集判断一个对象是否属于某一类时,严格要求对象所属等价类的所有对象都要属于。因此该模型对噪音数据非常敏感,泛化能力不强,容错性不足。针对这一问题,人们提出了许多扩展模型,决策粗糙集模型就是其中之一。该模型引入了贝叶斯决策理论,并用一对阈值(α,β)将论域划分为正域、负域和边界域。
  三支决策是在处理问题时,采用接受,不接受和不能做出判断这三种决策方式。三支决策与决策粗糙集的三个域具有天然的联系,因此如何选择阈值,使决策的总体代价最小,就成为一个重要的问题。然而,阈值往往需要由具备专业知识的专家给定,从而阻碍了三支决策粗糙集模型的实际应用。为此,提出了利用人工鱼群算法自动求最优阈值的算法。该算法不需要领域专家设定阈值,而是以决策风险最小化为目标函数,在三支决策粗糙集模型中,利用人工鱼群从所给定的数据中学习到合适的阈值。利用UCI数据库中的部分数据集,对所提出的算法进行了实验。实验结果表明,该算法在运行时间和学习到的阈值均优于现有的自适应算法和模拟退火算法。
  为了验证算法在实际应用中的有效性,将该算法应用到电子邮件的分类中。使用UCI机器学习数据库的spambase数据集,利用人工鱼群算法从数据集中自动学习阈值。利用三支决策粗糙集模型,将邮件划分为正常邮件、垃圾邮件和需要进一步确认的可疑邮件。实验结果表明,该算法能有效提高邮件分类的精度,降低误分率。

著录项

  • 作者

    胡盼;

  • 作者单位

    广西大学;

  • 授予单位 广西大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 秦亮曦;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.098;
  • 关键词

    电子邮件; 粗糙集; 三支决策; 阈值; 分类精度;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号