首页> 中文学位 >基于粗糙集理论的增量式学习算法研究
【6h】

基于粗糙集理论的增量式学习算法研究

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 论文选题背景

1.2 国内外增量式算法的研究现状

1.3 论文主要工作

1.4 论文组织结构

第二章 粗糙集理论基础

2.1 粗糙集的基本概念

2.1.1 知识与不分明关系

2.1.2 粗糙集与近似

2.1.3 近似精度

2.1.4 决策表

2.1.5 约简与核

2.2 不确定性度量方法

2.2.1 决策表的不确定性度量

2.2.2 决策规则的不确定性度量

2.4 小结

第三章 基于粗糙集的增量式学习算法

3.1 引言

3.2 基于粗糙集的增量式规则获取算法

3.2.1 新样本的分类

3.2.2 新样本的学习

3.3 基于粗糙集理论的增量式学习算法

3.3.1 阈值和参数的设定

3.3.2 算法描述

3.4 实验测试

3.5 小结

第四章 基于粗糙集和规则树的自主式增量学习算法

4.1 引言

4.2 规则树的建立

4.3 规则树的更新

4.4 实验测试

4.4.1 实验相关说明

4.4.2 实验结果对比

4.6 小结

第五章 基于识别反馈和增量学习的电子邮件过滤方法

5.1 引言

5.2 电子邮件过滤系统中的粗糙集模型

5.3 基于识别反馈和增量学习的电子邮件过滤方法

5.5 实验测试

5.5.1 实验一

5.5.2 实验二

5.6 小结

第六章 总结及未来的工作

6.1 总结

6.2 未来的工作

致 谢

攻硕期间从事的科研工作及取得的研究成果

参考文献

展开▼

摘要

随着数据库技术的发展和应用,社会各个部门积累了大量的数据资料,数据挖掘是发现这些数据背后蕴涵的知识的重要手段。但是这些数据信息每天都在不断增加,如果在每次数据库更新之后都要对全部数据进行重新挖掘,将耗费大量的资源,这导致对增量式挖掘算法的迫切需求。将增量式学习算法与数据库的更新相结合,渐进式的对已有知识进行更新,避免对数据进行重新学习是增量式知识获取方法的主要思想。
   粗糙集(又称Rough Set、Rough集、粗集)是数据挖掘的方法之一,它是一种处理不精确、不确定和模糊数据的新型数学工具,它能有效地从数据本身提供的信息中发现有效的、潜在的知识。近年来该理论成功地在机器学习、数据挖掘、智能数据分析等领域得到了广泛应用。
   本文主要对基于粗糙集理论的增量式规则获取方法进行研究:
   首先,针对已有的基于粗糙集的增量式学习算法IRAA(IncrementalRule Acquisition Algorithm)不能很好地解决的情形(即:新样本与原始规则集完全矛盾和类完全矛盾,或者新样本与原始规则集部分矛盾、类部分矛盾或类匹配,且在属性约简属性上,信息系统中能找到与新样本相同的样本)进行进一步的研究工作,提出一种改进的增量式学习算法IAIL(ImproveAlgorithm for Incremental Learning)。该算法在IRAA算法的基础上,将决策表的局部最小确定性作为阈值来控制规则产生,避免了重新训练,提高了算法的效率。实验表明,在保持测试样本正确识别率基本不变的情况下,该算法时间效率高于增量式知识获取算法IRAA,且规则个数有所减少。
   其次,把规则树的思想与IAIL算法相结合,将原始规则集构建为树的形式,同时将规则的可信度作为参数标识每条规则,根据阈值选择可信度最高的规则进行更新。实验结果表明,该方法的时间效率较IAIL算法有很大的提高。
   最后,本文在基于粗糙集的电子邮件过滤模型的基础上,提出基于识别反馈和增量学习的电子邮件过滤方法,该方法在邮件识别过程中增加了反馈环节,并将反馈的错判和未识别信息作为增量样本进行学习,通过动态调整矛盾规则的可信度和阈值控制的方法产生邮件规则,实验证明该方法能有效提高邮件的正确识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号