基于粗糙集理论的增量式学习算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着数据库技术的发展和应用，社会各个部门积累了大量的数据资料，数据挖掘是发现这些数据背后蕴涵的知识的重要手段。但是这些数据信息每天都在不断增加，如果在每次数据库更新之后都要对全部数据进行重新挖掘，将耗费大量的资源，这导致对增量式挖掘算法的迫切需求。将增量式学习算法与数据库的更新相结合，渐进式的对已有知识进行更新，避免对数据进行重新学习是增量式知识获取方法的主要思想。
　　粗糙集(又称Rough Set、Rough集、粗集)是数据挖掘的方法之一，它是一种处理不精确、不确定和模糊数据的新型数学工具，它能有效地从数据本身提供的信息中发现有效的、潜在的知识。近年来该理论成功地在机器学习、数据挖掘、智能数据分析等领域得到了广泛应用。
　　本文主要对基于粗糙集理论的增量式规则获取方法进行研究：
　　首先，针对已有的基于粗糙集的增量式学习算法IRAA(IncrementalRule Acquisition Algorithm)不能很好地解决的情形(即：新样本与原始规则集完全矛盾和类完全矛盾，或者新样本与原始规则集部分矛盾、类部分矛盾或类匹配，且在属性约简属性上，信息系统中能找到与新样本相同的样本)进行进一步的研究工作，提出一种改进的增量式学习算法IAIL(ImproveAlgorithm for Incremental Learning)。该算法在IRAA算法的基础上，将决策表的局部最小确定性作为阈值来控制规则产生，避免了重新训练，提高了算法的效率。实验表明，在保持测试样本正确识别率基本不变的情况下，该算法时间效率高于增量式知识获取算法IRAA，且规则个数有所减少。
　　其次，把规则树的思想与IAIL算法相结合，将原始规则集构建为树的形式，同时将规则的可信度作为参数标识每条规则，根据阈值选择可信度最高的规则进行更新。实验结果表明，该方法的时间效率较IAIL算法有很大的提高。
　　最后，本文在基于粗糙集的电子邮件过滤模型的基础上，提出基于识别反馈和增量学习的电子邮件过滤方法，该方法在邮件识别过程中增加了反馈环节，并将反馈的错判和未识别信息作为增量样本进行学习，通过动态调整矛盾规则的可信度和阈值控制的方法产生邮件规则，实验证明该方法能有效提高邮件的正确识别率。

著录项

作者
徐丹;
展开▼
作者单位

重庆邮电大学;

展开▼
授予单位重庆邮电大学;
学科计算机应用技术
授予学位硕士
导师姓名于洪;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;TP393.098;
关键词
粗糙集理论; 增量式; 学习算法; 数据挖掘; 样本; 知识获取算法; 电子邮件; 识别率; 矛盾; Incremental Learning; 数据库技术; 可信度; 规则集; 信息; 时间效率; 阈值选择; 实验; 反馈; 属性约简; 重新学习;

相似文献

中文文献
外文文献
专利

1. 基于粗糙集理论的模糊聚类算法研究 [J] . 张红霞 ,吴桐桐 ,冷雪亮 . 软件 . 2019,第009期
2. 基于粗糙集理论的遗传属性约简算法研究 [J] . 孙玲芳 ,许锋 ,周家波 . 江苏科技大学学报（自然科学版） . 2014,第003期
3. 基于粗糙集理论的公交信号优先算法研究 [J] . 杨柳 ,彭小波 ,王当仁 . 交通标准化 . 2013,第021期
4. 基于粗糙集理论的图像增强算法研究 [J] . 谢霖铨 ,吴谭 ,袁德林 . 计算机与数字工程 . 2013,第002期
5. 基于粗糙集理论的文本分类算法研究 [J] . 林殉 ,李志蜀 ,周勇 . 计算机科学 . 2011,第011期
6. 基于粗糙集理论和关联规则的腐蚀区域纹理特征检测算法研究 [C] . Yin Jidong ,殷积东 ,Liu Bo . 第五届图像图形技术与应用学术会议 . 2010
7. 基于粗糙集理论的属性约简与决策树分类算法研究 [A] . 石凯 . 2014

基于粗糙集理论的增量式学习算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅