F-粗糙集不确定性的度量及粗糙集算法的优化

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

粗糙集理论是一种行之有效的数学工具，可以处理不精确、含糊和不完整信息。在数据挖掘、机器学习和模式识别等领域，粗糙集理论广泛应用于分类和特征选择（属性约简）。属性约简的方法包括正域、差别矩阵和差别函数、信息熵以及属性重要度等等。
　　本研究的第一个要点是F-粗糙集不确定性的度量。F-粗糙集是一种针对信息表簇或决策表簇的新的粗糙集模型。本文利用F-粗糙集模型中上、下近似的思想，定义了不确定性概念漂移的一些度量，包括概念的上、下近似漂移量，概念的上、下近似偶合度等，并初步探讨了它们的性质。第二个要点是属性约简算法的优化。在各式各样的粗糙集约简算法里划分占去了大量时间。同时，比较操作主导了划分过程。早期的采用蛮力运算策略的约简算法，在划分时需要很多时间来执行比较操作。这在约简大型决策表时是不可接受的。本文提出了一种哈希划分的方法，可以高效解决划分问题同时大幅减少比较运算的次数。本文使用哈希划分改善了决策表划分，并且和以往论文中常常采用的基于排序的划分方法做了详尽对比。通过哈希划分，耗时的比较运算明显减少，因而，很多粗糙集算法的运算效率得以提升。实验表明此方法适合于获取正域、决策表核属性、基于正域的Pawlak约简以及基于属性重要度矩阵的并行约简。本文的另一个亮点是对大数据的测试。不少声称测试了大数据的文章仅测试了10万条以下的决策表的表现。本文不仅加入了百万条数据集的测试结果，还人工合成了一张近40000000条数据、总容量为3.2GB的数据表然后进行了约简测试。最后，哈希划分同样可以改善并行约简。并行约简可以获取决策表的近似约简，实验表明加入了哈希划分的新算法优于原有算法的表现。

著录项

作者
裴明华;
展开▼
作者单位

浙江师范大学;

展开▼
授予单位浙江师范大学;
学科计算机软件与理论
授予学位硕士
导师姓名邓大勇;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
数据挖掘; 属性约简; 哈希划分; 程序语言;

相似文献

中文文献
外文文献
专利

1. F-粗糙集方法对概念漂移的度量 [J] . 邓大勇 ,裴明华 ,黄厚宽 . 浙江师范大学学报（自然科学版） . 2013,第003期
2. 模糊邻域粗糙集的决策熵不确定性度量 [J] . 樊雲瑞 ,张贤勇 ,杨霁琳 . 计算机工程与设计 . 2021,第005期
3. 邻域概率粗糙集的不确定性度量 [J] . 周艳红 ,张迪 ,莫智文 . 四川师范大学学报（自然科学版） . 2021,第001期
4. 不完备邻域粗糙集的不确定性度量和属性约简 [J] . 姚晟 ,汪杰 ,徐风 . 计算机应用 . 2018,第001期
5. 基于严凹函数的粗糙集不确定性度量 [J] . 黄国顺 ,文翰 . 软件学报 . 2018,第011期
6. 推广粗糙集模型下粗糙集与粗糙分类的模糊性度量 [C] . 梁吉业 ,王江 ,苗夺谦 . 第一届中国Rough集与软计算学术研讨会 . 2001
7. 双直积论域粗糙集的不确定性度量 [A] . 邓切 . 2020

F-粗糙集不确定性的度量及粗糙集算法的优化

目录

摘要

著录项

相似文献

相关主题

期刊订阅