首页> 中文会议>第二十二届中国数据库学术会议 >基于粗糙集理论的分类规则挖掘方法

基于粗糙集理论的分类规则挖掘方法

摘要

粗糙集(RoughSet,RS)理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据的数学理论,是一种新的处理模糊和不确定性知识的数学工具.它已经成功地应用于诸如机器学习、数据挖掘、智能数据分析以及控制算法等领域.人们对粗糙集的研究主要是在求属性集合的"核"和"约简"的问题上.针对动态变化的数据库JanG.Bazan等人提出了动态约简的思想,针对有序信息表的概念,Yao.Y.Y.等人提出了有序信息表中的约简思想.而对于一般的信息表,人们通常采用分辨矩阵的方法求出决策表的核和约简,这种方法对于数据量比较少的决策表而言是高效可行的,但对于数据量较多的决策表,计算其分辨矩阵所消耗的时间也多,占有的存储空间也大,从而在此系统上进行挖掘所消耗的时间相当惊人,而且得出的结果往往是约简的超集.所以对信息系统的约简求解最小子集成为了粗糙集理论研究中的一个基本问题.在许多情况下,关系数据库系统中的关系可以通过数据预处理很容易地转化为一个决策表,而且其中的决策属性一般也可以根据实际问题来确定.因此本文提出了一个不需要构造分辨矩阵,不用先计算条件属性的核,而是直接从决策表中计算属性的约简得到约简表的算法,它比用构造分辨矩阵的方法所付出的代价要小.本文提出了一个基于粗糙集理论实现分类挖掘的完整计算步骤,并通过一个实例证明了算法的可行性.此外,随着数据的不断更新,属性的动态增长,记录数的增大,计算的时间复杂度会大大增加,这是需要我们深入研究的课题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号