技术领域
本发明设计粗糙集理论约简技术领域,具体涉及一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法。
背景技术
Pawlak粗糙集理论是由波兰学者Pawlak在20世纪80年代初提出的一种解决模糊不确定性和进行数据分析的有力的数学工具,现也成功应用于数据挖掘、知识发现、不确定性推理、故障诊断等领域。
经典的粗糙集理论主要是在单粒度完备系统下基于等价关系进行的,但对实际应用中一些数据缺失、属性复杂的情况,经典的粗糙集处理具有一定的局限性,因此一些学者提出了不完备系统下的粗糙集模型。同时为了更好的解释粗糙集中的正域、负域和边界域,加拿大学者Yao最早提出了决策粗糙集理论,将贝叶斯决策理论引入到传统的粗糙集中,使得最终作出的决策损失代价最小。相对于传统的粗糙集,决策粗糙集对噪声数据具有容忍效果,同时基于此模型Yao又进一步提出一种特殊的三支决策方法。
通过研究发现,现有的研究单粒度粗糙集和单粒度决策粗糙集以及多粒度粗糙集和多粒度决策粗糙集主要是基于完备的等价关系下进行的,对数据缺失的情况处理较为困难。大都只在完备信息系统等价下进行决策分析,没有考虑信息缺失的情况,对属性约简较为困难。同时,乐观多粒度决策粗糙集较为宽松,悲观多粒度较为严格,以及乐观-悲观多粒度决策粗糙集的局限性以及不可行性。
发明内容
针对现有技术中存在数据缺失的情况下进行决策分析困难的问题,本发明提供一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法。
本发明是通过以下技术方案来实现:
一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法,其特征在于,包括以下步骤:
S1:定义核属性为空,判断数据表中是否有缺失值;若有缺失值,分类时,缺失值被赋予当前所处分类元素的值,若无缺失值,则按照各自的属性值进行分类;求解U/D和U/TOR
S2:求解容差关系下的等价类包含在X
S3:根据三支决策计算α,将S2中比例大于α的元素按照下近似分布定义求出下近似分布集合;
S4:计算每个属性的重要度,并选取重要度大于零的属性进行赋值到核属性中;
S5:通过分别计算每个核属性的近似分布质量,将近似分布质量与全局的分布质量结果对比,若相同,则结束,得到决策粗糙集属性约简结果;
S6:若S5中的分布质量结果对比不同,则将S5中的重要度值较大的属性作为起始点,根据外部重要度定义,继续求解外部重要度值较大的属性,直至近似分布质量与全局的分布质量结果对比相同;得到决策粗糙集属性约简结果。
进一步,所述S1分类过程中,根据粗糙集的本质解决模糊不确定性的问题,将问题划分为上下近似,然后继续划分为正域、负域和边界域,定义如下,
下近似:
上近似:
正域:POS(X)=
负域:
边界域:
进一步,将粗糙集扩展到完备关系下的乐观多粒度粗糙集和悲观多粒度粗糙集中,其中乐观多粒度粗糙集和悲观多粒度粗糙集的上下近似分别为:
乐观多粒度下近似:
乐观多粒度上近似:
悲观多粒度下近似:
悲观多粒度上近似:
其中悲观的计算过程中必须满足所有条件,乐观的计算过程中满足任意一个条件即可。
进一步,所述S2和S3中的求解容差关系下的等价类包含在X
定义决策粗糙集为在不完备系统下,S=(U,AT),AT是一个非空集合,b1,…,Bm是AT的m个属性子集,
其中p(X|[x]
设状态集为{X,~X},分别表示{x∈X和
将悲观多粒度粗糙集、乐观多粒度粗糙集和决策粗糙集进行不同的组合,形成悲观-乐观多粒度决策粗糙集和乐观-悲观多粒度决策粗糙集,定义如下:
悲观-乐观多粒度决策粗糙集下近似:
悲观-乐观多粒度决策粗糙集上近似:
乐观-悲观多粒度决策粗糙集下近似:
乐观-悲观多粒度决策粗糙集上近似:
进一步,所述S4粒度重要度的定义为:
在不完备的决策信息系统中,
设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
若
6.根据权利要求5所述一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法,其特征在于,
在S5中不完备粒度B在粒度集AT关于d的悲观-乐观和乐观-悲观多粒度决策粗糙集内部属性重要的性度量分别定义为:
进一步,在所述S5中在不完备的决策信息系统,设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
进一步,在所述S6中求解外部重要度值较大的属性定义为:
不完备的决策信息系统设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,
下近似分布定义为:一个不完备的决策信息系统设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
若
与现有技术相比,本发明具有以下有益的技术效果:
本发明一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法,将粗糙集属性约简的完备系统扩展到不完备系统,将现有技术中的等价关系替换为容差关系,将悲观多粒度决策粗糙集和乐观多粒度决策粗糙集的属性约简扩展到悲观-乐观多粒度决策粗糙集和乐观-悲观多粒度决策粗糙集的属性约简,同时通过近似分布质量与全局的分布质量结果对比相同,证明了悲观-乐观多粒度决策粗糙集在此方法的有效性,具体的,是在进行属性分类时,将缺失属性的值与分类属性的值保持一致,增加了计算的准确性,保证了缺失属性的多种情况。同时相较于现有的属性约简方法主要分为基于信息熵的属性约简、基于区分矩阵的属性约简、以及基于属性重要度的属性约简方法。本方法是从属性重要度角度出发进行属性约简,因而方便直观,计算简单,同时为了增加属性约简的精确度,加入了下近似分布质量概念,又将属性重要度细分为内部重要度和外部重要度,使得属性约简过程简便、计算结果更加的精确。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
本发明一种不完备系统下悲观-乐观多粒度决策粗糙集属性约简方法,包括以下步骤:
S1:定义核属性为空,判断数据表中是否有缺失值;若有缺失值,分类时,缺失值被赋予当前所处分类元素的值,若无缺失值,则按照各自的属性值进行分类;求解U/D和U/TOR
下近似:
上近似:
正域:POS(X)=
负域:
边界域:
S2:求解容差关系下的等价类包含在X
S3:根据三支决策计算α,将S2中比例大于α的元素按照下近似分布定义求出下近似分布集合;
具体的,将粗糙集扩展到完备关系下的乐观多粒度粗糙集和悲观多粒度粗糙集中,其中乐观多粒度粗糙集和悲观多粒度粗糙集的上下近似分别为:
乐观多粒度下近似:
乐观多粒度上近似:
悲观多粒度下近似:
悲观多粒度上近似:
其中悲观的计算过程中必须满足所有条件,乐观的计算过程中满足任意一个条件即可;
进一步的,所述S2和S3中的求解容差关系下的等价类包含在X
定义决策粗糙集为在不完备系统下,S=(U,AT),AT是一个非空集合,b1,…,Bm是AT的m个属性子集,
其中p(X|[x]
设状态集为{X,~X},分别表示{x∈X和
将悲观多粒度粗糙集、乐观多粒度粗糙集和决策粗糙集进行不同的组合,形成悲观-乐观多粒度决策粗糙集和乐观-悲观多粒度决策粗糙集,定义如下:
悲观-乐观多粒度决策粗糙集下近似:
悲观-乐观多粒度决策粗糙集上近似:
乐观-悲观多粒度决策粗糙集下近似:
乐观-悲观多粒度决策粗糙集上近似:
同时,在S3中求解近似集合定义为:
下近似分布定义为:一个不完备的决策信息系统设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
S4:计算每个属性的重要度,并选取重要度大于零的属性进行赋值到核属性中;
具体的,粒度重要度的定义为:
在不完备的决策信息系统中,
设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
若
S5:通过分别计算每个核属性的近似分布质量,将近似分布质量与全局的分布质量结果对比,若相同,则结束,得到决策粗糙集属性约简结果;
具体的,不完备粒度B在粒度集AT关于d的悲观-乐观和乐观-悲观多粒度决策粗糙集内部属性重要的性度量分别定义为:
进一步的,在所述S5中在不完备的决策信息系统,设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
S6:若S5中的分布质量结果对比不同,则将S5中的重要度值较大的属性作为起始点,根据外部重要度定义,继续求解外部重要度值较大的属性,直至近似分布质量与全局的分布质量结果对比相同;得到决策粗糙集属性约简结果。
具体的,在所述S6中求解外部重要度值较大的属性定义为:
不完备的决策信息系统设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,
下近似分布定义为:一个不完备的决策信息系统设信息系统S=(U,AT,V,f),B1,…,Bm是AT的m个属性子集,U/D={D
若
本发明提供的一种优选实施例为:如下给定一个数据表,寻找重要性较大的因素S={U,AT,V,f}如表1,论域U={x
表1不完备决策信息表
步骤1:根据步骤1,进行1判断是否含有缺失值,然后对数据进行分类。由上表可知,在B1条件下,属性X6缺失,用*表示,其值在分类时,与其他元素值保持一致。同理,在B3条件下,属性X10缺失,用*表示,其值在分类时,与其他元素值保持一致。
下表是不同条件下各元素分类
表2各元素在不同条件下的分类
由上表可知,在属性缺失的情况下,将缺失值赋予各个元素的值,可以进行准确的分类。同时下一步从整体计算各个容差关系下的分类.
U/TOR
U/TOR
U/TOR
U/TOR
以上的计算可以对各个元素清楚的定位与分类,为下一步求解提供帮助.以下则是通过贝叶斯定理步骤2求解各对象在不同决策属性下的比例,将求出的结果与α值进行比较,得出下近似分布集合。
表3各元素在D1决策下的概率
表4各元素在D2决策下的概率
步骤3根据α,假设
步骤4根据内部属性重要度求出各个条件下内部重要度值
步骤5,6根据上述的结果可以得出,B1和B3的内部属性重要度较大,然后根据近似分布质量定义,求解出B1和B3的近似分布质量,
步骤7根据以上的结果可以得出,B1和B3的外部属性重要度值较大,故选择B1,B3,求解
这一部分是求解乐观-悲观的情况,步骤同上。
根据步骤2各对象在不同决策属性下的比例,根据
由下近似分布可知,在乐观-悲观多粒度决策粗糙集下,下近似分布较为宽松,继续计算乐观-悲观多粒度决策粗糙集的内部属性重要度:
由以上结果可以看出,乐观-悲观的多粒度决策粗糙集的内部重要度和乐观-悲观的内部重要度相同。所以仍判断B1和B3的近似分布质量,
选择B1,B3为
通过以上的实例证明,在不完备容差关系下,内外部属性重要度可进行有效的属性约简,在
机译: 一种计算机显示图像的放大方法,包括在系统不辅助放大镜时按下功能键,从而向计算机提供放大说明,以激活放大镜以放大图像。
机译: 车辆碰撞模拟测试装置和方法,以及一种用于在不破坏车辆的情况下模拟乘客房间加速的车辆碰撞模拟测试装置的控制系统
机译: 分子转化的方法和系统:一种用于在不释放二氧化碳的情况下将废物转化为能源和原料的过程