首页> 中国专利> 一种基于粗糙集理论和D-S证据理论的温室智能决策方法

一种基于粗糙集理论和D-S证据理论的温室智能决策方法

摘要

本发明公开了一种基于粗糙集理论和D‑S证据理论的温室智能决策方法,涉及智能农业技术领域,经过模糊C均值聚类处理,在经过求核和粗糙集的属性约简得到处理好的数据;利用粗糙集构建基本概率分配函数,计算温室各影响因素之间的支持程度。运用改进的D‑S证据理论,引入计算得出的BPA基本概率指派矩阵,构建置信度矩阵完成对温室影响因素的组合,得出决策结果。利用传统的针对小样本机器学习的SVM算法,引入BPA基本概率指派矩阵,得出决策结果,并与D‑S证据理论算法进行算法对比验证。

著录项

  • 公开/公告号CN112785004A

    专利类型发明专利

  • 公开/公告日2021-05-11

    原文格式PDF

  • 申请/专利权人 中国计量大学;

    申请/专利号CN202110150119.7

  • 申请日2021-02-03

  • 分类号G06N20/10(20190101);G06K9/62(20060101);G06Q50/02(20120101);

  • 代理机构61223 西安铭泽知识产权代理事务所(普通合伙);

  • 代理人王力文

  • 地址 310018 浙江省杭州市下沙高教园区学源街258号

  • 入库时间 2023-06-19 10:57:17

说明书

技术领域

本发明涉及智能农业技术领域,特别涉及一种基于粗糙集理论和D-S证据理论的温室智能决策方法。

背景技术

农业是国家重要的支柱产业,温室影响因素智能决策技术的提升我国农业发展的重中之重。温室影响因素的智能决策技术主要是调节作物生长的外部条件。根据不同的作物,每个影响因素都不同,有必要提供正确的影响因素来调整和保证作物的良好生长。

由于温室内影响因素的变化和监测设备内部硬件问题等多种不稳定因素的影响,监测设备所获取的原始数据,是不一定正确的,对于这些不一定正确的数据,若进行智能决策算法处理,则极有可能出现判断错误或决策失误的情况。

而D-S证据理论的主要特点之一就是在存在有不确定性的数据的情况下,能够有效处理该数据。而对于检测设备采集到的数据,大多是连续的原始数据,计算机对连续数据的处理能力很差,所以对连续数据进行离散化后,采用粗糙集理论,采用粗糙集理论的主要原因是,粗糙集理论中属性约简的特点,能够将无用的条件属性剔除,并且数据的原始功能不变,这能有效的降低算法的运行代价。

在温室影响因素的监测方面,目前大部分温室的监控传输以Wi-Fi,ZigBee等通信技术进行数据的传输。温室环境是一个具有大惯性和非线性特性的系统,并且存在时延和交连等现象,想要建立精确模型阻碍非常多,难度十分大。

针对现有技术存在的问题,本申请提供了一种基于粗糙集理论和D-S证据理论的温室智能决策方法,运用改进的D-S证据理论,引入计算得出的BPA基本概率指派矩阵,构建置信度矩阵完成对温室影响因素的组合,得出温室智能决策结果。

发明内容

本发明的目的在于提供一种基于粗糙集理论和D-S证据理论的温室智能决策方法,运用改进的D-S证据理论,引入计算得出的BPA基本概率指派矩阵,构建置信度矩阵完成对温室影响因素的组合,得出温室智能决策结果。

本发明提供了一种基于粗糙集理论和D-S证据理论的温室智能决策方法,包括以下步骤:

步骤1:采集温室影响因素样本数据,建立粗糙集和D-S证据理论模型,以粗糙集理论为模型前沿,进行温室影响因素样本数据的属性约简;

步骤2:利用D-S证据组合规则,结合温室影响因素样本数据获得组合结果的基本置信度分布;

步骤3:运用模糊C均值聚类方法对样本数据进行离散处理,把n个向量x

模糊C均值聚类算法的价值函数为:

其中,u

而聚类中心C

其隶属度计算为:

步骤4:确定每个样本的相应聚类类别时,决定使用隶属度重叠的阈值,并使用样本数据值的阈值进行选择相应的聚合用于限制的所有样本数据;

步骤5:利用粗糙集构建基本概率分配函数,计算温室各影响因素之间的支持程度;

步骤6:运用改进的D-S证据理论,引入计算得出的BPA基本概率指派矩阵,构建置信度矩阵完成对温室影响因素的组合,得出决策结果。

进一步地,所述步骤S1中采集温室影响因素样本数据包括温度、湿度、光照强度、土壤内温度、土壤内湿度和二氧化碳体积分数。

进一步地,所述步骤S6中提到的决策结果包括1、2、3、4四种类别,分别对应的操作为打开卷膜、打开卷膜并启动风扇、启动风扇和湿帘以及不动作。

进一步地,将决策结果设为{L(k),k=1,2,3,4},其中,k为4种决策的结果,温室影响因素控制决策识别框架的幂集下的基本可信性分布函数表示各种决策类别的温室影响因素信息的支持程度,并且

进一步地,温室决策因素的基本可信度分布M(1),M(2),M(3),M(4)所对应的温度值的集合为{31.5℃,32.8℃,29.2℃}、{35.1℃,36.0℃,34.7℃}、{38.2℃,42.3℃,37.5℃}、{24.9℃,27.0℃,25.1℃}。

与现有技术相比,本发明具有如下显著优点:

本发明提出的一种基于粗糙集理论和D-S证据理论的温室智能决策方法,首先研究了模糊C均值算法(FCM)对数据的处理,将连续数据进行离散化处理,以便对原始数据的进行粗糙集理论的属性约简和决策规则约简,其次运用基于信息熵的属性约简方法筛选出专家知识中不必要的条件属性,最后运用D-S证据融合进行数据的决策,通过基于基本可信度分配的决策,确定决策类别并选择阈值:ε

附图说明

图1为本发明实施例提供的基于粗糙集和证据理论的决策模型图;

图2为经过D-S证据理论的证据组合后的所产生的基本可信度的对比图。

具体实施方式

下面结合本发明中的附图,对本发明实施例的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。

在1982年由波兰的科学家Z.Pawlak创立出粗糙集理论(Rough Set Theory),使得在数据处理和分析领域得到了重大的发展。

属性约简与规则约简是粗糙集理论中的重要的研究课题。由于知识库中的知识并不是每一个都有用,也不是每一个都十分重要,相反,存在一些冗余的知识,这些知识是占用资源的,会造成资源的损失,同时,也会干扰人们或者计算机做出正确的判断。数据的属性约简,就是要保证原有数据的决策分类能力不变,并将原始数据中的不必要条件属性删去。减少决策属性和条件属性之间的依赖性的过程不会改变。

定义1设I=(C∪D),C、D分别是条件属性和决策属性,c∈C,如果γ

定义2知识Q相对于知识P的条件熵H((Q|P))定义为:

式中,

G.shafer将信任函数的概念引入到D-S证据理论当中,这是对D-S证据理论的一次极大提升,由此产生了能够处理多数据融合的一套科学的数学方法。贝叶斯推理方法是D-S证据理论的基础,贝叶斯条件概率为实现贝叶斯推理方法的关键。基本概率分配(BPA)的概念是框架分配给每个命题的信任度,m(A)是基本可信数,反映了A的可靠性。设基本概率分布函数的两个证据源为m1和m2,基本概率分布函数的计算是由已存在的D-S证据理论组合规则得出的,这是D-S证据融合的基本过程。

定义1基本概率分配(BPA)

设U为识别框架,则函数m:2

(1)

(2)

称m(A)=0为A的基本赋值,m(A)=0表示对A的信任程度,也称mass函数。

定义2信任函数(BeliefFunction)

Bel:2

表示A的全部子集的概率分配函数之和。

定义3多个信任函数的合成

设Bel

在D-S证据理论中,最重要的是确定焦点元素的基本概率分配函数,这也是D-S证据理论能否在实际运用中实现的关键点。同时,证据的获取和基本可信度分配等很多方面还或多或少地依赖于领域专家的经验或历史数据等,主观性难以避免。但是,由于粗糙集理论的特点,可以采用隶属度的概念,即通过分析对象的隶属度,将粗糙集理论提升,提升到能够分析识别框架,这样就可以达到获取基本可信度分配的目的。综上所述,粗糙集理论是适合与D-S证据理论结合,帮助D-S证据理论解决有关证据获取困难的重要难题,也能解决因为专家经验判断而产生的失误。

参照图1-2,本发明提供了一种基于粗糙集理论和D-S证据理论的温室智能决策方法,包括以下步骤:

步骤1:采集温室影响因素样本数据,采集温室影响因素样本数据包括温度、湿度、光照强度、土壤内温度、土壤内湿度和二氧化碳体积分数;建立粗糙集和D-S证据理论模型,以粗糙集理论为模型前沿,进行温室影响因素样本数据的属性约简;

步骤2:利用D-S证据组合规则,结合温室影响因素样本数据获得组合结果的基本置信度分布;

步骤3:运用模糊C均值聚类方法对样本数据进行离散处理,把n个向量x

模糊C均值聚类算法的价值函数为:

其中,u

而聚类中心c

其隶属度计算为:

模糊C均值聚类方法用于连续数据的离散处理是指在同一个聚类中,所有的数据具有最高的相似性,并且不同的聚类中,数据的属性不一样,是正好相反的。模糊C均值聚类算法是对普通C均值聚类算法的发展和改善。普通C均值算法的数据划分是难以区分的,模糊C均值聚类算法相当于易于区分,并具有更高的灵活性。模糊C均值聚类算法能够对目标函数进行更有效的优化,能够更好地对原始数据进行分类,并能够对样本中的原始数据进行跟有效率的隶属度分配,对其的自动化的形成提供了基础。在通过模糊C均值聚类算法对连续数据进行离散化之后,使用每个原始数据经过离散化后的样本最大隶属度的类别进行记录,并将其作用于离散化后数据的样本值,并且将连续数据离散化的结果作为离散集合以便于更加有效的分析,然后粗糙集理论用于知识挖掘;

步骤4:确定每个样本的相应聚类类别时,决定使用隶属度重叠的阈值,并使用样本数据值的阈值进行选择相应的聚合用于限制的所有样本数据;

其中,隶属度函数是表示一个对象x隶属于集合A的程度的函数,通常记做μ

A={(μ

步骤5:利用粗糙集构建基本概率分配函数,计算温室各影响因素之间的支持程度;

步骤6:运用改进的D-S证据理论,引入计算得出的BPA基本概率指派矩阵,构建置信度矩阵完成对温室影响因素的组合,得出决策结果,决策结果包括1、2、3、4四种类别,分别对应的操作为打开卷膜、打开卷膜并启动风扇、启动风扇和湿帘以及不动作。

其中,将决策结果设为{L(k),k=1,2,3,4},其中,k为4种决策的结果,温室影响因素控制决策识别框架的幂集下的基本可信性分布函数表示各种决策类别的温室影响因素信息的支持程度,并且

温室决策因素的基本可信度分布M(1),M(2),M(3),M(4)所对应的温度值的集合为{31.5℃,32.8℃,29.2℃}、{35.1℃,36.0℃,34.7℃}、{38.2℃,42.3℃,37.5℃}、{24.9℃,27.0℃,25.1℃}。

本发明采用的数据预处理方法为数据约归。数据约归通常包括降维和数据压缩,意味着研究人员可以使用较小的条件属性,值范围和较少的数据来表达与原始数据集相同或相似的信息。粗糙集理论的最大特点是条件属性的减少,通过专家表的知识和对温室影响因素的判断,删除可去掉的条件属性和冗余的属性。粗糙集理论通过用等价类中的对象替换等价类来压缩数据,从而减少数据集。

在粗糙集和D-S证据理论模型上,以粗糙集理论为模型前沿,进行温室影响因素控制专家知识表数据的属性约简。然后在D-S证据理论中应用D-S证据组合规则,结合各种温室影响因素。这些因素相互组合以获得组合结果的基本置信度分布。使用此结果来决定要采取的操作。基于粗糙集和证据理论的决策模型如图1所示。

在通过模糊C均值算法进行聚类之后,当确定每个样本的相应聚类类别时,决定使用隶属度重叠的阈值并使用样本数据值的阈值来选择相应的聚合用于限制的所有样本数据。例如,如果所有样本数据的数据隶属度重叠度的数值大于阈值设置,并且当样本数据值设置阈值的类别选择确定连续数据离散化后的类别选择时,即它可以确定样本对应于多个离散类别。在添加隶属度重叠度的概念和判断后可以将真实情况更真切的反映出来。引入的隶属度重叠度实际上等于隶属度值的极限范围。对于属于特定间隔的分类点,可以使用阈值为0.4来确定隶属值的值。阈值取值越高,经过隶属度重叠度决定的分界线越分明。对于受噪声影响的样本数据的对应类别越独特,但事实并非如此。反之,唯一性很弱,但它能够反映出整个样本数据的情况,且这个情况是比较真实的。因此,在模糊C均值算法聚类后,使用隶属度重叠度得阈值来限制离散化后的数据是有必要的。

实施例1

依据所选西北地区温室的具体的影响因素信息,得出的温室影响因素控制专家知识表,如表1所示,共计12组样本,每一组样本中有6个温室影响因素并通过6个影响因素判断出唯一一个决策结果,其中温室影响因素由温度、湿度、光照强度、土壤内温度、土壤内湿度、二氧化碳体积分数6个因素组成,决策结果包括1、2、3、4等4类,分别为打开卷膜,打开卷膜并启动风扇,启动风扇和湿帘,不动作。表1中的数据包含温室影响因子指标和相应的决策结果,但用户不易理解温室影响因素数据中包含的信息,因此很难直接用于决策。

表1温室影响因素控制专家知识表

运用模糊C均值聚类算法的对表1进行聚类,聚类数取4,等于决策结果类别的数量,具有算法返回值的聚类中心为4级,每个样本的隶属度函数分别属于4个聚类中心。见表2,表2中没有不兼容的样本,表明聚合的数量合适。

表2温室影响因素控制决策表

表2为经过FCM聚类算法后得到的决策表,为基于粗糙集理论的属性约简算法进行铺垫,方便属性约简方法的进行。

实施例2

根据基于信息熵的属性约简算法,制定其论域,温度影响因素条件属性和决策结果集,在计算温度影响因素条件属性相对于决策结果的核,在对核的属性进行约简,得到约简后的数据,为进行D-S证据理论的融合做铺垫。

在温室影响因素的智能控制的决策中,整个框架中的影响因素表明应该采取了哪种控制方法。因此,对于表1,整个框架可以写为{L(k),k=1,2,3,4},k即为4种决策的结果。温室影响因素控制决策识别框架的幂集下的基本可信性分布函数表示各种决策类别的温室影响因素信息的支持程度,并且

设a,b,c分别为温度,光照强度和二氧化碳体积分数。以温度为例,各判定类别对应的环境指标的均值将基本可信区间划分。M(1),M(2),M(3),M(4)所对应的温度值的集合为{31.5℃,32.8℃,29.2℃}、{35.1℃,36.0℃,34.7℃}、{38.2℃,42.3℃,37.5℃}、{24.9℃,27.0℃,25.1℃},经过计算得出各个集合的平均值分别为31.2℃,35.3℃,39.3℃,25.3C,温度因素的基本可信度建立如下:

当a<25.3℃时,则m(4)=0.9,m(1),m(2),m(3)均为0,m(Θ)=0.1;

当25.3℃≤a≤31.2℃时,m(4)=[1-(a-25.3)/(31.2-25.3)]×0.9,m(2),m(3)均为0,m(1)=[(a-25.3)/

当31.2℃≤a≤35.3℃时,m(3),m(4)均为0,m(2)=[(a-31.2)/(35.3-31.2)]×0.9,m(1)=[1-(a-31.3)/(35.3-31.3)]×0.9,m(Θ)=0.1:

当35.3℃≤a≤39.3℃时,m(1),m(4)均为0,m(3)=[(a-35.3)/(39.3-35.3)]×0.9,m(2)=[1-(a-35.3)/(39.3-35.3)]×0.9,m(Θ)=0.1;

当39.3℃≤a时,m(3)=0.9,m(1),m(2),m(4)均为0,m(Θ)=0.1。

设在不同时刻采集的数据为:A1={30.2℃,9.4klx,438μL/L},A2={33.8℃,12.4klx,358μL/L},A3={38.1℃,20.8klx,283μL/L},A4={23.0℃,8.5klx,371μL/L},得出表3。

表3组合前的基本可信度分配

上述为对温度的基本可信度计算,同理,对于光照强度和二氧化碳体积分数的基本可信度计算也可以完成。其中,指标a、b、c分别表示温度、光照强度、二氧化碳体积分数;m(1),m(2),m(3),m(4),m(Θ)代表卷膜的打开,打开卷膜并启动风扇,启动风扇和湿帘,没有动作和不确定的支持。

D-S证据将温度,光强度和温度以及二氧化碳体积分数组合以获得基本置信度分布,然后组合两组属性以获得基本可信度分布。最后,通过基于基本可信度分配的决策。确定决策类别并选择阈值:ε

表4 D-S证据组合与决策

其中L(1),L(2),L(3),L(4)为决策结果,L(1)对应的是打开卷膜,L(2)对应于打开卷膜并启动风扇,L(3)对应于启动风扇和湿帘和L(4)对应于没有动作。

从表4可以看出,通过D-S证据理论的融合决策算法,得出结论,即为拥有2个属性的就可以对决策结果产生有效地影响,对于决策结果,拥有4个样本就可以对其作出决定。如表1中,样本A2,证据{a,b}组合后,m(1)与m(2)差值高于0.2,m(Θ)小于0.03,并且m(1)远远大于m(Θ),所以判定结果为L(1),{a,c}组合,相反,m(2)与m(1)差值高于0.2,m(Θ)小于0.03,m(2)远远大于m(Θ),因此决策结果为L(2),因为两两组合决策的结果有不同的结果,于是需将组合进一步的进行融合,关于m(1)与m(2)的基本可信度分配值分别为0.16793、0.81674,m(2)与m(1)差值高于0.2,m(Θ)小于0.03,并且m(2)远远大于m(Θ),所以得出,决策结果应为L(2);此外,从表3中m(Θ)的变化可以得出结论,经过D-S证据理论的融合决策后,m(Θ)有大幅度地减小,{a,b,c}组合后,3组决策属性集的组合相比于2组决策属性集的组合来说,每一组的属性约简不确定性都会降低。表4显示不确定性的数量级由10-2变至10-3,由此可以得出结论,多种属性集的D-S证据组合,能有效降低决策结果的不确定性,进而达到提高判断精度的目的。

实施例3

选择针对小样本机器学习的SVM算法与基于粗糙集和D-S证据理论的决策方法进行对比。

首先,使用表1中的原始数据对针对小样本机器学习的SVM算法进行训练和测试,在使用SVM算法进行原始数据训练和测试后,对分类器进行训练,并对模型进行测试。评估分类器的性能指标,并在交叉验证后选择最佳模型参数。决策正确率为90.34%,由此说明小样本机器学习的SVM算法并不能完全学习和应用专家知识。而基于粗糙集和D-S证据理论的决策方法,根据信息熵属性约简的约简结果,删除表1中湿度、土壤内温度、土壤内湿度这3个条件属性后,重新进行训练、测试,此时,正确的决策率增加到100%,表明基于信息熵的属性约简算法可以删除专家知识中不必要的条件属性,增强条件属性与决策属性之间的映射关系。最后,对样本A1、A2、A3、A4分别采用基于粗糙集和D-S证据理论的决策方法与小样本机器学习的SVM算法进行决策,得到决策结果,D-S证据理论的融合决策算法和针对小样本机器学习的SVM算法的平均运行时间分别为0.002378s和0.017939s,表明进行融合决策时,基于粗糙集和D-S证据理论的决策算法的运行代价远小于小样本机器学习的SVM算法,所以基于粗糙集和D-S证据理论的决策算法具有较低的计算复杂度,并且两种算法都能够处理处相同的决策结果。

对12组温室影响因素数据进行处理,与专家知识对比,算法得出的决策结果与专家知识一致则视为识别正确,最终可得两者都可以得出正确的决策结果,并得出结论:本申请提出的基于粗糙集和D-S证据理论的决策算法能够以较少的专业知识分配冲突信息,并在这种情况下能做出有效的决策,得出正确的决策结果。将该计算应用于温室影响因素的控制部分是可行的。

此外,D-S证据理论的决策结果适应了温室决策因素的不确定性,采用多种属性集的D-S证据组合,能有效降低决策结果的不确定性,进而达到提高判断精度的目的。

使用小样本机器学习的SVM算法对表1进行测试和训练,得出的决策正确率较低,不足以完成对温室影响因素决策的条件,而经过模糊C均值聚类,经过基于信息熵的属性约简算法后,重新对其进行D-S证据融合,决策的正确率达到100%,这说明在小样本情况下,基于粗糙集和D-S证据理论的温室智能决策方法的效率和正确率要明显好于SVM算法。表5和表6分别为SVM算法的测试集数据和训练集数据,如下表所示:

表5 SVM算法中测试集数据

表6 SVM算法中训练集数据

基于粗糙集和D-S证据理论的决策方法与小样本机器学习的SVM算法的简略对比如表7所示。

表7 温室影响因素决策对比

以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号