法律状态公告日
法律状态信息
法律状态
2012-07-25
授权
授权
2010-11-24
实质审查的生效 IPC(主分类):G06K9/62 申请日:20100514
实质审查的生效
2010-10-06
公开
公开
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于改进蚁群算法的图像特征优化选择方法与系统,尤其适用于对棉花异性纤维的图像特征进行优化选择。
背景技术
棉花异性纤维是指在棉花生产过程中混入棉花中的对棉花及其制品的质量有严重影响的非棉纤维和色纤维,主要包括塑料布、布条、头发、麻绳、丙纶丝和鸡毛等。
异性纤维在皮棉中的含量虽少,但对棉纺织品的质量影响严重,不仅影响纱线强度,而且还影响着色,会对棉纺织工业造成重大经济损失。目前普遍的解决方法是通过挑拣来降低异性纤维的含量,但这种人工的剔除方式需要消耗大量的人力物力,极大的增加了棉纺织工业的成本。
近年来,机器视觉技术推动了棉花异性纤维在线识别技术的发展。利用机器视觉技术进行棉花异性纤维在线识别,关键是利用图像处理技术、模式识别技术对含有异性纤维的棉花图像进行加工、处理、分析,并对分割出来的棉花异性纤维目标进行分类,分类的正确率将直接影响后续进行的识别、计量、剔除工作,而用于分类的特征是分类正确率的关键。对棉花异性纤维图像进行特征提取主要从颜色、形状、纹理三方面进行,但每一方面都可以提取出大量的特征。如何从大量的特征中去除冗余无关的特征,选择出最主要的特征是关键问题,特征选择的好坏直接影响到分类的准确率,制约着棉花异性纤维在线识别技术发展。
尽管目前对于棉花异性纤维目标图像的特征提取和模式识别的研究已经取得了很多成果,也有很多成果已经在实际生产中进行了成功的应用,但在棉花异性纤维目标的特征优化选择方面研究成果很少。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:使选择的特征的分类性能更高,进一步提高分类速度,并使选择的特征集具有全局性。
(二)技术方案
针对现有技术的不足,本发明提供了一种基于改进蚁群算法的图像特征优化选择方法,包括以下步骤:
S1:创建对图像进行特征提取后得到的特征样本的特征属性表、蚂蚁和蚂蚁表;
其中,所述特征属性表是由特征的选择概率和信息素含量构成的数组,所述蚂蚁是由特征的编码和优度构成的数组,所述编码的值表示特征是否被选择,所投放的蚂蚁构成所述蚂蚁表;
S2:对每只蚂蚁进行特征选择与编码,并计算每只蚂蚁的优度,优度值的大小表示蚂蚁所选择的特征子集的优劣程度;
S3:随机选择部分蚂蚁对其所选择的特征子集进行变异;
S4:判断是否达到选择次数的阀值,如达到,转至S6;否则执行S5;
S5:根据每只蚂蚁的优度,重新设置特征的选择概率和信息素含量,至此完成一次循环,选择次数加1,然后转至S2;
S6:解码输出最优特征集,其中,蚂蚁表最后一行的蚂蚁的特征即为最优特征编码,解码输出该最优特征编码得到最优特征集。
其中,在步骤S1还包括初始化的步骤:根据每个特征的样本值计算各特征的初始优度,并根据所述初始优度计算初始选择概率,将得到的每个特征的初始选择概率填入所述特征属性表的第一行,并将蚂蚁表中的数据置0,将信息素含量全部置为同一任选值,置选择次数为1,完成初始化,其中,特征的初始优度表示特征的可分离程度。
其中,所述步骤S2中,计算所述初始优度或优度时所使用的优度函数模型为:
其中,
上式中,s表示初始优度或优度,c表示样本的种类总数,ni表示第i类样本总数,d表示样本总数,m表示所有样本的均值向量;计算初始优度时,样本的向量维数为1,即仅包含所计算的样本的特征值,表示第i类样本中的第j个样本的特征值,mi表示第i类样本的均值;计算优度时,表示第i类样本的第j个样本的特征向量,mi表示第i类样本的均值向量。
其中,利用以下初始选择概率函数模型根据初始优度计算初始选择概率:
式中,x表示初始选择概率系数,si为第i个特征的优度,smin表示最小优度值,smax表示最大优度值。
其中,步骤S2中,采用如下编码策略对每只蚂蚁进行编码:产生一个随机数,由所产生的随机数与特征的选择概率的大小决定每个特征是否被选择,每进行一次特征选择,产生一次随机数。
其中,步骤S3中,利用所产生的随机数确定变异的蚂蚁数、变异蚂蚁、变异的特征数和变异特征,被选择进行变异的蚂蚁的优度优于未被选择进行变异的蚂蚁的优度。
其中,步骤S5中,
利用以下信息素含量函数模型计算信息素含量:
τ(i,t+1)=ατ(i,t)+βΔτ(i,t),
上式中,τ(i,t)表示蚂蚁在进行第t次循环时的第i个特征所带有的信息素含量,Δτ(i,t)表示第i个特征在本次循环时信息素含量的变化量,α表示信息素的挥发系数,β表示信息素的变化系数,a表示蚂蚁总数,f(xi)为特征选择函数,如果特征xi被第j只蚂蚁所选择,则f(xi)等于1,如果未被选择,则f(xi)等于0,sj表示第j蚂蚁的优度;和/或
利用以下特征选择概率函数模型计算特征的选择概率:
上式中,δ表示概率系数,ε表示概率变化系数,b表示特征总数;表示所有特征上的信息素总量;特征的选择概率的最大值为1,若大于1则取1,最小为0,若小于0则取0。
其中,所述图像为棉花异性纤维图像。
本发明还提供了一种基于改进蚁群算法的图像特征优化选择系统,包括:
初始化模块,用于创建对图像进行特征提取后得到的特征样本的特征属性表、蚂蚁和蚂蚁表;其中,所述特征属性表是由特征的选择概率和信息素含量构成的数组,所述蚂蚁是由特征的编码和优度构成的数组,所述编码的值表示特征是否被选择,所投放的蚂蚁构成所述蚂蚁表;
特征选择模块,用于对每只蚂蚁进行特征选择与编码,并计算每只蚂蚁的优度,优度值的大小表示蚂蚁所选择的特征子集的优劣程度;
特征变异模块,用于随机选择部分蚂蚁对其所选择的特征子集进行变异;
条件判断模块,用于特征选择的终止判断;
属性计算模块,用于在所有蚂蚁完成一次特征选择后,计算特征的信息素含量及特征选择概率,并更新特征属性表的数据;
特征输出模块,用于解码输出最优特征集,其中,蚂蚁表最后一行的蚂蚁的特征即为最优特征编码,解码输出该最优特征编码即得到最优特征集。
其中,所述特征选择模块包括随机数产生单元,用于产生特征选择时所需要的各种随机数;以及特征选择与编码单元,用于对蚂蚁进行特征选择与编码。
其中,所述特征变异模块包括随机数产生单元,用于产生特征选择时所需要的各种随机数;以及蚂蚁变异单元,用于完成蚂蚁变异的各种计算与操作,包括变异蚂蚁的选用、计算变异蚂蚁的优度以及对蚂蚁进行变异。
(三)有益效果
本发明的技术方案将每个特征的可分离性大小作为初始特征选择概率,将每次选择的全部子集的优度作为下次选择的选择概率的主因素,加快了算法的收敛,使较优的特征保留,较劣的特征抛弃,同时,增加了蚂蚁变异操作,使算法避免陷入局部性,使选择的特征集具有全局性。
附图说明
图1是本发明实施例的基于改进蚁群算法的棉花异性纤维图像特征优化选择方法的流程图;
图2是图1所示方法的特征属性表结构示意图;
图3是图1所示方法的蚂蚁数据结构示意图;
图4是图1所示方法的蚂蚁表结构示意图;
图5是图1所示方法的特征变异流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
蚁群优化算法作为一种新颖的智能仿生算法,具有良好的选择机制、更新机制、协调机制,已经在不同的组合优化问题中表现出良好性能。而本发明实施例将蚁群优化算法应用到棉花异性纤维的特征选择中,将为异性纤维的分类识别提供更准确精简的特征,同时对蚁群算法进行了改进,根据每个特征可分性大小,设置初始选择概率,加速算法的收敛性,加入变异操作,可以避免算法陷入局部性,使选择的特征的分类性能更高,进一步提高分类速度,满足棉花异性纤维的在线识别需求。
本发明实施例的棉花异性纤维目标图像的特征选择方案中,所采用的是棉花异性纤维目标图像特征提取后的数据。同时特征的种类不局限于棉花异性纤维的颜色、纹理、形状三个方面,可以是其中一方面或两方面的特征,也可以是棉花异性纤维的其它特征。本发明实施例的目标是从上述特征中选择出具有最佳分类能力的特征,为棉花异性纤维的正确快速分类识别提供最优的特征集。
图1为本发明实施例方法流程图,如图1所示,主要包括以下步骤:
步骤S0:输入样本数据;
步骤S1:创建特征属性表、蚂蚁、蚂蚁表,初始化;
图2是特征属性表的结构示意图,如图2所示,特征属性表为2×b数组,b表示特征总数,第一行表示特征的选择概率,第二行表示特征的信息素含量。第一行第一列P1表示第一个特征的选择概率,第一行第二列P2表示第二个特征的选择概率,依次类推,第一行最后一列Pb表示最后一个特征的选择概率;第二行第一列τ1表示第一个特征的信息素含量,第二行第二列τ2表示第二个特征的信息素含量,依次类推第二行最后一列τb表示最后一个特征的信息素含量。信息素含量取[0.5,0.7]之间某同一数值。
图3是蚂蚁数据的结构示意图,每只蚂蚁用1×(b+1)数组表示,前b项为编码项,编码项表示特征的编码组合,蚂蚁每运行一次编码项就改变一次,每次编码项的值表示每次的特征选择结果,编码项的取值为0或者1,0表示特征未被选择,1表示特征被选择,第b+1项表示前b项表示的特征子集的优度。
图4是蚂蚁表的结构示意图,所投放的蚂蚁构成蚂蚁表,蚂蚁表为(a+1)×(b+1)数组,a表示投放蚂蚁的数目,前a行表示投放的蚂蚁,最后一行为每次的最优蚂蚁复本;a的取值范围为特征总数的[0.5,1]。
参数多是蚁群算法的特点,而参数值影响到蚁群算法的性能,本发明实施例给出各参数的取值范围,可根据取值范围分别设置各参数值,实际应用中可适当调整以下参数值以得到最好的特征。信息素挥发系数α取值范围优选(0.5,0.9)、信息素变化系数β取值范围优选(0,1)、初始选择概率系数x取值范围优选(0.5,0.9)、概率系数δ取值范围优选(0,1)、概率变化系数ε取值范围优选(0,5)。
特征的初始优度表示每个特征的可分离程度,利用初始优度计算初始选择概率,可以将质量高的特征优先选择出来。优度函数对每个特征的所有样本数据进行单独计算,不涉及特征间的关系。
利用优度函数模型(1)、(2)、(3)计算各特征的初始优度
利用初始选择概率模型(4)计算各特征的初始选择概率
将计算出的初始选择概率值写入特征属性表相应的位置,如第i特征的初始选择概率,写入特征属性表中的第一行第i列中。按此方法,对每个特征进行计算,修改特征属性表第一行全部的初始概率值。
各参数设值、蚂蚁表各数据置0、信息素含量全部置为同一值,置选择次数为1,完成初始化。
步骤S2:投放蚂蚁,确定每只蚂蚁的特征编码;计算每只蚂蚁的优度,即被蚂蚁选择的特征子集的优度。
根据蚂蚁的特征编码策略:产生一个随机数,根据随机数与特征选择概率决定每个特征是否被选择。从第一只蚂蚁开始,首先由随机数产生单元(可以是随机数产生器),生成一个(0,1)内的随机数,比较此随机数与特征属性列表中特征选择概率行的第一列概率值的大小,如果大于概率值,将此蚂蚁的第一列置0,如果小于概率值,则将第一只蚂蚁的第一列置1,完成蚂蚁对第一个特征的选择及编码,按同样方法,完成对其余特征的选择及编码,第一只蚂蚁完成全部编码后,按此方法对全部蚂蚁的完成特征选择与编码。
仍然利用优度函数模型(1)、(2)、(3)计算每只蚂蚁的优度。
步骤S2具体为:首先根据蚂蚁的特征编码项,对其解码后,得到蚂蚁所选择的特征子集,即特征编码项中值为1的列所对应的特征为被选特征,由其所组成的子集即为蚂蚁所选的特征子集,根据样本数据,计算蚂蚁的优度,同时将此优度值更新到此蚂蚁的优度项。据此方法,依次计算每只蚂蚁的优度值,并更新其优度项。优度值的大小表示蚂蚁所选择特征子集的优劣程度,值越大,特征子集分类能力越强,越能准确表达棉花异性纤维。比较所有蚂蚁的优度值大小,将优度值最大的蚂蚁与蚂蚁表最后一行再作比较,如果优度值大于最后一行的优度,则复制此蚂蚁到蚂蚁表最后一行。当最终特征选择停止时,此行特征编码项即为最优蚂蚁的编码。
步骤S3:随机选择部分蚂蚁,进行变异。
图5是蚂蚁变异流程图,蚂蚁变异方法优选为:由随机数产生器产生一个(0,0.1)范围内的数,用此数与蚂蚁的总数相乘得到的数取整即为需要变异的蚂蚁数目e,置i=0;由随机数产生器产生一个[1,a]范围内的数,此数即为第一个需要变异的蚂蚁,将此蚂蚁的数据复制到临时蚂蚁,然后由随机数产生器产生一个(0,0.1)范围的数,用此数与蚂蚁特征总数相乘取整得到需要变异的特征数f,置j=0,由随机数产生器产生一个[1,b]范围的数,此数即为需要变异的特征,将临时蚂蚁中此特征取反,即0变1,1变0,j=j+1;判断j是否等于f,如不等于,继续变异特征,直至变异的特征数等于f,如等于,则根据优度函数计算其优度,如果此优度值大于临时蚂蚁优度项中的优度,则更换优度,并将临时蚂蚁的数据复制到原蚂蚁,同时与蚂蚁表最后一行优度值比较,如大于同时将数据复制到最后一行,i=i+1;判断i是否等于e,如不等于则继续进行下一只蚂蚁变异,如等于则完成需要变异的全部e只蚂蚁的变异操作;变异完成。
上述变异操作是本发明方法的改进之处,这是因为:对特征子集进行变异,可以避免算法过早的局部化,保证所选择的特征具有全局性。
步骤S4:判断是否达到选择次数阀值,如达到,转至S6;否则进行S5;
步骤S5:根据每只蚂蚁的优度,重新设置特征的信息素含量及选择概率;转至步骤S2;
τ(i,t+1)=ατ(i,t)+βΔτ(i,t) (5)
利用信息素含量计算函数模型(5)、(6)计算各特征信息素含量。第一个特征信息素含量计算方法为:根据蚂蚁表第一列的值及其优度值根据上述模型计算第一个特征信息素的含量,并将计算结果更新到特征属性表的第二行第一列中,依此方法更新其余列,完成全部特征信息素含量的更新;
利用特征选择概率计算函数模型(7)计算各特征选择概率。第一个特征选择概率计算方法为:首先根据特征属性表第二行第一列即第一个特征的信息素含量,利用选择概率模型计算选择概率,将计算结果更新到特征属性表的第一行第一列中,依此更新第二列,直至最后一列,完成全部特征选择概率更新。
完成以上操作后,将选择次数值加1,转至步骤S2;
步骤S6:解码输出最优特征集。蚂蚁表最后一行的蚂蚁特征项即为最优特征编码,解码输出该最优特征编码得到最优特征集。
本实施例通过将每个特征的可分离性大小作为初始特征选择概率,将每次选择的全部子集的优度,作为下次选择的选择概率的主因素,加快了算法的收敛,使较优的特征保留,较劣的特征抛弃;同时,增加了蚂蚁变异操作,使算法避免陷入局部性,使选择的特征集具有全局性。
本发明实施例的棉花异性纤维目标图像特征选择系统包括数据输入模块、初始化模块、特征选择模块、特征变异模块、终止判断模块、属性计算模块、特征输出模块。
本实施例中,数据输入模块可采用两种数据输入方式将样本数据装入系统,一是通过直接输入,一是文件导入;其中文件导入方式,更利于大数据量导入,可以将样本数据集先存入文件中,然后再由系统读入。
初始化模块,设置各种系统参数包括特征数、蚂蚁数、信息素挥发系数、信息素变化系数、初始选择概率系数、概率系数、概率变化系数、选择数阀值等,初始优度计算单元的初始优度,初始概率计算单元计算各特征的初始概率,初始化特征属性表、蚂蚁表,选择数置1。
在特征选择模块中,随机数产生器产生各种随机数,用于特征选择,特征选择与编码单元根据产生随机数进行特征选择并进行编码。
在特征变异模块中,随机数产生器产生的随机数确定变异蚂蚁数、蚂蚁、变异特征数、变异特征,蚂蚁变异单元根据产生的随机数对蚂蚁进行变异、计算变异蚂蚁优度、决定变异蚂蚁的选用并相应调整蚂蚁表。
在终止判断模块中,根据选择次数是达到选择次数阀值而决定是继续进行特征选择还是输出特征子集。
属性计算模块根据蚂蚁表数据,信息素含量计算器开始计算各特征的信息素含量,选择概率计算器计算各特征下次的选择概率,并更新特征属性表的数据。
特征输出模块将最优特征子集解码输出。
本实施例通过初始化模块计算表示每个特征的可分离性大小的优度并计算初始特征选择概率,通过属性计算模块计算每次选择的全部子集的优度,将其作为选择概率的主因素,加快了算法的收敛,使较优的特征保留,较劣的特征抛弃;同时,特征变异模块增加了蚂蚁变异操作,使算法避免陷入局部性,使选择的特征集具有全局性。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
机译: 用于车辆的驾驶员辅助系统的车道检测方法,涉及确定多个图像特征,基于所确定的图像特征检测车道以及确定图像中的对比度跳跃。
机译: 应力约束函数敏感度的节点集选择方法及基于相同方法的基于拓扑优化的应力约束函数敏感度分析方法
机译: 使用归一化扩散加权成像优化MRI图像特征通畅性的系统和方法