首页> 中国专利> 一种基于优化的模糊学习矢量量化的苹果分类方法

一种基于优化的模糊学习矢量量化的苹果分类方法

摘要

本发明是一种基于优化的模糊学习矢量量化的苹果分类方法,其包括以下步骤:第一步,苹果样本近红外光谱采集;第二步,用主成分分析方法对苹果的近红外光谱进行降维处理;第三步,运行模糊C-均值聚类以得到初始聚类中心;第四步,用优化的模糊学习矢量量化方法进行苹果品种的分类。本发明解决了模糊学习矢量量化处理含噪声数据时对噪声敏感的问题,具有检测速度快,分类准确率高,分类效率高,对苹果不造成损坏等优点,可实现不同品种苹果的分类。

著录项

  • 公开/公告号CN103646252A

    专利类型发明专利

  • 公开/公告日2014-03-19

    原文格式PDF

  • 申请/专利权人 江苏大学;

    申请/专利号CN201310649236.3

  • 发明设计人 武小红;武斌;孙俊;傅海军;

    申请日2013-12-05

  • 分类号G06K9/62;G01N21/3563;G01N21/359;

  • 代理机构

  • 代理人

  • 地址 212013 江苏省镇江市京口区学府路301号

  • 入库时间 2024-02-19 22:53:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-23

    未缴年费专利权终止 IPC(主分类):G06K9/62 授权公告日:20170111 终止日期:20171205 申请日:20131205

    专利权的终止

  • 2017-01-11

    授权

    授权

  • 2014-04-16

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20131205

    实质审查的生效

  • 2014-03-19

    公开

    公开

说明书

技术领域

本发明属于人工智能技术领域,尤其是一种基于优化的模糊学习矢量量化的苹果分类方 法。

背景技术

苹果是我国主要的水果之一,苹果的采后处理、品质判断及检测一直是农产品加工研究 的重要课题。苹果品种不同则它的大小、颜色、外观形状等外部品质到口感、糖分含量、酸 度和维生素含量等内部品质都是不相同的,随着苹果采后处理技术的发展,苹果品种的鉴别 变得越来越重要,所以研究一种简单、快速、非破坏的苹果品种鉴别方法是非常必要的。

近红外光谱是波长在780~2526nm范围里的电磁波,其吸收谱带对应于有机物质分子基 频振动的倍频和组合频,是解析有机物质结构的强有力工具,被广泛用于定量分析、定性鉴 别物质。近红外光谱技术具有非破坏性检测,检测速度快,可同时检测多种成分等优点。近 红外光谱射向苹果后得到漫反射光谱,在不同品种的苹果上获得的漫反射光谱是不同的,利 用这个原理,可以实现不同品种的苹果分类。但是,近红外采集过程中会采集到一些噪声信 号,这给近红外光谱数据的处理带来误差。

模糊学习矢量量化是一种无监督的学习方法(Tsao E C,Bezdek J C,Pal N R.Fuzzy  Kohonen clustering networks.Pattern Recognition,1994,27(5):757–764.)。模糊学习矢量量化是 将模糊C-均值聚类(FCM)引入到Kohonen聚类网络的学习速率和更新策略中。但是FCM 建立在可能性约束条件基础上,对噪声敏感。所以,建立在FCM基础上的模糊学习矢量量化 也对噪声敏感。为了克服FCM的这个缺点,Krishnapuram和Keller放弃了FCM的可能性约 束条件,提出了可能性C-均值聚类(PCM)(Krishnapuram R,Keller J.A possibilistic approach  to clustering.IEEE Trans.Fuzzy Systems,1993,1(2):98-110.)。PCM能够聚类包含噪声的数据。 本发明是将优化参数的PCM引入到Kohonen聚类网络的学习速率和更新策略中而得到的。 从而解决了模糊学习矢量量化方法对噪声敏感的问题。

目前,在应用近红外光谱技术分类水果时对近红外光谱的分类方法主要有人工神经网络, 支持向量机和k-近邻法等方法。这些方法属于有监督的学习方法,即它们需要学习样本来获 取先验知识。在没有学习样本,或者学习样本比较少的情况下运用以上方法进行水果分类时 会导致分类准确率低而难以实现水果的正确分类。

发明内容

针对上述现有的分类方法的缺陷和不足,本发明的目的是提出一种基于优化的模糊学习 矢量量化的苹果分类方法。该方法用近红外光谱技术获取苹果的近红外光谱,用主成分分析 对苹果的近红外光谱进行降维处理,运行模糊C-均值聚类以得到初始聚类中心,用优化的模 糊学习矢量量化方法进行苹果品种的分类。本发明属于无监督学习方法,不需要学习样本, 能快速、无损的分类苹果。

本发明依据的原理:研究表明,苹果的近红外漫反射光谱包含了苹果内部的糖度,酸度 和可溶性固形物等内部品质信息,品种不同的苹果所对应的近红外漫反射光谱也不同。用优 化的模糊学习矢量量化方法可以实现苹果品种的分类。

根据上述原理,采用的技术方案包括以下步骤:

步骤一、在恒温恒湿环境下,苹果样本近红外光谱采集:针对不同品种的苹果样本,用 近红外光谱仪对这些苹果样本投射近红外,获取苹果样本的近红外漫反射光谱信息,将光谱 信息存储在计算机里。

步骤二、对苹果样本近红外光谱进行降维处理:采用主成分分析方法(PCA)将苹果样 本近红外光谱从高维数据降到相对较低的低维数据,并保存这些数据。

步骤三、模糊C-均值聚类以得到初始聚类中心:对降维后的苹果近红外数据运行模糊 C-均值聚类,得到初始的聚类中心。

步骤四、用优化的模糊学习矢量量化方法进行苹果品种的分类:根据步骤(3)的初始的 聚类中心运行优化的模糊学习矢量量化方法得到模糊隶属度,根据模糊隶属度可将不同品种 苹果进行分类。

所述步骤一中近红外漫反射光谱信息是指光谱的波数范围为10000~4000cm-1,采集到每 个苹果样本的光谱是1557维的数据。

所述步骤二中用主成分分析方法进行降维时,在满足主成分的累计可信度≥95%条件下 选取主成分个数。

所述步骤四中的优化的模糊学习矢量量化方法如下:

1.初始化

(1)固定苹果近红外光谱样本类别数c和权重指数m0的值,n为样本数,n>c>1, +∞>m0>1;

(2)计算苹果近红外光谱样本的协方差σ2

这里xk为第k个苹果近红外光谱样本,(是步骤二中的6维苹果数 据)为样本的均值,x=1nΣk=1nxk.

2.计算隶属度值

计算隶属度值uik,t-1,uik,t-1表示第t-1(t=1,2,3,…)次迭代计算时第k个样本隶属于第i 类的隶属度值,其中t为迭代次数,Dik=||xk-vi,t-1||, mt-1=m0-(t-1)Δm,Δm=(m0-1)/tmax,tmax为最大迭代次数,vi,t-1为第t-1次迭代计算时 第i类的类中心。

3.计算学习速率αik,t-1

4.计算类中心vi,t

vi,t为第t次迭代计算时第i类的类中心,计算出vi,t后,t自动 加1,即t=t+1,当t=tmax时,迭代结束,否则返回步骤2继续迭代计算。

附图说明

图1是本发明的流程图;

图2是苹果样本的近红外光谱图;

图3是苹果近红外光谱的前2个主成分得分图。

具体实施方式

下面结合附图以及具体实施例对本发明作进一步的说明,但本发明的保护范围并不限于 此。

本发明适用于不同品种苹果的品种分类,实施流程如图1所示,具体实施如下:

步骤一、苹果样本近红外光谱采集:取红富士,花牛和加纳三种苹果样本,每种苹果样 本50个。Antaris II近红外光谱分析仪开机预热1个小时,在恒温恒湿环境下,采用反射积分 球模式采集近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均 值。光谱扫描的波数为10000~4000cm-1,扫描间隔为3.856cm-1,采集到每个样品的光谱是 1557维的数据。为减少误差,每个苹果样本沿赤道轨迹采样3次,取其平均值作为最终的实 验数据。150个苹果样本的近红外光谱如图2所示。

步骤二、苹果样本近红外光谱的降维处理:采用主成分分析方法将苹果样本近红外光谱 从1557维降到相对较低的低维数据,分别选取前i个主成分得到其累计可信度如表1所示(累 计可信度=前i个主成分特征值除以总的特征值之和)。若取前2个主成分,则累计可信度达 99.41%,其主成分得分图如图3所示;若取前6个主成分,则累计可信度达100%(见表1)。

表1、主成分累计可信度

前i个主成分 1 2 3 4 5 6 累计可信度% 97.29 99.41 99.91 99.97 99.99 100.0

步骤三、模糊C-均值聚类以得到初始聚类中心:对降维后得到的6维近红外光谱数据运 行模糊C-均值聚类(FCM),得到初始的聚类中心V0如下:

V0=3.88-0.19-0.050.020.020.00-0.250.280.01-0.06-0.020.01-3.61-0.140.050.030.00-0.01

步骤四、用优化的模糊学习矢量量化方法进行苹果品种的分类:

1.初始化:

(1)固定苹果近红外光谱样本类别数c=3,权重指数m0=2.0,样本数n为150,最大 迭代次数tmax=100;

(2)计算苹果近红外光谱样本的协方差σ2

这里xk为第k个苹果近红外光谱样本,为样本的均值, x=1nΣj=1nxj,

实验计算结果:σ2=10.696。

2.计算隶属度值:

计算隶属度值uik,t-1,uik,t-1表示第t-1(t=1,2,3,…)次迭代计算时第k个样本隶属于第i 类的隶属度值,其中t为迭代次数,Dik=||xk-vi,t-1||,vi,t-1为 第t-1次迭代计算时第i类的类中心,mt-1=m0-(t-1)Δm,Δm=(m0-1)/tmax,tmax为最大 迭代次数。

计算出隶属度值uik,t-1后(见表2),取第k个样本中uik,t-1的最大值所对应的i值,即判定 第k个样本属于第i类。例如,当k=1时,u1k,99=0.00,u2k,99=0.98,u3k,99=1.00;因为u3k,99最 大,则判定第1个样本属于第3类(加纳)。

表2、隶属度的部分值

第k个样本 u1k,99u2k,99u3k,991 0.00 0.98 1.00 2 0.00 0.00 1.00 3 0.00 0.00 1.00

4 0.00 0.00 1.00 5 0.00 0.00 0.00 149 1.00 0.00 0.00 150 1.00 0.00 0.00

3.计算学习速率αik,t-1

实验结果:实验迭代共t=100次,αik,99的结果有3×150=450个数,其部分数值如表3 所示。

表3、αik,99的部分值

第k个样本 α1k,99α2k,99α3k,991 0.00 0.98 1.00 2 0.00 0.00 1.00 3 0.00 0.00 1.00 4 0.00 0.00 1.00 5 0.00 0.00 0.00 149 1.00 0.00 0.00 150 1.00 0.00 0.00

4.计算类中心:

vi,t为第t次迭代计算时第i类的类中心,计算出vi,t后,t 自动加1,即t=t+1,当t=tmax时,迭代结束,否则返回步骤2继续迭代计算。

实验结果:实验迭代t=100时结束,vi,99为:

v1,99=[3.50-0.17-0.120.030.010.00]

v2,99=[-0.520.290.02-0.05-0.010.02]

v3,99=[-3.19-0.120.070.020.000.00]

最后,根据隶属度值实现红富士,花牛和加纳三种苹果分类,分类准确率达到88.7%。

本所述实施例为本发明的优选的实施方式,但发明并不限于上述实施方式,在不背离本 发明的实质内容的情况下,本领域技术人员能够做出的任何显而易见的改进、替换或变型均 属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号