首页> 中国专利> 基于聚类算法的玉米种子高光谱图像分类识别模型更新方法

基于聚类算法的玉米种子高光谱图像分类识别模型更新方法

摘要

本发明公开了基于聚类算法的玉米种子高光谱图像分类识别模型更新方法,包括:基于采集所有待识别玉米种子在N个波段下的N个高光谱图像,计算感兴趣区域内的光谱均值特征,作为特征参数,依次输入数据,计算待识别玉米种子与检测模型的匹配性;判断匹配性,若匹配不成功,则通过化学分析测试,获得待识别玉米种子的类别,利用获得的待识别种子特征参数及其真实类别,更新训练集;在完成所有待识别玉米种子的匹配性判断后,利用新的训练集来建立新的最小二乘支持向量机检测模型fLS-SVM,用fLS-SVM来识别更新后的待识别样本集。本发明提供了一种基于聚类算法的玉米种子高光谱图像分类识别模型更新方法,能够实现高光谱图像分类模型的更新,效果好,且可靠性高。

著录项

  • 公开/公告号CN105224960A

    专利类型发明专利

  • 公开/公告日2016-01-06

    原文格式PDF

  • 申请/专利权人 江南大学;

    申请/专利号CN201510741678.X

  • 发明设计人 黄敏;何楚婕;朱启兵;

    申请日2015-11-04

  • 分类号G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 214122 江苏省无锡市滨湖区蠡湖大道1800号

  • 入库时间 2023-12-18 13:18:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-07-20

    授权

    授权

  • 2016-02-03

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20151104

    实质审查的生效

  • 2016-01-06

    公开

    公开

说明书

技术领域

本发明涉及一种玉米种子高光谱图像分类模型的更新方法,尤其是一种基于聚类算 法的玉米种子高光谱图像分类识别模型更新方法。

背景技术

近年来,随着种子杂交技术的广泛应用,种子的品种越来越多,类间相似性越来越 大,混杂现象日趋严重,这导致品种区分越来越困难,种子的纯度问题也越来越受到人们的 关注。种子的纯度反映种子质量的重要参数,是评定种子等级的主要依据。传统的种子纯度 检测方法存在着鉴定时间长、人员依赖性强、对种子具有破坏性等缺点,难以在实际应用中 得到推广。为了提高种子检测的快速性,机器视觉技术、近红外光谱分析技术以及高光谱图 像技术这类的无损检测技术得到发展。机器视觉技术主要是利用种子外在形态学信息,而近 红外光谱技术是利用种子中所有有机分子含氢基团的化学特征信息。无论是机器视觉技术还 是近红外光谱分析技术都只能获得种子的单一性状信息,对于某些种子来说,不同品种间的 某些性状信息差异并不明显,如果仅仅依赖于这些单一性状信息,会降低种子纯度检测的准 确性。相比较,高光谱图像技术可以提供包含被测对象外在形态学特征,内部结构特征和化 学成分特征的所有信息,这些信息为种子纯度的准确检测提供了充分可靠的信息保证。因而 高光谱图像技术在农产品无损检测中得到广泛的应用。

利用高光谱图像技术进行种子纯度检测从本质上来说是个模式分类问题,其分类精 度受到分类特征信息的充分性、可靠性和有效性影响。因此模型更新对于提高模型的鲁棒性 和泛化能力具有重要的意义。以往的学者提出的模型更新方法选择大量样本来更新模型,这 种方式虽然能达到比较高的精度,但是费时费力。因此,寻找一种能选择代表性样本的模型 更新策略实现种子分类模型的更新就显得尤为重要。

发明内容

本发明的目的是克服以上技术的缺点,提供一种基于聚类算法的玉米种子高光谱图 像分类识别模型更新方法,其能够实现高光谱图像分类模型更新,省时省力,快速有效,且 可靠性高。

本发明提供的技术方案,所述的聚类算法的玉米种子高光谱图像分类识别模型更新 方法,具体的步骤包括:a、将待识别的玉米种子样本放置在高光谱图像采集系统中,采集并 获取所有玉米种子样本在N个波段下的N个高光谱图像;b、计算感兴趣区域内的光谱均值特 征,将所有玉米种子的N个波段下获得的共N个光谱均值特征作为待识别玉米种子的特征参 数矩阵Y;c、将步骤b所得到的玉米种子特征参数矩阵Y,依次输入数据,计算待识别玉米 种子与训练样本的匹配性;d、判断待识别玉米种子与训练样本的匹配性,若匹配不成功,则 通过化学分析测试,获得待识别玉米种子的类别,利用获得的待识别种子特征参数及其真实 类别,更新训练集和测试集;e、重复步骤(c-d),完成所有待识别玉米种子的匹配性判断,利 用新的训练集来建立新的最小二乘支持向量机检测模型fLS-SVM,用该模型来识别更新后的待 识别样本集。

进一步的,在步骤b中,获得玉米种子的特征参数包括:

首先选择待识别玉米种子轮廓最清晰的图像对应的波段(在782.59nm处),利用自 适应阈值分割法,获得该波段下的待识别玉米种子的轮廓曲线。将该轮廓曲线投射到N个波 段上,提取N个波段在该轮廓曲线内的光谱均值作为玉米种子的分类特征参数。

在步骤c中判断待识别玉米种子与训练样本的匹配性的操作包括:

按照步骤a、b获取h类共l个玉米种子的特征参数,并利用化学分析测试,获得其 类别标签,将类别标签相同的玉米种子构建为一个子训练集合,共得到h个子集合:

令D=[D1,…,Di,…,Dh]为h类样本的训练集,为有ni个样本的 第i类样本的子集合,T=D-Di为剔除第i类样本的子集合。对于给定的训练样本 xijDi,xikDi,和有类内距离和类间距离

Sij,k=||xij-xik||,xij,xikDi,jk---(1)

Pik,s=||xik-xis||,xikDi,xisTi---(2)

其中:1≤i≤h,||||表示2范数。

在计算第i类的K最小类内距离平均和K最小类间距离平均后,计算一个 判别指标

Thrik=DIik/DWik,i=1,...,h,k=1,...,ni---(3)

定义一个反映不同类样本间差异性的阈值Thi

Thi=mink=1:ni(Yhrik)×β---(4)

其中β为松弛系数。对h类训练样本,得到h个阈值(Th1,…,Thi,…,Thh)。

在步骤e中,建立玉米种子的最小二乘支持向量机检测模型fLS-SVM,具体包括:

利用步骤d中获得的h类共l个玉米种子的特征参数和类别标签,通过一对多方法, 构建h个子LS-SVM分类模型。其第k(1≤k≤h)个子模型的输出表达式zk(Y)为:

zk(Y)=sgn[Σj=1lβjK(Y,Yj)+b]---(5)

其中,sgn(·)为符号函数,Y为待识别玉米种子样本的特征参数,Yj为训练集玉米 种子样本的特征参数,βj和b均为待定系数。当大于等于零时,sgn(·)取值 为1,表示待识别样本Y属于第k类,否则不属于。

公式(5)中βj和b的取值由下列形式给出,

0-DDTΩ+γ-1Ebθ=0I---(6)

其中,θ=[β1…βj…βl]和b为待求解参数;D=[d1…dj…dl],当 训练样本Yj属于第k类时,dj=1,否则dj=-1。γ为为惩罚系数,E为l×l的单位方阵,I 为l×1的全1列向量;Ω是l×l的方阵,其第i行第j列的元素Ωij=didjK(Yi,Yj),核函数 选取:

K(Yik,Yjk)=exp(-||Yik-Yjk||22σ2)---(7)

高斯核函数K(Y,Yi)的核宽度参数和惩罚系数γ通过网格搜索方法获得。

进一步地,基于聚类算法的玉米种子高光谱图像分类识别模型更新方法,其特征在 于步骤d中判断待识别玉米种子与训练样本的匹配性,具体包括:

取一个待识别样本x,假设其属于第i类,则按式(1),(2)和(3)计算其判别指 标Thri,如果Thri≥Thi,则该待识别样本与所假设的第i类样本不匹配,此时将该待识别样本 归为更新样本,并利用化学分析测试,获得其类别标签,利用获得的待识别种子特征参数及 其真实类别,更新训练集;反之,不更新训练集。

附图说明

图1为本发明提供的基于聚类算法的玉米种子高光谱图像分类识别模型更新方法的 流程图。

具体实施方法

下面结合具体附图和优选实施例对本发明做进一步说明。

图1为本发明提供的基于聚类算法的玉米种子高光谱图像分类识别模型更新方法 的流程图,如图1所示,其中,基于最小二乘支持向量机的模型更新具体步骤包括:a、将待 识别的玉米种子样本放置在高光谱图像采集系统中,采集并获取所有玉米种子样本在N个波 段下的N个高光谱图像;b、计算感兴趣区域内的光谱均值特征,将所有玉米种子的N个波段 下获得的共N个光谱均值特征作为待识别玉米种子的特征参数矩阵Y;c、将步骤b所得到的 玉米种子特征参数矩阵Y,依次输入数据,计算待识别玉米种子与训练样本的匹配性;d、判 断待识别玉米种子与训练样本的匹配性,若匹配不成功,则通过化学分析测试,获得待识别 玉米种子的类别,利用获得的待识别种子特征参数及其真实类别,更新训练集和测试集;e、 重复步骤(c-d),完成所有待识别玉米种子的匹配性判断,利用新的训练集来建立新的最小二 乘支持向量机检测模型fLS-SVM,用该模型来识别更新后的待识别样本集。

进一步的,在步骤b中,获得玉米种子的特征参数包括:

首先选择待识别玉米种子轮廓最清晰的图像对应的波段(在782.59nm处),利用自 适应阈值分割法,获得该波段下的待识别玉米种子的轮廓曲线。将该轮廓曲线投射到N个波 段上,提取N个波段在该轮廓曲线内的光谱均值作为玉米种子的分类特征参数。

在步骤c中计算待识别玉米种子与训练样本的匹配性的操作包括:

按照步骤a、b获取h类共l个玉米种子的特征参数,并利用化学分析测试,获得其 类别标签,将类别标签相同的玉米种子构建为一个子训练集合,共得到h个子集合:

令D=[D1,…,Di,…,Dh]为h类样本的训练集,为有ni个样本的 第i类样本的子集合,T=D-Di为剔除第i类样本的子集合。对于给定的训练样本 xijDi,xikDi,xisTi,有类内距离和类间距离

Sij,k=||xij-xik||,xij,xikDi,jk---(1)

Pik,s=||xik-xis||,xikDi,xisTi---(2)

其中:1≤i≤h,||||表示2范数。

在计算第i类的K最小类内距离平均和K最小类间距离平均后,计算一个 判别指标

Thrik=DIik/DWik,i=1,...,h,k=1,...,ni---(3)

定义一个反映不同类样本间差异性的阈值Thi

Thi=mink=1:ni(Thrik)×β---(4)

其中β为松弛系数。对h类训练样本,得到h个阈值(Th1,…,Thi,…,Thh)。

在步骤e中,建立玉米种子的最小二乘支持向量机检测模型fLS-SVM,具体包括:

利用步骤d中获得的h类共l个玉米种子的特征参数和类别标签,通过一对多方法, 构建h个子LS-SVM分类模型。其第k(1≤k≤h)个子模型的输出表达式zk(Y)为:

zk(Y)=sgn[Σj=1lβjK(Y,Yj)+b]---(5)

其中,sgn(·)为符号函数,Y为待识别玉米种子样本的特征参数,Yj为训练集玉米种 子样本的特征参数,βj和b均为待定系数。当大于等于零时,sgn(·)取值为 1,表示待识别样本Y属于第k类,否则不属于。

公式(5)中βj和b的取值由下列形式给出,

0-DDTΩ+γ-1Ebθ=0I---(6)

其中,θ=[β1…βj…βl]和b为待求解参数;D=[d1…dj…dl],当 训练样本Yj属于第k类时,dj=1,否则dj=-1。γ为为惩罚系数,E为l×l的单位方阵,I 为l×1的全1列向量;Ω是l×l的方阵,其第i行第j列的元素Ωij=didjK(Yi,Yj),核函数 选取:

K(Yik,Yjk)=exp(-||Yik-Yjk||22σ2)---(7)

高斯核函数K(Y,Yi)的核宽度参数和惩罚系数γ通过网格搜索方法获得。

进一步地,基于聚类算法的玉米种子高光谱图像分类识别模型更新方法,其特征在 于步骤d中判断待识别玉米种子与训练样本的匹配性,具体包括:

取一个待识别样本x,假设其属于第i类,则按式(1),(2)和(3)计算其判别指 标Thri,如果Thri≥Thi,则该待识别样本与所假设的第i类样本不匹配,此时将该待识别样本 归为更新样本,并利用化学分析测试,获得其类别标签,利用获得的待识别种子特征参数及 其真实类别,更新训练集;反之,不更新训练集。

本发明的优势:提供一种基于聚类算法的玉米种子高光谱图像分类识别模型更新方 法,其能够实现高光谱图像分类模型更新,省时省力,快速有效,且可靠性高。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号