首页> 中国专利> 基于聚类算法的玉米种子高光谱图像分类识别模型更新方法

基于聚类算法的玉米种子高光谱图像分类识别模型更新方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了基于聚类算法的玉米种子高光谱图像分类识别模型更新方法，包括：基于采集所有待识别玉米种子在N个波段下的N个高光谱图像，计算感兴趣区域内的光谱均值特征，作为特征参数，依次输入数据，计算待识别玉米种子与检测模型的匹配性；判断匹配性，若匹配不成功，则通过化学分析测试，获得待识别玉米种子的类别，利用获得的待识别种子特征参数及其真实类别，更新训练集；在完成所有待识别玉米种子的匹配性判断后,利用新的训练集来建立新的最小二乘支持向量机检测模型fLS-SVM,用fLS-SVM来识别更新后的待识别样本集。本发明提供了一种基于聚类算法的玉米种子高光谱图像分类识别模型更新方法，能够实现高光谱图像分类模型的更新，效果好，且可靠性高。

著录项

公开/公告号CN105224960A

专利类型发明专利
公开/公告日2016-01-06

原文格式PDF
申请/专利权人江南大学;
展开▼

申请/专利号CN201510741678.X
发明设计人黄敏;何楚婕;朱启兵;
展开▼

申请日2015-11-04
分类号G06K9/62(20060101);
代理机构
代理人
地址 214122 江苏省无锡市滨湖区蠡湖大道1800号
入库时间 2023-12-18 13:18:56

法律信息

法律状态公告日

法律状态信息

法律状态
2018-07-20

授权

授权
2016-02-03

实质审查的生效 IPC(主分类):G06K9/62 申请日:20151104

实质审查的生效
2016-01-06

公开

公开

说明书

技术领域

本发明涉及一种玉米种子高光谱图像分类模型的更新方法，尤其是一种基于聚类算法的玉米种子高光谱图像分类识别模型更新方法。

背景技术

近年来，随着种子杂交技术的广泛应用，种子的品种越来越多，类间相似性越来越大，混杂现象日趋严重，这导致品种区分越来越困难，种子的纯度问题也越来越受到人们的关注。种子的纯度反映种子质量的重要参数，是评定种子等级的主要依据。传统的种子纯度检测方法存在着鉴定时间长、人员依赖性强、对种子具有破坏性等缺点，难以在实际应用中得到推广。为了提高种子检测的快速性，机器视觉技术、近红外光谱分析技术以及高光谱图像技术这类的无损检测技术得到发展。机器视觉技术主要是利用种子外在形态学信息，而近红外光谱技术是利用种子中所有有机分子含氢基团的化学特征信息。无论是机器视觉技术还是近红外光谱分析技术都只能获得种子的单一性状信息，对于某些种子来说，不同品种间的某些性状信息差异并不明显，如果仅仅依赖于这些单一性状信息，会降低种子纯度检测的准确性。相比较，高光谱图像技术可以提供包含被测对象外在形态学特征，内部结构特征和化学成分特征的所有信息，这些信息为种子纯度的准确检测提供了充分可靠的信息保证。因而高光谱图像技术在农产品无损检测中得到广泛的应用。

利用高光谱图像技术进行种子纯度检测从本质上来说是个模式分类问题，其分类精度受到分类特征信息的充分性、可靠性和有效性影响。因此模型更新对于提高模型的鲁棒性和泛化能力具有重要的意义。以往的学者提出的模型更新方法选择大量样本来更新模型，这种方式虽然能达到比较高的精度，但是费时费力。因此，寻找一种能选择代表性样本的模型更新策略实现种子分类模型的更新就显得尤为重要。

发明内容

本发明的目的是克服以上技术的缺点，提供一种基于聚类算法的玉米种子高光谱图像分类识别模型更新方法，其能够实现高光谱图像分类模型更新，省时省力，快速有效，且可靠性高。

本发明提供的技术方案，所述的聚类算法的玉米种子高光谱图像分类识别模型更新方法，具体的步骤包括：a、将待识别的玉米种子样本放置在高光谱图像采集系统中，采集并获取所有玉米种子样本在N个波段下的N个高光谱图像；b、计算感兴趣区域内的光谱均值特征，将所有玉米种子的N个波段下获得的共N个光谱均值特征作为待识别玉米种子的特征参数矩阵Y；c、将步骤b所得到的玉米种子特征参数矩阵Y，依次输入数据，计算待识别玉米种子与训练样本的匹配性；d、判断待识别玉米种子与训练样本的匹配性，若匹配不成功，则通过化学分析测试，获得待识别玉米种子的类别，利用获得的待识别种子特征参数及其真实类别，更新训练集和测试集；e、重复步骤(c-d),完成所有待识别玉米种子的匹配性判断,利用新的训练集来建立新的最小二乘支持向量机检测模型f_LS-SVM,用该模型来识别更新后的待识别样本集。

进一步的，在步骤b中，获得玉米种子的特征参数包括：

首先选择待识别玉米种子轮廓最清晰的图像对应的波段(在782.59nm处)，利用自适应阈值分割法，获得该波段下的待识别玉米种子的轮廓曲线。将该轮廓曲线投射到N个波段上，提取N个波段在该轮廓曲线内的光谱均值作为玉米种子的分类特征参数。

在步骤c中判断待识别玉米种子与训练样本的匹配性的操作包括：

按照步骤a、b获取h类共l个玉米种子的特征参数，并利用化学分析测试，获得其类别标签,将类别标签相同的玉米种子构建为一个子训练集合，共得到h个子集合：

令D＝[D₁，…,D_i,…,D_h]为h类样本的训练集，为有n_i个样本的第i类样本的子集合，T＝D-D_i为剔除第i类样本的子集合。对于给定的训练样本 $x_{i}^{j} \in D_{i}, x_{i}^{k} \in D_{i},$ 和有类内距离和类间距离

$S_{i}^{j, k} = | | x_{i}^{j} - x_{i}^{k} | |, x_{i}^{j}, x_{i}^{k} \in D_{i}, j \neq k - - - (1)$

$P_{i}^{k, s} = | | x_{i}^{k} - x_{i}^{s} | |, x_{i}^{k} \in D_{i}, x_{i}^{s} \in T_{i} - - - (2)$

其中：1≤i≤h，||||表示2范数。

在计算第i类的K最小类内距离平均和K最小类间距离平均后，计算一个判别指标

${Thr}_{i}^{k} = {DI}_{i}^{k} / {DW}_{i}^{k}, i = 1, ..., h, k = 1, ..., n_{i} - - - (3)$

定义一个反映不同类样本间差异性的阈值Th_i：

${Th}_{i} = \underset{k = 1 : n_{i}}{m i n} ({Yhr}_{i}^{k}) \times β - - - (4)$

其中β为松弛系数。对h类训练样本，得到h个阈值(Th₁,…,Th_i,…,Th_h)。

在步骤e中，建立玉米种子的最小二乘支持向量机检测模型f_LS-SVM，具体包括：

利用步骤d中获得的h类共l个玉米种子的特征参数和类别标签，通过一对多方法，构建h个子LS-SVM分类模型。其第k(1≤k≤h)个子模型的输出表达式z^k(Y)为：

$z^{k} (Y) = s g n [Σ_{j = 1}^{l} β_{j} K (Y, Y_{j}) + b] - - - (5)$

其中,sgn(·)为符号函数，Y为待识别玉米种子样本的特征参数，Y_j为训练集玉米种子样本的特征参数，β_j和b均为待定系数。当大于等于零时，sgn(·)取值为1，表示待识别样本Y属于第k类，否则不属于。

公式(5)中β_j和b的取值由下列形式给出，

$(\begin{matrix} 0 & - D \\ D^{T} & Ω + γ^{- 1} E \end{matrix}) (\begin{matrix} b \\ θ \end{matrix}) = (\begin{matrix} 0 \\ I \end{matrix}) - - - (6)$

其中，θ＝[β₁…β_j…β_l]和b为待求解参数；D＝[d₁…d_j…d_l]，当训练样本Y_j属于第k类时，d_j＝1，否则d_j＝-1。γ为为惩罚系数，E为l×l的单位方阵，I 为l×1的全1列向量；Ω是l×l的方阵，其第i行第j列的元素Ω_ij＝d_id_jK(Y_i,Y_j)，核函数选取：

$K (Y_{i}^{k}, Y_{j}^{k}) = \exp (- \frac{| | Y_{i}^{k} - Y_{j}^{k} | |^{2}}{2 σ^{2}}) - - - (7)$

高斯核函数K(Y,Y_i)的核宽度参数和惩罚系数γ通过网格搜索方法获得。

进一步地，基于聚类算法的玉米种子高光谱图像分类识别模型更新方法，其特征在于步骤d中判断待识别玉米种子与训练样本的匹配性，具体包括：

取一个待识别样本x，假设其属于第i类，则按式(1)，(2)和(3)计算其判别指标Thr_i，如果Thr_i≥Th_i，则该待识别样本与所假设的第i类样本不匹配，此时将该待识别样本归为更新样本，并利用化学分析测试，获得其类别标签，利用获得的待识别种子特征参数及其真实类别，更新训练集；反之，不更新训练集。

附图说明

图1为本发明提供的基于聚类算法的玉米种子高光谱图像分类识别模型更新方法的流程图。

具体实施方法

下面结合具体附图和优选实施例对本发明做进一步说明。

图1为本发明提供的基于聚类算法的玉米种子高光谱图像分类识别模型更新方法的流程图，如图1所示，其中，基于最小二乘支持向量机的模型更新具体步骤包括：a、将待识别的玉米种子样本放置在高光谱图像采集系统中，采集并获取所有玉米种子样本在N个波段下的N个高光谱图像；b、计算感兴趣区域内的光谱均值特征，将所有玉米种子的N个波段下获得的共N个光谱均值特征作为待识别玉米种子的特征参数矩阵Y；c、将步骤b所得到的玉米种子特征参数矩阵Y，依次输入数据，计算待识别玉米种子与训练样本的匹配性；d、判断待识别玉米种子与训练样本的匹配性，若匹配不成功，则通过化学分析测试，获得待识别玉米种子的类别，利用获得的待识别种子特征参数及其真实类别，更新训练集和测试集；e、重复步骤(c-d),完成所有待识别玉米种子的匹配性判断,利用新的训练集来建立新的最小二乘支持向量机检测模型f_LS-SVM,用该模型来识别更新后的待识别样本集。