首页> 中国专利> 一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法

一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法

摘要

本发明公开了一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,包括样本预处理以及电子鼻装置预热步骤;将电子鼻的采样针头深入烧杯内对样本进行采样步骤;收集通过电子鼻的传感器阵列采集的气味数据并进行预处理步骤以及将预处理后的传感器原始数据进行特征识别步骤。本发明将半监督鉴别投影算法提取的低维特征向量作为自组织特征映射神经网络的输入模式向量,实现大闸蟹新鲜度等级的预测模型,能对样品进行无损检测并且检测精度大幅提高,能够实现快速、无损检测大闸蟹品质检测。

著录项

  • 公开/公告号CN106568907A

    专利类型发明专利

  • 公开/公告日2017-04-19

    原文格式PDF

  • 申请/专利权人 常熟理工学院;

    申请/专利号CN201610969507.7

  • 申请日2016-11-07

  • 分类号G01N33/12(20060101);G06N3/08(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人朱显国

  • 地址 215500 江苏省苏州市常熟市南三环路99号

  • 入库时间 2023-06-19 01:55:21

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-21

    授权

    授权

  • 2017-05-17

    实质审查的生效 IPC(主分类):G01N33/12 申请日:20161107

    实质审查的生效

  • 2017-04-19

    公开

    公开

说明书

技术领域

本发明提供了一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,涉及检测方法技术领域。

背景技术

大闸蟹因其味道鲜美、营养丰富,是久负盛名的美食,不仅在我国分布广泛,而且在欧洲和北美洲等地也有分布,是消费者竞相购买的传统水产品之一,具有较高的经济价值。但是对于不新鲜的大闸蟹而言,因自身酶的分解和各种细菌的滋生,会使大闸蟹肉体发生变质从而引起酸臭性发酵,慢慢地挥发出含氮产物、胺、氨气、醇类和含硫产物等具有腐败性特征的气体,有时甚至产生组胺等有毒物质,在高温蒸煮下无法破坏这种毒素,如食用而引起食物中毒,后果将不堪设想。

目前对于大闸蟹新鲜度、品质的评价通常采取感官评价和理化指标测定等方法,但是感官评价会受到个体差异和主观随意性等因素影响,准确性较差;理化指标在检测过程中不能达到快速检测的目的,而且具有破坏性,限制了在大闸蟹在保藏、运输和销售过程中进行的新鲜度检测。对于大闸蟹新鲜度等品质的检测还仅限于实验室生化法,而其他的水产品先后涌现出了一些较为先进快捷的信息技术,如超声波技术、计算机视觉技术、生物阻抗技术及近红外光谱分析技术等,其中电子鼻技术采用不同感应器得到样品中挥发性特征成分的整体信息,能够客观、准确、快捷地模仿人类的嗅觉功能,且具有重复性好、不损伤样品等特点,因此越来越受到科研人员的重视。应用于电子鼻的判断水产品新鲜度的关键在于后期的数据处理,包括数据预处理、特征选择、特征提取、分类识别等环节,其中特征提取是整个数据处理的关键。目前,特征提取主要无监督式学习算法如主成分分析(Principal component analysis,PCA),有监督式学习算法如线性判别分析(Linear DiscriminantAnalysis,LDA)和核主成分分析(kernel PCA,KPCA),以及半监督学习算法如基于聚类的Cluster-then-Label算法等。PCA、LDA这类线性降维算法的特点是将高维数据以矩阵运算的形式线性映射到一个低维子空间,其优点是学习过程及降维过程计算复杂度低,运算速度快,缺点是对于本质为非线性分布的数据降维效果不好。基于聚类的Cluster-then-Label在样本量较大时获得的聚类效果不明显。而KPCA这类非线性降维算法没有考虑样本的类别信息。另外这些算法大多在欧式空间分析电子鼻响应数据,不能充分挖掘蕴含在高维数据中的潜在信息。并且活体大闸蟹存储过程中挥发的气味信息差异较小,加上传感器阵列普遍存在基线漂移、重复性差等问题,导致这些传统的特征提取算法都无法精确判断大闸蟹的新鲜度。

发明内容

1、本发明的目的。

本发明提供了一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,首先采用电子鼻装置采集活体大闸蟹存储过程中散发的气味获取多维特征信息,通过半监督鉴别投影算法(Semi-supervised learning-unsupervised discriminantprojection,SS-UDP)对多维数据进行降维,再采用自组织特征映射神经网络实现对样本的分类识别,同时将平行样本的理化指标挥发性盐基氮的新鲜度无损检测结果作为参照标准,为快速、无损检测大闸蟹品质提供理论依据。SS-UDP算法是在流行学习算法无监督鉴别投影算法(unsupervised discriminant projection,UDP)基础上,与半监督的机器学习方法结合起来,进一步优化流行学习算法的性能。SS-UDP算法由于能够很好地挖掘非线性数据中的潜在几何结构和内在规律,同时充分利用少量的标签信息来来改善UDP算法的性能,因此这种算法较常见的特征提取算法如PCA、LDA和KPCA等具有能有效识别传感器微弱的变化信息的特点、达到提高检测精度的目的。

2、本发明所采用的技术方案。

本发明的基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,它包括以下几个步骤:

(1)样本预处理以及电子鼻装置预热;

(2)将电子鼻的采样针头深入烧杯内对样本进行采样;

(3)收集通过电子鼻的传感器阵列采集的气味数据并进行预处理;

(4)将预处理后的传感器原始数据进行特征识别:

(A)从瞬态、稳态信息中选择最有效表征气味信息的特征;

(B)通过半监督鉴别投影算法对气味信息的特征进行降维;

(C)采用自组织特征映射神经网络实现对样本的分类识别,获取大闸蟹新鲜度的预测等级;

(D)将平行样本的挥发性盐基氮测量数据作为样本新鲜度无损检测结果的参照标准。

更进一步具体实施方式:所述的步骤(1)中设置电子鼻采样时间对大闸蟹样本气味数据进行采样按照如下步骤进行:

(1a)、将购买的大闸蟹样本置于室温下回温2小时,再将回温后的大闸蟹放置在500ml烧杯中,用锡箔纸将容器口密封,顶空40分钟使其散发的气体充满整个容器,同时打开自制电子鼻装置的电源,对传感器阵列预热30分钟;

(1b)、预热、顶空静置结束后,设置电子鼻采样时间100秒,将采样针头深入烧杯内且要求每次采样的深度保持不变,打开真空气泵电源,将烧杯内顶空的气体抽入气室内,同时传感器阵列开始采样;采样结束后,洗气时间120秒,将管道内及气室中残留的气体快速清除,进行下一个样品实验。

更进一步具体实施方式:对所述的步骤(2)中电子鼻采样针头深入烧杯的深度保持不变。

更进一步具体实施方式:所述的步骤(2)中收集传感器阵列采集的气味数据并进行预处理包括:抑制噪声和电子鼻系统本身引起的干扰、提高信噪比以及补偿传感器阵列交叉响应带来的漂移影响。

更进一步具体实施方式:对所述的步骤(3)中预处理主要包括均值滤波、基线处理和异常数据剔除:均值滤波通过第i个原始采样点(i-N,i+N)邻域范围内的平均值来代替该点原来的数值,实现线性滤波从而减少空气噪声和硬件电源等干扰造成的数据小范围波动;基线处理采用差分基线处理方法,即将未处理的当前传感器响应数据x(t)减去前一个样本在采样阶段开始前将传感器洗气到基准值x(0),从而实现对传感器漂移的补偿,异常数据剔除即采用3σ准则对传感器获取的数据中异常数据进行剔除,实现对实验操作过程中引入的粗大误差或传感器的暂时中毒造成的异常数据。

更进一步具体实施方式:对所述的步骤(4)中气味信息即每次采样时7个传感器100秒内共采集700个原始数据,该数据通过预处理后作为气味特征提取前的有效数据:选取每个传感器有效数据中最大值、最小值、最大值与最小值之差、平均值以及方差构成一个7*5特征向量xi,作为样本i此次采样的气味特征值。

更进一步具体实施方式:对所述的步骤(4)中基于半监督鉴别投影的降维(B)具体实现步骤如下:

B1)构造整体样本集合:假设共有(L+N)样本数据构成整体样本集合,其中一类是有标签的样本集XL={x1,x2,...,xl},另一类是无标签的样本集XU={xl+1,xl+2,...,xN},并且有标签的样本集类别数为C=3(即新鲜、次新鲜和不新鲜三类大闸蟹);

B2)初始化参数:正则化参数α,β,热扩散比t,嵌入维数d,最近邻参数K;

B3)构造关系矩阵:对于给定的整体样本集合X=XL+XU,计算每个点周围的K个近邻之间距离,构建关系矩阵H=(hij)M×M,其公式如下

B4)构造局部散度核矩阵:假设有一个对角矩阵D,且则局部散度核矩阵L=D-H;

B5)对于整体样本集合X计算局部散度矩阵SL和非局部散度矩阵SN,计算公式如下:

B6)对于有标签的样本集XL计算类间散度矩阵SB和类内散度矩阵SW,计算公式为:

其中NC第C类训练样本的数目,整个样本均值为第C类样本的均值为

B7)求解下式的特征值和特征向量问题

(SB+αSN)w=λ(SW+βSL)w

找出其中最大的d个特征值λ1≥λ2≥...≥λd及其对应的特征向量W=(w1,w2,...,wd);

B8)通过特征向量W对有标签、无标签的数据集XL、XU进行投影,获取低维数的特征向量Y,其投影公式如下

Y={yi=WTxi,i=1,2,...,N}

其中W=(w1,w2,...,wd)。

更进一步具体实施方式:所述的步骤(4)中基于自组织特征映射神经网络的分类识别(C)具体实现步骤如下:

C1)将所述的步骤(B8)所获取低维数的特征向量Y作为自组织特征映射神经网络的输入;

C2)创建竞争网络,由于大闸蟹新鲜度类别数为3,故竞争层参数设置为3;

C3)将已知等级的样本集合作为训练集,对输入数据归一化处理,进行样本训练;

C4)将未知等级的样本数据作为测试集,并输入到训练好的网络进行测试,获取未知大闸蟹样本新鲜度的预测等级。

更进一步具体实施方式:所述的步骤(D)中按照水产行业标准GB/T5009.44规定的方法测定每个平行样本的挥发性盐基氮含量;根据水产行业标准SC3113-2002中对甲壳类水产品的规定,对各个大闸蟹样本的新鲜度等级进行划分,并以此作为大闸蟹新鲜度无损检测结果的参照标准。

更进一步具体实施方式:所述的步骤(4)中储存天数的分类信息为:即前三天数据为新鲜类、第四天到第五天为次新鲜类、第六天到第九天为不新鲜类。

3、本发明的有益效果。

(1)本发明在实验结果的基础上,确定了一种快速、无损判断大闸蟹新鲜度等级的方法。其通过在传感器阵列获取样本的原始数据,通过特征选择与特征提取从复杂的多维原始数据中来选择最有效的特征,反映气味的浓度信息,形成了一种快速、无损判断方法;

(2)通过半监督鉴别投影算法能够从原始的高维多传感器数据中有效获取最具有代表性的低维流行特征。较基于聚类的半监督式算法而言,这种低维流行特征更具有分离性能和聚类效果;较无监督鉴别投影算法而言,有标签的样本信息对于分类至关重要,故半监督鉴别投影算法能更好的表达和区分大闸蟹微弱浓度变化,提高了大闸蟹新鲜度等级判断的精确度。

(3)通过自组织特征映射神经网络构建大闸蟹新鲜度等级的预测模型,用半监督鉴别投影算法提取的低维数据作为网络的输入模式向量,通过网络的竞争与更新机制从而实现对模式向量的聚类和识别。自组织特征映射神经网络较反向传播网络等一类有监督学习的方法相比较,该算法更接近于人脑的认知过程,从而获得更高的聚类和识别能力。

综上所述,本发明通过半监督鉴别投影算法提取的低维数据作为自组织特征映射神经网络的输入模式向量,实现大闸蟹新鲜度等级的预测模型,能对样品进行无损检测并且检测精度大幅提高。

附图说明

图1本发明检测方法流程图;

图2本发明实例中响应信号图;

图3本发明实例中采用线性降维算法PCA的挥发性盐基氮结果图;

图4本发明实例中采用线性降维算法LDA的挥发性盐基氮结果图;

图5本发明实例中采用非线性算法KPCA的挥发性盐基氮结果图;

图6本发明实例中采用非线性算法SS-UDP的挥发性盐基氮结果图;

图7本发明实例中可视化分析对比图;

图8本发明实例中分类结果图。

具体实施方式

下面结合附图对本发明做进一步的阐述,以下的具体实施方式便于更好的理解本发明,但并不限定本发明。

实施例1

基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,它包括以下几个步骤:

(1)、将购买的大闸蟹样本置于室温下回温2小时,再将回温后的大闸蟹放置在500ml烧杯中,用锡箔纸将容器口密封,顶空40分钟使其散发的气体充满整个容器。同时打开自制电子鼻装置的电源,对传感器阵列预热30分钟。大闸蟹样本为同属于一个品种以及同一种状态下的蟹类产品。

自制电子鼻装置主要由密封气室、两进一出三通电磁阀、微型气泵、气管、传感器阵列等部件构成的气路模块和由传感器信号调理电路、气动元件控制电路、数据采集卡及上位机等构成电路模块组成。其中气体模块核心为传感器阵列,它包含7个金属半导体气敏传感器:日本的TGS系列TGS822、TGS2600、TGS2602、TGS2620和国产的MQ系列MQ135、MQ3、QS-01。

(2)、预热、顶空静置结束后,设置电子鼻采样时间100秒。将采样针头深入烧杯内且要求每次采样的深度保持不变,目的在于每次所得的数据具有较高重复性。

打开真空气泵电源,将烧杯内顶空的气体抽入气室内,同时传感器阵列开始采样。采样结束后,洗气时间120秒,将管道内及气室中残留的气体快速清除,进行下一个样品实验。

(3)、收集传感器阵列采集的气味数据并进行预处理,一方面抑制噪声和电子鼻系统本身引起的干扰,提高信噪比,另一方面补偿传感器阵列交叉响应带来的漂移影响,提高采样数据的可重复性。

预处理主要包括均值滤波、基线处理和异常数据剔除。均值滤波通过第i个原始采样点(i-N,i+N)邻域范围内的平均值来代替该点原来的数值,实现线性滤波从而减少空气噪声和硬件电源等干扰造成的数据小范围波动。基线处理采用差分基线处理方法,即将未处理的当前传感器响应数据x(t)减去前一个样本在采样阶段开始前将传感器洗气到基准值x(0),从而实现对传感器漂移的补偿。异常数据剔除即采用3σ准则对传感器获取的数据中异常数据进行剔除,实现对实验操作过程中引入的粗大误差或传感器的暂时中毒造成的异常数据。

(4)、将预处理后的传感器原始数据进行特征识别。首先从瞬态、稳态信息中选择最有效表征气味信息的特征,通过半监督鉴别投影算法对气味信息的特征进行降维,再采用自组织特征映射神经网络实现对样本的分类识别,获取大闸蟹新鲜度的预测等级。同时将平行样本的挥发性盐基氮测量数据作为大闸蟹新鲜度无损检测结果的参照标准,为快速、无损检测技术提供理论依据。

对所述的步骤(4)中气味信息即每次采样时7个传感器100秒内共采集700个原始数据,该数据通过预处理后作为气味特征提取前的有效数据。选取每个传感器有效数据中最大值、最小值、最大值与最小值之差、平均值以及方差构成一个7*5特征向量xi,作为样本i此次采样的气味特征值。

基于半监督鉴别投影的降维算法具体实现步骤如下:

1)构造整体样本集合:假设共有(L+N)样本数据构成整体样本集合,其中一类是有标签的样本集XL={x1,x2,...,xl},另一类是无标签的样本集XU={xl+1,xl+2,...,xN}。并且有标签的样本集类别数为C=3(即新鲜、次新鲜和不新鲜三类大闸蟹)。

2)初始化参数:正则化参数α,β,热扩散比t,嵌入维数d,最近邻参数K。

3)构造关系矩阵:对于给定的整体样本集合X=XL+XU,计算每个点周围的K个近邻之间距离,构建关系矩阵H=(hij)M×M,其公式如下

4)构造局部散度核矩阵:假设有一个对角矩阵D,且则局部散度核矩阵L=D-H。

5)对于整体样本集合X计算局部散度矩阵SL和非局部散度矩阵SN,计算公式如下:

6)对于有标签的样本集XL计算类间散度矩阵SB和类内散度矩阵SW,计算公式为:

其中NC第C类训练样本的数目,整个样本均值为第C类样本的均值为

7)求解下式的特征值和特征向量问题

(SB+αSN)w=λ(SW+βSL)w

找出其中最大的d个特征值λ1≥λ2≥...≥λd及其对应的特征向量W=(w1,w2,...,wd)。

8)通过特征向量W对有标签、无标签的数据集XL、XU进行投影,获取低维数的特征向量Y,其投影公式如下

Y={yi=WTxi,i=1,2,...,N}

其中W=(w1,w2,...,wd)。

基于自组织特征映射神经网络的分类识别具体实现步骤如下:

1)将所述的步骤(4)所获取低维数的特征向量Y作为自组织特征映射神经网络的输入。

2)创建竞争网络,由于大闸蟹新鲜度类别数为3,故竞争层参数设置为3。

3)将已知等级的样本集合作为训练集,对输入数据归一化处理,进行样本训练。

4)将未知等级的样本数据作为测试集,并输入到训练好的网络进行测试,获取未知大闸蟹样本新鲜度的预测等级。

按照水产行业标准GB/T5009.44规定的方法测定每个平行样本的挥发性盐基氮含量;根据水产行业标准SC3113-2002中对甲壳类水产品的规定,对各个大闸蟹样本的新鲜度等级进行划分,并以此作为大闸蟹新鲜度无损检测结果的参照标准,验证本发明提出的检测方法的正确性。

储存天数的分类信息为:即前三天数据为新鲜类、第四天到第五天为次新鲜类、第六天到第九天为不新鲜类。

上述的方法属于一种快速、无损地判断大闸蟹新鲜度的应用。

实施例2

以阳澄湖大闸蟹的新鲜度等级判断为例,采用本发明提出的一种基于半监督鉴别投影的大闸蟹新鲜度无损检测方法,其具体的检测流程图如图1所示。具体的步骤流程如下:

(1)从阳澄湖市场购买新鲜的大闸蟹样本60只,重量为105±5g,用保温桶加冰块快速运送至实验室,并将其放置在温度4℃、湿度90%的冰箱中,并做好标签。每天采用电子鼻装置采集其中50只样本的气味信息,持续检测9天,每个样本每天采样1次,每次采集时间100秒,图2为第五天其中一样本数据。从图2中可以看去传感器阵列中不同的传感器响应曲线变化并不相同,但随着采样时间的变化而响应值全部逐渐增大,说明采用电子鼻技术进行大闸蟹新鲜度无损检测是可行的。为了证明这种无损检测方式可行性,同时按照水产行业标准GB/T5009.44规定的方法测定剩下10只样本的理化指标挥发性盐基氮值,每个样本重复测量5次并取平均值作为当天该样本的挥发性盐基氮值,其变化趋势如图7所示。根据水产行业标准SC3113-2002中对甲壳类水产品的规定,对各个大闸蟹样本的新鲜度等级进行划分,即挥发性盐基氮(mgN/100g)小于15为新鲜,大于15且小于25为次新鲜,大于25为不新鲜。从图7中不难发现,大闸蟹在存储的前三天是新鲜的,第四、五天样本为次新鲜,第六天之后样本为不新鲜。

(2)由于电子鼻测量过程中存在空气噪声和硬件本身引起干扰、传感器的漂移,导致测量的数据失真,因此要进行一系列的预处理。预处理是对电子鼻装置中气敏传感器阵列的响应信息进行预加工,主要包括均值滤波、基线处理和异常数据剔除等操作,达到提高信噪比的目的,同时还可以提高采样数据的可重复性。

(3)由电子鼻装置采集的大闸蟹气味信息可知,每个样本测量一次可获得一个7*100数据矩阵,每天测量50个平行样本,可获得数据矩阵为50*7*100,实验中共测量了9天,最终获得一个50*7*100*9数据矩阵。但是对于如此复杂的多维数据,会增加分类算法运行成本和分类精度。本发明将从电子鼻测量的瞬态、稳态信息中选择最有效表征气味信息的特征,即选取每个传感器100个采样数据中的最大值、最小值、最大值与最小值之差、平均值以及方差构成特征向量,获得的数据矩阵为7*5,其中瞬态信息有最大值、最小值、最大值与最小值之差,稳态信息包含平均值和方差,因此9天共获得450个样本,每个样本维数为7*5。

(4)特征选择后,采用特征提取算法进行降维,得到可视化的分类结果如图3-图6所示(为了便于观测,选取了其中的10个样本进行观测)。本发明选择了2种线性降维算法PCA和LDA、以及非线性算法KPCA和SS-UDP,其中PCA为非监督式,LDA和KPCA为监督式算法,SS-UDP为半监督式算法。从图3-4中可以得知:无论是PCA还是LDA,线性降维算法均不能分开相邻两天的响应值,其中部分样本点的存在交叉,这主要与大闸蟹活体检测有关,相邻的两天气味变化不大,同时从分类图中并不能很好的区分样品是否新鲜。图5-6均为非线性降维算法的分类结果,相对于线性降维算法而言,这两种算法对于相邻两天的数据还是存在一定的交叉,但是可以看出9天的数据可以分为3类,分别是前三天为一类、第四天和第五天的数据为一类和最后几天的数据为一类,基本上与理化指标测量结果相符,说明非线性降维算法能够挖掘出不同新鲜度的大闸蟹气味响应中的非线性特点。但是从图6中更能发现三类样本点的距离更远、而同一类样本内的点更接近,同时第一类和第二类间的距离更近,这与理化指标的测量值完全一致,即前五天的大闸蟹均能食用,而第六天开始数据变化更大,说明此时大闸蟹开始腐烂,处于不新鲜的状态。相比而言,图5中第二类和第三类较为靠近,缺与第一类距离较远,且每类数据间样本分布比较分散,说明SS-UDP算法比KPCA算法更能提取到有效的分类信息。

(5)特征分类后还需要通过预测模型确定样本的类别信息,本发明通过自组织特征映射神经网络构建大闸蟹新鲜度等级的预测模型。首先,从所有样本中选取其中的390个作为训练样本,其余的60个样本作为测试样本。设定竞争层神经元个数为15,学习率为0.7,训练目标误差为0.01,最大迭代次数为1000。初始化所有输入神经元到输出神经元的权值,建立优胜领域,输入样本并进行归一化,计算并找去获胜节点,更新优胜领域,调整优胜领域内结点间的连接权值,计算输出,重复训练直至达到终止条件,即小于训练目标误差或分类不再改变或达到最大迭代次数。将60个未知等级的样本数据作为测试集输入到训练好的网络进行测试,获取未知大闸蟹样本新鲜度的预测等级,图8是60个测试样本的分类结果。从图8可以看出60个测试样本来自不同的存储天数,其中第一天到第三天的样本被判断为新鲜,第四和第五天的样本判断为次新鲜,第六天之后的样本都被判断为不新鲜,与图7理化指标判断的结果完全一致,说明本发明提出的大闸蟹新鲜度检测方法是可行的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号