技术领域
本发明属于数字图像处理技术方向,涉及基于图像颜色和纹理特征的成品茶种类和等级识别方法。
背景技术
中国是茶叶原产地和生产、消费第一大国,茶叶种类繁多,形态各异,同时,一种茶叶往往还有不同等级品质的区分,不同等级茶叶品质要求悬殊,价格差异很大,偶有不法商家钻空子,以次充好欺骗消费者。因此,如果能够准确、高效的识别茶叶的种类乃至等级,对茶叶的生产、销售以及市场规范都有巨大的意义。
传统对成品茶种类和等级进行区分靠人类经验,越是性状接近的茶叶,越需要经验丰富的专家,区分准确率越低,而且人工区分主观性强、效率低、准确率不令人满意。因此亟需引入自动化手段实现成品茶的高效、准确分类。当前已有借助香气、味道、光谱、图像等信息对茶叶进行分类,都取得了一些结果,在这些信息中,图像无疑是效率最高、最易获得的信息,如果能借助茶叶图像对成品茶进行分类,可以大大提升分类效果。
当前有一些学者借助数字图像处理、计算机视觉等技术进行成品茶分类,通过提取图像特征导入分类器进行分类,准确率有高有低,稳定性差。但是当前研究往往停留在应用算法层面,并没有针对特定的需求进行参数优化,分类准确率还有提升空间。特别的,当前对同种茶叶不同等级的分类研究尚属空白,若能实现对同种茶叶等级的分类,能为茶叶分类自动化提供新的应用场景。
发明内容
为了解决现有技术中存在的上述技术问题,本发明提出了基于图像颜色和纹理特征的成品茶种类和等级识别方法,其具体技术方案如下:
基于图像颜色和纹理特征的成品茶种类和等级识别方法,包括如下步骤:
步骤1:使用拍摄装置采集茶叶图像并进行预处理;
步骤2:使用量化后的颜色直方图法提取图像颜色特征,存储为颜色特征向量;
步骤3:使用优化参数后的灰度共生矩阵法提取图像纹理特征,存储为纹理特征向量;
步骤4:建立支持向量机分类模型,将颜色特征向量和纹理特征向量合并后作为输入,使用网格搜索法优化支持向量机的核函数和参数,选取分类效果最理想的参数;
步骤5:使用优化后的分类模型对不同种类和等级的茶叶图像进行分类。
进一步的,所述步骤1具体包括:采用分辨率为1920×1080的工业相机进行图片拍摄采集,对所述图片提取中间部分作为感兴趣区域,感兴趣区域范围大小为600×540,将提取的感兴趣区域作为数据库图像。
进一步的,所述步骤2具体包括:通过使用Python编程语言,借助OpenCV模块将图像原始的RGB颜色模型转化为HSV颜色模型,根据人眼的感知特性设置量化规律,并采用所述量化规律的颜色直方图法提取72个图像颜色特征,即对逐个像素点量化并计数,输出为72维颜色特征,每个特征代表参数G取该值时像素点的数目,提取典型颜色量化直方图,存储72维颜色特征向量。
进一步的,所述采用的量化规律具体为:每个像素,分别包含有H(色调)、S(饱和度)和V(明度)三个分量,采用量化规律简化三个参数分量的范围,即:
引入参数G,令:
G=HQ
其中,Q
G=9H+3S+V
使用参数G替代每个像素的值,得到G的取值范围为G∈[0,1,...,70,71],再实行颜色直方图法进行颜色特征提取。
进一步的,所述步骤3具体包括:
使用Python编程语言,在Pycharm环境中编写灰度共生矩阵算法,选择灰度共生矩阵中的熵、对比度、能量和逆差矩4种纹理参数,并可视化灰度共生矩阵法中的步长d,得到4种纹理参数随步长d变化的规律,确定最优的步长d,在d确定的基础上,选择0°、45°、90°和135°4个方向上的4种纹理参数,计算4个方向的4种统计量并在各个方向上求平均,共16个特征值,存储为纹理特征向量。
进一步的,所述灰度共生矩阵的表达式为:
表示的是图像上一个灰度值i与灰度值j的像素点在θ方向上,距离为d时出现的概率,参数d的取值范围为d∈{1,2,3,4,5,6,7,8}。
进一步的,所述步骤4具体包括:
将颜色特征向量与纹理特征向量进行合并作为单张图片特征向量,建立数据集,按照4:1比例将数据集划分为训练集和测试集,建立支持向量机分类模型,将备选核函数设置为线性核函数和RBF核函数,采用网格搜索法分别对基于线性核函数的支持向量机模型参数和基于RBF核函数的支持向量机模型参数进行优化,分别得到两种核函数的最优模型,将测试集输入所述两种核函数的最优模型,选择准确率高的模型作为最终分类模型。
进一步的,所述参数进行优化具体包括:
步骤a:确定优化参数,当采用线性核函数时,优化参数为惩罚系数C;当采用RBF核函数时,优化参数为惩罚系数C和模型复杂度参数gamma;
步骤b:数据初始化,设定初始搜索步长及模型复杂度参数范围;
步骤c:网格搜索建模方法,采用10折交叉验证方法进行模型构建;
步骤d:根据网格搜索算法结束条件,得到最佳优化参数并输出;
其中,所述惩罚系数C的取值范围为[0.1,2],步长为0.1;模型复杂度参数gamma的取值范围为gamma∈{1e-08,1e-07,1e-06,1e-05,1e-04,0.001,0.01,0.1,1}。
本发明的有益效果是:充分利用图像的颜色和纹理特征,对特征提取方法和分类算法进行参数优化,不但能够实现对不同种类茶叶的准确高效区分,还能对同种茶叶不同等级进行区分,为茶叶品质自动化识别增加了应用场景。
附图说明
图1为本发明茶叶分类方法的流程图;
图2为ROI提取示意图;
图3为某款成品茶颜色特征直方图示意图;
图4a为四种茶成品茶纹理特征熵值统计量随步长d的变化规律;
图4b为四种茶成品茶纹理特征对比度值统计量随步长d的变化规律;
图4c为四种茶成品茶纹理特征能量值统计量随步长d的变化规律;
图4d为四种茶成品茶纹理特征逆差矩值统计量随步长d的变化规律;
图5a为金骏眉红茶不同等级纹理特征熵值统计量随步长d的变化规律;
图5b为金骏眉红茶不同等级纹理特征对比度值统计量随步长d的变化规律;
图5c为金骏眉红茶不同等级纹理特征能量值统计量随步长d的变化规律;
图5d为金骏眉红茶不同等级纹理特征逆差矩值统计量随步长d的变化规律;
图5e为碧螺春绿茶不同等级纹理特征熵值统计量随步长d的变化规律;
图5f为碧螺春绿茶不同等级纹理特征对比度值统计量随步长d的变化规律;
图5g为碧螺春绿茶不同等级纹理特征能量值统计量随步长d的变化规律;
图5h为碧螺春绿茶不同等级纹理特征逆差矩值统计量随步长d的变化规律。
具体实施方式
为了使本发明的目的、技术方案和技术效果更加清楚明白,下面结合说明书附图和实施例对本发明作进一步详细说明。
本发明的实施例如下:
茶叶种类图像数据库选择两种绿茶和和两种红茶,分别为金骏眉、正山小种、六安瓜片和碧螺春,每种采集100张图像;茶叶等级图像数据库分别包含4个不同等级的金骏眉和4个不同等级的碧螺春,每个等级采集100张图像。
如图1所示,基于图像颜色和纹理特征的成品茶种类和登记识别方法,具体包括:
步骤1,使用拍摄装置采集茶叶图像并进行预处理,具体为:
在自行设计的拍摄装置内进行图像采集,使用OSEECAM公司生产的H1603型CCD相机,分辨率为1920×1080,镜头为OSEECAM公司生产的H1605VT型,手动调节焦距;为保证拍摄效果一致性,自行设计了材质为黑色不透明亚克力板的暗箱拍摄装置和上下可调的相机与光源固定支座,以控制视野范围,照明采用环状LED灯;为了去除背景对分类结果的影响,减小计算量,如图2所示,对图像提取感兴趣区域(Region of Interest,ROI),即提取图像中心茶叶密集堆积部分矩形区域,尺寸为600×540,作为建库数据。
步骤2,使用量化后的颜色直方图法提取图像颜色特征,存储为颜色特征向量,具体为:
使用Python编程语言,借助OpenCV模块编写颜色模型转换、量化规律与颜色直方图法实现代码,对单张图片应用,首先通过OpenCV模块编写的颜色模型转换将所述图片转化为HSV颜色模型,根据人眼的感知特性设置量化规律,并通过所述量化规律的颜色直方图法提取72个图像颜色特征,即对逐个像素点量化并计数,输出为72维颜色特征,每个特征代表参数G取该值时像素点的数目,提取如图3所示的某典型颜色量化直方图,避免维度灾难,存储72维颜色特征向量备用。
具体的,所述量化规律为:对每个像素而言,分别包含有H(色调)、S(饱和度)和V(明度)三个分量,采用以下的量化规律简化三个参数分量的范围,即:
引入参数G,令:
G=HQ
其中,Q
G=9H+3S+V
使用参数G替代每个像素的值,得到G的取值范围为G∈[0,1,...,70,71],基于此实行颜色直方图法进行颜色特征提取。
步骤3,使用优化参数后的灰度共生矩阵法提取图像纹理特征,存储为纹理特征向量,具体为:
使用Python编程语言,在Pycharm环境中编写灰度共生矩阵算法,选择灰度共生矩阵中的熵、对比度、能量和逆差矩4种纹理参数,并可视化灰度共生矩阵法中的步长d,得到4种纹理参数随步长d变化的规律,确定最优的步长d,在d确定的基础上,选择0°、45°、90°和135°4个方向上的4种纹理参数,计算4个方向的4种统计量并在各个方向上求平均,共16个特征值,存储为纹理特征向量。绘制不同参数d时,每种茶叶和同种茶叶中每个等级的四种统计量平均值,得到结果如图4a-4d和图5a-5h所示,当参数d发生变化时,不同种类和等级茶叶的纹理特征值也会发生变化,若在d取某值时,不同种类和等级的茶叶纹理特征靠近或者交叉,则说明此时该特征区分度较差,若特征距离较远,离散度大,则说明区分度好,通过比较图4和图5所示可以得到,当d过大或过小时,有更多的特征集聚,因此d取中间位置参数,如4,5,6等,为方便计算,本发明统一取d=5。
具体的,设灰度共生矩阵P(i,j,d,θ)表示的是图像上一个灰度值i与灰度值j的像素点在θ方向上,距离为d时出现的概率,本质上是联合概率分布,考虑到实际应用情况,参数d的取值范围为d∈{1,2,3,4,5,6,7,8},表达式为:
步骤4,建立支持向量机分类器,将颜色特征向量和纹理特征向量合并后作为输入,使用网格搜索法优化支持向量机的核函数和参数,选取分类效果最理想的参数,具体为:将颜色特征向量与纹理特征向量进行合并作为单张图片特征向量,建立数据集,按照4:1比例将数据集划分为训练集和测试集;建立支持向量机分类模型,考虑到实际的特征量和样本量,将备选核函数设置为线性核函数和RBF核函数,采用网格搜索法,分别对基于线性核函数的支持向量机模型参数和基于RBF核函数的支持向量机模型参数进行优化,分别得到两种核函数的最优模型。在测试集上应用两种最优模型,选择准确率高的一种模型作为最终分类模型。
所述参数进行优化具体包括:
步骤a:确定优化参数,若采用线性核函数,优化参数为惩罚系数C;若采用RBF核函数,优化参数为惩罚系数C和模型复杂度参数gamma;
步骤b.:数据初始化,设定初始搜索步长及模型复杂度参数范围;
步骤c:网格搜索建模方法,采用10折交叉验证方法进行模型构建;
步骤d:根据网格搜索算法结束条件,得到最佳优化参数并输出。
其中,惩罚系数C的取值范围为[0.1,2],步长为0.1;模型复杂度参数gamma的取值范围为gamma∈{1e-08,1e-07,1e-06,1e-05,1e-04,0.001,0.01,0.1,1}
样本信息数据如表1所示:
表1茶叶样本数据库详细信息
应用网格搜索法分别搜索适用于线性核函数和RBF核函数的最佳参数,将网格搜索算法打分依据设定为测试集误分类数量,误分类数量越少打分越高。经过迭代可得,若核函数为线性核函数,C=0.5时打分最高,若核函数为RBF核函数时,C=0.5,gamma=0.0001时打分最高。分别取最优参数,成品茶种类和等级分类结果如表2和表3所示:
表2取最优参数时的成品茶种类识别结果
表3取最优参数时的成品茶等级识别结果
依据上表可以发现,在进行成品茶种类识别时,两种核函数优化参数后都展现出了卓越的分类性能,对四种成品茶分类准确率都超过了95%。在进行同种成品茶等级识别时,两种分类器都能对各等级的碧螺春展现出基本一致的卓越性能,分类准确率达到95%以上,但是,在区分3级,4级金骏眉时,参数优化后的线性核函数分类器准确率在73-76%,低于其他等级的95%以上。相比于线性核函数,RBF核函数在这个问题上表现较好,准确率提升到78.95%-80.95%。
综上所述,对茶叶图像进行感兴趣区域划分,再基于量化后的颜色直方图法和参数优化的灰度共生矩阵法提取颜色和纹理特征,合并后输入使用网格搜索法优化参数的支持向量机分类器中进行识别,可以高效、准确的实现成品茶种类和等级的自动化识别。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
机译: 用于显示指示器装置的像素的颜色等级和亮度等级选择装置,具有带有存储单元的存储器,其中关于颜色等级和亮度等级的不同组合的照明信息被存储在存储单元中
机译: 在医疗领域中用于产生患者的X射线和光学图像的X射线设备操作方法,涉及显示不同颜色和灰度等级的光学图像采集,取决于颜色和/或灰度等级的不透明度
机译: 等级差异识别装置,等级差异识别方法和等级差异识别程序