首页> 中国专利> 基于支持向量机模型的图像分类预测方法及装置

基于支持向量机模型的图像分类预测方法及装置

摘要

本发明公开了一种基于支持向量机模型的图像分类预测方法及装置,本发明的方法包括:将待分类图像进行图像切割,提取待分类图像的设定部分图像;提取待分类图像的设定部分图像的颜色矩特征;构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别。本发明的图像分类预测方法的预测结果准确且预测方法简易方便推广。

著录项

  • 公开/公告号CN112926674A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 广东好太太智能家居有限公司;

    申请/专利号CN202110297687.X

  • 发明设计人 王妙玉;黄宇航;吴宁泉;

    申请日2021-03-19

  • 分类号G06K9/62(20060101);G06K9/34(20060101);G06K9/46(20060101);

  • 代理机构44288 广州市越秀区哲力专利商标事务所(普通合伙);

  • 代理人成婵娟

  • 地址 511434 广东省广州市番禺区化龙镇石化路21号之一、之二

  • 入库时间 2023-06-19 11:19:16

说明书

技术领域

本发明涉及视觉图像领域,具体涉及一种基于支持向量机模型的图像分类预测方法及装置。

背景技术

对于图像的分类多是根据经验并通过肉眼观察进行判断,存在主观性引起的观察性偏倚,使观察结果的可比性,可重复性降低,不易推广应用。当前,数字图像处理技术为计算机监控技术在图片分类的应用提供更大的空间。例如,通过神经网络模型实现图像分类、行人检测以及医学诊断等问题。相关技术中,通过同一个图像分类模型对样本集(训练集)训练,得到单个图像分类模型;并根据单个图像分类模型对所有待分类图像(测试集)进行分类识别,得到分类结果。但采用这种深度模型进行分类方法复杂,非常依赖参数,比如学习率,隐含层的结构与节点个数。参数的好坏会极大影响神经网络的分类效果和准确率,不利于在图像分类上进行大规模推广应用。

发明内容

鉴于以上技术问题,本发明的目的在于提供一种基于支持向量机模型的图像分类预测方法及装置,解决现有的图像的分类方法依赖人工判断或采用神经网络模型准确率低或方法复杂的问题。

本发明采用以下技术方案:

一种基于支持向量机模型的图像分类预测方法,包括:

将待分类图像进行图像切割,提取待分类图像的设定部分图像;

提取待分类图像的设定部分图像的颜色矩特征;

构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别。

进一步的,所述将待分类图像进行图像切割,提取待分类图像的设定部分图像的步骤包括:

截取宽从第

进一步的,构建支持向量机模型的步骤包括:

获取图像样本;

提取图像样本的设定部分图像和图像样本的类别;

提取图像样本的设定部分图像的颜色矩特征,得到样本颜色矩特征;

将样本颜色矩特征作为支持向量机模型的训练样本输入,得到预测的训练样本的图像分类类别;

若预测的训练样本的分类准确率达不到预设值,调整所述支持向量机模型的参数,直到预测的训练样本的分类准确率达到预设值。

进一步的,所述提取待分类图像的设定部分图像的颜色矩特征的步骤包括:

分别按颜色通道提取所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征,形成待分类图像的颜色矩特征向量。

进一步的,所述分别按颜色通道提取所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征的步骤包括:

分别按R、G、B三个颜色通道提取所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征。

进一步的,所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征满足以下公式:

其中,E

进一步的,将样本颜色矩特征作为所述支持向量机模型的训练样本输入的步骤包括:

将样本颜色矩特征统一乘以常数k后,作为所述支持向量机模型的训练样本输入。

进一步的,所述常数k根据预测的训练样本的分类准确率进行调整。

基于支持向量机模型的图像分类预测装置,包括:

切割模块,用于将待分类图像进行图像切割,提取待分类图像的设定部分图像;

特征提取模块,用于提取待分类图像的设定部分图像的颜色矩特征;

预测模块,用于构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别。

一种计算机存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现所述的基于支持向量机模型的图像分类预测方法。

相比现有技术,本发明的有益效果在于:

本发明通过将待分类图像进行图像切割,提取待分类图像的设定部分图像;提取待分类图像的设定部分图像的颜色矩特征;构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别,图像分类预测结果准确且预测方法简易方便推广。

附图说明

图1为本发明一实施例提供的一种基于支持向量机模型的图像分类预测方法的流程示意图;

图2为本发明一实施例中构建支持向量机模型的示意图;

图3为本发明另一实施例提供的一种电子设备的结构示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例:

实施例一:

参照图1,示出了本发明实施例的一种基于支持向量机模型的图像分类预测方法,包括:

步骤S1:将待分类图像进行图像切割,提取待分类图像的设定部分图像;

可选的,所述将待分类图像进行图像切割,提取待分类图像的设定部分图像的步骤包括:

截取宽从第

在本实施例中,通过截取宽从第

步骤S2:提取待分类图像的设定部分图像的颜色矩特征;

采集的图像数据维度过大,不容易分析,需要从中提取图像的特征,提取反映图像本质的一些关键指标,以到达自动进行图像识别或分类的目的。显然,图像特征提取是图像识别或分类的关键步骤,图像特征提取的效果直接影响到图像识别和分类的好坏。

图像特征主要包括颜色特征、纹理特征、形状特征和空间关系特征等。与几何特征相比,颜色特征更为稳健,对于物体的大小和方向均不敏感,表现出较强的“鲁棒性”。颜色特征是一种全局特征,所有属于图像或图像区域所对应景物的表面性质。一般颜色特征是基于像素点的特征,所有属于图像或图像区域的像素都有各自的贡献。

应理解,基于颜色矩提取图像特征的数据基础为图像中任何的颜色分布均可用它的矩来表示。根据概率论的理论,随机变量的概率分布可以由其各阶矩表示和描述。一幅图像的色彩分布也可认为是一种概率分布,那么图像可以由其各阶矩来描述。

颜色矩是一种简单有效的颜色特征表示方法,有一阶矩(均值,)、二阶矩(方差)和三阶矩(斜度)等,由于颜色信息主要分布于低阶矩中,所以仅采用颜色的一阶矩、二阶矩和三阶矩就足以表达图像的颜色分布,颜色矩可有效地表示图像中的颜色分布。采用颜色矩方法的优点在于:无需对特征进行向量化,可过滤图像以缩小检索范围。

在本实施例中,颜色矩包括各个颜色通道的一阶矩、二阶矩和三阶矩,对于一幅RGB颜色空间的图像,具有R、G和B三个颜色通道,则有9个分量。

在本发明中,通过提取设定部分图像的颜色矩特征,既可提取到图像或图像区域所对应景物的表面性质,计算又比较简易,有利于提高分类效率。通过采用颜色矩方法还避免了从图像中提取颜色特征时先要对图像进行量化处理,避免了量化处理容易导致误检,且产生的图像特征维数较高不利于检索的问题。

步骤S3:构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别。

需要说明的是,支持向量机(Support Vector Machine,简称SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类的广义线性分类器(generalizedlinear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-marginhyperplane);SVM支持向量机使用铰链损失函数(hinge loss)计算经验风险(empiricalrisk)并在求解系统中加入了正则化项以优化结构风险(structural risk),是一个具有稀疏性和稳健性的分类器。

在构建支持向量机模型过程中,所述支持向量机模型的样本输入和建模参数说明如下表:

表:向量机模型的样本输入和建模参数说明

其中,表的1~9行为输入的颜色矩特征,发现所述输入的颜色矩特征取值范围都在0~1之间,如果直接输入SVM模型,彼此之间区分度会比较小,因此,可以将所有特征都统一乘以一个适当的常数k,从而提高区分度和准确度。常数k的选取不能过大,也不能过小,过小导致区分度较低,模型精确度差,较大则容易导致模型在训练样本中过拟合,总的来说,k过大过小都会导致测试样本的准确率下降,所以可以根据测试准确率来选择k的最优值。

具体的,可以通过以下步骤来选择:

首先,计算k、训练样本准确率和测试样本准确率之间的关系;

假设当k=1000,则训练样本准确率可以达到100%,但测试样本准确率可能低于20%。此时为“过拟合”;

假设当k=1,可能训练样本被提取的特征之间的差别比较小,导致训练出来的模型不能很好地匹配,表现得很差,甚至样本本身都无法高效的识别,此时为“欠拟合”。这样,得到k值过大过小都会影响准确率。

然后,根据测试准确率来选择k的最优值。常用方法可以使用“K折交叉验证”。

具体的,“K折交叉验证”方法包括:将数据集等比例划分成K份,以其中的一份作为测试数据,其他的K-1份数据作为训练数据。然后,这样算是一次实验,K折交叉验证实验K次后算完成完整的一次试验,也就是说交叉验证实际是把实验重复做了K次,每次实验都是从K个部分选取一份不同的数据部分作为测试数据(保证K个部分的数据都分别做过测试数据),剩下的K-1个当作训练数据,最后把得到的K个实验结果进行平均,根据平均下来的准确率来选择最优值K。平均下来的准确率最高时,作为最优值K。

可选的,参照图2,示出了构建支持向量机模型的示意图,具体包括:

样本数据采集:

数据预处理:通过图像切割,提取图像样本的设定部分图像;提取图像样本的设定部分图像的颜色矩特征,得到样本颜色矩特征;

构建模型:将样本颜色矩特征作为所述支持向量机模型的训练样本输入,得到预测的训练样本的图像分类类别;

在具体应用中,提取图像切割后的图像颜色矩,作为图像的颜色特征。在颜色矩的提取中,同时提取每个图像在文件名中的类别和序号,同时针对所有的图片都进行同样的操作。

若预测的训练样本的分类准确率达不到预设值,调整所述支持向量机模型的参数,直到预测的训练样本的分类准确率达到预设值。

图像分类:若模型对于图像的分类准确率达到理想值,即可将模型应用于图像分类预测中,获取图像分类结果。

在实际应用中,可对图像样本的类别特征进行标注,其中,标注类别特征,就是我们常见的打标签,一般是从既定的标签中选择数据对应的标签,是一个封闭集合。每张图像都可以有一个或者多个类别特征或者标签;例如,成人、女、黄种人、长发等等。需要说明的是,图像样本组成图像样本集,本实施例中涉及到的图像样本集也可以被称为训练集。

图像的类比还可以是其他类比,例如:人物肖像图像、景物图像等,可通过各种类别的图像识别模型根据不同的需求对所述样本图像数据标注,例如所述样本图像数据为人物肖像图像时,可通过人脸识别模型对该样本图像数据进行识别,进行标注;例如社交软件中的用户肖像图像,可通过用户注册的性别对所述样本图像数据预先标注性别分类,作为所述图像样本数据的标准分类。

其中,将样本颜色矩特征作为所述支持向量机模型的训练样本输入的步骤可包括:

将样本颜色矩特征统一乘以常数k后,作为所述支持向量机模型的训练样本输入。

可选的,所述常数k根据预测的训练样本的分类准确率进行调整。

常数k的选取不能过大,也不能过小,过小导致区分度较低,模型精确度差,较大则容易导致模型在训练样本中过拟合,总的来说,k过大过小都会导致测试样本的准确率下降,所以可以根据测试准确率来选择k的最优值。在预测的训练样本的分类准确率达不到预设值,通过调整所述k的值,可提高图像分类的准确率。

作为一种实施方式,所述步骤S2包括:分别按颜色通道提取所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征,形成待分类图像的颜色矩特征向量。

具体的,可包括:

分别按R、G、B三个颜色通道提取所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征。

可选的,所述设定部分图像的一阶矩、二阶矩和三阶矩的颜色矩特征满足以下公式:

其中,E

本发明利用基于计算机视觉的数据图像处理技术,提取图像的特征,取所有测试样本为输入样本,代入构建好的支持向量机模型,得到输出结果,实现图像的分类预测,方法简单且准确率高。

实施例二:

本发明的另一实施例的基于支持向量机模型的图像分类预测装置,包括:

切割模块,用于将待分类图像进行图像切割,提取待分类图像的设定部分图像;

特征提取模块,用于提取待分类图像的设定部分图像的颜色矩特征;

其中,采集的图像数据维度过大,不容易分析,需要从中提取图像的特征,提取反映图像本质的一些关键指标,已到达自动进行图像识别或分类的目的。显然,图像特征提取是图像识别或分类的关键步骤,图像特征提取的效果直接影响到图像识别和分类的好坏。

预测模块,用于构建支持向量机模型,将待分类图像的颜色矩特征作为所述支持向量机模型的输入,得到输出结果,将输出结果作为预测的待分类图像的分类类别。

实施例三:

图3为本申请实施例提供的一种电子设备的结构示意图,在本申请中可以通过图3所示的示意图来描述用于实现本申请实施例的本发明一种基于支持向量机模型的图像分类预测方法的电子设备100。

如图3所示的一种电子设备的结构示意图,电子设备100包括一个或多个处理器102、一个或多个存储装置104,这些组件通过总线系统和/或其它形式的连接机构(未示出)互连。应当注意,图3所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备可以具有图3示出的部分组件,也可以具有图3未示出的其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。

本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。

对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号