技术领域
本发明涉及模式识别和机器学习等领域,尤其是面向图像数据的不完整多视角聚类任务。
背景技术
计算机视觉是人工智能的门户,是人类视觉的延续,它让计算机拥有人能所见、人能所识、人能所思的能力,随着大数据时代的到来,计算机视觉逐渐成为信息科学、生物医学工程等诸多领域的重要研究对象。
21世纪是信息爆炸的时代,图像已经成为人们获取信息、表达信息和传递信息的重要手段,目前为止,图像的分类识别依然是图像处理领域中的难点,因为现实世界是多样的和复杂的,获取图像的途径也是多种多样的,这就使得不同的图像相互之间差别很大,难以用统一的方法和模型描述。而其中基于聚类分析的图像识别分析技术是图像领域中一类极其重要的应用广泛的而算法。
在图像处理等大多数计算机视觉领域中,图像数据往往有不同的来源或者由不同的特征所描述,例如一个人可以由不同角度的摄像机拍摄记录,一张图片可以由灰度、LBP、HOG等特征描述,我们把这种由多个特征描述的图像数据称为多视角数据。
现有的针对多视角数据的聚类方法假设图像数据中所有图像样本都是完整的,但在现实中,一些如设备故障、传输中断等干扰因素,往往会导致图像数据中的部分样本缺失,给多视聚类方法带来了巨大的挑战。因此,如何减少缺失图像的带来的不利影响,挖掘聚类模型的潜在信息,是一个值得关注的问题。
对于一幅图像,一方面可以由不同的特征描述不同的信息,同时这不同的特征之间也有一致性关联,而对于来自多视角的多个图像数据,当今多视聚类的瓶颈问题是如何从中分离并利用这种共享信息和个性信息,为解决该瓶颈问题,本研究方法从以下两个方面进行分析:1)多个graph模型对同一图像样本从不同角度描述,将其共享的一致性信息最大化;2)每个视角具有其他视角所不具有的个性化信息,有效利用这些固有的差异来进行聚类。
发明内容
针对以上问题,本发明提出一种基于不完整多视数据的聚类方法,用于解决图像分类识别问题。对于由不同特征所描述的不完整多视角图像数据集,构造每个视角下的初始图模型,用指示矩阵标记丢失图像的位置,提取关联矩阵从而实现不完整多视数据的聚类任务,有效提升图像识别的准确性与鲁棒性。
具体技术方案如下:
(1)获取待聚类的不完整多视角数据集
(2)根据自适应图学习方法,对数据集
(3)根据步骤(2)得到的不完整多图数据
(4)根据得到的一致性图C和一系列个性化图
进一步的,步骤(2)中所述的自适应图学习方法构造第m个视角的初始图A
第m个视角共有N
向量
进一步的,步骤(2)中所述的不完整多图聚类方法IMGC具体如下:
将M个视角的初始图
其中,N
指示矩阵W
有益效果
一种不完整多视数据的聚类方法比其他方法实现了更高的聚类精度和识别能力,这预示着未来在实际图像识别分类应用中的良好前景。
附图说明
图1、一种基于不完整多视聚类的图像识别方法流程图。
具体实施方式
一种不完整多视数据的聚类方法在样本缺失率分别为10%、20%、30%、40%、50%和60%的人脸数据集UMIST上进行评估,该数据集包括从20个对象中捕获的575个图像,共20个类别,每个类别有19-48张图像。我们提取该图像数据集的LBP、Gabor、Gist三个特征分别作为三个输入视角数据X
1)图像预处理:
对于不完整多视数据X
具体地,对于第m个视角下的输入图像数据X
2)聚类分析:
对于得到的不完整多图数据
其中,N
指示矩阵W
对于得到的C和一系列D
机译: 基于大量视觉特征变化的三维图像的视疲劳监测装置及方法,一种减少视疲劳度的装置及方法
机译: 一种基于语义相似度的电子文档自动迭代聚类的方法,一种基于语义相似度的聚类文档的多种搜索方法及计算机可读介质
机译: 用于移动机动车辆的车道标记识别方法,包括将具有相似亮度的相干图像与聚类进行组合以确定物体的形式,并基于形式和车道中的周期性布置来识别车道标记。