首页> 中国专利> 多模态特征选择与图像数据分类方法、装置及计算机设备

多模态特征选择与图像数据分类方法、装置及计算机设备

摘要

本发明公开一种多模态特征选择与图像数据分类方法、装置及计算机设备。该多模态特征选择方法包括:分别获取对应多个模态的多张图像的数据集;分别对所述多张图像进行特征提取,分别确定与所述多个模态相对应的多个第一特征集;以及基于预设的多模态特征选择模型,对所述多个第一特征集中的特征进行筛选,确定第二特征集;其中,所述多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于所述第二特征集构建的特征空间后的距离最小。根据本发明提供的多模态特征选择方法,能够有效地诱导多模态特征选择模型选择出具有高判别性的特征。

著录项

  • 公开/公告号CN112749718A

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利号CN201911051486.0

  • 发明设计人 祖辰;罗尚勇;

    申请日2019-10-31

  • 分类号G06K9/62(20060101);G06K9/46(20060101);

  • 代理机构11438 北京律智知识产权代理有限公司;

  • 代理人孙宝海;袁礼君

  • 地址 100086 北京市海淀区知春路76号8层

  • 入库时间 2023-06-19 10:51:07

说明书

技术领域

本发明涉及计算机技术领域,尤其涉及一种多模态特征选择与图像数据分类方法、装置、计算机设备及计算机可读存储介质。

背景技术

以医学成像领域为例,多模态图像指就同一临床诊断,同时从MRI(MagneticResonance Imaging,核磁共振成像)和PET(Position Emission Tomography,正电子发射成像)等不同渠道获得的图像。随着图像数据的增多,通过手工勾画的方式分析多模态图像使医生的工作负担不断加重,因此目前迫切需要计算机辅助技术对多模态图像进行分析处理。

在多模态图像分析中,由于从原始医学图像中提取的特征通常具有较高维数,而临床中仅有少量样本包含完整的多模态数据,应用时很有可能产生维数灾难。而深度学习需要使用大量样本对模型进行训练,如果在高维特征下样本数较少,将会导致严重的过拟合问题。因此,如何通过特征学习选择保留部分具有高判别性的特征,以有效地改善机器学习算法泛化能力,是目前多模态图像分析领域面临的重要课题。

需要说明的是,在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

有鉴于此,本发明提供一种多模态特征选择与图像数据分类方法、装置、计算机设备及计算机可读存储介质。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明的一方面,提供一种多模态特征选择方法,包括:分别获取对应多个模态的多张图像的数据集,每张图像的数据集包含对应图像多个位置点的多个图像数据;分别对所述多张图像进行特征提取,分别确定与所述多个模态相对应的多个第一特征集;以及基于预设的多模态特征选择模型,对所述多个第一特征集中的特征进行筛选,确定第二特征集;其中,所述多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于所述第二特征集构建的特征空间后的距离最小。

根据本发明的一实施方式,所述距离子模型包含标号对齐的正则化函数。

根据本发明的一实施方式,所述标号对齐的正则化函数如下式:

其中,μ为正则化参数,p、q表示模态,w

其中,y

根据本发明的一实施方式,所述多模态特征选择模型的目标函数基于加速近似梯度算法实现求解。

根据本发明的一实施方式,分别对所述多张图像进行特征提取包括:根据预定义模板,分别对每个模态的图像进行特征提取。

根据本发明的另一方面,提供一种图像数据分类方法,包括:获取待分类图像数据;以及在根据上述任一种多模态特征选择方法确定的第二特征集构建的特征空间中,通过预先训练的分类器模型,对所述待分类图像数据进行分类。

根据本发明的一实施方式,所述分类器模型为支持向量机模型。

根据本发明的一实施方式,所述支持向量机模型根据各模态图像中两两图像数据对应的核矩阵的线性组合进行预先训练,所述两两图像数据在各模态图像中的位置相同。

根据本发明的再一方面,提供一种多模态特征选择装置,包括:数据获取模块,用于分别获取对应多个模态的多张图像的数据集,每张图像的数据集包含对应图像多个位置点的多个图像数据;特征提取模块,用于分别对所述多张图像进行特征提取,分别确定与所述多个模态相对应的多个第一特征集;以及特征选择模块,用于基于预设的多模态特征选择模型,对所述多个第一特征集中的特征进行筛选,确定第二特征集;其中,所述多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于所述第二特征集构建的特征空间后的距离最小。

根据本发明的再一方面,提供一种图像数据分类装置,包括:数据获取模块,用于获取待分类图像数据;以及数据分类模块,用于在根据上述多模态特征选择装置确定的第二特征集构建的特征空间中,通过预先训练的分类器模型,对所述待分类图像数据进行分类。

根据本发明的再一方面,提供一种计算机设备,包括:存储器、处理器及存储在所述存储器中并可在所述处理器中运行的可执行指令,所述处理器执行所述可执行指令时实现上述任一种方法。

根据本发明的再一方面,提供一种计算机可读存储介质,其上存储有计算机可执行指令,所述可执行指令被处理器执行时实现上述任一种方法。

根据本发明提供的多模态特征选择方法,通过向多模态特征选择模型嵌入距离子模型,以充分利用不同模态图像数据之间的互补信息,能够有效地诱导模型选择出具有高判别性的特征。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施方式示出的一种多模态特征选择方法的流程图。

图2是根据一示例性实施方式示出的一种图像数据分类方法的流程图。

图3是根据一示例性实施方式示出的一种多模态特征选择装置的框图。

图4是根据一示例性实施方式示出的一种图像数据分类装置的框图。

图5是根据一示例性实施方式示出的一种计算机设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免喧宾夺主而使得本发明的各方面变得模糊。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

为解决多模态图像分析任务中的过拟合问题,本发明提出一种能够对多模态数据进行特征选择的特征学习框架,其中多模态特征选择模型包括:第一子模型与第二子模型。

第一子模型包含经验风险函数,其可表示为如下式(1)所示最小

其中,

需要说明的是,在本发明实施例中,第一子模型的经验风险函数并非仅限于上式(1)的形式。

第二子模型包含结构风险函数,其可表示为如下式(2)所示最小

根据向量范数的定义:‖w

λ为第一正则化参数,用于平衡第一子模型与第二子模型在多模态特征选择模型中的相对权重。当设置λ值较大时,较少的特征被选择保留,反之则有较多的特征被选择保留。对于极端情况λ=0,则不进行特征选择。

需要说明的是,在本发明实施例中,第二子模型的结构风险函数并非仅限于上式(2)的形式。

如上所述,本发明提出的特征学习框架能够对多模态数据进行特征选择,但上述多模态特征选择模型在进行特征选择时虽考虑到同一模态数据的相关性,却忽视了不同模态数据之间可能存在的内在联系,即不同模态数据之间的互补信息在特征选择时未得到利用。

因此,本发明进一步优化特征学习框架,并在改进多模态特征选择模型的基础上,提出了一种新的多模态特征选择方法。图1是根据一示例性实施方式示出的一种多模态特征选择方法的流程图。

参考图1,多模态特征选择方法10包括:

在步骤S102中,分别获取对应多个模态的多张图像的数据集。例如,可分别获取MRI、PET等模态图像的数据集。

其中,每张图像的数据集包含对应图像多个位置点的多个图像数据。

在步骤S104中,分别对多张图像进行特征提取,分别确定与多个模态相对应的多个第一特征集。

在一些实施例中,分别对多张图像进行特征提取可包括:根据预定义模板,分别对每个模态的图像进行特征提取。

在步骤S106中,基于预设的多模态特征选择模型,对多个第一特征集中的特征进行筛选,确定第二特征集。

其中,多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于第二特征集构建的特征空间后的距离最小。

距离子模型例如可以嵌入于本发明所提改进前的多模态特征选择模型,以与第一子模型与第二子模型配合完成特征联合选择,下文将对此进行详细阐述。需要说明的是,距离子模型也可以嵌入于其它任何可能形式的多模态特征选择模型,本发明对此不做限定。

根据本发明实施方式提供的多模态特征选择方法,通过向多模态特征选择模型嵌入距离子模型,以充分利用不同模态图像数据之间的互补信息,能够有效地诱导模型选择出具有高判别性的特征。

应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施方式。

在一些实施例中,距离子模型可包含标号对齐的正则化函数。

进一步地,标号对齐的正则化函数例如可以如下式(3)所示:

其中,μ为第二正则化参数,p、q表示模态,w

其中,y

从数学的角度来说,若两个映射点对应的图像数据类别相同(例如均来自脑疾病患者的大脑图像),则在投影后的特征空间中应彼此靠近,即距离很小;反之,若两个映射点对应的图像数据类别不同(例如一个来自脑疾病患者的大脑图像,另一个来自正常人的大脑图像),则在投影后的特征空间中应彼此远离,即距离较大。

承上述,基于上文在先提出的多模态特征选择模型以及包含上式(3)的距离子模型,本发明进一步提出一种新的基于标号对齐的多模态特征选择模型,其目标函数如下式(4):

其中,

具体而言,‖W‖

需要说明的是,由于本发明对第一子模型、第二子模型及距离子模型中各函数的形式均不做限定,因此本发明改进后的多模态特征选择模型及其目标函数也不以上述实施例中所述为限。

在一些实施例中,改进后的多模态特征选择模型的目标函数可以基于加速近似梯度(Accelerated Proximal Gradient,APG)算法实现优化的求解。

继续以上式(4)为例进行说明:目标函数可拆分为光滑项和非光滑项(省略min),其中光滑项为下式(5):

非光滑项为下式(6):

g(W)=λ‖W‖

构造下式(7)以逼近复合函数f(W)+g(W):

其中,‖·‖

其中,l

APG算法的关键是如何有效地解决更新问题,因此上式(8)可转化为如下式(9)所示的d个子问题进行求解:

其中,w

此外,在一些实施例中,还可使用搜索点Q

Q

其中,

根据上述各实施例提供的多模态特征选择方法所筛选出的特征,可以应用于各种不同的多模态图像数据分析任务,例如分类、回归等,在本发明中同样不对第二特征集的使用场景做任何限定。

下面以分类任务为例,具体说明根据本发明实施方式提供的多模态特征选择方法所选择的特征的一种应用方法。

图2是根据一示例性实施方式示出的一种图像数据分类方法的流程图。如图2所示的图像数据分类方法例如可以应用于对来自MRI、PET等模态大脑图像的数据进行分类,即确定其是来自患者样本还是正常人样本。

参考图2,图像数据分类方法20包括:

在步骤S202中,获取待分类图像数据,例如来自MRI、PET等模态大脑图像的数据。

在步骤S204中,在根据上述方法10确定的第二特征集构建的特征空间中,通过预先训练的分类器模型,对待分类图像数据进行分类。

由于本发明实施方式优化后的多模态特征选择方法能够有效地选择出具有高判别性的特征,因此,根据本发明实施方式提供的图像数据分类方法,能够显著提高多模态图像数据分类的准确率。

在一些实施例中,分类器模型可以为支持向量机模型,例如使用传统的SVM(Support Vector Machine,支持向量机)工具箱LIBSVM建立的多核支持向量机模型。

支持向量机模型例如可以根据各模态图像中两两图像数据对应的核矩阵的线性组合进行预先训练,其中两两图像数据在各模态图像中的位置相同。以两个图像位置n

首先,分别计算每个模态图像中的两个图像数据对应的核矩阵

其中,x为待分类图像数据在第二特征集构建的特征空间中的映射点。组合系数β

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。

此外,需要注意的是,上述附图仅是根据本发明示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。

图3是根据一示例性实施方式示出的一种多模态特征选择装置的框图。

参考图3,多模态特征选择装置30包括:数据获取模块302、特征提取模块304以及特征选择模块306。

其中,数据获取模块302用于分别获取对应多个模态的多张图像的数据集。

其中,每张图像的数据集包含对应图像多个位置点的多个图像数据。

特征提取模块304用于分别对多张图像进行特征提取,分别确定与多个模态相对应的多个第一特征集。

特征选择模块306用于基于预设的多模态特征选择模型,对多个第一特征集中的特征进行筛选,确定第二特征集。

其中,多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于第二特征集构建的特征空间后的距离最小。

根据本发明实施方式提供的多模态特征选择装置,通过向多模态特征选择模型嵌入距离子模型,以充分利用不同模态图像数据之间的互补信息,能够有效地诱导模型选择出具有高判别性的特征。

图4是根据一示例性实施方式示出的一种图像数据分类装置的框图。

参考图4,图像数据分类装置40包括:数据获取模块402以及数据分类模块404。

其中,数据获取模块402用于获取待分类图像数据。

数据分类模块404用于在根据多模态特征选择装置30确定的第二特征集构建的特征空间中,通过预先训练的分类器模型,对待分类图像数据进行分类。

根据本发明实施方式提供的图像数据分类装置,能够显著提高多模态图像数据分类的准确率。

需要注意的是,上述附图中所示的框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。

图5是根据一示例性实施方式示出的一种计算机设备的结构示意图。需要说明的是,图5示出的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示,计算机设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的设备中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:

分别获取对应多个模态的多张图像的数据集;分别对多张图像进行特征提取,分别确定与多个模态相对应的多个第一特征集;基于预设的多模态特征选择模型,对多个第一特征集中的特征进行筛选,确定第二特征集;其中,多模态特征选择模型包括:距离子模型,用于使对应多个模态的、类别相同的图像数据在相应的第一特征集构建的特征空间中的映射点投影于第二特征集构建的特征空间后的距离最小。以及,

获取待分类图像数据;在根据上述方法确定的第二特征集构建的特征空间中,通过预先训练的分类器模型,对待分类图像数据进行分类。

以上具体地示出和描述了本发明的示例性实施方式。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号