公开/公告号CN113284136A
专利类型发明专利
公开/公告日2021-08-20
原文格式PDF
申请/专利权人 南京信息工程大学;
申请/专利号CN202110690947.X
申请日2021-06-22
分类号G06T7/00(20170101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构32204 南京苏高专利商标事务所(普通合伙);
代理人柏尚春
地址 210044 江苏省南京市江北新区宁六路219号
入库时间 2023-06-19 12:18:04
技术领域
本发明属于医学图像处理领域,涉及一种双损失函数训练的残差网络和XGBoost的医学图像分类方法。
背景技术
医学影像技术的不断发展对疾病的诊治做出了巨大的贡献,使用影像学技术诊断疾病不仅效率高,而且对于传染性强的疾病而言,可以降低医患之间交叉感染的风险。医生通过分析患者的医学影像来诊断患者所患有的疾病种类。然而,能够准确分析医学影像的经验丰富的放射科医生在每个医院都属于稀缺人才,这使得人为检测的效率很低,所以,需要发明一种能够自动分析医学影像并进行准确判断的方法。
目前自动诊断疾病的主流方法是使用AI技术,利用深度学习技术自动对医学图像进行分类。卷积神经网络是深度学习的代表算法之一,使用卷积神经网络对医学图像进行分类是当前的热门研究方向,选择一个合适的神经网络,使用医学图像作为数据训练神经网络,便可以使神经网络自动准确的分类医学影像从而达到准确诊断的目的。而使用神经网络对图像进行分类的关键在于神经网络提取到的图像的特征,本发明在选定的网络中使用三元组损失和中心损失共同训练网络,对网络中提取到的图像特征进行充分处理,最后使用XGBoost方法进行分类,进一步提高最终的分类精度。
发明内容
发明目的:本发明的目的是提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,提高分类精度,提升模型的分类效果。
技术方案:本发明提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,具体包括以下步骤:
(1)收集医学图像数据集,并将其划分为训练集和测试集;
(2)对医学图像数据集进行预处理,将图像大小调整为224*224并且进行归一化处理;
(3)搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,并采用三元组损失以及中心损失共同训练Resnet50网络;
(4)将Resnet50网络网络的最后一个全连接层移除,使用XGBoost作为模型的分类层;
(5)使用训练集训练模型,将测试集输入训练好的模型得到分类结果。
进一步地,步骤(1)所述的训练集、验证集和测试集的比为8:2。
进一步地,步骤(3)所述的采用三元组损失训练Resnet50网络过程如下:
三元组损失由一个三元组构成,一次输入三张成对图像,其中,a为训练集中选取的一个训练样本,p为与训练样本同一类别的样本,称为正样本,n为与训练样本不同类别的样本,称为负样本,三元组损失L
L
其中,d(a,p)表示的是a和p之间的欧氏距离度量,d(a,n)表示的是a和n之间的欧氏距离度量,margin是a与p之间的距离和a与n之间的距离之间的间距,人为可控,偏小会难以区分相似的图像,偏大会导致网络不收敛,需要设置合理的margin值。
进一步地,步骤(3)所述的中心损失训练Resnet50网络过程如下:
其中,L
L=L
其中,β是中心损失的平衡权重。
进一步地,所述步骤(4)实现过程如下:
设训练集为D={(g
其中,
有益效果:与现有技术相比,本发明的有益效果:使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,可以使特征提取层学习更快并且对噪声有鲁棒性;使用三元组损失来训练特征提取层,可以增强欧式空间的类内紧凑性和类间可分性,也就是可以使得同类样本特征更加靠近,不同类样本特征更加远离,有助于提高模型的分类精度;添加中心损失配合三元组损失训练特征提取层,不仅可以进一步对提取到的特征进行处理,还可以弥补三元组损失的不足从而提高模型性能;使用XGBoost作为模型的分类层来进行最终的分类,效率高,在提高模型分类精度的同时,可以防止过拟合。
附图说明
图1是本发明的流程图;
图2是修改后的残差模块图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明提供一种双损失函数训练的残差网络和XGBoost的图像分类方法,如图1所示,具体包括以下步骤:
步骤1:收集医学图像数据集,并将数据集划分为训练集和测试集。
收集医学图像数据集,并根据神经网络需要大量数据进行训练的特性以及结合以往的实验经验将整个医学数据集的80%划分为训练集和20%的测试集。
步骤2:为了统一标准对医学图像数据集进行预处理,将医学图像数据集中的图像大小调整为224*224并且进行归一化处理。
步骤3:搭建Resnet50网络作为模型特征提取层,使用ELU激活函数替换Resnet50网络中残差块中的ReLU激活函数,使用ELU激活函数可以使特征提取层学习更快并且对噪声有鲁棒性,修改后的残差块如图2所示,输入残差块中的特征矩阵的深度为256维度,使用64个1*1的卷积核对其进行卷积,特征矩阵的深度降维到64维度,之后通过64个3*3的卷积核进行卷积,然后使用256个1*1的卷积核进行卷积,使得特征矩阵的深度升维到256维度,最后将输入的特征矩阵与经过3次卷积处理之后的特征矩阵相加,整个残差块中使用了3次ELU激活,分别是在第一次和第二次卷积以及最后相加操作之后。
采用三元组损失以及中心损失共同训练Resnet50网络。使用三元组损失可以增强欧式空间的类内紧凑性和类间可分性,它由一个三元组构成,所以,一次输入三张成对图像,(anchor)a指的是我们训练集中选取的一个CT训练样本,(positive)p是与训练样本同一类别的样本称为正样本,(negative)n是与训练样本不同类别的样本称为负样本,因此三元组损失L
L
当d(a,p)-d(a,n)+margin大于0的时候L
其中,L
L=L
其中,β是中心损失的平衡权重。
步骤4:将Resnet50网络的最后一个全连接层移除,使用XGBoost作为模型的分类层。
设训练集为D={(g
其中,
步骤5:使用训练集训练模型,将测试集输入训练好的模型得到分类结果。
机译: 基于XGBoost的数据分类方法和装置,计算机设备和存储介质
机译: 医学图像分类方法,模型训练方法,计算设备和存储介质
机译: 医学图像的训练系统,由处理器执行以控制医学图像的训练系统的计算机程序的产品以及医学图像的训练系统的操作方法