首页> 中国专利> 一种基于非随机掩盖数据增强方式的黑色素瘤分类方法

一种基于非随机掩盖数据增强方式的黑色素瘤分类方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

一种基于非随机掩盖数据增强方式的黑色素瘤分类方法，包括以下步骤：步骤1.首先原始训练集中的皮肤镜图像进行数据增强，增强方式为非随机掩盖；步骤2.将原始数据分别和不同掩盖位置的数据进行混合然后放入网络中进行训练，最后根据模型在验证集上的表现选择出效果相对好的4个模型，然后将这4个模型的增强样本和原始数据放在一起作为最终的黑色素瘤分类模型的训练样本，然后进行训练从而得到黑色素瘤分类模型；步骤3.训练模型；步骤4.将步骤3中提取的特征放入到softmax分类器中进行分类。本发明提供一种可靠性高的黑色素瘤分类方法，可以有效的对患者皮肤镜检图像来进行分类，达到辅助最终诊断的效果。

著录项

公开/公告号CN108960281A

专利类型发明专利
公开/公告日2018-12-07

原文格式PDF
申请/专利权人浙江工业大学;
展开▼

申请/专利号CN201810505394.4
发明设计人胡海根;孔祥勇;苏一平;陈胜勇;肖杰;周乾伟;
展开▼

申请日2018-05-24
分类号
代理机构杭州斯可睿专利事务所有限公司;
代理人王利强
地址 310014 浙江省杭州市下城区潮王路18号浙江工业大学
入库时间 2023-06-19 07:34:02

法律信息

法律状态公告日

法律状态信息

法律状态
2020-05-05

授权

授权
2019-01-01

实质审查的生效 IPC(主分类):G06K9/62 申请日:20180524

实质审查的生效
2018-12-07

公开

公开

说明书

技术领域

本发明属于计算机视觉领域，基于深度学习中的卷积神经网络构建了一个对于皮肤癌黑色素瘤的分类模型。

背景技术

黑色素瘤是一种由黑素细胞引起的恶性皮肤癌。在所有的因皮肤癌而导致死亡的病例中，黑色素瘤约占75％。在皮肤癌疾病中，黑色素瘤是最致命的皮肤癌病变。随着计算机技术和人工智能的迅速发展，深度学习技术在诸多领域，尤其计算机视觉等领域得到广泛使用，成为人工智能领域最为活跃的研究领域。其中图像分类作为视觉范围中一块极其有影响力的课题方向，受到广大深度学习研究者们的青睐。基于深度学习技术对此开展深入研究，将具有非常重要的理论价值和较好的应用发展前景。对于皮肤病以及恶性黑色素瘤的研究将有利于医生们更好诊断患者病情。

发明内容

为了克服已有黑色素瘤分类方法的可靠性较低的不足，本发明提供一种可靠性高的黑色素瘤分类方法，可以有效的对患者皮肤镜检图像来进行分类，达到辅助最终诊断的效果。

本发明解决其技术问题所采用的技术方案是：

一种基于非随机掩盖数据增强方式的黑色素瘤分类方法，包括以下步骤：

步骤1.非随机掩盖数据增强：首先原始训练集中的皮肤镜图像进行数据增强，增强方式为非随机掩盖；

步骤2.选择表现好的模型：使用非随机掩盖的数据增强方式，先将原始数据分别和不同掩盖位置的数据进行混合然后放入网络中进行训练，最后根据模型在验证集上的表现选择出效果相对好的4个模型，然后将这4个模型的增强样本和原始数据放在一起作为最终的黑色素瘤分类模型的训练样本，然后进行训练从而得到黑色素瘤分类模型；

步骤3.训练模型：将训练数据放入到深度卷积残差50层的网络中进行特征提取；训练过程中，使用残差50层在ImageNet数据集上预训练的模型来对网络参数进行初始化，在此基础上进行微调网络参数；

步骤4.将步骤3中提取的特征放入到softmax分类器中进行分类。

进一步，所述步骤1中，非随机掩盖数据增强的步骤如下：

1.1依次从训练集中取图片img，并获取img的宽img_w和高img_h；

1.2初始化掩盖区域的宽w＝img_w/3，高h＝img_h/3；

1.3确定掩盖区域的左上角坐标分别为(x₁，y₁)＝(0，0)，(x₂，y₂)＝(w，0)，(x₃，y₃)＝(2w，0)，(x₄，y₄)＝(0，h)，(x₅，y₅)＝(w，h)，(x₆，y₆)＝(2w，h)，(x₇，y₇)＝(0，2h)，(x₈，y₈)＝(w，2h)，(x₉，y₉)＝(2w，2h)；

1.4确定掩盖区域为M_i＝(x_i，y_i，x_i+w，y_i+h)，其中i＝1，2，3…9；

1.5将掩盖区域M_i的像素值置为0；

1.6保存增强后的图片。

再进一步，所述步骤2中，卷积残差50层网络训练的过程如下：

2.1：每张原始图片I经过非随机掩盖增强后会产生新的9张图片，分别对应掩盖区域为M1、M2、M3、M4、M5、M6、M7、M8、M9的图片，然后将原始图片分别和这九种不同掩盖区域的图片进行组合成9个训练集，比如训练集1＝原始图片I+增强的I_M1训练出9个模型；

2.2：对于步骤2.1中训练出来的的9个模型使用验证集的数据来进行验证，评估模型在AC、AP、AUC、SE、SP上的表现，选择出表现最好的4个模型；

2.3：将原始未增强的样本和该四个模型中使用到的增强样本组合到一起，组成一个新的训练集；

2.4：将新的训练集放入到卷积残差50层的网络中进行训练，训练过程中最后一层的输出为2，同时在网络残差初始化的时候使用在ImageNet预训练的参数作为初始化参数，然后将最后一层的输出作为softmax分类器的输入。

本发明的有益效果主要表现在：有效的对患者皮肤镜检图像来进行分类，达到辅助最终诊断的效果。

附图说明

图1为本发明中非随机掩盖增强方式的示意图。

图2为本发明中使用的卷积残差50层的网络结构示意图。

图3为本发明中整个分类模型的示意图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1～图3，一种基于非随机掩盖数据增强方式的黑色素瘤分类方法，包括以下步骤：

步骤1.非随机掩盖数据增强：首先原始训练集中的皮肤镜图像进行数据增强，增强方式为非随机掩盖；

步骤4.将步骤3中提取的特征放入到softmax分类器中进行分类。

进一步，所述步骤1中，非随机掩盖数据增强的步骤如下：

1.1依次从训练集中取图片img，并获取img的宽img_w和高img_h；

1.2初始化掩盖区域的宽w＝img_w/3，高h＝img_h/3；

1.4确定掩盖区域为M_i＝(x_i，y_i，x_i+w，y_i+h)，其中i＝1，2，3…9；

1.5将掩盖区域M_i的像素值置为0；

1.7保存增强后的图片。

再进一步，所述步骤2中，卷积残差50层网络训练的过程如下：

2.2：对于步骤2.1中训练出来的的9个模型使用验证集的数据来进行验证，评估模型在AC、AP、AUC、SE、SP上的表现，选择出表现最好的4个模型；

2.3：将原始未增强的样本和该四个模型中使用到的增强样本组合到一起，组成一个新的训练集；

本实施例中，对于原始训练集中存在两类皮肤镜图像样本，一类为黑色素瘤，另一类为脂溢性角化病和痣的混合图像即非黑色素瘤。

本实施例的基于非随机掩盖数据增强方式的黑色素瘤分类方法，包括以下步骤：

步骤1对于非随机掩盖数据增强，我们依次从原始训练集中取出样本，每次取一张进行增强，原图备份保存。

1.1:从训练集中取到样本ISIC_0000074.jpg，先获取该张图像的宽img_w＝1022，高img_w＝767；

1.2：初始化确定掩盖区域的宽w＝1022/3＝340(取整)，h＝767/3＝255；

1.3：确定掩盖区域的左上角坐标分别为(0，0)，(340，0)，(680，0)，(0，255)，(340，255)，(680，255)，(0，510)，(340，510)，(680，510)；

1.4：确定掩盖区域分别为M1为(0，0，340，255)M2为(340，0，680，255)，M3为(680，0，1020，255)，M4为(0，255，340，510)，M5为(340，255，680，510)，M6为(680，255，1020，510)，M7为(0，510，340，765)，M8为(340，510，680，765)，M9为(680，510，1020，765)；

1.5：将掩盖区域M1、M2、M3、M4、M5、M6、M7、M8、M9的像素值这是为0；

1.6：保存掩盖后的样本分别命名为Mask1_0000074.jpg、Mask2_0000074.jpg、Mask3_0000074.jpg、Mask4_0000074.jpg、Mask5_0000074.jpg、Mask6_0000074.jpg、Mask7_0000074.jpg、Mask8_0000074.jpg、Mask9_0000074.jpg；

最后增强后的样本如图1所示。

步骤2将训练集中的所有样本均进行随机掩盖进行扩充，然后将原始样本分别和不同掩盖位置的数据进行混合组成训练集然后放入残差50层网络中进行训练，训练时依然使用预训练模型作为参数初始化，拿单张图片举例来说将ISIC0000074.jpg分别和Mask1_0000074.jpg、Mask2_0000074.jpg、Mask3_0000074.jpg、Mask4_0000074.jpg、Mask5_0000074.jpg、Mask6_0000074.jpg、Mask7_0000074.jpg、Mask8_0000074.jpg、Mask9_0000074.jpg分别组成训练集1-9，然后分别将训练集1-9放入到残差50层网络中进行训练优化，最后根据各个训练集的表现选择出表现好的训练集，将其训练数据放在一起组成模型的最终训练集。

步骤3.将确定的最终训练集的数据放入到深度卷积残差50层的网络中进行特征提取。训练过程中，使用残差50层在ImageNet数据集上预训练的模型来对网络参数进行初始化，在此基础上进行微调网络参数。

步骤4.将3中提取的特征放入到softmax分类器中进行分类。

深度卷积残差50层网络结构如图2所示，整体的模型流程如图3所示。模型的最终的结果参照表1：

表1。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于非随机掩盖数据增强方式的黑色素瘤分类方法 [P] . 中国专利： CN108960281A . 2018-12-07
2. 一种基于差分隐私及随机梯度下降的数据分类方法 [P] . 中国专利： CN112232401A . 2021-01-15
3. METHOD AND APPARATUS FOR CLASSIFICATION OF LESION BASED ON LEARNING DATA APPLYING ONE OR MORE AUGMENTATION METHODS IN LESION INFORMATION AUGMENTED PATCH OF MEDICAL IMAGE [P] . 美国专利： US2020335197A1 . 2020-10-22

机译：基于学习数据的病变分类方法和装置，该学习数据在医学图像的病变信息增强补丁中采用一种或多种增强方法
4. METHOD AND APPARATUS FOR CLASSIFICATION OF LESION BASED ON LEARNING DATA APPLYING ONE OR MORE AUGMENTATION METHOD IN LESION INFORMATION AUGMENTED PATCH OF MEDICAL IMAGE [P] . 韩国专利： KR20200121558A . 2020-10-26

机译：基于学习数据的病变分类方法和装置，该方法和方法将一种或多种增强方法应用于医学图像的病变信息增强补丁中
5. Electrical apparatus for the prcessamento enhanced digital images; improved method for generation of addresses for memory access to be random to one or more pixels are extracted byAn input image digital electronics has a limit; address generator circuit improved for the generation of addresses in a random access memory for one or more pixels areExtracted from at least one input image digital electronics has a limit; electric appliance perfected for the processing of digital images; improved method for processing DAt least one input image digital electronics has a limit to derive an output image processed digital electronics; random access memory in a processing circuit ofDigital images and random access memory in a table of conference to a processing circuit of digital images [P] . BR9402047A . 1994-12-20

机译：用于增强增强型数字图像的电气设备;一种改进的生成地址的方法，用于通过以下方式提取对一个或多个像素随机访问的存储器：输入图像数字电子设备有一个限制;从至少一个输入图像中提取出的数字发生器有一个极限;改进的地址发生器电路，用于在一个或多个像素的随机存取存储器中生成地址。完美处理数字图像的电器;用于处理DA的改进方法至少一个输入图像数字电子设备具有导出输出图像处理的数字电子设备的限制;数字图像处理电路中的随机存取存储器和会议桌中的数字图像处理电路中的随机存取存储器