首页> 中国专利> 一种基于GoogLeNet网络的医学图像分类方法

一种基于GoogLeNet网络的医学图像分类方法

摘要

本发明公开了一种基于GoogLeNet网络的医学图像分类方法,具体包括以下步骤:S1、采集CT图像原始数据信息并进行预处理,并将预处理之后的CT图像数据划分为测试集和训练集;S2、构建改进的GoogLeNet网络模型,并将所述训练集输入到所述改进的GoogLeNet网络模型中进行训练,得到训练好的CT图像分类模型;S3、将所述测试集输入到所述CT图像分类模型中,得到CT图像分类结果。本发明能够在有限的训练样本情况下提高CT图像的分类准确率及分类精确率,有效改善了CT图像的诊断效果。

著录项

  • 公开/公告号CN113255794A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利权人 闽南师范大学;

    申请/专利号CN202110608436.9

  • 申请日2021-06-01

  • 分类号G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11562 北京东方盛凡知识产权代理事务所(普通合伙);

  • 代理人贾耀淇

  • 地址 363000 福建省漳州市芗城区县前直街36号

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本发明属于医学图像计算机辅助诊断技术领域,特别是涉及一种基于GoogLeNet网络的医学图像分类方法。

背景技术

早发现、早确诊、早隔离是控制肺炎传播的主要方法,目前核酸检测仍是确诊的“金标准”,通过核酸检测阳性才能确诊新冠肺炎。但是核酸检测存在检测速度不够快,并存在核酸检测敏感度问题,可能导致假阴性情况的出现。因此部分专家建议将影像学图像诊断作为新冠肺炎确诊的一个辅助条件。由于医疗资源的匮乏,通过放射科医生对大规模医学图像进行阅片诊断工作量大、效率不高。因此,利用计算机视觉技术对可能的新冠肺炎CT图像进行辅助诊断能够有效降低新冠肺炎的漏诊率,缓解医疗资源的不足,具有重要意义,计算机辅助诊断也成为了当前众多学者研究的热点之一。

目前,国内外学者对医学图像研究主要分为两大类。一类是基于传统机器学习的方法。如赵可扬等人在“机器学习辅助肿瘤诊断”中采用高质量数字病理切片用机器学习的方法判断肿瘤的性质,分级和预后。孙蕾等人在“基于医学图像的数学规划支持向量机”中应用非线性支持向量机的方法进行计算机辅助诊断。范炤等人在“基于机器学习的阿尔茨海默病病程分类”中利用支持向量机和随机森林构建模型对阿尔茨海默病进行分类研究。然而传统的机器学习方法不能有效地挖掘到医学图像中蕴含的丰富信息。

另一部分学者采用深度学习的方法来研究医学图像。刘迪等人在“基于深度学习的医学图像肺结节检测”中采用卷积神经网络进行假阳性结节去除并在LUNA16数据集上进行了实验;Yang等人在“COVID-CT-Dataset:A CT Scan Dataset about COVID-19”使用DenseNet网络对肺炎CT图像进行分类获得了84.7%的分类准确率。然而,上述传统的机器学习方法或者深度学习方法需要大量带标签的图像数据来训练模型。

因此,寻找一种高准确率和高分类精确率,并且不需要大量带标签的图像数据来训练模型的医学图像分类方法成为研究人员重点关注的问题。

发明内容

为了解决上述技术问题,本发明提供一种基于GoogLeNet网络的医学图像分类方法,能够在有限的训练样本情况下提高CT图像的分类准确率及分类精确率,有效改善了CT图像的诊断效果。

为实现上述目的,本发明提出一种基于GoogLeNet网络的医学图像分类方法,具体包括以下步骤:

S1、采集CT图像原始数据信息并进行预处理,并将预处理之后的CT图像数据划分为测试集和训练集;

S2、构建改进的GoogLeNet网络模型,并将所述训练集输入到所述改进的GoogLeNet网络模型中进行训练,得到训练好的CT图像分类模型;

S3、将所述测试集输入到所述CT图像分类模型中,得到CT图像分类结果。

优选地,所述S1具体为:

S1.1、通过医学放射仪器对人体病变部位进行扫描,得到不同灰度的像素按矩阵排列形成的CT图像原始数据信息;

S1.2、对所述CT图像原始数据信息进行图像分割、特征提取、标注数据信息和数据增强,得到带有标签的样本集合;

S1.3、对所述样本集合按照比例划分为训练集和测试集。

优选地,所述分类标签,包括:正常和多种病变类别标签。

优选地,所述数据增强,包括:镜像、旋转、缩放、裁剪、平移、高斯噪声、亮度调节、饱和度调节和对比度调节。

优选地,所述S2具体为:

S2.1、根据可视化特征图和修改GoogLeNet特征网络中结构,构建改进的GoogLeNet网络模型,并对所述改进的GoogLeNet网络模型进行预训练;

S2.2、根据医学图像与自然图像在纹理、边缘低层次特征具有的共通性,对预训练后的GoogLeNet网络进行低层次特征迁移学习;

S3.3、将所述训练集输入到所述改进的GoogLeNet网络模型中进行训练,得到训练好的CT图像分类模型。

优选地,修改所述GoogLeNet特征网络的结构,具体为:

将GoogLeNet特征网络中的Inception结构替换为Fast-Inception结构,激活函数采用h-Switsh函数,分类器采用Softmax函数,全连接层的神经元个数为24个;然后,将GoogLeNet模型中原有的Inception模块中的3×3卷积核和5×5卷积核的两条分支合并。

优选地,所述S3.3具体为:

采用自适应梯度估计方法对所述改进的GoogLeNet特征网络进行优化网络深度训练,并采用梯度下降法更新权重矩阵和偏置;同时调整所述改进的GoogLeNet特征网络中的冻结层,得到训练好的CT图像分类模型。

优选地,所述S3具体为:

S3.1、将所述测试集输入到所述CT图像分类模型中,得到正常或多种病变类别CT图像;

S3.2、将正常和多种病变类别CT图像分别存放在不同的两个文件夹;

S3.3、通过matlab中的imageDatastore指令自动为所述正常和多种病变类别CT图像打上对应标签,然后将正常和多种病变的CT图像进行比对,得到分类准确率、分类精度、敏感度和特异性。

与现有技术相比,本发明的有益效果在于:

本发明首先对CT原始图像数据进行数据增强、图像处理等一系列预处理,充分利用医学图像与自然图像之间的内在联系进行特征迁移,同时采用特征可视化,提高了网络层的特征提取效率和图像分类准确率,并减少了训练过程中的冗余计算量。最后用改进的网络进行调整和分类,得到了拟合较好的CT图像分类模型。本发明能够在有限的训练样本情况下提高肺部CT图像的分类准确率及分类精确率,有效改善了肺部CT图像的诊断效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的方法流程图;

图2为本发明GoogLeNet特征网络结构替换图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例1

参照图1所示,本发明提出一种基于GoogLeNet网络的医学图像分类方法,具体包括以下步骤:

S1、采集CT图像原始数据信息并进行预处理,并将预处理之后的CT图像数据划分为测试集和训练集;

首先,采用医学放射科的机器对人体进行扫描,机器发出的X射线在穿透人体后,其检测病变部位被X射线的探测器捕捉到,由于人体不同器官对X射线的透过率不一样,可以显示由软组织组成的器官,(如脑、脊髓、纵膈、肺、胆、胰以及盆腔器官等),因此会得到一幅能反映人体不同结构组织的CT图像,并能够良好的解剖图像背景上出现病变的影像。CT图像是由一定数目由黑到白不同灰度的像素按矩阵排列所构成,本发明采用以矩阵形式表示的CT图像作为原始数据,这些像素反映的是相应体素的X线吸收系数,不同CT扫描及其所得图像的像素大小及数目不同,大小可以是1.0×1.0mm、0.5×0.5mm不等,数目可以是256×256,即65536个,或512×512个不等,像素越小,数目越多,构成图像越细致,及空间分辨力越高。

然后,本发明对以矩阵形式表示的CT图像原始数据进行预处理,包括:图像分割、特征提取、设定分类标签、数据增强;

所述设定分类标签,包括:正常和多种病变类别标签;所述数据增强,包括镜像、旋转、缩放、裁剪、平移、高斯噪声、亮度调节、饱和度调节和对比度调节。

将采集到的大量医学CT图像统一通过固定大小的窗口进行随机分隔,得到一系列子图;然后对这些子图进行特征向量提取,得到特征向量集合,即样本集合,并对这些样本集合进行标记,得到正常和多种病变类别的标签,然后对每种类别的样本集合进行数据增加,即镜像、旋转、缩放、裁剪、平移、高斯噪声、亮度调节、饱和度调节和对比度调节,以适应GoogLeNet网络的输入,并且可以充分利用现有的少量带标签的CT图像来增加训练样本的多样性。

最后,将经过数据增加处理的多种类别的样本集合均拆分为训练集和测试集,并按照66.7%/33.3%、75%/25%或者90%/10%进行划分。

S2、构建改进的GoogLeNet网络模型,并将划分后的训练集输入到改进的GoogLeNet网络模型中进行预训练,并对模型参数进行调整,得到训练好的CT图像分类模型。

首先,构建改进的GoogLeNet网络模型,并对改进的GoogLeNet网络模型进行预训练;

传统的GoogLeNet网络深度144层。根据对病变位置CT图像特定细粒度类别的研究,通过对传统GoogLeNet网络的主要节点进行特征可视化。通过特征可视化,设定在大多数通道中的特征出现无法正常识别出患病位置的纹理轮廓时,确定该层之后的网络层对CT图像低层次特征的提取敏感度低,通过该方法,最终确定迁移的网络深度,这为网络超参数的调整提供依据。

由于病变类别图像分类的关键是区分图像中细粒度的特征,根据该原则,本发明依据可视化特征图,确定改进后的GoogLeNet网络总深度为130层,即保持原始GoogLeNet网络的前125层架构,改动的最后5层包括2个pool层、1个loss层、1个softmax层,1个output层。取前125层的原因是,在前125层之后的特征图中,大多数特征图显示为块状斑片区域,不利于医学图像的细粒度特征识别。然后,参照图2所示,在改进的GoogLeNet特征网络中将GoogLeNet特征网络中的Inception结构替换为Fast-Inception结构,激活函数为h-Switsh函数,分类器采用Softmax函数,全连接层的神经元个数为24个。改进的GoogLeNet特征网络包含22个权值层;然后,将GoogLeNet模型中原有的Inception模块中的3×3卷积核和5×5卷积核的两条分支合并,以提升网络识别率同时减少参数的原则来进行合并。在改进的GoogLeNet特征网络中,数据降维后经过Dropout层,Dropout层的输出比率为60%。本发明将GoogLeNet特征网络的激活函数h-Swish为h-Swish(x)=x*ReLU6(x+3)/6,其中,ReLU6(x)=min(max(x,0),6),能够提升原GoogLeNet特征网络的识别准确率并保证相对较低的计算量。

本发明根据医学图像与自然图像在纹理、边缘等低层次特征具有的共通性,使用在样本数据集上预训练的网络进行低层次特征迁移学习,缓解带标签CT样本的不足。

然后,采用自适应梯度估计方法对每个改进的GoogLeNet特征网络进行优化网络深度训练,并采用梯度下降法更新权重矩阵和偏置,即通过梯度下降法逐步优化调整网络参数,使得训练数据的标签与最终预测标签的误差逐渐减少,使得网络能够更好地拟合训练数据。

最后,调整改进的GoogLeNet特征网络中的冻结层即通过固定GoogLeNet特征网络中前面的网络层K,只训练N-K层网络,加快网络训练过程。通过调整K值冻结不同网络层,最终得到训练好的CT图像分类模型。

S3、将测试集中待识别的CT图像输入到训练好的CT图像分类模型中,得到对应的CT图像分类结果。

使用图像标签及分类结果,图像标签即根据医生的诊断结果,对不同类型(正常或多种病变类别CT图像)分别存放在不同两个文件夹,通过matlab中的imageDatastore指令即可自动为图像打上对应标签,比对得到分类准确率,分类精度,敏感度,特异性。

综上,本发明首先对CT原始图像数据进行数据增强、图像处理等一系列预处理,充分利用医学图像与自然图像之间的内在联系进行特征迁移,同时采用特征可视化,提高了网络层的特征提取效率和图像分类准确率,并减少了训练过程中的冗余计算量。最后用改进的网络进行调整和分类,得到了拟合较好的CT图像分类模型。本发明能够在有限的训练样本情况下提高CT图像的分类准确率及分类精确率,有效改善了CT图像的诊断效果。

以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号