首页> 中国专利> 一种基于深度学习分析的肝细胞癌的CK19的预测方法

一种基于深度学习分析的肝细胞癌的CK19的预测方法

摘要

本申请公开了一种基于深度学习分析的肝细胞癌的CK19的预测方法,所述方法包括将待检测图像分割为若干子图像;基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图;基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。本申请通过采用分割网络模型确定特征图作为分类模型的输入项,并基于该特征图确定所述待检测图像对应的CK19预测类别,这样通过深度学习方式确定待检测图像对应的CK19预测类别,可以提高CK19预测类别的准确性。

著录项

说明书

技术领域

本申请涉及生物医学工程技术领域,特别涉及一种基于深度学习分析的肝细胞癌的CK19的预测方法。

背景技术

CK19属于I型细胞角蛋白,为肝癌干细胞标志物之一,常在肝干细胞及胆管细胞表达,肝细胞一般不表达。CK19表达阳性往往预示着肝细胞癌(hepatocellularcarcinoma,HCC)侵袭性强及预后较差,是HCC预后不良的独立因素。与CK19表达阴性的HCC对比,CK19阳性的HCC更容易出现卫星灶、癌栓及包膜浸润等,术后复发转移的可能性更大。

近年来核磁共振(magnetic resonance imaging,MRI)在HCC方面应用越来越多,MRI不仅具有较好的软组织分辨力,同时具有多序列、多参数成像的特点,由于钆塞酸二钠(gadolinium ethoxybenzyl diethylenetriamine pentaacetic acid,Gd-EOB-DTPA)等特异性对比剂的应用使MRI可以为HCC的K19提供丰富信息。然而,目前基于医学影像对HCC的CK19阳性表达预测主要是利用图像参数进行简单的统计分析或传统机器学习建模,普遍存在检测准确性低的问题。

因而现有技术还有待改进和提高。

发明内容

本申请要解决的技术问题在于,针对现有技术的不足,提供一种基于深度学习分析的肝细胞癌的CK19的预测方法。

为了解决上述技术问题,本申请实施例第一方面提供了一种基于深度学习分析的肝细胞癌的CK19的预测方法,所述方法包括:

将待检测图像分割为若干子图像,其中,若干子图像中的每个子图像均为二维图像;

基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图;

基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述待检测图像为MRT图像。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述将待检测图像分割为若干子图像具体包括:

将所述待检测图像以预设步长进行分块,以得到若干候选子图像;

对于若干候选子图像中的每个候选子图像,将该候选子图像转换为h5格式,以得到若干子图像。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图具体包括:

对于若干子图像中的每个子图像,将该子图像输入经过训练的分割网络模型,通过所述分割网络模型确定该子图像对应的候选特征图;

根据获取到所有候选特征图,确定所述待检测图像对应的特征图,其中,所述特征图的图像尺寸与所述候选特征图的图像尺寸相同。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述分割网络模型包括编码模块和解码模块;所述特征图为所述编码模块中的激活层的输出项,其中,所述激活层与所述编码模块中位于最后的卷积层相连接,且位于该卷积层之后。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述分割网络模型的训练过程具体包括:

获取若干候选训练图像,并将若干候选训练图像中的每个候选训练图像的图像格式转换为预设图像格式;

对于转换后的各候选训练图像进行重采样,以得到若干训练图像,其中,若干训练图像中的各训练图像的图像尺寸以及分辨率均相同;

基于得到的若干训练图像对预设网络模型进行训练,以得到所述分割网络模型。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述分类模型为Adaboost分类模型,所述基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别具体为:

将所述特征图输入所述Adaboost分类模型,通过所述Adaboost分类模型输出所述待检测图像对应的CK19预测类别。

所述基于深度学习分析的肝细胞癌的CK19的预测方法,其中,所述分类模型的训练过程中采用十折交叉验证策略进行训练。

本申请实施例第二方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的基于深度学习分析的肝细胞癌的CK19的预测方法中的步骤。

本申请实施例第三方面提供一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;

所述通信总线实现处理器和存储器之间的连接通信;

所述处理器执行所述计算机可读程序时实现如上任一所述的基于深度学习分析的肝细胞癌的CK19的预测方法中的步骤。

有益效果:与现有技术相比,本申请提供了一种基于深度学习分析的肝细胞癌的CK19的预测方法,所述方法包括将待检测图像分割为若干子图像;基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图;基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。本申请通过采用分割网络模型确定特征图作为分类模型的输入项,并基于该特征图确定所述待检测图像对应的CK19预测类别,这样通过深度学习方式确定待检测图像对应的CK19预测类别,可以提高CK19预测类别的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在不符创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法的流程图。

图2为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法的流程示例图。

图3为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法的原理示例图。

图4为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法中的训练图像的示例图。

图5为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法中的分割网络模型的原理图。

图6为本申请提供的基于深度学习分析的肝细胞癌的CK19的预测方法中的分类模型的训练与测试的原理图。

图7为本申请提供的终端设备的结构原理图。

具体实施方式

本申请提供一种基于深度学习分析的肝细胞癌的CK19的预测方法,为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

经发明人研究发现,肝细胞癌(hepatocellularcarcinoma,HCC)是最常见的原发性肝癌,其发病率在全球范围内逐年上升,居全球恶性肿瘤第6位,其死亡率高居全球第2位。由于HCC早期症状不明显,多数HCC患者确诊时已处于中晚期,肿瘤负荷较大或伴有门脉侵犯,预后较差。外科手术是目前治疗HCC的首选方法,可目前切除术后HCC的复发率高达69%,导致肝癌术后的外科效果不尽人意。据研究显示,HCC术后早期复发与多种影响因素密切相关,包括肿瘤大小、病灶数目、组织分化程度、血管侵犯、卫星灶及相关基因表型等,其中细胞角蛋白19(cytokeratin19, CK19)表达阳性是HCC早期复发及预后不良的重要预测因素。

CK19属于I型细胞角蛋白,为肝癌干细胞标志物之一,常在肝干细胞及胆管细胞表达,肝细胞一般不表达。CK19表达阳性往往预示着肝细胞癌(hepatocellularcarcinoma,HCC)侵袭性强及预后较差,是HCC预后不良的独立因素。与CK19表达阴性的HCC对比,CK19阳性的HCC更容易出现卫星灶、癌栓及包膜浸润等,术后复发转移的可能性更大。

近年来核磁共振(magnetic resonance imaging,MRI)在HCC方面应用越来越多,MRI不仅具有较好的软组织分辨力,同时具有多序列、多参数成像的特点,由于钆塞酸二钠(gadolinium ethoxybenzyl diethylenetriamine pentaacetic acid,Gd-EOB-DTPA)等特异性对比剂的应用使MRI可以为HCC的K19提供丰富信息。然而,目前基于医学影像对HCC的CK19阳性表达预测主要是利用图像参数进行简单的统计分析或传统机器学习建模,普遍存在检测准确性低的问题。

为了解决上述问题,本申请实施例中,将待检测图像分割为若干子图像;基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图;基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。本申请通过采用分割网络模型确定特征图作为分类模型的输入项,并基于该特征图确定所述待检测图像对应的CK19预测类别,这样通过深度学习方式确定待检测图像对应的CK19预测类别,可以提高CK19预测类别的准确性。

下面结合附图,通过对实施例的描述,对申请内容作进一步说明。

本实施提供了一种基于深度学习分析的肝细胞癌的CK19的预测方法,如图1、图2和图3所示,所述方法包括:

S10、将待检测图像分割为若干子图像,其中,若干子图像中的每个子图像均为二维图像。

具体地,所述待检测图像可以为通过配置有该基于深度学习分析的肝细胞癌的CK19的预测方法的终端设备采集得到,也可以是外部设备采集并发送给终端设备的,还可以是存储于终端设备本地的。所述待检测图像为MRT图像,并且所述待检测图像携带有肝部区域。本实施例的应用场景可以为:通过MRT设备采集对患者行上腹部Gd-EOB-DTPA增强MR检查,以得到MRT图像,并将采集到MRT图像发送给配置有该基于深度学习分析的肝细胞癌的CK19的预测方法的终端设备,以得到该终端设备可以获取到待检测图像。在本实施例的一个具体实现方式中,所述待检测图像的获取过程可以为:采用Magneton TrioaTim3.0T超导MR成像设备(siemens healthcare sector,Erlangen,Germany)行上腹部平扫及动态增强扫描,并用8通道体部线圈,取仰卧位进行图像采集,扫描范围覆盖膈顶至肝脏下缘,以得到待检测图像,其中,Gd-EOB-DTPA增强MRI扫描采用T1WI压脂三维容积内插屏气检查(three dimensional volume interpolated breath-hold examination,3D-VIBE)序列;特异性对比剂使用Gd-EOB-DTPA;扫描参数为:重复时间(Repetition Time,TR)3.3ms,回波时间(Echo Time,TE)1.2ms,反转角为13°。

在本实施例的一个实现方式中,MRT图像为三维图像,从而在获取到待检测图像后,需要对待检测图像进行分割,以将待检测图像分割为若干二维图像。相应的,所述将待检测图像分割为若干子图像具体包括:

S11、将所述待检测图像以预设步长进行分块,以得到若干候选子图像;

S12、对于若干候选子图像中的每个候选子图像,将该候选子图像转换为h5格式,以得到若干子图像。

具体地,所述若干候选子图像中的每个候选子图像均为所述待检测图像中的一个图像块,并且若干候选子图像中的各候选子图像对应的图像块互不相同。所述预设步长为预先设置的,用于确定相邻每个候选子图像在分割方向上的距离,例如,待检测图像为长方体结构,其长度方向表示为X,高度方向表示为Y,厚度方向表示为Z;将待检测图像沿Z方向以预设步长进行划分,那么划分得到的若干候选子图像中的每个候选子图像在Z方向上的厚度均为预设步长,每个候选子图像的长度与待检测图像的长度相同,每个候选子图像的宽度与待检测图像的宽度相同。在本实施例的一个实现方式中,所述预设步长为1,所述待检测图像以预设步长进行分块指的是即将所述待检测图像以1为步长进行分块以得到若干图像块,并将若干图像块作为若干候选子图像,即若干图像块中的每个图像块为一个候选子图像。

进一步,所述h5格式为层次化的格式(hierarchial format),用于存储数据。所述将候选子图像转换为h5格式指的是以h5格式存储所述候选子图像对应的图像信息。在本实施例中,在获取到若干候选子图像后,将每个候选子图像转换为matlab矩阵,并通过matlab的将对matlab矩阵转换为h5格式,以得到若干子图像。

S20、基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图。

具体地,所述分割网络模型为经过训练的,用于定位待检测图像中的肿瘤区域。所述分割网络模型的输入项为待检测图像,所述分割网络模型的输出项为待检测图像中的肿瘤区域,其中,所述肿瘤区域为基于分割网络模型学习到的待检测图像对应的特征图确定的。可以理解的是,所述分割网络模型会学习到该待检测图像的图像信息以形成特征图,在通过该特征图对待检测图像进行定位,以得到该检测图像对应的肿瘤区域。

在本实施例的一个实现方式中,如图5所示,所述基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图具体包括:

对于若干子图像中的每个子图像,将该子图像输入经过训练的分割网络模型,通过所述分割网络模型确定该子图像对应的候选特征图;

根据获取到所有候选特征图,确定所述待检测图像对应的特征图,其中,所述特征图的图像尺寸与所述候选特征图的图像尺寸相同。

具体地,所述分割网络模型包括编码模块和解码模块;所述候选特征图为所述编码模块中的激活层的输出项,其中,所述激活层与所述编码模块中位于最后的卷积层相连接,且位于该卷积层之后。可以理解的是,所述候选特征图为所述编码模块中最后一个卷积层的输出项通过激活层得到,其中,所述激活层可以配置有Relu激活函数。所述特征图为根据获取到所有候选特征图确定得到,这样可以提高特征图携带的图像信息的抽象程度以及表征能力,从而可以提高基于特征图确定CK19类别的准确性。

在本实施例的一个实现方式中,在获取到候选特征图后,可以使用全局自适应池化将该候选特征图转换为特征图向量,在将各候选特征图各自对应的特征图向量进行求平均值,以得到待检测图像对应的特征图。例如,候选特征图的图像尺度为32*32*512,候选特征图对应的特征图向量的维度为1*512,那么若干特征图向量求平均值得到的特征图的维度为1*512。

在本实施例的一个实现方式中,所述分割网络模型包括编码模块和解码模块,所述编码模块包括若干下采样单元,所解码模块包括若干上采样单元,所述若干下采样单元与所述若干上采样单元一一对应,并且各下采样单元与其对应的上采样单元通过跳跃连接连通。所述下采样单元包括下采样层以及残差卷积块,所述下采样层与所述残差卷积块相连接,所述下采样层的输出项为残差卷积块的输入项。所述上采样单元包括上采样层以及残差卷积块,所述上采样层与所述残差卷积块相连接,所述上采样层的输出项为残差卷积块的输入项。此外,所述编码模块包括下采样层,所解码模块包括上采样层,所述分割网络模型包括卷积单元,若干下采样单元中位于最后的下采样单元、下采样层、卷积单元、上采样层以及若干上采样单元中位于最前的上采样单元依次连接。所述卷积单元可以包括第两个级联的卷积块,两个级联的卷积块中的每个卷积块均包括3*3卷积层以及激活函数层,其中,所述激活函数层可以配置有relu激活函数。由此,所述特征图为最后一个上采样单元的输出项。

在本实施的一个实现方式中,所述残差卷积块包括第一卷积单元、第二卷积单元以及卷积层,所述第一卷积单元与所述第二卷积单元级联,所述第一卷积单元的输入项为残差卷积块的输入项,所述第二卷积单元的输入项为第一卷积单元的输出项;所述第一卷积层的输入项为残差卷积块的输入项,所述第二卷积单元的输出项与所述卷积层的输出项进行残差连接后作为残差卷积块的输出项。所述第一卷积单元和第二卷积单元均包括3*3卷积层以及激活函数层,其中,所述激活函数层可以配置有relu激活函数,卷积层可以为3*3卷积层。

在本实施例的一个实现方式中,所述分割网络模型的训练过程具体包括:

获取若干候选训练图像,并将若干候选训练图像中的每个候选训练图像的图像格式转换为预设图像格式;

对于转换后的各候选训练图像进行重采样,以得到若干训练图像,其中,若干训练图像中的各训练图像的图像尺寸以及分辨率均相同;

基于得到的若干训练图像对预设网络模型进行训练,以得到所述分割网络模型。

具体地,所述若干候选训练图像中的每个候选训练图像均为MRT图像,各候选训练图像对应的患者互不相同。例如,若干候选训练图像包括候选训练图像A和候选训练图像B,候选训练图像A对应的患者与候选训练图像B对应的患者不相同。在一个具体实现方式中,所述若干候选训练图像中的每个候选训练图像均可以是采用Magneton TrioaTim3.0T超导MR成像设备(siemens healthcare sector,Erlangen,Germany)行上腹部平扫及动态增强扫描,并用8通道体部线圈,取仰卧位进行图像采集,扫描范围覆盖膈顶至肝脏下缘,以得到待检测图像,其中,Gd-EOB-DTPA增强MRI扫描采用T1WI压脂三维容积内插屏气检查(threedimensional volume interpolated breath-hold examination,3D-VIBE)序列;特异性对比剂使用Gd-EOB-DTPA;扫描参数为:重复时间(Repetition Time,TR)3.3ms,回波时间(Echo Time,TE)1.2ms,反转角为13°。此外,每个候选训练图像对应的患者均可以满足如下条件:(1)术前1个月内行上腹部Gd-EOB-DTPA增强MR检查;(2)病灶为单发;(3)肝脏肿瘤行手术切除,术后病理证实为HCC;(4)术后大体标本行免疫组化检查,提示CK19阴性或阳性;(5)术前没有进行针对HCC的治疗。患者排除标准可以为:①多发病灶(2个或以上)或有子灶;②术前有针对肿瘤的治疗病史:如介入治疗,靶向药物治疗等;③病理提示为胆管细胞癌、混合性肝细胞癌或其他;④影像质量差或非Gd-EOB-DTPA增强MR的病例。

进一步,所述若干候选训练图中的每个候选训练图均携带有肿瘤区域标注,该肿瘤区域标注作为分割网络模型训练过程中的金标信息。所述若干候选训练图像中的每个候选训练图像对应的肿瘤区域标注均可以由放射科医生在不知晓临床、病理的情况下对相应的术前MR HBP图像进行标注得到,并且在标注过程中需要对肿瘤区域的每一层进行标准,并且在横断面、冠状面、矢状面相互调整与补充,以得到包含肿瘤区域的标注框。例如,如图4所示,图中的白色线条围成的区域为标注肿瘤区域。

进一步,在获取到若干候选训练图像后,对于若干候选训练图像中的每张候选训练图像,将该候选训练图像的图像格式转换为预设图像格式,其中,所述候选训练图像的图像格式为DICON格式,预设图像格式为NIFTI格式,并且转换后的候选训练图像为三维图像。此外,在获取到转换后的候选训练图像后,对转换后的候选训练图像进行图像尺寸调整以及分辨率调整,以得到若干训练图像,其中,若干训练图像中的各训练图像的图像尺寸均相同,例如,各训练图像的图像尺寸均为256*256;若干训练图像中的各训练图像的图像分辨率均相同,例如,各训练图像的分辨率均为1.875*1.875*2.0。此外,在对调整各候选训练图像的分辨率时,可以使用3D双线性插值法对候选训练图像进行体素重采样,这样可以降低图像体素对分割网络模型训练的影响,从而可以提高训练得到的分割网络模型的模型性能。

在本实施例的一个实现方式中,所述预设网络模型的模型结构与分割网络模型的模型结构相同,预设网络模型与分割网络模型的区别在于预设网络模型的模型参数为初始模型参数,分割网络模型的模型参数为基于若干训练图像训练后的模型参数。在基于训练图像对预设网络模型进行训练时,可以将若干训练图像划分为训练图像集、验证图像集以及测试图像集,其中,训练图像集、验证图像集以及测试图像集中的各训练图像互不相同。可以理解的是,对于若干训练图像中的任一训练图像,该训练图像仅能包括于训练图像集、验证图像集或者测试图像集中的一个图像集,并且每个训练图像均包含于训练图像集、验证图像集或者测试图像集中的一个图像集。此外,值得说明的是,由于训练图像采用的是MRT图像,从而在获取到训练图像集后,需要对训练图像集中的各训练图像进行分块,以得到若干二维训练图像。其中,训练图像的分块过程与上述待检测图像的分块过程相同,这里就不再赘述,具体可以参照上述待检测图像的分块过程。

在本实施例中,在对预设网络模型进行训练时可以采用交叉熵作为损失函数,以Adam作为优化器,基本学习率(learning rate,lr)为10

其中,A表示训练图像对应的标注区域,B表示预设网络模型预测的预测区域。

S30、基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。

具体地,所述分类模型为经过训练的网络模型,所述分类模型用于预测待检测图像对应的CK19预测类别,其中,所述CK19预测类别包括CK19阴性和CK19阳性。可以理解的是,所述待检测图像对应的CK19预测类别为CK19阳性或者CK19阴性。本实施例中在对待检测图像进行CK19类别预测时,采用基于分割网络模型确定的特征图作为输入项,可以提高预测类别的准确性。

在本实施例的一个实现方式中,所述分类模型为Adaboost分类模型,所述基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别具体为:

将所述特征图输入所述Adaboost分类模型,通过所述Adaboost分类模型输出所述待检测图像对应的CK19预测类别。

具体地,所述Adaboost分类模型包括若干弱分类器,所述Adaboost分类模型中的弱分类器数量和学习率通过采用网格寻优(例如,三折交叉验证)的方法进行寻优得到,其中,弱分类器数量的寻优范围为:50,75,100,125,150,175以及300等;学习率的寻优范围为1,0.9,0.8,0.7,0.6, 0.5,0.1以及0.05等。

所述Adaboost分类模型是针对同一个训练集训练不同的弱分类器,然后把各弱分类器集合起来,以构成的强分类器。其中,Adaboost分类模型的训练过程可以为在一弱分类器收敛后,根据每个训练图像的分类是否正确以及总体分类的正确性调整每个训练图像和弱分类器的权重,即降低分类正确样本的权重,而提升分类错误的样本权重,这样使得错误分类的样本更加突出;同时降低错分率高的弱分类器的权重,并将修改过权重的新数据集送给下一次迭代分类器进行训练,最后将训练得到的多个弱分类器按照一定的权重融合起来,作为最后的预测分类器,最终的预测输出可以为:

其中,

在本实施例的一个实现方式中,所述分类模型的训练过程中采用十折交叉验证策略进行训练。如图6所示,所述十折验证的策略是将数据集划分成10份,其中,9份作为训练集、1份作为测试集。基于训练集进行参数网格寻优(例如,采用3折交叉验证),网格寻优使用的策略为训练集再分成三份,两份作为内部训练集,一份作为验证集。基于不同参数组合在内部训练集上训练得到模型,根据验证集的结果选出最优参数组合。最后使用网格寻优得到的参数组合基于训练集进行模型训练,得到最优模型,并用测试集测试最优模型得到最后的预测概率。

根据每一个样本的预测概率,绘制出预测模型的ROC曲线,并得出了相应的AUC值、标准误差(Standard Error,SE)、95%置信区间(Confidence Interval,CI)来评估模型的整体性能。ROC曲线是以真阳率(True Positive Rate,TPR)为纵轴、以假阳率(FalsePositive Rate,FPR)为横轴,其本身对正负样本比例变化不敏感,可以直观地反映不同阈值下敏感性和特异性之间的内在关系,能够综合考虑模型漏、错判的影响,是一种有效、全面的模型评估指标。通过ROC曲线,我们可以确定预测模型的最佳阈值,并计算出预测模型的敏感度(Sensitivity,SEN)、特异度(Specificity,SPEC)、准确率(Accuracy,ACC)和AUC值。本研究使用Youden Index最大值所对应的阈值为最佳阈值,即SEN+SPE-1最大时所对应的阈值。AUC为ROC曲线下的面积,范围从0至1,通常AUC值越大,预测准确性越高。

综上所述,本实施例提供了一种基于深度学习分析的肝细胞癌的CK19的预测方法,所述方法包括将待检测图像分割为若干子图像;基于若干子图像以及经过训练的分割网络模型,确定所述待检测图像对应的特征图;基于所述特征图以及经过训练的分类模型,确定所述待检测图像对应的CK19预测类别。本申请通过采用分割网络模型确定特征图作为分类模型的输入项,并基于该特征图确定所述待检测图像对应的CK19预测类别,这样通过深度学习方式确定待检测图像对应的CK19预测类别,可以提高CK19预测类别的准确性。

为了进一步说明本实施例提供的基于深度学习分析的肝细胞癌的CK19的预测方法,下面给出具体实验作为依据。

1、实验采用的患者信息

对患者性别和CK19表达采用交叉表进行描述,且进行卡方检验,当P值>0.05时认为患者性别和CK19表达之间不相关。同时,本研究对年龄进行正态性检验,若符合正态分布则用均数及标准差描述,并进行独立样本t检验;若不符合正态分布则用中位数及四分位数间距描述,进行非参数检验。当P值>0.05时认为患者年龄和CK19表达之间不相关。统计分析过程在SPSS软件上进行。

本研究患者年龄符合正态分布,均值为55.49,标准差为11.937,使用独立样本t检验P值为0.138。同时,本研究对性别和CK19表达进行Pearson 卡方检验,P值为0.501。结果表明,本研究中患者年龄和性别均与CK19的表达无关。

表1:人口信息统计表

2、三种影像组学特征的预测结果

为了比较本研究方法预测性能,我们分别提取了传统影像组学(TraditionalRadiomics,TR)特征和深度学习影像组学(Deep Learning-Based Radiomics,DLR)特征,其中,根据深度学习预训练模型的不同,DLR特征分为基于深度学习分类网络的影像组学特征(IRV2特征)和基于深度学习分割网络的影像组学特征(UN特征)。基于上述三种特征使用机器学习方法进行Adaboost分类器的构建,以实现HCC的CK19阳性表达预测。最后评估和对比基于不同特征所建的CK19阳性表达预测模型的性能。

表2列出了基于TR特征、基于IRV2特征以及基于UN特征构建Adaboost分类器预测HCC的CK19阳性表达模型的性能。其中,基于UN特征构建的Adaboost分类器性能最佳,AUC为0.832(95%CI:0.721-0.913,p<0.001),基于Youden Index选择分类阈值为0.502087时,ACC、SEN、SPEC分别达到了0.835821、0.76、0.880952。此外,基于TR特征构建的HCC的CK19预测模型AUC为0.511(95%CI:0.386-0.636,p=0.8772), 基于Youden Index选择分类阈值为0.521528时,ACC、SEN、SPEC分别为0.597015、0.400000、0.714286。基于IRV2特征建立的预测模型AUC为0.716(0.593-0.820),基于Youden Index选择分类阈值为0.444854时,ACC、SEN、SPEC分别为0.701493、0.84、0.619048。

表2:基于三种影像特征的Adaboost预测模型性能结果

注:RA表示TR特征;IRV2表示基于Inception-Resnet-v2深度学习分类网络特征;UN表示基于Unet深度学习分割网络特征;假设检验H0:AUC=0.5;p<0.05认为模型AUC与AUC=0.5具有统计学差异。

3、不同影像组学特征性能比较

表3为基于TR特征、基于深度学习分类网络特征、基于深度学习分割网络特征构建的预测模型ROC比较结果。统计任意两组AUC的差值、95%CI与SE,并使用DeLong检验分析其ROC的差异。其中,基于深度学习分割网络特征的预测模型AUC比基于深度学习分类网络特征预测模型的AUC高0.116(95% CI:-0.035-0.268,P=0.132),比基于TR特征的预测模型AUC高0.321(95% CI:0.167-0.475,P<0.001)。同时,基于深度学习分类网络特征的预测模型AUC比基于TR特征的预测模型高0.205(95% CI:0.0255-0.384,P=0.025)。

表3:基于三种影像特征的预测模型ROC比较结果

注:RA表示TR特征;IRV2表示基于Inception-Resnet-v2深度学习分类网络深度特征;UN表示基于Unet深度学习分割网络特征;使用DeLong检验两两比较ROC,P<0.05认为差异具有统计学意义。

相比于TR特征,基于DLR特征具有下列优势:第一,TR特征需要人为设计并提取,且提取特征的过程较为复杂,且一般基于一定的前提或者研究假设,特征的有效性难以得到验证。而DLR无需额外的特征提取步骤,较为方便和快捷,其特征的有效性仅与预训练模型的性能相关。第二,深度学习网络能提取更高维度的特征,且特征更为抽象、对病灶信息的表征能力更强。深度学习预训练网络在训练的过程中能够最大程度地挖掘出HCC患者的MRI图像与CK19阳性表达之间的内在联系,从而建立出高效、准确和鲁棒的预测模型。而TR方法只是采用通用性较高的特征,并没有针对临床任务本身的需求做出更有效地分析和调整,容易错过一些重要的特征信息。

对于DLR两种特征,如表3所示,基于深度学习分割网络深度特征构建的Adaboost分类器性能高于基于深度学习分类网络特征构建的分类器性能。使用DeLong检验进行两者性能比较,两者之间不具有统计学差异(P=0.132),但是AUC差值为0.116。由于IRV2特征是基于患者ROI区域最大层选定的矩形框区域进行提取,这使得深度学习分类网络减少对肿瘤区域以外信息的提取,有助于提升特征的有效性,从而提升了深度学习分类网络的性能。但这使得此特征提取过程中需要用到金标准。同样,深度学习预训练分割网络可以利用金标准来监督特征的学习,使得网络的注意力更集中于病灶区域。相较于深度学习分类网络提取特征的方法,深度学习分割网络提取特征具有以下优势:⑴仅需在模型预训练过程中使用金标准,而无需在特征提取的过程中使用,大大降低了勾画ROI给临床医生带来的负担;⑵网络注意力更集中于病灶区域,提取的特征更具有有效性。

基于上述基于深度学习分析的肝细胞癌的CK19的预测方法,本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述实施例所述的基于深度学习分析的肝细胞癌的CK19的预测方法中的步骤。

基于上述基于深度学习分析的肝细胞癌的CK19的预测方法,本申请还提供了一种终端设备,如图7所示,其包括至少一个处理器(processor)20;显示屏21;以及存储器(memory)22,还可以包括通信接口(Communications Interface)23和总线24。其中,处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令,以执行上述实施例中的方法。

此外,上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。

存储器22作为一种计算机可读存储介质,可设置为存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块,从而执行功能应用以及数据处理,即实现上述实施例中的方法。

存储器22可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器22可以包括高速随机存取存储器,还可以包括非易失性存储器。例如,U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。

此外,上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不再一一陈述。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号