首页> 中国专利> 一种基于双区域影像组学的食管鳞癌生存预测方法和系统

一种基于双区域影像组学的食管鳞癌生存预测方法和系统

摘要

本发明公开了一种基于双区域影像组学的食管鳞癌生存预测方法和系统。该方法包括:利用已知病例的数据集,分别提取肿瘤区域和淋巴结区域的影像组学特征,该数据集包含患者的CT影像数据、生存期信息和临床风险信息;对所提取的影像组学特征进行可预测性筛选;将筛选后的特征输入最小绝对收缩和选择算子LASSO回归模型,获得非零系数的特征,并利用非零系数特征的线性组合构建用于生存预测的双区域影像组学预后模型,其中所述双区域影像组学预后模型的输入是融合肿瘤区域和淋巴结区域建立的双区域影像组学特征。利用本发明能提高食管鳞癌的生存预测准确性。

著录项

  • 公开/公告号CN113096757A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 中国科学院深圳先进技术研究院;

    申请/专利号CN202110477059.X

  • 发明设计人 董璐;李志成;赵源深;张圣海;

    申请日2021-04-29

  • 分类号G16H10/60(20180101);G16H50/20(20180101);G16H50/30(20180101);G16H50/50(20180101);G16H50/70(20180101);

  • 代理机构11430 北京市诚辉律师事务所;

  • 代理人耿慧敏;朱伟军

  • 地址 518055 广东省深圳市南山区深圳大学城学苑大道1068号

  • 入库时间 2023-06-19 11:45:49

说明书

技术领域

本发明涉及医学图像处理技术领域,更具体地,涉及一种基于双区域影像组学的食管鳞癌生存预测方法和系统。

背景技术

鳞癌是食管癌最主要的病理类型,目前食管癌人群生存率的研究存在诸多局限,需要以人群为基础的多中心大样本来提供食管鳞癌生存率等预后指标的信息。

在现有技术中,癌症预后都是针对年龄性别等临床风险因素,运用临床PTNM分期,或者将CT图像的影响组学用于癌症预后研究。有团队对晚期结肠癌进行分期的研究中通过整合来自原发肿瘤的影像组学特征和淋巴结的影像组学特征,组成双区域影像组学特征,可以实现较高准确率的预测。但现有仅用临床因素的PTNM食管鳞状细胞癌预后模型,预后准确率较差,且临床实际运用中发现存在较大地区差异性,从而导致误诊。

发明内容

本发明的目的是克服上述现有技术的缺陷,提供一种基于双区域影像组学的食管鳞癌生存预测方法和系统。

根据本发明的第一方面,提高一种基于双区域影像组学的食管鳞癌生存预测方法。该方法包括:

步骤S1,利用已知病例的数据集,分别提取肿瘤区域和淋巴结区域的影像组学特征,该数据集包含患者的CT影像数据、生存期信息和临床风险信息;

步骤S2,对所提取的影像组学特征进行可预测性筛选;

步骤S3,将筛选后的特征输入最小绝对收缩和选择算子LASSO回归模型,获得非零系数的特征,并利用非零系数特征的线性组合构建用于生存预测的双区域影像组学预后模型,其中所述双区域影像组学预后模型的输入是融合肿瘤区域和淋巴结区域建立的双区域影像组学特征。

根据本发明的第二方面,提供一种基于双区域影像组学的食管鳞癌生存预测系统。该系统包括:

特征提取单元:用于利用已知病例的数据集,分别提取肿瘤区域和淋巴结区域的影像组学特征,该数据集包含患者的CT影像数据、生存期信息和临床风险信息;

特征筛选单元:用于对所提取的影像组学特征进行可预测性筛选;

生存预测单元:用于将筛选后的特征输入最小绝对收缩和选择算子LASSO回归模型,获得非零系数的特征,并利用非零系数特征的线性组合构建用于生存预测的双区域影像组学预后模型,其中所述双区域影像组学预后模型的输入是融合肿瘤区域和淋巴结区域建立的双区域影像组学特征。

与现有技术相比,本发明的优点在于,挖掘增强CT图像的临床辅助价值,从中提取影像组学特征辅助食管鳞状细胞癌预后;考虑到食管部位淋巴结密集而跳跃,易出现癌症转移侵犯现象,整合来自原发肿瘤的影像组学特征和近邻淋巴结的影像组学特征,组成双区域影像组学特征,对食管鳞状细胞癌进行总生存期OS(Overall Survival,或全生存期)预后分析,提高了预测准确度。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是根据本发明一个实施例的训练数据集的肿瘤+淋巴结影像组学标签进行Kaplan-Meier分析的示意图;

图2是根据本发明一个实施例的验证数据集的肿瘤+淋巴结影像组学标签进行Kaplan-Meier分析的示意图;

图3根据本发明一个实施例的训练数据集的肿瘤影像组学标签进行Kaplan-Meier分析的示意图;

图4是根据本发明一个实施例的验证数据集的肿瘤影像组学标签进行Kaplan-Meier分析的示意图;

图5根据本发明一个实施例的训练数据集的肿瘤+淋巴结+临床预后模型Kaplan-Meier分析的示意图;

图6根据本发明一个实施例的验证数据集的肿瘤+淋巴结+临床预后模型Kaplan-Meier分析的示意图;

图7根据本发明一个实施例的训练数据集的传统临床预后模型Kaplan-Meier分析的示意图;

图8根据本发明一个实施例的验证数据集的传统临床预后模型Kaplan-Meier分析的示意图;

图9是根据本发明一个实施例的预测OS的临床预后诺模图;

图10根据本发明一个实施例的预测OS的肿瘤+淋巴结+临床预后诺模图;

图11是根据本发明一个实施例的临床预后诺模图的校准曲线示意图;

图12是根据本发明一个实施例的肿瘤+淋巴结+临床预后诺模图的校准曲线示意图;

图13是根据本发明一个实施例的临床预后诺模图和肿瘤+淋巴结+临床预后诺模图的决策曲线对比示意图;

图14是根据本发明一个实施例的临床训练集timeROC曲线示意图;

图15是根据本发明一个实施例的双区影像组学训练集timeROC曲线示意图;

图16是根据本发明一个实施例的基于双区域影像组学的食管鳞癌生存预测方法的流程图;

图17是根据本发明一个实施例的基于双区域影像组学的食管鳞癌生存预测方法的过程示意图;

附图中,risk-风险;Low risk-低风险;High risk-高风险;Probablitily ofover survival–全生存期的概率;months-月;Number at risk-风险数目;Net Benefit-净增益;High Risk Threshold–高风险阈值;cost-成本;Benefit Ratio-增益率;Sensitivity-敏感性,Specificity-特异性。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本发明考虑食管近邻淋巴结与食管癌发展之间的联系,加入附近淋巴区域影像联合建模,而非仅肿瘤本位的VOI(Volume of Interest,三维感兴趣体积),简言之,所提供的技术方案包括以下内容。

1)、获取食管癌CT影像数据集307例,随机分成训练组(200例)与验证组(107例),并用秩和检验或卡方检验验证数据集临床病理特征的差异。

2)、使用Pyradiomics(用于医学图像的影像组学特征提取)从每个病例图像的肿瘤本位VOI和临近淋巴结中分别提取1132个特征用于分析,例如包括一阶特征、形状特征和纹理特征等。

3)、继而进行特征降维,通过可预测性选择,计算每个特征的C-index(C指数,即一致性指数),去除C-index在0.4至0.6之间的特征。

4)、通过使用LASSO-COX回归分析,建立影像组学特征,包括来自肿瘤区域的特征;来自淋巴结区域的特征;通过融合肿瘤和淋巴结区域的特征建立的双区域特征。并根据建立的影像组学特征构建影像组学预后模型,包括肿瘤+淋巴结双区影像组学预后模型M1和肿瘤影像组学预后模型M2和临床预后模型M3,将肿瘤+淋巴结双区影像组学标签与年龄、性别,CT报告肿瘤长度和厚度、CT报告中肿瘤的位置、淋巴结状态,pT和pN分期的临床病理因素相融合,构建肿瘤+淋巴结+临床预后模型M4。

5)、通过使用Kaplan-Meier(用于生存分析)方法生成存活曲线,并通过双侧对数秩检验进行比较,通过CI值、AUC值、决策曲线、校正曲线,时间ROC曲线等多方面进行比较验证。

具体地,结合图16和图17,所提供的基于双区域影像组学的食管鳞癌生存预测方法包括以下步骤。

步骤S10,提取近邻淋巴结和肿瘤区域的影像组学特征。

具体地,对食管鳞状细胞癌肿瘤和近邻淋巴结的三维感兴趣体积(VOI)进行分割与特征提取。例如,首先采用线性插值法将所有体素各向同性地重采样到mm3中,进行1×1×1一致特征提取,然后利用ITK-SNAP软件V3.8.0,由在食管成像方面有10年经验的放射科医生逐层勾画肿瘤或淋巴结的VOI。

为了证明特征描述变化的鲁棒性,由该放射科医生和另一位具有5年食管成像经验的放射科医生对患者重复VOI勾画,生成评分员内测试数据集以及评分员间测试数据集。为了使强度范围正常化,在描绘表示肿瘤(或淋巴结)区域的平均值和标准偏差中,强度超过μ±3σ的体素被丢弃。

在每个食管鳞状细胞癌病例的肿瘤VOI中,利用开源工具Pyradiomics提取肿瘤区域的影像组学特征,每个病例的肿瘤区域影像组学特征包含1132个特征,包括一阶特征、形状特征和纹理特征等。在每个食管鳞状细胞癌病例的临近淋巴结VOI中,也利用Python软件的开源工具Pyradiomics提取淋巴结区域的影像组学特征,每个病例的淋巴结区域影像组学特征同样包含1132个特征,包括一阶特征、形状特征和纹理特征。其中,可采用灰度共生矩阵、灰度游程矩阵、灰度大小区域矩阵、灰度相关矩阵和邻域灰度调差矩阵等方法计算纹理特征。

步骤S20,构建肿瘤+淋巴结双区和肿瘤单区的影像组学标签。

例如,采用R软件V3.4.0进行统计分析,以衡量各组数据的差异性。例如,P值<0.05被认为是满足显著性差异。卡方检验适用于独立的两组二分类对比,或者独立的多组二分类对比,而对于多组多分类资料对比,则应使用秩和检验。在本发明中,将Wilcoxon秩和检验用于评估训练集和测试集之间年龄、CT报告肿瘤长度和厚度的差异,而对训练组和测试组患者的性别,CT报告中肿瘤的位置、淋巴结状态,pT和pN分期则使用卡方检验。

为了对高维特征进行优先排序,在一个实施例中,采用三步特征选择策略。

首先,通过组内相关系数(Intraclass Correlation Coefficient,ICC)计算每个特征的评分者内信度以及每个特征的评分者间信度。ICC<0.85的特征被排除在后续分析之外。

然后,和该患者的总生存期(OS)数据一起,计算其选择单变量一致性指数C-Index,(如C-Index≥0.60(正相关)或≤0.40(负相关))的特征作为预后变量,其他特征则被丢弃。

接下来,将筛选后的特征输入到最小绝对收缩和选择算子(Least AbsoluteShrinkage and Selection Operator,LASSO)回归模型中,以确定最优特征。并基于训练数据集建立影像组学特征。LASSO回归模型将不相关特征的系数精确地降为零,为了优化模型的超参数λ,例如采用最小10折交叉验证,最终得到交叉验证预测误差最小的模型。将剩余的非零特征按系数线性组合,得到最终的预测模型。

使用与上述相同的方法,对每例食管鳞状细胞癌患者的肿瘤区域和淋巴结区域进行VOI勾画、提取影像组学特征和特征筛选,并建立三个影像组学特征,包括:来自肿瘤区域的特征;来自淋巴结区域的特征;通过融合肿瘤和淋巴结区域的特征建立的双区域特征。进一步地,根据建立的影像组学特征构建两个影像组学预后模型,包括肿瘤+淋巴结双区影像组学预后模型(M1,本发明模型)和肿瘤影像组学预后模型(M2)。

然后,使用Kaplan-Meier生存分析在200例训练数据集上,评估肿瘤+淋巴结双区影像组学预后模型(M1)和肿瘤影像组学预后模型(M2)与总生存期OS的关系,并在107例验证数据集进行模型验证。Kaplan-Meier法在1958年由Kaplan和Meier提出,可以简称为KM法。使用该方法时,首先要明确,生存分析并不是对所有的观察对象进行终身关注,它往往会设立一个观察终结点,大都是以时间为观察评估条件,例如通常用5年生存期来进行衡量。观察的指标和条件,也就是观察的结局事件,往往在实验开始就要给出明确定义,例如,通常采用疾病是否复发或者是否死亡。

对于肿瘤+淋巴结双区影像组学预后模型(M1)和肿瘤影像组学预后模型(M2),使用LASSO回归筛选出来的影像组学特征线性组合,分别构建M1和M2的影像组学标志物模型,并计算出每个病人的Rad-score(影像组学评分)。使用X-tile,生成训练数据集的Rad-score最优截断值,将患者分为高风险组和低风险组,并在验证数据集验证。然后采用加权对数秩检验评估两组之间KM曲线差异,并将M1和M2的影像组学标志物模型分别放入Cox比例风险模型(用于衡量特征对于死亡率的影响)。

步骤S30,获取肿瘤+淋巴结双区和肿瘤单区的影像组学标签构建结果。

对于肿瘤+淋巴结图像(M1),使用pyradiomics从每个病例中分别提取了1132个特征,包括一阶特征、形状特征和纹理特征,共2264个影像组学特征。由于所提取的特征过多,首先进行降维,通过可预测性选择,计算每个特征的C-index,去除C-index在0.4至0.6之间的特征,这一步从这2264个特征中选择出了66个特征。

使用Lasso-Cox回归模型构建影像组学标志物,使用LASSO回归筛选来自肿瘤图像和淋巴结图像(M1)的66个特征,得到在LASSO-Cox回归模型中具有10个非零系数的特征。线性组合这10个特征,构建影像组学标志物模型,从而计算出每个病人的Rad-score。使用X-tile可生成训练集的Rad-score的最优的切断值为0.0942,使用训练集的最优切断值,将患者分为高风险组和低风险组。

对于肿瘤图像(M2),从每个病例中提取了包括一阶特征、形状特征和纹理特征1132个特征。同样由于所提取的特征过多,首先进行降维,通过可预测性选择,计算每个特征的C-index,去除C-index在0.4至0.6之间的特征,这一步从这1132个特征中选择出了61个特征。使用Lasso-Cox回归模型构建影像组学标志物,使用LASSO回归筛选来自肿瘤图像(M2)的61个特征,得到在LASSO Cox回归模型中具有5个非零系数的特征。线性组合这5个特征,构建影像组学标志物模型,从而计算出每个病人的Rad-score。使用X-tile,可生成训练集的Rad-score的最优的切断值为0.1913,使用训练集的最优切断值,将患者分为高风险组和低风险组。

步骤S40,验证淋巴结影像组学标签对肿瘤单区域影像组学模型的预后增益。

参见表1和表2,训练数据集中,肿瘤+淋巴结双区域影像组学标签获得了更高的OS预测能力,C-Index为0.698,对比肿瘤单区影像组学标签,OS预测C-Index为0.631。在验证数据集上,肿瘤+淋巴结双区域影像组学标签效果也是更佳,肿瘤+淋巴结双区域标签C-Index为0.611,肿瘤单区影像组学标签C-Index为0.594,Akaike信息准则(Akaikeinformation criterion,AIC)可以说明模型对过度拟合的可靠性能,AIC值的结果是肿瘤+淋巴结双区域标签更低,表明其相对过度拟合的可靠性更好。

表1:两个模型在训练集的C-Index、95%CI、AIC值

表2:两个模型在测试集的C-Index、95%CI、AIC值

重分类改善指标(Net Reclassification Improvement,NRI)和综合判别改善指数(Integrated Discrimination Improvement,IDI)经常被分别用来说明新迭代模型的诊断能力和诊断准确性是否提高。如表3所示,经对比肿瘤+淋巴结双区和肿瘤单区的影像组学标签结果,新模型肿瘤+淋巴结双区的影像组学预后模型的NRI和IDI均>0,同时p值大小说明该数据具有统计学意义,说明相对于旧模型(肿瘤影像组学预后模型)的诊断能力和诊断准确性有了正改善的效果。

表3:两个模型对比的训练集NRI、IDI的值

图1至图4分别展示了根据训练数据集的肿瘤+淋巴结影像组学标签进行Kaplan-Meier分析,根据验证数据集的肿瘤影像组学标签进行Kaplan-Meier分析,根据训练数据集的肿瘤+淋巴结影像组学标签进行Kaplan-Meier分析和根据验证数据集的肿瘤+淋巴结影像组学标签进行Kaplan-Meier分析。对比发现,肿瘤+淋巴结双区影像组学预后模型(M1)和肿瘤影像组学预后模型(M2)在训练数据集上均能实现高低风险组区分,但前者区分能力优于后者,而对于验证数据集KM曲线,肿瘤影像组学预后模型(M2)并不能很好的区分高低风险组的区分,肿瘤+淋巴结双区影像组学预后模型(M1)可以实现区分。

验证结果表明,肿瘤+淋巴结双区影像组学预后模型(M1)能够比肿瘤影像组学预后模型(M2)获得更好的临床预后,能够显著改善肿瘤单区域影像组学模型并不十分出色的预后效果,这说明淋巴结影像组学标签对肿瘤单区域影像组学模型的预后增益价值,也反应了临床食管鳞状细胞癌诊断分期与淋巴结转移的相关性。

步骤S50,构建肿瘤+淋巴结+临床预后模型和临床预后模型并进行增益验证。

在此步骤,探究双区影像组学标签相比于传统临床因素的预后增益价值,完成肿瘤+淋巴结+临床预后模型和临床预后模型的构建,并绘制出肿瘤+淋巴结+临床预后诺模图和临床预后诺模图,本发明所提供的肿瘤+淋巴结+临床预后模型采用上述提取的肿瘤+淋巴结双区域影像组学标志物,纳入临床病理因素一起构建,其中临床病理因素包含年龄、性别,CT报告肿瘤长度和厚度、CT报告中肿瘤的位置、淋巴结状态,pT和pN分期。并在模型校准、鉴别、重分类和临床可用性等多方面进行增益价值评估。

1)临床特征分析

例如,收集了符合标准的307例食管鳞状细胞癌患者数据,其中200例训练组,107例验证组。通过分析训练组和验证组的307例食管鳞状细胞癌患者的临床特征,两组临床特征无显著差异,训练组的中位OS为59.035个月(20.56-60.00),验证组为42.100个月(19.54-60.00)。

将利用M1的10个特征所构建的影像组学标志物与年龄、性别,CT报告肿瘤长度和厚度、CT报告中肿瘤的位置、淋巴结状态,pT和pN分期的临床病理因素相融合,构建肿瘤+淋巴结+临床预后模型(M4,本发明模型)。

对于临床预后模型(M3)使用X-tile,可生成训练集的Rad-score的最优的切断值为0.2120,使用训练集的最优切断值,将患者分为高风险组和低风险组。使用X-tile对于肿瘤+淋巴结+临床预后模型(M4)的预后Rad-score进行分层,可生成训练集的Rad-score的最优的切断值为0.5425,使用训练集的最优切断值,将患者分为高风险组和低风险组。

图5至图8分别展示了根据训练数据集的肿瘤+淋巴结+临床预后模型Kaplan-Meier分析,根据训练数据集的肿瘤+淋巴结+临床预后模型Kaplan-Meier分析,根据训练数据集的传统临床预后模型Kaplan-Meier分析和根据验证数据集的传统临床预后模型Kaplan-Meier分析。通过对比发现,不论是在训练数据集还是验证数据集上,肿瘤+淋巴结+临床预后模型(M4)和传统的临床预后模型(M3)两个模型均能明显区分出高低风险组,但是前者的区分能力优于后者。

如表4和表5所示,在肿瘤+淋巴结+临床预后模型与传统临床预后模型结果对比,训练数据集中肿瘤+淋巴结+临床预后模型获得了更高的OS预测,C-Index为0.732,对比传统临床预后模型OS预测C-Index为0.708。在验证数据集上本发明的模型也更佳,肿瘤+淋巴结+临床预后模型C-Index为0.689,对比传统临床预后模型OS预测C-Index为0.700。Akaike信息准则(Akaike information criterion,AIC)可以说明模型对过度拟合的可靠性能,肿瘤+淋巴结+临床预后模型的AIC值低,表明模型对过度拟合的可靠性相对传统临床预后模型更好。

表4:两个模型在训练集的C-Index、95%CI、AIC值

表5:两个模型在测试集的C-Index、95%CI、AIC值

重分类改善指标(Net Reclassification Improvement,NRI)和综合判别改善指数(Integrated Discrimination Improvement,IDI)经常被分别用来说明新迭代模型的诊断能力和诊断准确性是否提高。如表6所示,在肿瘤+淋巴结+临床预后模型与传统临床预后模型对比下,新模型肿瘤+淋巴结+临床预后模型的NRI和IDI均>0,NRI为0.269(95%CI:0.085,0.409,P=0.008)和IDI为0.068(95%CI:0.025,0.109,P<0.001),p值大小说明该数据具有统计学意义,说明相对于旧模型传统临床预后模型的诊断能力和诊断准确性有了正改善的效果。

表6:两个模型对比的训练集NRI、IDI的值

表7中的HR风险比信息总结了OS预测中所有变量的HR风险比及95%置信区间(CI,confidence interval),通过多变量Cox分析(HR:1.869,95%CI:1.347,2.592,P=1.82e-04),可知肿瘤+淋巴结双区域模型标签是有统计学意义的独立预后因素。

表7:OS预测中所有变量的HR风险比

图9和图10是预测OS的临床风险因素预后NOMO图和预测OS的肿瘤+淋巴结+临床预后NOMO图,图11和图12是食管鳞状细胞癌手术切除术后2年、3年以及5年的复发概率预测的校准曲线,横坐标为NOMO图临床预后的OS,纵坐标为实际观察的OS,通过临床预后模型和肿瘤+淋巴结+临床预后模型的校准曲线对比分析可知,后者的预测与实际指标之间一致性更优。图13为决策曲线,其中横坐标为阈值概率,纵坐标为净收益,由图可知,在绝大部分的阈值概率内,肿瘤+淋巴结+临床预后模型诺模图比临床预后模型诺模图的总体净效益更大,这说明了肿瘤+淋巴结+临床预后模型的临床有效性。另外,图14和图15是双区影像组学模型5年生存ROC曲线训练组AUC为0.813(95%CI:0.751-0.875),验证组AUC为0.723(95%CI:0.621-0.825),该结果表明,双区影像组学模型在对高危患者进行1-5年生存率分层以调整治疗策略方面优于传统临床预后模型,影像组学标签具有增益价值。

上述实验数据表明,本发明提供的“肿瘤-淋巴结双区域影像组学”模型的预后性能优于“肿瘤影像组学”模型,近邻淋巴结影像组学标签的增加,相较于单一肿瘤影像组学标签预后模型具有增量价值;另外“肿瘤-淋巴结-临床”模型的预后性能优于“临床”模型,“肿瘤-淋巴结双区域影像组学”模型标签是OS的独立预后因素,有很大的潜力与临床价值,成为判断食管鳞状细胞癌预后高低风险的影像学生物标志物,并为目前临床分期不足提供了补充。

相应地,本发明还提供一种基于双区域影像组学的食管鳞癌生存预测系统,用于实现上述方法的一个方面或多个方面。例如,该系统包括:特征提取单元,其用于利用已知病例的数据集,分别提取肿瘤区域和淋巴结区域的影像组学特征,该数据集包含患者的CT影像数据、生存期信息和临床风险信息;特征筛选单元,其用于对所提取的影像组学特征进行可预测性筛选;生存预测单元,其用于将筛选后的特征输入最小绝对收缩和选择算子LASSO回归模型,获得非零系数的特征,并利用非零系数特征的线性组合构建用于生存预测的双区域影像组学预后模型,其中所述双区域影像组学预后模型的输入是融合肿瘤区域和淋巴结区域建立的双区域影像组学特征。

综上所述,与现有技术相比,本发明的优点是:

1)、现有方案仅用临床因素的PTNM食管鳞状细胞癌预后模型,预后准确率较差,且临床实际运用中发现有较大差异性,从而导致误诊,本发明挖掘增强CT图像的临床辅助价值,从中提取影像组学特征辅助食管鳞状细胞癌预后;

2)相比利用来自原发肿瘤的影像组学特征的食管鳞状细胞癌预后模型,本发明考虑到食管部位淋巴结密集而跳跃,易出现癌症转移侵犯现象,整合来自原发肿瘤的影像组学特征和近邻淋巴结的影像组学特征,组成双区域影像组学特征,以此对食管鳞状细胞癌进行总生存期OS预后分析,相较于现有的临床预后模型具有增量价值。

3)利用本发明可提高对原发性病变和区域淋巴结的敏感性,并且提供肿瘤异质性的丰富信息。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++、Python等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号