首页> 中国专利> 基于影像组学及语义特征预测CRLM患者的RAS基因状态

基于影像组学及语义特征预测CRLM患者的RAS基因状态

摘要

本发明属于智能医疗技术领域,具体涉及一种基于影像组学特征预测晚期结直肠癌肝转移患者的RAS基因状态的模型及其应用。本发明成功构建了基于影像组学特征预测晚期结直肠癌肝转移患者的RAS基因状态的模型:收集患者的初始治疗前增强CT图像,提取影像组学特征,利用1000次Lasso‑Logistic分析得到12个影像组学特征,利用多因素逻辑回归方法构建影像组学预测模型。本发明利用的是增强CT图像,达到经济、无创、快速地预测结直肠癌肝转移患者的RAS基因状态,辅助基因分型,可以帮助临床医生进行精准个体化治疗决策,具有重大的临床意义。

著录项

  • 公开/公告号CN114783517A

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 中国医科大学;

    申请/专利号CN202210517862.6

  • 发明设计人 王昕缇;石芮川;孟林;

    申请日2022-05-13

  • 分类号G16B20/50;G16B20/20;G06T7/11;

  • 代理机构沈阳亚泰专利商标代理有限公司;

  • 代理人史力伏

  • 地址 110122 辽宁省沈阳市沈北新区蒲河路77号

  • 入库时间 2023-06-19 16:06:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    公开

    发明专利申请公布

说明书

技术领域

本发明属于智能医疗技术领域,具体涉及一种基于影像组学特征预测晚期结直肠癌肝转移患者的RAS基因状态的模型及其应用。

背景技术

结直肠癌(colorectal cancer,CRC)是世界上癌症相关死亡的第三大常见原因。既往有研究表明,约25-30%被诊断为结直肠癌的患者在病程中发生肝转移。在结直肠癌患者中,RAS(KRAS和NRAS)基因突变状态被越发广泛应用于指导临床决策。在针对结直肠癌肝转移(colorectal liver metastasis,CRLM)患者的手术治疗上,安全手术切缘的建议是至少为10mm。然而,对于携带RAS基因突变的CRLM患者,目前还没有明确的最佳切缘。因此,对于携带RAS基因突变的CRLM患者,肝转移病灶的手术切缘的选择应该有所不同。此外,RAS基因突变与较短的无病生存期(disease-free survival,DFS)和总生存期(overalsurvival,OS)相关。RAS基因的突变状态对晚期结直肠癌患者的治疗选择有着至关重要的影响。

在晚期结直肠癌患者中,明确RAS基因突变状态是后续治疗的“必经之路”。目前对RAS基因的突变状态检测通常需要通过对手术或活检所获得的组织标本进行分析,这一方法不仅具有侵入性,并且费用较高。尤其是对于组织标本年代久远、无法行穿刺活检术的患者来说,通过影像组学实现对RAS基因状态的无创预测显得格外重要。影像组学(Radiomics)的基本原理正是通过分析医学影像中的高通量的特征信息反映微观水平(如蛋白质、基因、信号通路)的特征。利用CT图像中的影像组学特征构建RAS基因状态预测模型具有多种得天独厚的优势,(1)无创:传统的RAS基因状态检测手段需要依靠对组织标本的分析,而该模型使用的是CT图像数据,不需要对患者进行有创操作;(2)数据来源广泛:全腹增强CT可谓是晚期结直肠癌患者中最常见的辅助检查之一;(3)成本低廉:该模型是对CT图像的“二次利用”,不需要再增加患者的治疗费用;(4)等待期短:增强CT图像可以说是“立等可取”,患者在完成CT扫描检查后,CT图像可以瞬时获得,而传统的检测手段一般需要等待5-7个工作日才能明确RAS基因突变状态。这种非侵入性、数据来源广泛、成本低廉、等待期短的预测方法可以进一步辅助临床医生对CRLM患者的治疗决策。

发明内容

针对上述现有技术存在的缺陷,本发明提供一种基于影像组学特征预测CRLM患者的RAS基因状态的模型及其应用。该模型可用于预测CRLM患者的RAS基因状态,辅助医生对疾病做出更准确的判断以及治疗决策。

为了实现上述目的,本发明提供了如下技术方案。

本发明提供了一种基于影像组学特征预测CRLM患者的RAS基因状态的模型的构建方法,其特征在于,所述方法基于影像组学特征建立,具体步骤如下:

S1. 收集初诊时为晚期肠癌肝转移患者的增强CT影像学图像数据;

S2. 对S1收集的增强CT影像学图像数据进行分析,分割感兴趣区域,提取影像特征;

S3. 利用1000次Lasso-Logistic分析,其中12种影像特征及参数的组合稳定重复出现了900次以上;

S4.利用多因素逻辑回归方法对S3得到的12个影像组学特征,构建得到相应的基于影像组学特征的RAS基因状态预测模型。

进一步地,S2中所述分割感兴趣区域采用三维半自动分割方法,对门静脉期CT图像中的感兴趣区域进行分割。

优选地,所述三维半自动分割方法的具体步骤如下:

(1)将DICOM格式的PVP图像导入3D-Slicer软件,然后使用软组织窗(窗宽:350HU,窗位:40HU)对所选ROIs进行轮廓勾画,使用FAST-MARCHING半自动快速分割算法对每名患者的全部PVP图像进行逐层分割以对ROIs整体进行分析;

(2)再一次手动地逐层调整并完善勾画区域,沿着病变的可见清晰边界进行勾画,并且擦除邻近的正常组织结构,例如胆管和血管;

(3)勾画完成的ROIs分割结果由两名经验丰富的高年资放射线科医生检查并进一步完善修改。最后,将ROIs导出为NRRD和MRML格式进行存储和进一步分析。

进一步地,S2中所述提取影像特征包括:

(1)一阶特征描述了体素强度在ROIs中的分布情况;

(2)基于形状的特征描述了ROIs的立体直观特征,包括二维和三维水平的大小和形状;

(3)基于5种纹理矩阵提取的纹理特征:a)灰度共生矩阵、b)灰度区域大小矩阵、c)灰度游程长度矩阵、d)邻域灰度差矩阵和e)灰度相关矩阵;

(4)小波特征:对原始图像的基础上增加了小波滤波,降噪的同时可以提取详细的高维影像组特征。

进一步地,S3中所述筛选得到的12个影像组特征包括:

wavelet.HHH_glszm_SizeZoneNonUniformityNormalized,wavelet.HLL_glszm_LowGrayLevelZoneEmphasis",wavelet.HLL_glszm_SmallAreaLowGrayLevelEmphasis",wavelet.LHL_firstorder_Skewness,wavelet.LHL_glcm_ClusterShade,wavelet.LHL_glcm_Correlation,wavelet.LHL_glcm_MCC,wavelet.LLH_firstorder_Median,wavelet.LLH_glcm_Idn,wavelet.LLH_glszm_GrayLevelNonUniformityNormalized,wavelet.LLH_glszm_SmallAreaLowGrayLevelEmphasis,wavelet.LLH_glszm_ZoneEntropy。

进一步地,S4中所述预测模型是影像组学预测模型。影像组学分数计算公式:

3.5512-6.1777*wavelet.HHH_glszm_SizeZoneNonUniformityNormalized-1.8147*wavelet.HLL_glszm_LowGrayLevelZoneEmphasis+1.3087*wavelet.HLL_glszm_SmallAreaLowGrayLevelEmphasis-4.0329*wavelet.LHL_firstorder_Skewness-2.1221*wavelet.LHL_glcm_ClusterShade+1.0033*wavelet.LHL_glcm_Correlation-3.0967*wavelet.LHL_glcm_MCC+0.4027*wavelet.LLH_firstorder_Median+0.5078*wavelet.LLH_glcm_Idn-0.2159*wavelet.LLH_glszm_GrayLevelNonUniformityNormalized+6.8791*wavelet.LLH_glszm_SmallAreaLowGrayLevelEmphasis+4.6685*wavelet.LLH_glszm_ZoneEntropy。

将cutoff值设定为50%,即根据上述公式计算得到的分数大于50%预测该名患者为RAS基因突变型,反之则预测患者为RAS基因野生型。

本发明还提供一种存储介质,其上存储有多条指令,其特征在于,所述指令适于由处理器加载并执行,以实现上述所述基于影像组学特征模型的结直肠癌肝转移RAS基因状态预测方法的步骤。

本发明还提供一种终端,其特征在于,包括:处理器、与处理器通信连接的存储介质,所述存储介质适于存储多条指令;所述处理器适于调用所述存储介质中的指令,以执行实现上述所述基于影像组学特征模型的结直肠癌肝转移RAS基因状态预测方法的步骤。

本发明还提供一种晚期结直肠癌肝转移患者的RAS基因状态的预测模型,其特征在于,通过上述所述基于影像组学特征模型的晚期结直肠癌肝转移患者的RAS基因状态预测方法的步骤构建得到。

本发明还提供一种结直肠癌肝转移患者RAS基因状态的预测装置,其特征在于,包括上述的晚期结直肠癌肝转移患者的RAS基因状态预测模型。

与现有技术相比本发明的有益效果。

如上所述,本发明基于治疗前的影像组学特征,本发明构建了一种针对结直肠癌肝转移患者RAS基因状态的预测模型,具有以下有益效果。

首先,通过本发明的方法,可以针对晚期结直肠癌肝转移患者在接受系统抗肿瘤治疗之前,利用增强CT图像的影像组学特征,更准确的预测RAS基因状态,即是否携带突变的RAS基因,辅助医生为后续的抗肿瘤治疗提供更准确的判断以及治疗决策。

其次,RAS基因的突变状态检测通常需要通过对手术或活检所获得的组织标本进行分析,这一方法不仅具有侵入性,并且费用较高、等待结果的周期较长。在本方明中,我们利用的是增强CT图像,一方面增强CT是肿瘤患者最常见的的检查之一。另一方面,增强CT检查方法本身是无创的,并且增强CT检查可以马上生成图像,结果立等可取。本发明方法可以做到经济、无创、快速地预测RAS基因状态。

本发明方法作为辅助病理诊断方法,可以帮助临床医生进行精准个体化治疗决策。

附图说明

图1. 利用1000次Lasso-Logistic分析,筛选得到12个影像组特征。利用1000次Lasso-Logistic分析,其中12种影像特征及参数的组合重复出现了900次以上,他们分别是(1)参数,(2)wavelet.HHH_glszm_SizeZoneNonUniformityNormalized,(3)wavelet.HLL_glszm_LowGrayLevelZoneEmphasis,(4)wavelet.HLL_glszm_SmallAreaLowGrayLevelEmphasis,(5)wavelet.LHL_firstorder_Skewness,(6)wavelet.LHL_glcm_ClusterShade,(7)wavelet.LHL_glcm_Correlation,(8)wavelet.LHL_glcm_MCC,(9)wavelet.LLH_firstorder_Median,(10)wavelet.LLH_glcm_Idn,(11)wavelet.LLH_glszm_GrayLevelNonUniformityNormalized,(12)wavelet.LLH_glszm_SmallAreaLowGrayLevelEmphasis,(13)wavelet.LLH_glszm_ZoneEntropy。

图2. 影像组学预测模型在训练集(实线)和验证集(虚线)中的ROC曲线。

具体实施方式

下面结合具体实施例对本发明做详细的说明。以下实施例将有助于对本发明的了解,但这些实施例仅为了对本发明加以说明,本发明并不限于这些内容。在实施例中的操作方法均为本技术领域常规操作方法。

实施例

一、研究方法及结果。

1.1 病例收集。

按照国际ISBER标准,回顾性收集于2014年1月至2019年10月初诊时即为结直肠癌肝转移的患者。

纳入标准:1)由病理学确认的晚期结直肠癌肝转移患者;2)年龄18~80岁;3)ECOG评分0~2分;4)已完成手术或穿刺活检标本RAS基因突变状态的检测;5)可获得治疗开始前的肺腹增强CT图像,CT图像层厚≤2 mm;6)肺腹增强CT检查与获取手术或穿刺活检标本的时间间隔不超过30天(范围4-30天)。

排除标准:1)并发其他肿瘤的患者;2)由于患者植入金属或运动等原因造成伪影的CT图像;3)CT图像中肝转移病灶的边界过于模糊,无法对边缘进行准确勾画。

资料收集:从医院的病案记录中收集患者的姓名、性别、年龄及RAS基因突变状态的检测结果。所有纳入的患者均已签署知情同意书。本研究中涉及的肿瘤患者标本的收集、检测与患者的随访已经得到治疗所在医院的伦理委员会的批准。

根据纳入排除标准,最终共纳入158例患者(88例突变型患者,70例野生型患者),将所有患者按照7:3的比例随即划分为验证集和训练集。

1.2 CT图像收集。

CT图像收集是影像组学的第一步,首先从CT图像中获取大量的影像图像(DICOM格式),然后对这些图像进行预处理,包括图像重建、降噪、灰阶标准化等,以确保特征数据采集与重建参数的标准化与一致性,包括辐射剂量、扫描方案、重建算法和扫描的层厚。

患者在经初次系统治疗之前已完成肺腹增强CT检查。CT具体采集参数和条件为:根据标准操作步骤,采用GE、Phillips、Siemens和Toshiba等多种64排螺旋CT机,管电压120kVp(范围为100~140kVp),管电流333mA (范围为100~752 mA),CT层厚为2mm,应用标准重建方法;造影剂碘海醇剂量按照1.2–1.5 mL/千克体重计算,静脉输注速度为2.5 mL/秒,后续输注20~30mL生理盐水;所有患者在仰卧位并吸气屏气状态下进行CT图像扫描。在大约60-70s处扫描门静脉期(portal venous phase,PVP)图像。在筛选图像的过程中,通过肉眼逐层检查并判断图像质量。最后,应用DICOM cleaner软件对全部CT图像进行脱敏处理,删除患者姓名、性别、年龄、检查日期、住院登记号、CT检查号、医院名称等隐私信息,不同患者以随机数字标记。所有CT图像均以DICOM格式存储。

1.3 CT图像分割。

CT图像分割过程主要利用3D-Slicer软件(www.slicer.org),采用三维半自动分割方法对门静脉期(PVP)CT图像中的感兴趣区域(regions of interest,ROIs)进行分割。感兴趣区域(ROIs)一般指在图像处理时,从原始CT图像中以方框、圆、椭圆或不规则多边形等方式勾画分割出用于后续分析的区域。在本研究中,我们将感兴趣区域(ROIs)选定为非融合、横截面积最大、边界清晰的肝转移病灶。

首先,将DICOM格式的PVP图像导入3D-Slicer软件,然后使用软组织窗(窗宽:350HU,窗位:40HU)对所选ROIs进行轮廓勾画,使用FAST-MARCHING半自动快速分割算法对每名患者的全部PVP图像进行逐层分割以对ROIs整体进行分析。然后,我们再一次手动地逐层调整并完善勾画区域,沿着病变的可见清晰边界进行勾画,并且擦除邻近的正常组织结构,例如胆管和血管。最终勾画完成的ROIs分割结果由两名经验丰富的高年资放射线科医生检查并进一步完善修改。最后,将ROIs导出为NRRD和MRML格式进行存储和进一步分析。

1.4 CT图像的影像组特征提取、筛选。

使用Pyradiomics方法提取每名患者的ROIs的影像组学特征。从勾画好的ROIs中提取的影像组学特征可以对肿瘤的强度、形状和纹理等特征进行量化评估。这些影像组学特征可分为三类:1)一阶特征、基于形状的特征和纹理特征。一阶特征描述了体素强度在ROIs中的分布情况;2)基于形状的特征描述了ROIs的立体直观特征,包括二维和三维水平的大小和形状。这些特征与ROIs中的灰度强度分布并不相同;3)基于5种纹理矩阵提取的纹理特征:(1)灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM),(2)灰度区域大小矩阵(Gray Level Size Zone Matrix,GLSZM),(3)灰度游程长度矩阵(Gray Level RunLength Matrix,GLRLM),(4)邻域灰度差矩阵(Neighbouring Gray Tone DifferenceMatrix,NGTDM)和(5)灰度相关矩阵(Gray Level Dependence Matrix,GLDM)。此外,我们对原始图像的基础上增加了小波滤波,降噪的同时可以提取详细的高维影像组特征。

在对每名患者的ROIs的影像组特征进行提取后,我们对全部影像组特征进行了筛选降维。首先,我们删除了在所有患者中数值相同,无区分度的影像组特征。其次,为了验证影像组特征的鲁棒性和可重复性,我们随机选取了30例ROIs,计算每一个影像组特征的同类相关系数 (intraclass correlation coefficient,ICC)和一致性相关系数(concordance correlation coefficient,CCC)。为计算同类相关系数(ICC),两名影像科医生对同一名患者的ROIs进行半自动逐层勾画(具体方法同前)。除了结直肠癌肝转移的临床诊断之外,这两名影像科医生对患者RAS基因突变状态并不知情。为计算一致性相关系数(CCC),我们对随机选取的30名患者进行了ROIs勾画分割后,在两周后,由同一名医生再次重复相同的勾画分割步骤。最后,我们将ICC或CCC数值低于0.75的影像组特征排除在后续的分析之外。

1.5 RAS基因突变检测

从福尔马林浸润的用石蜡包被的组织切片样品中,利用DNA样品制备试剂盒获取组织DNA。通过实时聚合酶链式反应(real-time polymerase chain reaction,RT-PCR),测定KRAS外显子2、3、4,NRAS外显子2、3、4的基因突变情况。

1.6 基于影像组特征构建预测模型。

在本研究中,我们基于影像组学特征构建了RAS基因状态预测模型。我们将所有患者按照7:3的比例随机分为训练集和验证集。利用1000次Lasso-Logistic算法分析,其中12种影像组学特征及参数的组合稳定出现了900次以上。这12个特征分别是:(图1)。

构建的影像组学预测模型计算公式:

3.5512-6.1777*wavelet.HHH_glszm_SizeZoneNonUniformityNormalized-1.8147*wavelet.HLL_glszm_LowGrayLevelZoneEmphasis+1.3087*wavelet.HLL_glszm_SmallAreaLowGrayLevelEmphasis-4.0329*wavelet.LHL_firstorder_Skewness-2.1221*wavelet.LHL_glcm_ClusterShade+1.0033*wavelet.LHL_glcm_Correlation-3.0967*wavelet.LHL_glcm_MCC+0.4027*wavelet.LLH_firstorder_Median+0.5078*wavelet.LLH_glcm_Idn-0.2159*wavelet.LLH_glszm_GrayLevelNonUniformityNormalized+6.8791*wavelet.LLH_glszm_SmallAreaLowGrayLevelEmphasis+4.6685*wavelet.LLH_glszm_ZoneEntropy。

将cutoff值设定为50%,即根据上述公式计算得到的分数大于50%预测该名患者为RAS基因突变型,反之则预测患者为RAS基因野生型。

1.7 影像组学模型的预测性能比较。

受试者工作曲线(receiver operating characteristic, ROC)曲线下面积(areaunder the curve, AUC)用于评估基于影像组学特征构建的模型对晚期肠癌肝转移患者RAS基因状态的预测能力。基于这12个影像组学特征构建影像组学RAS基因状态预测模型。该影像组学模型在训练集中的AUC为0.84,在验证集中的AUC为0.79(图2)。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号