首页> 中国专利> 血管周区域的放射组学标签

血管周区域的放射组学标签

摘要

一种用于使用受试者的医学成像数据表征血管周区域的方法。所述方法包括使用所述医学成像数据计算所述血管周区域的放射组学标签的值。还公开了一种用于推导用于预测心血管风险的放射组学标签的方法。所述方法包括获得放射组学数据集并使用所述放射组学数据集来构造血管周放射组学标签。还公开了用于执行前述方法的系统。

著录项

  • 公开/公告号CN113056232A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 牛津大学科技创新有限公司;

    申请/专利号CN201980075076.1

  • 发明设计人 C·安东尼亚德斯;E·奥科诺莫;

    申请日2019-09-18

  • 分类号A61B6/00(20060101);G06T7/00(20170101);G06T7/40(20170101);G16H50/20(20180101);G16H30/40(20180101);

  • 代理机构11713 北京世峰知识产权代理有限公司;

  • 代理人王思琪;王建秀

  • 地址 英国牛津

  • 入库时间 2023-06-19 11:39:06

说明书

技术领域

本发明涉及特别是使用放射组学标签来表征血管周区域的方法以及用于所述方法的系统。本发明还涉及推导这种标签的方法以及用于所述方法的系统。

背景技术

尽管在一级和二级心血管预防两者方面都取得了显著进展,但冠状动脉疾病(CAD)仍然是发病率和死亡率的主要原因。评估呈现典型或非典型症状的患者中是否存在CAD的无创诊断测试(如冠状动脉计算机断层扫描血管造影术(CCTA))是现代心血管诊断的支柱,尤其是在具有CAD的低到中间的预测试可能性的个体中。传统上,此类技术依靠阻塞性病变的检测或冠状动脉钙化的存在和程度来进行心血管风险分层。然而,尽管进行了最佳药物治疗,仍有大量患者的残留心血管风险升高。残留血管炎症尤其是不良事件的驱动因素,导致动脉粥样硬化斑块的形成和不稳定两者,但使用常规测试(如对血管疾病具有非特异性的循环性炎性生物标志物)可能难以诊断。

传统上,对临床成像研究的解释依赖于对经成像的解剖学的主观的操作者相关的定性评估。尽管此方法在繁忙的临床环境中很有用,但其忽略了包含在所有临床扫描中的大量信息。

WO 2016/024128 A1和WO 2018/078395 A1定义了基于特异性CCTA的度量,即,脂肪衰减指数(FAI)或血管周FAI(FAI

在最近的研究中,Kolossvary等人表明放射组学特征可以可靠地标识具有高风险斑块特征的餐巾环征(napkin-ring sign)的斑块,对其进行标识通常依赖于对斑块解剖和操作者经验丰富的眼睛的定性评估(Kolossvary M、Karady J、Szilveszter B等人,放射组学特征优于常规定量计算机断层扫描度量以标识具有餐巾环征的冠状动脉斑块(RadiomicFeatures Are Superior to Conventional Quantitative Computed TomographicMetrics to Identify Coronary Plaques With Napkin-Ring Sign),《循环心血管成像(Circ Cardiovasc Imaging)》2017;10(12):e006843)。然而,此方法集中于斑块本身的表型分析,并且忽略了PVT和可以从中获得的有价值的信息。

所需要的是一种方法或工具,所述方法或工具提供超越当前基于CCTA的风险分层工具的心血管风险的预后价值,如CAD的存在和程度、高风险的斑块特征的存在、冠状动脉钙和最近描述的FAI

发明内容

根据本发明的第一方面,提供了一种用于使用受试者的医学成像数据表征血管周区域(例如,其表型,例如,组成和/或纹理)的方法。所述方法可以包括使用所述医学成像数据计算所述血管周区域的放射组学标签的值。所述放射组学标签可以基于所述血管周区域的至少两个放射组学特征的经测量的值来计算。所述至少两个放射组学特征的所述经测量的值可以根据或通过所述医学成像数据来计算。

所述放射组学标签可以提供所述血管周区域的纹理的量度。

所述至少两个放射组学特征中的至少一个放射组学特征可以提供所述血管周区域的所述纹理的量度。

所述放射组学标签可以预测心血管风险。

所述放射组学标签可以预测所述受试者经历主要不良心血管事件的可能性。

所述放射组学标签可以预测所述受试者经历心脏特异性主要不良心血管事件的可能性。

所述放射组学标签可以指示心血管健康。

所述放射组学标签可以指示血管疾病。例如,所述放射组学特征可以指示血管炎症。

所述至少两个放射组学特征中的至少一个放射组学特征可以根据衰减值的小波变换来计算的。

所述至少两个放射组学特征中的每个放射组学特征可以与体积无关和/或与取向无关。

所述至少两个放射组学特征可以选自聚类1到9的所述放射组学特征,其中所述至少两个放射组学特征各自选自不同的聚类,其中:

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和、联合平均值和高灰度区域优势组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、第90个百分位数LLL、中值LLL、峰度LLL和中值组成;

聚类3由游程熵、依赖性熵LLL、依赖性熵、区域熵LLL、游程熵LLL和均值LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势、小依赖性低灰度优势、灰度方差LLL(GLSZM)、灰度方差(GLDM)、方差、灰度方差(GLDM)、差异方差LLL、灰度方差LLL(GLRLM)、方差LLL、灰度方差LLL(GLDM)、平方和、对比度LLL、平均绝对偏差、四分位距、稳健平均绝对偏差、长游程低灰度优势、差异方差、灰度方差(GLSZM)、归一化逆差矩、平均绝对偏差LLL、平方和LLL和对比度组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)、归一化灰度不均匀度LLL(GLRLM)、和熵、联合能量、熵、归一化灰度不均匀度(GLDM)、联合能量、归一化灰度不均匀度LLL(GLDM)、均匀度LLL、和熵LLL和均匀度组成;

聚类6由区域熵HHH、归一化大小区域不均匀度HHH和小面积优势HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL、粗糙度LLH、粗糙度HHH、粗糙度HLH、粗糙度HHL和粗糙度LHH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL、第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL、大小区域不均匀度、能量HLL、游程长度不均匀度LHH、大小区域不均匀度HLL、灰度不均匀度LLH(GLSZM)、灰度不均匀度LHL(GLSZM)、灰度不均匀度LLL(GLSZM)、游程长度不均匀度HLL、灰度不均匀度HLH(GLSZM)、灰度不均匀度HHL(GLSZM)、游程长度不均匀度和游程长度不均匀度HHH组成。

聚类1到9可以替代地定义如下:

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和以及联合平均值组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、第90个百分位数LLL、中值LLL和峰度LLL组成;

聚类3由游程熵、依赖性熵LLL、依赖性熵和区域熵LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势、小依赖性低灰度优势、灰度方差LLL(GLSZM)、灰度方差(GLDM)、方差、灰度方差(GLDM)和差异方差LLL组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)和归一化灰度不均匀度LLL(GLRLM)组成;

聚类6由区域熵HHH和归一化大小区域不均匀度HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL、粗糙度LLH和粗糙度HHH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL、大小区域不均匀度、能量HLL、游程长度不均匀度LHH、大小区域不均匀度HLL、灰度不均匀度LLH(GLSZM)和灰度不均匀度LHL(GLSZM)组成。

聚类1到9可以替代地定义如下:

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和以及联合平均值组成;

聚类2由偏度、偏度LLL、峰度和第90个百分位数组成;

聚类3由游程熵、依赖性熵LLL和依赖性熵组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势和小依赖性低灰度优势组成;

聚类5由区域熵和归一化灰度不均匀度(GLRLM)组成;

聚类6由区域熵HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL和粗糙度LLH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL和大小区域不均匀度组成。

聚类1到9可以替代地定义如下:

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势和自相关组成;

聚类2由偏度和偏度LLL组成;

聚类3由游程熵和依赖性熵LLL组成;

聚类4由小面积低灰度优势和低灰度区域优势组成;

聚类5由区域熵组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL和游程长度不均匀度LHL组成。

聚类1到9可以替代地定义如下:

聚类1由短游程高灰度优势、高灰度优势和高灰度游程优势组成;

聚类2由偏度和偏度LLL组成;

聚类3由游程熵组成;

聚类4由小面积低灰度优势和低灰度区域优势组成;

聚类5由区域熵组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差以及和熵组成;并且

聚类9由大小区域不均匀度LLL组成。

聚类1到9可以替代地定义如下:

聚类1由短游程高灰度优势、高灰度优势和高灰度游程优势组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、中值LLL、峰度LLL和中值组成;

聚类3由游程熵、游程熵LLL和中值LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势和灰度方差(GLSZM)组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)和均匀度组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、稳健平均绝对偏差LLL、灰度方差LLL(GLSZM)、四分位距LLL、和熵LLL、灰度方差(GLRLM)、方差、灰度方差(GLDM)、平均绝对偏差、和熵、稳健平均绝对偏差、四分位距、熵LLL、第10个百分位数LLL、第10个百分位数、熵、均匀度LLL、归一化灰度不均匀度LLL(GLDM)、归一化灰度不均匀度LLL(GLRLM)、均方根、归一化灰度不均匀度(GLDM)、均方根LLL和长游程低灰度优势组成;并且

聚类9由大小区域不均匀度LLL、繁忙度和大小区域不均匀度组成。

所述至少两个放射组学特征可以选自以下:中值LLL、均值LLL、中值、均方根LLL、均值、峰度、均方根、游程熵LLL(GLRLM)、均匀度、第90个百分位数、归一化灰度不均匀度(GLRLM)、均匀度LLL、偏度、归一化灰度不均匀度LLL(GLRLM)、第10个百分位数LLL、偏度LLL、第10个百分位数、熵、四分位距LLL、稳健平均绝对偏差LLL、游程熵(GLRLM)、四分位距、和熵(GLCM)、归一化灰度不均匀度LLL(GLRLM)、依赖性不均匀度LHL(GLDM)、峰度LLL、游程长度不均匀度HHL(GLRLM)、熵LLL、稳健平均绝对偏差、和熵LLL(GLCM)、第90个百分位数LLL、游程熵HHL(GLRLM)、能量、能量LLL、强度(NGTDM)、自相关(GLCM)、平均绝对偏差LLL、高灰度优势(GLDM)、联合平均值(GLCM)、平均值和(GLCM)、短游程高灰度优势(GLRLM)、能量HHH、高灰度游程优势(GLRLM)、游程熵HHH(GLRLM)、能量HHL和平均绝对偏差。

所述至少两个放射组学特征可以选自聚类1到8的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1到7的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1到6的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1到5的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1到4的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1到3的所述放射组学特征。所述至少两个放射组学特征可以选自聚类1和2的所述放射组学特征。

所述至少两个放射组学特征可以包括至少三个放射组学特征。所述至少两个放射组学特征可以包括至少四个放射组学特征。所述至少两个放射组学特征可以包括至少五个放射组学特征。所述至少两个放射组学特征可以包括至少六个放射组学特征。所述至少两个放射组学特征可以包括至少七个放射组学特征。所述至少两个放射组学特征可以包括至少八个放射组学特征。所述至少两个放射组学特征可以包括至少九个放射组学特征。

所述至少两个放射组学特征可以包括至少六个放射组学特征,其中所述六个放射组学特征是短游程高灰度优势、偏度、游程熵、小面积低灰度优势、区域熵HHH和区域熵。

所述至少两个放射组学特征可以包括至少九个放射组学特征,其中所述九个放射组学特征是短游程高灰度优势、偏度、游程熵、小面积低灰度优势、区域熵HHH、区域熵、强度、聚类倾向性LLL和大小区域不均匀度。

所述放射组学标签可以包括所述至少两个放射组学特征中的每个放射组学特征的值的加权和。所述放射组学标签可以与所述至少两个放射组学特征中的每个放射组学特征的值的加权和线性相关。

所述医学成像数据可以包括针对对应于至少所述血管周区域的多个体素中的每个体素的衰减值。所述多个体素还可以对应于围绕其安置有所述血管周区域的血管。

方法可以进一步包括使用医学成像数据来标识血管周区域(或血管周组织的物质、组织或类型,例如,脂肪组织)。血管周区域可以被标识为医学成像数据的所有体素,其衰减(或放射密度)值落入衰减值的给定范围内和/或定位在距外血管壁(即,血管与血管周组织相邻)的给定径向距离内。例如,如果血管周区域对应于血管周脂肪组织,则衰减值的给定范围可以为约-190到约-30Hounsfield单位。例如,如果血管周区域对应于水,则衰减值的给定范围可以为约-30到约+30Hounsfield单位。给定的径向距离可以是与相邻血管的一个或多个尺寸有关的距离。给定的径向距离可以等于相邻血管直径。给定的径向距离可以是固定值,例如,5mm。

血管周区域可以邻近或包围人体中的冠状动脉、颈动脉、主动脉或任何其它动脉。例如,血管周区域可以邻近或包围近侧右冠状动脉和/或中部右冠状动脉。

方法可以进一步包括分割血管周区域。方法可以进一步包括从经分割的血管周区域计算放射组学特征的值。

可以根据原始衰减值、分仓的衰减值或衰减值的小波变换来计算至少两个放射组学特征中的每个放射组学特征的值。

方法可以进一步包括基于放射组学标签的经计算的值来预测受试者经历主要不良心脏事件的风险。方法可以进一步包括基于放射组学标签的经计算的值来预测受试者经历心脏特异性主要不良心脏事件的风险。

方法可以进一步包括基于放射组学标签的经计算的值确定受试者是否患有血管疾病。血管疾病可以选自由动脉粥样硬化、血管钙化、内膜增生、血管动脉瘤和血管炎症组成的组。

方法可以进一步包括基于放射组学标签的经计算的值确定受试者是否患有冠心病。

放射组学标签的经计算的值可以用于将不稳定的冠状动脉病变和稳定的冠状动脉病变进行区分。血管周区域可以是病变周围区域。

根据本发明的第二方面,提供了用于推导用于预测心血管风险的放射组学标签的方法。所述方法可以包括使用数据集,例如放射组学数据集,以构造血管周放射组学标签或评分以用于预测心血管风险。放射组学标签可以基于血管周区域的至少两个放射组学特征来计算。数据集可以包括血管周区域的多个放射组学特征的经测量的值,所述多个放射组学特征的所述经测量的值是针对多个个体中的每个个体从医学成像数据获得的。所述多个个体可以包括已经达到指示心血管风险的临床终点的第一组个体以及尚未达到指示心血管风险的临床终点的第二组个体。

在收集医学成像数据之后的随后时间段内,第一组个体可以已经达到指示心血管风险的临床终点,并且在收集医学成像数据之后的随后时间段内,第二组个体可以尚未达到指示心血管风险的临床终点。

至少两个放射组学特征中的每个放射组学特征可以被选择为与对应的与临床终点显著(即,统计上显著)相关联的配偶体放射组学特征共线(或相关),例如,如根据数据集确定或计算的。至少两个放射组学特征中的配偶体放射组学特征可以彼此不同。

至少两个放射组学特征中的每个放射组学特征可以被选择为不同的重要放射组学特征或与所述不同的重要放射组学特征共线,所述不同的重要放射组学特征与临床终点显著相关联(如从数据集中确定的,即,从数据集中标识为与临床终点显著相关联)。因此,方法可以包括从各自与临床终点显著相关联的多个放射组学特征中标识重要放射组学特征,所述至少两个放射组学特征各自被选择为不同的重要放射组学特征或与所述不同的重要放射组学特征共线。

重要放射组学特征可以被选择为彼此不共线。例如,方法可以进一步包括标识彼此不共线的多个放射组学特征的子集(例如,重要放射组学特征的子集),至少两个放射组学特征各自被选择为属于子集的不同放射组学特征或与所述不同放射组学特征共线。

可以选择配偶体放射组学特征中的每个配偶体放射组学特征以与其它配偶体放射组学特征中的任何配偶体放射组学特征不共线。

至少两个放射组学特征中的至少一个放射组学特征可以是其自身的配偶体放射组学特征。

至少两个放射组学特征中的每个放射组学特征可以被选择为与临床终点显著相关,例如,如根据数据集确定或计算的。

方法可以包括标识放射组学特征的多个聚类。每个聚类可以包括多个放射组学特征的子集。每个聚类可以包含原始放射组学特征,所述聚类中的其它放射组学特征中的每个其它放射组学特征被选择为共线,例如,如根据数据集确定或计算的。至少两个放射组学特征可以各自选自不同的聚类。

原始放射组学特征中的每个原始放射组学特征可以被选择为与其它聚类中的任何其它聚类的原始放射组学特征的任何原始放射组学特征不共线,例如,如根据数据集确定或计算的。

每个聚类中的放射组学特征中的每个放射组学特征可以被选择为与同一聚类中的所有其它放射组学特征共线,例如,如根据数据集确定或计算的。

原始放射组学特征中的每个原始放射组学特征可以被选择与临床终点显著相关联,例如,如根据数据集确定或计算的。

原始放射组学特征中的每个原始放射组学特征可以被选择为与其聚类中所有放射组学特征的临床终点最密切相关联,例如,如根据数据集确定或计算的。

至少两个放射组学特征可以被选择为彼此不共线,例如,如根据数据集确定或计算的。

如果两个放射组学特征的相关程度大于相关性阈值,则可以将其标识为共线的。

可以使用斯皮尔曼rho系数来计算放射组学特征之间的共线性。可替代地,可以使用成对相关性的其它量度,如皮尔森相关系数(皮尔森r)来计算放射组学特征之间的共线性。

相关性阈值可以为至少约|0.75|,例如,约|rho|=0.75。

如果放射组学特征与高于显著性阈值的临床终点相关联,则可以将其确定为与临床终点显著相关联,例如,如根据数据集确定或计算的。显著性阈值可以为至少约α=0.05,例如,约α=0.05。

如本领域技术人员将容易地理解的,放射组学特征与临床终点的关联可以基于接受者工作特征(ROC)曲线分析来计算,特别是使用曲线下面积(AUC)测量(即,C统计)来计算。

可以将Bonferroni校正应用于显著性阈值。

多个放射组学特征的主成分分析可以例如使用数据集(具体地,根据多个个体的放射组学特征的值)来执行。Bonferroni校正可以基于考虑到给定数量的观察到的变化的主成分的数量,如根据主成分分析确定的。观察到的变化的给定数量可以是至少约99.5%,例如,约99.5%。

放射组学标签可以被构造为与临床终点相关。放射组学标签可以被构造为与临床终点显著相关。

如果放射组学标签与高于显著性阈值的临床终点相关,则可以将所述放射组学特征标识为与临床终点显著相关,例如,如根据数据集确定或计算的。显著性阈值可以为至少约0.05,例如,约α=0.05。

可以将数据集分为用于个体的训练队列的数据和用于个体的验证队列的数据。构造放射组学标签的步骤可以包括使用用于至少训练队列的数据推导标签。构造放射组学标签的步骤可以包括使用用于验证队列的数据来验证标签。

仅当在两个队列中,放射组学特征与临床终点显著相关联时,才可以将所述放射组学特征标识为与临床终点显著相关联。如果在训练队列中,放射组学标签与临床终点显著相关联,则可以将所述放射组学特征标识为与临床终点显著相关联。

至少两个放射组学特征中的每个放射组学特征可以与体积无关。至少两个放射组学特征中的每个放射组学特征可以与取向无关。多个放射组学特征可以各自与体积和/或取向无关。

在选择至少两个放射组学特征之前,可以从多个放射组学特征中去除任何与体积和/或取向相关的放射组学特征。

至少两个放射组学特征可以被选择为稳定的,例如,如根据数据集确定或计算的。例如,至少两个放射组学特征可以选自例如如根据数据集确定或计算的被标识为稳定的特征。

可以从多个放射组学特征中去除所有不稳定的特征。例如,在选择至少两个放射组学特征之前,可以从多个放射组学特征中去除所有不稳定的特征。

如果针对放射组学特征的组内相关系数(ICC)(针对重复测量值或扫描计算)小于稳定性阈值,则可以将所述放射组学特征标识为不稳定。稳定性阈值可以是至少约0.9,例如,0.9。组内相关系数可以基于放射组学特征的Z-评分(或标准评分,即,用与均值的标准偏差的数量表示)来计算。

构造放射组学标签的步骤可以包括完善至少两个放射组学特征对放射组学标签的贡献,以增加放射组学标签与临床终点的关联或相关性。放射组学标签可以被构造为与临床终点显著相关。

如本领域技术人员将容易地理解的,放射组学标签与临床终点的关联可以基于接受者工作特征(ROC)曲线分析来计算,特别是使用曲线下面积(AUC)测量(即,C统计)来计算。

构造放射组学标签的步骤可以使用机器学习算法来执行。

构造放射组学标签的步骤可以使用留p法内部交叉验证来执行。

构造放射组学标签的步骤可以使用留一法内部交叉验证来执行。

构造放射组学标签的步骤可以使用弹性网络回归来执行。

放射组学标签可以包括至少两个放射组学特征的加权和。

放射组学标签可以与至少两个放射组学特征的加权和线性相关。

构造放射组学标签的步骤可以包括调整至少两个放射组学特征中的每个放射组学特征的相对权重,以增加放射组学标签与临床终点的关联或相关性。

放射组学标签可以被构造为提供血管周区域的纹理的量度。

所述至少两个放射组学特征中的至少一个放射组学特征可以提供所述血管周区域的所述纹理的量度。例如,至少两个放射组学特征中的每个放射组学特征可以提供血管周区域的纹理的量度(即,至少两个放射组学特征中的每个放射组学特征可以是纹理统计数据)。

临床终点可以是主要不良心脏事件的复合终点。临床终点可以是心脏特异性主要不良心脏事件的复合终点。

本发明的方法还可以包括从医学成像数据计算放射组学特征的步骤。

除了上文提及的至少两个放射组学特征之外,还可以基于另外的放射组学特征来计算本发明的放射组学标签。因此,可以说放射组学标签是基于多个放射组学特征来计算的,并且多个放射组学特征可以包括至少两个放射组学特征。例如,用于推导用于预测心血管风险的放射组学标签的方法可以包括使用数据集,特别是放射组学数据集,来构造用于预测心血管风险的血管周放射组学标签或评分。放射组学标签可以基于(第二)多个血管周放射组学特征(即,血管周区域的放射组学特征)来计算。数据集可以包括血管周区域的(第一)多个血管周放射组学特征的经测量的值,所述(第一)多个血管周放射组学特征的所述经测量的值是针对多个个体中的每个个体从医学成像数据获得的。所述多个个体可以包括已经达到指示心血管风险的临床终点的第一组个体以及尚未达到指示心血管风险的临床终点的第二组个体。第二多个血管周放射组学特征可以选自第一多个血管周放射组学特征,特别是提供用于预测心血管风险的放射组学标签,如根据或使用数据集确定的,例如,使用机器学习算法。因此,除了至少两个放射组学特征之外,还可以基于另外的放射组学特征(例如,选自(第一)多个放射组学特征)来计算放射组学标签。

方法可以进一步包括配置用于计算患者的放射组学标签的值的系统。例如,方法可以进一步包括配置系统以用于通过计算患者或受试者的所推导的放射组学标签的值来表征患者或受试者的血管周区域。系统可以被配置成使用或基于患者或受试者的至少血管周区域的医学成像数据来计算所推导的放射组学标签的值。系统可以被配置成使用或至少基于患者或受试者的血管周区域的至少两个(或第二多个)放射组学特征的值来计算所推导的放射组学标签的值。

因此,方法可以用于推导血管周放射组学标签并且配置用于使用所推导的放射组学标签来表征患者的血管周区域的系统。

系统可以被配置成接收医学成像数据或至少两个(或第二多个)放射组学特征的值作为输入。系统可以被配置成输出(例如,显示)放射组学标签的经计算的值或基于放射组学标签的经计算的值输出值。系统可以被配置成输出患者的心血管风险和/或血管健康的指示。系统可以被配置成输出患者经历不良心血管事件的风险的指示。系统可以是计算机系统。

方法可以包括提供用于配置系统的指令,所述系统用于计算患者或受试者的所推导的放射组学标签的值。

方法可以进一步包括计算患者或受试者的血管周区域的所推导的放射组学标签的值。例如,方法可以进一步包括通过计算所推导的放射组学标签的值来表征患者或受试者的血管周区域。可以基于或使用患者或受试者的至少血管周区域的医学成像数据来计算所推导的放射组学标签的值。可以使用或至少基于患者或受试者的血管周区域的至少两个(或第二多个)放射组学特征的值来计算所推导的放射组学标签的值。

因此,方法可以用于推导血管周放射组学标签并使用所推导的放射组学标签来表征血管周区域。

根据本发明的第三方面,提供了一种被配置成执行如上文所描述的方法中的任何方法的系统。系统可以是计算机系统。系统可以包括被配置成执行方法的步骤的处理器。系统可以包括装载有用于执行方法的步骤的可执行指令的存储器。

根据本发明的第四方面,提供了血管周放射组学标签用于上述目的中的任何上述目的的用途,例如,用于表征血管周区域,检测血管疾病或预测心血管风险。血管周放射组学标签可以基于血管周区域的多个血管周放射组学特征的经测量的值来计算。

医学成像数据可以是放射影像数据。医学成像数据可以是计算机断层扫描数据。

血管周区域可以是或可以包括血管周组织,例如,血管周脂肪组织。血管周区域还可以在血管周区域内包括水和/或其它软组织结构。

附图说明

现在将参考附图描述本发明,其中:

图1展示了研究方法和设计。图1A展示了血管周区域表型分析、体积分割、离散化、小波变换和放射组学特征计算的方法。图1B和1C分别展示了研究的第1组和第2组的总结。AMI:急性心肌梗塞;CAD:冠状动脉疾病;CCTA:冠状动脉计算机断层扫描血管造影术;MACE:主要不良心血管事件;PVR:血管周区域;H/L:高/低小波变换;VOI:所关注的体积。

图2总结了高风险血管周区域放射组学标签的构建。图2A总结了用于将标签构建为流程图的多步骤方法。首先,在总共843个经计算的放射组学特征中,在稳定性分析(ICC<0.9)之后排除了124个。接下来,选择两个队列中处于a=0.05水平的与MACE显著相关联的六十个放射组学特征。在这些之中,排除了七个与体积和取向相关的特征(例如,能量和非HHH/LLL变换),并且随后通过逐步消除处于|rho|≥0.75水平的成对相关性,降低了共线性。使用剩余的九个放射组学特征,在队列1中应用了使用弹性网络回归和留一法内部交叉验证的机器学习方法。图2B示出了用于进行MACE的预测的最佳性能模型的相对变量重要性(加权)。图2C示出了用于进行心脏特异性MACE(cMACE)的预测的最佳性能模型的相对变量重要性(加权)。然后使用图2C的模型的前六个成分来定义血管周纹理指数(PTI),所述血管周纹理指数是根据本发明的放射组学标签。AUC:曲线下面积;CI:置信区间;MACE:主要不良心血管事件;SALGLE:小面积低灰度优势;SRHGLE:短游程高灰度优势;SZNU:大小区域不均匀度。

图3示出了本发明的PTI标签提供了当前基于CCTA的工具之外的增量预后信息。在对两个第1组队列的汇总分析中,将血管周纹理指数(PTI)添加到由年龄、性别、传统风险因素和计算机断层扫描推导的高风险特征(包含冠状动脉周围FAI

图4示出了原始放射组学特征的相关性绘图。示出的107个冠状血管周区域放射组学特征的相关性绘图是根据原始CCTA图像计算的。绘图描绘了各个放射组学特征之间关联的方向和强度(通过斯皮尔曼rho系数计算),并揭示了不同特征聚类的存在。

图5展示了冠状血管周区域放射组学特征的主成分分析的各个方面。图5A示出了第1组中三个主要主成分的成分绘图。图5B显示了碎石绘图,描绘了由92个第一成分解释的变化百分比,占变化的99.5%。图5C示出了用于预测特征值>1的42个成分的5年MACE的曼哈顿绘图(Manhattan plot)。图5D显示了呈现用于预测针对单变量分析中重要七个主成分的5年MACE的经调整的优势比(针对如年龄、性别等协变量进行统计调整)的森林绘图。图5E示出了选定成分与人口统计的相关性绘图。图5F展示了血管周区域放射组学成分对于5年MACE的预测的增量预后价值。AUC:曲线下面积;BMI:身体质量指数;CCS:冠状动脉钙评分;DM:糖尿病;EAT:心外膜脂肪组织;HCH:高胆固醇血症;HDL:高密度脂蛋白;LDL:低密度脂蛋白;PC:主成分;PVR:血管周区域;SBP:收缩压;TG:甘油三酯。

图6示出了用于预测5年MACE的曼哈顿绘图。对于在原始图像或小波变换图像上计算的所有放射组学特征,从接受者工作特征(ROC)曲线分析推导P值,以用于区分5年MACE。MACE:主要不良心血管事件;H/L:小波变换中的高通/低通信号。

图7示出了所有血管周区域放射组学特征的组内相关系数(ICC)的绘图。在重复分析中,根据组内相关系数(ICC)对放射组学特征进行排名。发现总共719个放射组学特征的ICC≥0.9。

图8示出了使用根据本发明的放射组学标签的血管周区域纹理表型分析可以用于检测不稳定的冠状动脉病变。图8A-G示出了包含在PTI中的六个放射组学特征以及PTI本身的框线绘图。在第2组中,在存在不稳定的冠状动脉病变对稳定的冠状动脉病变的情况下,PTI的六个组成成分放射组学特征中有五个显著改变,而在区分不稳定形式的稳定的冠状动脉病变时,PTI的性能优于所有六个单独的放射组学特征(AUC:0.76;95%CI:0.64-0.88)。这些发现表明,与斑块破裂相关联的血管炎症与血管周区域纹理变化之间的紧密联系(现在可以通过本发明的放射组学标签来检测,例如,PTI)作为监测冠状动脉病变的风险概况的无创方式。AU:任意单位;SALGLE:小面积低灰度优势;SRHGLE:短游程高灰度优势;SZNU:大小区域不均匀度。

具体实施方式

发明人已经发现,基于PVR的两个或更多个放射组学特征计算的血管周区域(PVR)放射组学标签(以其它方式被称为“评分”或“指数”)增加了在预测未来不良心血管事件并评估心血管健康和风险方面超出传统风险因素和已建立的CCTA风险分类工具的增量价值,并进一步辅助检测一般的血管炎症、局部斑块炎症以及不稳定的冠状动脉病变的存在。因此,本发明的PVR放射组学标签优选地基于PVR的两个或更多个放射组学特征来计算,并提供用于表征PVR的工具(例如,血管周组织,如血管周脂肪组织(PVAT))以用于评估心血管或血管健康,预测患者未来发生不良心血管事件的风险,标识或诊断冠状动脉疾病或冠心病,以及标识不稳定的冠状动脉病变或血管炎症(例如,由局部斑块引起的)。

本发明的PVR放射组学标签可以单独用于表征PVR或提供诊断或预后信息,或者可以与现有模型组合,如FAI

本发明利用以下事实:冠状壁和相邻PVR,特别是PVR内的组织,如脂肪组织,以双向方式进行相互作用。因此,即使在不存在可见冠状动脉病变的情况下,冠状PVR中的血管诱导性表型变化也可以充当潜在疾病的传感器。具体地,本发明利用了此相互作用对PVR的纹理的影响(例如,空间不均匀度或可变性),并且因此可以构造本发明的放射组学标签以提供PVR的纹理的量度。因此,本发明的放射组学标签也可以被称为血管周纹理指数(PTI)。然而,用于构造本发明的标签的基于放射组学的方法并不特定于构造测量纹理的放射组学标签,并且最重要的是所得标签的预后价值。因此,对于放射组学标签来说,并非必须要测量纹理以成为有效的预后或诊断工具。

PVR是指与血管相邻的区域或体积。PVR可以是血管周组织(PVT)的区域或体积或者可以包括PVT或由其组成。血管周组织是定位在血管附近的组织。组织是复杂的生物结构,并且可以包括细胞(例如,脂肪细胞、神经元等)以及可以占据细胞间隙的细胞外结构和材料(如水)。具体地,PVT可以包括血管周脂肪组织(PVAT)或由其组成,并且因此PVR可以可替代地被称为PVAT的区域或体积。

本发明采用放射组学方法。放射组学是其中使用数据特征化算法从成像数据中提取大量定量信息的成像领域。所得特征(被称为放射组学特征)的范围从简单的体积、形状相关或一阶统计数据(如均值或中值衰减)到描述经分割的体积或区域的纹理以及具有类似或不同衰减值的体素的空间关系的二阶和高阶统计数据。此类特征可以标识肉眼无法识别的具有显著临床价值的成像模式,并且具有使无创PVR表型分析的诊断产量最大化的潜力。

基于放射组学特征,例如从医学成像数据中提取的放射组学特征,推导并计算本发明的标签。具体地,从中提取放射组学特征的医学成像数据对应于血管周区域(PVR),例如,冠状PVR,如冠状血管周脂肪组织(PVAT),并且任选地还对应于血管本身和/或与PVR相邻或包围其的其它组织。医学成像数据通常包括针对相关区域的多个体素(在这种情况下为PVR以及任选地还为相邻组织)的放射密度(或衰减)值,通常以Hounsfield单位(HU)表示。

医学成像数据优选地是计算机断层扫描(CT)数据,如冠状动脉计算机断层扫描血管造影术(CCTA),但是可以替代地使用提供针对成像区域的体素的衰减(或放射密度)数据的其它形式的医学成像数据(例如,放射影像数据),如三维计算的x射线分层摄影法数据。通常,本发明中使用的医学成像数据是三维成像数据。贯穿下文,在提及CCTA或另一种医学成像技术的地方,应当理解的是,可以可替代地使用其它合适的医学成像技术。

PVR可以包含仅放射密度(或衰减)落入给定或预定范围内和/或定位在界定的区域内,例如,位于距外血管壁的给定或预定径向距离内的体素。给定的径向距离优选地是与相邻血管的一个或多个尺寸(如其直径或半径)有关或取决于其的距离。然而,径向距离可以替代地是设定值或固定值,如约5mm。可替代地,PVR可以由人类操作者通过手动轮廓或界定来标识,任选地还可以与施加放射密度或衰减掩模组合,使得仅包含放射密度处于指定范围内并且落入所界定的区域内的体素。例如,操作者可以通过检查数据(例如,CT图像)来标识PVR。PVR可以包含仅放射密度处于约-190HU到约+30HU Hounsfield单位范围内的体素。例如,PVR可以包含仅放射密度处于约-190HU到约-30HU Hounsfield单位范围内的体素。衰减值的此范围通常对应于血管周脂肪组织(PVAT)的放射密度。然而,可以使用其它范围,例如,约-30到约+30Hounsfield单位,这通常对应于水的放射密度。具体地,可以将PVR标识为放射密度处于约-190HU到约-30HU Hounsfield单位范围中并且定位在距相邻的外血管壁的大约等于相邻血管直径的径向距离内的所有体素。

可以针对特定的血管,例如,冠状血管,如冠状动脉,计算放射组学特征以及因此的放射组学标签。由于其直航向并且不存在大分支,因此近侧右冠状动脉(RCA)和中部右冠状动脉(根据美国心脏协会(American Heart Association)的解剖学分类的区段1和区段2,例如如Austen WG、Edwards JE、Frye RL等人在评估患者的冠状动脉疾病的报告系统(Areporting system on patients evaluated for coronary artery disease)中所定义的,美国心脏协会心血管外科委员会冠状动脉疾病分级特设委员会(the Ad HocCommittee for Grading of Coronary Artery Disease,Council on CardiovascularSurgery,American Heart Association)的报告,发行1975;51(4增刊):5-40)是特别合适的。因此,PVR可以定位在特定血管附近。

可以在计算放射组学特征之前分割PVR,并且可以从经分割的数据计算放射组学特征。经分割的体积或区域对应于PVR,并且分割可以去除与PVR外部的体素相对应的数据。因此,可以通过以下来实现分割:如上文所描述标识PVR,并且然后从被标识为不属于PVR的一部分的数据中去除任何体素,例如,与周围或相邻组织体素相对应的那些体素。可以通过放置三维球体来进行分割,所述三维球体的直径等于血管直径加上距外血管壁给定距离的两倍,在所述给定距离内,可以在沿着血管中心线的连续切片上标识PVR。例如,如果将PVR标识为定位在距外血管壁的等于相邻血管直径的径向距离内,则球体的直径将等于相邻血管直径的三倍。经分割的PVR可以被提取并用于计算放射组学特征。

可以使用计算机程序或软件来执行根据医学成像数据的放射组学特征的计算。存在用于此目的的各种可商购获得的软件包,如3D Slicer。放射组学特征可以是形状相关的统计数据、一阶统计数据或纹理统计数据(例如,二阶和高阶统计数据)。可以使用PVR体素的原始放射密度(HU)值来计算形状相关的放射组学特征和一阶放射组学特征。为了计算纹理特征(例如,灰度共生矩阵[GLCM]、灰度依赖性矩阵[GLDM]、灰度游程长度矩阵[GLRLM]、灰度大小区域矩阵[GLSZM]和相邻灰度色调差异矩阵[NGTDM],参见图1A和表R1-R7),优选地将PVR体素放射密度或衰减值离散化为多个仓,优选地离散化为16个仓,优选地宽度相等(例如,宽度为十HU),以减少噪声,同时允许足够的分辨率以检测PVR衰减中的生物学上显著的空间变化。建议将离散化为16个仓作为增加用于放射组学分析的图像的信噪比的最佳方法。然而,离散化为多于或少于16个仓也是可能的。为了实施对称的旋转不变的结果,可以在所有(正交)方向上计算放射组学特征中的一些或所有放射组学特征,尤其是纹理统计数据(GLCM等),并且然后取平均值(例如,使用四个方向中每个方向上的特征的经单独计算的值的均值或其它平均值)。

还可以为原始图像数据的三维小波变换计算放射组学特征中的一些或所有放射组学特征,特别是与一阶统计数据和基于纹理的统计数据有关的放射组学特征,从而产生多个另外的放射组学特征集(图1A),例如,如描述于Guo等人,(Guo X、Liu X、Wang H等人,通过小波变换增强CT图像提高胸部结节的诊断准确性(Enhanced CT images by thewavelet transform improving diagnostic accuracy of chest nodules),《数字成像杂志(J Digit Imaging)》2011;24(1):44-9)中。小波变换将数据分解为高频和低频分量。在高频下(较短的时间间隔),所得子波可以捕获原始数据中的不连续性、破裂和奇点。在低频(较长的时间间隔)下,小波表征数据的粗糙结构,以标识长期趋势。因此,小波分析允许提取原始数据的隐藏和重要时间特征,同时提高成像研究的信噪比。可以通过使数据通过多电平(例如,三电平)滤波器组,通过离散小波变换将数据分解为多个(例如,八个)小波分解。在每一个电平处,分别通过高通滤波器和低通滤波器将数据分解为高频分量和低频分量。因此,如果使用三电平滤波器组,则会产生对应于HHH、HHL、HLH、HLL、LHH、LHL、LLH和LLL的八个小波分解,其中H表示“高通”,并且L表示“低通”。当然,可以可替代地使用多于或少于八电平来分解数据。可以使用广泛可用的软件(如并入了Pyradiomics文库的切片机放射组学软件包(Slicer Radiomics software package))执行此类分解。在基于数据的小波分解或变换来计算放射组学特征的情况下,这由已基于小波分解计算放射组学特征的后缀表示(例如,HHH表示高通、高通、高通)。因此,例如,“偏度LLL”表示如基于LLL小波分解计算的放射组学特征“偏度”。在不存在后缀的情况下,则基于原始(original)(或原始(raw))数据计算放射组学特征。

本发明提供了一种用于推导用于表征PVR(例如,血管周脂肪组织的区域)的放射组学标签以例如用于预测心血管风险的方法。放射组学标签通过使用以下数据来推导:针对多个个体的医学成像数据以及包含在收集医学成像数据之后的随后时间段内针对多个个体中的每个个体的临床终点事件的发生的数据。具体地,临床终点优选地指示心血管健康或风险。

方法通常涉及在例如通过临床指示的评估通过CCTA或其它医学成像技术收集成像数据之后的预定或随后时间段内,优选地在五年内,对(人类)患者进行有对没有不良(临床终点)事件的病例对照者研究。达到临床终点的个体为病例(第一组),并且未达到临床终点的个体为对照者(第二组)。

可以将多个个体(在本文中也被称为患者)分为患者正在进行(或所述患者已经经历)医学成像的两个独立队列,具体地是训练队列和验证队列。基于临床终点事件在收集医学成像数据之后的指定或预定时间段(即,随后时间段)内发生来标识病例。随后时间段优选地是至少约五年,优选地约五年,但是可以是更长时间或更短时间。临床终点优选地是主要不良心血管事件(MACE)的主要复合终点,所述主要复合终点可以被定义为在收集医学成像数据之后的指定时间段(优选地五年)内的全因死亡率和非致命性心肌梗塞(MI)的复合,或者在收集医学成像数据之后的指定时间段(优选地五年)内的心脏特异性MACE(cMACE,即,心脏死亡率和非致死性MI)的主要复合终点。

如本文所使用的,心脏死亡率和非心脏死亡率可以根据ACC/AHA的建议(HicksKA、Tcheng JE、Bozkurt B等人,2014年ACC/AHA针对临床试验中的心血管终点事件的关键数据元素和定义:美国心脏病学会/美国心脏协会临床数据标准工作组的报告(2014ACC/AHA Key Data Elements and Definitions for Cardiovascular Endpoint Events inClinical Trials:AReport of the American College of Cardiology/American HeartAssociation Task Force on Clinical Data Standards)(开发心血管终点数据标准的撰写委员会),《美国心脏病学会杂志(J Am Coll Cardiol)》2015;66(4):403-69)进行定义。更具体地,心脏死亡率可以被定义为由于邻近的心脏原因(例如,心肌梗塞、低输出心力衰竭、致命性心律失常)而导致的任何死亡。满足心脏性猝死标准的死亡也可以包含在此组中。先前定义未涵盖的任何死亡,如由恶性肿瘤、意外事故、感染、败血症、肾衰竭、自杀或其它非心脏血管原因(如中风或肺栓塞)导致的死亡都可以被分类为非心脏的。

对照者优选地被标识为在同一指定时间段内,例如在CCTA后至少五年内进行无事件随访的患者。例如使用自动算法来优选地进行1:1病例-对照者匹配,以将病例与对照者进行匹配。病例和对照者可以匹配临床人口统计特征(如年龄、性别、肥胖状况)、队列和/或与成像数据采集有关的技术参数(例如,所使用的管电压和CT扫描仪)。优选地,还使患者与其它心血管风险因素匹配,包含高血压、血脂异常、糖尿病和吸烟。

高血压可以基于文件记录的抗高血压方案诊断或治疗的存在根据相关的临床指南(James PA、Oparil S、Carter BL等人,2014年成人高血压管理的基于证据的指南:第八届全国联合委员会(JNC 8)任命的小组成员的报告(2014evidence-based guideline forthe management of high blood pressure in adults:report from the panel membersappointed to the Eighth Joint National Committee(JNC 8)),《美国医学会杂志(JAMA)》2014;311(5):507-20)进行定义。类似的标准可以应用于高胆固醇血症和糖尿病的定义(美国糖尿病A.糖尿病的诊断和分类(American Diabetes A.Diagnosis andclassification of diabetes mellitus),《糖尿病监护(Diabetes Care)》2014;37增刊1:S81-90;Stone NJ、Robinson JG、Lichtenstein AH等人,2013年ACC/AHA关于降低成年人的动脉粥样硬化性心血管疾病风险的胆固醇治疗指南:美国心脏病学会/美国心脏协会实践指南工作组的报告(2013ACC/AHA guideline on the treatment of blood cholesterolto reduce atherosclerotic cardiovascular risk in adults:a report of theAmerican College of Cardiology/American Heart Association Task Force onPractice Guidelines),《美国心脏病学会杂志(J Am Coll Cardiol)》2014;63(25Pt B):2889-934)。

“聚类”(或共线消除)方法

然后可以按照逐步方法来开发放射组学标签,如图2示意性地展示的。首先,例如,如上文所描述的,针对多个个体中的每个个体从医学成像数据计算多个放射组学特征。放射组学特征可以包括如表R1-R7中定义的放射组学特征中的选择或全部放射组学特征,并且可以基于原始图像数据和/或图像数据的一个或多个小波变换(或小波分解)来计算放射组学特征中的每个放射组学特征,如上文所描述的。优选地,针对原始图像数据和针对图像数据的上述八个三维小波分解计算放射组学特征中的每个放射组学特征。

可以从多个放射组学特征中去除不稳定的特征。可以对特征应用z-评分变换(即,根据相对于均值的标准偏差的数量来表示放射组学特征的值),并且可以基于z-评分执行稳定性分析。不稳定的放射组学特征被标识为在重复成像数据采集(例如,成像扫描)中具有低于稳定性阈值的组内相关系数(ICC)的不稳定的放射组学特征。例如,稳定性阈值可以为至少约0.9,例如,约0.9,使得排除了ICC<0.9的所有放射组学特征(图3)。然而,可以替代地使用其它稳定性阈值,如0.85或0.95。可以针对多个重复扫描来计算ICC,例如,两次到十次扫描,具体地两次或十次扫描。换句话说,可以对从多个放射组学特征去除的PVR放射组学特征和不稳定的放射组学特征执行稳定性分析。稳定性分析可以基于针对多个个体的成像数据来执行,或者可以使用其它数据来执行,例如,参考数据,如RIDER数据集(评估治疗反应的参考图像数据库)。

优选地,如果多个放射组学特征包含与任何体积和取向相关的放射组学特征,则将其排除(即将其从多个放射组学特征中去除)。可替代地,任何与体积和取向相关的特征都可以从一开始就排除在外,因此不需要这一步骤。换句话说,初始的多个放射组学特征可以各自与体积和取向无关的。体积相关的特征可以包含能量和总能量(计算的原始和小波),并且取向相关的特征可以包含从小波变换HLL、HLH、LLH、HLL、LHL、LHH(即,除LLL或HHH之外的所有特征,或那些不仅限于高通或低通的小波变换)推导的特征。

然后可以从多个放射组学特征中去除不与临床终点显著相关联(例如,相关)的放射组学特征,例如,高于显著性阈值的5年MACE或cMACE。每个放射组学特征与临床终点的关联可以基于接受者工作特征(ROC)曲线分析来计算,具体地基于多个个体的数据计算曲线下面积。显著性阈值优选地为α=0.05或更小,例如,α的范围可以为0.001到0.05。显著性阈值优选地为约α=0.05。然而,显著性阈值可以为约α=0.04。可替代地,显著性阈值可以为约α=0.03。可替代地,显著性阈值可以为约α=0.02。可替代地,显著性阈值可以为约α=0.01。可替代地,显著性阈值可以为约α=0.005。可替代地,显著性阈值可以为约α=0.002。优选地,必须将放射组学特征标识为在训练队列和验证队列两者中与临床终点显著相关,以便将其保留,并去除被发现在一个或两个队列中不与临床终点显著相关的任何放射组学特征,以减少由于队列特异性变化而产生的阳性发现。然而,可以替代地仅保留被发现在队列之一(例如,训练队列)中与临床终点显著相关的放射组学特征。可替代地,可以基于针对两个队列,即,针对多个个体中的所有个体的汇总数据来执行对每个放射组学特征是否与临床终点显著相关的评估。换句话说,方法可以涉及评估放射组学特征与临床终点的显著性,并从多个特征中去除被发现不与临床终点显著相关联的特征。最终结果应该是从多个放射组学特征中去除不与临床终点显著相关联的任何放射组学特征(如根据数据确定或计算的,例如基于数据分析)。

然后可以通过去除成对相关性,即,通过去除每对共线的放射组学特征中的至少一个来减小或消除保留的放射组学特征(即,与临床终点显著相关联的放射组学特征,也被称为重要放射组学特征)的共线性。通常使用多个个体的放射组学特征的经测量的值来计算放射组学特征之间的相关性。成对相关性的去除可以以逐步的方式进行。可以将共线放射组学特征标识为彼此相关程度至少等于给定相关性阈值的放射组学特征。相关性阈值优选地应用于正相关性和负相关性两者,例如,相关性阈值可以表示为模量。可以使用斯皮尔曼rho系数计算成对相关性,并且相关性阈值可以为至少约|rho|=0.75,例如,约|rho|=0.75,使得消除处于|rho|≥0.75水平的所有成对相关性。如在本领域中将容易理解的,相关性或共线性是两个放射组学特征从一个个体到下一个个体一起变化的紧密程度的量度,并且可以基于针对多个个体的经测量的放射组学特征值来计算。

例如,当一对共线的放射组学特征被标识时,优选地从多个特征中消除两个特征之一。例如,可以消除根据数据计算的与两者的临床终点不那么密切相关联的放射组学特征,并且可以保留与临床终点最紧密关联的放射组学特征,但这不是必需的,并且可以保留或删除任一个。例如,共线消除步骤可以在不考虑临床终点的情况下以无监督的方式执行,并且算法可以消除对研究群体的变化贡献最小的最大冗余特征(例如,如跨多个个体测量的方差较小的特征)。在一个实例中,当一对共线特征被标识时,去除具有最大平均(例如,均值)绝对相关性(即具有所有其它放射组学特征的平均相关性值(或平均模量或平方相关性值))的特征。这可以以逐步的方式执行,直到没有保留共线的放射组学特征为止。

共线消除步骤可以使用算法或函数(例如,函数克拉雷特:发现相关性,R数据包(the function claret:findCorrelation,R package)参见Kuhn,M.&Johnson,K,《应用预测模型(Applied Predictive Modelling)》,(施普林格出版社(Springer),2013年)进行。例如,函数或算法可以构造含有放射组学特征之间的成对相关性的成对相关性矩阵。然后,函数可以通过相关性矩阵进行搜索,并返回与列相对应的整数向量以去除以减少成对相关性。然后可以从多个放射组学特征中去除这些列所对应的放射组学特征。在确定要去除哪些列时,算法可以首先标识放射组学特征之间的成对相关性。当两个共线放射组学特征被标识时,算法然后标识与具有最大平均绝对相关性的特征相对应的列以进行去除。

无论如何执行共线消除步骤,最终结果优选地是产生减少的多个放射组学特征,在所述多个放射组学特征中,特征中的每个特征与其它剩余特征中的每个其它剩余特征的相关程度小于相关性阈值。换句话说,方法可以涉及去除放射组学特征以消除放射组学特征之间的共线性的步骤,使得剩余放射组学特征均不与其它剩余放射组学特征中的任何其它剩余放射组学特征共线。这可以涉及计算放射组学特征之间的成对相关性,以及去除任何所标识的一对共线特征中的至少一个。

然后可以基于在执行上文所描述的步骤中的任一个步骤中幸存的剩余放射组学特征中的至少两个剩余放射组学特征(例如,稳定性分析、显著性分析和/或共线性消除)来构造放射组学标签。例如,然后可以基于在共线消除步骤中幸存的减少的多个非共线放射组学特征中的至少两个非共线放射组学特征来构造放射组学标签。在共线消除步骤中幸存的减少的多个特征以其它方式被称为“原始特征”。然而,由于被消除的放射组学特征各自与原始特征中的至少一个原始特征密切相关,因此其中原始特征中的一个或多个原始特征由与经替代的原始特征共线的特征之一替代的标签通常将与基于仅原始特征计算标签类似的方式执行。例如,有可能将原始特征之一交换为计算为与所述原始特征共线的特征之一,并且应以类似的方式执行标签。实际上,用与经替代的原始特征共线的可替代特征替代原始特征中的一个或多个(甚至全部)原始特征可能导致标签具有提高的预后价值是可能的,并且实际上已经发现在一些情况下是这样的(参见例如表8A和8B)。这是因为尽管原始特征通常与临床终点最独立相关联,但是当组合成标签时,其不一定是性能最佳的特征。

因此,构造放射组学标签的过程可以涉及构造放射组学特征的“聚类”(每个聚类都包括原始特征之一),在所述聚类中,每个聚类中的放射组学特征中的每个放射组学特征与所述聚类中的至少“原始”特征共线(即,在共线消除步骤中幸存的所述聚类的特征,例如,聚类中与临床终点最独立密切相关联的特征)。可以代替共线消除步骤来执行这些聚类的构造。例如,代替消除每对共线特征中的一个,可以将共线特征分配给同一聚类。可替代地,可以如上文所描述地执行成对消除步骤,并且然后,一旦原始特征被标识,就可以通过将被消除的特征分配给与其最密切相关或共线的原始特征的聚类来重新引入所述被消除的特征。

然而,无论如何构造聚类,最终结果都应该是,将每个放射组学特征和与其共线的一个或多个原始放射组学特征分配给同一聚类。如果放射组学特征与两个“原始”特征共线,则优选地是将所述放射组学特征分配给与其最共线的原始特征的聚类,但也可以将所述放射组学特征分配给与其共线的所有原始特征的聚类。

聚类还可以被扩展为包含与所述聚类的“原始”放射组学特征共线的原始多个放射组学特征中的任何原始多个放射组学特征,无论放射组学特征本身是否与临床终点独立地显著相关联。然而,如先前所提及的,优选地,包含在聚类中的任何放射组学特征是稳定的。

因此,每个聚类中的“原始”放射组学特征表示所述聚类中其它放射组学特征中的每个其它放射组学特征的“配偶体”放射组学特征,其中每个聚类中的放射组学特征中的每个放射组学特征都与其“配偶体”特征共线。因此,从这个意义上讲,原始放射组学特征可以被认为是其自身“配偶体”放射组学特征,因为其与其自身完全共线。

然后可以基于减少的多个特征(例如,“原始”特征)中的至少两个(或全部)特征来构造初始放射组学标签。可替代地,如果构造聚类,则可以由至少两个放射组学特征来构造初始放射组学标签,每个放射组学特征均选自不同的聚类。放射组学标签的构造涉及完善或优化放射组学标签,具体地使用“训练”队列的数据。这涉及基于数据完善或优化剩余放射组学特征中的每个剩余放射组学特征对标签的贡献,以改善标签与临床终点之间的相关性或关联性。例如,标签可以包括初始标签中包含的放射组学特征中的每个放射组学特征的值的加权和,并且可以逐步地优化或完善放射组学特征中的每个放射组学特征的权重。放射组学特征中的每个放射组学特征与之相乘的系数通常被称为β(β)系数,并且正是这些β系数才可以进行优化或完善。

优选地,所有减少的多个特征包含在要完善的初始放射组学标签中,例如,来自每个聚类的一个特征,但这不是绝对必要的。例如,可以包含来自每个聚类的“最佳”特征或“原始”特征(例如,与临床终点最独立地密切相关联的特征)。其它放射组学特征也可以包含在要优化的初始标签中,例如,来自聚类中的任何或所有聚类的两个或更多个放射组学特征可以包含在初始标签中。然而,为了提供与临床终点更密切相关联的标签以及因此提高的诊断和预后的有用性,优选的是包含至少两个放射组学特征,每个放射组学特征均来自不同的聚类。这是因为来自不同聚类的特征提供了与PVR相关的补充信息。具体地,来自不同聚类的放射组学特征将对PVR的不同表型特征敏感,因为其与不同的“原始”或“配偶体”特征共线。例如,初始放射组学标签可以包括至少三个放射组学特征,每个放射组学特征选自不同的聚类。可替代地,初始放射组学标签可以包括至少四个放射组学特征,每个放射组学特征选自不同的聚类。可替代地,初始放射组学标签可以包括至少五个放射组学特征,每个放射组学特征选自不同的聚类。可替代地,初始放射组学标签可以包括至少六个放射组学特征,每个放射组学特征选自不同的聚类。可替代地,初始放射组学标签可以包括至少七个放射组学特征,每个放射组学特征选自不同的聚类。可替代地,初始放射组学标签可以包括至少八个放射组学特征,每个放射组学特征选自不同的聚类。优选地,初始放射组学标签可以包括来自每个聚类的一个放射组学特征。

一旦初始放射组学标签已经被完善,则可以基于初始标签中包含的所有放射组学特征或这些特征的子集来构造最终放射组学标签。例如,可以将经优化或完善的初始标签用作最终标签。可替代地,最终放射组学标签可以包括仅初始标签中包含的放射组学特征的子集。例如,仅那些对经改善的初始标签的贡献高于某个阈值的参数可以包含在最终标签中,如经优化的加权系数(例如,β参数)高于某个(例如,预定的)阈值的那些参数。换句话说,经优化的系数低于给定阈值的那些放射组学特征将从最终标签中去除。例如,可以在最终标签中包含前七个特征(即,对经完善的标签贡献最大的特征)。

如果仅放射组学特征的子集包含在最终标签中,则一种选择是仅基于特征子集重新优化或完善标签。例如,可以针对包含在最终标签中的放射组学特征的子集重新优化系数或β参数。可替代地,从对初始标签执行的初始优化推导的系数或β参数可以用于最终标签中。

如上文所提及的,标签可以包含多个放射组学特征的经计算的值的加权和。标签还可以包含其它术语,如常数的加法或减法,或因数的乘法。然而,通常,标签将以某种方式与放射组学特征值的加权和线性相关。

放射组学标签可以采用以下形式或包含术语(例如,可以基于包含术语的函数来计算标签):

A ±Σb

其中A是常数(可以为零或非零),b

可以使用机器学习算法来构造(即,优化或完善)初始和/或最终放射组学标签。例如,机器学习算法可以用于例如通过优化β系数来完善或优化放射组学特征中的每个放射组学特征对标签的贡献。机器学习方法可以使用弹性网络/套索回归,并且可以利用留一法内部交叉验证。弹性网络回归是将套索和岭方法的L1和L2罚分线性地组合的正则化回归方法。L1(最小绝对收缩和选择算子“套索”罚分)惩罚系数的绝对值,将不相关的系数收缩为零并有助于特征选择,而L2(“岭”罚分)惩罚系数的平方,因此限制了共线性的影响并减少了过度拟合。可以通过交叉验证来选择最佳罚分系数(λ,λ),而α优选地被设置为α=1。

优选地,使用用于训练队列的数据来完善标签,并且然后使用用于训练队列的数据在外部对所述标签进行验证。

“非聚类”方法

本发明还提供了另一种用于推导放射组学标签的方法。在此方法中,如上文关于“聚类”方法所描述的,从医学成像数据针对多个个体中的每个个体计算多个放射组学特征。

然后可以例如使用接受者工作特征(ROC)曲线分析,具体地使用曲线下面积计算(计算C统计数据)来评估所有放射组学特征(优选地所有稳定的放射组学特征)对临床终点(例如,5年MACE)的辨别价值,并且从多个特征中消除了不与临床终点显著相关联的任何放射组学特征。对于上文所描述的聚类方法,如果特征与高于某个显著性阈值的临床终点相关联,则将所述特征标识为与临床终点显著相关联。显著性阈值优选地为α=0.05或更小,例如,α=0.001到0.05。显著性阈值优选地为约α=0.05。然而,显著性阈值可以为约α=0.04。可替代地,显著性阈值可以为约α=0.03。可替代地,显著性阈值可以为约α=0.02。可替代地,显著性阈值可以为约α=0.01。可替代地,显著性阈值可以为约α=0.005。可替代地,显著性阈值可以为约α=0.002。

为了校正多重比较并降低错误发现率(FDR),可以将Bonferroni校正应用于显著性阈值。可以基于主成分数量来应用Bonferroni校正,所述主成分数量占基于主成分分析的研究样品中可变性的给定数量。例如,给定数量可以为约99.5%。换句话说,用于校正α值的m值(通过将α除以m,即,α/m)是占可变性的给定数量的主成分的数量。因此,可以对多个个体(如果将个体分为训练队列和验证队列,则优选地包含两个队列)的数据执行放射组学特征的主成分分析。

如上文所描述的,然后放射组学标签可以基于剩余放射组学特征中的至少两个剩余放射组学特征来构造,即,被标识为与临床终点显著相关联的放射组学特征。可以以与如上文针对聚类方法所描述的相同的方式来构造和优化放射组学标签,但是不同之处在于,不需要从不同的聚类中选择放射组学特征。

例如,被标识为与临床终点显著相关联的所有放射组学特征可以包含在初始或最终放射组学标签中。可替代地,仅与临床终点显著相关联的放射组学特征的子集可以包含在初始或最终标签中,例如,至少两个。可替代地,与临床终点显著相关联的放射组学特征中的至少三个放射组学特征可以包含在初始或最终标签中。可替代地,与临床终点显著相关联的放射组学特征中的至少四个放射组学特征可以包含在初始或最终标签中。可替代地,与临床终点显著相关联的放射组学特征中的至少五个放射组学特征可以包含在初始或最终标签中。可替代地,与临床终点显著相关联的放射组学特征中的至少六个放射组学特征可以包含在初始或最终标签中。可替代地,与临床终点显著相关联的放射组学特征中的至少七个放射组学特征可以包含在初始或最终标签中。

同样,优选地使用用于训练队列的数据来完善标签,并且然后使用用于训练队列的数据在外部对所述标签进行验证。

可以组合聚类方法或非聚类方法的元素。例如,聚类(或共线消除)方法可以涉及Bonferroni校正的应用。

例如,可以将多个放射组学特征输入到机器学习算法中,而无需执行上文所描述的前述步骤中的一些(或任何)前述步骤。然而,通常,在将特征输入到机器学习算法之前,至少要执行消除不稳定的放射组学特征的步骤。

通常,在上述方法(聚类和非聚类两者)中,可以通过非参数斯皮尔曼rho(ρ)系数来评估放射组学特征之间的双变量关联,而观察者可变性可以通过组内相关系数(ICC)在给定的扫描次数(例如,至少两次扫描,例如,十次扫描)中进行评估。

基于从医学成像数据获得的放射组学特征的经测量的值来计算本发明的PVR放射组学标签。具体地,优选地基于至少两个放射组学特征来计算PVR放射组学标签。

为了改善标签的预后和诊断价值,如上文所描述的,优选地基于选自共线特征的不同“聚类”中的至少两个放射组学特征来计算标签。这减少了冗余并改善了标签计算中包含的信息的多样性,因为来自不同聚类的特征涉及PVR的不同纹理方面。

已经使用“聚类”方法标识九个聚类,所述九个聚类对应于在以下“示例”部分中描述的研究中在共线消除过程中幸存的减少的多个放射组学特征中的九个“原始”或“配偶体”特征。表1标识了九个聚类的成员。

表1还标识了“原始特征”,所述原始特征是每个聚类中的在上文描述的“聚类”方法中的共线特征的消除中幸存的特征。每个聚类中其它特征与原始特征的共线性用|ρ|系数表示(其中ρ是非参数斯皮尔曼rho(ρ)系数)。

为了构造表1的聚类,在训练队列和验证队列两者中与临床终点相关联高于阈值(p<0.05;其中p是概率值或渐近显著性,即,α=0.05)的53个稳定的与体积和取向无关的放射组学特征是基于其与原始特征相关的强度进行聚类的。如果发现放射组学特征与两个或更多个原始特征(|rho|≥0.75)共线,则将所述放射组学特征分配给与所述放射组学特征最密切相关联的原始特征的聚类。令人感兴趣的是,并且也许令人惊讶的是,FAI

表1:“标准”聚类的放射组学特征选自与MACE显著相关联的53个所标识的特征

如前所述,可以将聚类扩展为包含与聚类的“原始”放射组学特征共线的原始多个放射组学特征的稳定成员,无论共线放射组学特征本身是否独立地与临床终点显著相关。

表2呈现了九个“扩展”聚类的成员。这些扩展聚类与表1中呈现的原始聚类等效,但是扩展为包含也与来自每个聚类的原始特征(|rho|≥0.75)之一共线的719个稳定的放射组学特征(ICC>0.9)中的任何放射组学特征。同样,如果发现放射组学特征与两个或更多个原始特征(|rho|≥0.75)共线,则将所述放射组学特征分配给发现与所述放射组学特征最密切相关联的原始特征的聚类。

表2:“扩展”聚类的放射组学特征选自719个所标识的稳定特征

放射组学标签可以由表1或表2中包含的放射组学特征中的任何放射组学特征(即,标准聚类或扩展聚类)构造而成,前提是放射组学标签包括至少两个各自选自不同聚类的放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少三个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少四个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少五个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少六个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少七个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少八个放射组学特征。例如,放射组学标签可以包括来自不同聚类的至少九个放射组学特征。

选自不同聚类中的至少两个(或更多个)放射组学特征中的每个放射组学特征可以被选择为与其所属的聚类的至少处于|rho|=0.8程度的“原始”特征相关。例如,来自不同聚类的至少两个放射组学特征中的每个放射组学特征可以与其所属的聚类的至少处于|rho|=0.85程度的“原始”特征相关。例如,来自不同聚类的至少两个放射组学特征中的每个放射组学特征可以与其所属的聚类的至少处于|rho|=0.9程度的“原始”特征相关。例如,来自不同聚类的至少两个放射组学特征中的每个放射组学特征可以与其所属的聚类的至少处于|rho|=0.95程度的“原始”特征相关。

除了基于来自不同聚类的至少两个放射组学特征来计算放射组学标签之外,还可以基于另外的放射组学特征来计算所述放射组学标签。例如,放射组学标签可以包含来自任何给定聚类的多于一个放射组学特征,或者可以包含聚类中的任何聚类中都不包含的放射组学特征。

可替代地,可以基于使用“非聚类”方法已经发现与临床终点独立地相关联的放射组学特征中的至少两个放射组学特征来计算放射组学标签。因此,可以替代地基于选自表3的至少两个放射组学特征来计算放射组学标签。

表3:按照“非聚类”方法,放射组学特征被标识与MACE显著相关联

可以基于来自表3中的至少两个放射组学特征来计算放射组学标签。例如,可以基于来自表3中的至少三个放射组学特征来计算放射组学标签。例如,可以基于来自表3中的至少四个放射组学特征来计算放射组学标签。例如,可以基于来自表3中的至少五个放射组学特征来计算放射组学标签。例如,可以基于来自表3中的至少六个放射组学特征来计算放射组学标签。例如,可以基于来自表3中的至少七个放射组学特征来计算放射组学标签。

至少两个(或更多个)放射组学特征可以选自表3中经Bonferroni调整的P值<0.04的那些放射组学特征。例如,经Bonferroni调整的P值<0.03的放射组学特征。例如,经Bonferroni调整的P值<0.02的放射组学特征。例如,经Bonferroni调整的P值<0.01的放射组学特征。例如,经Bonferroni调整的P值<0.005的放射组学特征。例如,经Bonferroni调整的P值<0.002的放射组学特征。

标签可以由表3中列出的放射组学特征构造,但均值除外。

同样,除了基于选自表3中呈现的放射组学特征的至少两个放射组学特征来计算放射组学标签之外,还可以基于另外的放射组学特征来计算所述放射组学标签。例如,放射组学标签可以包含表3中未包含的放射组学特征。

本发明的放射组学标签中的每个放射组学标签提供了用于使用医学成像数据表征PVR的直接方式。因为本发明的放射组学标签中的每个放射组学标签基于相对较少数量的可以测量的可能放射组学特征总数,所以标签易于计算和理解,并且临床医生可以更好地理解其生理学显著性。

本发明的方法可以在如计算机系统等系统上执行。因此,本发明还提供被配置成或布置成执行本发明的方法中的一个或多个方法的系统。例如,系统可以包括计算机处理器,所述计算机处理器被配置成执行本发明的方法中的一种或多种方法或方法的步骤。系统还可以包括装载有用于执行本发明的方法中的任何方法的步骤的可执行指令的计算机可读存储器。

具体地,可以在此类系统上执行推导放射组学标签的方法,并且因此根据本发明提供了此类系统。例如,系统可以被配置成接收并且任选地存储数据集,所述数据集包括从医学成像数据针对多个个体中的每个个体获得的PVR的多个放射组学特征的值,以及关于在收集指示多个个体中的每个个体的心血管风险的临床终点的医学成像数据之后的随后时间段期间发生的信息。系统可以被配置成根据本发明的方法使用此类数据集来构造(例如,推导和验证)放射组学标签。

可替代地,系统可以被配置成执行表征PVR的方法。具体地,本发明提供了一种用于使用受试者的医学成像数据来表征PVR的系统。系统可以被配置成使用医学成像数据来计算PVR的放射组学标签的值。可以基于PVR的至少两个放射组学特征的经测量的值来计算放射组学标签,并且可以根据医学成像数据来计算至少两个放射组学特征的经测量的值。

系统还可以被配置成根据医学成像数据计算放射组学特征,如上文更详细地描述的。因此,系统可以被配置成接收并且任选地存储医学成像数据,并且处理成像数据以计算放射组学特征。

通常仅通过引用其名称就可以在放射组学领域内很好地理解本文所指的放射组学特征的定义。然而,为了便于参考,在下文的表R1到R7中提供了本文所使用的特征的定义。表R1到R7中的放射组学特征是根据由Pyradiomics数据包使用的放射组学特征(http://pyradiomics.readthedocs.io/en/latest/features.html,参见vanGriethuysen,J.J.M.,Fedorov,A.,Parmar,C.,Hosny,A.,Aucoin,N.,Narayan,V.,Beets-Tan,R.G.H.,Fillon-Robin,J.C.,Pieper,S.,Aerts,H.J.W.L.(2017),对放射组学表型进行解码的计算放射组学系统(Computational Radiomics System to Decode theRadiographic Phenotype),《癌症研究(Cancer Research)》,77(21),e104–e107.https://doi.org/10.1158/0008-5472.CAN-17-0339)定义的。表R1到R7中定义的大多数特征均符合由成像生物标志物标准化倡议(Imaging Biomarker Standardization Initiative,IBSI)所描述的特征定义,所述特征定义可在Zwanenburg等人,(2016)(Zwanenburg,A.,Leger,S.,Vallières,M.和

这些统计数据描述了给定的所关注区域(ROI)中衰减值的集中倾向性、可变性、均匀度、不对称性、偏度和幅度,而忽略了各个体素的空间关系。如此,所述统计数据描述了整个ROI(PVR)的定量和定性特征。针对八个小波变换中的每个小波变换和原始CT图像,计算了总共19个特征,如下所示:

令:

·X为所关注区域(ROI)中包含的一组N

·P(i)为具有N

·p(i)为归一化一阶直方图并且等于

·c为使强度变化以防止X中出现负值的值。这确保了灰度值最低的体素而不是灰度强度最接近0的体素对能量的贡献最小。由于PVR内的脂肪组织(AT)的HU范围(-190到-30HU)不包含零,因此可以将c设置为c=0。因此,较高的能量对应于较小放射密度AT,以及因此较高的亲脂性含量。

·∈为任意小的正数(例如,约2.2×10

表R1:用于PVR表征的一阶放射组学特征

形状相关的统计数据描述了给定ROI的大小和形状,而没有考虑其体素的衰减值。由于其与灰度强度无关,因此形状相关的统计数据在所有小波变换和原始CT图像中都是一致的,并且因此仅计算一次。这些定义如下:

令:

V为ROI的体积,以mm

A为ROI的表面积,以mm

表R2:用于PVR表征的形状相关的放射组学特征

简单来说,GLCM描述了给定衰减值i的体素定位在j的体素附近的次数。大小为N

令:

∈为任意小的正数(例如,约2.2×10

P(i,j)为任意δ和θ的共生矩阵

p(i,j)为归一化共生矩阵并且等于

Ng为图像中离散强度水平的数量

μ

μ

σ

σ

对于距离加权,将GLCM矩阵通过加权因子W加权,并且然后求和并归一化。通过W=e-‖d‖

表R3:用于PVR表征的灰度共生矩阵(GLCM)统计数据

灰度大小区域(GLSZM)描述了ROI中的灰度区域,其被定义为共享同一灰度强度的连接体素的数量。如果距离根据无穷范数为1(3D中的26个连接区域,2D中的8个连接区域),则体素被认为是连接的。在灰度大小区域矩阵P(i,j)中,第(i,j)个元素等于出现在图像中的灰度为i且大小为j的区域的数量。与GLCM和GLRLM相反,GLSZM与旋转无关,其中针对ROI中的所有方向计算仅一个矩阵。

令:

N

N

N

N

1≤N

P(i,j)为大小区域矩阵

p(i,j)为归一化大小区域矩阵,被定义为

∈为任意小的正数(例如,约2.2×10

表R4:用于PVR表征的灰度大小区域矩阵(GLSZM)统计数据

灰度游程长度矩阵(GLRLM)描述了灰度值相同的连续像素的灰度游程,所述灰度游程被定义为像素的数量的长度。在灰度游程长度矩阵P(i,j|θ)中,第(i,j)个元素描述了灰度为i且长度j的游程沿着角度θ在图像(ROI)中出现的次数。

令:

N

N

N

N

P(i,j|θ)为任意方向θ的游程长度矩阵

p(i,j|θ)为归一化游程长度矩阵,被定义为

∈为任意小的正数(例如,约2.2×10

默认情况下,将在GLRLM上针对每个角度分别计算特征的值,然后返回这些值的均值。如果启用了距离加权,则将通过相邻体素之间的距离对GLRLM进行加权,并且然后对其求和并归一化。然后在所得矩阵上计算特征。使用“加权范数(weightingNorm)”中指定的范数针对每个角度计算相邻体素之间的距离。

表R5:用于PVR表征的灰度游程长度矩阵(GLRLM)统计数据

相邻灰度色调差异矩阵量化了灰度值与位于距离δ之内的其邻居的平均灰度值之间的差异。将灰度i的绝对差之和存储在矩阵中。令X

其中(k

此处,W为也在X

令:

n

Nv,p为X

p

N

N

表R6:用于PVR表征的相邻灰度色调差异矩阵(NGTDM)

灰度依赖性矩阵(GLDM)量化图像中的灰度依赖性。灰度依赖性被定义为位于距离δ内的依赖于中心体素的连接体素的数量。如果|i-j|≤α,则认为灰度为j的相邻体素依赖于灰度为i的中心体素。在灰度依赖性矩阵P(i,j)中,第(i,j)个元素描述了在其邻域中具有j个相关体素的灰度为i的体素在图像中出现的次数。

N

N

N

P(i,j)为依赖性矩阵

p(i,j)为归一化依赖性矩阵,被定义为

表R7:用于PVR表征的灰度依赖性矩阵(GLDM)统计数据

实例

进行了一项旨在探索CCTA冠状PVR放射组学表型分析的诊断和预后价值的两组研究。图1和表4A、4B和5呈现了研究组1和研究组2的研究流程图和基线特征。研究方案已获得所有当地机构审查委员会(local institutional review boards)的批准。

第1组

这是在通过CCTA进行临床指示评估之后的五年内的一项有不良事件的患者对没有不良事件的病例对照者研究。从经历临床指示CCTA的两个独立患者队列的前瞻性收集数据中检索出符合资格的病例。在审查的总共4239项个体扫描中(队列1中的2246项和队列2中的1993项),有3912项是优等质量的,并包含在另外的分析中。基于主要不良心血管事件(MACE)的主要复合终点标识病例,所述主要复合终点被定义为CCTA后五年内全因死亡率和非致命性心肌梗塞(MI)的复合,而对照者被标识为CCTA后至少五年无事件随访的患者。在审查了扫描质量并检索了相关人口统计特征之后,使用自动算法对与CCTA采集相关的年龄、性别、肥胖状况、队列和技术参数(使用了管电压和CT扫描仪)进行了1:1匹配。在可能的情况下,还使患者与其它心血管风险因素匹配,包含高血压、血脂异常、糖尿病和吸烟。还分别检查了患有心脏特异性MACE(cMACE;心脏死亡率和非致死性MI)的亚组患者及其匹配的对照者,以增加对心脏特异性高风险PVR特征的敏感性。

表4A:研究组1人口统计特征

值呈现为百分比(%)或均值±标准差。

ACEi:血管紧张素转换酶抑制剂;ARB:血管紧张素II-受体阻断剂;CAD:冠状动脉疾病;(c)MACE:(心脏特异性的)主要不良心血管事件。

表4B:研究组1人口统计特征

值呈现为百分比(%)或均值±标准差。

ACEi:血管紧张素转换酶抑制剂;ARB:血管紧张素II-受体阻断剂;CAD:冠状动脉疾病;(c)MACE:(心脏特异性的)主要不良心血管事件。

第2组

这是一项招募了22名存在有急性心肌梗塞的患者(n=22个不稳定病变)的前瞻性研究(Ox-IMPACT研究,经牛津C研究伦理委员会(Oxford C Research Ethics Committee)中南部的伦理批准;REC参考17/SC/0058),所述患者被邀请在入住96小时和六个月后接受一系列CCTA扫描。对照组中的32名具有已知稳定的CAD(n=39个稳定的病变)以及在CCTA扫描之前至少三个月具有先前经皮冠状动脉介入治疗(PCI)的患者也包含在此组中。在稳定的病变和不稳定的病变两者周围进行冠状PVR的放射组学表型,以标识PVR的与斑块不稳定性和炎症关联的放射组学标签。

表5:研究组2人口统计特征

研究中包含的放射组学特征

测量了总共843个PVR放射组学特征,如表6所总结的。

表6:PVR放射组学特征的细分

数据收集、定义和结果评估

在第1组中,通过搜索病历并由不参与随后的图像/数据分析的本地研究者查询本地/国家数据库汇编结果数据。在豁免个人知情同意书的情况下,获得了合适的机构审查委员会的批准。临床数据和人口统计特征在初次临床接触时就已预先记录在电子病历中,并将其手动提取以用于当前研究。高血压基于文件记录的抗高血压方案诊断或治疗的存在根据相关的临床指南(James PA、Oparil S、Carter BL等人,2014年成人高血压管理的基于证据的指南:第八届全国联合委员会(JNC 8)任命的小组成员的报告,《美国医学会杂志(JAMA)》2014;311(5):507-20)进行定义。类似的标准应用于高胆固醇血症和糖尿病的定义(美国糖尿病A.糖尿病的诊断和分类(American Diabetes A.Diagnosis andclassification of diabetes mellitus),《糖尿病监护(Diabetes Care)》2014;37增刊1:S81-90;Stone NJ、Robinson JG、Lichtenstein AH等人,2013年ACC/AHA关于降低成年人的动脉粥样硬化性心血管疾病风险的胆固醇治疗指南:美国心脏病学会/美国心脏协会实践指南工作组的报告,《美国心脏病学会杂志(J Am Coll Cardiol)》2014;63(25Pt B):2889-934)。由每个地点的研究者通过病历审查、死亡证明检查和/或电话随访和/或与家庭成员进行验证来确定确切的死因。如先前所描述的,根据ACC/AHA和学术研究联盟(AcademicResearch Consortium)的建议定义了心脏死亡率和非心脏死亡率。更具体地,心脏死亡率被定义为由于邻近的心脏原因(例如,心肌梗塞、低输出心力衰竭、致命性心律失常)而导致的任何死亡。满足心脏性猝死标准的死亡也包含在此组中。先前定义未涵盖的任何死亡,如由恶性肿瘤、意外事故、感染、败血症、肾衰竭、自杀或其它非心脏血管原因(如中风或肺栓塞)导致的死亡都被分类为非心脏的。在无法收集具有确定性的关于死因的信息的情况下,死亡由当地现场研究者将其分类为“死因不明”。在随访期间的非致命性心肌梗塞事件(ST区段抬高或非ST区段抬高)也可以通过电子健康记录的搜索来检索。

冠状CT血管造影术(CCTA)采集方案

CCTA扫描处理和分析

所有图像首先在本地匿名,并且随后转移到核心实验室(英国牛津大学学术心血管CT室(Academic Cardiovascular CT Unit,University of Oxford,United Kingdom))以由对人口统计特征和结果不知情的研究者在专用工作站(Aquarius

冠状PVR放射组学特征提取

使用3D Slicer(v.4.9.0-2017-12-18r26813,可从http://www.slicer.org获得)在所有选择的CCTA扫描中进行冠状PVR的放射组学特征的计算。为避免不同冠状血管之间的共线性问题,第1组的分析仅限于近侧右冠状动脉和中部右冠状动脉(RCA)(根据美国心脏协会的解剖学分类,区段1和区段2)。冠状PVR被定义为处于-190到-30Hounsfield单位范围内(HU)的定位在距外血管壁的等于相邻血管直径的径向距离内所有体素。通过将直径等于冠状血管直径三倍的三维球体放置在沿血管中心线的连续切片上来进行冠状PVR的分割。随后,使用3D Slicer的将Pyradiomics文库并入到3D Slicer的SlicerRadiomics扩展将经分割的PVR提取并将其用于计算放射组学特征。使用经分割的PVR的原始HU值来计算形状相关的放射组学特征和一阶放射组学特征。为了计算纹理特征(灰度共生矩阵[GLCM]、灰度依赖性矩阵[GLDM]、灰度游程长度矩阵[GLRLM]、灰度大小区域矩阵[GLSZM]和相邻灰度色调差异矩阵[NGTDM],图1A和表R1-R7),将PVR体素离散化为16个等宽的仓(十个HU的宽度),以减少噪声,同时允许足够的分辨率以检测PVR衰减中的生物学上显著的空间变化。为了实施对称的旋转不变的结果,可以在所有四个方向上计算纹理统计数据(GLCM等),并且然后取平均值(例如,如先前描述于Kolossvary M,Kellermayer M,Merkely B,Maurovich-Horvat P.,心脏计算机断层扫描放射组学:放射组学技术综合评论(Maurovich-HorvatP.Cardiac Computed Tomography Radiomics:A Comprehensive Review on RadiomicTechniques),《胸成像杂志(Journal of thoracic imaging)》2018;33(1):26-34)中。

小波变换:还针对原始图像数据的三维小波变换计算一阶统计数据和基于纹理的统计数据,从而产生八个另外的放射组学特征集(图1A)。

统计分析

在第1组中,使用Stata中ccmatch命令提供的自动算法执行病例对照者匹配。在最终研究群体中,临床人口统计特征呈现为连续变量的均值±标准差,以及类别变量的百分比。两组之间的连续变量通过学生t检验进行比较,而类别变量通过皮尔森卡方检验(Pearson'sChi-square test)进行比较。

主成分和无监督聚类:在两个研究组中,所有843个经计算的PVR放射组学特征都包含在主成分分析中,以标识描述研究群体中表型变异中的大多数表型变异的主成分。然后,使用第1组(PC1、PC2、PC3)和第2组(PC1'、PC2'和PC3')的三个第一成分对观察值进行分层聚类(使用Ward方法和Minkowski距离)。通过卡方检验对不同聚类之间的MACE(第1组)的频率和不稳定斑块(第2组)进行比较。

特征选择和改进的辨别力:首先,在接受者工作特征(ROC)曲线分析中对5年MACE的所有放射组学特征的辨别价值进行了测试。此分析是针对两个队列的汇总数据进行的。为了校正多重比较,遵循了先前在放射组学图像分析领域中使用的基于全基因组关联研究(GWAS)的方法,通过对本研究样品中占99.5%可变性的主成分数量进行Bonferroni校正(参见例如,Kolossvary M、Karady J、Szilveszter B等人,放射组学特征优于常规定量计算机断层扫描度量以标识具有餐巾环征的冠状动脉斑块,《循环心血管成像》2017;10(12)和Johnson RC、Nelson GW、Troyer JL等人,考虑到全基因组关联研究(GWAS)中的多重比较(Accounting for multiple comparisons in a genome-wide association study(GWAS)),《BMC基因组学(BMC Genomics)》2010;11:724)。可以通过非参数斯皮尔曼rho(ρ)系数来评估放射组学特征之间的双变量关联,而观察者可变性可以通过组内相关系数(ICC)在十次扫描中进行评估。

为了构建高风险PVR的放射组学标签,采用了多步骤方法。将Z-评分变换应用于所有特征,并排除了在重复分析(<0.9)中具有低ICC的不稳定的放射组学特征。为了使由队列特异性变化产生的假阳性结果最少,选择了在两个队列中与MACE显著相关联的特征(处于α=0.05水平)。接下来,使用R上的caret数据包的适当功能,通过逐步去除成对比较来降低共线性。使用剩余的九个放射组学特征,在队列1中应用了使用弹性网络回归和留一法内部交叉验证的机器学习方法。通过交叉验证来选择最佳罚分系数(λ,λ),而α优选地被设置为α=1。然后,在队列2中从外部验证了MACE和cMACE两者的最佳性能模型,并通过计算曲线下面积(AUC)评估了辨别力。然后,通过将每个模型分别乘以所述模型的相应未调整的β系数并计算总和,将性能最佳的模型的最佳的变量组合为统一的评分/标签。然后,将统一标签添加到由以下四个块组成的逻辑回归模型中:i)年龄、性别、高血压、血脂异常、吸烟和糖尿病(模型1);ii)模型1+CT推导的测量值,包含Duke预后CAD指数、高风险斑块特征的存在、EAT体积和冠状动脉钙的存在(模型2);iii)模型2+FAI

研究群体人口统计特征

在第1组中审查的3912项个体扫描中,总共386项扫描包含在研究中,相当于193名5年MACE患者和193名相匹配的对照者。在亚组类型分析中,还标识并分析了98名心脏特异性mace(cMACE)患者及其匹配的对照者的选定亚组。表4A和4B汇总了研究组1群体人口统计特征和基线特征。病例和对照者在其基线人口统计特征方面无显著差异,然而,如所预期的,与其对照者相比,如通过冠状动脉狭窄程度和Duke预后CAD指数所评估的,病例(MACE或cMACE)更有可能患有冠状动脉疾病(CAD)。研究组2包含22名具有不稳定病变的患者,以及32名年龄和性别匹配的具有39个稳定病变的对照者(表5)。

PVR放射组学特征:成分分析以及与不良事件的关联

从原始图像计算总共103个放射组学特征,除了18个一阶统计数据、23个GLCM、14个GLDM、16个GLRLM、16个GLSZ和5个NGTDM单个特征之外,还对应于15个与形状相关的特征(表6,图4)。还针对经分割的区域的八个小波变换中的每个小波变换计算了除与形状相关的特征以外的所有特征,产生了总共843个放射组学特征。对所有放射组学特征的主成分分析揭示,三个主成分占第1组两个队列观察到的变化的61.98%(图5A),而92个成分占研究群体中的变化的99.5%(图5B中呈现的碎石绘图)。在特征值>1的42个成分中,总共有六个成分是MACE的显著预测因子(图5C),而在包含针对年龄、性别、心血管疾病风险因素和CCTA推导的CAD程度指数进行调整的所有五个成分的多元回归模型中,有四个成分仍与MACE独立相关联(图5D)。这些成分与基线临床人口统计特征和特征差异相关联(图5E),可能反映了描述不同生物表型的PVR特征。值得注意的是,在包含年龄、性别、心血管疾病风险因素和CCTA推导的风险特征的模型中包含的四个PVR成分显著改进针对5年MACE的辨别力(图5F),从而表明PVR的放射组学表型分析具有强且增量的预后价值。

基于冠状PVR表型分析的无监督聚类

使用冠状PVR放射组学的前三个主成分(PC1、PC2和PC3)对汇总的第1组研究群体进行无监督(分层)聚类,标识了5年MACE风险显著不同的三个不同聚类(46.5%对45.8%对65.8%MACE,P=0.009)。类似地,在第2组中,所标识的冠状动脉病变的分层聚类标识了不稳定斑块的患病率显著不同的两个不同聚类(58.8%对25%,P=0.01)。这些发现表明,PVR中存在不同的放射组学标签,这与心血管疾病的增加以及冠状动脉炎症和不稳定病变的局部存在关联。

标识特定的高风险PVR放射组学特征

主成分分析和无监督聚类证明了PVR的放射组学表型分析可以与冠状动脉炎症/疾病的局部存在和较差的结果两者关联的概念。然而,其无法标识可以在独立队列中可重复测量的特定的高风险放射组学特征。主成分特定于其源自的数据集,并且不容易应用于独立的数据集和队列。因此,进行了另外的工作以标识可以补充已建立的FAI

构建高风险PVR放射组学标签

尽管如FAI

表7:定义高风险PVR纹理标签

在表7中,通过将b

PVR放射组学表型分析的增量价值超出了当前的现有技术

为了评估FAI

验证本发明的替代放射组学标签(PTI)

图3A和3B中呈现的数据表明,表7中定义的放射组学标签(PTI)提供了模型对两个终点(MACE和cMACE)的显著改进的辨别价值。为了验证本发明的包含放射组学特征的不同选择的替代放射组学标签的有用性,针对现有技术模型对包含若干不同放射组学标签的一系列模型进行了测试。

在表8中,对存在于196名患者(98名患有心脏MACE的患者和98名匹配的对照者)中的模型性能进行了改进。每个步骤都对应于在现有技术模型之上包含一个选定的放射组学特征和先前聚类的放射组学特征。现有技术模型包含年龄、性别、高血压、血脂异常、吸烟和糖尿病、Duke预后冠状动脉疾病指数、高风险斑块特征、心外膜脂肪组织体积和冠状钙的存在。

在实例1-4中的每个实例中,现有技术模型由包含逐渐增多的来自不同聚类的放射组学特征的放射组学标签逐渐补充。首先,通过基于选自聚类1(表8A和8B的第一行:“+聚类1”)的放射组学特征计算的放射组学标签来补充现有技术模型。接下来,通过基于选自聚类1和2(表8A和8B的第一行:“+聚类2”)的两个放射组学特征计算的放射组学标签来补充现有技术模型。因此,表8A和8B的每个逐行对应于在现有技术模型之上包含一个选定的放射组学特征和先前聚类的放射组学特征。Nagelkerke的pseudo-R2提供了模型对cMACE的辨别力的量度。

从表8A和8B可以清楚地看出,基于从所标识的聚类中的放射组学特征的不同选择而计算的本发明的标签均提供了针对心脏特异性MACE的改进的预测。因此,表8中呈现的数据表明,无论哪些特征选自所标识的聚类中的每个所标识的聚类,或者精确地选择了多少个特征,本发明的放射组学标签(PTI)都相较于先前使用的模型提供了对心血管风险的改进的预测。

表8A:来自所标识的聚类中的放射组学特征的不同选择对心脏特异性MACE的改进的预测

表8B:来自所标识的聚类中的放射组学特征的不同选择对心脏特异性MACE的改进的预测

PVR放射组学表型分析检测不稳定病变

当在研究组2中预先定义的冠状动脉病变周围进行计算时,与稳定的经治疗的病变(在PCI后>3个月内扫描)相比,在存在不稳定的罪犯病变(在ACS发作96小时内扫描)的情况下,用于定义PTI的除所标识的放射组学特征之外的所有放射组学特征显著变化了(图8A-G)。更重要的是,PTI(使用表7的公式定义)在区分不稳定的冠状动脉病变与稳定的冠状动脉病变方面性能优于所有六个单独的放射组学特征(AUC:0.76;95%置信区间;0.64-0.88)(图8G)。这些发现表明,通过PTI组合FAI

发现总结

使用机器学习方法,发明人发现并验证了冠状PVR放射组学标签增加了预测未来不良心血管事件并评估心血管健康和风险方面的超出传统风险因素和已建立的CCTA风险分类工具的增量价值,并进一步检测局部斑块炎症以及不稳定的冠状动脉病变的存在。发明人已经证明,基于PVR的两个或更多个放射组学特征的PVR放射组学标签提供了用于预测患者未来不良事件,用于诊断冠状动脉疾病或冠心病,以及用于标识不稳定的冠状动脉病变的工具。

本发明的PVR标签描述了高风险PVR表型,将其与未来事件风险联系,并提供了超出当前基于CCTA的工具的增量的预后信息。本发明的标签还能够基于病灶周围脂肪的放射组学标签来将不稳定的冠状动脉病变与稳定的冠状动脉病变区分开。综上所述,本文提出的发现表明,借助本发明的放射组学标签的PVR放射表型分析可以用于标识高风险患者(当以归一化方式在冠状血管周围测量时)和高风险病变(当应用于特异性冠状动脉区段或病变周围时)两者,这对现代基于CCTA的风险预测具有重要意义。

令人惊讶地,放射组学标签不需要由与未来不良事件最独立地密切相关联的放射组学特征构造。相反,实际上有利的是包含从放射组学特征的不同共线“聚类”中选择放射组学特征,而不是仅包含与不良事件最独立地密切相关联的那些放射组学特征。

本发明的特别吸引人的方面是,其可以基于先前已经收集的历史医学成像数据来执行。可以基于历史成像数据来推导和计算本发明的标签,并且因此本发明提供了用于评估大量患者的便利工具,而无需执行另外的扫描。因此,本发明的方法不必包含收集医学成像数据的步骤,并且可以基于对现有医学成像数据的事后分析来执行。

以下编号的条款公开了本发明的各个方面。

条款1.一种用于使用受试者的医学成像数据表征血管周区域的方法,所述方法包括使用所述医学成像数据计算所述血管周区域的放射组学标签的值;

其中所述放射组学标签是基于所述血管周区域的至少两个放射组学特征的经测量的值来计算的,所述至少两个放射组学特征的所述经测量的值是根据所述医学成像数据计算的。

条款2.根据条款1所述的方法,其中所述至少两个放射组学特征选自聚类1到9的所述放射组学特征,其中所述至少两个放射组学特征各自选自不同的聚类,其中:

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和、联合平均值和高灰度区域优势组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、第90个百分位数LLL、中值LLL、峰度LLL和中值组成;

聚类3由游程熵、依赖性熵LLL、依赖性熵、区域熵LLL、游程熵LLL和均值LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势、小依赖性低灰度优势、灰度方差LLL(GLSZM)、灰度方差(GLDM)、方差、灰度方差(GLDM)、差异方差LLL、灰度方差LLL(GLRLM)、方差LLL、灰度方差LLL(GLDM)、平方和、对比度LLL、平均绝对偏差、四分位距、稳健平均绝对偏差、长游程低灰度优势、差异方差、灰度方差(GLSZM)、归一化逆差矩、平均绝对偏差LLL、平方和LLL和对比度组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)、归一化灰度不均匀度LLL(GLRLM)、和熵、联合能量、熵、归一化灰度不均匀度(GLDM)、联合能量、归一化灰度不均匀度LLL(GLDM)、均匀度LLL、和熵LLL和均匀度组成;

聚类6由区域熵HHH、归一化大小区域不均匀度HHH和小面积优势HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL、粗糙度LLH、粗糙度HHH、粗糙度HLH、粗糙度HHL和粗糙度LHH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL、第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL、大小区域不均匀度、能量HLL、游程长度不均匀度LHH、大小区域不均匀度HLL、灰度不均匀度LLH(GLSZM)、灰度不均匀度LHL(GLSZM)、灰度不均匀度LLL(GLSZM)、游程长度不均匀度HLL、灰度不均匀度HLH(GLSZM)、灰度不均匀度HHL(GLSZM)、游程长度不均匀度和游程长度不均匀度HHH组成。

条款3.根据条款2所述的方法,其中

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和以及联合平均值组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、第90个百分位数LLL、中值LLL和峰度LLL组成;

聚类3由游程熵、依赖性熵LLL、依赖性熵和区域熵LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势、小依赖性低灰度优势、灰度方差LLL(GLSZM)、灰度方差(GLDM)、方差、灰度方差(GLDM)和差异方差LLL组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)和归一化灰度不均匀度LLL(GLRLM)组成;

聚类6由区域熵HHH和归一化大小区域不均匀度HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL、粗糙度LLH和粗糙度HHH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL、大小区域不均匀度、能量HLL、游程长度不均匀度LHH、大小区域不均匀度HLL、灰度不均匀度LLH(GLSZM)和灰度不均匀度LHL(GLSZM)组成。

条款4.根据条款2所述的方法,其中

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势、自相关、平均值和以及联合平均值组成;

聚类2由偏度、偏度LLL、峰度和第90个百分位数组成;

聚类3由游程熵、依赖性熵LLL和依赖性熵组成;

聚类4由小面积低灰度优势、低灰度区域优势、短游程低灰度优势、低灰度游程优势、低灰度优势和小依赖性低灰度优势组成;

聚类5由区域熵和归一化灰度不均匀度(GLRLM)组成;

聚类6由区域熵HHH组成;

聚类7由强度、粗糙度HLL、粗糙度、粗糙度LHL、粗糙度LLL和粗糙度LLH组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL、游程长度不均匀度LHL、依赖性不均匀度LHL、依赖性不均匀度、游程长度不均匀度HLH、繁忙度、游程长度不均匀度LLH、依赖性不均匀度LLH、依赖性不均匀度LLL和大小区域不均匀度组成。

条款5.根据条款2所述的方法,其中

聚类1由短游程高灰度优势、高灰度优势、高灰度游程优势和自相关组成;

聚类2由偏度和偏度LLL组成;

聚类3由游程熵和依赖性熵LLL组成;

聚类4由小面积低灰度优势和低灰度区域优势组成;

聚类5由区域熵组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差、和熵、四分位距、聚类突出度LLL、熵LLL、第10个百分位数LLL和第10个百分位数组成;并且

聚类9由大小区域不均匀度LLL、依赖性不均匀度HLL、灰度不均匀度HLL(GLSZM)、灰度不均匀度(GLSZM)、游程长度不均匀度HHL和游程长度不均匀度LHL组成。

条款6.根据条款2所述的方法,其中

聚类1由短游程高灰度优势、高灰度优势和高灰度游程优势组成;

聚类2由偏度和偏度LLL组成;

聚类3由游程熵组成;

聚类4由小面积低灰度优势和低灰度区域优势组成;

聚类5由区域熵组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平方和LLL、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、灰度方差(GLRLM)、稳健平均绝对偏差LLL、灰度方差(GLDM)、方差、平均绝对偏差、聚类突出度、和熵LLL、四分位距LLL、灰度方差LLL(GLSZM)、平方和、稳健平均绝对偏差以及和熵组成;并且

聚类9由大小区域不均匀度LLL组成。

条款7.根据条款2所述的方法,其中

聚类1由短游程高灰度优势、高灰度优势和高灰度游程优势组成;

聚类2由偏度、偏度LLL、峰度、第90个百分位数、中值LLL、峰度LLL和中值组成;

聚类3由游程熵、游程熵LLL和中值LLL组成;

聚类4由小面积低灰度优势、低灰度区域优势和灰度方差(GLSZM)组成;

聚类5由区域熵、归一化灰度不均匀度(GLRLM)和均匀度组成;

聚类6由区域熵HHH组成;

聚类7由强度组成;

聚类8由聚类倾向性LLL、聚类倾向性、平均绝对偏差LLL、灰度方差LLL(GLDM)、方差LLL、灰度方差LLL(GLRLM)、稳健平均绝对偏差LLL、灰度方差LLL(GLSZM)、四分位距LLL、和熵LLL、灰度方差(GLRLM)、方差、灰度方差(GLDM)、平均绝对偏差、和熵、稳健平均绝对偏差、四分位距、熵LLL、第10个百分位数LLL、第10个百分位数、熵、均匀度LLL、归一化灰度不均匀度LLL(GLDM)、归一化灰度不均匀度LLL(GLRLM)、均方根、归一化灰度不均匀度(GLDM)、均方根LLL和长游程低灰度优势组成;并且

聚类9由大小区域不均匀度LLL、繁忙度和大小区域不均匀度组成。

条款8.根据条款1所述的方法,其中所述至少两个放射组学特征选自以下:中值LLL、均值LLL、中值、均方根LLL、均值、峰度、均方根、游程熵LLL(GLRLM)、均匀度、第90个百分位数、归一化灰度不均匀度(GLRLM)、均匀度LLL、偏度、归一化灰度不均匀度LLL(GLRLM)、第10个百分位数LLL、偏度LLL、第10个百分位数、熵、四分位距LLL、稳健平均绝对偏差LLL、游程熵(GLRLM)、四分位距、和熵(GLCM)、归一化灰度不均匀度LLL(GLRLM)、依赖性不均匀度LHL(GLDM)、峰度LLL、游程长度不均匀度HHL(GLRLM)、熵LLL、稳健平均绝对偏差、和熵LLL(GLCM)、第90个百分位数LLL、游程熵HHL(GLRLM)、能量、能量LLL、强度(NGTDM)、自相关(GLCM)、平均绝对偏差LLL、高灰度优势(GLDM)、联合平均值(GLCM)、平均值和(GLCM)、短游程高灰度优势(GLRLM)、能量HHH、高灰度游程优势(GLRLM)、游程熵HHH(GLRLM)、能量HHL和平均绝对偏差。

条款9.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到8的所述放射组学特征。

条款10.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到7的所述放射组学特征。

条款11.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到6的所述放射组学特征。

条款12.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到5的所述放射组学特征。

条款13.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到4的所述放射组学特征。

条款14.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1到3的所述放射组学特征。

条款15.根据条款2到7中任一项所述的方法,其中所述至少两个放射组学特征选自聚类1和2的所述放射组学特征。

条款16.根据条款1到14中任一项所述的方法,其中所述至少两个放射组学特征包括至少三个放射组学特征。

条款17.根据条款1到13中任一项所述的方法,其中所述至少两个放射组学特征包括至少四个放射组学特征。

条款18.根据条款1到12中任一项所述的方法,其中所述至少两个放射组学特征包括至少五个放射组学特征。

条款19.根据条款1到11中任一项所述的方法,其中所述至少两个放射组学特征包括至少六个放射组学特征。

条款20.根据条款1到10中任一项所述的方法,其中所述至少两个放射组学特征包括至少七个放射组学特征。

条款21.根据条款1到9中任一项所述的方法,其中所述至少两个放射组学特征包括至少八个放射组学特征。

条款22.根据条款1到8中任一项所述的方法,其中所述至少两个放射组学特征包括至少九个放射组学特征。

条款23.根据条款1所述的方法,其中所述至少两个放射组学特征包括至少六个放射组学特征,其中所述六个放射组学特征是短游程高灰度优势、偏度、游程熵、小面积低灰度优势、区域熵HHH和区域熵。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号