首页> 中国专利> 一种基于AdaBoost特征融合的鼻咽癌坏死预测方法

一种基于AdaBoost特征融合的鼻咽癌坏死预测方法

摘要

本发明公开了一种基于AdaBoost特征融合的鼻咽癌坏死预测方法,利用鼻咽癌患者核磁放射前三个模态扫描影像进行图像预处理,并且由经验医生勾画肿瘤区域作为掩膜,接下来根据这两组图像提取影像组学特征。对于剂量图像,手动提取图像中特征,联合影像组学特征进行特征筛选。最后利用以决策树为基础的模型融合方法AdaBoost对筛选特征进行模型搭建,模型测试等工作。本发明根据病人放射治疗前的影像数据及放疗计划,来预测鼻咽癌坏死情况,可修改放疗计划,使病人免于放射治疗副作用的影响;利用传统特征提取方法和传统机器学习方法,在一定程度上减少模型训练时间并且提高了结果与特征之间的可解释性。

著录项

  • 公开/公告号CN114864081A

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利权人 浙江柏视医疗科技有限公司;

    申请/专利号CN202210587145.0

  • 发明设计人 王奕然;卢山富;颜子夜;袁博;

    申请日2022-05-26

  • 分类号G16H50/20(2018.01);G16H50/30(2018.01);G16H50/80(2018.01);

  • 代理机构嘉兴启帆专利代理事务所(普通合伙) 33253;

  • 代理人林鸳

  • 地址 314000 浙江省嘉兴市经济技术开发区昌盛南路36号8幢1003室

  • 入库时间 2023-06-19 16:17:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-23

    实质审查的生效 IPC(主分类):G16H50/20 专利申请号:2022105871450 申请日:20220526

    实质审查的生效

  • 2022-08-05

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及鼻咽癌坏死预测技术领域,特别涉及一种基于AdaBoost特征融合的鼻咽癌坏死预测方法。

背景技术

鼻咽癌好发于鼻咽黏膜,是一类常见的头颈部恶性肿瘤。到目前为止,放射治疗仍被认为是鼻咽癌的主要治疗方式,其原因是大部分鼻咽癌的病理类型为低分化鳞癌,对放射线具有较高的敏感性,放射治疗不仅可以达到理想的治疗效果,还保证了鼻咽部及颈部解剖结构的完整性,提高了患者的生活质量。从开展了鼻咽癌深部线放射治疗以来,经历年代放疗技术,使鼻咽癌单纯放疗的局部控制率达到。部分早期鼻咽癌患者甚至可以通过放疗达到治愈的效果。放疗前一般由物理师设计放疗计划,临床医生根据放疗计划,对病人进行放射治疗;由于受到肿瘤属性、物理师经验水准、病人自身情况等多因素影响,部分病人在接受放射治疗后会出现肿瘤区域坏死情况。

磁共振在鼻咽癌病灶的检测、疗效的评价、临床分期和预测等方面一直以来都发挥着重要的作用。传统的基于形态的MRI对鼻咽癌治疗效果的早期预测几乎没有帮助。随着影像组学概念的提出,从医学影像中,通过自动化且可重复的分析方法,高通量地提取出定量特征,以捕获肿瘤内的异质性,例如基因、蛋白质、细胞、微环境、组织和器官。将这些特征与临床信息联系起来,用于建立描述和预测模型,而这些包括生物或医学数据的模型可以提供有价值的诊断、预后或预测信息。影像组学的方法提供了一种非侵入性(因此没有感染或伴随组织活检并发症的风险)、快速、低成本和可重复的表型信息调查方法,将海量的、肉眼无法辨别的影像信息,量化成可分析、可辨别的、反映肿瘤病理生理学差异性的影像学特征,终极目标是通过将影像学特征纳入治疗结果预测模型,提供准确的风险分层,潜在地加速了个性化医学的发展。鉴于鼻咽癌放疗坏死并不仅由肿瘤本身特性影响,因此仅基于组学特征难以做到很好的预测。

发明内容

为了解决上述问题,本发明提供了一种基于AdaBoost特征融合的鼻咽癌坏死预测方法,结合病人MRI影像信息和放疗剂量来预测病人放疗坏死的概率,从而及时修改放射计划,避免人为原因造成放疗照射坏死。

为此,本发明的技术方案是:一种基于AdaBoost特征融合的鼻咽癌坏死预测方法,包括以下步骤:

1)医学影像图像预处理:分别获取病人的MRI多模态数据T1、T1C、T2,再由医生手动分割出肿瘤区域;并对MR图像进行N4偏置场纠正;

2)影像组学特征提取:利用python pyradiomics程序库对步骤1)中得到的多模态数据及肿瘤区域提取影像组学特征;

3)多模态组学特征选择:分别对三个模态数据提取到的影像组学特征进行特征参数相关性计算,筛选出相关系数低的特征,并将筛选出的多模态特征进行拼接融合,作为病人组学特征;对每个特征下的所有病例进行归一化处理;

4)剂量特征提取:剂量特征表现为扫描图像,剂量影像切片像素值求和,以每个病例为单位计算其统计值;

5)特征融合:将步骤3)得到的组学特征和步骤4)得到的剂量特征拼接融合,并对所有特征进行归一化处理;

6)模型搭建:将步骤5)融合后的所有数据送入以决策树分类器为基础的AdaBoost分类器进行二分类;单分类器是决策树,增强组合算法是Adaboost算法;

7)利用交叉验证计算auc指标;

8)多次重复步骤6)~7),比较测试结果,得出病人以该剂量数据进行化疗后的坏死概率。

优选地,所述步骤3)中影像组学特征先进行Lasso正则化算法筛选出具有线性关系的特征,再进行相关性计算。

优选地,计算特征间两两相关性时,如其相关性高于设定的临界值,则这两组特征关联度较高,选择过滤掉其中一个特征,此特征与其他所有特征相关性均值高于被保留的另一个特征。

优选地,所述步骤4)具体步骤如下:

i)根据灰度值计算每张影像切片下的总像素值;

ii)对每个病例下所有切片计算其均值、中间值、最大值、最小值;

iii)利用相关性筛选剂量特征并进行归一化处理。

优选地,分析步骤8)得出的坏死概率,若坏死概率低,则按照医生制定的剂量数据进行放疗;若坏死概率高,则医生修改放疗剂量数据,重复步骤4)~8),直至得到的坏死概率降低,按照坏死概率低的剂量数据进行放疗。

与现有技术相比,本发明的有益效果是:根据病人放射治疗前的影像数据及放疗计划,得出组学特征与剂量特征,通过两者的特征融合来预测鼻咽癌坏死情况;利用传统特征提取方法和传统机器学习方法,在一定程度上减少模型训练时间并且提高了结果与特征之间的可解释性;医生可根据预测的坏死情况来修改放疗计划,在一定程度上使得病人免于放射治疗副作用的影响,保护病人的身体健康。

附图说明

以下结合附图和本发明的实施方式来作进一步详细说明

图1为本发明的流程框图。

具体实施方式

参见附图。本实施例所述基于AdaBoost特征融合的鼻咽癌坏死预测方法,利用鼻咽癌患者核磁放射前三个模态(T1,T1C,T2)扫描影像进行图像预处理,并且由经验医生勾画肿瘤ROI区域作为掩膜,接下来根据这两组图像提取影像组学特征。对于剂量图像,手动提取图像中特征,联合影像组学特征进行特征筛选。最后利用以决策树为基础的模型融合方法AdaBoost对筛选特征进行模型搭建,模型测试等工作。

具体包括以下步骤:

1)医学影像图像预处理:

i)分别获取病人的MRI多模态数据T1、T1C、T2;在MRI成像的过程中,通过改变MR信号的影响因素,可以得到不同的影像,这些不同的影像就称之为序列。如根据T1值加权,可得T1序列,根据T2值加权可得T2序列。一个病例可以有多个序列,每个序列由许多切片组成。T1序列主要用于观察解剖结构,T2序列用于确定病变部位信息,T1C序列用于观察肿瘤内部情况,鉴别肿瘤与非肿瘤性病变。

ii)由医生手动分割出肿瘤区域(ROI);在影像上把肿瘤或者部分肿瘤当做我们感兴趣的区域,给勾画出来,即为肿瘤ROI区域。

iii)对MR图像进行N4偏置场纠正;在同一组织内,MR图像上的亮度差异,强度值(从黑色到白色)。这是一种低频平滑的不良信号,会破坏MR图像。偏置场导致MRI机器的磁场中的不均匀性。如果未校正偏置字段将导致所有成像处理算法输出不正确的结果,所以在进行分割或分类之前,需要预处理步骤来校正偏置场的影响。

2)影像组学特征提取:利用python pyradiomics程序库对步骤1)中得到的多模态数据及肿瘤区域提取影像组学特征;在pyradiomics程序库中提供了许多可以使用的滤波器,可以使用原始图像及经过各种滤波器之后的图像;然后可以指定所要提取的特征,例如形状特征、一阶特征、纹理特征等。

3)多模态组学特征选择:分别对三个模态数据提取到的影像组学特征进行特征参数相关性计算,先进行Lasso正则化算法筛选出具有线性关系的特征,再进行相关性计算,筛选出相关系数低的多个特征,并将筛选出的多模态特征合并为病人组学特征;对每个特征下的所有病例进行归一化处理;

由于特征维度庞大且大部分互有关联性,我们利用Lasso正则化手段对已有特征中和坏死表现出线性关系的特征进行筛选,然后再计算特征间两两相关性,

如其相关性高于设定的临界值,则这两组特征关联度较高,因此我们选择过滤掉其中一个特征,此特征与其他所有特征相关性均值高于被保留的另一个特征。此项操作最大程度上保留了有效信息,并且过滤了冗余信息。

数据的归一化处理就是将数据统一映射到[0,1]区间上。

4)剂量特征提取:剂量特征表现为扫描图像,剂量影像切片像素值求和,以每个病例为单位计算其均值、中间值、最大值和最小值;利用相关性筛选剂量特征并进行归一化处理;

5)特征融合:将步骤3)得到的组学特征和步骤4)得到的剂量特征拼接融合,并对所有特征进行归一化处理;特征融合就是将组学特征集和剂量特征集合并,形成一个大特征集,然后对这个大特征集内的数据进行归一化处理;

6)模型搭建:将步骤5)融合后的所有数据送入以决策树分类器为基础的AdaBoost分类器进行二分类;单分类器是决策树,增强组合算法是Adaboost算法;

AdaBoost的运行过程:训练数据集的每一个样本,应赋予一个权重,这些权重构成一个向量D,一开始,这些权重都初始化为相等的值,首先在训练数据集上训练出一个弱分类器并计算该分类器的错误率,然后在同一数据集上再次训练弱分类器,但是在第二次训练时,将会根据分类器的错误率,对数据集中样本的各个权重进行调整,分类正确的样本的权重降低,而分类错的样本权重则上升,但这些权重的总和保持不变为1。AdaBoost为每个分类器分配一个权重值alpha,这些alpha的值是基于每个弱分类的错误率进行计算的。

单层决策树,就是只依靠一个特征对数据集进行分类。那么为了找到最好的特征,所以第一层循环就是遍历每个特征。在某一特征中,定义一个阈值,通过这个阈值,将大于这个阈值分为一类,小于阈值的分为另一类。这个阈值定义时,从最小值开始逐步加上一个步长直到最大值为止,所有第二层循环是对每个步长进行循环,寻找最好的阈值。在某一阈值下,是大于阈值归为1,还是小于阈值归为1呢?都要尝试一下以寻找最高的正确率,所以第三层循环就是对每个不等号进行循环。

7)利用交叉验证计算auc指标;

8)多次重复步骤6)~7),比较测试结果,得出病人以该剂量数据进行化疗后的坏死概率。预测结果是0-1的概率,结果的好坏基于概率得到的auc指标。

分析步骤8)得出的坏死概率,若坏死概率低,则按照医生制定的剂量数据进行放疗;若坏死概率高,则医生修改放疗剂量数据,重复步骤4)~8),直至得到的坏死概率降低,按照坏死概率低的剂量数据进行放疗。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号