首页> 中国专利> 一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法

一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法

摘要

本发明适用于医学临床乳腺癌诊断与术中检测技术领域,提供了一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:步骤一、获取乳腺组织样品;步骤二、测量组织拉曼光谱;步骤三、组织拉曼光谱预处理;步骤四、获取光谱特征差异信息;步骤五、利用所获差异化拉曼光谱信息对乳腺癌进行分期和分级。本发明中的一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,结合大量临床验证性前期研究,提出广义判别分析、主成分分析-支持向量机和主成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。

著录项

  • 公开/公告号CN114923893A

    专利类型发明专利

  • 公开/公告日2022-08-19

    原文格式PDF

  • 申请/专利权人 西北大学;

    申请/专利号CN202210622396.8

  • 申请日2022-06-02

  • 分类号G01N21/65(2006.01);G01N1/28(2006.01);G01N1/06(2006.01);G06K9/62(2022.01);G16H70/60(2018.01);

  • 代理机构北京中创博腾知识产权代理事务所(普通合伙) 11636;

  • 代理人李梅

  • 地址 710127 陕西省西安市长安区郭杜教育科技产业区学府大道一号

  • 入库时间 2023-06-19 16:26:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-06

    实质审查的生效 IPC(主分类):G01N21/65 专利申请号:2022106223968 申请日:20220602

    实质审查的生效

说明书

技术领域

本发明属于医学临床乳腺癌诊断与术中检测技术领域,尤其涉及一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法。

背景技术

乳腺癌是世界上最常见的恶性肿瘤,也是威胁我国女性健康的常见恶性疾病之一。2019年最新全国最新癌症报告显示,在2015年度我国乳腺癌新发病例约30.4万例,是女性癌症发病率第一,占所有癌症发病率的16.51%,而在全球范围,乳腺癌更占女性所有癌症发病率的30%;在新发病例中,约有7.4万人死于乳腺癌,是女性癌症死亡率第五位,占所有癌症死亡率7.82%,而在全球范围,乳腺癌更占女性所有癌症死亡率的15%。

现有技术基于病理荧光染色与标记分析方法的乳腺癌TNM分期、分级方法,整个病理切片分析过程需要大量时间,且其准确度常常受到医生经验和病变组织典型性等因素制约,极大地降低了临床诊疗效率。导致这样的缺点的原因是,病理切片制备、分析、诊断过程有较多的人为主观因素参与,且主要从组织结构特征方面进行判别诊断,缺乏客观、量化的组织成分信息。

已有技术采用拉曼光谱分析手段仅能实现健康组织、良性癌变与恶性癌变的鉴别分析,即仅能实现乳腺癌病理分型,尚无法实现基于TNM系统的乳腺癌精准分期、分级。导致这一缺点的原因是,缺乏成熟的数据分析手段与实验检测手段。

因此,针对以上现状,迫切需要开发一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,以克服当前实际应用中的不足。

发明内容

针对现有技术存在的不足,本发明实施例的目的在于提供一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,以解决上述背景技术中的问题。

为实现上述目的,本发明提供如下技术方案:

一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:

步骤一、获取乳腺组织样品:通过临床保乳手术、组织病理活检和组织冰冻切片,得到乳腺组织样品;

步骤二、测量组织拉曼光谱:通过拉曼光谱检测装置所使用的激发激光经二向色镜发射后,被凸透镜汇聚于乳腺组织上,在组织表面与内部激发出光谱信息,光谱信息透过二向色镜后被光纤束结构收集,并由光谱仪记录分析;

步骤三、组织拉曼光谱预处理:通过光谱范围选择、去除荧光背景、光谱曲线下面积校准以及光谱平滑的方法,完成测量光谱荧光背景去除、光谱曲线平滑与归一化等预处理操作;

步骤四、获取光谱特征差异信息:明确健康乳腺组织与浸润性导管癌组织所具有的光谱特征,并提出不同分期、分级条件下,浸润性导管癌组织所含有的色氨酸、苯丙氨酸、β-类胡萝卜素、脂质、核酸、蛋白质和脂肪酸生物标志物的光谱特征差异;

步骤五、结合所获拉曼光谱信息对乳腺癌样品进行病理分期和分级:通过广义判别分析算法、主成分分析-支持向量机和主成分分析-线性判别分析算法,实现乳腺癌TNM分期和分级并对其应用效力进行了对比分析。

作为本发明进一步的技术方案,在步骤二中,拉曼光谱检测装置包括装置体、光谱仪、光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜、光纤输出准直器和半导体激光器,所述光纤耦合镜、长通滤波片、带通滤波片、二向色镜、平凸透镜和光纤输出准直器均设置在装置体内,装置体的两端分别与光谱仪和半导体激光器采用光纤束与光纤连接。

作为本发明进一步的技术方案,在步骤二中,光纤束结构为一个圆形转线性排列的光纤阵列结构,其圆形排布面为光谱采集端,其线性排布面连接至光谱仪,光纤束线性排布面的尺寸以及光纤束所含光纤的数量,可根据光谱仪CCD像元排布进行设计。

作为本发明进一步的技术方案,在步骤五中,广义判别分析算法的使用步骤如下:

步骤一、利用广义判别分析算法,对健康乳腺组织与浸润性导管癌组织的光谱特征进行归类和鉴别;

步骤二、利用广义判别分析算法,归类与鉴别不同分期浸润性导管癌组织差异化光谱信息;

步骤三、利用广义判别分析算法,针对同期条件下不同级的浸润性导管癌组织差异化光谱信息进行鉴别。

作为本发明进一步的技术方案,在步骤五中,采用后验概率方法对基于广义判别分析算法的乳腺癌分期和分级准确性进行量化评价。

作为本发明进一步的技术方案,在步骤五中,主成分分析-支持向量机包括RBF、多项式和线性三种内核的拉曼光谱分期和分级方法,主成分分析-支持向量机的使用步骤如下:

步骤一、利用主成分分析方法对光谱数据集进行降维并提取主要的差异特征信息,获取最显著特征变量PC1和PC2输入至SVM的算法;

步骤二、利用网格搜索方法结合交叉验证从训练集光谱中确定RBF、多项式和线性三种内核的最优参数,认定分类精度最高的参数作为构建最终SVM模型的最佳参数;

步骤三、将所建模型应用于验证测试集数据,验证模型的分类性能。

作为本发明进一步的技术方案,训练集光谱占光谱数据总量的80%,测试集数据占光谱数据总量的20%,训练集与测试集的划分比率根据样品量大小进行调整。

作为本发明进一步的技术方案,在步骤五中,主成分分析-线性判别分析算法的使用步骤如下:

步骤一、通过主成分分析方法降低光谱数据集的维度,并且结合单因素方差分析,提取和识别显著差异主成分信息;

步骤二、将提取的显著差异主成分信息作为线性判别函数的输入变量,生成PCA-LDA光谱病理鉴别模型;

步骤三、利用模型对健康乳腺组织与不同TNM分期分级浸润性导管癌组织的光谱特征进行归类和判别。

与现有技术相比,本发明的有益效果是:

1)本发明首先提出一种简易化的共聚焦拉曼光谱检测装置,采用785nm激光、光纤束、光谱仪等核心元器件,实现临床保乳手术中切除的组织、组织病理活检所采集的组织、乳腺组织冰冻病理切片等各类样品的拉曼光谱信息高效采集;

2)本发明提出采用上述共聚焦拉曼光谱检测装置,快速检测临床保乳手术中切除的组织、组织病理活检所采集的组织、乳腺组织冰冻病理切片等各类样品所含脂肪酸、蛋白质、胡萝卜素、血红蛋白和核酸等生物标志物光谱特征信息;

3)本发明提出建立了基于广义判别分析、提出基于三种运算内核的主成分分析-支持向量机以及提出基于主成分分析-线性判别分析,实现基于拉曼光谱信息的乳腺癌病理分期、分级。

结合大量临床验证性前期研究,归纳分析,提出广义判别分析、主成分分析-支持向量机和成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。

为更清楚地阐述本发明的结构特征和功效,下面结合附图与具体实施例来对本发明进行详细说明。

附图说明

图1为本发明实施例提供的无损免标记快速乳腺癌拉曼光谱病理分级分期方法的工作流程图。

图2为本发明实施例提供的简易化的光谱检测装置对光谱检测的光路图。

图3为本发明实施例提供的健康组、浸润性乳腺癌一期、二期和三期的归一化平均拉曼光谱图及差谱图。

图4为本发明实施例提供的主要拉曼特征峰的强度统计图。

图5为本发明实施例提供的广义判别分析算法病理判别模型对比图。

图6为本发明实施例提供的基于广义判别分析算法的后验概率值对比图。

图7为本发明实施例提供的基于RBF、多项式和线性三种内核的PCA-SVM模型对比图。

图8为本发明实施例提供的健康、一期、二期和三期的PCA-LDA分数散点图。

附图标记:1-装置体,2-光谱仪,3-光纤耦合镜,4-长通滤波器,5-带通滤波器,6-二向平镜,7-平凸透镜,8-光纤输出准直器,9-半导体激光器。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述。

实施例1

如图1所示,作为本发明一个实施例提供的一种无损免标记快速乳腺癌拉曼光谱病理分级分期方法,包括如下步骤:

步骤一、获取乳腺组织样品:通过临床保乳手术、组织病理活检和组织冰冻切片,得到乳腺组织样品;

步骤二、测量组织拉曼光谱:通过拉曼光谱检测装置所使用的激发激光经二向色镜反射后,被凸透镜汇聚于乳腺组织上,在组织表面与内部激发出光谱信息,光谱信息透过二向色镜后被光纤束结构收集,并由光谱仪记录分析;

步骤三、组织拉曼光谱预处理:通过光谱范围选择、去除荧光背景、光谱曲线下面积校准以及光谱平滑的方法,完成测量光谱荧光背景去除、光谱曲线平滑与归一化等预处理的操作;

步骤四、获取光谱特征差异信息:明确健康乳腺组织与浸润性导管癌组织所具有的光谱特征,并提出不同分期、分级条件下,浸润性导管癌组织所含有的色氨酸、苯丙氨酸、β-类胡萝卜素、脂质、核酸、蛋白质和脂肪酸生物标志物的光谱特征差异;

步骤五、所获得拉曼光谱信息对乳腺癌进行分期和分级:通过广义判别分析算法、主成分分析-支持向量机和主成分分析-线性判别分析算法,实现乳腺癌TNM分期和分级并对其应用效力进行了对比分析。

在本实施例中,结合大量临床验证性前期研究,提出广义判别分析、主成分分析-支持向量机和主成分分析-线性判别分析的光谱分析手段,应用于不同乳腺癌病变组织拉曼光谱数据的归类和鉴别,挖掘组织病理状态所包含的统计学光谱信息,实现基于拉曼光谱检测技术的乳腺癌病理分期和分级。

如图2所示,作为本发明的一种优选实施例,在步骤二中,拉曼光谱检测装置包括装置体1、光谱仪2、光纤耦合镜3、长通滤波片4、带通滤波片5、二向色镜6、平凸透镜7、光纤输出准直器8和半导体激光器9,所述光纤耦合镜3、长通滤波片4、带通滤波片5、二向色镜6、平凸透镜7和光纤输出准直器8均设置在装置体1内,装置体1的两端分别与光谱仪2和半导体激光器9利用光纤结构连接。

如图2所示,作为本发明的一种优选实施例,在步骤二中,光纤束结构为一个圆形转线性排列的光纤阵列结构,其圆形排布面为光谱采集端,其线性排布面连接至光谱仪2,光纤束线性排布面的尺寸以及光纤束所含光纤的数量与直径,可根据光谱仪2CCD像元排布进行设计。

如图2所示,作为本发明的一种优选实施例,采用简易化的共聚焦拉曼光谱检测系统的光路,该系统主要由光谱激发端和光谱采集端两部分组成,在光谱激发端,使用波长为785nm功率连续可调半导体激光器9作为激发光源。采用光纤耦合镜3与光束准直器8对激发光准直输出,激发光通过785nm带通滤波片5(避免激光的光谱边带分量或杂散光进入激发光路,通过二向色镜6),用石英平凸透镜7将光聚焦在乳腺生物组织上,探测到的光谱信息透过二向色镜6透射,用长通滤波片4滤掉背向杂散激光,利用石英平凸透镜7将探测光耦合进光纤束,将获取到的拉曼散射光子传输至光谱仪2,并被背感光深度制冷CCD检测到。

实施例2

作为本发明的一种优选实施例,在步骤五中,广义判别分析算法的使用步骤如下:

步骤一、利用广义判别分析算法,对健康乳腺组织与浸润性导管癌组织的光谱特征进行归类和判别;

步骤二、利用广义判别分析算法,归纳鉴别不同分期浸润性导管癌组织差异化光谱信息;

步骤三、针对同期条件下不同级的浸润性导管癌组织差异化光谱信息进行鉴别。

如图3所示,(A)为健康乳腺组织(对照组)和浸润性乳腺癌不同TNM分期{一期[StageI—SI(SIG1,SIG2和SIG3)]、二期[StageII—SII(SIIG1,SIIG2和SIIG3)]和三期[StageIII—SIII(SIIIG1,SIIIG2和SIIIG3)]}的归一化平均拉曼光谱。

结果表明光谱特征峰分布于754cm

为了比较在健康组和癌变组[一期(SI)、二期(SII)和三期(SIII)]中上述生化物质的差异,所作差谱如图1(B)中所示,差谱表明癌变组中色氨酸、核酸和蛋白质的特征峰强度较高,健康组中苯丙氨酸、β-胡萝卜素和脂质的特征峰强度较高。

如图4所示,为了进一步探索在浸润性乳腺癌不同TNM分期[一期(SI)、二期(SII)和三期(SIII)]中上述生物物质的变化规律,对754cm

如图4所示,当乳腺组织从健康病变为三期癌症时,位于754cm

实施例3

作为本发明的一种优选实施例,为了提取更可靠的与TNM分期、分级直接相关的光谱特征纤细,实现乳腺癌分期分级的判别诊断,构建了广义判别分析病理判别模型来诊断乳腺肿瘤的分期和分级。

如图5(A)所示,健康组、一期(SI)癌症和二期(SII)癌的光谱分布在第一投射方向(GD1)的负轴上但彼此分离,而三期(SIII)癌症的光谱分布在GD1正轴上。健康组和一期(SI)癌症的光谱均聚集在第二投影方向(GD2)的负轴上,而二期(SII)和三期(SIII)癌症的光谱则分布在正轴上,健康组(对照组)去除时,如图4(B)所示,一期(SI),二期(SII)和三期(SIII)癌症被GD1和GD2的零线正确地归类。

在分期结果的基础上,进一步构建了分级的广义判别分析模型。每一分期包含三个分级,如一期(SI)包括一级(Grade1、G1),二级(Grade2、G2)和三级(Grade3、G3)。一期(SI)、二期(SII)和三期(SIII)中各分级的GDA结果分别如图5(C)、(D)和(E)所示,各分级同样均被GD1和GD2准确地归类。在GD1和GD2形成的特征空间中,同类的光谱大体聚集成团,并具有良好的紧致性,且异类彼此分离。

实施例4

作为本发明的一种优选实施例,在步骤五中,采用后验概率方法对基于广义判别分析算法的乳腺癌分期和分级准确性进行量化评价。

如图6所示,同时利用广义判别分析算法进一步计算了不同TNM分期和分级的后验概率并将其表示为二维三元相图,三元图内的一个点具有总概率。

图6(A)为一期(SI)、二期(SII)和三期(SIII)癌症的后验概率,结果表明一期(SI)癌症和二期(SII)癌症的后验概分界值为0.5,三期(SIII)癌症的后验概率均接近1。

在图6(B)、(C)和(D)分别为一期(SI)、二期(SII)和三期(SIII)相对应下各分级的后验概率值。

在图6(B)(一期分级)中,一级(G1)和三级(G3)的后验概分界值为0.5,二级(G2)的后验概率值大部分接近于1。

在图6(C)(二期分级)中,一级(G1)和二级(G2)的后验概分界值为0.5,三级(G3)的后验概率值主要接近于1。

在图6(D)(三期分级)中,一级(G1)、二级(G2)和三级(G3)的后验概率均接近1。

实施例5

作为本发明的一种优选实施例,在步骤五中,主成分分析-支持向量机包括RBF、多项式和线性三种内核的拉曼光谱分期和分级方法,主成分分析-支持向量机的使用步骤如下:

步骤一、利用主成分分析方法对光谱数据集进行降维并且提取特征信息,获取最显著特征变量PC1和PC2输入至SVM的算法;

步骤二、利用网格搜索方法结合交叉验证从训练集光谱中确定RBF、多项式和线性三种内核的最优参数,认定分类精度最高的参数作为构建最终SVM模型的最佳参数;

步骤三、将所建模型应用于验证测试集数据,验证模型的分类性能。

在图7中,(A)为RBF内核PCA-SVM模型分类准确率随参数C和γ变化关系;(B)为多项式内核PCA-SVM模型分类准确率随参数C和多项式阶数d的变化关系;(C)为线性核函数PCA-SVM算法分类准确度与参数C的关系。

如图7所述,以80%实验数据为训练数据集,采用网格搜索结合LOOCV来优化每个核的参数,以观察PCA-SVM模型训练过程中不同参数对分类精度的影响。在图7(A)中,RBF内核PCA-SVM模型中参数C在2

在多项式内核时,同样需要对两个参数(参数C和多项式阶数d)进行优化。如图7(B)中所示,当C值和项式阶数d均逐渐增大时,模型的准确率也逐渐提高;其中参数C=256,多项式阶数d=5时,模型的分类准确率最高,可以达到73.33%。

对于线性核PCA-SVM模型,只需要优化一个参数C。如图7(C)中显示了分类精度与参数C的关系,当C=64时,分类准确率达到最高值25%,优化SVM算法和参数后,选择准确率最高时的参数作为最佳参数构建模型,并在测试集(其他20%光谱数据)中进行模型性能验证,结果表明:RBF核PCA-SVM模型在测试集中的总体分类准确率为80.91%,多项式核PCA-SVM模型的总体分类准确率均为73.64%,而线性核PCA-SVM模型的总体分类准确率为36.36%。

实施例6

作为本发明的一种优选实施例,在步骤五中,主成分分析-线性判别分析算法的使用步骤如下:

步骤一、通过主成分分析方法降低光谱数据集的维度,并且结合单因素方差分析,提取和识别显著差异主成分信息;

步骤二、将提取的显著差异主成分信息作为线性判别函数的输入变量,生成PCA-LDA光谱病理鉴别模型;

步骤三、利用模型对健康乳腺组织与不同TNM分期分级浸润性导管癌组织的光谱特征进行归类和判别。

如图8所示,利用主成分分析方法(PCA)降低光谱数据集的数据维度,并且结合单因素方差分析(one-way ANOVA)提取、识别显著差异主成分信息(Principal Components,PCs,P<0.01)。

将所提取的最显著主成分PCs(PC1、PC2和PC3)作为线性判别函数(LDA)的输入变量,生成PCA-LDA光谱病理鉴别模型。

如图8所示,展示了基于PCA-LDA算法散点健康、一期[SI(SIG1,SIG2和SIG3)]二期[SII(SIIG1,SIIG2和SIIG3)]和三期[SIII(SIIIG1,SIIIG2和SIIIG3)]的归类结果。结果表明健康组、一期(SI)和三期(SIII)被第一主函数和第二主函数的零线准确地区分且彼此分离,而二期(SI)介于一期(SI)和三期(SIII)间未被完全地归类诊断。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号