首页> 中国专利> 基于深度学习的KI67指数分析方法

基于深度学习的KI67指数分析方法

摘要

本发明涉及基于深度学习的KI67指数分析方法,包括:S10,获取数字化病理全场图,作为原始病理全场图;S20,将所述原始病理全场图分为感兴趣区域和不感兴趣区域;S30,过滤原始病理全场图中的不感兴趣区域,对剩余的感兴趣区域的所有细胞进行语义分割,分割出细胞核的中心位置;S40,确定所述细胞核所属细胞类别,所述细胞类别包括肿瘤细胞和正常细胞,具体包括阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞以及阴性正常细胞;S50,根据阳性肿瘤细胞和肿瘤细胞总数计算KI67指数。本发明提出在图像中以不同颜色的标记点将阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞、阴性正常细胞的细胞核标记出来,通过深度学习建立细胞分类模型,大大提升了KI67指数的准确率。

著录项

  • 公开/公告号CN112215790A

    专利类型发明专利

  • 公开/公告日2021-01-12

    原文格式PDF

  • 申请/专利权人 杭州迪英加科技有限公司;

    申请/专利号CN201910548431.4

  • 申请日2019-06-24

  • 分类号G06T7/00(20170101);G06T7/11(20170101);G06T7/73(20170101);

  • 代理机构11486 北京博维知识产权代理事务所(特殊普通合伙);

  • 代理人张倩

  • 地址 311121 浙江省杭州市余杭区仓前街道龙潭路7号杭州未来研创园B座5楼B501-B508室

  • 入库时间 2023-06-19 09:30:39

说明书

技术领域

本发明涉及细胞检测领域,特别是涉及一种基于深度学习的KI67指数分析方法。

背景技术

在多种肿瘤的诊断中,如乳腺癌,卵槽癌,胃癌,结直肠癌等,都会涉及到有丝分裂指数的考察,而KI67是一种编码蛋白质,该蛋白质与细胞的增值密切相关,在有丝分裂以及分裂期的细胞(G1, S, G2, M期)中都能检测出KI67蛋白质,有丝分裂停止的细胞(G0期)中则无KI67蛋白质的存在。所以KI67指数在很多肿瘤病理中被当做是判断肿瘤细胞增殖情况的一个指标,KI67指数越高,说明肿瘤细胞增殖越快。KI67指数一般被用于肿瘤分级,评估患者预后和判断患者化疗是否敏感等。但是并不是所有KI67强表达的细胞都是肿瘤细胞,增殖活性较大的细胞如干细胞,母细胞等也会强表达,而有些增殖较慢的肿瘤细胞也不是KI67强表达。目前主流的分析方法是使用图像处理方法根据细胞核染色不同将细胞分为阴阳性,并对两种细胞进行计数,然而这种方法无法准确检测出呈阳性的正常细胞核和呈阴性的肿瘤细胞,使得得到的KI67指标不准确,继而影响肿瘤判断结果的准确性。

发明内容

本发明的一个目的在于针对传统方法无法准确检测出呈阳性的正常细胞核和呈阴性的肿瘤细胞,使得根据KI67指标计算不准确的问题,本发明提供了一种深度学习的KI67指数分析方法。

本发明通过以下技术方案来实现上述目的:基于深度学习的KI67指数分析方法,包括:S10,获取数字化病理全场图,作为原始病理全场图;S20,将所述原始病理全场图分为感兴趣区域和不感兴趣区域;S30,过滤原始病理全场图中的不感兴趣区域,对剩余的感兴趣区域的所有细胞进行语义分割,分割出细胞核的中心位置;S40,确定所述细胞核所属细胞类别,所述细胞类别包括肿瘤细胞和正常细胞,具体包括阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞以及阴性正常细胞;S50,根据阳性肿瘤细胞和肿瘤细胞总数计算KI67指数。

进一步地,步骤S20具体包括:读入原始病理全场图,从原始病理全场图上逐个截取n*n大小的图像区域,n为像素值;将所述图像区域输入区域过滤模型,区域过滤模型输出所输入图像区域的属性,所述图像区域的属性包括感兴趣区域或不感兴趣区域。

进一步地,所述区域过滤模型的获得包括:S201,获取一定数量的标注为感兴趣区域的图片和标注为不感兴趣区域的图片作为样本数据,样本数据大小与所述图像区域大小相同;S202,对所述样本数据进行数据增强和归一化处理;S203,将处理后的图片作为神经网络模型的输入,训练获得区域过滤模型。

进一步地,步骤S30具体包括:过滤原始病理全场图中的不感兴趣区域,对剩余的感兴趣区域,使用滑动窗口逐个截取n*n大小的小图并转化为灰度图,作为语义分割神经网络模型的输入图像;语义分割神经网络模型为每一张输入图像生成对应的特征概率矩阵,并从生成的特征概率矩阵中找出所有极大值点,极大值点的位置就是检测到的细胞核的中心位置。

进一步地,步骤S40具体包括:以所述细胞核的中心位置为中心截取w*w大小的图像片段,即为细胞核,w为像素值;将所述图像片段输入细胞分类模型中,细胞分类模型输出细胞类别;将所述细胞核的中心位置和对应的细胞类别记录在检测列表中,并统计阳性肿瘤细胞的个数和所有肿瘤细胞的个数。

进一步地,所述细胞分类模型的获得包括:分别获取一定数量的阳性肿瘤细胞图片、阳性正常细胞图片、阴性肿瘤细胞图片以及阴性正常细胞图片;以图片中细胞核的中心位置为中心,截取w*w大小的小图片;以截取的小图片作为训练样本,输入到神经网络模型,训练得到细胞分类模型。

进一步地,所述阳性肿瘤细胞图片、阳性正常细胞图片、阴性肿瘤细胞图片以及阴性正常细胞图片的获取步骤包括:从各种标注有阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞以及阴性正常细胞的图片中,以细胞核的中心像素点为中心截取m*m大小的图片,m为像素值,w

进一步地,步骤S50所述KI67指数为阳性肿瘤细胞的个数除以所有肿瘤细胞的个数。

与现有技术相比,本发明的实质性效果如下:本发明提出的KI67指数分析方法在图像中以不同颜色的标记点将阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞、阴性正常细胞的细胞核标记出来,通过深度学习建立细胞分类模型,实现准确,高效,稳定的细胞定位、分类和计数,一方面大大提升了KI67指数的准确率;另一方面可以帮助医生诊断或是研究分析组织病理的相关特征,提升工作效率。

附图说明

图1是本发明KI67指数分析方法的流程图。

具体实施方式

下面结合附图对本发明作进一步说明:

基于深度学习的KI67指数分析方法,如图1所示,包括以下步骤:

S10,获取放大倍数为20倍或者40倍放入数字化病理全场图,作为原始病理全场图,这里可以通过扫描仪对病理切片进行扫描获取,在全场图片中选择有代表性的区域进行截图,对截取的图片上的细胞核进行穷尽标注,图片中的细胞可以分为四类:阳性癌细胞、阳性正常细胞、阴性癌细胞、阴性正常细胞, 标注时采用不同颜色的画笔在不同类的细胞核中心画点标注。

S20,区域检测:从较为低倍的视野中例如2倍读入原始病理全场图,使用滑动窗口法从全场图上逐个截取一定大小如256x256的区域作为区域检测网络的输入图像,模型会预测该输入图像为0(不感兴趣区域)或者1(感兴趣区域),将这一信息记录在列表里,后续分析即不再处理不感兴趣的区域,此举可以过滤掉绝大部分无效区域,提升算法的效率和速度。当然医生也可以对指定区域进行KI67指数分析,如果医生指定了区域,则会自动跳过此区域检测过程。在病理全场图里,有相当大的一部分区域都是医生不感兴趣的区域,例如空白区域,区域过滤模型在比较低倍的视野对每张图做一个二分类,用来将不感兴趣的区域过滤掉。

区域过滤模型的获得包括:

S201,获取一定数量的标注为感兴趣区域的图片和标注为空白区域的图片作为样本数据,样本数据与所述图像区域大小相同;

S202,对所述样本数据进行数据增强和归一化处理;具体地,对样本数据进行随机旋转,翻转,在一定范围内对图片进行缩放,调节亮度,对比度,饱和度,色度等进行数据增强处理,再从样本数据中央截取大小为256*256的小图,最后进行归一化处理;

S203,将处理后的图片作为神经网络模型的输入,训练获得区域过滤模型,其中神经网络模型可以选择使用Inception或是ResNet等分类效果较好的网络模型,损失函数使用的是二进制交叉熵(Binary Cross Entropy),使用梯度下降(SGD)作为优化方法,在训练过程中绘制模型在训练集和验证集的准确率和validation loss, 当这两项指标不再明显变化时,模型即完成训练。

S30,细胞检测:对所述病理全场图中感兴趣区域内的所有细胞进行语义分割,分割出细胞核的中心位置。具体包括:对过滤不感兴趣区域后的原始病理全场图,使用滑动窗口逐个截取256*256或512*512大小的小图并转化为灰度图作为语义分割神经网络模型的输入图像,语义分割神经网络模型为每一张输入图像生成对应的特征概率矩阵,并从生成的特征概率矩阵中找出所有极大值点,极大值点的位置就是检测到的细胞核的中心位置。训练细胞分类模型:这个模型主要是用来进行一个四分类,将每一个细胞分为阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞、阴性正常细胞中的一种。

语义分割神经网络模型,训练过程包括:

S301:从原始病理全场图上截取一定量的图片,对这些图片上的所有细胞核进行穷尽标注,不同类型细胞核使用不同颜色画笔标注;

S302: 将标注提取出来并转换为二元掩码图,上述所截取的图片和对应的二元掩码图作为样本数据;

S303:将上述截取的图片转换为灰度图并做归一化处理, 将处理过的图片以及相应的二元掩码图进行翻转,旋转等数据增强处理;

S304:将上述处理过的图片以及二元掩码图作为训练数据输入到神经网络模型,训练得到语义分割神经网络模型,语义分割神经网络模型为Unet或类似的全卷积神经网络,采用并交比(IOU)和二元交叉熵(BCE)结合作为损失函数, 选用梯度下降法作为优化方法进行训练,绘制loss曲线,通过不定期观察神经网络生成的二元掩码图来评估语义分割效果,当loss曲线变化范围达到预设范围并且神经网络生成的二元掩码图达到预期效果时,停止训练。

S40,细胞分类:确定所述细胞核所属细胞类别,所述细胞类别包括肿瘤细胞和正常细胞,具体包括阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞以及阴性正常细胞。具体包括:以所述细胞核的中心位置为中心截取40*40大小的图像片段,将所述图像片段输入细胞分类模型中,细胞分类模型输出细胞类别,将所述细胞核的中心位置和对应的细胞类别记录在检测列表中,并统计阳性肿瘤细胞的个数和所有肿瘤细胞的个数。

细胞分类模型的获得包括:选取一定大小的切片样本进行穷尽标注,采用不同的标注方式标注出阳性肿瘤细胞、阳性正常细胞、阴性肿瘤细胞以及阴性正常细胞,以标注点为中心截取40*40大小的图片,对截取的图片进行数据增强后得到处理后的阳性肿瘤细胞图片、阳性正常细胞图片、阴性肿瘤细胞图片以及阴性正常细胞图片作为初始样本,以初始样本中细胞核的中心位置为中心,截取32*32大小的小图片,以截取的小图片作为神经网络模型的输入,训练得到细胞分类模型。细胞分类模型采用Inception网络,采用交叉熵CrossEntropy作为损失函数,选用梯度下降法作为优化方法进行训练,绘制loss曲线,并采用误差矩阵confusion matrix评估分类效果,当loss曲线变化范围达到预设范围且误差矩阵所评估的分类效果符合预期时,停止训练。

S50,根据阳性肿瘤细胞和肿瘤细胞总数计算KI67指数,KI67指数为阳性肿瘤细胞的个数除以所有肿瘤细胞的个数。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号