首页> 中国专利> 基于巴氏染色方式的DNA倍体定量分析方法及系统

基于巴氏染色方式的DNA倍体定量分析方法及系统

摘要

一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析方法及系统,对采用巴氏染色方式进行染色得到的细胞玻片扫描,对得到的细胞图像中的单个细胞采用设置的积分光密度分析模型处理,得到单个细胞的积分光密度值,采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,根据计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。其中,所述分析模型采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标训练得到的。本发明保证DNA倍体定量分析的准确性。

著录项

  • 公开/公告号CN112750493A

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利号CN202011525947.6

  • 发明设计人 杨志明;

    申请日2020-12-22

  • 分类号G16B5/00(20190101);G06T7/00(20170101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11018 北京德琦知识产权代理有限公司;

  • 代理人牛峥;王丽琴

  • 地址 100084 北京市海淀区上地信息路12号中关村发展大厦B区B203

  • 入库时间 2023-06-19 10:51:07

说明书

技术领域

本发明涉及医学细胞图像处理技术,特别涉及一种基于巴氏染色方式的细胞图像进行脱氧核糖核酸(DNA)倍体定量分析方法及系统。

背景技术

癌症是一种染色体疾病,致癌物质、罕见的遗传病症以及偶发的有丝分裂错误都可以产生非整倍体继而引起肿瘤。研究显示,细胞基因组改变以及标本当中非整倍体细胞的出现,是癌症发展中的早期事件,可作为肿瘤检测标志。采用DNA倍体定量分析技术,对细胞核DNA含量和倍体状况进行测定和分析,是目前恶性肿瘤诊断中的一种重要方法,已广泛应用于各类细胞学检查中,过程为:基于获取到的细胞标本制作细胞玻片;对细胞玻片进行细胞图像的采集后,对所采集的细胞图像进行分析,得到其中的细胞区域,对细胞区域进行DNA倍体定量分析,得到定量分析结果。在这里,标本可以为诸如宫颈、口腔等表面刮取的标本,痰液、尿液等分泌排泄的标本,胸腔、腹腔等体液或肿瘤穿刺的标本,消化道、呼吸道内窥镜刷片及组织印片的标本等。

DNA非整体倍出现与癌变率和癌前病变增生程度有关,研究显示,细胞基因组改变以及标本当初非整倍体细胞的出现,是细胞发生癌变的一个重要指标,通过DNA倍体定量分析技术,对细胞DNA含量和倍体状况进行测定和分析,是目前恶性肿瘤诊断的重要方法之一,已经广泛应用于各类细胞学检查中。

目前,DNA倍体定量分析方法通常采用福尔根染色(Feulgen-stained)对细胞染色后,得到细胞图像进行分析,福尔根染色是一种能专一显示DNA的染色方法,DNA含量越高,细胞核染色后的颜色越深,但是该染色技术耗时较长,且基于该细胞图像进行DNA倍体定量分析方法存在腺细胞无法识别、过多的人工参与以及分析时间过长等问题。积分光密度是用来度量福尔根染色下的细胞图像中的细胞核DNA含量的重要数值,计算方式如下:

其中,λ

为了克服上述问题,在DNA倍体定量分析时,可以采用巴氏染色方式得到细胞图像后进行分析,巴氏染色技术是人体脱落细胞学最常用的染色方法之一,广泛应用于呼吸系统、泌尿系统以及生殖系统等脱落细胞学的诊断及微生物感染的鉴定等领域。与福尔根染色得到的细胞图像相比,巴氏染色下的细胞图像中的细胞透明度好,颜色鲜艳,细胞结构清晰。使用基于巴氏染色的细胞玻图像进行DNA倍体分析方法,可以有效解决现有基于福尔根染色的细胞图像的DNA倍体定量分析方法中染色和分析环节中存在的耗时长、人工参与多等问题。但是巴氏染色方式同时对细胞中的细胞核及细胞质进行染色,对细胞核中的非DNA物质也具有一定的染色作用,在进行后续的DNA倍体定量分析时也会掺杂非DNA物质,因此基于巴氏染色方式的细胞图像如何进行DNA倍体定量分析计算,避免在计算时包括了非DNA物质,保证DNA倍体定量分析的分析结果准确,成为了一个亟待解决的问题。

发明内容

有鉴于此,本发明实施例提供了一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析方法,该方法能够去除巴氏染色下非DNA物质造成的影响,保证DNA倍体定量分析的准确性。

本发明实施例还提供了一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析系统,该系统能够在进行DAN分析结果时去除DNA物质,保证DNA倍体定量分析的准确性。

本发明实施例是这样实现的:

一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析方法,包括:

对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像;

对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的;

采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,根据计算出该细胞玻片中的所有细胞的DNA指数得到该细胞玻片的DNA定量分析结果。

较佳地,所述积分光密度分析模型是采用EfficientNet网络结构,所述结构包括:卷积层、注意力机制层、特征金子塔层以及回归层。

较佳地,所述注意力机制层,用于积分光密度分析模型在训练时对输入的单个细胞中的细胞核区域进行关注处理;

所述特征金字塔层,用于在处理时融合不同尺度的细胞特征。

较佳地,所述回归层中采用Huber损失函数进行回归,包括:

其中,L为计算的Huber损失函数的结果,y代表细胞的福尔根染色下归一化的积分光密度真值,f(x)为细胞的巴氏染色下的预测值,x代表输入的单个细胞图像,δ为预定义的阈值。

较佳地,所述卷积层,用于对输入的巴氏染色方式下的细胞图像中的单个细胞的特征进行卷积处理;

回归层,包括卷积层及全局最大池化层,激活函数采用Relu激活函数,输出为巴氏染色下的细胞图像中的单个细胞对应的在福尔根染色下的积分光密度数值。

较佳地,在所述训练得到积分光密度分析模型之前,还包括准备训练数据集进行训练:

按照设定数量准备细胞玻片,包括阴性细胞玻片和阳性细胞玻片;

将每一例细胞玻片,使用巴氏染色对细胞玻片中的细胞进行染色并扫描为细胞图像后,再将其褪色后使用福尔根染色并扫描为细胞图像,分别获得同一细胞样本在福尔根染色和巴氏染色下的细胞图像;

获得巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值。

一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析系统,包括:获取单元、处理单元及DNA倍体定量分析单元,其中,

获取单元,用于对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像;

处理单元,用于对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的;

DNA倍体定量分析单元,用于采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。

较佳地,所述处理单元,还用于所述积分光密度分析模型是采用EfficientNet网络结构,该结构包括:卷积层、注意力机制层、特征金子塔层以及回归层。

如上所见,本发明实施例对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像,对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值后,采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。其中,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的。这样,由于本发明在对细胞图像进行DNA倍体定量分析时,采用了积分光密度分析模型,该模型是将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的,可以去除巴氏染色下非DNA物质造成的影响,且该模型在构建时引入了注意力机制及特征金字塔机制,可以使网络可以自动学习需要重点关注的细胞核区域,融合不同尺度的细胞特征信息,增强所提特征的表征能力,保证DNA倍体定量分析的准确性。

附图说明

图1为本发明实施例提供的一种基于巴氏染色方式的细胞图像进行DNA倍体定量分析方法流程图;

图2为本发明实施例提供的DNA倍体定量分析的具体例子示意图;

图3为本发明实施例提供的积分光密度分析模型的网络结果具体示意图;

图4为本发明实施例提供的FPN层的结构示意图;

图5为本发明实施例提供的注意力机制层的结构示意图;

图6为本发明实施例提供的基于巴氏染色方式的细胞图像进行DNA倍体定量分析系统结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明进一步详细说明。

从背景技术可以看出,使用基于巴氏染色的细胞进行DNA倍体分析方法,虽然可以有效解决现有基于福尔根染色方式的细胞图像的DNA倍体定量分析方法中染色和分析环节中存在的耗时长、人工参与多等问题。但是巴氏染色方式对细胞进行染色时,同时对细胞中的细胞核及细胞质进行染色,对细胞核中的非DNA物质也具有一定的染色作用,在进行后续DNA倍体定量分析时也会掺杂非DNA物质,使得DNA倍体定量分析不准确。因此,本发明实施例对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像,对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值后,采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,根据计算出该细胞玻片中的所有细胞的DNA指数得到该细胞玻片的DNA定量分析结果。其中,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的。

这样,由于本发明在对细胞图像进行DNA倍体定量分析时,采用了积分光密度分析模型,该模型是将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的,可以去除巴氏染色下非DNA物质造成的影响,且该模型在构建时引入了注意力机制及特征金字塔机制,可以使网络自动学习需要重点关注的细胞核区域,融合不同尺度的细胞特征信息,增强所提特征的表征能力,保证DNA倍体定量分析的准确性。

图1为本发明实施例提供的基于巴氏染色方式的细胞图像进行DNA倍体定量分析方法流程图,其具体步骤包括:

步骤101、对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像;

步骤102、对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的;

步骤103、采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,根据计算出该细胞玻片中的所有细胞的DNA指数得到该细胞玻片的DNA定量分析结果。

在该方法中,所述积分光密度分析模型是采用EfficientNet网络结构,该结构包括:卷积层、注意力机制层、特征金子塔层及回归层。

其中,卷积层一般采用3*3的结构,对输入的单个细胞的特征进行卷积处理。

注意力机制层,用于积分光密度分析模型在训练时对输入的单个细胞中的细胞核区域进行关注处理。

特征金字塔层,用于在处理时融合不同尺度的细胞特征。

在回归层中采用Huber损失函数进行回归,包括:

其中,L为计算的Huber损失函数的结果,y代表细胞的福尔根染色下归一化的积分光密度真值,f(x)为细胞的巴氏染色下的预测值,x代表输入的单个细胞图像特征,δ为预定义的阈值。

回归层,采用了两个3*3的卷积层及全局最大池化层,激活函数采用Relu激活函数,输出为巴氏染色下的细胞图像中的单个细胞对应的在福尔根染色下的积分光密度数值。

在该方法中,所述积分光密度分析模型具体训练如下所述。

第一个步骤:准备训练数据集。

在该步骤下,首先,进行细胞玻片准备,包括阴性细胞玻片和阳性细胞玻片,都按照设定数量准备;其次,采集细胞玻片,获得细胞图像,具体将上述每一例细胞玻片,首先使用巴氏染色对细胞玻片中的细胞进行染色并扫描为细胞图像后,再将其褪色后使用福尔根染色并扫描为细胞图像,以此分别获得同一细胞样本在福尔根染色和巴氏染色下的细胞图像;最后,获得巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值。

第二个步骤:设置积分光密度分析模型并基于准备的训练数据集进行训练。

考虑到同一细胞样本下,使用两种染色方式获得的细胞图像,其细胞核的DNA含量应该是保持一致的。因此,本发明实施例构建积分光密度分析模型,在该模型中,通过深度学习技术,直接构建出了巴氏染色下的单个细胞到福尔根染色积分光密度数值的映射关系,以便进一步计算巴氏染色下的单个细胞DNA倍体值。

具体地说,首先,构建网络结构;

在该步骤中,采用回归目标构建积分光密度分析模型,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为巴氏染色下相应的单个细胞的回归目标。也就是说,在构建的积分光密度分析模型中,输入为巴氏染色下的细胞图像中的单个细胞图像,输出为该细胞对应的在福尔根染色下的积分光密度数值,进行训练。

积分光密度分析模型,其主干网络采用EfficientNet网络结构,该EfficientNet网络结构通过简单高效的复合系数从深度、宽度和分辨率三个维度上放大网络,在网络结构中可以插入特征金字塔层,通过融合不同尺度的细胞特征信息,增强提取特征的能力,适应不同细胞形态尺寸差异较大的问题;在网络结构中还可以插入注意力机制层,使网络自动学习需要重点关注的单个细胞中的细胞核区域,更好的确定巴氏染色下的细胞图像中的单个细胞与福尔根染色下对应的细胞核积分光密度之间的关系。

积分光密度分析模型中的回归层采用了Huber损失函数:

其中,L为计算的Huber损失函数的结果,y代表细胞的福尔根染色下归一化的积分光密度真值,f(x)为细胞的巴氏染色下的预测值,x代表输入的单个细胞图像,δ为预定义的阈值。

第三个步骤,DNA倍体数值计算

在获得单细胞的积分光密度之后,采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。

对本发明实施例提供的DNA倍体数值计算的方法举例进行详细说明。

参照图2所示的本发明实施例提供的DNA倍体定量分析的具体例子示意图进行说明。

第一个步骤:准备训练数据集。

在该步骤下,首先,进行细胞玻片准备,包括阴性细胞玻片和阳性细胞玻片,都按照设定数量准备;其次,采集细胞玻片,获得细胞图像,具体将上述每一例细胞玻片,首先使用巴氏染色对细胞玻片中的细胞进行染色并扫描为细胞图像后,再将其褪色后使用福尔根染色并扫描为细胞图像,以此分别获得同一细胞样本在福尔根染色和巴氏染色下的细胞图像;最后,获得巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值。

在这里,所述获得巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值的过程为:

1)使用已有的积分光密度计算方法计算福尔根染色下的细胞图像中的细胞核积分光密度数值。经福尔根染色后的细胞样本可以采用MotiCytometer(麦克奥迪医疗诊断系统有限公司)的全自动细胞像分析系统进行扫描,并收集8000左右的细胞核,每个细胞核均得出100多个参数特征值,通过参数特征值系统可自动对细胞核进行分类,确定细胞核的DNA倍体值;

2)使用设置的目标检测模型对巴氏染色下的细胞图像进行细胞检测,获得单个细胞;所设置的目标检测模型是已经训练好的,用于进行巴氏染色下的细胞图像中的单个细胞的检测。

3)将巴氏染色的细胞图像和福尔根染色的细胞图像进行坐标对齐,获得的巴氏染色中的单个细胞图像与对应的福尔根染色下的细胞核积分光密度值。

第二个步骤,设置积分光密度分析模型并基于准备的训练数据集进行训练。

由于福尔根染色方式仅对细胞中的细胞核染色,而巴氏染色方式对细胞核及细胞质均具有染色作用,并且对细胞核中DNA、蛋白质等多种物质染色都具有着色作用。若直接通过计算积分光密度的方法,获得的巴氏染色细胞的DNA倍体数值,与福尔根染色的DNA倍体值会存在一定差异。考虑到同一细胞样本下,使用两种染色方式获得的细胞图像,其细胞核的DNA含量是保持一致的。因此,本发明实施例构建积分光密度分析模型,在该模型中,通过深度学习技术,直接构建出了巴氏染色下的单个细胞与福尔根染色下的积分光密度数值的映射关系,以便进一步计算巴氏染色下细胞DNA倍体值。

具体地说,如图3所示,图3为本发明实施例提供的积分光密度分析模型的网络结果具体示意图。首先,构建网络结构;

在该步骤中,采用回归目标构建积分光密度分析模型,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为巴氏染色下相应的单个细胞的回归目标。也就是说,在构建的积分光密度分析模型中,输入为巴氏染色下的细胞图像中的单个细胞图像特征,输出为该细胞对应的在福尔根染色下的积分光密度数值,进行训练。

积分光密度分析模型,其主干网络采用EfficientNet网络结构,该EfficientNet网络结构通过简单高效的复合系数从深度、宽度和分辨率三个维度上放大网络,增强主干网络的特征提取能力。

在网络结构中插入特征金字塔(FPN)层,如图4所示,图4为本发明实施例提供的FPN层的结构示意图,通过融合不同尺度的细胞特征信息,增强提取特征的能力,适应不同细胞形态尺寸差异较大的问题。

在网络结构中还可以插入注意力机制(attention)层,如图5所示,图5为本发明实施例提供的注意力机制层的结构示意图,使网络自动学习需要重点关注的单个细胞中的细胞核区域,更好的确定巴氏染色下的细胞图像中的单个细胞与福尔根染色下对应的细胞核积分光密度之间的关系。

在积分光密度分析模型中的回归层采用了两个3*3的卷积层及全局最大池化层,激活函数采用Relu激活函数,输出为巴氏染色下的细胞图像中的单个细胞对应的在福尔根染色下的积分光密度数值。

在积分光密度分析模型中,回归层常用的损失函数有平方损失函数、绝对值损失函数或Huber损失函数等,平方损失函数最常用,其缺点是对于异常点会施以较大的惩罚,因而不够鲁棒;绝对值损失函数具有抵抗异常点干扰的特性,但是在y-f(x)处不连续可导,难以优化。本发明实施例的积分光密度分析模型中的回归层的回归目标,是以福尔根染色方式的单个细胞中的细胞核获得的积分光密度值为目标,对巴氏染色下的对应细胞进行分析,为方便损失函数计算,将回归层的积分光密度值进行归一化处理,采用的损失函数为Huber损失函数:

其中,L为计算的Huber损失函数的结果,y代表细胞的福尔根染色下归一化的积分光密度真值,f(x)为细胞的巴氏染色下的预测值,x代表输入的单个细胞图像,δ为预定义的阈值。

第三个步骤,DNA倍体定量值计算

在获得单细胞的积分光密度之后,采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。

图6为本发明实施例提供的基于巴氏染色方式的细胞图像进行DNA倍体定量分析系统结构示意图,包括:获取单元、处理单元及DNA倍体定量分析单元,其中,

获取单元,用于对采用巴氏染色方式进行染色得到的细胞玻片进行扫描,得到细胞图像;

处理单元,用于对所述细胞图像中的单个细胞采用设置的积分光密度分析模型进行处理后,得到单个细胞的积分光密度值,所述积光密度分析模型是采用注意力机制及特征金字塔机制的回归神经网络,将巴氏染色下的单个细胞对应的福尔根染色下积分光密度数值作为回归目标进行训练得到的;

DNA倍体定量分析单元,用于采用设置的细胞检测模型对所有单个细胞检测后,从检测为正常的所有单个细胞中选取部分单个细胞作为样本细胞,将统计出的样本细胞的积分光密度均值作为对照值,计算出该细胞玻片中的所有细胞的DNA指数,得到该细胞玻片的DNA定量分析结果。

在该系统中,所述处理单元,还用于所述积分光密度分析模型是采用EfficientNet网络结构,该结构包括:卷积层、注意力机制层、特征金子塔层及回归层。

本发明实施例简化了基于巴氏染色下的细胞图像的DNA倍体分析流程,提高DNA倍体定量分析的精准度,具体地说:本发明实施例提出了积分光密度分析模型,能够实现巴氏染色下的细胞图像的单个细胞的积分光密度值的自动计算;本发明实施例提出的积分光密度分析模型使用EfficientNet网络作为主干网络,该网络基于神经结构搜索技术采用简单而高效的复合系数从深度,宽度和分辨率三个维度放大网络,且引入特征金字塔层和注意力机制层,可以融合不同尺度的细胞信息,同时增强提取特征的能力,可适应于各扫描仪倍数差异、不同种类细胞大小差异等实际问题,具有较高的鲁棒性。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号