首页> 中国专利> 一种用于计算机辅助诊断的乳腺B超图像特征自学习提取方法

一种用于计算机辅助诊断的乳腺B超图像特征自学习提取方法

摘要

本发明涉及一种用于计算机辅助诊断的乳腺B超图像特征自学习提取方法,首先基于中等规模以上的乳腺B超病灶区域图像集无监督训练出一个卷积受限玻尔兹曼机(CRBM),对于任意给定的一幅B超病灶区域图像,首先将其输入训练好的CRBM,由CRBM提取得到乳腺B超图像的初始特征;随后,利用主成分分析法(PCA)对初始特征进行降维,得到可用于计算机辅助诊断的低维乳腺B超图像特征,完成乳腺B超图像浅层特征的自学习提取。本发明采用完全无监督的形式,从已有的乳腺B超图像数据中去自学习特征,减少工作量,避免了人工干涉,该方法实现灵活,具有较强的实用性。

著录项

  • 公开/公告号CN105023023A

    专利类型发明专利

  • 公开/公告日2015-11-04

    原文格式PDF

  • 申请/专利权人 福州大学;

    申请/专利号CN201510413836.9

  • 申请日2015-07-15

  • 分类号G06K9/62(20060101);G06K9/46(20060101);G06K9/32(20060101);G06T7/00(20060101);

  • 代理机构35100 福州元创专利商标代理有限公司;

  • 代理人蔡学俊

  • 地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区

  • 入库时间 2023-12-18 11:38:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-28

    未缴年费专利权终止 IPC(主分类):G06K 9/62 专利号:ZL2015104138369 申请日:20150715 授权公告日:20180817

    专利权的终止

  • 2018-08-17

    授权

    授权

  • 2015-12-02

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20150715

    实质审查的生效

  • 2015-11-04

    公开

    公开

说明书

技术领域

本发明涉及医学图像处理技术领域,特别是一种用于计算机辅助 诊断的乳腺B超图像特征自学习提取方法。

背景技术

乳腺癌是发生在妇女群体中最普遍的恶性肿瘤之一。近年来,我 国反癌协会调查研究显示,乳腺癌的发生比率在逐年递增。因此提高 乳腺癌的早期诊断精度变得越来越有意义。

目前,乳腺癌诊断采用的主要方法是通过乳腺x射线、B超图像 等影像检查,诊断者通过钙化或肿块等影像特征来对病情进行分析。 但由于乳腺组织中的腺体、血管、脂肪等软组织的密度与病灶区的密 度都很接近,加上诊断者视觉疲劳等因素,使得早期乳腺癌的误诊和 漏诊仍时常发生。随着医学影像技术和计算机辅助技术的不断发展, 利用计算机进行辅助诊断成为可能;比如利用数字图像处理技术,提 取乳腺B超图像中病理相关的特征,运用SVM等机器学习方法根据这 些特征对乳腺肿块良恶性进行分类识别等。

从计算机辅助诊断乳腺癌的应用现状来看,计算机辅助诊断的准 确度很大程度取决于提取到B超图像病理相关特征是否有效。目前, 用于计算机辅助诊断的医学图像特征提取基本上采用手工定位病灶 感兴趣区域,并通过基本图像处理的方法提取的一些基础的常规特 征,如:灰度直方图特征、形状特征、灰度共生矩阵特征、小波特征 等。但上述方法有以下几个方面的不足:第一、上述基础常规特征的 逐一提取耗时费力;第二、上述单个基础常规特征本身并非领域相关, 和乳腺癌的特定应用关联度不大;第三、设计有效的可用于计算机辅 助诊断乳腺癌的基础常规特征组合具有严重的不确定性。因此,最好 的解决机制是提供一种可以根据以往乳腺癌B超图像自动学习出与 病理有关且可用于辅助诊断的图像特征的方法。

在Honglak Lee等人发表的“Convolutional Deep Belief  Networks for Scalable Unsupervised Learning of Hierarchical  Representations”文章中,作者利用卷积深信网对人脸图像进行特 征学习,通过学习得到的特征对人脸进行识别。该实验结果表明卷积 深信网可用于特征的自学习。

由此,本专利提出利用卷积受限玻尔兹曼机(CRBM)完成乳腺B 超图像的特征自学习提取。

发明内容

有鉴于此,本发明的目的是提出一种用于计算机辅助诊断的乳腺 B超图像特征自学习提取方法,减少工作量,避免了人工干涉,且有 助于特征的病理相关性。

本发明的采用以下方案实现:一种用于计算机辅助诊断的乳腺B 超图像特征自学习提取方法,具体包括以下步骤:

步骤S1:给定一个中等规模以上的乳腺B超病灶区域图像集,所述 中等规模表示该图像集至少含有200幅以上的乳腺B超诊断图像;

步骤S2:手动提取步骤S1中图像集离每一张乳腺B超诊断图像的乳 腺B超病灶区域图像ROI,并将全部的乳腺B超病灶区域图像ROI作 为训练集的样本;其中所述乳腺B超病灶区域图像ROI的大小为 150×150;

步骤S3:将训练集用于面向初始特征提取的卷积受限玻尔兹曼机 CRBM的训练;

步骤S4:采用CD算法训练面向初始特征提取的卷积受限玻尔兹曼机 CRBM,得到面向初始特征提取的卷积受限玻尔兹曼机CRBM的具体设 置;

步骤S5:给定一幅乳腺B超病灶区域图像,将其作为面向初始特征 提取的卷积受限玻尔兹曼机CRBM的输入,并从所述卷积受限玻尔兹 曼机CRBM的输出层输出提取得到维度为117600维的初始特征;

步骤S6:利用主成分分析法PCA对步骤S5得到的维度为117600维 的初始特征进行降维处理,得到低维的乳腺B超图像特征,其中低维 表示维度为100维,该100维的乳腺B超图像特征可应用于后续计算 机辅助诊断中。

进一步的,所述步骤S3中的卷积受限玻尔兹曼机CRBM包含输入 层、隐层和pooling层,其中输入层为乳腺B超病灶区域图像,输出 层为pooling层,pooling层每个单元的概率值表示乳腺B超病灶区 域图像的初始浅层特征。

进一步的,步骤S4中所述面向初始特征提取的卷积受限玻尔兹 曼机CRBM的具体设置如下:输入层大小设置为150×150,即Nv取150, 输入层偏置c设为0;滤波器大小设置为10×10,即NW取10,滤波 器组个数取24个,即K设置为24,卷积层特征图被分割为多个无重 叠的2×2的待汇聚Bα小块,汇聚比例C取2;

给定输入层v,则卷积层,即隐层单元的条件概率为:

P(hki,j=1|v)=exp(I(hki,j))1+Σ(i,j)Bαexp(I(hkij));

给定输入层v,则pooling层单元的条件概率为:

P(pαk=0|v)=11+Σ(i,j)Bαexp(I(hki,j));

给定卷积层,即隐层h,则输入层单元的条件概率为:

P(vi,j=1|h)=σ((ΣkWk*hk)i,j+c),输入层偏置c取0;

其中表示由可见层传输到卷积层的信号,bk表示第k个滤波器对应的卷积层特征图偏置,该特征图上所有单元共 享同一个偏置bk,Wk表示第k个滤波器的系数矩阵(卷积核),表 示Wk矩阵同时纵向横向翻转,Bα表示2×2的待汇聚的小块,i,j在 Bα中取值,代表行和列索引,1≤i,j≤2,hki,j表示卷积层中第k个特 征图上任意Bα小块中第i行j列的单元,1≤i,j≤2,*表示卷积操作, σ表示sigmoid函数。

较佳地,所述的CD算法训练过程具体如下:

S41:对于任意给定的一幅B超病灶区域图像(ROI),大小为 150×150,首先将图像转化为灰度图像,然后图像矩阵除以255,即 将图像矩阵数据范围转化为[0,1],假设处理后的图像为v;

S42:按照条件概率分布P(hki,j=1|v)=exp(I(hki,j))1+Σ(i,j)Bαexp(I(hki,j))由v 得到隐层(卷积层)第k个特征图hk,1≤k≤24;

S43:将第k个特征图各个概率单元转化为二进制形式,得到 state_hk,具体如下:对于任意Bα小块,按列优先存储为一个(1,4) 的向量vec,任意给定一个随机数rnd=rand(1),若则vec中第一个元素为1,其余三个元素均为0;若且 (其中2≤s≤4),则vec中第s个元素为1,其余元素为 0;然后将vec向量重新映射回2×2矩阵,给Bα赋值;

S44:按照条件概率分布P(neg_vi,j=1|h)=σ((ΣkWk*state_hk)i,j+c)(c取0)由二进制卷积层得到采样后的可见层图像neg_v;

S45:类似步骤S42中的操作,可得到采样后的卷积层中第k个 特征图neg_hk,1≤k≤24;

S46:计算梯度:

dWk=v*hk~-neg_v*neg_hk;~

dbk=Σs=1size(hk,2)Σt=1size(hk,1)hkts-Σs=1size(hk,2)Σt=1size(hk,1)neg_hktssize(hk,1)×size(hk,2);

S47:更新滤波器系数和偏置:

Wk=Wk+α×dWk

bk=bk+α×dbk

其中α为学习率,本发明中设置为0.01,dWk表示第k个滤波器 的梯度矩阵,大小为10×10,dbk表示第k个滤波器的偏置,为一个 标量;size(hk,1)表示特征图hk的行数,size(hk,2)表示特征图hk的列数, *表示卷积操作,×表示普通标量乘法。hkts表示特征图hk中第t行第 j列的元素,neg_hkts类似。

与现有技术相比,本发明采用完全无监督的形式,从已有的乳腺 B超图像数据中去自学习特征,减少工作量,避免了人工干涉,该方 法实现灵活,具有较强的实用性。

附图说明

图1为本发明中面向乳腺B超图像初始特征提取的卷积受限玻尔兹曼 机(CRBM)结构示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图1所示,本实施例提供了一种用于计算机辅助诊断的乳腺B 超图像特征自学习提取方法,具体包括以下步骤:

步骤S1:给定一个中等规模以上的乳腺B超病灶区域图像集,所述 中等规模表示该图像集至少含有200幅以上的乳腺B超诊断图像;

步骤S2:手动提取步骤S1中图像集离每一张乳腺B超诊断图像的乳 腺B超病灶区域图像ROI,并将全部的乳腺B超病灶区域图像ROI作 为训练集的样本;其中所述乳腺B超病灶区域图像ROI的大小为 150×150;

步骤S3:将训练集用于面向初始特征提取的卷积受限玻尔兹曼机 CRBM的训练;

步骤S4:采用CD算法训练面向初始特征提取的卷积受限玻尔兹曼机 CRBM,得到面向初始特征提取的卷积受限玻尔兹曼机CRBM的具体设 置;

步骤S5:给定一幅乳腺B超病灶区域图像,将其作为面向初始特征 提取的卷积受限玻尔兹曼机CRBM的输入,并从所述卷积受限玻尔兹 曼机CRBM的输出层输出提取得到维度为117600维的初始特征;

步骤S6:利用主成分分析法PCA对步骤S5得到的维度为117600维 的初始特征进行降维处理,得到低维的乳腺B超图像特征,其中低维 表示维度为100维,该100维的乳腺B超图像特征可应用于后续计算 机辅助诊断中。

在本实施例中,所述步骤S3中的卷积受限玻尔兹曼机CRBM包含 输入层、隐层和pooling层,其中输入层为乳腺B超病灶区域图像, 输出层为pooling层,pooling层每个单元的概率值表示乳腺B超病 灶区域图像的初始浅层特征。

在本实施例中,步骤S4中所述面向初始特征提取的卷积受限玻 尔兹曼机CRBM的具体设置如下:输入层大小设置为150×150,即Nv取 150,输入层偏置c设为0;滤波器大小设置为10×10,即NW取10, 滤波器组个数取24个,即K设置为24,卷积层特征图被分割为多个 无重叠的2×2的待汇聚Bα小块,汇聚比例C取2;

给定输入层v,则卷积层,即隐层单元的条件概率为:

P(hki,j=1|v)=exp(I(hki,j))1+Σ(i,j)Bαexp(I(hki,j));

给定输入层v,则pooling层单元的条件概率为:

P(pαk=0|v)=11+Σ(i,j)Bαepx(I(hki,j));

给定卷积层,即隐层h,则输入层单元的条件概率为:

P(vi,j=1|h)=σ((ΣkWk*hk)i,j+c),输入层偏置c取0;

其中表示由可见层传输到卷积层的信号,bk表示第k个滤波器对应的卷积层特征图偏置,该特征图上所有单元共 享同一个偏置bk,Wk表示第k个滤波器的系数矩阵(卷积核),表 示Wk矩阵同时纵向横向翻转,Bα表示2×2的待汇聚的小块,i,j在 Bα中取值,代表行和列索引,1≤i,j≤2,hki,j表示卷积层中第k个特 征图上任意Bα小块中第i行j列的单元,1≤i,j≤2,*表示卷积操作, σ表示sigmoid函数。

较佳地,在本实施例中,所述的CD算法训练过程具体如下:

S41:对于任意给定的一幅B超病灶区域图像(ROI),大小为 150×150,首先将图像转化为灰度图像,然后图像矩阵除以255,即 将图像矩阵数据范围转化为[0,1],假设处理后的图像为v;

S42:按照条件概率分布P(hki,j=1|v)=exp(I(hki,j))1+Σ(i,j)Bαexp(I(hki,j))由v 得到隐层(卷积层)第k个特征图hk,1≤k≤24;

S43:将第k个特征图各个概率单元转化为二进制形式,得到 state_hk,具体如下:对于任意Bα小块,按列优先存储为一个(1,4) 的向量vec,任意给定一个随机数rnd=rand(1),若则vec中第一个元素为1,其余三个元素均为0;若且 (其中2≤s≤4),则vec中第s个元素为1,其余元素为 0;然后将vec向量重新映射回2×2矩阵,给Bα赋值;

S44:按照条件概率分布P(neg_vi,j=1|h)=σ((ΣkWk*state_hk)i,j+c)(c取0)由二进制卷积层得到采样后的可见层图像neg_v;

S45:类似步骤S42中的操作,可得到采样后的卷积层中第k个 特征图neg_hk,1≤k≤24;

S46:计算梯度:

dWk=v*hk~-neg_v*neg_hk;~

dbk=Σs=1size(hk,2)Σt=1size(hk,1)hkts-Σs=1size(hk,2)Σt=1size(hk,1)neg_hktssize(hk,1)×size(hk,2);

S47:更新滤波器系数和偏置:

Wk=Wk+α×dWk

bk=bk+α×dbk

其中α为学习率,本发明中设置为0.01,dWk表示第k个滤波器 的梯度矩阵,大小为10×10,dbk表示第k个滤波器的偏置,为一个 标量;size(hk,1)表示特征图hk的行数,size(hk,2)表示特征图hk的列数, *表示卷积操作,×表示普通标量乘法。hkts表示特征图hk中第t行第 j列的元素,neg_hkts类似。

以上所述仅为本发明的较佳实施例,本专利提出的特征自学习提 取方法并不局限于乳腺B超图像本身,亦可扩展至其它医学图像中病 理相关特征的自学习提取,凡依本发明申请专利范围所做的均等变化 与修饰,皆应属本发明的涵盖范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号