公开/公告号CN105023023A
专利类型发明专利
公开/公告日2015-11-04
原文格式PDF
申请/专利权人 福州大学;
申请/专利号CN201510413836.9
申请日2015-07-15
分类号G06K9/62(20060101);G06K9/46(20060101);G06K9/32(20060101);G06T7/00(20060101);
代理机构35100 福州元创专利商标代理有限公司;
代理人蔡学俊
地址 350108 福建省福州市闽侯县上街镇大学城学园路2号福州大学新区
入库时间 2023-12-18 11:38:13
法律状态公告日
法律状态信息
法律状态
2022-06-28
未缴年费专利权终止 IPC(主分类):G06K 9/62 专利号:ZL2015104138369 申请日:20150715 授权公告日:20180817
专利权的终止
2018-08-17
授权
授权
2015-12-02
实质审查的生效 IPC(主分类):G06K9/62 申请日:20150715
实质审查的生效
2015-11-04
公开
公开
技术领域
本发明涉及医学图像处理技术领域,特别是一种用于计算机辅助 诊断的乳腺B超图像特征自学习提取方法。
背景技术
乳腺癌是发生在妇女群体中最普遍的恶性肿瘤之一。近年来,我 国反癌协会调查研究显示,乳腺癌的发生比率在逐年递增。因此提高 乳腺癌的早期诊断精度变得越来越有意义。
目前,乳腺癌诊断采用的主要方法是通过乳腺x射线、B超图像 等影像检查,诊断者通过钙化或肿块等影像特征来对病情进行分析。 但由于乳腺组织中的腺体、血管、脂肪等软组织的密度与病灶区的密 度都很接近,加上诊断者视觉疲劳等因素,使得早期乳腺癌的误诊和 漏诊仍时常发生。随着医学影像技术和计算机辅助技术的不断发展, 利用计算机进行辅助诊断成为可能;比如利用数字图像处理技术,提 取乳腺B超图像中病理相关的特征,运用SVM等机器学习方法根据这 些特征对乳腺肿块良恶性进行分类识别等。
从计算机辅助诊断乳腺癌的应用现状来看,计算机辅助诊断的准 确度很大程度取决于提取到B超图像病理相关特征是否有效。目前, 用于计算机辅助诊断的医学图像特征提取基本上采用手工定位病灶 感兴趣区域,并通过基本图像处理的方法提取的一些基础的常规特 征,如:灰度直方图特征、形状特征、灰度共生矩阵特征、小波特征 等。但上述方法有以下几个方面的不足:第一、上述基础常规特征的 逐一提取耗时费力;第二、上述单个基础常规特征本身并非领域相关, 和乳腺癌的特定应用关联度不大;第三、设计有效的可用于计算机辅 助诊断乳腺癌的基础常规特征组合具有严重的不确定性。因此,最好 的解决机制是提供一种可以根据以往乳腺癌B超图像自动学习出与 病理有关且可用于辅助诊断的图像特征的方法。
在Honglak Lee等人发表的“Convolutional Deep Belief Networks for Scalable Unsupervised Learning of Hierarchical Representations”文章中,作者利用卷积深信网对人脸图像进行特 征学习,通过学习得到的特征对人脸进行识别。该实验结果表明卷积 深信网可用于特征的自学习。
由此,本专利提出利用卷积受限玻尔兹曼机(CRBM)完成乳腺B 超图像的特征自学习提取。
发明内容
有鉴于此,本发明的目的是提出一种用于计算机辅助诊断的乳腺 B超图像特征自学习提取方法,减少工作量,避免了人工干涉,且有 助于特征的病理相关性。
本发明的采用以下方案实现:一种用于计算机辅助诊断的乳腺B 超图像特征自学习提取方法,具体包括以下步骤:
步骤S1:给定一个中等规模以上的乳腺B超病灶区域图像集,所述 中等规模表示该图像集至少含有200幅以上的乳腺B超诊断图像;
步骤S2:手动提取步骤S1中图像集离每一张乳腺B超诊断图像的乳 腺B超病灶区域图像ROI,并将全部的乳腺B超病灶区域图像ROI作 为训练集的样本;其中所述乳腺B超病灶区域图像ROI的大小为 150×150;
步骤S3:将训练集用于面向初始特征提取的卷积受限玻尔兹曼机 CRBM的训练;
步骤S4:采用CD算法训练面向初始特征提取的卷积受限玻尔兹曼机 CRBM,得到面向初始特征提取的卷积受限玻尔兹曼机CRBM的具体设 置;
步骤S5:给定一幅乳腺B超病灶区域图像,将其作为面向初始特征 提取的卷积受限玻尔兹曼机CRBM的输入,并从所述卷积受限玻尔兹 曼机CRBM的输出层输出提取得到维度为117600维的初始特征;
步骤S6:利用主成分分析法PCA对步骤S5得到的维度为117600维 的初始特征进行降维处理,得到低维的乳腺B超图像特征,其中低维 表示维度为100维,该100维的乳腺B超图像特征可应用于后续计算 机辅助诊断中。
进一步的,所述步骤S3中的卷积受限玻尔兹曼机CRBM包含输入 层、隐层和pooling层,其中输入层为乳腺B超病灶区域图像,输出 层为pooling层,pooling层每个单元的概率值表示乳腺B超病灶区 域图像的初始浅层特征。
进一步的,步骤S4中所述面向初始特征提取的卷积受限玻尔兹 曼机CRBM的具体设置如下:输入层大小设置为150×150,即Nv取150, 输入层偏置c设为0;滤波器大小设置为10×10,即NW取10,滤波 器组个数取24个,即K设置为24,卷积层特征图被分割为多个无重 叠的2×2的待汇聚Bα小块,汇聚比例C取2;
给定输入层v,则卷积层,即隐层单元的条件概率为:
给定输入层v,则pooling层单元的条件概率为:
给定卷积层,即隐层h,则输入层单元的条件概率为:
其中表示由可见层传输到卷积层的信号,bk表示第k个滤波器对应的卷积层特征图偏置,该特征图上所有单元共 享同一个偏置bk,Wk表示第k个滤波器的系数矩阵(卷积核),表 示Wk矩阵同时纵向横向翻转,Bα表示2×2的待汇聚的小块,i,j在 Bα中取值,代表行和列索引,1≤i,j≤2,hki,j表示卷积层中第k个特 征图上任意Bα小块中第i行j列的单元,1≤i,j≤2,*表示卷积操作, σ表示sigmoid函数。
较佳地,所述的CD算法训练过程具体如下:
S41:对于任意给定的一幅B超病灶区域图像(ROI),大小为 150×150,首先将图像转化为灰度图像,然后图像矩阵除以255,即 将图像矩阵数据范围转化为[0,1],假设处理后的图像为v;
S42:按照条件概率分布
S43:将第k个特征图各个概率单元转化为二进制形式,得到 state_hk,具体如下:对于任意Bα小块,按列优先存储为一个(1,4) 的向量vec,任意给定一个随机数rnd=rand(1),若则vec中第一个元素为1,其余三个元素均为0;若且 (其中2≤s≤4),则vec中第s个元素为1,其余元素为 0;然后将vec向量重新映射回2×2矩阵,给Bα赋值;
S44:按照条件概率分布
S45:类似步骤S42中的操作,可得到采样后的卷积层中第k个 特征图neg_hk,1≤k≤24;
S46:计算梯度:
S47:更新滤波器系数和偏置:
Wk=Wk+α×dWk;
bk=bk+α×dbk;
其中α为学习率,本发明中设置为0.01,dWk表示第k个滤波器 的梯度矩阵,大小为10×10,dbk表示第k个滤波器的偏置,为一个 标量;size(hk,1)表示特征图hk的行数,size(hk,2)表示特征图hk的列数, *表示卷积操作,×表示普通标量乘法。hkts表示特征图hk中第t行第 j列的元素,neg_hkts类似。
与现有技术相比,本发明采用完全无监督的形式,从已有的乳腺 B超图像数据中去自学习特征,减少工作量,避免了人工干涉,该方 法实现灵活,具有较强的实用性。
附图说明
图1为本发明中面向乳腺B超图像初始特征提取的卷积受限玻尔兹曼 机(CRBM)结构示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1所示,本实施例提供了一种用于计算机辅助诊断的乳腺B 超图像特征自学习提取方法,具体包括以下步骤:
步骤S1:给定一个中等规模以上的乳腺B超病灶区域图像集,所述 中等规模表示该图像集至少含有200幅以上的乳腺B超诊断图像;
步骤S2:手动提取步骤S1中图像集离每一张乳腺B超诊断图像的乳 腺B超病灶区域图像ROI,并将全部的乳腺B超病灶区域图像ROI作 为训练集的样本;其中所述乳腺B超病灶区域图像ROI的大小为 150×150;
步骤S3:将训练集用于面向初始特征提取的卷积受限玻尔兹曼机 CRBM的训练;
步骤S4:采用CD算法训练面向初始特征提取的卷积受限玻尔兹曼机 CRBM,得到面向初始特征提取的卷积受限玻尔兹曼机CRBM的具体设 置;
步骤S5:给定一幅乳腺B超病灶区域图像,将其作为面向初始特征 提取的卷积受限玻尔兹曼机CRBM的输入,并从所述卷积受限玻尔兹 曼机CRBM的输出层输出提取得到维度为117600维的初始特征;
步骤S6:利用主成分分析法PCA对步骤S5得到的维度为117600维 的初始特征进行降维处理,得到低维的乳腺B超图像特征,其中低维 表示维度为100维,该100维的乳腺B超图像特征可应用于后续计算 机辅助诊断中。
在本实施例中,所述步骤S3中的卷积受限玻尔兹曼机CRBM包含 输入层、隐层和pooling层,其中输入层为乳腺B超病灶区域图像, 输出层为pooling层,pooling层每个单元的概率值表示乳腺B超病 灶区域图像的初始浅层特征。
在本实施例中,步骤S4中所述面向初始特征提取的卷积受限玻 尔兹曼机CRBM的具体设置如下:输入层大小设置为150×150,即Nv取 150,输入层偏置c设为0;滤波器大小设置为10×10,即NW取10, 滤波器组个数取24个,即K设置为24,卷积层特征图被分割为多个 无重叠的2×2的待汇聚Bα小块,汇聚比例C取2;
给定输入层v,则卷积层,即隐层单元的条件概率为:
给定输入层v,则pooling层单元的条件概率为:
给定卷积层,即隐层h,则输入层单元的条件概率为:
其中表示由可见层传输到卷积层的信号,bk表示第k个滤波器对应的卷积层特征图偏置,该特征图上所有单元共 享同一个偏置bk,Wk表示第k个滤波器的系数矩阵(卷积核),表 示Wk矩阵同时纵向横向翻转,Bα表示2×2的待汇聚的小块,i,j在 Bα中取值,代表行和列索引,1≤i,j≤2,hki,j表示卷积层中第k个特 征图上任意Bα小块中第i行j列的单元,1≤i,j≤2,*表示卷积操作, σ表示sigmoid函数。
较佳地,在本实施例中,所述的CD算法训练过程具体如下:
S41:对于任意给定的一幅B超病灶区域图像(ROI),大小为 150×150,首先将图像转化为灰度图像,然后图像矩阵除以255,即 将图像矩阵数据范围转化为[0,1],假设处理后的图像为v;
S42:按照条件概率分布
S43:将第k个特征图各个概率单元转化为二进制形式,得到 state_hk,具体如下:对于任意Bα小块,按列优先存储为一个(1,4) 的向量vec,任意给定一个随机数rnd=rand(1),若则vec中第一个元素为1,其余三个元素均为0;若且 (其中2≤s≤4),则vec中第s个元素为1,其余元素为 0;然后将vec向量重新映射回2×2矩阵,给Bα赋值;
S44:按照条件概率分布
S45:类似步骤S42中的操作,可得到采样后的卷积层中第k个 特征图neg_hk,1≤k≤24;
S46:计算梯度:
S47:更新滤波器系数和偏置:
Wk=Wk+α×dWk;
bk=bk+α×dbk;
其中α为学习率,本发明中设置为0.01,dWk表示第k个滤波器 的梯度矩阵,大小为10×10,dbk表示第k个滤波器的偏置,为一个 标量;size(hk,1)表示特征图hk的行数,size(hk,2)表示特征图hk的列数, *表示卷积操作,×表示普通标量乘法。hkts表示特征图hk中第t行第 j列的元素,neg_hkts类似。
以上所述仅为本发明的较佳实施例,本专利提出的特征自学习提 取方法并不局限于乳腺B超图像本身,亦可扩展至其它医学图像中病 理相关特征的自学习提取,凡依本发明申请专利范围所做的均等变化 与修饰,皆应属本发明的涵盖范围。
机译: 图像特征提取设备,图像特征提取方法,图像特征提取程序,记录介质存储图像特征提取程序,配有图像特征提取设备的图像相似性计算设备,图像相似性计算和方法,图像相似性计算和方法计算程序
机译: 图像特征学习设备,图像特征学习方法,图像特征提取装置,图像特征提取方法和程序
机译: 图像特征学习装置,图像特征学习方法,图像特征提取装置,图像特征提取方法以及程序