公开/公告号CN112634204A
专利类型发明专利
公开/公告日2021-04-09
原文格式PDF
申请/专利权人 北京信息科技大学;
申请/专利号CN202011407416.7
申请日2020-12-03
分类号G06T7/00(20170101);G06T7/11(20170101);G06T7/13(20170101);G06N3/04(20060101);G06N3/08(20060101);G01N21/65(20060101);
代理机构11416 北京律恒立业知识产权代理事务所(特殊普通合伙);
代理人王琦;庞立岩
地址 100085 北京市海淀区清河小营东路12号北京信息科技大学光电学院
入库时间 2023-06-19 10:32:14
技术领域
本发明涉及数据处理分析技术领域,具体涉及一种基于卷积神经网络的癌症边界智能识别方法。
背景技术
目前,对于癌症边界的判断主要依赖于窥镜呈像,通过观察组织状态判断组织器官癌症边界,这样的判断方式极容易导致经过后续的治疗后,无法彻底清除癌细胞组织,癌症复发,或是过多的切除了正常组织,导致身体机能受影响。
发明内容
为了解决现有技术中癌症边界定位不准的问题,本发明提供一种基于卷积神经网络的癌症边界智能识别方法,包括以下步骤:
(1)采集已知癌症组织的拉曼光谱并进行预处理;
(2)构建并训练基于卷积神经网络的模型;
(3)采集癌症区域的拉曼光谱数据,判断癌症边界。
进一步地,步骤(1)中所述采集已知癌症的光谱的方法为,采集每个已知样品三个不同位置的拉曼光谱数据,每次采集20s。
进一步地,步骤(1)中所述预处理包括数据截取、平滑处理、荧光背景消除和归一化处理;
所述数据截取的范围是600cm
进一步地,步骤(2)中所述训练基于卷积神经网络的模型的方法为,将预处理后的数据用于训练,并将其作为一维信号输入,光谱强度作为一维特征,根据医院病理学分析设定标签,将预处理过的光谱数据进行随机排序,然后输入卷积神经网络。
进一步地,所述基于卷积神经网络的模型是基于改进的神经网络模型,可以将输入的光谱数据进行自动特征提取,所述神经网络模型的最后一层采用全连接层,可以预测所测组织是否为癌症组织。
与现有技术相比,本发明的有益效果是:
本发明提供一种基于卷积神经网络的癌症边界智能识别方法,该方法使用拉曼光谱识别装置采集癌症组织样本的光谱数据,构造深度学习的卷积神经网络模型,使用采集到的拉曼光谱数据对模型进行训练,得到成熟的卷积神经网络模型,使用训练后的卷积神经网络模型对癌症区域进行识别,可以准确的判断癌症边界,以便进行准确的癌症组织切除。
附图说明
图1为本实施例中癌症边界智能识别方法的流程图;
图2为本实施例中卷积神经网络结构示意图。
具体实施方式
通过参考示范性实施例,本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。
在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。下面通过具体的实施例对本发明的一种基于卷积神经网络的癌症边界智能识别方法进行说明:
如图1所示,为本实施例中一种基于卷积神经网络的癌症边界智能识别方法的流程图,该智能识别方法包括以下步骤:
1、采集已知癌症组织的拉曼光谱并进行预处理
使用光纤拉曼设备获取已知癌症组织的拉曼光谱,对获取的拉曼光谱进行预处理操作,获得数据样本,同时根据病理学检验结果对数据进行标定。具体包括如下步骤:
(1)在封闭环境中使用光纤拉曼设备获取不同已知癌症组织样品的拉曼光谱数据,测量每个样品的三个不同位置,每个光谱的采集时间为20s。采用Ocean Optics公司的拉曼光谱仪获取不同组织的光谱数据,为了在实验中模拟手术中灯光对数据采集的影响,整个光谱均采用暗室和光照双重采集。
(2)对拉曼光谱数据进行平滑处理,使用Savitzky-Golay方法来达到降噪的目的,使用了最小二乘法拟合。其包括以下步骤:
A、采用最小二乘法,用于多项式拟合,用以减小平滑对有效的光谱信息造成干扰,最小二乘拟合的表达式如下:
式中
B、为了求得a
其中,ε表示误差平方和,i表示数据中的某一个点,j表示当前的数据,n表示数据范围。
(3)对处理过的光谱数据进行归一化处理:
其中,
2.构建并训练基于卷积神经网络的模型
构建卷积神经网络模型,使用经过预处理的数据对其进行训练,其过程包括:
(1)将上述预处理过的数据与对应的标签作为输入,对模型进行正式训练。
(2)本模型采用前向传播,如图2所示,步骤如下:
A、通过一层卷积层,提取光谱数据特征:
其中x
B、通过一层池化层,可以提炼特征,减少模型规模,送入最大池化层,其中,卷积层输出映射y
其中,s表示范围,m表示范围中的量;
C、再添加一层卷积层和池化层,进一步提炼特征,增加分类的准确度。
通过损失函数对训练好的模型进行评价,损失函数采用交叉熵,表示如下:
其中,x
3、采集癌症区域的拉曼光谱数据,判断癌症边界。
结合这里披露的本发明的说明和实践,本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的,本发明的真正范围和主旨均由权利要求所限定。
机译: 基于偏方差选择的癌症驱动基因识别计算机数据处理方法和基于偏方差选择的癌症驱动基因识别方法
机译: 一种基于指针的对象获取方法,用于对计算机系统的信息进行有形处理,该方法基于一种自然语言,并且该机器人或机器人的人工智能系统对该计算机系统的接收信号作出反应,该计算机系统具有相应的关联机器人或机器人的人工智能,该机器人或机器人的人工智能计算机系统的相应思想得到证实
机译: 基于双流卷积神经网络的面部情感识别方法