公开/公告号CN113035348A
专利类型发明专利
公开/公告日2021-06-25
原文格式PDF
申请/专利权人 山西三友和智慧信息技术股份有限公司;
申请/专利号CN202110301562.X
申请日2021-03-22
分类号G16H50/20(20180101);G16H50/70(20180101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构14119 太原荣信德知识产权代理事务所(特殊普通合伙);
代理人杨凯;连慧敏
地址 030006 山西省太原市高新区科技街15号A118室
入库时间 2023-06-19 11:35:49
技术领域
本发明属于图像识别技术领域,具体涉及一种基于GRU特征融合的糖尿病诊断方法。
背景技术
现在对于糖尿病人的入院诊断过于依赖医生的主观判别,而由于经验丰富医师的缺乏,常常会出现误诊现象。现有的智能诊断模型多基于SVM等机器学习方法,此类方法需要进行人工特征选择,这导致主观因素会大大的影响模型的判别效果。
存在问题或缺陷的原因:由于糖尿病人数量较多,现有医疗水平无法满足诊断需求,大量病人无法得到快速的诊断,导致病情延误。而现有的辅助诊断系统对于特征的学习不足,识别效果较差。
发明内容
针对上述图像识别技术模型识别效果差的技术问题,本发明提供了一种识别效果好、成本低、准确率高的基于GRU特征融合的糖尿病诊断方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于GRU特征融合的糖尿病诊断方法,包括下列步骤:
S100、数据集构建:将数据集重构为3分类数据集,并将标签进行One-hot化,构建可供深度学习网络进行学习的标准数据集;
S200、数据集划分:使用K折交叉验证方法将数据集划分为多个小型数据集供模型训练与测试;
S300、模型构建:基于GRU与Bi-GRU进行构建网络模型,通过对网络不同部分特征的融合,对数据特征进行充分的学习,最后对融合特征进行全连接分类,得到识别结果;
S400、模型训练:采用指定的超参数对网络进行训练,通过对划分的多个数据集进行训练,选取最佳模型并保存;
S500、模型评价:采用准确率、召回率与F1-Score进行评价。
所述S100数据集构建中,所述数据集有100000个数据实例,数据经过了噪声去除并基于数据特征进行构建,将按照对患者建议入院治疗天数的分类,分别为不建议入院、建议入院30天以内、建议入院30天及以上,其中标签处理方式为将待识别的3种数据标签重构为One-hot形式,其中不建议入院的数据标签为[1,0,0]、建议入院30天以内的数据标签为[0,1,0]、建议入院30天及以上的标签为[0,0,1]。
所述S200数据集划分中,采用K折交叉验证方式进行数据集划分,将数据集划分为训练集、验证集与测试集,取K=10,将全部数据平均分为10个数据集,将其编号为数据集A-J,在进行模型训练时,选取9个小数据集作为训练集进行模型参数训练,1个小数据集作为测试集对模型识别效果进行评估,构建10个训练集-测试集组合。
所述S300模型构建中,基于GRU与Bi-GRU网络进行模型搭建,并对GRU与Bi-GRU网络结构进行改进,使用不同的方式对不同深度的特征进行融合,所述GRU与Bi-GRU网络包括1个GRU网络、2个Bi-GRU网络与一个全连接层,GRU分为两个门,一个重置门和一个更新门,具体计算方式为:z=σ(x
所述S300模型构建中,所述Bi-GRU为双向GRU,对数据进行正向与反向的两次识别,之后将两次提取的特征进行concate,采用Concate(ADD(GRU,Bi-GRU),Bi-GRU)的方式,即首先使用GRU网络对数据进行特征提取,所述GRU网络的层隐藏节点数为32,之后将提取得到的特征输入Bi-GRU网络中再次进行特征的提取,所述Bi-GRU网络的隐藏节点数为16,再将GRU网络提取的特征与Bi-GRU网络提取得到的特征进行特征ADD,将融合得到的特征输入一个Bi-GRU网络中,所述Bi-GRU网络的隐藏节点数为64,再次将融合特征与Bi-GRU网络输出的特征进行Concate,对特征进行多次提取与融合,构建识别效果更加优秀的改进Bi-GRU网络,最后使用全连接层对提取到的特征信息进行全连接分类,采用softmax输出识别结果。
所述S400模型训练中,使用交叉熵损失函数作为损失函数,由负对数似然函数和对数softmax函数组成,公式为
所述S400模型训练中,使用带有分层洗牌的10倍交叉验证,网络的学习率为0.001,batch size大小为64,初始设定100个epoch,将训练epoch、学习率和batch size作为参数进行调整,对于每种配置,将执行10倍的交叉验证,并取每种配置的平均精度进行比较,最终选取测试精度最高的模型作为方案最终模型。
所述S500模型评价中,使用训练好的模型对测试集数据进行分类预测,将预测结果与其对应标签进行比对,进行识别效果评价,评价方式为F1-score,公式为
本发明与现有技术相比,具有的有益效果是:
本发明使用GRU网络对糖尿病数据特征进行了序列依赖的提取,并通过对GRU网络的深度改造,对特征进行了多次不同形式的融合,帮助网络更好的学习数据特征,提升了网络的识别效果。且本网络训练过程中无需人工进行特征提取,保证了模型的客观性。
附图说明
图1本发明的主要步骤流程图;
图2本发明的网络模型图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于GRU特征融合的糖尿病诊断方法,如图1所示,包括下列步骤:
S100、数据集构建:将数据集重构为3分类数据集,并将标签进行One-hot化,构建可供深度学习网络进行学习的标准数据集;
S200、数据集划分:使用K折交叉验证方法将数据集划分为多个小型数据集供模型训练与测试;
S300、模型构建:基于GRU与Bi-GRU进行构建网络模型,通过对网络不同部分特征的融合,对数据特征进行充分的学习,最后对融合特征进行全连接分类,得到识别结果;
S400、模型训练:采用指定的超参数对网络进行训练,通过对划分的多个数据集进行训练,选取最佳模型并保存;
S500、模型评价:采用准确率、召回率与F1-Score进行评价。
进一步,步骤S100数据集构建中,使用数据集为1999-2008年130家美国医院的糖尿病经验证据,该数据集有100000个数据实例,数据经过了噪声去除并基于数据特征进行构建,将按照对患者建议入院治疗天数的分类,分别为不建议入院、建议入院30天以内、建议入院30天及以上,其中标签处理方式为将待识别的3种数据标签重构为One-hot形式,其中不建议入院的数据标签为[1,0,0]、建议入院30天以内的数据标签为[0,1,0]、建议入院30天及以上的标签为[0,0,1]。
进一步,步骤S200数据集划分中,采用K折交叉验证方式进行数据集划分,将数据集划分为训练集、验证集与测试集,取K=10,将全部数据平均分为10个数据集,将其编号为数据集A-J,在进行模型训练时,选取9个小数据集作为训练集进行模型参数训练,1个小数据集作为测试集对模型识别效果进行评估,构建10个训练集-测试集组合。
进一步,步骤S300模型构建中,如图2所示,基于GRU与Bi-GRU网络进行模型搭建,并对网络结构进行改进,使用不同的方式对不同深度的特征进行融合,网络包括1个GRU网络、2个Bi-GRU网络与一个全连接层,GRU分为两个门,一个重置门和一个更新门,重置门决定了如何将新的输入信息与前面的记忆相结合,更新门定义了前面记忆保存到当前时间步的量。这两个门控向量决定了哪些信息最终能作为门控循环单元的输出,两个门控机制的特殊之处在于,它们能够保存长期序列中的信息,且不会随时间而清除或因为与预测不相关而移除,具体计算方式为:z=σ(x
进一步,步骤S300模型构建中,Bi-GRU即双向GRU,对数据进行正向与反向的两次识别,之后将两次提取的特征进行concate,采用Concate(ADD(GRU,Bi-GRU),Bi-GRU)的方式,即首先使用GRU对数据进行特征提取,该层隐藏节点数为32,之后将提取得到的特征输入Bi-GRU网络中再次进行特征的提取,此Bi-GRU网络的隐藏节点数为16,再将GRU部分提取的特征与Bi-GRU提取得到的特征进行特征ADD,将融合得到的特征输入一个Bi-GRU网络中,此Bi-GRU网络的隐藏节点数为64,再次将融合特征与Bi-GRU输出的特征进行Concate,对特征进行多次提取与融合,构建识别效果更加优秀的改进Bi-GRU网络,最后使用全连接层对提取到的特征信息进行全连接分类,采用softmax输出识别结果。
进一步,步骤S400模型训练中,使用交叉熵损失函数作为损失函数,Pytorch中的交叉熵损失函数结合了负对数似然损失和对数softmax函数,并在不同类别上输出一个数字概率值,使用最大的值作为预测标签,交叉熵损失函数由负对数似然函数和对数softmax函数组成,公式为
进一步,步骤S400模型训练中,为了确保参数模型的训练结果不偏向于类的分布,使用了带有分层洗牌的10倍交叉验证,网络的学习率为0.001,batch size大小为64,初始设定100个epoch,为了进一步调整模型,对模型进行参数调优,且由于学习速率和batchsize对准确性有影响,将训练epoch、学习率和batch size作为参数进行调整,对于每种配置,将执行10倍的交叉验证,并取每种配置的平均精度进行比较,最终选取测试精度最高的模型作为方案最终模型。
进一步,步骤S500模型评价中,使用训练好的模型对测试集数据进行分类预测,将预测结果与其对应标签进行比对,进行识别效果评价,评价方式为F1-score,公式为
上面仅对本发明的较佳实施例作了详细说明,但是本发明并不限于上述实施例,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化,各种变化均应包含在本发明的保护范围之内。
机译: 一种使用多位置标记,包含与II型糖尿病相关的标记和微阵列的固定化多核苷酸的多核苷酸的II型糖尿病诊断方法
机译: 基于基线荧光荧光血管造影的糖尿病性黄斑病变计算机预测的形态学特征和对泄漏血管的空间排列特征,预测对血管内皮生长因子治疗的反应
机译: 融合纹理特征和qavelet矩特征的基于内容的搜索方法