公开/公告号CN113808693A
专利类型发明专利
公开/公告日2021-12-17
原文格式PDF
申请/专利权人 浙江科技学院;
申请/专利号CN202111061579.9
申请日2021-09-10
分类号G16H10/60(20180101);G16H70/40(20180101);G06N3/04(20060101);G06N3/08(20060101);
代理机构33240 杭州君度专利代理事务所(特殊普通合伙);
代理人朱亚冠
地址 310023 浙江省杭州市西湖区留和路318号
入库时间 2023-06-19 13:45:04
法律状态公告日
法律状态信息
法律状态
2022-01-14
实质审查的生效 IPC(主分类):G16H10/60 专利申请号:2021110615799 申请日:20210910
实质审查的生效
技术领域
本发明属于计算机应用技术领域,涉及一种基于图神经网络和注意力机制的药物推荐方法。
背景技术
现代医学技术的发展使得电子病历被广泛使用,从而积累了大量的临床数据,如生命体征、临床总结、疾病诊断、处方药物等。同时,深度学习技术为医疗数据的挖掘和利用提供了新的技术手段,是目前的一个研究热点。其中,基于电子病历的组合药物推荐算法,能够根据患者病情的变化特征,药物属性以及大量药物之间的作用关系,辅助医生制定安全有效的处方,具有重要的研究价值。
早期的药物推荐技术多基于规则。相关专家基于患者的诊断,疾病分类,症状,检测结果等医学信息提取用药规则,缺点是维护复杂难于更新扩展。深度学习下的药物推荐技术将患者的体征、诊断、既往用药等信息嵌入到一个低维空间,并使用该嵌入表示进行推荐,提高了推荐的准确率。但它们还存在着许多问题,包括数据稀疏性问题,不能有效利用患者的历史病历信息问题,忽略医疗代码蕴藏的医学本体信息问题等。
图神经网络是一种直接作用于图结构上的神经网络。它有以下特点:忽略节点的输入顺序;在计算过程中,节点的表示受其周围邻居节点的影响,而图本身连接不变;图结构的表示,使得可以基于图进行推理。因此,图神经网络成为研究的一大热点,被广泛应用于社交网络,推荐系统,金融风控,物理系统,分子化学,生命科学,知识图谱,交通预测等领域。
将图注意力机制引入到图神经网络,已经在很多领域得到了广泛应用。受益于注意力机制,图神经网络通过学习邻居的权重,更好的实现邻居的加权聚合,进一步过滤噪音邻居,提升模型表现并可以对结果实现一定的解释。
发明内容
本发明的目的旨在针对现有技术的不足,提供一种能有效的缓解医疗数据稀疏性,有效的利用患者的历史病例信息且兼顾药物安全性的药物推荐方法。
为了实现上述目的,本发明提供的技术是基于图神经网络和注意力机制的药物推荐方法,包括以下步骤:
步骤1、获取历史电子病历数据,并进行结构化处理:
获取患者的历史就诊情况和对应就诊情况的用药信息构建电子病历,其中就诊情况包括诊断数据和手术状况数据;患者的电子病历表示为p=[x
步骤2、构建三个图神经网络,用以学习患者就诊情况和用药信息的结构性特征;其中三个图神经网络的输入分别为患者的诊断数据、手术状况数据、用药数据,对应输出分别为d
三个图神经网络采用相同结构,具体包括结点和边;其中结点包括叶子结点、非叶子结点,叶子结点为输入数据即患者的诊断数据、手术状况数据、用药数据中的一种,非叶子结点为叶子结点的医学归属分类;边为两结点的医学分类关系;
每个非叶子结点表示为其自身和其所有子结点的向量表示之和,采用GAT图注意力机制的方式计算:
其中g
每个叶子节点表示为其自身和其所有祖先节点的向量表示之和,同样采用GAT图注意力机制的方式计算:
其中c′
步骤3、构建两个具有注意力机制的GRU网络模型,输入分别为步骤2的输出结果d
上述两个具有注意力机制的GRU网络模型采用相同结构,均包括两个并行GRU网络、以及与两个并行GRU网络输出连接的注意力机制模块;
两个并行GRU模型是采用不同激活函数获取历史就诊情况(即诊断或手术状况信息)的隐藏层输出信息,具体如下:
H=GRU
W
H=GRU
W′
其中,H,H′分别表示第一GRU网络、第二GRU网络模型输出的隐藏层信息,W
注意力机制模块根据公式(9)计算得到带有历史信息的k
其中t表示患者就诊总次数,W
步骤4、构建两个结构相同的记忆神经网络MANN;其中第一个记忆神经网络中存储的键-值对为“第i次就诊诊断数据融合信息
对第i次就诊情况和其历史就诊情况进行对位相乘,计算第i次就诊情况的权重
其中
通过权重
进一步得到记忆神经网络的键
其中
根据
步骤5、构建药物相互作用知识库
引入药物相互作用知识,使用邻接矩阵A
5-1将步骤4中
其中W
5-2构建电子病历中药物共存关系矩阵和药物相互作用关系矩阵
A
其中D表示A
5-3使用图卷积神经网络来学习药物之间的关系,将药物的相互作用和共存关系结合到嵌入表示中,得到药物共现图的表示矩阵Z
Z
ZD=A
其中,W
基于矩阵Z
其中,W
最后得到推荐的药物列表y
其中,W
当药物列表中药物的推荐概率y
本发明的另一个目的是提供基于图神经网络和注意力机制的药物推荐装置,包括
数据预处理模块,用于患者的历史就诊情况和对应就诊情况的用药信息进行结构化处理,构建对应电子病历数据;
图神经网络模块,用以学习患者就诊情况和用药信息的结构性特征;其中三个图神经网络的输入分别为患者的诊断数据、手术状况数据、用药数据,对应输出分别为d
具有注意力机制的GRU网络模型模块,用于将图神经网络模块输出的诊断数据、手术状况数据通过GRU网络提取特征,然后将其结合到当前就诊情况,获得带有历史信息的诊断数据、手术状况数据。
记忆神经网络MANN模块,用于构建具有注意力机制的GRU网络模型模块输出的第i次就诊诊断数据融合信息与图神经网络的用药信息的键值对,以及具有注意力机制的GRU网络模型模块输出的第i次就诊手术情况融合信息与图神经网络的用药信息的键值对;
药物相互作用知识库模块,用于采用图卷积神经网络学习药物共现关系和药物相互作用关系,将药物的相互作用和共现关系结合到记忆神经网络MANN模块的药物嵌入表示,产生推荐药物列表。
本发明的又一个目的是一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的方法。
本发明的再一个目的是一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述的方法。
本发明具有以下优势:本发明将每个患者的就诊情况或用药信息的结构性特征当做一个结点,采用图神经网络捕捉其中各个结构性特征之间的关系,学习包含医学体系知识的高阶特征。同时使用注意力机制来更好地建模用户的历史病历,并引入药物相互作用知识,有效的提高了药物推荐的准确率和安全性。
附图说明
图1为基于图神经网络和注意力机制的药物推荐过程。
图2为医疗代码编码体系结构的树状图。
图3为不同方法针对不同就诊次数下F1值对比。
具体实施方式
下面结合具体实施例对本发明做进一步的分析。
本发明提供的技术是基于图神经网络和注意力机制的药物推荐方法,包括以下步骤:
步骤1、获取历史电子病历数据,并进行结构化处理:
获取患者的历史就诊情况和对应就诊情况的用药信息构建电子病历,其中就诊情况包括诊断数据和手术状况数据;患者的电子病历表示为p=[x
步骤2、构建三个图神经网络,用以学习患者就诊情况和用药信息的结构性特征;其中三个图神经网络的输入分别为患者的诊断数据、手术状况数据、用药数据,对应输出分别为d
三个图神经网络采用相同结构,具体包括结点和边;其中结点包括叶子结点、非叶子结点,叶子结点为输入数据即患者的诊断数据、手术状况数据、用药数据中的一种,非叶子结点为叶子结点的医学归属分类;边为两结点的医学分类关系;
每个非叶子结点表示为其自身和其所有子结点的向量表示之和,采用GAT图注意力机制的方式计算:
其中g
每个叶子节点表示为其自身和其所有祖先节点的向量表示之和,同样采用GAT图注意力机制的方式计算:
其中c′
步骤3、构建两个具有注意力机制的GRU网络模型,输入分别为步骤2的输出结果de、p
上述两个具有注意力机制的GRU网络模型采用相同结构,均是包括GRU网络、以及与GRU网络输出连接的注意力机制模块;
GRU模型使用注意力机制将历史就诊情况(即诊断或手术状况信息)的隐藏层输出信息结合到当前的信息表示当中,具体的计算方式如下:
H=GRU
W
H′=GRU
W′
其中,H,H′分别表示第一个、第二个GRU网络模型输出的隐藏层信息,W
注意力机制模块根据公式(9)计算得到的带有历史信息的k
其中,t表示患者就诊总次数,W
步骤4、构建两个结构相似的记忆神经网络MANN;其中第一个记忆神经网络中存储的键-值对为“第i次就诊诊断数据融合信息
对第i次就诊情况和其历史就诊情况进行对位相乘,计算第i次就诊情况的权重
其中
通过权重
进一步得到记忆神经网络的键
其中
步骤5、构建药物相互作用知识库
引入药物相互作用知识,使用邻接矩阵A
5-1将步骤四中
其中,W
5-2构建电子病历中药物共存关系矩阵和药物相互作用关系矩阵
A
其中D表示A
5-3使用图卷积神经网络来学习药物之间的关系,将药物的相互作用和共存关系结合到嵌入表示中,得到药物共现图的表示矩阵Z
z
Z
其中,W
基于矩阵Z
其中,W
最后得到推荐的药物列表y
其中,W
得到的药物列表为一组绝对值小于1的一维矩阵,横竖坐标分别代表药物种类和推荐概率,当药物列表中药物的推荐概率大于事先设置的阈值0.5时,则推荐该药物。
实验过程:
本实验使用MIMIC-III(Medical Information Mark for Intensive Care)数据库的电子病历数据,该数据集由麻省理工学院计算生理学实验室发布的一个免费公开的重症监护数据集。本发明使用该数据库中的诊断单、手术单和处方单数据,筛选患者在进入ICU后的24小时内接受的药物。
为衡量推荐准确度,本发明使用杰卡德相似系数(Jaccard)即真实药物与推荐药物交集的大小除以并集大小、平均F1值(F1)即精确率和召回率的调和平均、精确度调用曲线(PRAUC)作为准确率的衡量指标。
为衡量推荐药物的安全性,使用药物相互作用率DDI即推荐组合药物中含有DDI药物的比率。
与当前较有效的六种方法进行了对比实验,其中Nearst方法根据当前就诊和以往诊断的相似度对进行推荐,推荐和以往诊断相同的组合药物;LR方法是L2正则化逻辑回归,使用多热向量来表示输入数据,二分类用于处理多标签输出。Leap方法使用循环神经网络来建模标签依赖关系,使用基于内容的注意力机制来捕获标签实例间的映射。RETAIN方法基于两层注意力网络模型的序列数据药物组合,该模型选择过去就诊中重要的临床变量。GAMENet方法是一种通过存储模块将历史用药和药物相互作用DDI使用图卷积网络集成的方法。PREMIER方法使用注意里机制学习患者历史表示,结合图注意力机制学习药物相互作用。
表1模型对比实验
表1是药物推荐任务在数据集上各种方法的性能。实验结果表明,在所有方法中,本发明方法的模型可以达到最好的效果。具体来说,本发明提出的方法在Jaccard、PRAUC和F1得分方面比最新的方法(PREMIER)分别高出0.97%、0.89%和0.93%。同时本发明方法兼顾药物相互作用,在所有同类深度学习方法中取前40种药物相互作用率情况下DDI最低为0.0705。此外本发明推荐的平均药物数量为14.98,在和各深度学习方法对比中最接近病历真实的平均药物数量14.68。
GRAD-mkg表示本发明去掉药物相互作用知识库的实验结果。在没有药物相互作用知识库的情况下,推荐药物的准确率方面变动不大,但模型推荐药物中的DDI变高达到0.767,这表明方法中把药物间相互作用关系的知识和具有历史就诊信息的查询向量结合,降低了推荐药物中的相互作用率,提高了用药安全性。Grad-tree表示仅使用图神经网络学习患者的就诊情况和用药信息的结构性特征生成的模型。在没有医疗代码本体结构的嵌入后,药物推荐的准确率出现明显下降,这表明本文使用的图神经网络具有对高阶结构特征的编码能力,能够丰富医学本体的嵌入表示,一定意义上弥补了训练数据稀疏的问题,提高了药物推荐的准确率。
由于每位患者的就诊次数不同,应考虑以往就诊次数的影响。对于不同的时序长度,本发明优于其他所有方法。如图3所示,本发明在以就诊次数的所有分类中F1值均为最高。特别是对于就诊次数多的数据,与其他方法相比仍能保持较高的准确率,这表明本方法对患者病历中的长时序依赖具有更好的建模能力。
表2不同程度DDI比较实验
关于对药物相互作用的效果,本发明还做了进一步的实验。分别使用前40,60,80,100种DDI类型,以探讨在考虑使用不同数量的DDI情况下,本发明以及那些所对比方法受到的影响。结果如表2所示,尽管△DDI率从-18.48上升到-0.26%,但当考虑的DDI类型的数量从40变为100时,GRAD是唯一能够实现DDI降低的算法,并且无论DDI类型有多少,△DDI率始终大于零。这表明在引入药物相互作用知识后本发明可以降低推荐药物的相互作用率,更具安全性。
因此可以得出,本发明具有以下优势:提出的基于图神经网络和注意力机制的药物推荐算法,将每个患者的就诊情况或用药信息的结构性特征当做一个结点,采用图神经网络捕捉其中各结点之间的关系,学习包含医学分类关系的高阶特征。同时使用注意力机制来更好地建模用户的历史病历,并引入药物相互作用知识,有效的提高了药物推荐的准确率和安全性。
机译: 基于卷积神经网络和特征图生成方法的深度学习中特征图计算的金字塔历史图生成方法
机译: 一种正面认证方法,其增强了计算机生成全息图转换的数字全息图标记的安全级别,这是一种基于计算机生成的全息图的正认证系统数字全息图标记发生器,用于基于计算机生成的全息图的正验证系统
机译: 基于影响基于神经网络的混合推荐系统及其方法