首页> 中国专利> 面向SRS联合用药不良反应信号的等价信号挖掘方法

面向SRS联合用药不良反应信号的等价信号挖掘方法

摘要

本发明公开了一种面向SRS联合用药不良反应信号的等价信号挖掘方法,包括通过药物不良事件自发呈报系统SRS获取数据,得到联合用药不良反应信号集合X={D1,D2,…,Dx},Dx为判定为不良反应信号的药品组合;优先处理药品组合集合大小最小的信号,求解D的最大等价组DG,合并与DG存在交集的最大等价组到最大等价组DG;再将不属于DG且与D等价的信号并入DG,将DG加入XG,输出最大等价组集合XG。XG中的每个最大等价组即为联合用药不良反应信号间存在两两等价关系的信号集合,从最大等价组中选取一个信号代表该信号集合(即最大等价组),参与其它数据分析,有利于减少整体分析的工作量。

著录项

  • 公开/公告号CN112365989A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 长沙市弘源心血管健康研究院;

    申请/专利号CN202011304774.5

  • 申请日2020-11-19

  • 分类号G16H50/70(20180101);G16H70/40(20180101);

  • 代理机构43244 长沙智路知识产权代理事务所(普通合伙);

  • 代理人张毅

  • 地址 410006 湖南省长沙市岳麓区麓谷文轩路27号麓谷钰园F1栋13楼北面

  • 入库时间 2023-06-19 09:54:18

说明书

技术领域

本发明涉及信号挖掘技术领域,尤其涉及一种面向SRS联合用药不良反应信号的等价信号挖掘方法,SRS表示药物不良事件自发呈报系统。

背景技术

受限于实验范围、研究对象及时间等因素,上市前阶段不可能完成所有联合用药相互作用的研究,许多潜在的药物相互作用只有在药品上市后大范围、长时间使用过程中才发现。药物不良事件自发呈报系统(Spontaneous Reporting System,SRS)为上市后药物相互作用信号挖掘提供了重要的数据来源。例如美国FDA不良事件报告系统(FDA AdverseEvent Reporting System,FAERS)等,真实反应了现实生活中用药安全的复杂性,据调查,其60%的不良事件报告中患者用药多于一种,70%的报告中患者发生的不良事件多于一种,84%的报告中患者用药或发生不良事件的总数至少3种。这些特点给联合用药不良反应信号挖掘带来机遇和挑战。

为了突破“数据海量、信息匮乏”的困境,主流研究利用计算机在自发呈报系统数据中批量发掘联合用药不良反应信号。信号包含两个要素:药物组合D及目标不良反应AE。药物组合是一个药品集合,也可称为组合用药或联合用药。若药物组合D是不良反应AE的信号,则意味着当病患同时服用D中的全部药品时可能会产生目标不良反应AE。当AE确定时,信号可表述为药物组合。需要指出的是,信号只是一种线索,并不能证明药物组合与不良反应之间存在因果关系,这需要更完备的医药实验及机制分析来确认,能够被确认的信号称为阳性信号,不能被确认的称为假阳性信号。信号中阳性信号占比越高,则说明信号挖掘的质量越高。其中,信号强度度量是决定信号挖掘质量的关键。非均衡性测量是信号度量的基本思路,即所关注事件与其他事件相比较而言的“非均衡性”或“不相称性”。包括频数法和贝叶斯法两大类,频数法包括相对危险比(RR),比例报告比值(PRR)、报告比值比(ROR)等,贝叶斯法包括贝叶斯置信度递进神经网络(BCPNN),经验贝叶斯伽玛泊松分布缩减法(MGPS)、BCPNN高维扩展版、以及Ω收缩测量法等。上述方法各有优势,但整体而言,存在信号线索量大且准确率低(4%)的共性问题,无法真正发挥大数据优势,这个缺陷在挖掘高阶联合用药不良反应信号时会更加凸显。这是因为现实生活中的药物联用模式非常复杂,而已知的非均衡性测量方法评估信号不良反应风险时假设用药独立不相关,只评价其药物组合本身,不考虑其他联合用药的影响,这使得与阳性信号日常联用的其他药物(组合)也可能被评估为假阳性信号。其中,一个非常典型的问题是,若干看起来表达不同的联合用药不良反应信号,均来自于SRS数据库中相同的一组病患报告。对医药研究人员开展后续信号分析来说,此类信号的存在会导致两方面的问题:(1)对于来自于相同病患亚组的信号,独立开展数据分析会造成重复劳动;(2)从数据分析的角度,这些信号之间互为混杂因素,换言之,其中阳性信号的个数远少于信号的个数。目前,如何规范描述并挖掘此类信号,尚无相关研究工作可借鉴。

发明内容

(一)要解决的技术问题

针对上述问题,本发明提供一种面向SRS联合用药不良反应信号的等价信号挖掘方法。若两个信号所对应的病患群体重合度高,病例差异不足以支撑信号强度判断,两个信号相当于同一病患群体药物不良反应的等价描述,称两个信号之间具有等价关系,本发明给出了判定方法。在此基础上,采用传递假设和合并假设,挖掘出联合用药不良反应信号间存在两两等价关系的信号集合,本发明将其称之为最大等价组。从所述最大等价组中选取一个信号代表整个集合参与其它数据分析,减少整体分析的工作量,且该信号的等价信号可视为混杂因素,有助于提升信号分析质量。

(二)技术方案

基于上述的技术问题,本发明提供一种面向SRS联合用药不良反应信号的等价信号挖掘方法,所述方法包括以下步骤:

S1、令未处理集合Z=X,令联合用药不良反应信号集合X的最大等价组集合X

S2、判断Z是否为空集,若是,则进入步骤S9,否则进入步骤S3;

S3、优先处理药品组合大小最小的信号,药品组合大小表示药品组合中包含的药品个数,即令处理信号

S4、判断X

S5、遍历X

S6、判断Z是否为空集,若是,则进入步骤S8,否则进入步骤S7;

S7、遍历Z,将其中与D等价的信号加入D的最大等价组D

S8、令X

S9、输出最大等价组集合X

进一步的,所述判定为不良反应信号的药物组合的方法包括:若药物组合D的用药病患上报的目标不良反应信号AE的次数大于支持度阈值;药物组合D的长度不大于联合用药信号长度阈值MAX_D;根据病患集合PS的SRS数据得到的D作为目标不良反应信号AE的信号强度置信区间的下界Q(PS,D,AE).CI

进一步的,所述Q(PS,D,AE)为非均衡性度量类的信号度量函数,采用的度量方法包括RR、PRR、RoR、BCPNN、MGPS。

进一步的,所述预处理包括对数据去重,对药物名称进行规范化。

进一步的,所述步骤S5包括以下步骤:

S5.1、遍历X

S5.2、判断遍历X

进一步的,所述步骤S7包括以下步骤:

S7.1、选定Z的未遍历成员D

S7.2、判断D是否等价于D

S7.3、判断遍历Z是否结束,若否,则进入步骤S7.1,若是,则表明D

进一步的,所述步骤S7.2中判断D是否等价于D

S7.2.1、判定Q(PS,D,AE).CI

S7.2.2、判定绝对值|C(G(D),AE)-C(G(D

S7.2.3、判定D是否是D

S7.2.4、令C(G(D)-G(D

S7.2.5、判断|D|是否等于联合用药信号长度阈值MAX_D,若成立,则进入步骤S7.2.6;否则,进入步骤S7.3;

S7.2.6、遍历SRS数据,统计得到C(G(D)-G(D

S7.2.7、判断C(G(D)-G(D

S7.2.8、D等价于D

本发明公开了一种服务器,包括:

至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行所述的面向SRS联合用药不良反应信号的等价信号挖掘方法。

本发明公开了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行所述的面向SRS联合用药不良反应信号的等价信号挖掘方法。

(三)有益效果

本发明的上述技术方案具有如下优点:

(1)本发明通过先在X中取值D,求解D的最大等价组D

(2)本发明的步骤S7根据等价关系判定方法,求解D的最大等价组D

(3)本发明的步骤S7中,还结合等价传递假设及等价合并假设,通过|D|与联合用药信号长度阈值MAX_D的大小的方法判断等价关系,免去执行等价关系判定,有利于避免SRS数据查询,进一步提高计算效率;

(4)本发明的步骤S5在X

附图说明

通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:

图1为本发明实施例的基于SRS数据的联合用药不良反应等价关系信号挖掘方法的整体流程示意图;

图2为本发明实施例的等价关系与最大等价组的示例;

图3为本发明实施例的基于SRS的联合用药不良反应等价关系的信号挖掘方法的流程图;

图4为本发明实施例的判断D是否等价于D

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

本发明以FAERS发布的不良事件报告文件分析联合用药出血的不良反应等价关系信号的挖掘方法,如图1所示,包括:

第I阶段通过药物不良事件自发呈报系统SRS获取数据并预处理:通过药物不良事件自发呈报系统SRS获取数据,对数据去重,对药物名称进行规范化,选定目标不良反应AE。这是所有信号挖掘工作的基础和前提。数据预处理之后,用于后两个阶段的信号分析。为便于下文表述,定义以下符号:令SRS中全部病患集合记为PS={p

获取FAERS 2018年三季度数据发布的不良事件报告文件,得到420,915个病例报告,1,651,966条用药记录(包括51083种药物名称),以及1,329,530条不良反应事件记录(涵盖11,944种不良反应事件),整合其中的通过病例ID关联的人口学信息、用药信息、药物不良反应,将药物不良反应名称和药品名称进行规范化处理。选定出血事件为目标不良反应AE,涉及194中不良反应事件(均可归纳为出血事件,但表述不同),共有19,067条出血事件记录。

第II阶段挖掘联合用药不良反应信号:对于选定的SRS数据和目标不良反应AE,挖掘联合用药不良反应信号,获得联合用药不良反应信号集合X={D

表1典型信号度量方法及其置信区间选择

使用FAERS 2018年三季度数据挖掘联合用药出血事件信号。令支持度阈值Support=20,长度阈值MAX_D=3,信号度量函数Q(.)采用RoR,信号强度阈值δ=2,共得到1,530个联合用药出血事件信号。

第III阶段从所述联合用药不良反应信号集合中挖掘联合用药不良反应等价关系信号:该阶段的输入为本发明要挖掘出联合用药不良反应信号间存在两两等价关系的信号集合,所述的两两等价关系是指两个信号所对应的病患群体重合度高,病例差异不足以支撑信号强度判断,两个信号相当于同一病患群体的等价描述。此为本发明内容,对第二阶段得到信号集合进行分析,识别信号之间的等价关系,获得最大等价信号组。本阶段一般采用第二阶段相同的信号度量函数Q。

为了便于揭示等价关系的特点,首先分析理想等价关系,由理想等价关系的推论延伸到一般情况下的假说,再得到一般情况下的等价关系判定标准和挖掘算法:

理想等价关系为:给定信号D

推论1等价替代:若信号D

等价替代推论表明,对于等价信号D

推论2等价传递:若信号D

推论3合并等价:若信号D

但理想等价关系是一种特例,鉴于现实中联合用药的复杂性,信号之间存在理想等价关系的可能性微乎其微。对药物不良反应信号评估而言,少量的不良反应报告差异并不具有统计学意义。因此,判定信号之间的等价关系关注两点:(1)信号强度没有显著差异,即信号强度的置信区间存在交集;(2)对目标不良反应AE来说,允许信号的不良反应报告之间存在适量差异,采用参数“不良反应报告数阈值θ”来约束差异。等价关系判定定义如下。

等价关系判定:对于给定信号D

分析上述判定过程,条件(i)中,Q(PS,D

鉴于等价关系判定过程涉及查询SRS数据,为进一步提高计算效率,借鉴理想等价关系的等价传递推论、合并等价推论,将这两个推论作为等价传递假设及等价合并假设,尽量避免进行SRS数据查询。由等价传递假设可知,当信号D

对于输入的信号集合X,本专利希望将其中的信号分组,对于选定的若干信号,若信号间均存在两两等价关系,则将这些信号放入到一个信号集合,称为最大等价组。定义如下:

最大等价组定义:给定信号集合

基于等价传递假设,可以证明任何一个信号最多属于一个最大等价组。如图2,由理想等价关系的推论延伸到一般情况下的假说,再得到一般情况下的等价关系判定标准和挖掘算法:所示,当不采信等价传递假设时,{D

综上,信号集合X会被会划分未若干互无交集的最大等价组,将这些最大等价组的集合称为最大等价组集合X

当输入SRS数据、信号集合X(包含每个信号相关的Q(PS,D,AE)及C(G(D

S1、令未处理集合Z=X,令联合用药不良反应信号集合X的最大等价组集合X

S2、判断Z是否为空集,若是,则进入步骤S9,否则进入步骤S3;

若Z为空集,则联合用药不良反应信号集合X已全部处理;

S3、优先处理药品组合大小(药品组合中包含的药品个数)最小的信号,即令处理信号

S4、判断X

若X

S5、遍历X

S5.1、遍历X

根据等价传递假设,若两个最大等价组D

S5.2、判断遍历X

S6、判断Z是否为空集,若是,则进入步骤S8,否则进入步骤S7;

若Z为空集,则联合用药不良反应信号集合X已全部处理;

S7、遍历Z,将其中与D等价的信号加入D的最大等价组D

S7.2、判断D是否等价于D

S7.3、判断遍历Z是否结束,若否,则进入步骤S7.1,若是,则表明D

根据上述等价关系判定可得步骤S7.2中判断D是否等价于D

S7.2.1、判定以下两个不等式是否成立,Q(PS,D,AE).CI

S7.2.2、判定绝对值|C(G(D),AE)-C(G(D

S7.2.3、判定D是否是D

S7.2.4、令C(G(D)-G(D

S7.2.5、判断|D|是否等于联合用药信号长度阈值MAX_D,若成立,则进入步骤S7.2.6;否则,进入步骤S7.3;

S7.2.6、遍历SRS数据,统计得到C(G(D)-G(D

S7.2.7、判断以下两个不等式是否成立:C(G(D)-G(D

S7.2.8、D等价于D

步骤S7.2.1根据上述等价关系判定(i)首先进行判定,步骤S7.2.2排除上述无需查询SRS数据的等价关系判定(ii)不成立的特例条件,避免SRS数据查询,步骤S7.2.3至步骤S7.2.6表示当D是D

S8、令X

S9、输出最大等价组集合X

本发明通过先在X中取值D,求解D的最大等价组D

针对上一阶段得到的1,530个信号,令不良反应报告数阈值θ=4,经挖掘共得到783个最大等价组。其中,包含2个及2个以上信号的最大等价组有47个,这47个最大等价组中共包含794个信号,当每个最大等价组选取一个代表信号进行分析时,794个信号分析流程可以压缩为47个。从单个最大等价组来看,包含信号最多的最大等价组包含399个信号,其中信号之一为{苯丙香豆素,利司培酮},其RoR

该方法可以单独用于联合用药不良反应信号分析,也可以结合面向SRS联合用药不良反应信号的强信号筛选方法和/或面向SRS联合用药不良反应信号的存疑信号挖掘方法协同使用。三种方法均是分析信号与信号之间的关系,但目标各有侧重,强信号筛选是找出阳性信号线索,存疑信号挖掘是找出假阳性信号线索,等价关系信号挖掘是找出数据高度一致的信号线索,这些线索各自有利于提升信号分析质量。建议先进行等价关系信号挖掘再进行强信号筛选、存疑信号挖掘执行。等价关系信号挖掘方法得到最大等价组集合,每个最大等价组中仅需选择一个信号参与后续分析,可降低整个分析流程的计算开销。

最后需要说明的是,上述的方法可以转换为软件程序指令,既可以使用包括处理器和存储器的控制系统来运行实现,也可以通过非暂态计算机可读存储介质中存储的计算机指令来实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

综上可知,通过上述的一种面向SRS联合用药不良反应信号的等价信号挖掘方法,具有以下优点:

(1)本发明通过先在X中取值D,求解D的最大等价组D

(2)本发明的步骤S7根据等价关系判定方法,求解D的最大等价组D

(3)本发明的步骤S7中,还结合等价传递假设及等价合并假设,通过|D|与联合用药信号长度阈值MAX_D的大小的方法判断等价关系,免去执行等价关系判定,有利于避免SRS数据查询,进一步提高计算效率;

(4)本发明的步骤S5在X

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号