首页> 中国专利> 患者招募项目智能匹配方法及装置

患者招募项目智能匹配方法及装置

摘要

本发明公开了一种患者招募项目智能匹配方法及装置,涉及计算机技术领域,可解决目前在进行患者招募项目匹配时,存在处理患者线索时间长以及成本高,以及有些复杂患者材料人工不能有效准确识别出的技术问题。其中方法包括:获取受试患者的疾病材料信息,提取所述疾病材料信息对应的文字特征以及图像特征;基于医学知识规则,根据所述文字特征筛选与所述受试患者匹配的候选招募项目;将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,得到与所述受试患者匹配的目标招募项目。本申请适用于对患者招募项目的匹配分析。

著录项

  • 公开/公告号CN114913942A

    专利类型发明专利

  • 公开/公告日2022-08-16

    原文格式PDF

  • 申请/专利权人 北京健康之家科技有限公司;

    申请/专利号CN202210404321.2

  • 申请日2022-04-18

  • 分类号G16H10/20(2018.01);G16H10/60(2018.01);G16H30/20(2018.01);G16H50/70(2018.01);G06V10/40(2022.01);G06V10/74(2022.01);G06V10/774(2022.01);G06V10/80(2022.01);G06V10/82(2022.01);G06V30/148(2022.01);G06N3/04(2006.01);G06N5/00(2006.01);G06N20/20(2019.01);G06F16/36(2019.01);G06F40/151(2020.01);G06F40/284(2020.01);

  • 代理机构北京中强智尚知识产权代理有限公司 11448;

  • 代理人刘敏

  • 地址 100102 北京市朝阳区利泽中二路2号C座2层201

  • 入库时间 2023-06-19 16:23:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-21

    著录事项变更 IPC(主分类):G16H10/20 专利申请号:2022104043212 变更事项:申请人 变更前:北京健康之家科技有限公司 变更后:北京水滴科技集团有限公司 变更事项:地址 变更前:100102 北京市朝阳区利泽中二路2号C座2层201 变更后:100102 北京市朝阳区利泽中二路2号C座二层201

    著录事项变更

  • 2022-09-02

    实质审查的生效 IPC(主分类):G16H10/20 专利申请号:2022104043212 申请日:20220418

    实质审查的生效

说明书

技术领域

本申请涉及计算机技术领域,尤其涉及到一种患者招募项目智能匹配方法及装置。

背景技术

临床试验中,受试者招募是开启临床试验的关键一环。如何在临床试验过程中,招募到合适的受试者,确保临床试验在确定时间内完成,是临床试验所面临的难题。据国外的数据显示,86%的临床试验入组速度没有达到试验进度的要求,延期达1个月的占29%,延期达1~6个月之间的占52%,延期达6个月以上的占5%,真正按照试验进度要求准时达到入组人数的仅占14%。据报道,85%~95%的临床试验进度延迟的原因是不能按计划招募到合格的受试者。即便在我国人口基数庞大的背景下,受试者招募的进展仍显得缓慢和不足,招募方式的单一性、效率低下、信息闭塞等问题导致国内开展的大多数临床试验都很难在一定时间内完成。

传统的患者招募行业采取人工审核的方式去处理患者匹配项目的线索,需要大量的人力去筛选有效线索,再由招募团队人员对有效线索进行初筛,最终由医学老师进行复筛,这一系列流程需要每个环节负责的人员进行阅读患者材料,人工提取匹配项目特征的患者医学材料,从患者的材料中抽取有效的信息,比如用药史,疾病的类型,疾病的治疗线数,疾病的基因类型,通过有效的信息再去匹配项目,整个患者招募处理过程中均使用人工提取使用信息去匹配项目,存在处理患者线索时间长以及成本高的问题,以及有些复杂患者材料人工不一定能有效准确的识别出。

发明内容

有鉴于此,本申请提供了一种患者招募项目智能匹配方法及装置,可用于解决目前在进行患者招募项目匹配时,存在处理患者线索时间长以及成本高,以及有些复杂患者材料人工不能有效准确识别出的技术问题。

根据本申请的一个方面,提供了一种患者招募项目智能匹配方法,该方法包括:

获取受试患者的疾病材料信息,提取所述疾病材料信息对应的文字特征以及图像特征;

基于医学知识规则,根据所述文字特征筛选与所述受试患者匹配的候选招募项目;

将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,得到与所述受试患者匹配的目标招募项目。

优选地,所述疾病材料信息包括第一文本信息和图像信息,所述提取所述疾病材料信息对应的文字特征以及图像特征,包括:

利用光学字符识别技术将所述图像信息转换为第二文本信息,根据预设关键词在所述第一文本信息和所述第二文本信息中提取所述疾病材料信息对应的文字特征;

利用尺度不变特征变换技术提取所述图像信息中与尺度缩放、旋转、亮度变化无关的图像特征。

优选地,所述基于医学知识规则,根据所述文字特征筛选与所述受试患者匹配的候选招募项目,包括:

获取预先根据医学知识规则创建的医学知识图谱;

根据所述文字特征在所述医学知识图谱中筛选与所述受试患者匹配的候选招募项目。

优选地,所述医学知识图谱中包含各个预设招募项目以及各个所述预设招募项目对应的项目特征,所述根据所述文字特征在所述医学知识图谱中筛选与所述受试患者匹配的候选招募项目,包括:

计算所述文字特征与各个所述预设招募项目对应项目特征的特征相似度;

将对应所述特征相似度大于预设相似度阈值的预设招募项目确定为与所述受试患者匹配的候选招募项目。

优选地,所述方法还包括:

根据医学知识规则提取与各个预设招募项目匹配的项目特征;

生成各个所述预设招募项目的第一特征标签,各个所述预设招募项目所匹配项目特征对应的第二特征标签,以及所述第一特征标签与所述第二特征标签的匹配映射关系;

创建包含所述第一特征标签、所述第二特征标签以及所述匹配映射关系的医学知识图谱。

优选地,在将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,得到与所述受试患者匹配的目标招募项目之前,还包括:

获取完成招募项目匹配的样本数据,并将所述样本数据划分为训练集和测试集,其中,所述样本数据中配置有匹配成功的目标招募项目标签;

利用所述训练集迭代训练患者招募项目预测模型,直至利用所述测试集验证所述患者招募项目预测模型的预测精准度大于预设阈值,判定所述患者招募项目预测模型训练完成。

优选地,将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,得到与所述受试患者匹配的目标招募项目,包括:

将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,获取所述患者招募项目预测模型输出的针对各个所述候选招募项目的预测得分;

将对应所述预测得分最高的候选招募项目确定为与所述受试患者匹配的目标招募项目。

根据本申请的另一个方面,提供了一种患者招募项目智能匹配装置,该装置包括:

第一提取模块,用于获取受试患者的疾病材料信息,提取所述疾病材料信息对应的文字特征以及图像特征;

筛选模块,用于基于医学知识规则,根据所述文字特征筛选与所述受试患者匹配的候选招募项目;

输入模块,用于将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,得到与所述受试患者匹配的目标招募项目。

优选地,所述疾病材料信息包括第一文本信息和图像信息,所述第一提取模块。包括:第一提取单元、第二提取单元;

所述第一提取单元,用于利用光学字符识别技术将所述图像信息转换为第二文本信息,根据预设关键词在所述第一文本信息和所述第二文本信息中提取所述疾病材料信息对应的文字特征;

所述第二提取单元,用于利用尺度不变特征变换技术提取所述图像信息中与尺度缩放、旋转、亮度变化无关的图像特征。

优选地,所述筛选模块,包括:获取单元、筛选单元;

所述获取单元,用于获取预先根据医学知识规则创建的医学知识图谱;

所述筛选单元,用于根据所述文字特征在所述医学知识图谱中筛选与所述受试患者匹配的候选招募项目。

优选地,所述医学知识图谱中包含各个预设招募项目以及各个所述预设招募项目对应的项目特征,所述筛选单元,具体用于计算所述文字特征与各个所述预设招募项目对应项目特征的特征相似度;将对应所述特征相似度大于预设相似度阈值的预设招募项目确定为与所述受试患者匹配的候选招募项目。

优选地,所述装置还包括:第二提取模块、生成模块、创建模块;

所述第二提取模块,用于根据医学知识规则提取与各个预设招募项目匹配的项目特征;

所述生成模块,用于生成各个所述预设招募项目的第一特征标签,各个所述预设招募项目所匹配项目特征对应的第二特征标签,以及所述第一特征标签与所述第二特征标签的匹配映射关系;

所述创建模块,用于创建包含所述第一特征标签、所述第二特征标签以及所述匹配映射关系的医学知识图谱。

优选地,所述装置还包括:训练模块;

所述训练模块,用于获取完成招募项目匹配的样本数据,并将所述样本数据划分为训练集和测试集,其中,所述样本数据中配置有匹配成功的目标招募项目标签;利用所述训练集迭代训练患者招募项目预测模型,直至利用所述测试集验证所述患者招募项目预测模型的预测精准度大于预设阈值,判定所述患者招募项目预测模型训练完成。

优选地,所述输入模块,包括:输入单元、确定单元;

所述输入单元,用于将所述文字特征和所述图像特征进行特征融合后的多模态特征,以及所述候选招募项目输入训练完成的患者招募项目预测模型,获取所述患者招募项目预测模型输出的针对各个所述候选招募项目的预测得分;

所述确定单元,用于将对应所述预测得分最高的候选招募项目确定为与所述受试患者匹配的目标招募项目。

根据本申请的又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述患者招募项目智能匹配方法及装置。

根据本申请的再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述患者招募项目智能匹配方法及装置。

本申请提供了一种患者招募项目智能匹配方法及装置,可首先在获取到受试患者的疾病材料信息后,利用光学字符识别技术提取疾病材料信息对应的文字特征,以及利用尺度不变特征变换技术提取疾病材料信息对应的图像特征;进一步的,基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;最后将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。通过本申请中的技术方案,可通过将光学字符识别技术、尺度不变特征变换技术以及模型推荐算法技术运用在患者招募中,可从多个层面完成患者与招募项目的匹配,借此智能、自动匹配项目,流程自动化,可减少人力和物力成本,提高患者招募项目匹配的效率,使识别准确率也得到了有效保证。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。

参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:

图1示出了本发明实施例提供的一种患者招募项目智能匹配方法流程图;

图2示出了本发明实施例提供的另一种患者招募项目智能匹配方法流程图;

图3示出了本发明实施例提供的一种患者招募项目智能匹配的原理示意图;

图4示出了本发明实施例提供的一种患者招募项目智能匹配装置的结构示意图;

图5示出了本发明实施例提供的另一种患者招募项目智能匹配装置的结构示意图;

图6示出了本发明实施例提供的一种计算机设备的实体结构示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

本发明实施例可以应用于计算机系统/服务器,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。

计算机系统/服务器可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

本发明实施例提供了一种患者招募项目智能匹配方法,如图1所示,该方法包括:

101、获取受试患者的疾病材料信息,提取疾病材料信息对应的文字特征以及图像特征。

其中,受试患者为待进行患者招募项目匹配验证的临床试验患者,疾病材料信息包括受试患者的基本信息和病历信息,基本信息包括:疾病名称、亚型、性别、年龄、患者身份证号、日常活动水平等。病历信息包括:已接受的治疗方法、已接受的治疗时间、已接受的治疗药物、治疗化验信息、病情信息、和并发症信息、病理图文报告、CT报告、影像报告、疾病诊断等。在具体的应用场景中,可通过在医疗平台获取受试患者的疾病材料信息,或以调查问卷的方式对受试患者进行信息采集得到疾病材料信息。由于疾病材料信息中所包含的数据对应不同的数据维度,故可通过特征提取,得到具有特征表征且具有统一特定维度的文字特征以及图像特征,以进一步利用文字特征以及图像特征进行患者招募项目的快速匹配验证。

对于本申请的执行主体可为用于支持患者招募项目匹配的系统,可配置在客户端或服务端,能够在获取到受试患者的疾病材料信息后,提取疾病材料信息对应的文字特征以及图像特征;进一步基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;最后将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。

102、基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目。

在具体的应用场景中,不同的招募项目对患者的情况有不同的要求,如某一试验药物对应的招募项目要求患者以往治疗中未用过含吉西他滨的药物;可以允许患者患有乙肝,但乙肝定量不能超过2000IU/mL等。针对于此,可预先根据不同预设招募项目对患者的要求创建医学知识规则,在提取到受试患者对应疾病材料的文字特征后,可进一步根据医学知识规则在众多预设招募项目中滤除与该文字特征(如包括受试患者的疾病类型,用药史,疾病治疗线数,疾病基因类型)不相关的无关招募项目,保留与该文字特征以及图像特征对应特征关联度较高的候选招募项目,以方便在候选招募项目中快速进行与受试患者所匹配的目标招募项目的筛选。

103、将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。

其中,患者招募项目预测模型具体可采用FM和DNN结合而来的极深因子分解机模型(xDeepFM),该模型具备着记忆能力和泛化能力。它的记忆能力是在Linear部分将一阶特征加权求和得到的,泛化能力是利用全连接深度学习神经网络DNN实现的。

在具体的应用场景中,在执行本实施例步骤之前,还需要对患者招募项目预测模型进行预训练,直至判定患者招募项目预测模型符合预设训练标准,进一步利用训练完成的患者招募项目预测模型进行目标招募项目的匹配评估。相应的,在创建和训练患者招募项目预测模型时,实施例步骤具体可以包括:获取完成招募项目匹配的样本数据,并将样本数据划分为训练集和测试集,其中,样本数据中配置有匹配成功的目标招募项目标签;利用训练集迭代训练患者招募项目预测模型,直至利用测试集验证患者招募项目预测模型的预测精准度大于预设阈值,判定患者招募项目预测模型训练完成。具体的,可在获取测试集下患者招募项目预测模型对应的分值预测结果后,进一步依据分值预测结果和目标招募项目标签计算患者招募项目预测模型的预测精准度,当判定预测精准度大于预设阈值时,判定患者招募项目预测模型训练完成。其中,样本数据为每个将患者与项目匹配成功后的数据集,包括匹配成功的患者的文字特征和图片特征,具体的,可将匹配成功的患者的文字特征、图片特征与所匹配成功的目标招募项目构成一条记录作为正样本,来训练模型。预设阈值为大于0且小于1的数值,当预设阈值的取值越接近于1,表示患者招募项目预测模型的训练精准度越高,具体预设阈值的数值可根据实际应用场景进行设定,在此不进行具体的限定。

本申请实施例提供的一种患者招募项目智能匹配方法,可首先在获取到受试患者的疾病材料信息后,利用光学字符识别技术提取疾病材料信息对应的文字特征,以及利用尺度不变特征变换技术提取疾病材料信息对应的图像特征;进一步的,基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;最后将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。通过本申请中的技术方案,可通过将光学字符识别技术、尺度不变特征变换技术以及模型推荐算法技术运用在患者招募中,可从多个层面完成患者与招募项目的匹配,借此智能、自动匹配项目,流程自动化,可减少人力和物力成本,提高患者招募项目匹配的效率,使识别准确率也得到了有效保证。

进一步地,为了更好的说明上述临床药物试验患者的匹配过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种患者招募项目智能匹配方法,如图2所示,方法包括:

201、获取受试患者的疾病材料信息,其中,疾病材料信息包括第一文本信息和图像信息。

在具体的应用场景中,第一文本信息可包括受试患者的基本信息和病历信息,基本信息包括:疾病名称、亚型、性别、年龄、患者身份证号、日常活动水平等。病历信息包括:已接受的治疗方法、已接受的治疗时间、已接受的治疗药物、治疗化验信息、病情信息、和并发症信息、疾病诊断结果等字符信息;图像信息可包括病理图文报告、CT报告、影像报告等医学图片。

对于本实施例,可按照预设时间周期在医疗管理系统以及用户注册信息中自动化采集受试患者的疾病材料信息,或以调查问卷的方式对受试患者进行信息采集得到疾病材料信息,以便进一步通过执行实施例步骤202至206,对疾病材料信息进行文字特征维度以及图像特征维度的多模态特征分析,确定招募项目匹配分析结果。

202、利用光学字符识别技术将图像信息转换为第二文本信息,根据预设关键词在第一文本信息和第二文本信息中提取疾病材料信息对应的文字特征。

对于本实施例,在利用光学字符识别技术将图像信息转换为第二文本信息时,具体可包括如下步骤:1、对疾病材料信息中的医学图片进行预处理:此过程包含二值化(像素)、去噪、倾斜度矫正等;2、版面分析:将所要识别的文档分段、分行处理;3、字符切割:此步骤需要字符定位和字符切割,定位出字符串的边界,然后分别对字符串进行单个切割,单个分割出来的字符再做识别。4、字符特征提取:提取需要的字符特征,为后面的识别提供依据。5、字符识别:将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符。6、版面恢复:将识别结果按照原来的版面排版,输出Word或pdf格式的文档,即得到患者疾病材料的第二文本信息。

相应的,在根据第一文本信息和第二文本信息提取疾病材料信息对应的文字特征时,可预先针对各个文字类型配置对应的预设关键词,如对于基本信息的文字特征提取,可配置预设关键词包括:“姓名”、“性别”、“年龄”等,对于病历信息的文字特征提取,可配置预设关键词包括:“诊断结果”、“诊断项目”、“药物名称”、“治疗项目”等。通过关键词的匹配,能够在第一文本信息和第二文本信息中提取各个数据类型下的文本字符串,进一步利用文本特征提取技术确定各个数据类型下文本字符串对应的字符串特征,通过拼接各个字符串特征,即可得到疾病材料信息对应的文字特征。其中,文本特征提取技术可包括独热编码(one-hot)、词频-逆向文件频率(TF-IDF)等,在此不进行具体的限定。

203、利用尺度不变特征变换技术提取图像信息中与尺度缩放、旋转、亮度变化无关的图像特征。

其中,尺度不变换特征变换(ScaleinvariantfeatureTransform,SIFT)主要包括两个阶段,一个是SIFT特征的生成,即从多幅图像中提取对尺度缩放、旋转、亮度变化无关的特征向量;第二阶段是SIFT特征向量的匹配。SIFT方法中的低层次特征提取是选取那些显特征,这些特征具有图像尺度(特征大小)和旋转不变性,而且对光照变化也具有一定程度的不变性。对于本实施例,可利用尺度不变换特征变换技术提取医学图片(如病理图文报告,CT报告,影像报告等)中的有效特征,得到患者疾病材料的图像特征。

204、获取预先根据医学知识规则创建的医学知识图谱,医学知识图谱中包含各个预设招募项目以及各个预设招募项目对应的项目特征。

在具体的应用场景中,在执行本实施例步骤之前,可预先根据医学知识规则创建医学知识图谱,相应的,实施例步骤具体可以包括:根据医学知识规则提取与各个预设招募项目匹配的项目特征;生成各个预设招募项目的第一特征标签,各个预设招募项目所匹配项目特征对应的第二特征标签,以及第一特征标签与第二特征标签的匹配映射关系;创建包含第一特征标签、第二特征标签以及匹配映射关系的医学知识图谱。其中,医学知识图谱中的节点表示各个预设招募项目的第一特征标签和各个预设招募项目所匹配项目特征对应的第二特征标签,知识图谱结构中的边表示第一特征标签和对应第二特征标签之间的匹配映射关系。相应的,在执行本实施例步骤时,可直接调用该预先创建的医学知识图谱,并利用医学知识图谱执行后续对候选招募项目的初步筛选。

205、根据文字特征在医学知识图谱中筛选与受试患者匹配的候选招募项目。

对于本实施例,实施例步骤205具体可以包括:计算文字特征与各个预设招募项目对应项目特征的特征相似度;将对应特征相似度大于预设相似度阈值的预设招募项目确定为与受试患者匹配的候选招募项目。其中,在计算特征相似度时,可利用预设特征距离计算公式进行计算,也可利用机器学习模型进行计算,在此不进行具体的限定。预设特征距离计算公式可为任何适用于度量的距离函数公式,如可包括欧几里得距离公式(EuclideanDistance)、曼哈顿距离公式(ManhattanDistance)、杰卡德距离公式(JaccardDistance)、马氏距离公式(Mahalanobisdistance)等,机器学习模型可包括决策树模型、随机森林模型、神经网络模型等。需要说明的是。预设特征距离计算公式以及机器学习模型具体可根据实际应用场景进行选择,在此不进行具体的限定。

206、将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。

在具体的应用场景中,在执行本实施例步骤之前,需要将文字特征和图像特征进行特征融合,具体可将文字特征和图像特征进行特征向量的拼接,如将文字特征对应的特征向量拼接在图像特征对应的特征向量之后,或将图像特征对应的特征向量拼接在文字特征对应的特征向量之后,具体拼接方式不进行具体的限定。此外,还需要预先对患者招募项目预测模型进行预训练,直至判定患者招募项目预测模型符合预设训练标准,具体训练过程可参见实施例步骤103中的相关描述,在此不再赘述。

相应的,在判定患者招募项目预测模型训练完成后,可进一步执行本实施例步骤,相应的,实施例步骤206具体可以包括:将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,获取患者招募项目预测模型输出的针对各个候选招募项目的预测得分;将对应预测得分最高的候选招募项目确定为与受试患者匹配的目标招募项目。在具体的应用场景中,除了将对应预测得分最高的候选招募项目确定为与受试患者最为匹配的目标招募项目之外,作为另一种可选方式,还可按照预测得分由高到低的顺序在候选招募项目提取预设数量个与受试患者较为匹配的目标招募项目,并提供匹配度较高的原因,供医学老师参考选取。

为了完整的说明本申请中的技术方案,在此结合说明书附图3中一种患者招募项目智能匹配的原理示意图,对本申请的实现过程进行完整的说明:在获取到受试患者的疾病材料信息后,通过OCR识别提取疾病材料信息中的文字特征,以及利用尺度不变特征变换(SIFT)提取疾病材料信息中的图像特征,进而基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;将文字特征和图像特征进行特征融合,得到多模态特征后,将多模态特征以及候选招募项目输入训练完成的xdeepFM模型(患者招募项目预测模型),获取xdeepFM模型输出的针对各个候选招募项目的预测得分,进而将对应预测得分最高的候选招募项目确定为与受试患者匹配的目标招募项目。

目前现有技术方案在进行患者招募项目的匹配分析时,往往是在患者线索提交后,招募团队首先要筛选出有效线索,排除一些无效的线索比如提交无效材料,年龄不符的。人工审核筛选出有效线索并提交后,需要后台人工进行初筛,初筛成功后的线索后人工再进行复筛,失败的需要给出初筛驳回的原因;进入复筛的线索由医学老师对线索进行病情分析,看病人的医学材料,提取匹配是否符合招募项目最终的条件,符合条件的提报给用药厂商。这样就面临着一个问题,当线索较多时,人工审核时间慢,审核的准确率也难以保证。而本申请则是从患者特征匹配项目特征的角度出发,去计算患者材料文字特征与项目特征的相似度,进而来判断该患者是否适合该招募项目,对于患者与项目匹配度很低时,直接将线索排除掉,减少人工审核时间,并反馈出驳回原因;反之,则将与患者线索匹配度较高的预设招募项目确定为该受试患者的候选招募项目,进一步基于患者材料文字特征与患者影像图片特征对应的多模态融合特征,以及利用患者招募项目预测模型在候选招募项目中提取出与受试患者最为匹配的目标招募项目,并提供匹配度较高的原因,供医学老师参考。本申请中的技术方案,可通过智能化的算法来提高患者招募效率,以及匹配的精准度,对于大数据时代必将是大势所趋。

借由上述患者招募项目智能匹配方法,可首先在获取到受试患者的疾病材料信息后,利用光学字符识别技术提取疾病材料信息对应的文字特征,以及利用尺度不变特征变换技术提取疾病材料信息对应的图像特征;进一步的,基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;最后将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。通过本申请中的技术方案,可通过将光学字符识别技术、尺度不变特征变换技术以及模型推荐算法技术运用在患者招募中,可从多个层面完成患者与招募项目的匹配,借此智能、自动匹配项目,流程自动化,可减少人力和物力成本,提高患者招募项目匹配的效率,使识别准确率也得到了有效保证。

进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种患者招募项目智能匹配装置,如图4所示,该装置包括:第一提取模块31、筛选模块32、输入模块33。

第一提取模块31,可用于获取受试患者的疾病材料信息,提取疾病材料信息对应的文字特征以及图像特征;

筛选模块32,可用于基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;

输入模块33,可用于将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。

在具体的应用场景中,如图5所示,第一提取模块31,包括:第一提取单元311、第二提取单元312;

第一提取单元311,可用于利用光学字符识别技术将图像信息转换为第二文本信息,根据预设关键词在第一文本信息和第二文本信息中提取疾病材料信息对应的文字特征;

第二提取单元312,可用于利用尺度不变特征变换技术提取图像信息中与尺度缩放、旋转、亮度变化无关的图像特征。

在具体的应用场景中,如图5所示,筛选模块32,包括:获取单元321、筛选单元322;

获取单元321,可用于获取预先根据医学知识规则创建的医学知识图谱;

筛选单元322,可用于根据文字特征在医学知识图谱中筛选与受试患者匹配的候选招募项目。

在具体的应用场景中,医学知识图谱中包含各个预设招募项目以及各个预设招募项目对应的项目特征,筛选单元322,具体可用于计算文字特征与各个预设招募项目对应项目特征的特征相似度;将对应特征相似度大于预设相似度阈值的预设招募项目确定为与受试患者匹配的候选招募项目。

在具体的应用场景中,如图5所示,该装置还包括:第二提取模块34、生成模块35、创建模块36;

第二提取模块34,可用于根据医学知识规则提取与各个预设招募项目匹配的项目特征;

生成模块35,可用于生成各个预设招募项目的第一特征标签,各个预设招募项目所匹配项目特征对应的第二特征标签,以及第一特征标签与第二特征标签的匹配映射关系;

创建模块36,可用于创建包含第一特征标签、第二特征标签以及匹配映射关系的医学知识图谱。

在具体的应用场景中,如图5所示,该装置还包括:训练模块37;

训练模块37,可用于获取完成招募项目匹配的样本数据,并将样本数据划分为训练集和测试集,其中,样本数据中配置有匹配成功的目标招募项目标签;利用训练集迭代训练患者招募项目预测模型,直至利用测试集验证患者招募项目预测模型的预测精准度大于预设阈值,判定患者招募项目预测模型训练完成。

在具体的应用场景中,如图5所示,输入模块33,包括:输入单元331、确定单元332;

输入单元331,可用于将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,获取患者招募项目预测模型输出的针对各个候选招募项目的预测得分;

确定单元332,可用于将对应预测得分最高的候选招募项目确定为与受试患者匹配的目标招募项目。

基于上述如图1和图2所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1至图2所示的方法。

基于上述如图1所示方法和如图4所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图6所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上处理器41执行程序时实现如图1至图2所示的方法。

通过本发明的技术方案,可首先在获取到受试患者的疾病材料信息后,利用光学字符识别技术提取疾病材料信息对应的文字特征,以及利用尺度不变特征变换技术提取疾病材料信息对应的图像特征;进一步的,基于医学知识规则,根据文字特征筛选与受试患者匹配的候选招募项目;最后将文字特征和图像特征进行特征融合后的多模态特征,以及候选招募项目输入训练完成的患者招募项目预测模型,得到与受试患者匹配的目标招募项目。通过本申请中的技术方案,可通过将光学字符识别技术、尺度不变特征变换技术以及模型推荐算法技术运用在患者招募中,可从多个层面完成患者与招募项目的匹配,借此智能、自动匹配项目,流程自动化,可减少人力和物力成本,提高患者招募项目匹配的效率,使识别准确率也得到了有效保证。

本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。

本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号