公开/公告号CN112201350A
专利类型发明专利
公开/公告日2021-01-08
原文格式PDF
申请/专利权人 北京嘉和海森健康科技有限公司;
申请/专利号CN202011253487.6
申请日2020-11-11
分类号G16H50/20(20180101);G16H40/20(20180101);G16H10/60(20180101);G06N20/00(20190101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人王娇娇
地址 100085 北京市海淀区上地信息产业基地开拓路7号1幢三层2307室
入库时间 2023-06-19 09:30:39
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种智能分诊方法、装置及电子设备。
背景技术
医学是一门知识性和专业性很强的学科。到医院就诊的患者通常因为缺乏医学知识,而不知道该去哪些科室挂号,导致挂错号的情况时有发生,这不仅会造成医疗挂号资源的浪费,还会耽误患者的就诊时间,甚至是延误病情,错失治疗时机。
对此,如何帮助患者在就诊时精准预测科室,成为本领域技术人员亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种智能分诊方法、装置及电子设备,能够基于患者的症状和医院的具体情况准确预测科室,降低患者挂错号的概率,节约医疗挂号资源。
为实现上述目的,本申请提供如下技术方案:
本申请提供一种智能分诊方法,包括:
获取患者的症状信息;
将所述症状信息输入预先完成训练的疾病预测模型,得到所述疾病预测模型对所述症状信息处理后输出的预测疾病;
基于所述预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与所述患者对应的科室。
可选的,所述疾病预测模型的训练过程,包括:
获取多个训练样本,每个训练样本包括症状信息、症状属性信息和标注信息,所述标注信息为疾病信息;
利用预先构建的学习模型对所述训练样本进行预测,得到预测结果;
根据所述预测结果和标注信息调整所述学习模型,直至调整后的学习模型满足预设收敛条件,将满足预设收敛条件的学习模型确定为所述疾病预测模型。
可选的,所述获取多个训练样本,包括:
获得多个历史病历;
确定目标科室集合,确定目标疾病集合;
从所述多个历史病历中筛选出目标病历,其中,所述目标病历中的科室信息属于所述目标科室集合,所述目标病历中的疾病信息属于所述目标疾病集合,所述目标病历中的症状信息属于针对所述目标病历中的疾病信息预先构建的症状信息集合;
对所述目标病历进行结构化处理,得到结构化病历;
对所述结构化病历进行数据清洗和数据标准化,得到标准化病历;
从一个标准化病历中提取症状信息、症状属性信息和疾病信息构成一个训练样本。
可选的,所述确定目标科室集合,包括:
将医院的临床科室中处于门诊开放挂号状态的科室确定为第一科室集合;
将所述多个历史病历中的症状信息对应的首诊科室确定为第二科室集合;
将所述第一科室集合和所述第二科室集合的交集确定为所述目标科室集合。
可选的,所述确定目标疾病集合,包括:
将所述目标科室集合中的科室信息对应的疾病确定为初级疾病集合;
基于医疗实体同义词库和医疗实体层级库对所述初级疾病集合进行扩充,得到目标疾病集合。
可选的,还包括:针对每一疾病,建立所述疾病与医院中科室的归属关系。
可选的,所述建立所述疾病与医院中科室的归属关系,包括:
根据所述疾病在医院就诊科室的数量占比,确定该疾病对应的一级匹配科室;
结合医学知识图谱的科室治疗范围,在该疾病对应的一级匹配科室中筛选治疗范围与所述疾病相符的二级匹配科室,建立所述疾病与所述二级匹配科室的归属关系。
可选的,所述获取患者的症状信息,包括:
获取在图形界面输入的症状信息;
或者,获取患者的问询语句,提取所述问询语句中的症状信息。
另外,本申请提供一种智能分诊装置,包括:
信息获取单元,用于获取患者的症状信息;
疾病预测单元,用于将所述症状信息输入预先完成训练的疾病预测模型,得到所述疾病预测模型对所述症状信息处理后输出的预测疾病;
科室预测单元,用于基于所述预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与所述患者对应的科室。
另外,本申请提供一种电子设备,包括处理器、存储器和通信接口;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现以上任意一种智能分诊方法的各个步骤。
由此可见:
本申请公开的智能分诊方法、装置及电子设备,首先获取患者的症状信息,由预先完成训练的疾病预测模型对患者的症状信息进行处理,输出预测疾病,之后结合预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与患者对应的科室。由于疾病与科室的归属关系是根据医院的实际数据构建的,因此,基于预测疾病和该归属关系确定出的科室,具备更高的精准性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请公开的一种智能分诊方法的流程图;
图2为本申请公开的医院中科室与疾病分布的示意图;
图3为本申请公开的训练疾病预测模型的方法的流程图;
图4为本申请公开的训练疾病预测模型过程中获取多个训练样本的方法的流程图;
图5为本申请公开的对结构化病历中的数据进行清洗和标准化前后的示意图;
图6为本申请公开的疾病同义词及层级关系的示意图;
图7为本申请公开的疾病层级的示意图;
图8为本申请公开的科室名称、科室类别和门诊开放挂号标志的示意图;
图9为本申请公开的症状、科室、频次及科室是否为首诊科室的示意图;
图10为本申请公开的科室与接诊疾病的数量的示意图;
图11为本申请公开的疾病、疾病出现症状以及症状出现数量的示意图;
图12为本申请公开的一种智能分诊装置的结构示意图;
图13为本申请公开的另一种智能分诊装置的结构示意图;
图14为本申请公开的一种电子设备的结构示意图。
具体实施方式
本申请公开一种智能分诊方法及装置,能够基于患者的症状和医院的具体情况准确预测科室,降低患者挂错号的概率,节约医疗挂号资源。
这里对本申请中出现的术语进行说明。
自然语言处理:自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。也就是说让计算机理解我们日常所使用的语言的价值。
机器学习:机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径。
电子病历:电子病历(EMR)也叫计算机化的病案系统或基于计算机的病人记录。它是用电子设备(计算机、健康卡等)保存、管理、传输和重现的数字化的医疗记录,用以取代手写纸张病历。它的内容包括纸张病历的所有信息。
医学知识图谱:医学知识图谱是智慧医疗应用的基石,可以为机器阅读理解医学文本、智能咨询、智能诊断提供知识基础。利用自然语言处理与文本挖掘技术,以人机结合的方式构建的国际医学标准术语集以及规模庞大、多源异构的临床路径指南、临床实践、医学百科等资源,覆盖了疾病、药物和诊疗技术,构建过程中的描述体系、关键技术、构建流程以及医学知识描述等相关问题。
医疗同义词:是指同一医疗数据的不同的表达方式。
医疗层级:是指医疗分词词库中的词的父子关系,例如,疾病层级是指疾病之间的父子关系,如图7所示。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,图1为本申请公开的一种智能分诊方法的流程图。
该方法应用于电子设备,该电子设备可以为提供远程挂号服务的服务器,也可以为设置于医院内的终端。该方法包括:
S101:获取患者的症状信息。
实施中,可以通过多种方式获取患者的症状信息。
例如,用户(可能为患者,也可以为除患者之外的其他人员)在电子设备展示的图形界面输入患者的症状信息。可选的,图形界面显示备选的症状信息,用户根据患者的具体情况选择其中的部分症状信息,在完成选择操作后点击确认控件,就完成患者的症状信息的输入。图形界面是能够进行人机交互的前端页面。
例如,获取患者的问询语句,提取问询语句中的症状信息。也就是说,对患者的问询语句进行分析,从而确定并提取到问询语句中的症状信息。
S102:将症状信息输入预先完成训练的疾病预测模型,得到疾病预测模型对症状信息处理后输出的预测疾病。
其中,训练疾病预测模型所使用的训练样本是基于历史病历生成的。历史病历中包含患者的症状、症状属性、患者所患疾病、以及患者就诊的科室。疾病预测模型具备将患者的预测疾病趋于患者的实际疾病的能力。
需要说明的是,疾病预测模型的输出通常包括多个备选疾病和各个备选疾病的分数(也就是概率值)。在一种可能的实现方式中,将分数最高的备选疾病确定为该患者的预测疾病。在另一种可能的实现方式中,将分数超过预设数值的备选疾病确定为该患者的预测疾病,此时,预测疾病可能为多个。在另一种可能的实现方式中,按照分数从高到低的顺序排列各个备选疾病,将位于前M位的备选疾病确定为该患者的预测疾病,M为2或者大于2的整数。
S103:基于预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与患者对应的科室。
患者所患疾病的就诊科室,与就诊医院、该医院中科室的治疗范围、医师擅长治疗的疾病、以及疾病进展程度的不同,有直接关系。本申请中,预先针对医院构建疾病与科室的归属关系。需要说明的是,至少根据医院的实际数据构建疾病与科室的归属关系。
可以理解的是,某一疾病应归属于医院中对该疾病具有较好治疗能力的科室。例如,在A医院,心血管内科和老年病科具备较好的治疗高血压的能力,因此,针对A医院,建立高血压与心血管内科和老年病科的归属关系。在B医院,高血压门诊具备较好的治疗高血压的能力,因此,针对B医院,建立高血压与高血压门诊的归属关系。
需要说明的是,患者的预测疾病可能为一个也可能为多个。
在该患者的预测疾病为一个的情况下,如果该预测疾病归属于多个科室,那么与该患者对应的科室为多个,如果该预测疾病归属于一个科室,那么与该患者对应的科室为一个。
在该患者的预测疾病为多个的情况下,分别确定各个预测疾病所归属的科室,将各个预测疾病所归属的科室的并集作为该患者对应的科室。
本申请公开的智能分诊方法,首先获取患者的症状信息,由预先完成训练的疾病预测模型对患者的症状信息进行处理,输出预测疾病,之后结合预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与患者对应的科室。由于疾病与科室的归属关系是根据医院的实际数据构建的,因此,基于预测疾病和该归属关系确定出的科室,具备更高的精准性。
在图1所示智能分诊方法的基础上,还可以进一步设置:针对每一疾病,建立该疾病与医院中科室的归属关系。
其中,建立疾病与医院中科室的归属关系,除了将医院的实际数据作为依据之外,还可以结合医学知识图谱。下面对建立疾病与医院中科室的归属关系的一个方案进行说明。
建立疾病与医院中科室的归属关系,具体包括:
A1:根据疾病在医院就诊科室的数量占比,确定该疾病对应的一级匹配科室;
A2:结合医学知识图谱的科室治疗范围,在该疾病对应的一级匹配科室中筛选治疗范围与该疾病相符的二级匹配科室,建立该疾病与所述二级匹配科室的归属关系。
这里结合图2进行说明。
针对某医院,统计高血压在医院各科室就诊的数量,将数量达到预设阈值的科室确定为高血压对应的一级匹配科室。如图2中所示,高血压在老年病内科、心血管内科和内分泌科的数量达到预设阈值,因此将老年病内科、心血管内科和内分泌科确定为一级匹配科室。
之后,结合医学知识图谱的科室治疗范围,在一级匹配科室中进行筛选,确定治疗范围与高血压相符的科室作为二级匹配科室。在医学知识图谱中,高血压为循环系统和老年人群相关疾病,而内分泌科的主要治疗范围为内分泌系统相关疾病,因此老年病内科和心血管内科的治疗范围与高血压相符,而内分泌科的治疗范围与高血压不符。据此,将老年病内科和心血管内科作为二级匹配科室,建立高血压与老年病内科和心血管内科的归属关系。
本申请上述公开的建立疾病与医院中科室的归属关系的方案,利用了医院的实际数据,具有大数据统计分析意义,同时结合基于循证医学构建的医学知识图谱,使得疾病与科室的归属关系的构建更加客观,能够进一步提高为患者确定的科室的精准性。
下面对本申请使用的疾病预测模型的训练过程进行说明。
参见图3,图3为本申请公开的训练疾病预测模型的方法的流程图。该方法包括:
S301:获取多个训练样本。
其中,每个训练样本是基于一个历史病历生成。每个训练样本包括症状信息、症状属性信息和标注信息,标注信息为疾病信息。其中,症状属性信息包括但不限于症状诱因、症状持续时间。
例如,病历信息为:喝酒后头晕。那么,症状信息为:头晕;症状属性包括症状诱因,具体为喝酒。
例如,病历信息为:头疼3天。那么,症状信息为:头疼;症状属性包括症状持续时间,具体为3天。
S302:利用预先构建的学习模型对训练样本进行预测,得到预测结果。
S303:根据预测结果和标注信息调整学习模型,直至调整后的学习模型满足预设收敛条件,将满足预设收敛条件的学习模型确定为疾病预测模型。
预先构建的学习模型的初始模型参数均为自定义数值,训练学习模型的过程就是优化模型参数,以使得学习模型逐渐收敛,且预测结果的准确率逐渐提高的过程。当学习模型满足预设收敛条件时,将当前的学习模型确定为疾病预测模型。
在一种可能的实现方式中,预设收敛条件为:预设损失函数的值小于预设的第一阈值。其中,预设损失函数表征预测结果和标注信息之间的误差。
在一种可能的实现方式中,预设收敛条件包括:预设损失函数的值小于预设的第一阈值;对验证样本的识别准确率达到预设的第二阈值。其中,第一阈值和第二阈值均为经验值。
下面对获取多个训练样本的方案进行说明。
参见图4,图4为本申请公开的训练疾病预测模型过程中获取多个训练样本的方法的流程图。该方法包括:
S401:获得多个历史病历。
历史病历中包含患者的症状、症状属性、患者所患疾病、以及患者就诊的科室。
S402:确定目标科室集合,确定目标疾病集合。
S403:从多个历史病历中筛选出目标病历。
在一种可能的实现方式中,目标病历中的科室信息属于目标科室集合,目标病历中的疾病信息属于目标疾病集合。
在另一种可能的实现方式中,目标病历中的科室信息属于目标科室集合,目标病历中的疾病信息属于目标疾病集合,并且,目标病历中的症状信息属于针对该目标病历中的疾病信息预先构建的症状信息集合。
实施中,对大量的历史病历进行分析,统计各个疾病出现的症状以及各个症状出现的次数,基于各个症状出现的次数确定各疾病的常见症状。例如,将某个疾病下出现次数达到预设数值的症状确定为该疾病的常见症状,或者,将某个疾病下出现频次达到预设数值的症状确定为该疾病的常见症状。其中,某个症状的出现频次是指:该症状在该疾病下出现的次数与该疾病下各症状出现总次数的比值。将疾病的常见症状信息加入该疾病对应的症状信息集合。
也就是说,针对某个疾病信息预先构建的症状信息集合中的症状信息为:该疾病信息所指示疾病的常见症状信息。例如,在关于该疾病信息的历史病历中,出现次数或出现频次达到预设数值的症状信息加入为该疾病信息构建的症状信息集合。
例如,对大量的历史病历进行分析,疾病、疾病出现症状以及各症状出现数量如图11所示。关于冠状动脉性心脏病患者的病历中,症状信息“心悸”、“胸部疼痛”、“胸闷”、“呼吸困难”、“气短”和“喘息”的出现次数达到预设数值,而症状信息“视物模糊”、“视物变形”、“尿频”、“尿痛”、“排尿困难”的出现次数小于预设数值,那么针对冠状动脉性心脏病构建的症状信息集合包括“心悸”、“胸部疼痛”、“胸闷”、“呼吸困难”、“气短”和“喘息”,当然,这仅是一个举例。
医院中的科室众多,疾病种类众多,在步骤S401中获得的多个历史数据是从海量历史数据中获取的,可能包含了不适于智能分诊的科室或者疾病。另外,某些患者的症状可能不具有普遍性,例如,极少数的冠状动脉性心脏病患者会出现尿频、尿痛和排尿困难,而大部分的冠状动脉性心脏病患者不会出现前述的症状。因此,要根据目标科室集合、目标疾病集合、以及针对各个疾病信息预先构建的症状信息集合对获得的多个历史病历进行筛选。
具体的,如果某个历史病历中的科室信息不属于目标科室集合,那么将该历史病历去除,如果某个历史病历中的疾病信息不属于目标疾病集合,那么将该历史病历去除。进一步的,如果某个历史病历中的科室信息属于目标科室集合,该历史病历中的疾病信息属于目标疾病集合,但该历史病历中的症状信息不属于针对该历史病历中的疾病信息预先构建的症状信息集合,那么将该历史病历去除。也就是说,从多个历史病历中筛选出的目标病历,其中的科室信息属于目标科室集合,其中的疾病信息属于目标疾病集合,其中的症状信息属于针对该疾病信息预先构建的症状信息集合。
实施中,可以人工设定目标科室集合和目标疾病集合。也可以根据多个历史病历确定目标科室集合和目标疾病集合。在下文中会进行具体说明。
S404:对目标病历进行结构化处理,得到结构化病历。
通过自然语言处理技术,对目标病历进行结构化处理,以得到适用于机器学习的结构化病历。
例如,从历史病历中筛选出的一个目标病历如下:
“患者11年余前无明显诱因出现头晕,无视物旋转、黑曚、晕厥,无胸痛、胸闷、心悸、乏力,无恶心、呕吐,头晕呈持续性,具体时间不详,于外院诊为高血压,口服药物治疗,具体不详,治疗好转后患者自行停药,后未监测血压。此后患者头晕间断发作,性质同前,每日均有发作,但不影响日常活动,患者未诊治。1周前患者自觉头晕较前加重,性质同前,伴有心悸,持续不能缓解,自测血压210/130mmHg,口服降压药物治疗,具体药物不详,用药后于我院急诊就诊,查血压130/80mmHg,予口服拜新同30mgQd、缬沙坦80mgQd治疗,近1周患者规律用药,现为进一步诊治收入院。患者自发病以来精神可,饮食及睡眠可,大小便正常,体重无明显变化。”
对上述目标病历进行结构化处理得到的结构化病历如下:
S405:对结构化病历进行数据清洗和数据标准化,得到标准化病历。
历史病历中包含大量的垃圾数据、同义词数据、以及带有父子层级关系的数据。基于历史病历得到的结构化病历仍然存在这些问题,如果基于结构化病历中的信息进行疾病预测模型的训练,会影响疾病预测模型的预测准确性,因此,要对结构化病历进行数据清洗和数据标准化,得到对应的标准化病历。
实施中,基于数据清洗技术和医疗实体同义词库,对结构化病历中的数据进行清洗和标准化处理,即:将结构化病历中的数据转化为标准医学名词。如图5中所示,结构化病历中的“高血压病”、“高血压?”经过数据清洗,被处理为“高血压”,“高血压”是标准医学名词。结构化病历中的“冠心病”、“冠状动脉粥样硬化心脏病”、“冠心病?”经过数据清洗和数据标准化,被处理为“冠状动脉粥样硬化性心脏病”,“冠状动脉粥样硬化性心脏病”是标准医学名词。
S406:从一个标准化病历中提取症状信息、症状属性信息和疾病信息构成一个训练样本。
一个标准化病历用于生成一个训练样本。
需要说明的是,可以将全部的标准化病历用于生成训练样本,也就是,利用每一个标准化病历分别生成一个训练样本。也可以将全部的标准化病历划分为两部分,其中一部分标准化病历用于生成训练样本,其余的标准化病历用于生成验证样本。其中,每一个验证样本包括从标准化病历中提取的症状信息、症状属性信息和疾病信息。例如,标准化病历为2万个,其中的1.8万个用于生成训练样本,其余的2千个用于生成验证样本,共生成1.8万个训练样本和2千个验证样本。
本申请公开的获取训练样本的方案,在获得多个历史病历后,首先利用目标科室集合和目标疾病集合对多个历史病历进行筛选,得到目标病历,之后对目标病历进行结构化处理、数据清洗和数据标准化,得到标准化病历,之后利用标准化病历生成训练样本。
下面对确定目标科室集合的一个方案进行说明,具体包括:
B2:将医院的临床科室中处于门诊开放挂号状态的科室确定为第一科室集合。
B3:将多个历史病历中的症状信息对应的首诊科室确定为第二科室集合。
其中,症状信息对应的首诊科室是指:各科室中,该症状信息出现频次达到预设数值,且为首次诊断的科室。
B4:将第一科室集合和第二科室集合的交集确定为目标科室集合。
例如,某医院的科室名称、科室类别和门诊开放挂号标志如图8所示,由此确定第一科室集合包括心血管内科、老年病科、呼吸内科、消化内科、泌尿外科、妇科、眼科和普通外科。
再根据医院各科室接诊患者出现某些症状的频次,如图9所示,结合医学知识图谱确定原始病历中各症状信息对应的首诊科室(也就是首次就诊科室)。例如:多个原始病历中的症状为心悸、胸部疼痛、胸闷,对应的首诊科室为心血管内科和呼吸内科,即:第二科室集合包括心血管内科和呼吸内科。
第一科室集合和第二科室集合的交集包括心血管内科和呼吸内科,将该交集确定为目标科室集合。
下面对确定目标科室集合的方案进行说明。
确定目标科室集合的第一种方案,包括:将目标科室集合中的科室信息对应的疾病确定为目标疾病集合。
确定目标科室集合的第二种方案,包括:
C1:将目标科室集合中的科室信息对应的疾病确定为初级疾病集合。
其中,科室信息对应的疾病是指:在该科室信息指示的科室所接诊的疾病中,接诊数量达到预设数值的疾病。
例如,多个科室接诊的疾病,以及接诊疾病的数量的统计如图10所示,与心血管内科对应的疾病包括高血压和冠状动脉性心脏病。
C2:基于医疗实体同义词库和医疗实体层级库对初级疾病集合进行扩展,得到目标疾病集合。
需要说明的是,基于医疗实体同义词库和医疗实体层级库对初级疾病集合进行扩充,能够丰富预测疾病的范围,让预测疾病覆盖更多的有效特征,从而为精准预测疾病提供更好的数据支撑。
实施中,针对初级疾病集合中的疾病,根据医疗实体同义词库,获得前述疾病的同义词,根据医疗实体层级库,获得前述疾病的父级疾病和/或子级疾病,将获得的疾病的同义词、父级疾病和/或子级疾病加入初级疾病集合,以得到目标疾病集合,实现对预测疾病范围的有效扩充,让预测疾病覆盖更多有效特征,为精准预测科室提供基础数据支撑。
如图6所示,初始疾病集合包括“高血压”,“高血压”的同义词和子级疾病包括“原发性高血压”和“2期高血压”,根据医疗实体同义词库和医疗实体层级库对初始疾病集合进行扩充,得到的目标疾病集合包括“高血压”、“原发性高血压”、以及“2期高血压”。
在本申请公开的训练疾病预测模型的方案中,当采用第二种方案确定目标疾病集合时,是根据目标科室集合中的科室信息确定初级疾病集合,之后结合医疗实体同义词库和医疗实体层级库对初级疾病集合进行扩充,得到目标疾病集合;在获得历史病历后,至少基于目标科室集合和目标疾病集合从历史病历中筛选出目标病历,在对目标病历进行处理得到标准化病历后,基于标准化病历生成训练样本。可以看到,上述训练疾病预测模型的方案,能够在缩小疾病预测模型预测疾病的输出范围的情况下,同时扩充疾病预测模型训练过程中输入的有效特征,使得疾病预测模型的预测结果更加精准。
本申请上述公开了智能分诊方法,相应的,本申请还公开智能分诊装置。说明书中关于两者的描述可以相互参考。
参见图12,图12为本申请公开的一种智能分诊装置的结构示意图。该智能分诊装置包括:
信息获取单元100,用于获取患者的症状信息。
可选的,信息获取单元100用于:获取在图形界面输入的症状信息;或者,获取患者的问询语句,提取问询语句中的症状信息。
疾病预测单元200,用于将获取的症状信息输入预先完成训练的疾病预测模型,得到疾病预测模型对该症状信息处理后输出的预测疾病。
科室预测单元300,用于基于预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与该患者对应的科室。
本申请公开的智能分诊装置,首先获取患者的症状信息,由预先完成训练的疾病预测模型对患者的症状信息进行处理,输出预测疾病,之后结合预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与患者对应的科室。由于疾病与科室的归属关系是根据医院的实际数据构建的,因此,基于预测疾病和该归属关系确定出的科室,具备更高的精准性。
在另一个实施例中,在图12所示智能分诊装置的基础上,进一步设置模型训练单元400,模型训练单元400用于训练疾病预测模型。
模型训练单元400包括:
训练样本获取子单元,用于获取多个训练样本。其中,每个训练样本包括症状信息、症状属性信息和标注信息,标注信息为疾病信息。
数据处理子单元,用于利用预先构建的学习模型对训练样本进行预测,得到预测结果。
参数调整子单元,用于根据预测结果和标注信息调整学习模型,直至调整后的学习模型满足预设收敛条件,将满足预设收敛条件的学习模型确定为疾病预测模型。
可选的,训练样本获取子单元包括:
历史病历获取模块,用于获得多个历史病历。
目标科室集合确定模块,用于确定目标科室集合。
目标疾病集合确定模块,用于确定目标疾病集合;
病历筛选模块,用于从多个历史病历中筛选出目标病历。其中,目标病历中的科室信息属于目标科室集合,目标病历中的疾病信息属于目标疾病集合,目标病历中的症状信息属于针对目标病历中的疾病信息预先构建的症状信息集合。
病历结构化模块,用于对目标病历进行结构化处理,得到结构化病历。
病历标准化模块,用于对结构化病历进行数据清洗和数据标准化,得到标准化病历。
训练样本生成模块,用于从一个标准化病历中提取症状信息、症状属性信息和疾病信息构成一个训练样本。
可选的,目标科室集合确定模块具体用于:
将医院的临床科室中处于门诊开放挂号状态的科室确定为第一科室集合;将多个原始病历中的症状信息对应的首诊科室确定为第二科室集合;将第一科室集合和第二科室集合的交集确定为目标科室集合。
可选的,目标疾病集合确定模块具体用于:
将目标科室集合中的科室信息对应的疾病确定为初级疾病集合;基于医疗实体同义词库和医疗实体层级库对初级疾病集合进行扩充,得到目标疾病集合。
在另一个实施例中,在图12或图13所示的智能分诊装置的基础上,进一步设置归属关系预处理单元。归属关系预处理单元用于针对每一疾病,建立疾病与医院中科室的归属关系。
可选的,归属关系预处理单元建立疾病与医院中科室的归属关系,具体为:
根据疾病在医院就诊科室的数量占比,确定与该疾病对应的一级匹配科室;结合医学知识图谱的科室治疗范围,在该疾病对应的一级匹配科室中筛选治疗范围与该疾病相符的二级匹配科室,建立该疾病与二级匹配科室的归属关系。
本申请还提供一种电子设备。参见图14,图14示出了电子设备的硬件结构,该电子设备可以包括:至少一个处理器1401,至少一个通信接口1402,至少一个存储器1403和至少一个通信总线1404。
在本申请实施例中,处理器1401、通信接口1402、存储器1403、通信总线1404的数量为至少一个,且处理器1401、通信接口1402、存储器1403通过通信总线1404完成相互间的通信。
处理器1401可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等。
存储器1403可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器。
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取患者的症状信息;
将所述症状信息输入预先完成训练的疾病预测模型,得到所述疾病预测模型对所述症状信息处理后输出的预测疾病;
基于所述预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与所述患者对应的科室。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
获取患者的症状信息;
将所述症状信息输入预先完成训练的疾病预测模型,得到所述疾病预测模型对所述症状信息处理后输出的预测疾病;
基于所述预测疾病以及预先针对医院构建的疾病与科室的归属关系,确定与所述患者对应的科室。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、电子设备及存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
机译: 分诊标签管理系统和用于其的智能手机以及分诊标签管理方法
机译: 医学智能分诊方法和装置
机译: 医学智能分诊方法和装置