首页> 中国专利> 基于结构化病历数据库的参考病历检索方法及装置

基于结构化病历数据库的参考病历检索方法及装置

摘要

本发明公开了一种基于结构化病历数据库的参考病历检索方法及装置,该方法包括:以新病历的已检查项目为准则、病历数据库中新病历以前的历史病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;计算准则层相对于目标层的权重;计算新病历与历史病历的单项相似度;将相对同一历史病历的各个单项相似度与权重对应相乘获取新病历与历史病历的综合相似度;利用诊治医师和医院的等级指数计算历史病历的参考价值指数;利用综合相似度与参考价值指数确定新病历与历史病历的综合匹配度;以及选取综合匹配度高的历史病历作为该新病历的参考病历。该装置包括用于实现上述步骤的多个模块。本发明能够有效地利用病历大数据辅助医师进行诊疗。

著录项

  • 公开/公告号CN104881463A

    专利类型发明专利

  • 公开/公告日2015-09-02

    原文格式PDF

  • 申请/专利权人 清华大学深圳研究生院;

    申请/专利号CN201510268875.4

  • 申请日2015-05-22

  • 分类号G06F17/30(20060101);

  • 代理机构44257 深圳市汇力通专利商标代理有限公司;

  • 代理人李保明;张慧芳

  • 地址 518055 广东省深圳市南山区西丽大学城清华校区

  • 入库时间 2023-12-18 10:45:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-06

    未缴年费专利权终止 IPC(主分类):G06F17/30 专利号:ZL2015102688754 申请日:20150522 授权公告日:20180116

    专利权的终止

  • 2018-01-16

    授权

    授权

  • 2015-09-30

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150522

    实质审查的生效

  • 2015-09-02

    公开

    公开

说明书

技术领域

本发明涉及模式识别、相似性测度及电子病历领域,更具体地说,涉及一种基于结构化 病历数据库的参考病历检索方法及装置。

背景技术

电子病历是医疗信息化的必然产物,具备传统纸质病历所不具备的优点,比如便于保存、 传阅,并便于进一步开发病历的潜在价值。近年来,有关电子病历的应用研究逐渐增多,但 大多数仅限于记录患者的症状和治疗过程,而对其包含的大量信息再应用涉及较少。电子病 历既是患者的诊疗过程的记录,也是医生经验的载体,其包含了医生的经验以及患者个体化 差异的大量信息。所以对于电子病历的信息挖掘,会极大地发挥医疗大数据信息资源的临床 价值。

发明内容

本发明的目的是提供一种基于结构化病历数据库的参考病历检索方法及装置,该方法及 装置能够找出对患者诊疗方案更具参考意义的参考病历,以解决现有病历大数据未能有效利 用的问题。

本发明的具体技术方案如下:

一种基于结构化病历数据库的参考病历检索方法,该检索方法包括:

以新病历的已检查项目为准则、病历数据库中新病历以前的历史病历为待选方案建立 目标层-准则层-方案层三层结构的层次模型;

计算准则层相对于目标层的权重;

计算新病历与历史病历的单项相似度,所述单项相似度是对单个检查项目而言两个病历 的相似程度;

将相对同一历史病历的各个单项相似度与权重对应相乘获取新病历与历史病历的综合 相似度;

利用诊治医师和医院的等级指数计算历史病历的参考价值指数;

利用综合相似度与参考价值指数确定新病历与历史病历的综合匹配度;以及

选取综合匹配度高的历史病历作为该新病历的参考病历;

所述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。

在上述的基于结构化病历数据库的参考病历检索方法中,优选地,在计算准则层相对于 目标层的权重的步骤中,包括:用各个已检查项目与疾病的关联度指数构造准则层相对于目 标层的判断矩阵;以及将判断矩阵的各行向量进行几何平均,然后进行归一化处理得到目标 层的权重。

在上述的基于结构化病历数据库的参考病历检索方法中,优选地,在计算新病历与历史 病历的单项相似度的步骤中,采用距离系数来判定两个病历之间的匹配度。

在上述的基于结构化病历数据库的参考病历检索方法中,优选地,所述距离系数为相对 海明距离Dij,单项相似度Sij计算如下:

Sij=1-1mDij=1-1mΣk=1m|xki-xkj||xkmax-xkmin|

其中,i和j表示进行比较的两个病历,xk表示已检查项目k的指标,xkmax表示所有病历中 xk指标的最大值,xkmin表示所有病历中xk指标的最小值,m为指标个数,0≤Dij≤m。

在上述的基于结构化病历数据库的参考病历检索方法中,优选地,所述病历数据库以时 间为主索引,每个时间点上包含各项相关检查的子索引,子索引分层设置。

一种基于结构化病历数据库的参考病历检索装置,该检索装置包括:

层次模型构造模块,用于以新病历的已检查项目为准则、病历数据库中新病历以前的历 史病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;

权重计算模块,用于计算准则层相对于目标层的权重;

单项相似度计算模块,用于计算新病历与历史病历的单项相似度,所述单项相似度是对 单个检查项目而言两个病历的相似程度;

综合相似度计算模块,用于将相对同一历史病历的各个单项相似度与权重对应相乘获取 新病历与历史病历的综合相似度;

参考价值指数计算模块,用于利用诊治医师和医院的等级指数计算历史病历的参考价值 指数;

综合匹配度计算模块,用于利用综合相似度与参考价值指数确定新病历与历史病历的综 合匹配度;以及

输出检索结果模块,用于选取综合匹配度高的历史病历作为该新病历的参考病历;

所述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。

在上述的基于结构化病历数据库的参考病历检索装置中,优选地,所述权重计算模块包 括:判断矩阵构造子模块,用于用各个已检查项目与疾病的关联度指数构造准则层相对于目 标层的判断矩阵;以及矩阵处理子模块,用于将判断矩阵的各行向量进行几何平均,然后进 行归一化处理得到目标层的权重。

在上述的基于结构化病历数据库的参考病历检索装置中,优选地,在所述单项相似度计 算模块中,采用距离系数来判定两个病历之间的匹配度。

在上述的基于结构化病历数据库的参考病历检索装置中,优选地,在所述单项相似度计 算模块中,所述距离系数为相对海明距离Dij,单项相似度Sij计算如下:

Sij=1-1mDij=1-1mΣk=1m|xki-xkj||xkmax-xkmin|

其中,i和j表示进行比较的两个病历,xk表示已检查项目k的指标,xkmax表示所有病历中 xk指标的最大值,xkmin表示所有病历中xk指标的最小值,m为指标个数,0≤Dij≤m。

在上述的基于结构化病历数据库的参考病历检索装置中,优选地,所述病历数据库以时 间为主索引,每个时间点上包含各项相关检查的子索引,子索引分层设置。

本发明通过将医疗机构的病历结构化,构建病历数据库,进而依托病人已经进行的检查 结果检索获得与病人最为相似的病历,从而能够为医生进行个性化的诊治提供有价值的参 考。

附图说明

图1为本发明基于结构化病历数据库的参考病历检索方法一些实施例的流程图;

图2为其层次模型的示意图;

图3为其病历数据库部分分类索引的结构示意图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。这些更详细的描述旨在帮助理解本发明, 而不应被用于限制本发明。根据本发明公开的内容,本领域技术人员明白,可以不需要一些 或者所有这些特定细节即可实施本发明。而在其它情况下,为了避免将发明创造淡化,未详 细描述众所周知的操作过程。

层次分析法是一种利用定性和定量分析寻求最优解决方案的方法,在管理领域应用较 多。本发明在层次分析法基础上进行改进,尝试运用于临床领域,为电子病历的潜在价值的 开发利用提供技术支持。

如图1所示,一些实施例基于结构化病历数据库的参考病历检索方法包括以下步骤:

步骤S100,以新病历的已检查项目为准则、病历数据库中新病历以前的历史病历为待 选方案建立目标层-准则层-方案层三层结构的层次模型。

在一些实施例中,以冠心病为例进行说明,建立的层次模型如图2所示,已进行的检查 项目包括常规心电、运动心电、核医学、超声、CT、冠状动脉造影,它们构成了准则层。 依据传统的层次分析法并结合在本技术中的应用建立。计算准则层相对于目标层的权重时利 用层次分析法中的构造判断矩阵的方法,但在计算方案层相对准则层的权重时,由于方案层 中的方案指的是病历数据库中的各个病例,而病例数据量较大,无法由人工判断各病例相对 于各准则的权重,即不能利用构造判断矩阵的方法,所以此处的确定各病例的权重归为依据 各准则(常规心电相似、运动心电相似、核医学相似、超声相似、CT相似、冠状动脉造影 相似)计算病历数据库中各病例与新入病例的相似度,同时结合每个病历的重要性。

步骤S200,计算准则层相对于目标层的权重。

首先,构造准则层相对于目标层的判断矩阵,具体地,用各个已检查项目与疾病的关联 度指数构造准则层相对于目标层的判断矩阵。各项检查相对于冠心病确诊的重要性(即各个 已检查项目与疾病的关联度指数)由经验医生给出,举例如下:

表中,E1为常规心电,E2为运动心电,E3为核医学,E4为超声,E5为CT,E6为冠状动 脉造影,e为关联度指数。则,判断矩阵为:

A=1e12e13e14e15e16e211e23e24e25e26e31e321e34e35e36e41e42e431e45e46e51e52e53e541e56e61e62e63e64e651

通常eij与eji呈倒数关系。

接下来,利用判断矩阵确定各准则相对于目标的权重系数,具体的,将判断矩阵的各行 向量进行几何平均,然后进行归一化处理得到目标层的权重。举例来说,将上述判断矩阵A 各行向量进行几何平均,由

Wi=Πj=1neijn,i=1,2,...,n

此处n=6,可得,

W=W1W2W3W4W5W6

对W向量归一化,由

wi=WiΣi=1nWi,i=1,2,...,n,n=6

得到

w=w1w2w3w4w5w6.

为了获得更好效果,进一步地,还包括:计算判断矩阵的最大特征根,利用最大特征根 计算一致性指标,检验判断矩阵的一致性,获得具有良好一致性的权重。具体的,根据

λmax=1nΣi=1n(Aw)iwi

计算判断矩阵的最大特征根λmax;由

CI=λmax-nn-1

计算一致性指标CI,与平均随机一致性指标RI计算得到判断矩阵的一致性比率CR=CI/RI, 若CR小于0.1,说明判断矩阵具有满意的一致性,不需要调整,权重系数w可用。

步骤S300,计算新病历与历史病历的单项相似度,所述单项相似度是对单个检查项目 而言两个病历的相似程度。

每个病历都是由一系列诊断指标数据序列所组成,计算两个数据序列的相似度较常用的 方法包括相关系数、相似系数、距离系数和相似离度。相关系数和相似系数一般用来判断数 据序列的形相似,距离系数多用于判断值相似,相似离度是一种比较新的方法,结合了形相 似和值相似,但实际运用中效果并不十分理想。在此应用中,由于病历中每个指标即每个数 据点代表的意义不尽相同,用值相似来判断两个病历之间的匹配度更为合适,所以一些实施 例中采用距离系数来判定两个病历之间的匹配度。

距离系数主要包括绝对距离(即海明距离)和欧式距离,相比而言,绝对距离更能反映 两序列之间的值相似程度,所以一些实施例中采用绝对距离:

Adij=Σk=1m|xki-xkj|

其中m为每项检查项目下可量化的诊断指标数量。由于在比较病历的相似程度上,每个用 于比较的指标意义不同,量纲不同,为了去除量纲的影响,一些实施例中还对绝对距离进行 了改进,使用相对海明距离:

Dij=Σk=1m|xki-xkj||xkmax-xkmin|

具体的,单项相似度Sij计算如下:

Sij=1-1mDij=1-1mΣk=1m|xki-xkj||xkmax-xkmin|

其中,i和j表示进行比较的两个病历,xk表示已检查项目k的指标,xkmax表示所有病历中 xk指标的最大值,xkmin表示所有病历中xk指标的最小值,m为指标个数,0≤Dij≤m。可知0 ≤Sij≤1。

步骤S400,将相对同一历史病历的各个单项相似度与权重对应相乘获取新病历与历史 病历的综合相似度。

由步骤S300可以确定新病历与病历数据库中的历史病历分别在常规心电、运动心电、 核医学、超声、CT、冠状动脉造影六方面的相似度,即单项相似度,可表示如下(n为病历 数):

Susual-ecg=susual-ecg1susual-ecg2...susual-ecgnSsport-ecg=ssport-ecg1ssport-ecg2...ssport-ecgnSmpi=smpi1smpi2...smpinsus=sus1sus2...susn

Sct=sct1sct2...sctnScag=scag1scag2...scagn

综合六项得到排序值矩阵:

S=susual-ecg1ssport-ecg1smpi1sus1sct1scag1susual-ecg2ssport-ecg2smpi2sus2sct2scag2..................susual-ecgnssport-ecgnsmpinsusnsctnscagn

与步骤S200得到的权重向量w相乘得到病历的综合相似度SS:

SS=S×w=susual-ecg1ssport-ecg1smpi1sus1sct1scag1susual-ecg2ssport-ecg2smpi2sus2sct2scag2..................susual-ecgnssport-ecgnsmpinsusnsctnscagn×w1w2w3w4w5w6=SS1SS2...SSn.

步骤S500,利用诊治医师和医院的等级指数计算历史病历的参考价值指数。

病历的重要性即病历本身的参考价值。此处主要由病历所在的医院等级、主诊医生的经 验等级来进行测定。医院等级按目前划分标准分为十个等级,参考价值指数由三级特等到一 级丙等依次递减,如下表所示:

其中p_h1到p_h10满足

1≥p_h1>p_h2>…>p_h10>0

具体数值可由大数据统计分析得出。

诊治医生经验等级主要按照医生的职称级别来量化,职称级别越高,参考价值指数越大, 如下表:

其中p_d1到p_d4满足

1≥p_d1>p_d2>p_d3>p_d4>0

具体数值可由大数据统计分析得出。

进而可以得出每项病历的参考价值指数(即重要性)为:

Pi=p_hi×p_di

可知0<Pi≤1。

步骤S600,利用综合相似度与参考价值指数确定新病历与历史病历的综合匹配度。

将步骤S400中得到的综合相似度与步骤S500中得到的病历的参考价值指数结合起来得 到病历的综合匹配度,可以使检索到的病历既与待诊病人(即新病历)情况相似,又具有一 定的参考价值。具体的,综合匹配度可通过以下公式计算:

SM=(SS+P)/2=12(SS1SS2...SSn+P1P2...Pn)=[12(SS1+P1)12(SS2+P2)...12(SSn+Pn)].

步骤S700,选取综合匹配度高的历史病历作为该新病历的参考病历。例如,按照SM值 由大到小显示每个病历概况,前几项则为与待查新病历最为相关的病历,可用于个性化参考。

上述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。可以采 用基于XML的方法将医院的病历进行结构化,再从中建立更具有针对性的病历数据库。在 创建结构化病历数据库过程中,我们优选有经验的医生治愈的病历,使得最终检索得到的病 历可参考性更强。所述病历数据库以时间为主索引,每个时间点上包含各项相关检查的子索 引,子索引分层设置,从而便于更高效的进行检索和应用。如图3所示,主索引(一级索引) 包括“门诊”、“影像诊断”、“住院”、“确诊”、“治疗”等,子索引分层设置,例如,“门诊” 的二级索引包括“病人主述”、“初步心电”等;“病人主述”的下一级索引(三级索引)包括 胸闷、胸痛等,“初步心电”的下一级索引(三级索引)包括心率、PR间期等。

一些实施例的基于结构化病历数据库的参考病历检索装置,与上述检索方法中的步骤相 对应,具体包括:

层次模型构造模块,用于以新病历的已检查项目为准则、病历数据库中新病历以前的历 史病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;

权重计算模块,用于计算准则层相对于目标层的权重;

单项相似度计算模块,用于计算新病历与历史病历的单项相似度,所述单项相似度是对 单个检查项目而言两个病历的相似程度;

综合相似度计算模块,用于将相对同一历史病历的各个单项相似度与权重对应相乘获取 新病历与历史病历的综合相似度;

参考价值指数计算模块,用于利用诊治医师和医院的等级指数计算历史病历的参考价值 指数;

综合匹配度计算模块,用于利用综合相似度与参考价值指数确定新病历与历史病历的综 合匹配度;以及

输出检索结果模块,用于选取综合匹配度高的历史病历作为该新病历的参考病历;

所述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。

优选地,所述权重计算模块包括:判断矩阵构造子模块,用于用各个已检查项目与疾病 的关联度指数构造准则层相对于目标层的判断矩阵;以及矩阵处理子模块,用于将判断矩阵 的各行向量进行几何平均,然后进行归一化处理得到目标层的权重。

优选地,在所述单项相似度计算模块中,采用距离系数来判定两个病历之间的匹配度。 更优选地,所述单项相似度计算模块中,所述距离系数为相对海明距离Dij,单项相似度Sij计算如下:

Sij=1-1mDij=1-1mΣk=1m|xki-xkj||xkmax-xkmin|

其中,i和j表示进行比较的两个病历,xk表示已检查项目k的指标,xkmax表示所有病历中 xk指标的最大值,xkmin表示所有病历中xk指标的最小值,m为指标个数,0≤Dij≤m。

优选地,所述病历数据库以时间为主索引,每个时间点上包含各项相关检查的子索引, 子索引分层设置。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号