首页> 中国专利> 基于多元向量空间扭曲概念的电子病历检索优化系统

基于多元向量空间扭曲概念的电子病历检索优化系统

摘要

本发明公开一种基于多元向量空间扭曲概念的电子病历检索优化系统,包括空间向量库构建模块、调阅结果收集模块以及空间向量扭曲模块,空间向量库构建模块用于将所有电子病历的不同变量,采用不同的标准转换成空间向量中的一个或多个维度,构建空间向量库,再根据空间向量库构建多维空间;调阅结果收集模块用于对符合用户输入检索条件请求的具体电子病历,调取对应的空间向量;空间向量扭曲模块用于将用户的检索条件转换为空间向量,再进入空间向量扭曲计算,找到实际指向的检索条件,根据匹配计算划取周围的空间向量,将空间向量对应的电子病历按照距离大小降序排序返回用户进行选择;后然调阅结果进入调阅结果库,提供未来的检索结果优化。

著录项

  • 公开/公告号CN107480428A

    专利类型发明专利

  • 公开/公告日2017-12-15

    原文格式PDF

  • 申请/专利权人 广州慧扬健康科技有限公司;

    申请/专利号CN201710597825.X

  • 发明设计人 彭逢安;陈卫单;李卓研;

    申请日2017-07-20

  • 分类号

  • 代理机构深圳市合道英联专利事务所(普通合伙);

  • 代理人廉红果

  • 地址 510000 广东省广州市黄埔区茅岗村坑田大街32号广州鱼珠智谷E-PARK创意园区C03号

  • 入库时间 2023-06-19 04:03:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-07-28

    授权

    授权

  • 2018-01-09

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20170720

    实质审查的生效

  • 2017-12-15

    公开

    公开

说明书

技术领域

本发明涉及医疗技术领域,特别是指一种基于多元向量空间扭曲概念的电子病历检索优化系统。

背景技术

检索优化这一概念来源于针对网页检索的搜索引擎优化(SEO),两者都是根据某种特定规则改变检索结果的排名,但是由于检索原理的本质差异,两者又存在许多根本性的不同。搜索引擎的搜索算法在于“网络蜘蛛”在互联网上抓取软件,再采用Pagerank算法对抓取结果进行排序。

但在电子病历检索当中并不需要网络蜘蛛进行抓取,而是根据检索结果与检索条件的匹配程度进行排序。这一原理根本上的不同导致了在电子病历检索当中需要不一样的检索优化。

因此,有必要设计一种新的基于多元向量空间扭曲概念的电子病历检索优化系统,以解决上述技术问题。

发明内容

针对背景技术中存在的问题,本发明的目的是提供一种基于多元向量空间扭曲概念的电子病历检索优化系统,根据用户实际检索情况,改善检索结果的排序,建立基础是一定的用户使用量。

本发明的技术方案是这样实现的:一种基于多元向量空间扭曲概念的电子病历检索优化系统,包括空间向量库构建模块、调阅结果收集模块以及空间向量扭曲模块,其中,所述空间向量库构建模块:用于将所有电子病历的不同变量,采用不同的标准转换成空间向量中的一个或多个维度,经过转换成之后,构建一个空间向量库,再根据空间向量库构建多维空间;所述调阅结果收集模块:用于对符合用户输入的检索条件请求的具体电子病历,在空间向量库中调取对应的空间向量;所述空间向量扭曲模块:将用户的检索条件转换为空间向量,再进入空间向量扭曲计算,找到实际指向的检索条件,根据匹配计算划取周围的空间向量,将空间向量对应的电子病历按照距离大小降序排序返回用户进行选择;用户进行选择之后,调阅结果进入调阅结果库,提供未来的检索结果优化。

在上述技术方案中,所述不同变量的转换包括数值型数据转换、逻辑型变量转换和文本型变量转换。

在上述技术方案中,所述文本型变量转换包含特殊文本型变量转换和普通文本型变量转换。

在上述技术方案中,所述空间向量扭曲模块的步骤为:

a.将用户的检索条件转换为空间向量;

b.在调阅结果库中,抽取出与原检索条件对应向量距离小于等于d值的向量,共j个向量符合条件;

c.每个向量与原检索条件的距离为r,该向量对应的检索中心有n个,检索中心对应的向量分别为则按照公式计算出扭曲后的检索条件向量

得到的向量即为新的检索条件;

d.根据向量根据匹配算法划取周围的空间向量,将空间向量对应的电子病历按照距离大小降序排序,返回用户进行选择。

本发明基于多元向量空间扭曲概念的电子病历检索优化系统,包括空间向量库构建模块、调阅结果收集模块以及空间向量扭曲模块,在于对具体电子病历的多元向量抽象处理,以及多元向量对多维空间的扭曲用于电子病历检索的优化处理。本系统通过对电子病历的多元向量抽象并构建向量数据集,并根据各份病历针对具体检索条件调阅的情况,对各空间向量在多维空间中所占的位置进行扭曲,从而改变检索结果的指向。

附图说明

图1为本发明中调阅结果收集流程示意图;

图2为本发明中空间向量扭曲流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

原检索算法匹配到的结果不一定是用户所实际需求的,用户在某一检索条件之下所真正采纳的电子病历,才是该检索条件对检索结果的实际指向。本发明所述的一种基于多元向量空间扭曲概念的电子病历检索优化系统,通过对空间向量的扭曲,找到这一空间指向,其包括空间向量库构建模块、调阅结果收集模块以及空间向量扭曲模块,以下是对上述各模块的详细说明。

(1)空间向量库构建模块:

空间向量库的构建对于本检索优化系统来说是一项基础性的工作,必须先将档案馆中的电子病历数据库内的所有电子病历都先经过空间向量的抽象,才能进行后续的空间扭曲操作。

对具体电子病历的抽象,需要按照一定的标准进行。电子病历的复杂性在于其中包含许多变量,而这些变量的类型复杂多变,包括文本型、数据型和逻辑型。对于不同的变量,适宜采用不同的标准转换成空间向量中的一个或多个维度。其具体转换标准如下:

a.数值型数据:对于不同的数值型数据,由于在病历检索中所占的重要性不同,需要根据一定的权重进行放大和缩小。针对各个变量,权重需要预先设置,比如对于年龄这一数值型变量,值域为0到100,但设置的权重为10,因此经过相应的转换之后,值变为0到10。经过统一化的操作,使得具有不同量纲的变量具有可比性。

b.逻辑型变量:逻辑型变量本质上是二值变量的一种,变量值只能是是或否,但在实际应用中经过扩展可以扩展到一切的二值变量。在进行逻辑型变量的转换时,需要设置真值和假值的对应取值,随后根据这一设置值对变量进行抽象。例如是否绝经这一变量,是设置为0,否设置为100,则转换时根据这一规则进行转换。

c.文本型变量:文本型变量是情况最为复杂的一种变量。文本型变量的处理方法分为两种,一种是特殊文本型变量转换,后者是普通文本型变量转换。前者适用于精细转换,但是需要准备阶段的大量工作,后者的转换较为粗糙。

特殊文本型变量转换:特殊文本型变量转换面向诊断结果、术式、检查项目等转换要求较高的项目,要求转换结果能够精细地反应各项目之间的差异与联系。该转换方法需要事先建立一个转换谱,转换谱本质上也是一个多元向量谱,每一个项目对应一个多元向量,两个项目越接近,则两个对应的向量在空间上的距离也越近,从而直观地反应两者的联系。在转换时,根据具体的项目予以转换,将所得的空间向量作为其中的若干维度整合入对应的向量中去。

普通文本型变量转换:该转换方法实际上是离散型变量的转换方法,用户事先针对可能出现的不同字符串设置不同的值,随后在具体的电子病历检索过程中根据该文本型变量中出现的字符串,进行相应值的求和,从而得到该文本型变量对应的值,再整合入空间向量当中。

将每个电子病历完成转换之后,构建一个空间向量库,再根据这一空间向量库构建一个多维空间。初始时,由于尚未有用户进行任何检索,因此该多维空间未经过任何程度的扭曲。

(2)调阅结果收集模块:

用户在检索电子病历时,根据各种途径输入自己的检索条件,随后得到系统返回的检索结果题录。用户根据题录结果选择符合自己需求的电子病历,从而向系统发出请求获取电子病历拷贝。在这一请求过程当中,系统接受了针对某一检索条件的实际请求信息,这一请求信息就指向了这一检索条件实际的对象。

用户所输入的检索条件本质上可以抽象为一个空间向量,这一空间向量构成了一个多维空间中的一个数据点。而用户实际请求的病历或多或少对这一数据点存在偏离,而这一偏离情况就构成了客观条件下对这一多维空间的扭曲。

根据某一具体的检索条件,抽象为一个空间向量,而用户所请求的具体电子病历,在空间向量库中调取它们对应的空间向量。而这些空间向量不一定是单中心的,他们可以聚集在不同的中心周围。因此,需要实用ISODATA病历档案聚类分析系统,找到该检索条件下所指向的一个或多个检索中心,这些检索中心也是一个个多维空间向量。将这些检索中心对应的空间向量存放于调阅结果库。

(3)空间向量扭曲模块:

当用户新构建了一个检索条件并发送检索请求后,系统首先需要将检索条件转换为一个空间向量。这一空间向量再进入空间向量扭曲运算,找到实际指向的检索条件,其具体步骤为:

a.将用户的检索条件转换为空间向量。

b.在调阅结果库中,抽取出与原检索条件对应向量距离小于等于d值的向量,共j个向量符合条件。(d可等于10、100或500不等,取决于具体情况)。

c.每个向量与原检索条件的距离为r,该向量对应的检索中心有n个,检索中心对应的向量分别为则按照公式计算出扭曲后的检索条件向量

得到的向量即为新的检索条件。

d.根据向量根据匹配算法划取周围的空间向量,将空间向量对应的电子病历按照距离大小降序排序,返回用户进行选择。

用户进行选择之后,调阅结果又可进入调阅结果库,以提供未来的检索结果优化。其中,调阅结果收集的流程如图1所示,空间向量扭曲的流程如图2所示。

以下是结合一具体实例对本发明的进一步说明:

某用户输入的检索条件如下:

性别年龄诊断是否有家族史50消化道出血

经过空间向量抽象之后,获得的空间向量为:(5,5,8,10,2,5)

在调阅结果库中,与该向量距离小于d=20的向量有5个,对应的检索中心如下表所示:

向量坐标检索中心距离(5,3,8,9,3,5)(5,6,8,9,3,5)14.59451952(5,4,8,10,2,0)(5,7,8,10,3,5)14.2126704(5,7,8,10,3,5)(5,3,8,10,2,5)16.4924225(5,4,7,9,3,5)(5,6,8,11,3,5)14.31782106(5,3,8,9,1,5)(5,6,8,9,1,5)14.31782106

经过公式计算,得到的扭曲过后的空间向量为:

(5,5.671,8,9.798,2.409,5)

以该向量作为新的检索条件,在空间向量库中划取周围的空间向量,根据这些向量与新的检索条件之间的距离降序排序,得到优化过后的检索结果。

综上,与现有技术相比,本发明基于多元向量空间扭曲概念的电子病历检索优化系统具有以下有益效果:

1.现有的电子病历检索算法的原理是根据用户输入的检索条件对数据库中的电子病历进行匹配,再根据匹配程度降序排列。然而这一排序方法不一定符合用户的检索目的,用户可能会调阅排序相对不高的病历,这就需要根据用户的实际调阅情况对电子病历检索进行优化。本系统基于用户在某检索条件下调阅的电子病历才是该检索条件实际指向的结果,其建立基础是需要有一定的用户使用量以构建调阅结果库。根据以往的调阅情况,经过检索结果的优化后,所返回的检索结果排序情况准确程度会更符合用户的实际需求。

2.如果不经电子病历的检索优化,那么系统自动匹配到的结果可能与用户实际的需求存在一定的偏差,导致一些相关度不那么高的电子病历排在上面,而真正相关的电子病历排在下方,这就使得用户需要花费大量的时间阅读相关度不那么高的结果,使得阅读效率会有一定程度的下降。而且该优化系统是根据历史检索结果进行设计的,将电子病历进行抽象量化,大大提高了工作效率。

3.本电子病历检索优化系统通过学习用户对电子病历调阅的历史记录,对用户新建立的检索条件进行空间向量扭曲,并将扭曲后的空间向量作为新的检索条件,从而提供给用户优化后的检索结果。而用户根据这一检索结果调阅电子病历后,用户调阅的结果又可以进入调阅结果库中,为电子病历检索优化提供进一步的优化基础。用户使用的次数越多,优化得越精细。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号