首页> 中国专利> 一种针对中医药学信息的检索系统和方法

一种针对中医药学信息的检索系统和方法

摘要

本发明公开一种针对中医药学信息的检索系统和方法,该检索方法包括:在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性类型;按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相应属性类别的匹配结果。本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望,提高检索结果的准确度。

著录项

  • 公开/公告号CN104199855A

    专利类型发明专利

  • 公开/公告日2014-12-10

    原文格式PDF

  • 申请/专利权人 王和平;

    申请/专利号CN201410397651.9

  • 发明设计人 唐力;王和平;周晋;黄权;

    申请日2014-08-13

  • 分类号G06F17/30(20060101);

  • 代理机构11139 北京科龙寰宇知识产权代理有限责任公司;

  • 代理人孙皓晨;陈士骞

  • 地址 100007 北京市东城区东四十条甲22号南新仓商务大厦A座603号

  • 入库时间 2023-12-17 03:18:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-12-23

    专利权的转移 IPC(主分类):G06F17/30 专利号:ZL2014103976519 登记生效日:20221213 变更事项:专利权人 变更前权利人:王和平 变更后权利人:南京海维可信数据服务有限公司 变更事项:地址 变更前权利人:100007 北京市东城区东四十条甲22号南新仓商务大厦A座603号 变更后权利人:210019 江苏省南京市建邺区广聚路33号12层1201号

    专利申请权、专利权的转移

  • 2017-07-28

    授权

    授权

  • 2015-01-07

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140813

    实质审查的生效

  • 2014-12-10

    公开

    公开

说明书

技术领域

本发明涉及医药领域,具体而言,涉及一种针对中医药学信息的检索系 统和方法。

背景技术

针对中医药学的信息检索结构包含以下四种不同类型的信息单元:

方剂:在辨证审因确定治法之后,选择合适的药物,酌定用量,按照组 方结构的要求,妥善配伍而成。

本草:在中医理论指导下,用于预防、治疗、诊断疾病并具有康复与保 健作用的物质。

病证:即疾病,是致病邪气作用于人体,人体正气与之抗争二引起的机 体阴阳失调、脏腑组织损伤、生理机能失常或心理活动障碍的一个完整的生 命过程。

医案:即病案,是医生治疗疾病时辨证、立法、处方用药的连续记录。

症状:是疾病过程中表现出的个别、孤立的现象,可以是病人异常的主 观感觉或行为表现,也可以是医生检查病人时发现的异常征象。

随着信息化程度的日益提高,人们已经可以通过各种信息终端获取医疗 信息,但如何推测用户的意图以便为用户提供更准确的中医药信息仍是一个 亟需解决的问题。

发明内容

本发明提供一种针对中医药学信息的检索系统和方法,用以根据用户提 供的检索词推测用户的意图以便为用户提供更准确的中医药信息。

为达到上述目的,本发明提供了一种针对中医药学信息的检索系统,包 括:

属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中 每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包 括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;

意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类, 将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类 别确定用户的检索意图;

结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得 到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检 索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用 于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表 是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。

进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂> 病症>症状的优先级顺序确定用户的检索意图。

进一步地,所述意图推测模块包括:

聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t, j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km], 在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中, t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};

意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:

情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;

情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;

情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p 的信息单元。

进一步地,所述结果返回模块包括:

结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得 到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r 在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含 kj的信息单元的索引位置集;

分类单元,用于将R中的匹配结果按照属性类别进行分类,得到 Rt={r|β(r)=t,r∈R},其中t∈P;

结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果 页面的各个卡片:

对于情况C1,将方剂类结果作为默认类别的结果页面卡片;

对于情况C2,将病症类结果作为默认类别的结果页面卡片;

对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;

对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小 的顺序进行排列。

进一步地,上述系统还包括:

更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症 状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更 新所述索引表。

为达到上述目的,本发明还提供了一种针对中医药学信息的检索方法, 包括以下步骤:

在关键词属性表中,查询用户提供的一组检索词中每一个检索词的属性 类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其对应的 属性类别,所述属性类型包括本草、方剂、病症和症状;

按照属性类型对该组检索词进行聚类,将属性类型相同的检索词归为一 类,根据该组检索词中占比最大的检索词类别确定用户的检索意图;

根据该组检索词查询索引表和知识单元数据库,得到匹配结果集,并将 所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返回相 应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元,所 述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元数 据库内的每一个知识单元进行切词后建立的倒排索引。

进一步地,如果占比最大的检索词类别存在多个,则按照本草>方剂> 病症>症状的优先级顺序确定用户的检索意图。

进一步地,所述按照属性类型对该组检索词进行聚类,将属性类型相同 的检索词归为一类,根据该组检索词中占比最大的检索词类别确定用户的检 索意图步骤包括:

假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中查询到 的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1≤i≤m, P={本草,方剂,病症,症状};

按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t,j为自然 数,1≤j≤m},其中t∈P;

用p表示聚类后占比最大的检索词类别,即根据|Kp|和p 的取值确定用户的检索意图:

情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;

情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;

情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p 的信息单元。

进一步地,所述根据该组检索词查询索引表和知识单元数据库,得到匹 配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检索意 图向用户返回相应属性类别的匹配结果步骤包括:

根据该组检索词查询索引表和知识单元数据库,得到匹配结果集R={r 丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数据库中 的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元的索引 位置集;

将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其 中t∈P;

根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:

对于情况C1,将方剂类结果作为默认类别的结果页面卡片;

对于情况C2,将病症类结果作为默认类别的结果页面卡片;

对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;

对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小 的顺序进行排列。

进一步地,上述检索方法还包括以下步骤:

对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加 或更新;和/或

创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。

本发明通过对用户提供的一组关键词进行分析和处理,推测用户的检索 意图,并依据推测结果恰当地组织检索结果,更好地满足用户的检索期望, 提高检索结果的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一个实施例的针对中医药学信息的检索方法流程图;

图2为本发明一个实施例的针对中医药学信息的检索系统模块图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明一个实施例的针对中医药学信息的检索方法流程图;如图 所示,该检索方法包括以下步骤:

S110,在关键词属性表中,查询用户提供的一组检索词中每一个检索词 的属性类型,其中,所述关键词属性表中的每条结构化信息包括关键词及其 对应的属性类别,所述属性类型包括本草、方剂、病症和症状;

例如,假设用户输入的该组检索词为K=[k1,k2,…,km],在关键词属性表中 查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中,m、i为自然数,1 ≤i≤m,P={本草,方剂,病症,症状}。

S120,按照属性类型对该组检索词进行聚类,将属性类型相同的检索词 归为一类,根据该组检索词中占比最大的检索词类别确定用户的检索意图; 其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症>症 状的优先级顺序确定用户的检索意图。

例如,按照属性类型对该组检索词K进行聚类,得到Kt={kj丨T(kj)=t, j为自然数,1≤j≤m},其中t∈P;

用p表示聚类后占比最大的检索词类别,即根据|Kp|和p 的取值确定用户的检索意图:

情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;

情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;

情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p 的信息单元。

S130,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集, 并将所述匹配结果集按照属性类别进行分类,根据用户的检索意图向用户返 回相应属性类别的匹配结果,其中,所述知识单元数据库用于存储知识单元, 所述知识单元包含信息内容和信息所属类别,所述索引表是对所述知识单元 数据库内的每一个知识单元进行切词后建立的倒排索引,给定一个词W,能 够通过查询该索引表得到知识单元数据库中所有包含W的知识单元的索引位 置集。

例如,根据该组检索词查询索引表和知识单元数据库,得到匹配结果集 R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r在知识单元数 据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含kj的信息单元 的索引位置集;

将R中的匹配结果按照属性类别进行分类,得到Rt={r|β(r)=t,r∈R},其 中t∈P;

根据所确定的用户检索意图,向用户返回如下结果页面的各个卡片:

对于情况C1,将方剂类结果作为默认类别的结果页面卡片;

对于情况C2,将病症类结果作为默认类别的结果页面卡片;

对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;

对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小 的顺序进行排列。

此外,上述检索方法还包括以下步骤:

对所述关键词属性表中本草、方剂、病症和症状对应的关键词进行添加 或更新;和/或

创建或更新所述知识单元数据库中的知识单元,并更新所述索引表。

与上述方法实施例相对应,以下为本发明的针对中医药学信息的检索系 统实施例,该检索系统包括:

属性查询模块,用于在关键词属性表中,查询用户提供的一组检索词中 每一个检索词的属性类型,其中,所述关键词属性表中的每条结构化信息包 括关键词及其对应的属性类别,所述属性类型包括本草、方剂、病症和症状;

意图推测模块,用于按照查询得到的属性类型对该组检索词进行聚类, 将属性类型相同的检索词归为一类,根据该组检索词中占比最大的检索词类 别确定用户的检索意图;

结果返回模块,用于根据该组检索词查询索引表和知识单元数据库,得 到匹配结果集,并将所述匹配结果集按照属性类别进行分类,根据用户的检 索意图向用户返回相应属性类别的匹配结果,其中,所述知识单元数据库用 于存储知识单元,所述知识单元包含信息内容和信息所属类别,所述索引表 是对所述知识单元数据库内的每一个知识单元进行切词后建立的倒排索引。

其中,如果占比最大的检索词类别存在多个,则按照本草>方剂>病症 >症状的优先级顺序确定用户的检索意图。

例如,所述意图推测模块可以包括:

聚类单元,按照属性类型对该组检索词进行聚类,得到Kt={kj丨T(kj)=t, j为自然数,1≤j≤m},其中假设用户输入的该组检索词为K=[k1,k2,…,km], 在关键词属性表中查询到的K中每一个检索词ki的属性类型T(ki)∈P,其中, t∈P,m、i为自然数,1≤i≤m,P={本草,方剂,病症,症状};

意图推测单元,用p表示聚类后占比最大的检索词类别,即根据|Kp|和p的取值确定用户的检索意图:

情况C1:如果|Kp|>1且p为本草,则推测用户的主要检索目标为方剂;

情况C2:如果|Kp|>1且p为症状,则推测用户的主要检索目标为病症;

情况C3:除C1和C2之外的情况,推测用户的主要检索目标为类别为p 的信息单元。

例如,所述结果返回模块可以包括:

结果查询单元,用于根据该组检索词查询索引表和知识单元数据库,得 到匹配结果集R={r丨kj∈K,使得α(r)∈I(Kj)},其中α(r)表示信息单元r 在知识单元数据库中的索引位置,I(Kj)表示检索词kj在索引表中对应的包含 kj的信息单元的索引位置集;

分类单元,用于将R中的匹配结果按照属性类别进行分类,得到 Rt={r|β(r)=t,r∈R},其中t∈P;

结果返回单元,用于根据所确定的用户检索意图,向用户返回如下结果 页面的各个卡片:

对于情况C1,将方剂类结果作为默认类别的结果页面卡片;

对于情况C2,将病症类结果作为默认类别的结果页面卡片;

对于情况C3,将属性类别为p的结果页面作为默认类别的结果页面卡片;

对于默认类别之外的结果页面卡片,按照各类别含有结果数量由大到小 的顺序进行排列。

此外,上述检索系统还可以包括:

更新模块,用于添加或更新所述关键词属性表中本草、方剂、病症和症 状对应的关键词,以及创建或更新所述知识单元数据库中的知识单元,并更 新所述索引表。

本发明的上述检索系统和方法通过对用户提供的一组关键词进行分析和 处理,推测用户的检索意图,并依据推测结果恰当地组织检索结果,更好地 满足用户的检索期望,提高检索结果的准确度。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中 的模块或流程并不一定是实施本发明所必须的。

本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施 例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的 一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步 拆分成多个子模块。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其 限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者 对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术 方案的本质脱离本发明实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号