首页> 中国专利> 传统医学疾病本体的构建方法及装置

传统医学疾病本体的构建方法及装置

摘要

本发明公开了一种传统医学疾病本体的构建方法及装置。该方法包括搭建本体分类框架;实现属于各分类的传统医学疾病术语集到参考传统医学疾病术语集的映射。其中,将属于本体分类的传统医学疾病术语集作为匹配来源集,参考传统医学疾病术语集作为匹配目标集,实现属于各分类的传统医学疾病术语集到参考传统医学疾病术语集的映射包括:将匹配来源集中各疾病术语分别与匹配目标集中各疾病术语进行精确匹配,其中,精确匹配是指匹配来源集中的疾病术语与匹配目标集中的疾病术语语义等价。这种方法及装置面向分类统计,自动构建传统医学疾病本体;还涉及建立本体与参考传统医学疾病术语集间的交叉映射,是推进医疗服务规范化标准化管理的基础。

著录项

  • 公开/公告号CN112445917A

    专利类型发明专利

  • 公开/公告日2021-03-05

    原文格式PDF

  • 申请/专利权人 中国中医科学院中医药信息研究所;

    申请/专利号CN202011222616.5

  • 申请日2020-11-05

  • 分类号G06F16/36(20190101);G06F16/35(20190101);G06F40/30(20200101);

  • 代理机构11711 北京北汇律师事务所;

  • 代理人李英杰

  • 地址 100700 北京市东城区东直门内南小街16号

  • 入库时间 2023-06-19 10:06:57

说明书

技术领域

本发明涉及信息处理技术和中医药学,更为具体来说,本发明涉及一 种传统医学疾病本体的构建方法及装置。

背景技术

中医药学为中国原创性医学,体现了我国医学科学的优势与特色,是 世界传统医学和优秀民族文化的重要组成部分。中医药学的辩证与辨病、 理论与临床实践、指导和规范的三统一,是传承精华、守正创新的生动实 践。国内外高度重视中医药的发展,积极推动中医药标准体系建设。自 1995年以来,我国政府先后颁布《中医临床诊疗术语》(疾病部分)等 国家标准,世界卫生组织亦于2009年将中医药为代表的传统医学术语纳 入《国际疾病分类法》(International Classification of Disease,ICD),促 进了传统医学与现代医学的融合共进。然而,上述这些国家标准在形式上 表现为半结构化数据,且未与ICD分类代码建立交叉映射;因此,构建 人与机器均可理解的传统医学疾病体系,并在语义层面实现其与ICD的 有机统一,有助于开展中医疾病的分类统计,在一定程度上将推进“智慧 医疗”建设及“健康中国”政策的实施。

本体(Ontology)最早源于17世纪的古希腊哲学术语,意为“对世界 上客观存在物的系统描述”,即存在论。在信息科学等非哲学领域,普遍 认可的本体概念是由Studer等人在1998年提出的“本体是共享概念模型的 明确的形式化规范说明”,该定义体现了本体共享、明确、概念、形式化 的4个体征。具体而言,本体用来描述某一领域内的重要概念及概念之间 的语义关联,且要求这些概念和语义关系为公认的、明确的;此外,本体 采用国际通用的形式化语言(Web Ontology Language,OWL)来规范化描 述领域概念及其语义关系,使得这些知识可被人机共同理解,从而解决了 人机之间、机器之间信息传递及交流障碍。正因为这些特性,本体为人工 智能等应用的开发提供了机器可理解的重要领域知识;本体与知识图谱, 已成为知识工程中知识组织与智能应用的两个核心。

生物医学领域一直处于本体研究的前列。自1990年《基因本体》(Gene Ontology,GO)问世以来,生物医学本体构建及应用研究得到广泛关注, 产生一批具有较高影响力的成果,包括《疾病本体》(Disease ontology, DO)、《人类表型本体》(Human PhenotypeOntology,HPO)、《不良 反应本体》(Ontology of Adverse Events,OAE)等。目前,生物医学本体主 要应用于不同数据库中术语的对齐与整合、基础医学研究、智能决策系统 开发等方面。例如,通过整合《疾病本体》与大小鼠基因数据库中的疾病 名称,可有效提高不同物种间病名的数据标注效果;而一些学者通过定制 相关软件比如ChipInfo等,基于《基因本体》开展了微阵列分析、基因功 能预测等研究;此外,研究者根据不同应用需求构建了专用本体,进而开 发了疾病诊断与治疗、疾病风险评估等智能决策系统。

ICD分类法是目前国际通用的权威分组统计工具,主要用于疾病和死 亡原因统计。2018年6月18日,世界卫生组织发布最新版本ICD-11,其 中文版于同年12月21日由国家卫生健康委员会正式发布并在全国范围内 全面使用。ICD-11中文版共包含28章,其中第26章为传统医学病症术 语,具体又细分为传统医学疾病、传统医学症候两个小节,对有效规范医 疗机构疾病分类和编码、健全中西医术语标准体系、提高医疗服务标准化 水平和医疗管理效率、促进诊疗信息交互具有积极意义。

发明内容

本发明创新地提供了一种传统医学疾病本体的构建方法及装置,自动 进行传统医学疾病本体与现有传统医学疾病术语体系的语义匹配,能够快 速、准确地获得匹配结果。

为实现上述的技术目的,一方面,本发明公开了一种传统医学疾病本 体的构建方法。所述传统医学疾病本体的构建方法包括:搭建本体分类框 架;实现属于各个分类的传统医学疾病术语集到参考传统医学疾病术语集 的映射,其中,将属于本体分类的传统医学疾病术语集作为匹配来源集, 参考传统医学疾病术语集作为匹配目标集,所述实现属于各个分类的传统 医学疾病术语集到参考传统医学疾病术语集的映射包括:将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病术语进行精确匹配,找到精确 匹配成功的疾病术语对,其中,精确匹配是指匹配来源集中的疾病术语与 匹配目标集中的疾病术语语义等价。

进一步地,对于所述传统医学疾病本体的构建方法,所述精确匹配包 括以下各匹配方式中至少一种:匹配来源集中的疾病术语与匹配目标集中 的疾病术语相同;匹配来源集中的疾病术语与匹配目标集中的疾病术语主 体相同;匹配来源集和匹配目标集中一个集合的疾病术语的同义词与另一 个集合的疾病术语相同;以及匹配来源集的疾病术语与匹配目标集的疾病 术语内涵相同。

进一步地,对于所述传统医学疾病本体的构建方法,所述实现属于各 个分类的传统医学疾病术语集到参考传统医学疾病术语集的映射还包括: 对于精确匹配失败的疾病术语,将匹配来源集中各个疾病术语分别与匹配 目标集中各个疾病术语进行向上匹配,找到向上匹配成功的疾病术语对, 其中,向上匹配是指匹配目标集中疾病术语的内涵和外延大于匹配来源集 中的疾病术语。

进一步地,对于所述传统医学疾病本体的构建方法,所述向上匹配包 括以下原则:就近原则,当匹配来源集中的疾病术语的多个上级疾病术语 与匹配目标集的疾病术语存在精确匹配时,选择与其等级最近的上级疾病 术语所匹配的匹配目标集中的疾病术语作为其匹配术语;当匹配来源集与 匹配目标集的等级相差为1而且匹配来源集下一级疾病术语存在特指和/ 或非特指疾病术语时,建立匹配来源集的疾病术语与匹配目标集的疾病术 语下一级的特指或非特指疾病术语的相关匹配,而非向上匹配。

进一步地,对于所述的传统医学疾病本体的构建方法,所述实现属于 各个分类的传统医学疾病术语集到参考传统医学疾病术语集的映射还包 括:对于向上匹配失败的疾病术语,将匹配来源集中各个疾病术语分别与 匹配目标集中各个疾病术语进行向下匹配,找到向下匹配成功的疾病术语 对,其中,向下匹配是指匹配目标集中疾病术语的内涵和外延小于匹配来 源集中的疾病术语。

进一步地,对于所述的传统医学疾病本体的构建方法,所述向下匹配 包括以下原则:就近原则,选择已精确匹配的等级最相近的匹配来源集疾 病术语的下级疾病术语所匹配的匹配目标集术语进行向下匹配;当匹配来 源集中的疾病术语能够与匹配目标集中多个疾病术语建立向下匹配关系 时,不进行向下匹配。

进一步地,对于所述的传统医学疾病本体的构建方法,所述实现属于 各个分类的传统医学疾病术语集到参考传统医学疾病术语集的映射还包 括:对于向下匹配失败的疾病术语,将匹配来源集中各个疾病术语分别与 匹配目标集中各个疾病术语进行相关匹配,找到相关匹配成功的疾病术语 对,其中,相关匹配是指匹配来源集中的疾病术语与匹配目标集中的疾病 术语互相部分包含对方的内涵和外延。

进一步地,对于所述传统医学疾病本体的构建方法,所述相关匹配包 括以下原则:如果匹配来源集的疾病术语有子疾病术语,则相关匹配到匹 配目标集的非特指疾病术语;如果匹配来源集的疾病术语无子疾病术语, 则相关匹配到匹配目标集的特指疾病术语;就近原则,选择已精确匹配且 等级最相近的上级疾病术语所匹配的匹配目标集疾病术语下的特指或非 特指疾病术语。

为实现上述的技术目的,另一方面,本发明公开了一种传统医学疾病 本体的构建装置,所述传统医学疾病本体的构建装置包括:分类框架搭建 单元,用于搭建本体分类框架;映射单元,用于实现属于各个分类的传统 医学疾病术语集到参考传统医学疾病术语集的映射,其中,将属于本体分 类的传统医学疾病术语集作为匹配来源集,参考传统医学疾病术语集作为 匹配目标集,所述映射单元包括精确匹配模块,用于将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病术语进行精确匹配,找到精确匹配 成功的疾病术语对,其中,精确匹配是指匹配来源集中的疾病术语与匹配 目标集中的疾病术语语义等价。

为实现上述的技术目的,又一方面,本发明公开了一种计算设备。所 述计算设备包括:一个或多个处理器,以及与所述一个或多个处理器耦合 的存储器,所述存储器存储指令,当所述指令被所述一个或多个处理器执 行时,使得所述一个或多个处理器执行上述方法。

为实现上述的技术目的,再一方面,本发明公开了一种机器可读存储 介质。所述机器可读存储介质存储有可执行指令,所述指令当被执行时使 得所述机器执行上述方法。

本发明的有益效果为:

本发明实施例的传统医学疾病本体的构建方法及装置面向分类统计, 在充分借鉴国内外典型生物医学本体——特别是《疾病本体》成功经验的 基础上,通过复用已有国家标准中的中医疾病名称及内容结构,自动构建 传统医学疾病本体;还涉及建立本体与参考传统医学疾病术语集之间的交 叉映射,疾病分类与代码、手术操作分类与代码、病案首页、医学名词术 语等是推进医疗服务规范化、标准化管理的重要基础。自动建立传统医学疾病本体中传统医学疾病术语集与参考传统医学疾病术语集的语义关联, 能够快速、准确地获得匹配结果。

附图说明

图中,

图1为本发明实施例1提供的传统医学疾病本体体系的结构示例图;

图2为本发明实施例2提供的传统医学疾病本体的构建方法的流程图;

图3A、图3B、图3C和图3D为本发明实施例2中精确匹配的4个 示例图;

图4为本发明实施例2中向上匹配的示例图;

图5为本发明实施例2中向下匹配的示例图;

图6为本发明实施例2中相关匹配的示例图;

图7为本发明实施例3提供的传统医学疾病本体的构建装置的结构示 意图;

图8为根据本发明实施例的用于传统医学疾病本体的构建处理的计 算设备的结构框图。

具体实施方式

下面结合说明书附图对本发明提供的传统医学疾病本体的构建方法 及装置进行详细的解释和说明。

首先,对国家标准《中医临床诊疗术语》(疾病部分)及其内容结构 进行简要介绍。

1997年,国家标准《中医临床诊疗术语》(疾病部分)首次发布。 2017年,国家中医药管理局于2017年在全面总结标准应用情况的基础上 修订,形成《中医临床诊疗术语》(疾病部分(2017版))(征求意见 稿)。修订稿收录外感病类、寄生虫病类、中毒与意外伤害病类、脏腑病 及相关病类、小儿相关病类、眼病类、临时诊断用症候术语等17个大类、 1356条传统医学疾病名,重点解决了原标准与国家标准《中医病症分类 与代码》中的部分疾病术语、与《国际疾病分类体系》分类不一致的问题, 具有疾病名称明确、定义规范、同(近)义词检索方便等显著特点。表1 示出了《中医临床诊疗术语》(疾病部分(2017版))的修订稿中部分 疾病名,其主要内容包括分类代码(即等级体系)、中英文传统医学疾病 名、定义、及检索词(即同义词、近义词等术语)。

表1国家标准《中医临床诊疗术语》(疾病部分)的部分内容及结 构示例

下面,对本发明实施例1提供的传统医学疾病本体进行说明。

该实施例充分借鉴《疾病本体》的成果建设经验,通过复用国家标准 《中医临床诊疗术语》(疾病部分(2017版))(征求意见稿)的内容 和结构,建立《传统医学疾病本体》类、等级体系以及类的标签(label)、 以及同义词(has_exact_synonym)、定义(definition)和与其它词表的交叉映 射(database_cross_reference)等属性。国际化资源标识符(Internationalized Resource Identifiers,IRI)作为本体在世界范围内的唯一标识符,促进了 不同本体间的交互及复用。《传统医学疾病本体》类的IRI统一采用 “TCMO_七位数字”的形式进行表示,且七位数字从0000001开始依次递 增,例如“外感时令类病”的IRI为“TCMO_0000774”。本体类间等级 体系依据国家标准疾病名的分类代码建立,中英文语种的类标签、同义词、 定义则分别复用中英文疾病名、检索词及定义。此外,《传统医学疾病本体》体现了与国家标准、国际疾病分类法-11的交叉映射,例如,“外感 时令类病”与国家标准的映射表示为”database_cross_reference=GB/T2017:A01.01”,与ICD-11的交叉映射为“database_cross_reference= ICD11-ZH:SE2Z”。图1示出根据本发明实施例1的《传统医学疾病本体》 的基本内容结构、及其与国家标准和《ICD-11》中文版的对应关系。

图2为本发明实施例2提供的传统医学疾病本体的构建方法的流程图。

如图2所示,在步骤S210,搭建本体分类框架。基于已有的疾病分 类体系,搭建本体分类框架。

在步骤S220,实现属于各个分类的传统医学疾病术语集到参考传统 医学疾病术语集的映射。其中,将属于本体分类的传统医学疾病术语集作 为匹配来源集,参考传统医学疾病术语集作为匹配目标集,步骤S220包 括以下过程:将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病 术语进行精确匹配,找到精确匹配成功的疾病术语对,其中,精确匹配是 指匹配来源集中的疾病术语与匹配目标集中的疾病术语语义等价。

精确匹配可以包括以下各匹配方式中至少一种:匹配来源集中的疾病 术语与匹配目标集中的疾病术语相同;匹配来源集中的疾病术语与匹配目 标集中的疾病术语主体相同;匹配来源集和匹配目标集中一个集合的疾病 术语的同义词与另一个集合的疾病术语相同;以及匹配来源集的疾病术语 与匹配目标集的疾病术语内涵相同。

以参考传统医学疾病术语集为《国际疾病分类法-11》(《ICD-11》) 中文版为例,《传统医学疾病本体》与《国际疾病分类法-11》中文版的 映射方法采用计算机处理的方式,可以辅助人工审核,建立两者之间的语 义关联。以前者为匹配来源集,在图中示出为来源表A(共有1356个中 医病名),以后者为匹配目标集,在图中示出为目标表B(包含251条与传统医学疾病相关的分类名)。

精确匹配(Exact Match)表示语义等价,即表A和表B中的传统医 学疾病名称的内涵和外延均相等。本方法中,以下情况均属于精确匹配: (1)两表中疾病术语完全相同,例如表A中的“不寐”(A04.01.12)与 表B中的“不寐”(SD84),如图3A所示;(2)表A中的疾病名称去掉 后缀“病”字后与表B的分类名称相同,例如“惊悸病”(A04.01.09) 与“惊悸”(SA10),如图3B所示;(3)表A中疾病名称的同义词与 表B的分类名称相同,例如“胸痹心痛”(A04.01.01,同义词为“胸痹”) 与“胸痹”(L4-SA2),如图3C所示;(4)字面不同,但内涵相同, 例如“脏腑病及相关类(A04)”与“脏腑系统疾病(L2-SA0)”,如图 3D所示。

在该实施例中,步骤S220还可以包括以下步骤:对于精确匹配失败 的疾病术语,将匹配来源集中的各个疾病术语分别与匹配目标集中的各个 疾病术语进行向上匹配,找到向上匹配成功的疾病术语对,其中,向上匹 配是指匹配目标集中疾病术语的内涵和外延大于匹配来源集中的疾病术 语。向上匹配可以包括以下原则:就近原则,当匹配来源集中的疾病术语 的多个上级疾病术语与匹配目标集的疾病术语存在精确匹配时,选择与其 等级最近的上级疾病术语所匹配的匹配目标集中的疾病术语作为其匹配 术语;当匹配来源集与匹配目标集的等级相差为1而且匹配来源集下一级 疾病术语存在特指和/或非特指疾病术语时,建立匹配来源集的疾病术语 与匹配目标集的疾病术语下一级的特指或非特指疾病术语的相关匹配,而 非向上匹配。

仍以匹配目标集为《国际疾病分类法-11》中文版为例,向上匹配 (Broad Match)意指包含关系,即表B中分类名称的内涵和外延大于表 A的疾病名称。向上匹配遵循以下原则:(1)应用就近原则,当表A中 疾病名称的多个上级疾病名与表B中的分类名称存在精确匹配时,选择与 其等级最近的上级疾病名称所匹配的表B分类名称;(2)为更加贴近疾 病本质,当表A与表B的等级相差为1且表B下一级分类名称存在特指 和/或非特指类名称时,建立表A类目与表B类目下的特指、非特指类名 称的相关匹配,而非向上匹配。例如,表A中“阳黄病”(A04.02.03.01) 为4级疾病名,无精确匹配,其相应3级疾病名为“黄疸病”(A04.02.03) 可以匹配到表B中“黄疸”(SA01),2级疾病名“肝系病”(A04.02) 可以匹配到表B中“肝系病类”(L3-SA0),且“黄疸”(SA01)下无 特指和非特指类名称,根据就近原则,在“阳黄病”(A04.02.03.01)与 “黄疸”(SA01)之间建立向上匹配关系,如图4所示。其中,非特指(not otherwise specified,NOS)是一种特殊的分类名称,用于实际编码过程中因 信息不全而无法判定具体的细分种类的情况;(其他)特指类是在ICD 等分类体系中,没有涵盖所有的分类名称,只列出了几个常见的“特指” 类,其他的能根据实际信息具体判定的细分种类都可归到“其他特指的**”。

在该实施例中,步骤S220还可以包括以下步骤:对于向上匹配失败 的疾病术语,将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病 术语进行向下匹配,找到向下匹配成功的疾病术语对,其中,向下匹配是 指匹配目标集中疾病术语的内涵和外延小于匹配来源集中的疾病术语。向 下匹配可以包括以下原则:就近原则,选择已精确匹配的等级最相近的匹 配来源集疾病术语的下级疾病术语所匹配的匹配目标集术语进行向下匹配;当匹配来源集中的疾病术语能够与匹配目标集中多个疾病术语建立向 下匹配关系时,不进行向下匹配。

仍以匹配目标集为《国际疾病分类法-11》中文版为例,向下匹配 (narrow Match)表示包含于关系,即表B的分类名称的内涵和外延小于 表A。在该实施例中,向下匹配遵循以下原则:应用就近原则,选择已精 确匹配的等级最相近的表A疾病名称的下级疾病名称所匹配的表B分类 名称进行向下匹配;当表A中类目可以与多个表B类名称建立向下匹配关系时,不进行向下匹配。如表A中3级疾病名称“黑精病”(A11.01.04) 无精确匹配,其下1级仅有疾病名称“混睛障”(A11.01.04.11)可精确 匹配到表B中的“混睛障”(SC74),此时在“黑精病”(A11.01.04) 与“混睛障”(A11.01.04.11)之间建立向下匹配关系,如图5所示。

在该实施例中,步骤S220还可以包括以下步骤:对于向下匹配失败 的疾病术语,将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病 术语进行相关匹配,找到相关匹配成功的疾病术语对,其中,相关匹配是 指匹配来源集中的疾病术语与匹配目标集中的疾病术语互相部分包含对 方的内涵和外延。相关匹配包括以下原则:如果匹配来源集的疾病术语有 子疾病术语,则相关匹配到匹配目标集的非特指疾病术语;如果匹配来源 集的疾病术语无子疾病术语,则相关匹配到匹配目标集的特指疾病术语; 就近原则,选择已精确匹配且等级最相近的上级疾病术语所匹配的匹配目 标集疾病术语下的特指或非特指疾病术语。

仍以匹配目标集为《国际疾病分类法-11》中文版为例,相关匹配 (relatedMatch)表示相交关系,即表A和表B两表互相部分包含对方的 内涵和外延。在该实施例中,表A中存在临时诊断用症候术语,其中部 分疾病名称可以精确匹配到表B中的分类名称,余下未能精确匹配的术语 认为其为相关关系。另外,相关匹配遵循以下原则:表A疾病名称有子 疾病名称,则相关匹配到表B未特指分类名称;表A类目无子疾病名称, 则相关匹配到其它特指分类名称;应用就近原则,选择已精确匹配且等级 最相近的上级疾病名称所匹配的表B类目下的其它特指或非特指分类名 称。例如,表A中存在“新感温病”(A01.03.01.01),其不存在子疾病 名称,且其上1级疾病名称为“温病”(A01.03.01),上3级疾病名称 为“外感病类”(A01),二者分别与“温病”(L3-SE0)及“外感病” (L2-SD9)建立精确匹配,“温病”(L3-SE0)下存在“其它特指的温 病”(SE0Y),及“未特指的温病”(SE0Z),“外感病”(L2-SD9)下存在“其它特指的外感病”(SE2Y)及“未特指的外感病”(SE2Z), 此时,由于“新感温病”(A01.03.01.01)无子疾病,应选择其它特指分 类名称,而“其它特指的温病”(SE0)是其等级最相近的分类名,故在 二者之间建立相关匹配,如图6所示。

在该实施例中,建立以上四种匹配关系时,选择的先后顺序为精确匹 配-向上匹配-向下匹配-相关匹配。当然,也可以选择先后顺序为精确匹配 -向下匹配-向上匹配-相关匹配。

图7为本发明实施例3提供的传统医学疾病本体的构建装置的结构示 意图。如图7所示,该实施例提供的传统医学疾病本体的构建装置700包 括分类框架搭建单元710和映射单元720。映射单元720包括精确匹配模 块721。

分类框架搭建单元710用于搭建本体分类框架。分类框架搭建单元 710的操作可以参照上面参考图2描述的步骤S210的操作。

映射单元720用于实现属于各个分类的传统医学疾病术语集到参考 传统医学疾病术语集的映射,其中,将属于本体分类的传统医学疾病术语 集作为匹配来源集,参考传统医学疾病术语集作为匹配目标集。映射单元 720的操作可以参照上面参考图2描述的步骤S220的操作。

精确匹配模块721用于将匹配来源集中各个疾病术语分别与匹配目 标集中各个疾病术语进行精确匹配,找到精确匹配成功的疾病术语对,其 中,精确匹配是指匹配来源集中的疾病术语与匹配目标集中的疾病术语语 义等价。

精确匹配可以包括以下各匹配方式中至少一种:匹配来源集中的疾病 术语与匹配目标集中的疾病术语相同;匹配来源集中的疾病术语与匹配目 标集中的疾病术语主体相同;匹配来源集和匹配目标集中一个集合的疾病 术语的同义词与另一个集合的疾病术语相同;以及匹配来源集的疾病术语 与匹配目标集的疾病术语内涵相同。

映射单元720还可以包括向上匹配模块,用于对于精确匹配失败的疾 病术语,将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病术语 进行向上匹配,找到向上匹配成功的疾病术语对,其中,向上匹配是指匹 配目标集中疾病术语的内涵和外延大于匹配来源集中的疾病术语。向上匹 配可以包括以下原则:就近原则,当匹配来源集中的疾病术语的多个上级 疾病术语与匹配目标集的疾病术语存在精确匹配时,选择与其等级最近的 上级疾病术语所匹配的匹配目标集中的疾病术语作为其匹配术语;当匹配 来源集与匹配目标集的等级相差为1而且匹配来源集下一级疾病术语存 在特指和/或非特指疾病术语时,建立匹配来源集的疾病术语与匹配目标 集的疾病术语下一级的特指或非特指疾病术语的相关匹配,而非向上匹配。

映射单元720还可以包括向下匹配模块,用于对于向上匹配失败的疾 病术语,将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病术语 进行向下匹配,找到向下匹配成功的疾病术语对,其中,向下匹配是指匹 配目标集中疾病术语的内涵和外延小于匹配来源集中的疾病术语。向下匹 配可以包括以下原则:应用就近原则,选择已精确匹配的等级最相近的匹 配来源集疾病术语的下级疾病术语所匹配的匹配目标集术语进行向下匹配;当匹配来源集中的疾病术语能够与匹配目标集中多个疾病术语建立向 下匹配关系时,不进行向下匹配。

映射单元720还可以包括相关匹配模块,用于对于向下匹配失败的疾 病术语,将匹配来源集中各个疾病术语分别与匹配目标集中的疾病术语进 行相关匹配,找到相关匹配成功的疾病术语对,其中,相关匹配是指匹配 来源集中的疾病术语与匹配目标集中的疾病术语互相部分包含对方的内 涵和外延。相关匹配包括以下原则:如果匹配来源集的疾病术语有子疾病 术语,则相关匹配到匹配目标集的非特指疾病术语;如果匹配来源集的疾病术语无子疾病术语,则相关匹配到匹配目标集的特指疾病术语;应用就 近原则,选择已精确匹配且等级最相近的上级疾病术语所匹配的匹配目标 集疾病术语下的特指或非特指疾病术语。

图8为根据本发明实施例的用于传统医学疾病本体的构建处理的计 算设备的结构框图。

如图8所示,计算设备800可以包括至少一个处理器810、存储器820、 内存830、通信接口840以及内部总线850,并且至少一个处理器810、 存储器820、内存830和通信接口840经由总线850连接在一起。该至少 一个处理器810执行在计算机可读存储介质(即,存储器820)中存储或 编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。

在一个实施例中,在存储器820中存储有计算机可执行指令,其当执 行时使得至少一个处理器810:搭建本体分类框架;实现属于各个分类的 传统医学疾病术语集到参考传统医学疾病术语集的映射,其中,将属于本 体分类的传统医学疾病术语集作为匹配来源集,参考传统医学疾病术语集 作为匹配目标集,所述实现属于各个分类的传统医学疾病术语集到参考传 统医学疾病术语集的映射包括:将匹配来源集中各个疾病术语分别与匹配目标集中各个疾病术语进行精确匹配,找到精确匹配成功的疾病术语对, 其中,精确匹配是指匹配来源集中的疾病术语与匹配目标集中的疾病术语 语义等价。

应该理解的是,在存储器820中存储的计算机可执行指令当执行时使 得至少一个处理器810进行本公开的各个实施例中以上结合图1-6描述的 各种操作和功能。

在本公开中,计算设备800可以包括但不限于:个人计算机、服务器 计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计 算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手 持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。

根据一个实施例,提供了一种例如非暂时性机器可读介质的程序产品。 非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素), 该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图 1-6描述的各种操作和功能。

具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储 介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使 该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中 的指令。

在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中 任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存 储介质构成了本发明的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、 CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁 带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算 机上或云上下载程序代码。

以上所述仅为本发明的实施例,并非因此限制本发明的权利要求保护 范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换, 或直接或间接运用在其他相关的技术领域,均同理包括在本发明权利要求 的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号