首页> 中国专利> 一种中医医案数据提取系统及其方法

一种中医医案数据提取系统及其方法

摘要

本发明涉及中医信息化技术领域,且公开了一种中医医案数据提取系统,包括元数据模块、语料库、数据采集模块、数据验证模块、数据分解模块、医案建档模块、查询模块;所述元数据模块用于设定实体类、词典和语义关系并进行维护;所述语料库用于根据导入的文献形成半结构化文档;所述数据采集模块针对现有医案进行数据采集;所述数据验证模块对数据采集模块采集的数据进行验证,通过才有图像信息采集的方式提高对医案文本信息的采集速率,且在提取数据前引用规范标准的元数据模块和语料库,用于对采集数据进行规范化,提高了对医案数据的分析效率,保证了医案建档的规范,避免非常规性医案导致后续整理苦难。

著录项

  • 公开/公告号CN116821199A

    专利类型发明专利

  • 公开/公告日2023-09-29

    原文格式PDF

  • 申请/专利权人 中国中医科学院中医药信息研究所;

    申请/专利号CN202310786367.X

  • 发明设计人 刘丽红;朱彦;姚克宇;

    申请日2023-06-29

  • 分类号G06F16/2457(2019.01);G06F16/25(2019.01);G06F16/248(2019.01);G06F16/28(2019.01);G06F40/30(2020.01);

  • 代理机构广州大象飞扬知识产权代理有限公司 44745;

  • 代理人李静

  • 地址 100700 北京市东城区东直门内南小街16号

  • 入库时间 2024-01-17 01:30:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-09-29

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及中医信息化技术领域,具体为一种中医医案数据提取系统及其方法。

背景技术

中医医案也即是病案,是医生治疗疾病时辩证、立法、处方用药的连续记录。医案记录了中医临床大夫试试辩证论治的过程,反映了医家的思维活动、学术观点以及丰富的临床经验,为中医药理论的创新与发展提供了宝贵的研究素材。对医案进行研究,并从医案中学习相关知识,不仅能丰富和深化理论知识,而且可以提高临床诊疗水平,开阔视野,启迪思路。因此,医案对于从事中医临床、教学和科研工作者来说,在中医临床研究和实践方面具有重大的指导意义;

然而中医药自身的特点导致其属性表述方式小统一,比如中药的形状、产地、用量等属性通常需采用图、文字、数字等多种描述方式,使得用“模式”事先定义结构的传统关系型数据库难于有效管理,而且数据之问的异构增加了集成难度,中医理论主要从系统的、经验的角度出发,对中医药数据对象的属性描述相对抽象,如对药性的描述多采用诸如“辛”、“温”等词,如对细辛的应用描述为“本品辛温发散,...长于解表散寒,...宜于外感风寒,头身疼痛较甚者,常与羌活、防风、白芷等祛风比痛药同用...”,属性描述的模糊性、抽象性往往导致数据难以理解,因此将对大量中医医案数据提取到需要的符合规范的医案是一件非常困难的问题。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种中医医案数据提取系统及其方法,具备准确率高、操作规范化的优点,解决了医案数据提取苦难的问题。

(二)技术方案

为实现上述背景技术中提到目的,本发明提供如下技术方案:一种中医医案数据提取系统,包括元数据模块、语料库、数据采集模块、数据验证模块、数据分解模块、医案建档模块、查询模块;

所述元数据模块用于设定实体类、词典和语义关系并进行维护;

所述语料库用于根据导入的文献形成半结构化文档;

所述数据采集模块针对现有医案进行数据采集;

所述数据验证模块对数据采集模块采集的数据进行验证;

所述数据分解模块根据划分规范对数据采集模块采集到数据进行分解;

所述医案建档模块对数据分解模块分解的数据进行分类存放并设置检索条件;

所述查询模块用于对医案建档模块建档的医案进行查询。

优选的,所述元数据模块中设置有实体类和语义关系,每个所述实体类包括至少一个词典;所述语义关系根据所述实体类的属性定义各实体类之间的关系。

优选的,所述语料库中包括至少一个专题,每个所述专题下涵盖有多个文献;所述文献以树形结构进行展示。

优选的,所述数据采集模块包括图像采集和人工输入,图像采集通过摄像设备以及文本扫描设备对纸质的医案文本进行摄像和文本扫描,人工输入,对无法识别的纸质的医案文本信息进行手动输入。

优选的,所述数据验证模块通过调用元数据模块内和语料库验证数据采集模块采集的信息是否符合要求。

优选的,所述数据分解模块通过文本聚类算法对同一类症状的规范化患者症状信息进行聚类分析,通过关联规则挖掘算法挖掘中医医案中的症状与方药,症状与证型,证型与方药之间以及中药配伍之间的多重关联关系对医案数据进行分解,调用元数据模块和语料库将分解后的非常规术语替换为标准术语。

优选的,所述医案建档模块根据数据分解模块分解的数据类定义多维的医案数据元素结构,将多维数据元素结构和的数据分解模块分解的数据类整合成医案档案。

优选的,所述查询模块通过调用元数据模块和语料库对查询语句进行验证是否符合规范,根据符合要求的查询语句对医案档案进行查询。

一种中医医案数据提取系统的提取方法,包括一下步骤:

S1、通过摄像设备和文本扫描设对医案文本进行数据采集,无法识别的医案文本通过人工进行输入;

S2、调用数据验证模块,对摄像设备和文本扫描设采集的数据进行验证;

S3、调用数据分解模块,对医案数据进行分解,然后替换其中非常规术语;

S4、调用医案建档模块对数据分解模块分解后数据进行分类建档,并根据分类类型设置检索条件。

(三)有益效果

与现有技术相比,本发明提供了一种中医医案数据提取系统及其方法,具备以下有益效果:

1、该中医医案数据提取系统及其方法,通过才有图像信息采集的方式提高对医案文本信息的采集速率,且在提取数据前引用规范标准的元数据模块和语料库,用于对采集数据进行规范化,提高了对医案数据的分析效率,保证了医案建档的规范,避免非常规性医案导致后续整理苦难;

2、该中医医案数据提取系统及其方法,通过对医案数据的分解,对其中数据进行分化处理,根据元数据模块内规范对其替换,便于后期对医案数据的建档,也便于对医案进行检索。

附图说明

图1为本发明系统流程图;。

图中:1、元数据模块;2、语料库;3、数据采集模块;4、数据验证模块;5、数据分解模块;6、医案建档模块;7、查询模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚明白,下面将以附图及详细叙述清楚说明本申请所揭示内容的精神,任何所属技术领域技术人员在了解本申请内容的实施例后,当可由本申请内容所教示的技术,加以改变及修饰,其并不脱离本申请内容的精神与范围。

本申请的示意性实施例及其说明用于解释本申请,但并不作为对本申请的限定。另外,在附图及实施方式中所使用相同或类似标号的元件/构件是用来代表相同或类似部分。

关于本文中所使用的“第一”、“第二”、…等,并非特别指称次序或顺位的意思,也非用以限定本申请,其仅为了区别以相同技术用语描述的元件或操作。

关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。

关于本文中所使用的“及/或”,包括所述事物的任一或全部组合。

关于本文中的“多个”包括“两个”及“两个以上”;关于本文中的“多组”包括“两组”及“两组以上”。

某些用以描述本申请的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本申请的描述上额外的引导。

如图1所示,本申请提供了一种中医医案数据提取系统及其方法,包括元数据模块1、语料库2、数据采集模块3、数据验证模块4、数据分解模块5、医案建档模块6、查询模块7;

元数据模块1用于设定实体类、词典和语义关系并进行维护,元数据模块1中设置有实体类和语义关系,每个实体类包括至少一个词典;语义关系根据实体类的属性定义各实体类之间的关系;

语料库2用于根据导入的文献形成半结构化文档,语料库2中包括至少一个专题,每个专题下涵盖有多个文献;文献以树形结构进行展示;

数据采集模块3针对现有医案进行数据采集,数据采集模块3包括图像采集和人工输入,图像采集通过摄像设备以及文本扫描设备对纸质的医案文本进行摄像和文本扫描,人工输入,对无法识别的纸质的医案文本信息进行手动输入,针对从扫描设备直接扫描出的原始图像进行预处理,以将原始图像二值化并且去除原始图像噪点,将扭曲的原始图像还原,通过版面分析算法搜索整个预处理文档图像并对预处理文档图像进行区域划分和类型识别,以获得预处理文档图像的版面特征信息,版面特征信息包括区域分割线坐标信息、预处理文档图像的类型信息以及预处理文档图像中的文字对象的坐标信息,然后生成电子数据信息;

数据验证模块4对数据采集模块采集的数据进行验证,数据验证模块4通过调用元数据模块1和语料库2验证数据采集模块3采集的信息是否符合要求,对于元数据模块1和语料库2无法识别的文本信息进行提示,操作人员对其进行二次输入,或者在二次输入前对其进行修改,;

数据分解模块5根据划分规范对数据采集模块3采集到数据进行分解,据分解模块5通过文本聚类算法对同一类症状的规范化患者症状信息进行聚类分析,通过关联规则挖掘算法挖掘中医医案中的症状与方药,症状与证型,证型与方药之间以及中药配伍之间的多重关联关系对医案数据进行分解,分解要素根据建档规范进行分类,分类信息包括基础信息:中药的形状、产地、用量等属性,特征信息:药性、特征病人信息,调用元数据模块1和语料库2将分解后的非常规术语替换为标准术语;

医案建档模块6对数据分解模块5分解的数据进行分类存放并设置检索条件,医案建档模块6根据数据分解模块5分解的数据类定义多维的医案数据元素结构,将多维数据元素结构和的数据分解模块分解的数据类整合成医案档案,然后根据元数据模块1规范建立检索条件;

查询模块7用于对医案建档模块建档的医案进行查询。

一种中医医案数据提取系统的提取方法,包括一下步骤:

S1、通过摄像设备和文本扫描设对医案文本进行数据采集,无法识别的医案文本通过人工进行输入;

S2、调用数据验证模块4,对摄像设备和文本扫描设采集的数据进行验证;

S3、调用数据分解模块5,对医案数据进行分解,然后替换其中非常规术语;

S4、调用医案建档模块6对数据分解模块分解后数据进行分类建档,并根据分类类型设置检索条件。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号