首页> 中国专利> 基于元数据的中医药古籍共享数据库构建系统及方法

基于元数据的中医药古籍共享数据库构建系统及方法

摘要

本发明涉及一种基于元数据的中医药古籍共享数据库构建系统及方法,系统包括元数据索引建立模块、读取标记模块、信息提取模块、共享数据库和调节控制模块;方法包括S1.基于预设的不同权重优先级的地域元素建立元数据索引;S2.利用所述元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源;S3.提取所述目标中医药内容源中的书目和提要信息,将所述书目和提要信息存储至共享数据库中。本发明通过按照不同权重优先级逐级识别的方式,能够增加对中医药内容源的读取效率,避免所有等级地域元素全部参与索引导致的数据处理繁琐、内存占用大、读取效率低等问题。

著录项

  • 公开/公告号CN114783617A

    专利类型发明专利

  • 公开/公告日2022-07-22

    原文格式PDF

  • 申请/专利权人 合肥师范学院;

    申请/专利号CN202210500895.X

  • 申请日2022-05-10

  • 分类号G16H50/70;G16H70/40;G06F16/31;G06F16/383;G06F16/387;

  • 代理机构合肥中谷知识产权代理事务所(普通合伙);

  • 代理人李蒙蒙

  • 地址 230000 安徽省合肥市黄麓科教园区书香路

  • 入库时间 2023-06-19 16:06:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-22

    公开

    发明专利申请公布

说明书

技术领域

本发明属于古籍文献整理技术领域,具体涉及一种基于元数据的中医药古籍共享数据库构建系统及方法。

背景技术

目前各省区域中医药古籍文献大多分散在全国各地,各区域医籍文献数量众多,沉潜日久,抢救发掘工作任重道远,例如安徽,又一直没有一个专门针对各区域中医药古籍书目提要信息的能够实现共享的数据库,导致历代医学资料无法得到优良的传承。

发明内容

本发明的目的就在于为了解决上述问题而提供一种基于元数据的中医药古籍共享数据库构建系统及方法。

本发明通过以下技术方案来实现上述目的:

一种基于元数据的中医药古籍共享数据库构建方法,包括以下步骤:

S1.基于预设的不同权重优先级的地域元素建立元数据索引;

S2.利用所述元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源;

S3.提取所述目标中医药内容源中的书目和提要信息,将所述书目和提要信息存储至共享数据库中;

其中,步骤S2中,对于多个中医药内容源,通过调节各优先级的元数据索引数量,以实现至少两个中医药内容源的同时读取。

作为本发明的进一步优化方案,所述不同权重优先级的地域元素包括权重逐级递增的第一地域元素、第二地域元素…第n地域元素,由此其建立的元数据索引包括第一元数据索引、第二元数据索引…第m元数据索引。

作为本发明的进一步优化方案,步骤S2中所述的基于元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源的方法包括:

S201.启动第一元数据索引读取所述中医药内容源,并识别所述中医药内容源中是否存在与所述第一地域元素相匹配的第一地域元素数据,若存在,则标记所述第一地域元素数据并进入步骤S202,反之则读取结束;

S202.启动第二元数据索引读取所述中医药内容源,并识别所述中医药内容源中是否存在与所述第二地域元素相匹配的第二地域元素数据,若存在,则标记所述第二地域元素数据并进入步骤S203,反之则读取结束;

S203.以此类推,直至所有元数据索引读取所述中医药内容源,并识别、标记所述中医药内容源中的与所有地域元素相匹配的地域元素数据。

作为本发明的进一步优化方案,步骤S201-S203中,在中医药内容源读取过程中识别出存在与地域元素相匹配的地域元素数据时,当前元数据索引继续读取中医药内容源的剩余内容,同时立即启动下一级的元数据索引读取所述中医药内容源。

作为本发明的进一步优化方案,步骤S201-S203中,标记地域元素数据的方法包括:每一优先级元数据索引标记的地域元素数据采用不同颜色进行标记。

作为本发明的进一步优化方案,步骤S201中,当识别的所述中医药内容源中不存在与所述第一元数据索引目标相匹配的第一地域元素数据时,读取结束,并清除所述第一元数据索引中存储的中医药内容源。

作为本发明的进一步优化方案,在步骤S3之前,将标记有地域元素数据的中医药内容源发送至专家端,专家端基于所述地域元素数据和预设的不同权重优先级的地域元素判断所述中医药内容源是否属于目标地域的中医药内容源,若符合,则进行步骤S3,反之则清除所有元数据索引中存储的中医药内容源。

作为本发明的进一步优化方案,所述调节各优先级的元数据索引数量的调节方法包括:根据同时读取中医药内容源的数量,及时更换各优先级元数据索引中的地域元素,使得元数据索引的优先级别更换。

一种实现上述基于元数据的中医药古籍共享数据库构建方法的共享数据库构建系统,所述共享数据库构建系统包括:

元数据索引建立模块,其基于预设的不同权重优先级的地域元素建立元数据索引;

读取标记模块,其利用所述元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源;

信息提取模块,其用于提取所述目标中医药内容源中的书目和提要信息,将所述书目和提要信息存储至共享数据库中;

共享数据库,其用于存储所述书目和提要信息,并将所述书目和提要信息共享至网络平台;

调节控制模块,其用于根据同时读取中医药内容源的数量,及时更换各优先级的元数据索引中的地域元素。

所述读取标记模块设置为多个,每个读取标记模块中均植入一个元数据索引,所述调节控制模块还能够通过更换读取标记模块中的整个元数据索引,实现至少两个中医药内容源的同时读取。

本发明的有益效果在于:

1)本发明将地域元素按照不同权重优先级进行设置,以多级地域元素建立多级元数据索引,在对中医药内容源读取时,按照不同权重优先级的元数据索引逐级读取、识别中医药内容源,使得中医药内容源符合目标地域中医药古籍文献的确定度逐级增加,以此保证了地域中医药古籍文献的划分精确度,该方法通过按照不同权重优先级逐级识别的方式,能够增加对中医药内容源的读取效率,避免所有等级地域元素全部参与索引导致的数据处理繁琐、内存占用大、读取效率低等问题;

2)本发明能够对各元数据索引中的不同权重优先级的区域元素进行更换调节,使得各级别元数据索引数量可根据中医药内容源进行调节,能够实现至少两个中医药内容源的同时读取,以此来加快中医药内容源的读取效率;

3)本发明还能够对各读取识别模块中的整个元数据索引进行更换,使得各级别元数据索引数量可根据中医药内容源进行调节,实现至少两个中医药内容源的同时读取,以此来加快中医药内容源的读取效率。

附图说明

图1是本发明的整体方法流程图。

图2是本发明的系统框图。

图3是本发明的中医药内容源读取流程图。

图中:1、元数据索引建立模块;2、读取标记模块;3、信息提取模块;4、共享数据库;5、调节控制模块;6、专家端。

具体实施方式

下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。

在本发明的描述中,需要理解的是,术语“中心”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制;在本发明的描述中,除非另有说明,“多个”、“若干”的含义是两个或两个以上。

实施例1

如图1-3所示,一种基于元数据的中医药古籍共享数据库构建系统,包括:

元数据索引建立模块1,其基于预设的不同权重优先级的地域元素建立元数据索引;

读取标记模块2,其利用所述元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源;

信息提取模块3,其用于提取所述目标中医药内容源中的书目和提要信息,将所述书目和提要信息存储至共享数据库4中;

共享数据库4,其用于存储所述书目和提要信息,并将所述书目和提要信息共享至网络平台;

调节控制模块5,其用于根据同时读取中医药内容源的数量,及时更换各优先级的元数据索引中的地域元素。

所述读取标记模块2设置为多个,每个读取标记模块2中均植入一个元数据索引,根据不同权重优先级的元数据索引,使得多个读取标记模块2也按照优先级分成多个等级,所述调节控制模块5还能够通过更换读取标记模块2中的整个元数据索引,实现至少两个中医药内容源的同时读取。

采用上述基于元数据的中医药古籍共享数据库构建系统构建中医药古籍共享数据库的方法,包括以下步骤:

S1.基于预设的不同权重优先级的地域元素建立元数据索引;所述不同权重优先级的地域元素包括权重逐级递增的第一地域元素、第二地域元素…第n地域元素,由此其建立的元数据索引包括第一元数据索引、第二元数据索引…第m元数据索引;

其中,以安徽为例,第一地域元素可以包括涉及到安徽、安徽省级以下各地区名称、籍贯为安徽的作者名称、于安徽境内生活的作者名称等,其中涉及到地区的,包括历代安徽区域内的曾用名称;

第二地区元素可以包括起源于安徽的一些诊断方法、治疗手段、草本植物以及相关病症等;一般情况下存在第二地区元素的中医药内容源基本一定存在第一地区元素;

第三地区元素到第n地域元素以此类推,只要是能够逐步确定该中医药内容源为安徽的中医药古籍和文献即可;

S2.利用所述元数据索引按照不同权重优先级读取中医药内容源,以识别、标记出符合所述地域元素的目标中医药内容源;

具体方法包括:

S201.启动第一元数据索引读取所述中医药内容源,并识别所述中医药内容源中是否存在与所述第一地域元素相匹配的第一地域元素数据,若存在,则标记所述第一地域元素数据并进入步骤S202,反之则读取结束并清除所述第一元数据索引中存储的中医药内容源;

S202.启动第二元数据索引读取所述中医药内容源,并识别所述中医药内容源中是否存在与所述第二地域元素相匹配的第二地域元素数据,若存在,则标记所述第二地域元素数据并进入步骤S203,反之则读取结束;

S203.以此类推,直至所有元数据索引读取所述中医药内容源,并识别、标记所述中医药内容源中的与所有地域元素相匹配的地域元素数据;

其中,在中医药内容源读取过程中识别出存在与地域元素相匹配的地域元素数据时,当前元数据索引继续读取中医药内容源的剩余内容,同时立即启动下一级的元数据索引读取所述中医药内容源;

另外,每一优先级元数据索引标记的地域元素数据采用不同颜色进行标记;

S3.将标记有地域元素数据的中医药内容源发送至专家端6,专家端6基于所述地域元素数据和预设的不同权重优先级的地域元素判断所述中医药内容源是否属于目标地域的中医药内容源,若符合,则进行步骤S4,反之则清除所有元数据索引中存储的中医药内容源;

S4.提取所述目标中医药内容源中的书目和提要信息,将所述书目和提要信息存储至共享数据库4中;

另外,步骤S2中,对于多个中医药内容源,通过调节各优先级的元数据索引数量,以实现至少两个中医药内容源的同时读取;

方法一:可以针对所需读取的中医药内容源数量,提前设置各级元数据索引的数量,例如第一元数据索引数量到第m元数据索引数量可以逐渐降低,因为无论多少中医药内容源都需要从第一元数据索引进行读取,能够被第一元数据索引识别出地域元素数据的概率基本不会达到百分之百,甚至可能是0,因此第一元数据索引数量设置多一点更符合实际情况,这样能够进入第二元数据索引进行读取的中医药数据源就少于第一元数据索引,因此第二元数据索引数量可以设置低于第一元数据索引,同理,优先级别越高的元数据索引数量可以设置越低;而所有元数据索引的数量设置,可以根据整个系统的运行内存等进行设置;

具体的,例如有6个中医药内容源进来,共计设置8个元数据索引,8个元数据索引共计有4个等级,此时就可以设置第一元数据索引为3个,第二元数据索引为2个,第三元数据索引为2个,第四元数据索引为1个,此时就可以采用3个第一元数据索引先读取三个中医药内容源,读取完成后,继续读取剩余三个中医药内容源,整体可以分两波进行,加快了读取效率。

方法二:根据同时读取中医药内容源的数量,及时更换各优先级读取标记模块2中元数据索引的地域元素或是直接更换各优先级读取标记模块2中的整个元数据索引,使得元数据索引的优先级别更换;

具体的,例如系统中共计设置8个元数据索引,初始时每个等级分别为2个元数据索引,当有6个中医药内容源同时进来,可以调整第四读取识别模块中第四元数据索引的第四地域元素为第一地域元素,或是直接将第四读取识别模块中的第四元数据索引更换为第一元数据索引,两种方法均可;

调整后,使得第一元数据索引为3个,第二元数据索引为2个,第三元数据索引为2个,第四元数据索引为1个,此时就可以采用3个第一元数据索引先读取三个中医药内容源,读取完成后,继续读取剩余三个中医药内容源,整体可以分两波进行,加快了读取效率;

当读取的中医药内容源更多时,可以将第一元数据索引调整为4个,第二元数据索引调整为4个,当第一元数据索引读取4个中医药内容源完成后,看符合第一地域元素的有几个,若有4个,则4个第二元数据索引直接承接该4个中医药内容源,而此时的第一元数据索引先暂时调整为第三元数据索引,当第二元数据索引读取4个中医药内容源完成后,看符合第二地域元素的有几个,若有4个,则4个第三元数据索引直接承接该4个中医药内容源,而刚读取完成的第二元数据索引暂时调整为第四元数据索引,当第三元数据索引读取4个中医药内容源完成后,看符合第三地域元素的有几个,若有4个,则4个第四元数据索引直接承接该4个中医药内容源,直至读取结束;

上述情况基本很少,一般在第一元数据索引读取4个中医药内容源完成后,4个中医药内容源不会全部符合第一地域元素;当有2个中医药内容源符合第一地域元素时,可以将第二元数据索引调整为2个,第三元数据索引调整为2个,在4个第一元数据索引读取完成后,两个不符合第一地域元素的中医药内容源删除,两个符合的转入2个第二元数据索引,此时4个第一元数据索引就可以继续读取剩余4个中医药内容源,当两个中医药内容源都符合第二地域元素后,转入2个第三元数据索引,此时2个第二元数据索引调整为2个第四元数据索引,直至读取结束,再重复上述步骤,实现8个中医药内容源分两波处理,效率更高;该种方法相较于方法一更为灵活,读取效率更高。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号