首页> 中国专利> 一种数据库建设用测量数据属性智能化匹配与识别模块

一种数据库建设用测量数据属性智能化匹配与识别模块

摘要

本发明涉及数据库建设技术领域,特别涉及一种数据库建设用测量数据属性智能化匹配与识别模块,本发明公开了一种数据库建设用测量数据属性智能化匹配与识别模块,包括待匹配数据、本地数据库和匹配数据库,所述待匹配数据包括待匹配属性数据,所述待匹配属性数据为多个属性数据,所述本地数据库包括若干个数据库属性数据。本发明所述的一种数据库建设用测量数据属性智能化匹配与识别模块,选取待匹配属性数据作为匹配参考对象,从本地数据库中获取数据库属性数据,避免待匹配属性数据与大量数据库数据进行识别工作,从而提高识别匹配效率;而对待匹配属性数据进行相似度的加权值计算并判断,有利于对本地数据库的精准扩充。

著录项

  • 公开/公告号CN112328633A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 安徽精益测绘有限公司;

    申请/专利号CN202011107677.7

  • 发明设计人 万少华;姚路明;王强;

    申请日2020-10-16

  • 分类号G06F16/2455(20190101);G06F16/2457(20190101);G06F16/27(20190101);

  • 代理机构

  • 代理人

  • 地址 230000 安徽省合肥市包河区锦绣大道与庐州大道交口滨湖新地城市广场1幢办305室

  • 入库时间 2023-06-19 09:47:53

说明书

技术领域

本发明涉及数据库建设技术领域,特别涉及一种数据库建设用测量数据属性智能化匹配与识别模块。

背景技术

数据库是按照数据结构来组织、存储和管理数据的仓库,它产生于距今六十多年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。

而现有数据库在网络数据分析时,往往需要快速进行数据属性匹配和属性识别工作,而数据匹配的过程中往往因待匹配数据与数据库中大量数据进行一一识别,导致匹配效率不高;且在匹配识别过程中,匹配过程的准确性不高,从而不利于对本地数据库的精准扩充。

发明内容

本发明的主要目的在于提供一种数据库建设用测量数据属性智能化匹配与识别模块,可以有效解决背景技术中的问题。

为实现上述目的,本发明采取的技术方案为:

一种数据库建设用测量数据属性智能化匹配与识别模块,包括待匹配数据、本地数据库和匹配数据库,所述待匹配数据包括待匹配属性数据,所述待匹配属性数据为多个属性数据,所述本地数据库包括若干个数据库属性数据,对所述待匹配数据进行相似度计算和计算其加权值并对比加权值与阈值的关系,将所述待匹配数据导入匹配数据库,将所述匹配数据库导入本地数据库。

优选的,获取本地数据库中的多个数据库属性数据,将待匹配属性数据添加至对象队列,对象队列中待匹配属性数据按照属性数据进行排列;从对象队列中选取待匹配属性数据作为匹配参考对象;根据匹配参考对象的属性数据,从本地数据库中获取待匹配属性数据的数据库属性数据。

优选的,所述待匹配数据的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则不匹配;若加权值大于阈值,则匹配,加权平均值即将属性相似度乘以相应的权数,并加总求和得到总体值,再除以总的单位数;

优选的,其中确定匹配的工作流程如下:

S1、首先,将待匹配的数据进行导入,并确定待匹配数据的多个属性从而获取待匹配属性数据;

S2、根据本地数据库确定本地数据库多个属性从而获取数据库属性数据,并提取数据库属性数据。

S3、判断数据库属性数据的集合与待匹配属性数据的集合是否为空集,若不为空集,计算属性相似度加权值;若为空集,则进入下一步,判断待匹配属性数据集合是否与匹配数据集合为空集;

S4、计算参考阈值;

S5、判断属性相似度加权值是否大于阈值,若大于阈值,则进行匹配,并将待匹配数据导入匹配数据库;否则不匹配,并将待匹配数据存入存疑数据库。

优选的,所述步骤三中若匹配数据集合与待匹配属性数据集合为空集,则结束匹配,若匹配数据集合与待匹配属性数据集合不为空集,则将待匹配属性数据导入本地数据库。

优选的,一种数据库建设用测量数据属性智能化匹配与识别装置,包括:

数据采集模块,用于收集待匹配属性数据和数据库属性数据;

一号处理模块,用于判断属性数据集合是否为空集;

二号处理模块,用于根据待匹配属性数据和数据库属性数据计算属性相似

度的加权值;

三号处理模块,用于判断匹配数据集合是否为空集;

控制器,用于判断属性相似度的加权值与阈值之间的关系,并确定匹配结果;

存储器,用于对不匹配的待匹配数据进行存储;

导入模块,用于将匹配成功的待匹配属性数据导入匹配数据库,并最终将匹配数据库导入本地数据库。

与现有技术相比,本发明具有如下有益效果:

本发明中,通过将待匹配的数据进行导入,并选取待匹配属性数据作为匹配参考对象,根据匹配参考对象的属性数据从本地数据库中获取待匹配属性数据的数据库属性数据,避免待匹配属性数据与大量数据库数据进行识别工作,从而提高识别匹配效率;而对待匹配属性数据进行相似度的加权值计算并判断,从而可控制匹配过程的准确性,有利于对本地数据库的精准扩充。

附图说明

图1为本发明一种数据库建设用测量数据属性智能化匹配与识别模块的步骤流程图;

图2为本发明一种数据库建设用测量数据属性智能化匹配与识别模块的匹配流程图;

图3为本发明一种数据库建设用测量数据属性智能化匹配与识别模块的示意图。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。

在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

如图1-3所示,一种数据库建设用测量数据属性智能化匹配与识别模块,包括待匹配数据、本地数据库和匹配数据库,待匹配数据包括待匹配属性数据,待匹配属性数据为多个属性数据,本地数据库包括若干个数据库属性数据,对待匹配数据进行相似度计算和计算其加权值并对比加权值与阈值的关系,将待匹配数据导入匹配数据库,将匹配数据库导入本地数据库。

获取本地数据库中的多个数据库属性数据,将待匹配属性数据添加至对象队列,对象队列中待匹配属性数据按照属性数据进行排列;从对象队列中选取待匹配属性数据作为匹配参考对象;根据匹配参考对象的属性数据,从本地数据库中获取待匹配属性数据的数据库属性数据。

待匹配数据的相似度进行加权,并将加权值与阈值进行比较;若加权值小于阈值,则不匹配;若加权值大于阈值,则匹配,加权平均值即将属性相似度乘以相应的权数,并加总求和得到总体值,再除以总的单位数;

其中确定匹配的工作流程如下:

S1、首先,将待匹配的数据进行导入,并确定待匹配数据的多个属性从而获取待匹配属性数据;

S2、根据本地数据库确定本地数据库多个属性从而获取数据库属性数据,并提取数据库属性数据。

S3、判断数据库属性数据的集合与待匹配属性数据的集合是否为空集,若不为空集,计算属性相似度加权值;若为空集,则进入下一步,判断待匹配属性数据集合是否与匹配数据集合为空集;

S4、计算参考阈值;

S5、判断属性相似度加权值是否大于阈值,若大于阈值,则进行匹配,并将待匹配数据导入匹配数据库;否则不匹配,并将待匹配数据存入存疑数据库。

步骤三中若匹配数据集合与待匹配属性数据集合为空集,则结束匹配,若匹配数据集合与待匹配属性数据集合不为空集,则将待匹配属性数据导入本地数据库。

一种数据库建设用测量数据属性智能化匹配与识别装置,包括:

数据采集模块,用于收集待匹配属性数据和数据库属性数据;

一号处理模块,用于判断属性数据集合是否为空集;

二号处理模块,用于根据待匹配属性数据和数据库属性数据计算属性相似

度的加权值;

三号处理模块,用于判断匹配数据集合是否为空集;

控制器,用于判断属性相似度的加权值与阈值之间的关系,并确定匹配结果;

存储器,用于对不匹配的待匹配数据进行存储;

导入模块,用于将匹配成功的待匹配属性数据导入匹配数据库,并最终将匹配数据库导入本地数据库。

需要说明的是,本发明为一种数据库建设用测量数据属性智能化匹配与识别模块,首先,将待匹配的数据进行导入,并确定待匹配数据的多个属性然后将待匹配属性数据添加至对象队列,对象队列中待匹配属性数据按照属性数据进行排列;从对象队列中选取待匹配属性数据作为匹配参考对象;根据匹配参考对象的属性数据,从本地数据库中获取待匹配虚拟对象的数据库属性数据,从而获取待匹配属性数据;然后判断数据库属性数据的集合与待匹配属性数据的集合是否为空集,若不为空集,计算属性相似度加权值;若为空集,则进入下一步,判断待匹配属性数据集合是否与匹配数据集合为空集,若匹配数据集合与待匹配属性数据集合为空集,则结束匹配,若匹配数据集合与待匹配属性数据集合不为空集,则将待匹配属性数据导入本地数据库;而当数据库属性数据的集合与待匹配属性数据的集合不为空集时,对待匹配数据的相似度进行计算,并将属性相似度乘以相应的权数,并加总求和得到总体值,再除以总的单位数,得到加权值并将加权值与计算得出的阈值进行对比判断,当相似度加权值大于阈值时,则进行匹配,并将待匹配数据导入匹配数据库;否则不匹配,并将待匹配数据存入存疑数据库,对存疑的数据进行存储,而匹配和识别模块可实现数据间的快速匹配识别,且在匹配识别的过程中可对匹配数据库和本地数据库进行不断扩充,有利于丰富数据库数据。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号