首页> 中国专利> 一种自动生成近似函数依赖规则的方法

一种自动生成近似函数依赖规则的方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种自动生成近似函数依赖规则的方法，所述自动生成近似函数依赖规则的方法包含以下几个步骤：步骤S100：对数据库r的所有列进行扫描分析，生成候选列R，并构建所述候选列R各列的分区P(R)；步骤S200：对所述候选列R按照一定的顺序排序，采用策略搜索出所有满足条件的规则左部；步骤S300：对所述策略搜索的搜索空间，采用修剪规则进行修剪，压缩所述策略搜索的搜索空间；步骤S400：对所述压缩的搜索空间进行计算并生成近似函数依赖规则的右部，同时生成近似函数依赖规则。本发明可自动挖掘、生成近似函数依赖规则，挖掘与生成的效率较高。

著录项

公开/公告号CN103077181A

专利类型发明专利
公开/公告日2013-05-01

原文格式PDF
申请/专利权人深圳市华傲数据技术有限公司;
展开▼

申请/专利号CN201210471793.6
发明设计人王明兴;贾西贝;
展开▼

申请日2012-11-20
分类号G06F17/30;
代理机构
代理人
地址 518057 广东省深圳市高新区中区高新中一道9号软件大厦7楼713室
入库时间 2024-02-19 18:33:18

法律信息

法律状态公告日

法律状态信息

法律状态
2023-01-24

专利权人的姓名或者名称、地址的变更 IPC(主分类):G06F17/30 专利号:ZL2012104717936 变更事项:专利权人变更前:深圳市华傲数据技术有限公司变更后:深圳市华傲数据技术有限公司变更事项:地址变更前:518057 广东省深圳市高新区中区高新中一道9号软件大厦7楼713室变更后:518057 广东省深圳市龙华区民治街道北站社区汇德大厦1号楼2203/2204

专利权人的姓名或者名称、地址的变更
2017-02-08

授权

授权
2013-12-18

实质审查的生效 IPC(主分类):G06F17/30 申请日:20121120

实质审查的生效
2013-05-01

公开

公开

说明书

一、技术领域

本发明涉及到一种数据库的处理方法，尤其涉及到一种自动生成近似函数依赖规则的方法。

二、背景技术

随着社交网络、移动计算和传感器等新的渠道和技术不断涌现，大量新型数据应运而生。我们生活在一个数据成指数式急剧增的时代，常规技术已经难以应对PB(1024TB)级的大规模数据量。

分析调研机构IDC在其发布的数字宇宙研究报告(Digital Universe Study)——《从混沌中提取价值》(Extracting Value from Chaos)中指出，全球信息总量每过两年，就会增长一倍。 2011年，全球被创建和被复制的数据总量为1.8ZB。相较2010年同期，这一数据上涨了超过 1ZB。在被创建的信息数据总量中，有75％来自于个人，这包括文字、图片、视频和音乐。这些个人数据的蔓延增速要比数据的创建速度更加迅猛。不过，在报告中IDC同时也认为，企业级的应用数据有朝一日将会占据数据总量的80％。

如何从这些爆炸式增长的数据量中，收集、存储和发掘利用海量数据以获取洞见，为世界经济创造巨大的价值，是人们急需面对的一个难题。麦肯锡全球研究院在它的《海量数据：创新、竞争和提高生产率的下一个新领域》报告中预测，擅用海量数据产生价值的行业巨头战胜不擅利用海量数据的对手，已经越来越成为了显性的趋势。

在当前海量数据环境下或者大数据时代，怎样快速的找出数据之间的规则，分析、挖掘数据的规律，为企业决策者提供建设性的建议，是IT技术人员需要考虑的问题。本发明正是在此背景之下，针对海量数据，提出的一种新的、适用海量数据环境的一种自动生成近似函数依赖规则的方法。

三、发明内容

为了实现本发明目的，本发明提供一种自动生成近似函数依赖规则的方法。所述自动生成近似函数依赖规则的方法包含以下几个步骤：步骤S100：对数据库r的所有列进行扫描分析，生成候选列R，并构建所述候选列R各列的分区P(R)；步骤S200：对所述候选列R按照一定的顺序排序，采用策略搜索出所有满足条件的规则左部；步骤S300：对所述策略搜索的搜索空间，采用修剪规则进行修剪，压缩所述策略搜索的搜索空间；步骤S400：对所述压缩的搜索空间进行计算并生成近似函数依赖规则的右部，同时生成近似函数依赖规则。

应当理解，以上总体说明和以下详细说明都是说明性和实例性的，旨在提供对所要求的本发明的进一步说明。

四、附图说明

所包含的附图用于提供对本发明的进一步理解，其被并入说明书并构成其一部分，附图说明了本发明的实施例，并与说明书一起用于理解本发明的原理。

图1是本发明一种自动生成近似函数依赖规则的方法流程图。。

图2是本发明较佳实施例的计算生成近似函数依赖规则的右部的方法流程图。

图3是本发明较佳实施例的计算当前freesetCol的闭集closedCol和候选子集candidates 方法流程图。

图4是本发明较佳实施例的逆序遍历候选子集candidates方法流程图。

图5是本发明较佳实施例的递增策略搜索结构图。

五、具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

相似文献

专利
中文文献
外文文献

1. 一种自动生成近似函数依赖规则的方法 [P] . 中国专利： CN103077181B . 2017.02.08
2. 一种不规则多边形的最大内接矩形的快速近似求解方法 [P] . 中国专利： CN110648357A . 2020-01-03
3. RULE INFORMATION AUTO-GENERATION SYSTEM, RULE INFORMATION AUTO-GENERATION METHOD, RULE INFORMATION AUTO-GENERATION PROGRAM [P] . 日本专利： JP2004178416A . 2004-06-24

机译：规则信息自动生成系统，规则信息自动生成方法，规则信息自动生成程序
4. METHOD FOR AUTOMATICALLY GENERATING REGULAR EXPRESSIONS FOR RELAXED MATCHING OF TEXT PATTERNS [P] . 美国专利： US2009070327A1 . 2009-03-12

机译：自动生成规则表达匹配文本规则的规则表达的方法
5. A METHOD FOR AUTOMATIC GENERATION OF RULE-BASED DETECTION PATTERNS ABOUT THE BOTS AND WORMS IN THE COMPUTER NETWORK [P] . 韩国专利： KR100615080B1 . 2006-08-25

机译：计算机网络中基于规则和蠕虫的检测规则的自动生成方法