公开/公告号CN113849783A
专利类型发明专利
公开/公告日2021-12-28
原文格式PDF
申请/专利权人 北京创安恒宇科技有限公司;
申请/专利号CN202111156027.6
申请日2021-09-30
分类号G06F21/16(20130101);G06F21/60(20130101);G06F16/22(20190101);
代理机构34167 滁州创科维知识产权代理事务所(普通合伙);
代理人洪余节
地址 100089 北京市海淀区碧桐园6号楼4层417
入库时间 2023-06-19 13:26:15
技术领域
本发明涉及数据溯源技术领域,尤其涉及一种基于国密的结构化数据标签水印溯源的方法。
背景技术
大数据场景下,数据交易量与日俱增,数据在各个流转环节都会面临被攻击者窃取和贩卖的危险,数据溯源技术就显得尤为重要。数据溯源技术主要是记录原始数据在整个生命周期内的演变信息与演变处理内容,强调的是一种溯本追源的技术,根据追踪数据的流转路径来重现数据的历史状态和演变过程,在数据发生泄漏以后可以通过该技术迅速定位到泄密者。
传统的数据溯源技术,比如标注法和反向查询法等,虽然简单有效,但是存储信息需要额外的空间或者算法计算的复杂度较高,都不适用于当今的大数据背景。后期衍生的数据库水印技术可以实现对大批量数据的操作,主要通过将不同的标志性水印信息利用数据库水印技术嵌入到数据库中,然后将不同指纹信息的数据库依次分发给各个用户,一旦数据发生泄露,通过水印提取算法将提取出的水印信息进行比对确定出泄密者。然而,数据库水印技术局限性较强,大多针对数值型数据,而实际生产中数据类型大多是数值型和字符型混合的数据,这是现阶段必须要面对和解决的问题。
发明内容
本发明的目的在于提供一种基于国密的结构化数据标签水印溯源的方法,以解决上述现有技术中的不足之处。
为了实现上述目的,本发明采用了如下技术方案:一种基于国密的结构化数据标签水印溯源的方法,包括以下步骤:
S1:数据处理单位Dp对数据拥有者Do的原始数据表结构进行拆分操作;
S2:对拆分后的各个表添加或替换其主外键,从而形成保留参照关系的新型表结构;
S3:密钥生成与存储;
S4:基于密钥空间的置换算法将表中的元组进行重排,将重排后的数据分发给下属单位;
S5:基于密钥空间的置换算法以及数据处理单位D
作为上述技术方案的进一步描述:
所述对原始数据表结构进行拆分操作包括对单表拆分处理和多表拆分处理;
所述单表拆分处理方法为采用竖直拆分的方法,即在不破坏第三范式的前提下,将表A按照其模块和功能分别划分到不同的数据库表[a
所述多表拆分处理方法为利用中单表拆分方法对多表进行拆分处理。
作为上述技术方案的进一步描述:
所述对拆分后的各个表添加或替换其主外键具体方法包括以下步骤:
S2.1:保留表a
S2.2:将表[a
S2.3:将拆分后的每张表中拥有的属性情况存储为一个0-1表。
作为上述技术方案的进一步描述:
拆分后的每张表中拥有的属性情况存储为一个0-1表,表头行是原始表中的所有的属性名称,表头列是拆分后的每张表的名称。
作为上述技术方案的进一步描述:
当拆分后的表a
作为上述技术方案的进一步描述:
所述密钥生成与存储具体方法包括以下步骤:
S3.1:数据处理单位D
S3.2:加密密钥K
S3.3:在数据发布前,首先将数据用户D
S3.4:将单位编号U
作为上述技术方案的进一步描述:
基于密钥空间的置换算法将表中的元组进行重排具体方法包括以下步骤:
S4.1:采用SM4分组密码算法,对自增整数列p={p
S4.2:进一步对I进行操作,将分量E
S4.3:将表中的元组按照加密后整数列p
作为上述技术方案的进一步描述:
基于密钥空间的置换算法以及D
S5.1:提取泄漏表[x′]的属性情况,与D
S5.2:通过查询U-Key表得到K-Tree中数据所在的分支结构T
S5.3:利用之前采用的SM4分组密码算法的加密算法,模拟T
S5.4:将每次加密后的表[a
本发明提供了一种基于国密的结构化数据标签水印溯源的方法。具备以下有益效果:
该基于国密的结构化数据标签水印溯源的方法以数据库水印技术为基础的前提下,对原始数据不进行任何改动,也不会添加过多的冗余信息占用存储空间,通过对自增主键的加密操作来完成水印的嵌入,满足数值型和字符型混合的数据溯源需要,在溯源阶段,通过不断加密原始表结构的自增主键,并将该数据与泄漏的数据进行比较,最终确定叛徒并获得数据泄漏路径,且该基于国密的结构化数据标签水印溯源的方法溯源准确率极高,可以降低成本时间,且鲁棒性良好。
附图说明
图1为本发明中算法变量与定义示意图;
图2为本发明中中数据分发、盗取和溯源流程图的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参照图1-2,一种基于国密的结构化数据标签水印溯源的方法,包括以下步骤:
S1:数据处理单位Dp对数据拥有者Do的原始数据表结构进行拆分操作,不同用户的数据会被拆分成不同的表结构,以便于数据泄露以后的高效溯源,输入是一组包含N个元祖的原始数据库表A,输出是一组变更后的表[a0],针对不同的分发单位,可以将其对应的表拆分为不同的结构和个数T,以便溯源时快速定位范围。
S2:对拆分后的各个表添加或替换其主外键,从而形成保留参照关系的新型表结构;
S3:密钥生成与存储;
S4:基于密钥空间的置换算法将表中的元组进行重排,将重排后的数据分发给下属单位;
S5:基于密钥空间的置换算法以及数据处理单位D
输入是一组泄露的表[x′],原始的表[a
如图2所示,首先利用自增的主键变更表之间的主外键关联关系,接着利用基于密钥空间的置换算法产生新的顺序,而这种顺序就是一种水印,一旦数据泄露,就可以从源头通过不断地加密,来验证泄露者,主要包括主外键变更、水印嵌入、追踪溯源三部分,其中,数据拥有者D
所述对原始数据表结构进行拆分操作包括对单表拆分处理和多表拆分处理;
所述单表拆分处理方法为采用竖直拆分的方法,即在不破坏第三范式的前提下,将表A按照其模块和功能分别划分到不同的数据库表[a
所述多表拆分处理方法为利用中单表拆分方法对多表进行拆分处理。
所述对拆分后的各个表添加或替换其主外键具体方法包括以下步骤:
S2.1:保留表
S2.2:将表[a
S2.3:将拆分后的每张表中拥有的属性情况存储为一个0-1表。
拆分后的每张表中拥有的属性情况存储为一个0-1表,表头行是原始表中的所有的属性名称,表头列是拆分后的每张表的名称,当拆分后的表a
所述密钥生成与存储具体方法包括以下步骤:
S3.1:数据处理单位D
S3.2:加密密钥K
S3.3:在数据发布前,首先将数据用户D
S3.4:将单位编号U
基于密钥空间的置换算法将表中的元组进行重排具体方法包括以下步骤:
S4.1:采用SM4分组密码算法,对自增整数列p={p
S4.2:进一步对I进行操作,将分量E
S4.3:将表中的元组按照加密后整数列p
基于密钥空间的置换算法以及D
S5.1:提取泄漏表[x′]的属性情况,与D
S5.2:通过查询U-Key表得到K-Tree中数据所在的分支结构T
S5.3:利用之前采用的SM4分组密码算法的加密算法,模拟T
S5.4:将每次加密后的表[a
该基于国密的结构化数据标签水印溯源的方法以数据库水印技术为基础的前提下,对原始数据不进行任何改动,也不会添加过多的冗余信息占用存储空间,主要通过对自增主键的加密操作来完成水印的嵌入,满足数值型和字符型混合的数据溯源需要,在溯源阶段,通过不断加密原始表结构的自增主键,并将该数据与泄漏的数据进行比较,最终确定叛徒并获得数据泄漏路径,且该基于国密的结构化数据标签水印溯源的方法溯源准确率极高,可以降低成本时间,且鲁棒性良好。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料过着特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
机译: 一种信息建模,表示和集成的信息进程与不同型号的知识表示的无需使用正式语言的方法,这是一种基于结构化数据的有限集合来呈现描述这些对象的半结构化数据的方法
机译: 在2000年11月28日提交的美国临时专利申请No.60 / 253,612中,本发明的实施例(与相关申请的交叉引用)对通信系统中的救济连接过程的重试限制是“那些要求优先权的”。限制,以检查呼叫缓解信道过程的限制)和RetryLimitforDropCallRescueChannelProcedures,以及2001年10月16日提交的美国专利申请第09/978974号“ ForwardLinkdBasedRescueChannelMethod andApparatusforTelecommunicationSystem”,涉及“(一种通信系统的设备转发和基于链路的救援信道方法),出于任何目的,我将其内容通过引用合并于此。
机译: 基于空间局部性和表面特征的基于像素值预测的可逆数据隐藏方法一种可逆水印使用的方法及一种用于可逆数据隐藏的方法