公开/公告号CN114969810A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 厦门印了么信息科技股份有限公司;
申请/专利号CN202210508148.0
发明设计人 黄喜星;
申请日2022-05-11
分类号G06F21/62(2013.01);G06F21/60(2013.01);
代理机构厦门仕诚联合知识产权代理事务所(普通合伙) 35227;
代理人蔡稷元
地址 361000 福建省厦门市软件园三期溪西山尾路39号601-1单元
入库时间 2023-06-19 16:36:32
法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):G06F21/62 专利申请号:2022105081480 申请日:20220511
实质审查的生效
技术领域
本发明涉及文档加密技术领域,特别是一种PDF格式文档加密方法及应用该方法的装置及计算机可读存储介质。
背景技术
PDF(Portable Document Format,意为“可携带文档格式”),是由Adobe Systems用于与应用程序、操作系统、硬件无关的方式进行文件交换所发展出的文件格式。PDF文件以PostScript语言图象模型为基础,无论在哪种打印机上都可保证精确的颜色和准确的打印效果,即PDF会忠实地再现原稿的每一个字符、颜色以及图象。
基于PDF的上述特征,使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。因此,PDF格式文件在多个领域的应用都在增加越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件在开始使用PDF格式文件。
但是,由于电子文档有易于复制、存取和传输等特点,若文档内涉及保密内容,则当电子文档泄露时,将造成严重的损失。现有的PDF文档管理都只是提供文档的归档管理,对一些敏感文件无法有效的管控,存在文档安全性较低的问题。
发明内容
本发明的主要目的在于提供了一种PDF格式文档加密方法、装置及存储介质,旨在解决现有技术中PDF文档安全性较低的技术问题。
为实现上述目的,本发明提供了一种PDF格式文档加密方法,其包括以下步骤:获取初始文档与分割参数,初始文档为PDF格式文档;基于分割参数对初始文档进行数据分割处理,将初始文档内的数据分割为N个数据块,得到数据块B
可选的,分割参数包括分割数量参数和分割大小参数,获取分割参数为获取预设分割参数和/或获取随机生成的分割参数。
可选的,二次分割处理具体为:对重排序文档进行数据抽取;第一加密文档包括数据抽取得到的数据内容,第二加密文档包括数据抽取后剩余的数据内容。
可选的,数据抽取具体为,根据数据抽取对象、数据抽取范围和数据抽取长度进行数据抽取;所述抽取对象为全部数据块或部分数据块,所述数据抽取范围为抽取对象的头部或尾部数据,所述数据抽取长度小于所述抽取对象的数据总长度。
可选的,还包括根据预设加密方式对文档进行预加密,预加密具体包括如下步骤:获取文档内的数据长度L,将文档随机分为多段n*n的源矩阵,n为矩阵长度,且
可选的,将第一加密文档发送至服务器,同时将加密信息一同发送至服务器;将第二加密文档输出至指定路径前,对第二加密文档增加加密文档标识。
可选的,加密信息至少包括加密文档的文档名、加密文档的校验码、加密文档的创建者id、加密文档的加密方式、加密文档的加密密钥、加密文档内每个数据块的大小以及每个数据块的序号其中一种。
可选的,将第二加密文档输出至指定路径时,对第二加密文档进行操作权限设置和操作记录设置:操作权限设置为,对查看及配置加密文档的人员权限和/或查看及配置加密文档的时间权限和/或打印设备的打印权限进行设置;操作记录设置为,设置用户操作记录自动保存;用户操作记录至少包括:文档操作者id、打开时间、关闭时间、文档操作者成功打开文档、文档操作者打开文档失败、打印文档时间、打印设备名称、打印份数。
与所述PDF格式文档加密方法相对应的,本发明提供一种PDF格式文档加密装置,其包括:文档获取模块,用于获取初始文档与分割参数,初始文档为PDF格式文档;数据分割处理模块,用于基于分割参数对初始文档进行数据分割处理,将初始文档内的数据分割为N个数据块,得到数据块B
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有PDF格式文档加密程序,所述PDF格式文档加密程序被处理器执行时实现如上文所述的PDF格式文档加密方法的步骤。
本发明的有益效果是:
(1)本发明的PDF格式文档加密方法,通过数据分割处理、重排序、二次分割相结合,对PDF格式文档进行加密,提高了PDF格式文档的安全性;
(2)通过获取分割参数,并根据分割参数进行数据分割处理,通过获取随机生成的分割参数,进一步提高了加密文档的安全性,能够避免加密规则被轻易破解,造成加密文档内容的泄露;
(3)通过二次分割处理,对重排序文档进行数据抽取;将第一加密文档与第二加密文档分别存储,避免加密文档泄露后全部数据丢失带来的重大损失。
(4)通过预设加密方式对文档进行预加密,使得市面上的文档阅读器无法解析加密文档,只能通过预设加密方式绑定的阅读器进行解析、查阅文档,有效防止加密文档内容泄露;
(5)通过保存加密信息,在解密时能够对加密信息进行一一核对,核对一致后才能成功打开加密文档,对加密文档起到双重保护作用;
(6)通过对第二加密文档进行操作权限设置和操作记录设置,在解密时进行操作权限,对加密文档起到多重保护作用;进一步通过用户操作记录自动保存,加密文档的创建者能够获知文档操作者相关信息或文档操作相关信息,及时对盗取文档内容行为进行防范。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明PDF格式文档加密方法的流程简图;
图2为本发明PDF格式文档加密方法流程示意图;
图3为本发明PDF格式文档加密方法中数据抽取示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明的一种PDF格式文档加密方法,其包括以下步骤:获取初始文档与分割参数,初始文档为PDF格式文档;基于分割参数对初始文档进行数据分割处理,将初始文档内的数据分割为N个数据块,得到数据块B
请参考图2,本发明的PDF格式文档加密方法,通过数据分割处理、重排序、二次分割相结合,对PDF格式文档进行加密,提高了PDF格式文档的安全性。
在本实施例中,分割参数包括分割数量参数和分割大小参数,获取分割参数为获取预设分割参数和/或获取随机生成的分割参数。
具体而言,由于分割参数分为分割数量参数和分割大小参数,因此获取分割参数的方式分为获取预设分割数量参数、预设分割大小参数;或者,获取预设分割数量参数和获取随机分割大小参数;或者,获取随机分割数量参数和获取预设分割大小参数;或者,获取随机分割数量参数、随机分割大小参数。
在本实施例中,分割数量参数用于限定分割数据块的数量,分割大小参数用于限定分割后每个数据块的数据大小。
本发明通过获取随机生成的分割参数,进一步提高了加密文档的安全性,能够避免加密规则被轻易破解,造成加密文档内容的泄露。
在本实施例中,二次分割处理具体为对重排序文档进行数据抽取;第一加密文档包括数据抽取得到的数据内容,第二加密文档包括数据抽取后剩余的数据内容。数据抽取具体为,根据数据抽取对象、数据抽取范围和数据抽取长度进行数据抽取;抽取对象为全部数据块或部分数据块,数据抽取范围为抽取对象的头部或尾部数据,数据抽取长度小于抽取对象的数据总长度。
请参考图3,优选的,数据抽取对象为部分数据块,数据抽取范围为每个数据块的尾部数据,数据抽取长度为300字节。需要说明的是,为了方便示意,此处对抽取对象的抽取长度为统一长度,但是数据抽取也可以针对每个数据段的总数据长度进行随机抽取。
本发明通过二次分割处理,对重排序文档进行数据抽取;将第一加密文档与第二加密文档分别存储,避免加密文档泄露后全部数据丢失带来的重大损失。
优选的,在获取初始文档的同时,对其进行预处理,预处理至少包括对初始文档的文件头和文件尾进行删除。文件头和文件尾是固定格式的字符串,用于标识该文档为PDF,通过删除文件头和文件尾,减少不必要的数据,减轻了后续加密工作量。
在本实施例中,还包括根据预设加密方式对文档进行预加密,预加密具体包括如下步骤:获取文档内的数据长度L,将文档随机分为多段n*n的源矩阵,n为矩阵长度,且
在本实施例中,根据行偏移d将源矩阵变换为加密矩阵具体为,若i+d+j<n,A
在本实施例中,文档至少为初始文档、重排序文档、第一加密文档、第二加密文档其中一种。即预加密在基于分割参数对初始文档进行数据分割处理前进行,或者在生成重排序文档后进行,或者在二次分割处理后进行。
本发明通过预设加密方式对文档进行预加密,使得市面上的文档阅读器无法解析加密文档,只能通过该加密方式绑定的阅读器进行解析、查阅文档,有效防止加密文档内容泄露,使得加密文档的安全性提高。
优选的,将第二加密文档输出至指定路径前,对第二加密文档增加加密文档标识。具体而言,第二加密文档为.zpdf格式文档,加密文档标识为.zpdf格式文档标识。由于.zpdf格式需要通过其绑定的阅读器打开,能够进一步提高加密文档的安全性。
在本实施例中,将第一加密文档发送至服务器,同时将加密信息一同发送至服务器;加密信息至少包括加密文档的文档名、加密文档的校验码、加密文档的创建者id(Identity document)、加密文档的加密方式、加密文档的加密密钥、加密文档内每个数据块的大小以及每个数据块的序号其中一种。
优选的,校验码为MD5信息摘要算法(英文全称:Message-Digest Algorithm),其被广泛使用的密码散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致。
在本实施例中,MD5用于服务器识别文档,匹配对应的第一加密文档。用户打开本地的第二文档时,自动计算此文档的MD5,并发送到服务器,服务器通过对加密信息进行核对,判断用户是否可以解密此文档并获取对应的第一加密文档。
本发明通过保存加密信息,在解密时能够对加密信息进行一一核对,核对一致后才能成功打开加密文档,对加密文档起到双重保护作用。
进一步而言,将第二加密文档输出至指定路径时,对第二加密文档进行操作权限设置和操作记录设置:操作权限设置为,对查看及配置加密文档的人员权限和/或查看及配置加密文档的时间权限和/或打印设备的打印权限进行设置。
具体而言,对于人员权限进行设置是通过用户身份id授权实现,并记录该用户id,获得授权的用户能够对加密文档进行查看及配置;对于时间权限进行设置是通过预设时间范围,例如预设时间范围为:8:00-17:00(24h小时制),则只能在该时间范围内对加密文档进行查看及配置;对于打印设备的打印权限进行设置是通过对指定打印设备的MAC地址进行授权,仅授权打印设备可对加密文档进行打印。
操作记录设置为,设置用户操作记录自动保存;用户操作记录至少包括:文档操作者id、打开时间、关闭时间、文档操作者成功打开文档、文档操作者打开文档失败、打印文档时间、打印设备名称、打印份数。
本发明通过对第二加密文档进行操作权限设置和操作记录设置,在解密时进行操作权限,对加密文档起到多重保护作用;进一步通过用户操作记录自动保存,加密文档的创建者能够获知文档操作者相关信息或文档操作相关信息,及时对盗取文档内容行为进行防范。
具体而言,采用绑定的阅读器进行文档解析时,具体操作步骤如下:
用户登录,并获取第二加密文档。需要说明的是,用户可通过验证码或扫码登陆,并且此处的获取第二加密文档仅仅是对资源的获取,并不代表用户可以直接打开文档、查阅文档。
用户发送用户id,并进行操作权限校验。需要说明的是,权限设置校验可为多层验证,例如先进行人员权限验证,确认该用户是否为允许查看及配置加密文档的人员,若通过验证,进一步对时间权限进行验证,确认是否在允许查看及配置加密文档的预设时间范围内,若不在该预设时间范围内,即便是通过人员权限验证的用户,也无法查看及配置加密文档。当然,多层验证的前提是,将第二加密文档输出至指定路径时,对第二加密文档进行至少两种操作权限设置。
若用户通过操作权限校验,则向服务器获取第一加密文档及加密信息。阅读器自动根据加密信息读取文件并解密,并将第一加密文档的内容添加至第二加密文档内。
类似的,用户对加密文档进行打印操作时,需要进行打印设备的MAC地址校验,若未通过,则不开放打印功能。
本发明还对应提供一种PDF格式文档加密装置,其包括:文档获取模块,用于获取初始文档与分割参数,初始文档为PDF格式文档;数据分割处理模块,用于基于分割参数对初始文档进行数据分割处理,将初始文档内的数据分割为N个数据块,得到数据块B
进一步而言,PDF格式文档加密装置还包括:
预处理模块,用于对初始文档进行预处理,预处理至少包括对初始文档的文件头和文件尾进行删除;
预加密模块,用于根据预设加密方式对文档进行预加密,具体包括如下步骤:获取文档内的数据长度L,将文档随机分为多段n*n的源矩阵,n为矩阵长度,且
服务器设置模块,用于对第二加密文档进行操作权限设置和操作记录设置。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有PDF格式文档加密程序,PDF格式文档加密程序被处理器执行时实现如上文的PDF格式文档加密方法的步骤。
该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现图1所示的PDF格式文档加密方法。所述计算机可读存储介质可以是只读存储器,磁盘或光盘等。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例及存储介质实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
机译: 用于便携式文档格式(PDF)文档的数字签名的授权方法将授权数据存储在PDF文档中以检查签名
机译: 用于从便携式文档格式(PDF)文件中提取数据的系统,方法和计算机可读介质
机译: 用于从便携式文档格式(PDF)文件中提取数据的系统,方法和计算机可读介质