首页> 中国专利> 一种基于区块链技术的数字档案管理方法及系统

一种基于区块链技术的数字档案管理方法及系统

摘要

本发明涉及数字档案管理技术领域,涉及一种基于区块链技术的数字档案管理方法及系统。本发明基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别修改挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,并基于结构化、非结构化档案编码数据以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,更新配置得到的数字档案推送管理服务,数字档案推送管理服务的关联分类精度可以得到提升,并且基于挖掘结构化、非结构化档案编码数据的编码知识点,数字档案推送管理服务可以更新出更为准确的配置参数,从而提高服务运行的可靠性,进一步提升数字档案的关联分类精度。

著录项

  • 公开/公告号CN112214617A

    专利类型发明专利

  • 公开/公告日2021-01-12

    原文格式PDF

  • 申请/专利权人 广东新禾道信息科技有限公司;

    申请/专利号CN202011256018.X

  • 发明设计人 李细主;冯美柱;何强;李婷;

    申请日2020-11-11

  • 分类号G06F16/36(20190101);G06F16/35(20190101);G06F16/2458(20190101);G06F16/27(20190101);G06F40/30(20200101);

  • 代理机构44663 广州博士科创知识产权代理有限公司;

  • 代理人梁志标

  • 地址 510700 广东省广州市黄埔区科学大道237号401

  • 入库时间 2023-06-19 09:33:52

说明书

技术领域

本发明涉及数字档案管理技术领域,具体而言,涉及一种基于区块链技术的数字档案管理方法及系统。

背景技术

相关技术中,通常是仅基于结构化、非结构化档案编码数据对数字档案推送管理服务进行配置,由此进行数字档案推送管理服务信息的生成,这样方式没有考虑到知识图谱编码知识点的关联情况,造成数字档案推送管理服务的关联分类精度的降低。

发明内容

为了至少克服现有技术中的上述不足,本发明的目的在于提供一种基于区块链技术的数字档案管理方法及系统,通过对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别修改挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,由此挖掘结构化、非结构化档案编码数据相较于结构化、非结构化档案编码数据,数据分布发生了变化,基于结构化、非结构化档案编码数据以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,更新配置得到的数字档案推送管理服务,数字档案推送管理服务的关联分类精度可以得到提升,并且基于挖掘结构化、非结构化档案编码数据的编码知识点,数字档案推送管理服务可以更新出更为准确的配置参数,从而提高服务运行的可靠性。

第一方面,本发明提供一种基于区块链技术的数字档案管理方法,应用于数字档案服务器,所述数字档案服务器与多个数字档案终端通信连接,所述方法包括:

获取针对所述数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据,并从所述扩展档案编码数据中获取结构化、非结构化档案编码数据,其中,结构化档案编码数据为结构化形式存在的档案编码数据,非结构化档案编码数据为非结构化形式存在的档案编码数据,结构化、非结构化档案编码数据的编码知识点包括知识点翻阅等级;

对所述结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据;

基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,其中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,分别被视为非结构化档案编码数据内容和结构化档案编码数据内容;

基于所述结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务。

在第一方面的一种可能的实现方式中,所述对所述结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据的步骤,包括:

确定需要挖掘知识图谱编码知识点的结构化档案编码数据和非结构化档案编码数据;

挖掘所述结构化档案编码数据和非结构化档案编码数据中至少一块相同节点的知识图谱编码知识点,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据;

所述基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级的步骤,包括:

基于所述挖掘结构化档案编码数据中被挖掘的知识图谱编码知识点,计算所述挖掘结构化档案编码数据中未被挖掘的结构化档案编码数据内容与所述挖掘结构化档案编码数据的结构化档案编码数据的内容归属关系;

基于所述挖掘结构化档案编码数据的结构化档案编码数据的内容归属关系,调整所述挖掘结构化档案编码数据的知识点翻阅等级;

计算所述挖掘非结构化档案编码数据中被挖掘的知识图谱编码知识点,与所述挖掘非结构化档案编码数据的归属关系,将所述归属关系作为所述挖掘非结构化档案编码数据的结构化档案编码数据的内容归属关系;

基于所述挖掘非结构化档案编码数据的结构化档案编码数据的内容归属关系,调整所述挖掘非结构化档案编码数据的知识点翻阅等级。

在第一方面的一种可能的实现方式中,所述挖掘所述结构化档案编码数据和非结构化档案编码数据中至少一块相同节点的知识图谱编码知识点,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据的步骤,包括:

将所述结构化档案编码数据和非结构化档案编码数据按照相同的划分规则,划分为数量相同的知识图谱单元;

从预设业务范围中,随机选择一档案知识编辑对象作为所述结构化档案编码数据和非结构化档案编码数据的知识图谱单元的挖掘档案知识编辑对象;

对所述结构化、非结构化档案编码数据的知识图谱单元进行编码,得到知识图谱单元编码序列;

打乱所述知识图谱单元编码序列中编码的顺序,得到乱序后的知识图谱单元编码序列;

从所述乱序后的知识图谱单元编码序列中,选择所述知识图谱单元的挖掘档案知识编辑对象的编码作为挖掘编码;

挖掘所述结构化、非结构化档案编码数据中所述挖掘编码所指示的知识图谱单元,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据。

在第一方面的一种可能的实现方式中,所述数字档案推送管理服务包括档案实体特征识别单元和档案实体内容预测单元;

所述基于所述结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务的步骤,包括:

将所述结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,作为待更新配置的数字档案推送管理服务的更新配置档案编码数据;

通过所述档案实体特征识别单元提取更新配置档案编码数据的知识图谱特征信息;

通过所述档案实体内容预测单元基于所述知识图谱特征信息,对所述更新配置档案编码数据进行结构化形式存在的档案编码数据和非结构化形式存在的档案编码数据的分类预测;

基于所述更新配置档案编码数据的预测结果以及所述更新配置档案编码数据的编码知识点,计算所述数字档案推送管理服务的推送管理参数;

基于所述推送管理参数,调整所述数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务;

其中,所述更新配置档案编码数据的预测结果包括:更新配置档案编码数据的预测知识点翻阅等级,以及预测非知识点翻阅等级;

所述基于所述更新配置档案编码数据的预测结果以及所述更新配置档案编码数据的编码知识点,计算所述数字档案推送管理服务的推送管理参数的步骤,包括:

基于所述更新配置档案编码数据的编码知识点中的知识点翻阅等级,和所述预测结果中的预测知识点翻阅等级,计算所述更新配置档案编码数据的第一推送管理参数;

基于所述更新配置档案编码数据的知识点翻阅等级,确定所述更新配置档案编码数据实际的非知识点翻阅等级;

基于所述更新配置档案编码数据实际的非知识点翻阅等级,和所述预测结果中的预测非知识点翻阅等级,计算所述更新配置档案编码数据的第二推送管理参数;

基于所述更新配置档案编码数据的第一推送管理参数和第二推送管理参数,得到所述数字档案推送管理服务的总的推送管理参数。

在第一方面的一种可能的实现方式中,所述数字档案推送管理服务还包括与所述档案实体特征识别单元连接的档案实体抽取单元;

所述方法还包括:

获取所述结构化、非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息;

获取所述挖掘结构化档案编码数据和挖掘非结构化档案编码数据,在所述预设知识图谱特征维度的实际特征信息;

所述基于所述推送管理参数,调整所述数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务前,还包括:

通过所述档案实体抽取单元,对所述更新配置档案编码数据的知识图谱特征信息进行档案实体抽取,得到所述更新配置档案编码数据的在所述预设知识图谱特征维度的档案实体抽取特征信息;

基于所述更新配置档案编码数据,在所述预设知识图谱特征维度的实际特征信息以及档案实体抽取特征信息,得到所述数字档案推送管理服务在所述预设知识图谱特征维度的维度区分信息;

所述基于所述推送管理参数,调整所述数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务的步骤,包括:

基于所述推送管理参数和所述维度区分信息,调整所述数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务。

在第一方面的一种可能的实现方式中,所述预设知识图谱特征维度的实际特征信息包括:溯源信息维度的实际档案语义关系信息,所述档案实体抽取单元包括档案索引档案实体抽取单元;

所述通过所述档案实体抽取单元,对所述更新配置档案编码数据的知识图谱特征信息进行档案实体抽取,得到所述更新配置档案编码数据的在所述预设知识图谱特征维度的档案实体抽取特征信息,包括:

通过所述档案索引档案实体抽取单元,对所述更新配置档案编码数据的知识图谱特征信息进行档案索引档案实体抽取,得到所述更新配置档案编码数据的预测档案语义关系信息;

所述基于所述更新配置档案编码数据,在所述预设知识图谱特征维度的实际特征信息以及档案实体抽取特征信息,得到所述数字档案推送管理服务在所述预设知识图谱特征维度的维度区分信息的步骤,包括:

基于相同更新配置档案编码数据的实际档案语义关系信息和预测档案语义关系信息,计算档案语义关系区分信息;

基于所述档案语义关系区分信息,确定所述数字档案推送管理服务在所述溯源信息维度上的维度区分信息。

在第一方面的一种可能的实现方式中,所述获取所述结构化、非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息的步骤,包括:

对所述结构化档案编码数据中的知识图谱分布进行档案语义关系解析,得到所述结构化档案编码数据的实际档案语义关系信息;

对所述非结构化档案编码数据,设置不具有档案索引信息的档案语义关系作为所述非结构化档案编码数据的实际档案语义关系信息;

所述获取所述挖掘结构化档案编码数据和挖掘非结构化档案编码数据,在所述预设知识图谱特征维度的实际特征信息的步骤,包括:

将挖掘结构化档案编码数据对应的结构化档案编码数据的实际档案语义关系信息,确定为所述挖掘结构化档案编码数据的第一初始档案语义关系信息;

基于所述挖掘结构化档案编码数据中非结构化档案编码数据内容的位置,将所述第一初始档案语义关系信息中位于相同节点的档案索引信息替换为所述非结构化档案编码数据内容的档案索引信息,得到所述挖掘结构化档案编码数据的实际档案语义关系信息;

将挖掘非结构化档案编码数据对应的非结构化档案编码数据的实际档案语义关系信息,确定为所述挖掘非结构化档案编码数据的第二初始档案语义关系信息;

基于所述挖掘非结构化档案编码数据中结构化档案编码数据内容的位置,将所述第二初始档案语义关系信息中位于相同节点的档案索引信息替换为所述结构化档案编码数据内容的档案索引信息,得到所述挖掘非结构化档案编码数据的实际档案语义关系信息。

在第一方面的一种可能的实现方式中,所述从所述扩展档案编码数据中获取结构化、非结构化档案编码数据的步骤,包括:

在从所述扩展档案编码数据中获取原始兴趣档案编码数据后,对所述原始兴趣档案编码数据进行知识图谱解析,确定所述原始兴趣档案编码数据中的知识图谱分布;

在所述原始兴趣档案编码数据中,以所述知识图谱分布为参照对所述知识图谱分布进行扩展,得到扩展后知识图谱分布;

从所述原始兴趣档案编码数据中截取所述扩展后知识图谱分布的档案编码数据,作为非结构化档案编码数据;

获取结构化档案编码数据,所述结构化档案编码数据中包括结构化形式存在的档案编码数据。

在第一方面的一种可能的实现方式中,所述获取针对所述数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据的步骤,包括:

获取针对所述数字档案终端的档案管理对象的档案更新信息,所述档案更新信息为基于所述档案管理对象的每个目标订阅档案实体编码知识点的档案实体有效参数项目进行相应的云计算数据统计后的知识图谱数据信息;

对所述档案更新信息进行档案实体特征挖掘,得到所述档案更新信息对应的基础档案实体特征,并对所述档案更新信息对应的云端档案元数据架构的档案更新信息进行档案实体特征挖掘,得到对应的全局档案实体特征,其中,所述云端档案元数据架构为与所述档案管理对象相似的其它档案管理对象的档案元数据架构中反馈有效性大于预设有效性的档案元数据架构;

计算所述基础档案实体特征和所述全局档案实体特征之间的损失档案实体特征;

基于预设AI网络对所述损失档案实体特征进行挖掘,得到所述档案更新信息对应的扩展档案编码数据,并基于所述扩展档案编码数据生成对应的扩展数字档案推送管理服务信息。

第二方面,本发明实施例还提供一种基于区块链技术的数字档案管理装置,应用于数字档案服务器,所述数字档案服务器与多个数字档案终端通信连接,所述装置包括:

获取模块,用于获取针对所述数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据,并从所述扩展档案编码数据中获取结构化、非结构化档案编码数据,其中,结构化档案编码数据为结构化形式存在的档案编码数据,非结构化档案编码数据为非结构化形式存在的档案编码数据,结构化、非结构化档案编码数据的编码知识点包括知识点翻阅等级;

挖掘模块,用于对所述结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据;

调整模块,用于基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,其中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,分别被视为非结构化档案编码数据内容和结构化档案编码数据内容;

更新配置模块,用于基于所述结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务。

第三方面,本发明实施例还提供一种基于区块链技术的数字档案管理系统,所述基于区块链技术的数字档案管理系统包括数字档案服务器以及与所述数字档案服务器通信连接的多个数字档案终端;

所述数字档案服务器,用于:

获取针对所述数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据,并从所述扩展档案编码数据中获取结构化、非结构化档案编码数据,其中,结构化档案编码数据为结构化形式存在的档案编码数据,非结构化档案编码数据为非结构化形式存在的档案编码数据,结构化、非结构化档案编码数据的编码知识点包括知识点翻阅等级;

对所述结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到所述结构化档案编码数据对应的挖掘结构化档案编码数据,以及所述非结构化档案编码数据对应的挖掘非结构化档案编码数据;

基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,其中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,分别被视为非结构化档案编码数据内容和结构化档案编码数据内容;

基于所述结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务。

第四方面,本发明实施例还提供一种数字档案服务器,所述数字档案服务器包括处理器、机器可读存储介质和网络接口,所述机器可读存储介质、所述网络接口以及所述处理器之间通过总线系统相连,所述网络接口用于与至少一个数字档案终端通信连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以执行第一方面或者第一方面中任意一个可能的实现方式中的基于区块链技术的数字档案管理方法。

第五方面,本发明实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其被执行时,使得计算机执行上述第一方面或者第一方面中任意一个可能的实现方式中的基于区块链技术的数字档案管理方法。

基于上述任意一个方面,本发明通过对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,可得到挖掘结构化档案编码数据和挖掘非结构化档案编码数据,并基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别修改挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,其中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,分别被视为非结构化档案编码数据内容和结构化档案编码数据内容;由此,挖掘结构化、非结构化档案编码数据相较于结构化、非结构化档案编码数据,数据分布发生了变化,基于结构化、非结构化档案编码数据,以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,更新配置得到的数字档案推送管理服务,数字档案推送管理服务的关联分类精度可以得到提升,并且基于挖掘结构化、非结构化档案编码数据的编码知识点,数字档案推送管理服务可以更新出更为准确的配置参数,从而提高服务运行的可靠性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要调用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。

图1为本发明实施例提供的基于区块链技术的数字档案管理系统的应用场景示意图;

图2为本发明实施例提供的基于区块链技术的数字档案管理方法的流程示意图;

图3为本发明实施例提供的基于区块链技术的数字档案管理装置的功能模块示意图;

图4为本发明实施例提供的用于实现上述的基于区块链技术的数字档案管理方法的数字档案服务器的结构组件示意框图。

具体实施方式

下面结合说明书附图对本发明进行具体说明,方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。

图1是本发明一种实施例提供的基于区块链技术的数字档案管理系统10的交互示意图。基于区块链技术的数字档案管理系统10可以包括数字档案服务器100以及与数字档案服务器100通信连接的数字档案终端200。图1所示的基于区块链技术的数字档案管理系统10仅为一种可行的示例,在其它可行的实施例中,该基于区块链技术的数字档案管理系统10也可以仅包括图1所示组成部分的其中一部分或者还可以包括其它的组成部分。

本实施例中,基于区块链技术的数字档案管理系统10中的数字档案服务器100和数字档案终端200可以通过配合执行以下方法实施例所描述的基于区块链技术的数字档案管理方法,具体数字档案服务器100和数字档案终端200的执行步骤部分可以参照以下方法实施例的详细描述。

为了解决前述背景技术中的技术问题,图2为本发明实施例提供的基于区块链技术的数字档案管理方法的流程示意图,本实施例提供的基于区块链技术的数字档案管理方法可以由图1中所示的数字档案服务器100执行,下面对该基于区块链技术的数字档案管理方法进行详细介绍。

步骤S110,获取针对数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据,并从扩展档案编码数据中获取结构化、非结构化档案编码数据。

本实施例中,扩展档案编码数据可以是指对于档案实体需求中可以扩展的档案编码数据。

本实施例中,结构化档案编码数据可以理解为结构化形式存在的档案编码数据,非结构化档案编码数据可以理解为非结构化形式存在的档案编码数据,结构化、非结构化档案编码数据的编码知识点包括知识点翻阅等级,其中知识点翻阅等级可以理解为基于知识图谱的大数据行为生成的知识点翻阅的可信度区间。

步骤S120,对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到结构化档案编码数据对应的挖掘结构化档案编码数据,以及非结构化档案编码数据对应的挖掘非结构化档案编码数据。

本实施例中,知识图谱编码知识点可以用于表示数字档案推送管理服务中某个知识需求的属性所包括的分类编码知识点。

步骤S130,基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级。

本实施例中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,可以分别被视为非结构化档案编码数据内容和结构化档案编码数据内容。

步骤S140,基于结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务。

基于上述步骤,本实施例通过对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别修改挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,由此挖掘结构化、非结构化档案编码数据相较于结构化、非结构化档案编码数据,数据分布发生了变化,基于结构化、非结构化档案编码数据以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,更新配置得到的数字档案推送管理服务,数字档案推送管理服务的关联分类精度可以得到提升,并且基于挖掘结构化、非结构化档案编码数据的编码知识点,数字档案推送管理服务可以更新出更为准确的配置参数,从而提高服务运行的可靠性。

在一种可能的实现方式中,对于步骤S120而言,在对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到结构化档案编码数据对应的挖掘结构化档案编码数据,以及非结构化档案编码数据对应的挖掘非结构化档案编码数据的过程中,可以通过以下示例性的子步骤来实现,详细描述如下。

子步骤S121,确定需要挖掘知识图谱编码知识点的结构化档案编码数据和非结构化档案编码数据。

子步骤S122,挖掘结构化档案编码数据和非结构化档案编码数据中至少一块相同节点的知识图谱编码知识点,得到结构化档案编码数据对应的挖掘结构化档案编码数据,以及非结构化档案编码数据对应的挖掘非结构化档案编码数据。

在一种可能的实现方式中,对于步骤S130而言,在基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级的过程中,可以通过以下示例性的子步骤来实现,详细描述如下。

子步骤S131,基于挖掘结构化档案编码数据中被挖掘的知识图谱编码知识点,计算挖掘结构化档案编码数据中未被挖掘的结构化档案编码数据内容与挖掘结构化档案编码数据的结构化档案编码数据的内容归属关系。

子步骤S132,基于挖掘结构化档案编码数据的结构化档案编码数据的内容归属关系,调整挖掘结构化档案编码数据的知识点翻阅等级。

子步骤S133,计算挖掘非结构化档案编码数据中被挖掘的知识图谱编码知识点,与挖掘非结构化档案编码数据的归属关系,将归属关系作为挖掘非结构化档案编码数据的结构化档案编码数据的内容归属关系。

子步骤S134,基于挖掘非结构化档案编码数据的结构化档案编码数据的内容归属关系,调整挖掘非结构化档案编码数据的知识点翻阅等级。

进一步地,在一种可能的实现方式中,对于子步骤S122而言,可以通过以下示例性的实施方式来实现。

(1)将结构化档案编码数据和非结构化档案编码数据按照相同的划分规则,划分为数量相同的知识图谱单元。

(2)从预设业务范围中,随机选择一档案知识编辑对象作为结构化档案编码数据和非结构化档案编码数据的知识图谱单元的挖掘档案知识编辑对象。

(3)对结构化、非结构化档案编码数据的知识图谱单元进行编码,得到知识图谱单元编码序列。

(4)打乱知识图谱单元编码序列中编码的顺序,得到乱序后的知识图谱单元编码序列。

(5)从乱序后的知识图谱单元编码序列中,选择知识图谱单元的挖掘档案知识编辑对象的编码作为挖掘编码。

(6)挖掘结构化、非结构化档案编码数据中挖掘编码所指示的知识图谱单元,得到结构化档案编码数据对应的挖掘结构化档案编码数据,以及非结构化档案编码数据对应的挖掘非结构化档案编码数据。

在一种可能的实现方式中,对于步骤S140而言,数字档案推送管理服务具体可以包括档案实体特征识别单元和档案实体内容预测单元。

基于此,在基于结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务的过程中,可以通过以下示例性的子步骤来实现。

子步骤S141,将结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,作为待更新配置的数字档案推送管理服务的更新配置档案编码数据。

子步骤S142,通过档案实体特征识别单元提取更新配置档案编码数据的知识图谱特征信息。

子步骤S143,通过档案实体内容预测单元基于知识图谱特征信息,对更新配置档案编码数据进行结构化形式存在的档案编码数据和非结构化形式存在的档案编码数据的分类预测。

子步骤S144,基于更新配置档案编码数据的预测结果以及更新配置档案编码数据的编码知识点,计算数字档案推送管理服务的推送管理参数。

子步骤S145,基于推送管理参数,调整数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务。

其中,更新配置档案编码数据的预测结果可以包括:更新配置档案编码数据的预测知识点翻阅等级,以及预测非知识点翻阅等级。

如此,在子步骤S144中,可以通过以下示例性的实施方式来实现。

(1)基于更新配置档案编码数据的编码知识点中的知识点翻阅等级,和预测结果中的预测知识点翻阅等级,计算更新配置档案编码数据的第一推送管理参数。

(2)基于更新配置档案编码数据的知识点翻阅等级,确定更新配置档案编码数据实际的非知识点翻阅等级。

(3)基于更新配置档案编码数据实际的非知识点翻阅等级,和预测结果中的预测非知识点翻阅等级,计算更新配置档案编码数据的第二推送管理参数。

(4)基于更新配置档案编码数据的第一推送管理参数和第二推送管理参数,得到数字档案推送管理服务的总的推送管理参数。

在一种可能的实现方式中,上述的数字档案推送管理服务还可以包括与档案实体特征识别单元连接的档案实体抽取单元。

基于此,本实施例还可以获取结构化、非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息,并且获取挖掘结构化档案编码数据和挖掘非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息。

这样,在子步骤S145前,还可以通过档案实体抽取单元,对更新配置档案编码数据的知识图谱特征信息进行档案实体抽取,得到更新配置档案编码数据的在预设知识图谱特征维度的档案实体抽取特征信息。

然后,基于更新配置档案编码数据,在预设知识图谱特征维度的实际特征信息以及档案实体抽取特征信息,得到数字档案推送管理服务在预设知识图谱特征维度的维度区分信息。

这样,在子步骤S145中,可以基于推送管理参数和维度区分信息,调整数字档案推送管理服务的参数,得到更新配置完成的数字档案推送管理服务。

在一种可能的实现方式中,上述的预设知识图谱特征维度的实际特征信息可以包括溯源信息维度的实际档案语义关系信息,上述的档案实体抽取单元可以包括档案索引档案实体抽取单元。

基于此,在通过档案实体抽取单元,对更新配置档案编码数据的知识图谱特征信息进行档案实体抽取,得到更新配置档案编码数据的在预设知识图谱特征维度的档案实体抽取特征信息的过程中,具体可以通过档案索引档案实体抽取单元,对更新配置档案编码数据的知识图谱特征信息进行档案索引档案实体抽取,得到更新配置档案编码数据的预测档案语义关系信息。

在基于更新配置档案编码数据,在预设知识图谱特征维度的实际特征信息以及档案实体抽取特征信息,得到数字档案推送管理服务在预设知识图谱特征维度的维度区分信息的过程中,具体可以基于相同更新配置档案编码数据的实际档案语义关系信息和预测档案语义关系信息,计算档案语义关系区分信息,从而可以基于档案语义关系区分信息,确定数字档案推送管理服务在溯源信息维度上的维度区分信息。

在一种可能的实现方式中,在上述获取结构化、非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息的过程中,可以对结构化档案编码数据中的知识图谱分布进行档案语义关系解析,得到结构化档案编码数据的实际档案语义关系信息,然后对非结构化档案编码数据,设置不具有档案索引信息的档案语义关系作为非结构化档案编码数据的实际档案语义关系信息。

这样,在获取挖掘结构化档案编码数据和挖掘非结构化档案编码数据,在预设知识图谱特征维度的实际特征信息的过程中,可以通过以下示例性的实施方式来实现。

(1)将挖掘结构化档案编码数据对应的结构化档案编码数据的实际档案语义关系信息,确定为挖掘结构化档案编码数据的第一初始档案语义关系信息。

(2)基于挖掘结构化档案编码数据中非结构化档案编码数据内容的位置,将第一初始档案语义关系信息中位于相同节点的档案索引信息替换为非结构化档案编码数据内容的档案索引信息,得到挖掘结构化档案编码数据的实际档案语义关系信息。

(3)将挖掘非结构化档案编码数据对应的非结构化档案编码数据的实际档案语义关系信息,确定为挖掘非结构化档案编码数据的第二初始档案语义关系信息。

(4)基于挖掘非结构化档案编码数据中结构化档案编码数据内容的位置,将第二初始档案语义关系信息中位于相同节点的档案索引信息替换为结构化档案编码数据内容的档案索引信息,得到挖掘非结构化档案编码数据的实际档案语义关系信息。

进一步地,在一种可能的实现方式中,针对步骤S110,在从扩展档案编码数据中获取结构化、非结构化档案编码数据的过程中,可以在从扩展档案编码数据中获取原始兴趣档案编码数据后,对原始兴趣档案编码数据进行知识图谱解析,确定原始兴趣档案编码数据中的知识图谱分布。

基于此,可以在原始兴趣档案编码数据中,以知识图谱分布为参照对知识图谱分布进行扩展,得到扩展后知识图谱分布,从原始兴趣档案编码数据中截取扩展后知识图谱分布的档案编码数据,作为非结构化档案编码数据。

此外,与此同时,获取结构化档案编码数据,结构化档案编码数据中包括结构化形式存在的档案编码数据。

在一种可能的实现方式中,对于步骤S110而言,在获取针对所述数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据的过程中,可以通过以下示例性的子步骤来实现。

子步骤S111,获取针对数字档案终端200的档案管理对象的档案更新信息。

子步骤S112,对档案更新信息进行档案实体特征挖掘,得到档案更新信息对应的基础档案实体特征,并对档案更新信息对应的云端档案元数据架构的档案更新信息进行档案实体特征挖掘,得到对应的全局档案实体特征。

子步骤S113,计算基础档案实体特征和全局档案实体特征之间的损失档案实体特征。

子步骤S114,基于预设AI网络对损失档案实体特征进行挖掘,得到档案更新信息对应的扩展档案编码数据。

本实施例中,档案更新信息为基于档案管理对象的每个目标订阅档案实体编码知识点的档案实体有效参数项目进行相应的云计算数据统计后的知识图谱数据信息。目标订阅档案实体编码知识点的档案实体有效参数项目可以理解为针对具有统计意义的目标订阅档案实体编码知识点的虚拟编码知识点对象。每个虚拟编码知识点对象可以包括至少一个档案实体虚拟编码知识点所表示的虚拟编码知识点数据。

本实施例中,预设AI网络可以采用常规的深度学习网络通过预先配置的更新配置样本和更新配置样本对应的挖掘标注编码知识点进行更新配置获得,更新配置样本可以是指通过大量人工比对获得的档案实体特征,具体更新配置过程中不是本发明实施例的重点,参照现有技术中的常规更新配置方式即可,在此不作赘述。

本实施例中,扩展档案编码数据可以是指对于档案实体需求中可能遗漏的档案编码数据。

本实施例中,云端档案元数据架构为与档案管理对象相似的其它档案管理对象的档案元数据架构中运行稳定性大于预设运行稳定性的档案元数据架构,档案管理对象相似的其它档案管理对象可以是指用户特征相似的档案管理对象。

本实施例中,在基于扩展档案编码数据生成对应的扩展数字档案推送管理服务信息的过程中,示例性地,可以从扩展档案编码数据中获得每个扩展知识图谱分布对应的扩展编码知识点分类,然后获取扩展编码知识点分类所对应的扩展数字档案推送管理服务信息后,生成对应的扩展数字档案推送管理服务信息。

基于上述步骤,本实施例通过先确定更具有推送参考价值的损失档案实体特征,由此利用损失档案实体特征进行扩展档案编码数据挖掘,能够对后续的扩展数字档案推送管理服务信息的调用过程进行特征丰富,避免有效信息量的损失。

图3为本公开实施例提供的基于区块链技术的数字档案管理装置300的功能模块示意图,本实施例可以根据上述数字档案服务器100执行的方法实施例对该基于区块链技术的数字档案管理装置300进行功能模块的划分,也即该基于区块链技术的数字档案管理装置300所对应的以下各个功能模块可以用于执行上述数字档案服务器100执行的各个方法实施例。其中,该基于区块链技术的数字档案管理装置300可以包括获取模块310、挖掘模块320、调整模块330以及更新配置模块340,下面分别对该基于区块链技术的数字档案管理装置300的各个功能模块的功能进行详细阐述。

获取模块310,用于获取针对数字档案终端的档案管理对象的档案更新信息对应的扩展档案编码数据,并从扩展档案编码数据中获取结构化、非结构化档案编码数据,其中,结构化档案编码数据为结构化形式存在的档案编码数据,非结构化档案编码数据为非结构化形式存在的档案编码数据,结构化、非结构化档案编码数据的编码知识点包括知识点翻阅等级。其中,获取模块310可以用于执行上述的步骤S110,关于获取模块310的详细实现方式可以参照上述针对步骤S110的详细描述即可。

挖掘模块320,用于对结构化档案编码数据和非结构化档案编码数据分别进行至少一块知识图谱编码知识点的挖掘,得到结构化档案编码数据对应的挖掘结构化档案编码数据,以及非结构化档案编码数据对应的挖掘非结构化档案编码数据。其中,挖掘模块320可以用于执行上述的步骤S120,关于挖掘模块320的详细实现方式可以参照上述针对步骤S120的详细描述即可。

调整模块330,用于基于挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点与整体知识图谱编码知识点的归属关系,分别调整预先关联的区块链中存储的挖掘结构化、非结构化档案编码数据的编码知识点中的知识点翻阅等级,其中,挖掘结构化、非结构化档案编码数据中被挖掘的知识图谱编码知识点,分别被视为非结构化档案编码数据内容和结构化档案编码数据内容。其中,调整模块330可以用于执行上述的步骤S130,关于调整模块330的详细实现方式可以参照上述针对步骤S130的详细描述即可。

更新配置模块340,用于基于结构化、非结构化档案编码数据、以及挖掘结构化档案编码数据和挖掘非结构化档案编码数据,对数字档案推送管理服务进行更新配置,得到更新配置完成的数字档案推送管理服务。其中,更新配置模块340可以用于执行上述的步骤S140,关于更新配置模块340的详细实现方式可以参照上述针对步骤S140的详细描述即可。

需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现。也可以全部以硬件的形式实现。还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,获取模块310可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上获取模块310的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所描述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(application specific integrated circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(centralprocessing unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。

图4示出了本公开实施例提供的用于实现上述的基于区块链技术的数字档案管理方法的数字档案服务器100的硬件结构示意图,如图4所示,数字档案服务器100可包括处理器110、机器可读存储介质120、总线130以及收发器140。

在具体实现过程中,至少一个处理器110执行机器可读存储介质120存储的计算机执行指令(例如图3中所示的基于区块链技术的数字档案管理装置300包括的获取模块310、挖掘模块320、调整模块330以及更新配置模块340),使得处理器110可以执行如上方法实施例的基于区块链技术的数字档案管理方法,其中,处理器110、机器可读存储介质120以及收发器140通过总线130连接,处理器110可以用于控制收发器140的收发动作,从而可以与前述的数字档案终端200进行数据收发。

处理器110的具体实现过程可参见上述数字档案服务器100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

在上述的图4所示的实施例中,应理解,处理器可以是中央处理器(英文:CentralProcessing Unit,CPU),还可以是其它通用处理器、数字信号处理器(英文:DigitalSignal Processor,DSP)、专用集成电路(英文:Application SpecificIntegratedCircuit,ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

机器可读存储介质120可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。

总线130可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线130可以分为地址总线、数据总线、控制总线等。为便于表示,本发明附图中的总线并不限定仅有一根总线或一种类型的总线。

此外,本发明实施例还提供一种可读存储介质,所述可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上基于区块链技术的数字档案管理方法。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时,本说明书使用了特定词语来描述本说明书的实施例。如“一种可能的实现方式”、“一种可能的示例”、和/或“示例性地”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同词语两次或多次提及的“一种可能的实现方式”、“一种可能的示例”、和/或“示例性地”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对它们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其它编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或用户终端上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。

此外,除非权利要求中明确说明,本说明书所述处理元素和列表的顺序、数字字母的使用、或其它名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过互动业务实现,但是也可以只通过软件的解决方案得以实现,如在现有的用户终端或移动设备上安装所描述的系统。

同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。

最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其它的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号