首页> 中国专利> 电力数据伦理知识图谱构建方法和系统

电力数据伦理知识图谱构建方法和系统

摘要

本申请适用于知识图谱技术领域,提供了一种电力数据伦理知识图谱构建方法和系统,该方法包括:获取多模态的电力数据,电力数据包括非结构化数据,非结构化数据包括第一文本数据,第一文本数据包括数据伦理的政策文件和法律法规;基于实体识别模型对非结构化数据进行实体抽取,获得候选实体集,候选实体集包括多个候选实体;对候选实体集中的每个候选实体进行实体对齐,获得实体集,实体集中的每个实体为知识图谱的一个节点。本申请可以规避电力数据的隐私泄露问题和数据安全问题,使电力数据合理、高效、规范的服务于人们生产和生活。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-20

    实质审查的生效 IPC(主分类):G06N 5/02 专利申请号:2022113272051 申请日:20221027

    实质审查的生效

  • 2022-12-30

    公开

    发明专利申请公布

说明书

技术领域

本申请属于知识图谱技术领域,尤其涉及电力数据伦理知识图谱构建方法和系统。

背景技术

电力数据涉及电力的生产、传输、分配、调度以及使用等全部环节,服务对象包括企业和个人,具有实时性强、准确性高的特点。电力数据的量级已经达到PB级,海量的电力大数据资源产生巨大的社会价值的同时,也带来极大的数据伦理风险。因此,需要在符合法律、法规、数据安全及数据伦理的框架下,发挥电力数据的积极作用。

目前,对大数据使用的数据伦理规范以法律、法规、白皮书等文本形式出现,而这些文件中,并未明确具体地描述对数据伦理约束的方法,在实际操作过程中的执行尺度也不一致。

因此,亟需一种针对电力数据的伦理知识图谱构建方法和系统,规避电力数据的隐私泄露和数据安全问题,使电力数据合理、高效、规范的服务于人们生产和生活。

发明内容

为克服相关技术中存在的问题,本申请实施例提供了电力数据伦理知识图谱构建方法及系统,用于规避电力数据的隐私泄露和数据安全问题,使电力数据合理、高效、规范的服务于人们生产和生活。

本申请是通过如下技术方案实现的:

第一方面,本申请实施例提供了一种电力数据伦理知识图谱构建方法,应用于电力数据中台,包括:获取多模态的电力数据,电力数据包括非结构化数据,非结构化数据包括第一文本数据,第一文本数据包括数据伦理的政策文件和法律法规;基于实体识别模型对非结构化数据进行实体抽取,获得候选实体集,候选实体集包括多个候选实体;对候选实体集中的每个候选实体进行实体对齐,获得实体集,实体集中的每个实体为知识图谱的一个节点。

在第一方面的一种可能的实现方式中,电力数据还包括结构化数据和半结构化数据,非结构化数据还包括音频数据、图片数据和视频数据。获取多模态的电力数据,具体包括:基于电力数据中台获取电力业务系统上的结构化数据,结构化数据包括电力营销系统数据库表、电力生产系统数据库表以及电力物资系统数据库表。采用爬虫技术获取网络上数据伦理的半结构化数据,基于电力数据中台获取电力数据中台的系统日志文件的半结构化数据。通过收集数据伦理的政策文件和法律法规,获得第一文本数据的非结构化数据,通过采集电力客服和电力用户的通话录音,获得音频数据的非结构化数据,通过采集电力用户在电力数据中台上的图片记录,获得图片数据的非结构化数据,通过采集电力用户在电力数据中台上的视频记录,获得视频数据的非结构化数据。

在第一方面的一种可能的实现方式中,方法还包括基于多模态的电力数据,构建电力数据伦理知识的本体库。构建电力数据伦理知识的本体库,包括:基于电力数据类型和预设电力数据伦理分类,构建多个电力数据伦理本体,电力数据伦理本体包括用电个人用户隐私、用电企业用户隐私、用电数据安全以及科研数据,预设电力数据伦理分类包括隐私泄露类和数据安全类;对多个电力数据伦理本体进行语义描述,构建电力数据伦理知识的本体库。

在第一方面的一种可能的实现方式中,在基于实体识别模型对非结构化数据进行实体抽取前,本申请技术方法还包括:采用语音识别技术将音频数据转换为第二文本数据;采用机器视觉技术识别图片数据中的第三文本数据和第一图像实体;采用语音识别技术和机器视觉技术识别视频数据中的敏感目标,获取第四文本数据和第二图像实体;采用结巴分词模型对第一文本数据、第二文本数据、第三文本数据和第四文本数据按照中文语法进行词语划分;构建三元组特征模板,三元组特征模板为实体、关系和实体的形式。

在第一方面的一种可能的实现方式中,对候选实体集中的每个候选实体进行实体对齐,包括:采用word2vec算法分析每个候选实体,获得每个候选实体的语义向量;采用余弦相似度公式或相对熵的方式,计算每个语义向量的相似度;根据预设相似度阈值判定每个语义向量的相似度,将大于等于预设相似度阈值的候选实体进行实体对齐。

第二方面,本申请实施例提供了一种电力数据伦理知识图谱构建系统,应用于电力数据中台,包括:数据获取模块,用于获取多模态的电力数据,电力数据包括非结构化数据,非结构化数据包括第一文本数据,所述第一文本数据包括数据伦理的政策文件和法律法规;实体抽取模块,用于基于实体识别模型对结构化数据进行实体抽取,获得候选实体集,候选实体集包括多个候选实体;实体对齐模块,用于对候选实体集中的每个多个候选实体进行实体对齐,获得实体集,实体集中的每个实体为知识图谱的一个节点。

在第二方面的一种可能的实现方式中,电力数据还包括结构化数据和半结构化数据,非结构化数据还包括音频数据、图片数据和视频数据。数据获取模块获取电力数据,具体包括:基于电力数据中台获取电力业务系统上的结构化数据,结构化数据包括电力营销系统数据库表、电力生产系统数据库表以及电力物资系统数据库表。采用爬虫技术获取网络上数据伦理的半结构化数据,基于电力数据中台获取电力数据中台的系统日志文件的半结构化数据。通过收集数据伦理的政策文件和法律法规,获得第一文本数据的非结构化数据,通过采集电力客服和电力用户的通话录音,获得音频数据的非结构化数据,通过采集电力用户在电力数据中台上的图片记录,获得图片数据的非结构化数据,通过采集电力用户在电力数据中台上的视频记录,获得视频数据的非结构化数据。

在第二方面的一种可能的实现方式中,本申请提供的系统还包括本体库构建模块,该本体库构建模块,用于基于多模态的电力数据,构建电力数据伦理知识的本体库。本体库构建模块构建电力数据理论知识的本体库,包括:基于电力数据类型和预设电力数据伦理分类,构建多个电力数据伦理本体,电力数据伦理本体包括用电个人用户隐私、用电企业用户隐私、用电数据安全以及科研数据,预设电力数据伦理分类包括隐私泄露类和数据安全类。对多个电力数据伦理本体进行语义描述,构建电力数据伦理知识的本体库。

在第二方面的一种可能的实现方式中,在实体抽取模块基于实体识别模型对非结构化数据进行实体抽取前,本申请提供的系统还包括:音频数据处理单元,用于采用语音识别技术将音频数据转换为第二文本数据。图片数据处理单元,用于采用机器视觉技术识别图片数据中的第三文本数据和第一图像实体。视频数据处理单元,用于采用语音识别技术和机器视觉技术识别视频数据中的敏感目标,获取第四文本数据和第二图像实体。文本数据处理单元,用于采用结巴分词模型对第一文本数据、第二文本数据、第三文本数据和第四文本数据按照中文语法进行词语划分。特征模板单元,用于构建三元组特征模板,三元组特征模板为实体、关系和实体的形式。

在第二方面的一种可能的实现方式中,实体对齐模块,用于对候选实体集中的每个候选实体进行实体对齐,包括:采用word2vec算法分析每个候选实体,获得每个候选实体的语义向量;采用余弦相似度公式或相对熵的方式,计算每个语义向量的相似度;根据预设相似度阈值判定每个语义向量的相似度,将大于等于预设相似度阈值的候选实体进行实体对齐。

本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面所述电力数据伦理知识图谱构建方法。

本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被一个或多个处理器执行时实现如第一方面所述电力数据伦理知识图谱构建方法。

综上,本申请提供了一种电力数据伦理知识图谱构建方法及系统,本申请提供的构建方法通过获取电力数据中涉及数据伦理的政策文件和法律法规的非结构化数据,并基于实体识别模型对非结构化数据进行实体抽取,获得候选实体,再对抽取的候选实体进行实体对齐获得实体,该实体为电力数据伦理知识图谱的一个节点,从而将数据伦理政策法规的执行尺度在知识图谱中标准化、统一化,能够规避电力数据的隐私泄露问题和数据安全问题,使电力数据合理、高效、规范的服务于人们生产和生活。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的一种电力数据伦理知识图谱构建方法的流程示意图;

图2是本申请一实施例提供的另一种电力数据伦理知识图谱构建方法的流程示意图;

图3是本申请一实施例提供的构建电力数据伦理知识的本体库的流程示意图;

图4是本申请一实施例提供的电力数据伦理知识图谱构建系统的结构示意图;

图5是本申请实施例提供的终端设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

随着大数据技术的日新月异,大数据的数据量级日渐庞大,海量的大数据也催生了知识图谱技术的产生。知识图谱可以通过数据之间的关联关系,将碎片化的数据有机的组织起来,让数据更容易被人和及其理解和处理,并为大数据的搜索、挖掘、分析等需求提供便利。

与此同时,知识图谱采集的大数据所涉及的伦理问题逐步引起了人们的关注。大数据的伦理问题包括但不限于隐私侵犯、身份盗用、数据泄露、数据鸿沟、数据霸权、数据垄断、数据独裁、算法歧视、数据接入、数据作假、数据过载、知识产权侵犯等。

众所周知,电力是一个国家极其重要的战略能源,目前,电力系统所涉及的电力大数据已覆盖电力生产、传输、分配、调度以及使用等全流程的各个环节,服务对象几乎包括所有的企业和个人。因此,保护服务对象的电力数据隐私和电力数据安全,是亟需解决的问题。

基于上述问题,本申请实施例提供了电力数据伦理知识图谱构建方法。为了使本申请的目的、技术方案及优点更加清楚明确,以下结合附图及实施例,对本申请进行详细说明。应当理解的是,以下所描述的具体实施例仅用于解释本申请,并不用于限定本申请。

本申请提供的电力数据伦理知识图谱构建方法,应用于电力数据中台。于2019年12月,电力数据中台初步建成,数据中台是各类电力数据资源的汇聚中心、数据资产转化中心、数据价值发掘中心,满足横向跨专业、纵向不同层级的数据共享、分析挖掘和融通需求。

以下结合图1对本申请提供的电力数据伦理知识图谱构建方法进行详细说明。

图1是本申请一实施例提供的电力数据伦理知识图谱构建方法的流程示意图,参照图1,该方法可以通过执行步骤101至步骤103执行,详述如下:

在步骤101中,获取多模态的电力数据。

在一些实施例中,获取的电力数据包括非结构化数据。非结构化数据顾名思义,就是没有固定结构的数据。可以包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等都属于非结构化数据。

示例性的,非结构化数据可以包括第一文本数据,第一文本数据包括但不限于数据伦理的政策文件和法律法规等。

示例性的,非结构化数据还可以包括音频数据,音频数据包括但不限于电力客服和电力用户的通话录音。

示例性的,非结构化数据还可以包括图片数据,图片数据包括但不限于电力数据中台上的图片记录,个人用户的图像资料以及电力生产系统的监控图片数据等。

示例性的,非结构化数据还可以包括视频数据,视频数据包括但不限于电力数据中台上的视频记录和电力生产系统的监控视频数据等。

在一些实施例中,电力数据还包括结构化数据和半结构化数据。

结构化的数据简单来说是指可以使用关系型数据库表示和存储的数据。半结构化数据简单来说就是介于完全结构化数据和完全无结构的数据之间的数据,例如:html文档,JSON文档,xml和一些NoSQL数据库等就属于半结构化数据。对于结构化数据来讲通常是先有结构再有数据,而对于半结构化数据来说则是先有数据再有结构。

示例性的,结构化数据包括电力数据中台运行的电力业务系统的结构化数据,电力业务系统可以包括电力营销系统、电力生产系统以及电力物资系统。

进一步的,结构化数据可以是电力营销系统数据库表,其中,电力营销系统数据库表又可以包括电能采集数据库表,客户用电数据库表等。

进一步的,结构化数据可以是电力生产系统数据库表,其中,电力生产系统数据库表又可以包括电网运行数据库表,生产资料数据库表等。

进一步的,结构化数据可以是电力物资系统数据库表,其中,电力物资系统数据库表又可以包括合同数据库表,采购数据库表等。

示例性的,半结构化数据包括网络上的涉及数据伦理的半结构化数据,以及存储与电力数据中台的电力业务系统的系统日志等半结构化数据。

在一些实施例中,获取多模态的电力数据的方法,可以执行如下操作:

示例性的,基于电力数据中台获取电力业务系统上的结构化数据,结构化数据包括电力营销系统数据库表、电力生产系统数据库表以及电力物资系统数据库表。

示例性的,采用爬虫技术获取网络上数据伦理的半结构化数据,基于电力数据中台获取电力数据中台的系统日志文件的半结构化数据。

示例性的,通过收集数据伦理的政策文件和法律法规,获得第一文本数据的非结构化数据,通过采集电力客服和电力用户的通话录音,获得音频数据的非结构化数据,通过采集电力用户在电力数据中台上的图片记录,获得图片数据的非结构化数据,通过采集电力用户在电力数据中台上的视频记录,获得视频数据的非结构化数据。

在步骤102中,基于实体识别模型对非结构化数据进行实体抽取,获得候选实体集。

在一些实施例中,可以基于实体识别模型对非结构化数据进行实体抽取,获得候选实体集。

示例性的,实体识别模型可以为BERT-BiGRU-Attention-CRF模型。其中,BERT-BiGRU-Attention-CRF模型包括:BERT层,BiGRU层,Attention层和CRF层。

BERT层,用于提取非结构化数据中字符级别向量,并保留非结构化数据字符的顺序,BERT层输出的字符级别向量传递给BiGRU层,其中,BERT层包括三种向量分别为TokenEmbedding向量、Segment Embedding向量和Position Embedding向量,将Token Embedding向量、Segment Embedding向量和Position Embedding向量合并,用于保留非结构化数据中字词顺序。

BiGRU层,用于对字符级别向量进行语义的特征抽取,BiGRU层接收BERT层输出的字符级别向量,BiGRU层输出的对字符级别向量进行语义的特征抽取传递给Attention层。

Attention层,用于分配字符级别向量的注意力权重,Attention层接收BiGRU层输出的对字符级别向量进行语义的特征抽取,Attention层输出的标签序列传递给CRF层。其中,注意力权重表征每个字符级别向量对非结构化数据的重要程度。

CRF层,用于选取符合表达逻辑的最佳标注序列,CRF层接收Attention层输出的标签序列。其中,最佳标签序列可以采用Viterbi算法所获得。

通过上述BERT-BiGRU-Attention-CRF模型进行实体提取后的为多个候选实体,将多个候选实体整合为候选实体集。

在一些实施例中,基于实体识别模型对非结构化数据进行实体抽取前,需要对非结构化数据进行预处理。

示例性的,预处理的过程可以如下所述:

采用语音识别技术将音频数据转换为第二文本数据。

采用机器视觉技术识别图片数据中的第三文本数据和第一图像实体。

采用语音识别技术和机器视觉技术识别视频数据中的敏感目标,获取第四文本数据和第二图像实体。

采用结巴分词模型对第一文本数据、第二文本数据、第三文本数据和第四文本数据按照中文语法进行词语划分。

构建三元组特征模板。其中,三元组特征模板为实体、关系和实体的形式。

在步骤103中,对候选实体集中的每个候选实体进行实体对齐,获得实体集。

在一些实施例中,对候选实体集中的每个候选实体进行实体对齐,可以通过以下步骤实现:

在步骤1031中,采用word2vec算法分析每个候选实体,获得每个候选实体的语义向量。

在步骤1032中,采用余弦相似度公式或相对熵的方式,计算每个语义向量的相似度。

其中,余弦相似度公式为:

式中,X为第一语义向量,Y为第二语义向量,||X||为第一语义向量的模值,||Y||为第二语义向量的模值,n为第一语义向量或第二语义向量中元素的总数量,cos(θ)为余弦相似度,θ为第一语义向量与第二语义向量之间的夹角。

在步骤1033中,根据预设相似度阈值判定每个语义向量的相似度,将大于等于预设相似度阈值的候选实体进行实体对齐。

在一些实施例中,实体集中包含多个实体,每个实体皆为知识图谱的一个节点。

参见图2,一些实施例中,基于图1所示的实施例,上述电力数据伦理知识图谱构建方法,在获取多模态的电力数据后还包括:步骤104构建电力数据伦理知识的本体库。

图3示出了本申请一实施例提供的构建电力数据伦理知识的本体库的流程示意图,参照图3,构建电力数据伦理知识的本体库可以执行以下步骤:

在步骤1041中,基于电力数据类型和预设电力数据伦理分类,构建多个电力数据伦理本体。

示例性的,电力数据类型是多样的,例如:用电用户的类型、电力用途的类型、电价的类别以及电力设备的类型等,本申请不再做进一步限定。

示例性的,预设电力数据伦理分类可以分为隐私泄露类和数据安全类。

示例性的,构建的电力数据伦理本体可以是用电个人用户隐私、用电企业用户隐私、用电数据安全以及科研数据等。

在步骤1042中,对多个电力数据伦理本体进行语义描述,构建电力数据伦理知识的本体库。

本申请提供的构建方法通过获取电力数据中涉及数据伦理的政策文件和法律法规的非结构化数据,并基于实体识别模型对非结构化数据进行实体抽取,获得候选实体,再对抽取的候选实体进行实体对齐获得实体,该实体为电力数据伦理知识图谱的一个节点,从而将数据伦理政策法规的执行尺度在知识图谱中标准化、统一化,能够规避电力数据的隐私泄露问题和数据安全问题,使电力数据合理、高效、规范的服务于人们生产和生活。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

本申请还提供了一种电力数据伦理知识图谱构建系统。图4是本发明一实施例提供的电力数据伦理知识图谱构建系统的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。

参照图4,电力数据伦理知识图谱构建系统20可以包括数据获取模块201、实体抽取模块202和实体对齐模块203。

其中,数据获取模块201,用于获取多模态的电力数据,电力数据包括非结构化数据,非结构化数据包括第一文本数据,所述第一文本数据包括数据伦理的政策文件和法律法规;

实体抽取模块202,用于基于实体识别模型对结构化数据进行实体抽取,获得候选实体集,候选实体集包括多个候选实体;

实体对齐模块203,用于对候选实体集中的每个多个候选实体进行实体对齐,获得实体集,实体集中的每个实体为知识图谱的一个节点。

在一些实施例中,数据获取模块用于获取结构化数据和半结构化数据的电力数据,数据获取模块获取的非结构化数据还包括音频数据、图片数据和视频数据。

数据获取模块201用于获取电力数据,具体包括:

基于电力数据中台获取电力业务系统上的结构化数据,结构化数据包括电力营销系统数据库表、电力生产系统数据库表以及电力物资系统数据库表。

采用爬虫技术获取网络上数据伦理的半结构化数据,基于电力数据中台获取电力数据中台的系统日志文件的半结构化数据。

通过收集数据伦理的政策文件和法律法规,获得第一文本数据的非结构化数据,通过采集电力客服和电力用户的通话录音,获得音频数据的非结构化数据,通过采集电力用户在电力数据中台上的图片记录,获得图片数据的非结构化数据,通过采集电力用户在电力数据中台上的视频记录,获得视频数据的非结构化数据。

在一些实施例中,在实体抽取模块202基于实体识别模型对非结构化数据进行实体抽取前,本申请提供的电力数据伦理知识图谱构建系统还包括:

音频数据处理单元,用于采用语音识别技术将音频数据转换为第二文本数据。

图片数据处理单元,用于采用机器视觉技术识别图片数据中的第三文本数据和第一图像实体。

视频数据处理单元,用于采用语音识别技术和机器视觉技术识别视频数据中的敏感目标,获取第四文本数据和第二图像实体。

文本数据处理单元,用于采用结巴分词模型对第一文本数据、第二文本数据、第三文本数据和第四文本数据按照中文语法进行词语划分。

特征模板单元,用于构建三元组特征模板,三元组特征模板为实体、关系和实体的形式。

在一些实施例中,实体对齐模块203,用于对候选实体集中的每个候选实体进行实体对齐,具体包括:

采用word2vec算法分析每个候选实体,获得每个候选实体的语义向量。

采用余弦相似度公式或相对熵的方式,计算每个语义向量的相似度。

根据预设相似度阈值判定每个语义向量的相似度,将大于等于预设相似度阈值的候选实体进行实体对齐。

在一些实施例中,上述电力数据伦理知识图谱构建系统还包括本体库构建模块。本体库构建模块204,用于基于多模态的电力数据,构建电力数据伦理知识的本体库。

示例性的,本体库构建模块204构建电力数据理论知识的本体库,具体包括:

基于电力数据类型和预设电力数据伦理分类,构建多个电力数据伦理本体,电力数据伦理本体包括用电个人用户隐私、用电企业用户隐私、用电数据安全以及科研数据,预设电力数据伦理分类包括隐私泄露类和数据安全类。

对多个电力数据伦理本体进行语义描述,构建电力数据伦理知识的本体库。

在一种现实的场景中,可以应用本申请提供的电力数据伦理知识图谱构建方法和系统,构建电力数据伦理审核平台。该平台的审核流程可以如下所述:

当用户试图通过已建立的电力数据伦理知识图谱进行电力数据的查询时,平台可根据检索到的内容进行伦理风险的提示,并评定风险等级,将风险提示和风险等级传输至平台的审核员(审核员可以是具体的人,也可以是计算机程序或终端)进行审核,待审核员判定用户权限和对应风险等级匹配与否后,将与用户权限匹配的电力数据,进行数据脱敏处理后输出。

上述电力数据伦理审核平台,执行审核的流程具体如下:

将电力数据伦理知识图谱构建系统接入电力数据伦理审核平台;

将电力数据的查询入口接入本申请技术方案构建的电力数据伦理知识图谱;

接收用户终端输入的查询内容,查询内容对应电力数据伦理知识图谱的电力数据;

基于查询内容,电力数据伦理审核平台根据电力数据伦理知识图谱的实体关系推理,关联电力数据与法律之间的关系,提示伦理风险,并评定风险等级;

判定用户权限和对应风险等级匹配与否,若不匹配,则提示用户无查询权限,若匹配,则将加密的电力数据进行数据脱敏处理,并输出电力数据。

本申请实施例还提供了一种终端设备,参见图5,该终端设备300可以包括:至少一个处理器310、存储器320,存储器320中储存可在至少一个处理器310上运行的计算机程序321,处理器310执行计算机程序321时实现上述任意各个方法实施例中的步骤,例如图2所示实施例中的步骤101至步骤104。或者,所述处理器310执行所述计算机程序321时实现上述电力数据伦理知识图谱构建系统实施例中各模块/单元的功能,例如图4所示模块201至203的功能。

示例性的,计算机程序321可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器320中,并由处理器310执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序段,该程序段用于描述计算机程序在终端设备300中的执行过程。

本领域技术人员可以理解,图5仅仅是终端设备的示例,并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。

处理器310可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器320可以是终端设备300的内部存储单元,也可以是终端设备300的外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字卡(SecureDigital,SD),闪存卡(Flash Card)等。存储器320用于存储计算机程序321以及终端设备300所需的其他程序和数据。存储器320还可以用于暂时地存储已经输出或者将要输出的数据。

总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本申请实施例提供的电力数据伦理知识图谱构建方法可以应用于计算机、可穿戴设备、车载设备、平板电脑、笔记本电脑、上网本、个人数字助理(personal digitalassistant,PDA)、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、手机等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。

本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现可实现上述电力数据伦理方法各个实施例中的步骤。

本申请实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述电力数据伦理知识图谱构建方法各个实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号