首页> 中国专利> 一种基于网络直播和在线电商带货的信息处理方法及系统

一种基于网络直播和在线电商带货的信息处理方法及系统

摘要

本公开揭示的基于网络直播和在线电商带货的信息处理方法及系统,根据第一信息清单和第二信息清单确定多个标签信息的信息识别度以及标签信息之间的标签相似率。基于信息的信息识别度以及不同标签信息之间的标签相似率对标签信息进行验证并统计通过验证的目标标签信息。获取智能终端的消息报文并确定消息报文的时序连续性曲线以及关键词队列。在基于时序连续性曲线以及关键词序列判断出智能终端携带木马程序时设置访问拦截机制。如此,通过对智能终端的交互信息进行时序连续性检测以及自然语言分析,能够及时且精准地检测出智能终端是否携带木马程序,从而对携带木马程序的智能终端进行访问拦截,确保电商平台和其他智能终端的信息安全性。

著录项

  • 公开/公告号CN112488246A

    专利类型发明专利

  • 公开/公告日2021-03-12

    原文格式PDF

  • 申请/专利权人 蔡淦祺;

    申请/专利号CN202110028380.X

  • 发明设计人 蔡淦祺;

    申请日2020-08-06

  • 分类号G06K9/62(20060101);H04L29/06(20060101);G06F21/56(20130101);H04L29/08(20060101);H04N21/2187(20110101);H04N21/478(20110101);

  • 代理机构44214 广州市红荔专利代理有限公司;

  • 代理人李彦孚

  • 地址 522000 广东省揭阳市榕城区东兴马牙居委建阳路11号

  • 入库时间 2023-06-19 10:11:51

说明书

技术领域

本公开涉及网络直播和在线电商技术领域,特别涉及一种基于网络直播和在线电商带货的信息处理方法及系统。

背景技术

随着互联网的发展,人们的生活方式发生了巨大的变化。以购物为例,现如今,在线购物已成为人们的主要购物方式。而商家为了提高线上产品的销量,通常会通过网络直播的形式在电商平台上与用户进行交流,从而实现在线带货。商家与用户进行交流的本质是电商平台与智能终端之间的信息交互,因此,如何确保电商平台以及智能终端的信息安全性是现目前亟待解决的一个技术问题。

发明内容

为改善相关技术中存在的上述技术问题,本公开提供了基于网络直播和在线电商带货的信息处理方法及系统。

第一方面,提供一种基于网络直播和在线电商带货的信息处理方法,应用于与多个智能终端通信的云服务器,所述方法至少包括:

针对每个智能终端,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率;

基于确定的所述多个标签信息的信息识别度以及不同标签信息之间的标签相似率,对所述多个标签信息进行验证,并统计通过验证的至少三个目标标签信息;其中,所述目标标签信息的信息识别度大于设定识别度且所述目标标签信息之间的标签相似率小于设定相似率;

获取该智能终端在基于所述云服务器的运行日志确定出的当前时段内的消息报文,根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列;

基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序;若是,则根据该智能终端的终端配置信息设置用于拦截该智能终端的访问拦截机制。

可选地,基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序,包括:

获取所述时序连续性曲线中的临界曲线段,所述临界曲线段为包括有曲线斜率大于设定斜率的临界点的曲线段;将所述临界曲线段等分为至少两个子线段;并行计算所述至少两个子线段中每个子线段中包括的曲线斜率变化系数;将计算得到的各曲线斜率变化系数映射到预设数值区间中并计算各曲线斜率变化系数在所述预设数值区间中的映射值的加权和;

在所述加权和大于目标值时,提取所述关键词序列中的每个关键词的词向量;基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合;计算每个聚类集合中的词向量之间的特征差异度;

在每个特征差异度与设定差异度的差值小于预设阈值时,选取最大特征差异度对应的聚类集合作为检测集合并确定所述检测集合对应的词向量矩阵,从预设的数据库中查找是否存在与所述词向量矩阵之间的矩阵相似度大于设定相似度的目标词向量矩阵;若存在,则判定该智能终端携带木马程序;其中,所述目标词向量矩阵中的矩阵元素为异常关键词对应的元素。

可选地,基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合,计算每个聚类集合中的词向量之间的特征差异度,进一步包括:

确定所述曲线特征的特征维度数量并将所述曲线特征对应的特征值队列中的每个特征值在所述特征值队列中的位置信息进行归一化处理得到每个特征值对应的相对位置系数,采用所述相对位置系数对每个特征值进行修正得到每个特征值对应的修正值并根据所述修正值计算所述曲线特征对应的特征配置参数;其中,所述特征配置参数用于对预设聚类模型的模型参数进行更新,所述预设模型参数为kmeans均值聚类模型;

提取所述预设聚类模型的当前模型参数,根据所述当前模型参数与所述特征配置参数之间的相关性系数计算所述预设聚类模型的当前聚类准确率;在所述当前聚类准确率低于设定准确率时采用所述特征配置参数对所述预设聚类模型进行更新;

基于更新之后的预设聚类模型确定聚类特征数,并判断所述词向量的向量维度数是否等于所述聚类特征数;若否,则基于所述特征配置参数对所述词向量进行向量维度数的调整以使得所述词向量的向量维度数等于所述聚类特征数;

将完成调整的词向量输入更新之后的预设聚类模型并获得更新之后的预设聚类模型输出的至少两个聚类集合;针对每个聚类集合,计算该聚类集合中的每个词向量与其他词向量之间的余弦距离,根据该聚类集合中的每个词向量在该聚类集合中的聚类权重对所述余弦距离进行筛选并将筛选得到得余弦距离进行均值计算得到特征差异度。

可选地,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率,进一步包括:

将所述第一信息清单中用于表征该智能终端与所述云服务器之间的通信记录的第一信息集按照时序先后顺序列出并将所述第二信息清单中用于表征该智能终端与其他智能终端之间的通信记录的第二信息集按照时序先后顺序列出,基于所述第一信息集生成所述第一信息清单的第一信息流轨迹以及基于所述第二信息集生成所述第二信息清单的第二信息流轨迹;其中,所述第一信息流轨迹中的第一轨迹节点的数量与所述第二信息流轨迹中的第二轨迹节点的数量不相同,所述第一轨迹节点和所述第二轨迹节点具有不同的节点信息维度;

获取所述第一信息流轨迹中的其中一个第一轨迹节点对应的节点信息维度所表征的用于表征所述交互信息的时序连续轨迹以及所述交互信息的信息主题的目标信息;将所述第二信息流轨迹中具有最大节点信息维度的第二轨迹节点确定为目标轨迹节点,并依据所述第一信息流轨迹和所述第二信息流轨迹之间的时序差值将所述目标信息封装到所述目标轨迹节点中,以在所述目标轨迹节点中得到与所述目标信息对应的配置信息;根据所述配置信息与所述目标信息之间的匹配度确定所述第一信息清单和所述第二信息清单之间的时序一致性权重;

采用所述时序一致性权重对所述第一信息流轨迹以及所述第二信息流轨迹进行时序校正并将校正后的第一信息流轨迹和校正后的第二信息流轨迹进行拼接得到第三信息流轨迹;提取所述第三信息流轨迹中的每个第三轨迹节点对应的节点描述信息并将每个第三轨迹节点对应的节点描述信息进行分类得到第一信息分组以及第二信息分组;

基于所述第一信息分组下的节点描述信息确定待验证的用于确定所述交互信息的时序连续性的多个第一标签信息,基于所述第二信息分组下的节点描述信息确定待验证的用于确定用于提取所述交互信息的关键词的多个第二标签信息,根据所述第一标签信息和所述第二标签信息筛选出待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个第三标签信息;将每个第三标签信息对应的标签索引值映射到预设数值列表中得到每个第三标签信息对应的信息识别度;计算每两个第三标签信息的信息向量之间的余弦距离,对计算得到的余弦距离进行加权得到所述多个第三标签信息之间的标签相似率。

可选地,将每个第三轨迹节点对应的节点描述信息进行分类得到第一信息分组以及第二信息分组,具体包括:

按照预设时长间隔将所述第三信息流轨迹对应的轨迹曲线划分为多个曲线段并计算用于表征每个曲线段的轨迹稳定性的曲线斜率,根据所述曲线斜率生成所述第三信息流轨迹对应的轨迹分布列表;基于所述轨迹分布列表中的列表信息的信息关联度将每个第三轨迹节点对应的节点描述信息进行第一次分类得到第一初始分组以及第二初始分组;

在确定出所述第一初始分组下的节点描述信息与所述第二初始分组下的节点描述信息之间存在信息兼容性标识时,基于确定出的所述第一初始分组下的节点描述信息与所述第二初始分组下的节点描述信息之间信息兼容度将所述第一初始分组下的至少一个节点描述信息调整到所述第二初始分组下;

计算完成调整后的第一初始分组下的节点描述信息的第一信息配置系数以及完成调整后的第二初始分组下的节点描述信息的第二信息配置系数,确定所述第一信息配置系数与所述第二信息配置系数之间的系数差值;判断所述系数差值是否大于设定差值;在所述系数差值大于所述设定差值时,将完成调整后的第一初始分组确定为所述第一信息分组并完成调整后的第二初始分组确定为所述第二信息分组;在所述系数差值小于等于所述设定差值时继续将所述第一初始分组下的至少一个节点描述信息调整到所述第二初始分组下,并返回执行计算完成调整后的第一初始分组下的节点描述信息的第一信息配置系数以及完成调整后的第二初始分组下的节点描述信息的第二信息配置系数的步骤。

可选地,所述方法还包括:

获取用于修改所述设定识别度和所述设定相似率的修改指令;

根据所述修改指令对所述设定识别度和所述设定相似率进行修改。

第二方面,提供一种云服务器,所述云服务器与多个智能终端通信,所述云服务器至少用于:

针对每个智能终端,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率;

基于确定的所述多个标签信息的信息识别度以及不同标签信息之间的标签相似率,对所述多个标签信息进行验证,并统计通过验证的至少三个目标标签信息;其中,所述目标标签信息的信息识别度大于设定识别度且所述目标标签信息之间的标签相似率小于设定相似率;

获取该智能终端在基于所述云服务器的运行日志确定出的当前时段内的消息报文,根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列;

基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序;若是,则根据该智能终端的终端配置信息设置用于拦截该智能终端的访问拦截机制。

可选地,所述云服务器基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序具体包括:

获取所述时序连续性曲线中的临界曲线段,所述临界曲线段为包括有曲线斜率大于设定斜率的临界点的曲线段;将所述临界曲线段等分为至少两个子线段;并行计算所述至少两个子线段中每个子线段中包括的曲线斜率变化系数;将计算得到的各曲线斜率变化系数映射到预设数值区间中并计算各曲线斜率变化系数在所述预设数值区间中的映射值的加权和;

在所述加权和大于目标值时,提取所述关键词序列中的每个关键词的词向量;基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合;计算每个聚类集合中的词向量之间的特征差异度;

在每个特征差异度与设定差异度的差值小于预设阈值时,选取最大特征差异度对应的聚类集合作为检测集合并确定所述检测集合对应的词向量矩阵,从预设的数据库中查找是否存在与所述词向量矩阵之间的矩阵相似度大于设定相似度的目标词向量矩阵;若存在,则判定该智能终端携带木马程序;其中,所述目标词向量矩阵中的矩阵元素为异常关键词对应的元素。

第三方面,提供一种云服务器,包括互相之间通信的处理器和存储器,所述处理器通过从所述存储器中调取计算机程序并运行所述计算机程序,以实现上述的方法。

第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果。

首先根据第一信息清单和第二信息清单确定多个标签信息的信息识别度以及不同标签信息之间的标签相似率。

其次基于确定的多个标签信息的信息识别度以及不同标签信息之间的标签相似率对多个标签信息进行验证并统计通过验证的至少三个目标标签信息。

然后获取智能终端在当前时段内的消息报文并根据消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及目标标签信息之间的标签相似率,生成消息报文的时序连续性曲线并提取消息报文的关键词队列。

最后在基于时序连续性曲线以及关键词序列判断出智能终端携带木马程序时设置访问拦截机制。

如此,通过对智能终端的交互信息进行时序连续性检测以及自然语言分析,能够及时且精准地检测出智能终端是否携带木马程序,从而对携带木马程序的智能终端进行访问拦截,确保电商平台和其他智能终端的信息安全性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。

图1是根据本公开所涉及的基于网络直播和在线电商带货的信息处理方法的流程示意图;

图2是根据一示例性实施例示出的一种基于网络直播和在线电商带货的信息处理装置的框图;

图3是根据一示例性实施例示出的一种基于网络直播和在线电商带货的信息处理系统的架构示意图;

图4是根据另一示例性实施例示出的一种云服务器的硬件结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

发明人对现有的在线电商带货技术进行分析发现,现有的电商平台通常对接多个智能终端,也就是说,电商平台和多个智能终端的信息是互通的。这样以来,如果其中一个智能终端携带木马程序,则会影响到电商平台和其他智能终端的信息安全性。因此,如何对智能终端进行及时且精准的木马检测是确保电商平台和智能终端的信息安全性的关键。

为改善上述技术问题,本发明实施例提供了基于网络直播和在线电商带货的信息处理方法及系统,通过对智能终端的交互信息进行时序连续性检测以及自然语言分析,能够及时且精准地检测出智能终端是否携带木马程序,从而对携带木马程序的智能终端进行访问拦截,确保电商平台和其他智能终端的信息安全性。

为实现上述目的,请参阅图1,为本发明实施例所提供的基于网络直播和在线电商带货的信息处理方法的流程图,所述方法可以应用于与多个智能终端通信的云服务器,所述云服务器为电商平台部署在云端的服务器,进一步地,所述方法具体可以包括以下步骤S110-步骤S140所描述的内容。

步骤S110,针对每个智能终端,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率。

在步骤S110中,第一信息清单用于记录该智能终端与云服务器的交互信息(直接交互信息),第二信息清单用于记录该智能终端与其他智能终端的交互信息(间接交互信息)。

步骤S120,基于确定的所述多个标签信息的信息识别度以及不同标签信息之间的标签相似率,对所述多个标签信息进行验证,并统计通过验证的至少三个目标标签信息;其中,所述目标标签信息的信息识别度大于设定识别度且所述目标标签信息之间的标签相似率小于设定相似率。

在步骤S120中,设定识别度和设定相似率根据智能终端的数量进行设置,在此不作限定。

步骤S130,获取该智能终端在基于所述云服务器的运行日志确定出的当前时段内的消息报文,根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列。

在步骤S130中,运行日志用于记载云服务器的信息处理记录,消息报文包括但不限于文字消息、语音消息和图片消息,时序连续性曲线用于表征消息报文在时序上的可信度,关键词队列用于记录消息报文中的关键词。

步骤S140,基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序;若是,则根据该智能终端的终端配置信息设置用于拦截该智能终端的访问拦截机制。

在步骤S140中,访问拦截机制用于拦截该智能终端向云服务器以及其他智能终端发送的信息,还用于拦截云服务器以及其他智能终端向该智能终端发送的信息。

通过应用上述步骤S110-步骤S140所描述的内容,首先根据第一信息清单和第二信息清单确定多个标签信息的信息识别度以及不同标签信息之间的标签相似率,其次基于确定的多个标签信息的信息识别度以及不同标签信息之间的标签相似率对多个标签信息进行验证并统计通过验证的至少三个目标标签信息,然后获取智能终端在当前时段内的消息报文并根据消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及目标标签信息之间的标签相似率,生成消息报文的时序连续性曲线并提取消息报文的关键词队列,最后在基于时序连续性曲线以及关键词序列判断出智能终端携带木马程序时设置访问拦截机制。如此,通过对智能终端的交互信息进行时序连续性检测以及自然语言分析,能够及时且精准地检测出智能终端是否携带木马程序,从而对携带木马程序的智能终端进行访问拦截,确保电商平台和其他智能终端的信息安全性。

在实际应用上述方案时发明人发现,在确定待验证的标签信息的时候会出现确定出的标签信息存在缺损的情况。究其原因,是因为没有考虑第一信息清单和第二信息清单之间在时序上的一致性。为改善上述技术问题从而准确完整地确定标签信息及其对应的信息识别度和标签相似率,步骤S110所描述的基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率,进一步可以包括以下步骤S111-步骤S114所描述的内容。

步骤S111,将所述第一信息清单中用于表征该智能终端与所述云服务器之间的通信记录的第一信息集按照时序先后顺序列出并将所述第二信息清单中用于表征该智能终端与其他智能终端之间的通信记录的第二信息集按照时序先后顺序列出,基于所述第一信息集生成所述第一信息清单的第一信息流轨迹以及基于所述第二信息集生成所述第二信息清单的第二信息流轨迹;其中,所述第一信息流轨迹中的第一轨迹节点的数量与所述第二信息流轨迹中的第二轨迹节点的数量不相同,所述第一轨迹节点和所述第二轨迹节点具有不同的节点信息维度。

步骤S112,获取所述第一信息流轨迹中的其中一个第一轨迹节点对应的节点信息维度所表征的用于表征所述交互信息的时序连续轨迹以及所述交互信息的信息主题的目标信息;将所述第二信息流轨迹中具有最大节点信息维度的第二轨迹节点确定为目标轨迹节点,并依据所述第一信息流轨迹和所述第二信息流轨迹之间的时序差值将所述目标信息封装到所述目标轨迹节点中,以在所述目标轨迹节点中得到与所述目标信息对应的配置信息;根据所述配置信息与所述目标信息之间的匹配度确定所述第一信息清单和所述第二信息清单之间的时序一致性权重。

步骤S113,采用所述时序一致性权重对所述第一信息流轨迹以及所述第二信息流轨迹进行时序校正并将校正后的第一信息流轨迹和校正后的第二信息流轨迹进行拼接得到第三信息流轨迹;提取所述第三信息流轨迹中的每个第三轨迹节点对应的节点描述信息并将每个第三轨迹节点对应的节点描述信息进行分类得到第一信息分组以及第二信息分组。

步骤S114,基于所述第一信息分组下的节点描述信息确定待验证的用于确定所述交互信息的时序连续性的多个第一标签信息,基于所述第二信息分组下的节点描述信息确定待验证的用于确定用于提取所述交互信息的关键词的多个第二标签信息,根据所述第一标签信息和所述第二标签信息筛选出待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个第三标签信息;将每个第三标签信息对应的标签索引值映射到预设数值列表中得到每个第三标签信息对应的信息识别度;计算每两个第三标签信息的信息向量之间的余弦距离,对计算得到的余弦距离进行加权得到所述多个第三标签信息之间的标签相似率。

可以理解,通过上述步骤S111-步骤S114,能够对第一信息清单和第二信息清单之间在时序上的一致性进行分析,从而避免确定出的标签信息的缺失,进而准确完整地确定标签信息及其对应的信息识别度和标签相似率。

在上述基础上,步骤S113所描述的将每个第三轨迹节点对应的节点描述信息进行分类得到第一信息分组以及第二信息分组,具体可以包括以下步骤S1131-步骤S1133所描述的内容。

步骤S1131,按照预设时长间隔将所述第三信息流轨迹对应的轨迹曲线划分为多个曲线段并计算用于表征每个曲线段的轨迹稳定性的曲线斜率,根据所述曲线斜率生成所述第三信息流轨迹对应的轨迹分布列表;基于所述轨迹分布列表中的列表信息的信息关联度将每个第三轨迹节点对应的节点描述信息进行第一次分类得到第一初始分组以及第二初始分组。

步骤S1132,在确定出所述第一初始分组下的节点描述信息与所述第二初始分组下的节点描述信息之间存在信息兼容性标识时,基于确定出的所述第一初始分组下的节点描述信息与所述第二初始分组下的节点描述信息之间信息兼容度将所述第一初始分组下的至少一个节点描述信息调整到所述第二初始分组下。

步骤S1133,计算完成调整后的第一初始分组下的节点描述信息的第一信息配置系数以及完成调整后的第二初始分组下的节点描述信息的第二信息配置系数,确定所述第一信息配置系数与所述第二信息配置系数之间的系数差值;判断所述系数差值是否大于设定差值;在所述系数差值大于所述设定差值时,将完成调整后的第一初始分组确定为所述第一信息分组并完成调整后的第二初始分组确定为所述第二信息分组;在所述系数差值小于等于所述设定差值时继续将所述第一初始分组下的至少一个节点描述信息调整到所述第二初始分组下,并返回执行计算完成调整后的第一初始分组下的节点描述信息的第一信息配置系数以及完成调整后的第二初始分组下的节点描述信息的第二信息配置系数的步骤。

在具体实施时,通过应用上述步骤S1131-步骤S1133,能够对第三轨迹节点对应的节点描述信息进行准确分类,从而准确地得到第一信息分组以及第二信息分组。

在具体实施过程中,为了准确可靠地判断智能终端是否携带木马程序,避免误判,步骤S140所描述的基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序,进一步可以包括以下步骤S141-步骤S143所描述的内容。

步骤S141,获取所述时序连续性曲线中的临界曲线段,所述临界曲线段为包括有曲线斜率大于设定斜率的临界点的曲线段;将所述临界曲线段等分为至少两个子线段;并行计算所述至少两个子线段中每个子线段中包括的曲线斜率变化系数;将计算得到的各曲线斜率变化系数映射到预设数值区间中并计算各曲线斜率变化系数在所述预设数值区间中的映射值的加权和。

步骤S142,在所述加权和大于目标值时,提取所述关键词序列中的每个关键词的词向量;基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合,计算每个聚类集合中的词向量之间的特征差异度。

步骤S143,在每个特征差异度与设定差异度的差值小于预设阈值时,选取最大特征差异度对应的聚类集合作为检测集合并确定所述检测集合对应的词向量矩阵,从预设的数据库中查找是否存在与所述词向量矩阵之间的矩阵相似度大于设定相似度的目标词向量矩阵;若存在,则判定该智能终端携带木马程序;其中,所述目标词向量矩阵中的矩阵元素为异常关键词对应的元素。

在实际应用时,基于上述步骤S141-步骤S143,能够准确可靠地判断智能终端是否携带木马程序。

在一个更为具体的实施方式中,步骤S142所描述的基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合,计算每个聚类集合中的词向量之间的特征差异度,具体可以包括以下步骤S1421-步骤S1424所描述的内容。

步骤S1421,确定所述曲线特征的特征维度数量并将所述曲线特征对应的特征值队列中的每个特征值在所述特征值队列中的位置信息进行归一化处理得到每个特征值对应的相对位置系数,采用所述相对位置系数对每个特征值进行修正得到每个特征值对应的修正值并根据所述修正值计算所述曲线特征对应的特征配置参数;其中,所述特征配置参数用于对预设聚类模型的模型参数进行更新,所述预设模型参数为kmeans均值聚类模型。

步骤S1422,提取所述预设聚类模型的当前模型参数,根据所述当前模型参数与所述特征配置参数之间的相关性系数计算所述预设聚类模型的当前聚类准确率;在所述当前聚类准确率低于设定准确率时采用所述特征配置参数对所述预设聚类模型进行更新。

步骤S1423,基于更新之后的预设聚类模型确定聚类特征数,并判断所述词向量的向量维度数是否等于所述聚类特征数;若否,则基于所述特征配置参数对所述词向量进行向量维度数的调整以使得所述词向量的向量维度数等于所述聚类特征数。

步骤S1424,将完成调整的词向量输入更新之后的预设聚类模型并获得更新之后的预设聚类模型输出的至少两个聚类集合;针对每个聚类集合,计算该聚类集合中的每个词向量与其他词向量之间的余弦距离,根据该聚类集合中的每个词向量在该聚类集合中的聚类权重对所述余弦距离进行筛选并将筛选得到得余弦距离进行均值计算得到特征差异度。

如此,通过执行上述步骤S1421-步骤S1424,能够确保聚类的精准性以及特征差异度的准确性。

在一个可能的实施方式中,为了确保对多个标签信息的可靠验证,在步骤S120的基础上,还可以包括以下步骤S121和步骤S122所描述的内容。

步骤S121,获取用于修改所述设定识别度和所述设定相似率的修改指令。

步骤S122,根据所述修改指令对所述设定识别度和所述设定相似率进行修改。

如此,能够根据不同业务场景对设定识别度和设定相似率进行灵活修改,从而确保对多个标签信息的可靠验证。

在一个可替换的实施方式中,步骤S130所描述的根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列,具体可以包括以下步骤S131-步骤S135所描述的内容。

步骤S131,将所述消息报文在每个目标标签信息下的置信度按照由大到小的顺序进行排序得到置信度序列,根据所述置信度序列以及每个目标标签信息的信息识别度确定所述消息报文在所述当前时段内的多个时序节点。

步骤S132,基于所述目标标签信息之间的标签相似率将所述多个时序节点进行拟合得到初始曲线并采用所述置信度序列中的中位数对所述初始曲线进行平滑处理得到所述时序连续性曲线。

步骤S133,分别确定每个目标标签信息的信息识别度在所述消息报文中的关联报文字段,根据每个关联报文字段的字段特征生成所述消息报文的分词标识。

步骤S134,采用所述分词标识对所述消息报文进行拆分,得到多个报文序列。

步骤S135,基于所述目标标签信息之间的标签相似率确定提取逻辑并通过所述提取逻辑提取每个报文序列中的关键词,将所述关键词按照其对应的报文序列的生成时刻信息进行组合以得到所述关键词队列。

在应用上述步骤S131-步骤S135所描述的内容时,能够确保时序连续性曲线的平滑性以及关键词队列的完整性。

基于上述同样的发明构思,请结合参阅图2,提供了基于网络直播和在线电商带货的信息处理装置200的功能模块框图,所述信息处理装置200应用于上述的云服务器,具体包括以下功能模块:

标签信息确定模块210,用于针对每个智能终端,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率;

标签信息验证模块220,用于基于确定的所述多个标签信息的信息识别度以及不同标签信息之间的标签相似率,对所述多个标签信息进行验证,并统计通过验证的至少三个目标标签信息;其中,所述目标标签信息的信息识别度大于设定识别度且所述目标标签信息之间的标签相似率小于设定相似率;

消息报文处理模块230,用于获取该智能终端在基于所述云服务器的运行日志确定出的当前时段内的消息报文,根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列;

智能终端检测模块240,用于基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序;若是,则根据该智能终端的终端配置信息设置用于拦截该智能终端的访问拦截机制。

关于上述功能模块的说明请参阅对图1所示的方法的描述,在此不作赘述。

基于上述同样的发明构思,如图3所示,提供了一种基于网络直播和在线电商带货的信息处理系统300的架构示意图。所述信息处理系统300可以包括云服务器310以及与所述云服务器310通信的多个智能终端320,所述云服务器310用于:

针对每个智能终端,基于提取的用于记录该智能终端的交互信息的第一信息清单和第二信息清单,确定待验证的用于确定所述交互信息的时序连续性并用于提取所述交互信息的关键词的多个标签信息的信息识别度,以及不同标签信息之间的标签相似率;

基于确定的所述多个标签信息的信息识别度以及不同标签信息之间的标签相似率,对所述多个标签信息进行验证,并统计通过验证的至少三个目标标签信息;其中,所述目标标签信息的信息识别度大于设定识别度且所述目标标签信息之间的标签相似率小于设定相似率;

获取该智能终端在基于所述云服务器的运行日志确定出的当前时段内的消息报文,根据所述消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及所述目标标签信息之间的标签相似率,生成所述消息报文在所述当前时段内的时序连续性曲线并提取所述消息报文在所述当前时段内的关键词队列;

基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序;若是,则根据该智能终端的终端配置信息设置用于拦截该智能终端的访问拦截机制。

进一步地,所述云服务器310基于所述时序连续性曲线以及所述关键词序列判断该智能终端是否携带木马程序具体包括:

获取所述时序连续性曲线中的临界曲线段,所述临界曲线段为包括有曲线斜率大于设定斜率的临界点的曲线段;将所述临界曲线段等分为至少两个子线段;并行计算所述至少两个子线段中每个子线段中包括的曲线斜率变化系数;将计算得到的各曲线斜率变化系数映射到预设数值区间中并计算各曲线斜率变化系数在所述预设数值区间中的映射值的加权和;

在所述加权和大于目标值时,提取所述关键词序列中的每个关键词的词向量;基于所述时序连续性曲线对应的曲线特征对提取得到的多个词向量进行聚类得到至少两个聚类集合;计算每个聚类集合中的词向量之间的特征差异度;

在每个特征差异度与设定差异度的差值小于预设阈值时,选取最大特征差异度对应的聚类集合作为检测集合并确定所述检测集合对应的词向量矩阵,从预设的数据库中查找是否存在与所述词向量矩阵之间的矩阵相似度大于设定相似度的目标词向量矩阵;若存在,则判定该智能终端携带木马程序;其中,所述目标词向量矩阵中的矩阵元素为异常关键词对应的元素。

在上述基础上,请结合参阅图4,提供了一种云服务器310,包括互相之间通信的处理器311和存储器312,所述处理器311通过从所述存储器312中调取计算机程序并运行所述计算机程序,以实现如图1所示的方法。

此外,还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现如图1所示的方法。

综上,基于上述方法、装置、系统及云服务器,首先根据第一信息清单和第二信息清单确定多个标签信息的信息识别度以及不同标签信息之间的标签相似率。

其次基于确定的多个标签信息的信息识别度以及不同标签信息之间的标签相似率对多个标签信息进行验证并统计通过验证的至少三个目标标签信息。

然后获取智能终端在当前时段内的消息报文并根据消息报文在每个目标标签信息下的置信度、每个目标标签信息的信息识别度以及目标标签信息之间的标签相似率,生成消息报文的时序连续性曲线并提取消息报文的关键词队列。

最后在基于时序连续性曲线以及关键词序列判断出智能终端携带木马程序时设置访问拦截机制。

如此,通过对智能终端的交互信息进行时序连续性检测以及自然语言分析,能够及时且精准地检测出智能终端是否携带木马程序,从而对携带木马程序的智能终端进行访问拦截,确保电商平台和其他智能终端的信息安全性。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的内容,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号