首页> 中国专利> 一种基于人工智能的大数据分析建模预测方法

一种基于人工智能的大数据分析建模预测方法

摘要

本发明公开了一种基于人工智能的大数据分析建模预测方法,包括以下步骤:数据的收集与处理、设立特征库、数据的查询、用户的分类和数据的安全。通过特征库的设置,能够对账号的特征进行提取,从而在大数据平台内部预选根据用户所登陆的账号的特征来对数据进行调用,以减少实际分析建模预测时的时间,而且在数据库内部设置关键词表格,能够提高人工智能模块对关键词的分析速度,并且大数据平台会在全程对用户的账号进行保护,以防用户的信息和查询的数据泄漏,同时人工智能模块还能够对用户查询数据时的各项指标建模分析,以提高数据分析的速度。

著录项

  • 公开/公告号CN113849636A

    专利类型发明专利

  • 公开/公告日2021-12-28

    原文格式PDF

  • 申请/专利权人 工业云制造(四川)创新中心有限公司;

    申请/专利号CN202110977317.0

  • 申请日2021-08-24

  • 分类号G06F16/35(20190101);G06F40/30(20200101);G06F40/284(20200101);G06F40/247(20200101);G06F21/32(20130101);G06F21/60(20130101);

  • 代理机构51298 成都华复知识产权代理有限公司;

  • 代理人李俊

  • 地址 610000 四川省成都市高新区益州大道中段599号13栋19层1908-1912号、20层2008-2012号

  • 入库时间 2023-06-19 13:26:15

说明书

技术领域

本发明属于大数据分析技术领域,更具体地说,尤其涉及一种基于人工智能的大数据分析建模预测方法。

背景技术

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值;

由于大数据中的数据集合过于庞大而复杂,目前大数据平台在对数据进行分析建模预测时会花费较多的时间,导致人们不能及时得知数据分析的结果,降低了人们对大数据平台的使用体验。

发明内容

本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于人工智能的大数据分析建模预测方法。

为实现上述目的,本发明提供如下技术方案:一种基于人工智能的大数据分析建模预测方法,包括以下步骤:

S1、数据的收集与处理,大数据平台对数据进行收集,首先对这些数据进行处理,然后将数据按照设定好的关键词分类存储在数据库内部,再设立数据名称表格,将与数据关键词语义相近的词语囊括在表格中;

S2、设立特征库,在数据库内部设置特征库,根据用户登录的账号特征事先对用户可能检索的数据进行调取然后存放在特征库内,并按照先后顺序将调取的特征数据在特征库内部进行排列;

S3、数据的查询,用户在输入关键词查询数据时,人工智能模块会迅速对用户输入的关键词的词义进行分析,然后在数据名称表格中找到与该关键词词义相近或相同的词语,并对数据库内部该词语大类下的数据进行调取,以搜索内容相关与否的顺序排列后对用户进行显示;

S4、用户的分类,大数据平台在用户查询数据完成后,对用户查询数据时的各项指标进行提取,然后人工智能模块会对这些指标进行分析,将相似的指标通过分析算法配置成模型,生成对应的指标模型,在之后的用户登录账号后,人工智能模块能够直接套用指标模型来推送数据。

S5、数据的安全,大数据平台在用户登录账号到登出账号的这一时间段内全程对用户的账号进行保护,同时在用户查询数据时会请求对用户的身份进行验证,如果验证成功则予以显示数据,如果在有限次数内验证失败则强制登出账号,并对该账号进行监控。

优选的,所述S1中在对数据收集后先删除数据集合中的无用数据与乱码,然后根据数据的类别以时间的先后顺序在数据库内部存放,同时大数据平台会对数据的来源进行监测,以防数据中夹杂木马病毒或非法程序。

优选的,所述S2中特征指用户所登录的账号在一定时间范围内所检索的数据类别,在用户登录账号后即对用户网页端的cookice痕迹进行分析,以便向用户及时推送数据。

优选的,所述S3中人工智能模块会在一定时间范围内对用户输入的关键词进行汇总,并将多组具有相似关键词的用户进行分组,然后分析组内用户的特征,在下次遇见相同特征的用户时能够及时对数据进行推送。

优选的,所述S3中用户输入的关键词的方式可以是键盘在搜索框内输入内容的方式,也可以外接设备通过语音输入的方式,人工智能模块均能予以分析。

优选的,所述S4中的指标包括用户查询数据的时间,用户停留在每项数据上的时间以及用户经常查询的数据,同时各项指标被大数据平台进行收集汇总,并与该用户的账号特征加以联系。

优选的,所述S5中验证的方法可以是指纹验证、虹膜验证等生物特征验证方法,也可以是短信验证或密码验证,验证前需要实现将账号与用户的生物特征进行绑定。

优选的,所述S5中强制登出账号后会对该IP地址进行锁定,只有当用户通过后台验证身份通过后才可对该IP地址进行解锁,并且在账号监控过程中会对该账号的每一个违规行为进行判断,以保证账号的安全性。

本发明的技术效果和优点:

通过特征库的设置,能够对账号的特征进行提取,从而在大数据平台内部预选根据用户所登陆的账号的特征来对数据进行调用,以减少实际分析建模预测时的时间,而且在数据库内部设置关键词表格,能够提高人工智能模块对关键词的分析速度,并且大数据平台会在全程对用户的账号进行保护,以防用户的信息和查询的数据泄漏,同时人工智能模块还能够对用户查询数据时的各项指标建模分析,以提高数据分析的速度。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于人工智能的大数据分析建模预测方法,包括以下步骤:

S1、数据的收集与处理,大数据平台对数据进行收集,首先对这些数据进行处理,然后将数据按照设定好的关键词分类存储在数据库内部,再设立数据名称表格,将与数据关键词语义相近的词语囊括在表格中,在对数据收集后先删除数据集合中的无用数据与乱码,然后根据数据的类别以时间的先后顺序在数据库内部存放,同时大数据平台会对数据的来源进行监测,以防数据中夹杂木马病毒或非法程序,对数据收集时由于数据过于庞大,在实际的数据处理时会对相似的数据进行删除,并对删除的数据进行标记,如果用户所查询的数据为删除的内容,那么通过标记可以对数据进行恢复,表格在对与数据关键词语义相近的词语进行囊括时,人工智能模块会对与该词语读音相同的拼音进行分析,当用户再输入拼音时人工智能模块会自动跳出与该拼音读音相同的关键词以供用户进行查询;

S2、设立特征库,在数据库内部设置特征库,根据用户登录的账号特征事先对用户可能检索的数据进行调取然后存放在特征库内,并按照先后顺序将调取的特征数据在特征库内部进行排列,特征指用户所登录的账号在一定时间范围内所检索的数据类别,在用户登录账号后即对用户网页端的cookice痕迹进行分析,以便向用户及时推送数据,账号特征还包括该账号的性别、注册时间、以及身份认证的个人信息,特征库的设置能够对用户的账号特征进行存放,大数据平台能够对特征进行分析然后实现数据的精准推送,并且由于账号特征的存在,当新用户注册完账号后,大数据平台能够立即对该账号的账号特征进行分析,然后根据类似账号特征的数据对新用户进行推送;

S3、数据的查询,用户在输入关键词查询数据时,人工智能模块会迅速对用户输入的关键词的词义进行分析,然后在数据名称表格中找到与该关键词词义相近或相同的词语,并对数据库内部该词语大类下的数据进行调取,以搜索内容相关与否的顺序排列后对用户进行显示,人工智能模块会在一定时间范围内对用户输入的关键词进行汇总,并将多组具有相似关键词的用户进行分组,然后分析组内用户的特征,在下次遇见相同特征的用户时能够及时对数据进行推送,用户输入的关键词的方式可以是键盘在搜索框内输入内容的方式,也可以外接设备通过语音输入的方式,人工智能模块均能予以分析;

S4、用户的分类,大数据平台在用户查询数据完成后,对用户查询数据时的各项指标进行提取,然后人工智能模块会对这些指标进行分析,将相似的指标通过分析算法配置成模型,生成对应的指标模型,在之后的用户登录账号后,人工智能模块能够直接套用指标模型来推送数据,指标包括用户查询数据的时间,用户停留在每项数据上的时间以及用户经常查询的数据,同时各项指标被大数据平台进行收集汇总,并与该用户的账号特征加以联系,在对用户进行分类时,人工智能模块会将10组~20组用户的指标进行汇总,然后建立模型以进行分析,该组内的指标大多类型相近,以便人工智能模块对指标进行学习。

S5、数据的安全,大数据平台在用户登录账号到登出账号的这一时间段内全程对用户的账号进行保护,同时在用户查询数据时会请求对用户的身份进行验证,如果验证成功则予以显示数据,如果在有限次数内验证失败则强制登出账号,并对该账号进行监控,验证的方法可以是指纹验证、虹膜验证等生物特征验证方法,也可以是短信验证或密码验证,验证前需要实现将账号与用户的生物特征进行绑定,强制登出账号后会对该IP地址进行锁定,只有当用户通过后台验证身份通过后才可对该IP地址进行解锁,并且在账号监控过程中会对该账号的每一个违规行为进行判断,以保证账号的安全性。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号