首页> 中国专利> 一种基于互联网大数据的机器智能学习方法

一种基于互联网大数据的机器智能学习方法

摘要

本发明涉及机器学习技术领域,公开了一种基于互联网大数据的机器智能学习方法,该机器智能学习方法为以下步骤:S1、数据采集;S2、数据处理;S3、数据存储;S4、数据学习;S5、数据储备;S6、预测结果;S7、语音影像处理;本发明通过将采集的数据进行有效的拦截清洗过滤,能够有效的避免将大数据中所产生的病毒以及广告带入至机器学习的内容中,并将过滤后的数据在进行归纳集成,使得能够更快的传输至机器中,同时机器可根据无监督与有监督的学习方式,学习多种数据内容以及学习多种的礼貌用语以及表情,从而可有效的提高机器的学习能力以及模仿能力,也能够实现其人机交互的作用,使得商业价值进行提高。

著录项

  • 公开/公告号CN113220963A

    专利类型发明专利

  • 公开/公告日2021-08-06

    原文格式PDF

  • 申请/专利权人 深圳信息职业技术学院;

    申请/专利号CN202011237579.5

  • 发明设计人 谭旭;曹维;张倩;庄穆妮;赵学华;

    申请日2020-11-09

  • 分类号G06F16/951(20190101);G06F16/9535(20190101);G06N20/00(20190101);

  • 代理机构11624 北京卓岚智财知识产权代理事务所(特殊普通合伙);

  • 代理人郭智

  • 地址 518172 广东省深圳市龙岗区龙翔大道2188号

  • 入库时间 2023-06-19 12:07:15

说明书

技术领域

本发明涉及机器学习技术领域,具体是一种基于互联网大数据的机器智能学习方法。

背景技术

互联网大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,而大数据是人工智能的基础,使得大数据转变为知识或生产力,离不开机器学习,可以说机器学习是人工智能的核心,是使机器具有类似人的智能的根本途径。

但是,目前的机器学习的过程中,常常会将大数据中的广告以及新闻之类的垃圾带入至学习内容中,从而影响机器内部的存储空间,并且一般的机器的内存都为固定,其无法能够合理去利用其机器的内存空间,使得需要人工对其内容删除,同时也无法有效的去学习新的数据,且机器学习过程中其礼貌用语以及表情都较为简单,使得价值较低。因此,本领域技术人员提供了一种基于互联网大数据的机器智能学习方法,以解决上述背景技术中提出的问题。

发明内容

本发明的目的在于提供一种基于互联网大数据的机器智能学习方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于互联网大数据的机器智能学习方法,该机器智能学习方法为以下步骤:

S1、数据采集:将外界的互联网大数据中的所有产生的数据进行采集,并通过云平台将采集的数据发送至机器内部由机器内部的机器学习模块进行分类学习处理;

S2、数据处理:将采集的数据进行预处理,使得采集的数据中的广告、病毒之类的数据进行处理,并将过滤后的数据进行基础特征提取后进行存取;

S3、数据存储:将S2中所提取的信息在进行多层复杂特征提取后存储,并通过机器内部的自身内存而对不同的数据进行分类存储,以便于机器的学习;

S4、数据学习:针对不同的分类数据信息,将数据划分到合适的类别中,根据标签值或目标值建立模型或规则,然后利用这些带有目标值的数据形成的模型或规则,对新数据进行识别或预测其属于监督学习,与监督学习相对是无监督学习,无监督学习不指定目标值或预先无法知道目标值,它可以将把相似或相近的数据划分到相同的组里;

S5、数据储备:将学习后的数据进行储存至机器的内部储存卡内,能够避免发生数据丢失现象;

S6、预测结果:通过机器内部的智能模块,预测出所存储的数据是否为准确数据,若为错误数据则进行删除,若为正确数据,则进行保存;

S7、语音影像处理:对采集处理以及存储后的数据进行影像与声音处理,同时采用其内部的智能控制模块实现其语音播放以及影像放映,并利用智能控制模块对其进行运算以及智能对话处理。

作为本发明再进一步的方案:所述S4中的监督学习为基于输入数据及目标值训练预测模型学习,所述无监督学习为根据输入聚聚对数据进行分组学习。

作为本发明再进一步的方案:所述S2中数据处理包括以下步骤:

(1)、数据清洗:将采集的大数据全部传输至机器中的暂存模块内,利用机器内部的智能拦截模块将暂存模块内的所有数据进行清洗,使得带有病毒以及有害数据进行拦截并排出;

(2)、数据过滤:将清洗后的数据再次进行过滤,并通过其内部的智能模块将数据中的广告、新闻之类的进行拦截排出;

(3)、数据集成:清洗过滤后的数据通过数据集成将其进行归纳,并整合至一个整体,便于数据的传输。

作为本发明再进一步的方案:所述在S4中数据学习可进行礼貌用语训练、词语内容信息、使用表情训练、类似语句重复度信息、对话时长信息和对大数据进行训练等。

作为本发明再进一步的方案:所述礼貌用语为“你好”、“谢谢”、“不客气”等等至少二十种以上的用语,所述表情训练至少“喜、怒、哀、乐”等十种以上的表情。

作为本发明再进一步的方案:所述在S7中设有查询模块以及人机交互模块,可实现对其内部存储的数据进行查询,实现其快速的对数据处理检索的功能,并通过人机交互模块将检索出的信息通过语音以及影像进行播放。

作为本发明再进一步的方案:所述在S3数据存储中,数据存储采用每隔3S的速度进行存储,并在每次存储后进行压缩,从而使得能够存储较为多的数据。

作为本发明再进一步的方案:所述在S5数据储备中,其存储的数据至少可实现保存三个月以上,并且在自动删除前十二天可进行提示。

作为本发明再进一步的方案:所述在S6预测结果中,其智能模块通过无线连接的方式与外界进行连接,同时数据与智能模块进行对比从而进行判断。

与现有技术相比,本发明的有益效果是:本发明通过将采集的数据进行有效的拦截清洗过滤,能够有效的避免将大数据中所产生的病毒以及广告带入至机器学习的内容中,并将过滤后的数据在进行归纳集成,使得能够更快的传输至机器中,同时机器可根据无监督与有监督的学习方式,学习多种数据内容以及学习多种的礼貌用语以及表情,从而可有效的提高机器的学习能力以及模仿能力,也能够实现其人机交互的作用,使得商业价值进行提高,并且存储的数据可保存三个月以上,使得数据进行充分的保留,同时也在自动删除前可进行提示,保证数据的安全性,也能够对空间进行清理,使得能够让机器学习新的内容,且数据存储采用每隔3S的速度进行存储,使得在对数据压缩时有一定的时间间隙,并在每次存储后进行压缩,从而使得能够实现存储较为多的数据。

附图说明

图1为一种基于互联网大数据的机器智能学习方法的结构示意图;

图2为一种基于互联网大数据的机器智能学习方法中数据清洗的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

根据图1-图2,本发明实施例中,一种基于互联网大数据的机器智能学习方法,该机器智能学习方法为以下步骤:

S1、数据采集:将外界的互联网大数据中的所有产生的数据进行采集,并通过云平台将采集的数据发送至机器内部由机器内部的机器学习模块进行分类学习处理,外界互联网大数据中的数据采用互联网、移动互联网、通信网及物联网等方式进行传输并进行采集,其云平台主要用于对大数据进行数据分析处理;

S2、数据处理:将采集的数据进行预处理,使得采集的数据中的广告、病毒之类的数据进行处理,并将过滤后的数据进行基础特征提取后进行存取;

S2中数据处理包括以下步骤:

(1)、数据清洗:将采集的大数据全部传输至机器中的暂存模块内,利用机器内部的智能拦截模块将暂存模块内的所有数据进行清洗,使得带有病毒以及有害数据进行拦截并排出;

(2)、数据过滤:将清洗后的数据再次进行过滤,并通过其内部的智能模块将数据中的广告、新闻之类的进行拦截排出;

(3)、数据集成:清洗过滤后的数据通过数据集成将其进行归纳,并整合至一个整体,便于数据的传输。将采集的数据进行有效的拦截清洗过滤,能够有效的避免将大数据中所产生的病毒以及广告带入至机器学习的内容中,并将过滤后的数据在进行归纳集成,使得能够更快的传输至机器中。

S3、数据存储:将S2中所提取的信息在进行多层复杂特征提取后存储,并通过机器内部的自身内存而对不同的数据进行分类存储,以便于机器的学习,存储的数据可保存三个月以上,使得数据进行充分的保留,同时也在自动删除前可进行提示,保证数据的安全性,也能够对空间进行清理,使得能够让机器学习新的内容;

S4、数据学习:针对不同的分类数据信息,将数据划分到合适的类别中,根据标签值或目标值建立模型或规则,然后利用这些带有目标值的数据形成的模型或规则,对新数据进行识别或预测其属于监督学习,与监督学习相对是无监督学习,无监督学习不指定目标值或预先无法知道目标值,它可以将把相似或相近的数据划分到相同的组里;

S4中的监督学习为基于输入数据及目标值训练预测模型学习,无监督学习为根据输入聚聚对数据进行分组学习,在S4中数据学习可进行礼貌用语训练、词语内容信息、使用表情训练、类似语句重复度信息、对话时长信息和对大数据进行训练等,礼貌用语为“你好”、“谢谢”、“不客气”等等至少二十种以上的用语,表情训练至少“喜、怒、哀、乐”等十种以上的表情,同时机器可根据无监督与有监督的学习方式,学习多种数据内容以及学习多种的礼貌用语以及表情,从而可有效的提高机器的学习能力以及模仿能力,也能够实现其人机交互的作用,使得商业价值进行提高。

S5、数据储备:将学习后的数据进行储存至机器的内部储存卡内,能够避免发生数据丢失现象;

在S5数据储备中,其存储的数据至少可实现保存三个月以上,并且在自动删除前十二天可进行提示,数据存储采用每隔3S的速度进行存储,使得在对数据压缩时有一定的时间间隙,并在每次存储后进行压缩,从而使得能够实现存储较为多的数据。

S6、预测结果:通过机器内部的智能模块,预测出所存储的数据是否为准确数据,若为错误数据则进行删除,若为正确数据,则进行保存;

在S6预测结果中,其智能模块通过无线连接的方式与外界进行连接,同时数据与智能模块进行对比从而进行判断。

S7、语音影像处理:对采集处理以及存储后的数据进行影像与声音处理,同时采用其内部的智能控制模块实现其语音播放以及影像放映,并利用智能控制模块对其进行运算以及智能对话处理;

在S7中设有查询模块以及人机交互模块,可实现对其内部存储的数据进行查询,实现其快速的对数据处理检索的功能,并通过人机交互模块将检索出的信息通过语音以及影像进行播放,此设置可将机器所学习的内容进行展示,并且通过机器内部设置的语音接收模块,可实现人与机器进行对话并使得机器进行处理,从而有效的检验机器的学习能力。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号