首页> 中国专利> 基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法

基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法

摘要

本发明涉及一种基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法,属于数据增强领域。将实验测得的多扑动周期水动力数据切片,并通过深度学习方法扩充每组切片数据至相同数据长度,在不引入大量重复数据的前提下,有效扩充数据集大小,提高预测结果的准确性。

著录项

  • 公开/公告号CN115238763A

    专利类型发明专利

  • 公开/公告日2022-10-25

    原文格式PDF

  • 申请/专利权人 西北工业大学;

    申请/专利号CN202210651683.1

  • 发明设计人 黄桥高;白靖宜;何幸;潘光;

    申请日2022-06-10

  • 分类号G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);

  • 代理机构西安凯多思知识产权代理事务所(普通合伙) 61290;

  • 代理人刘新琼

  • 地址 710072 陕西省西安市友谊西路127号

  • 入库时间 2023-06-19 17:25:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-11

    实质审查的生效 IPC(主分类):G06K 9/62 专利申请号:2022106516831 申请日:20220610

    实质审查的生效

说明书

技术领域

本发明属于数据增强领域,具体涉及一种基于深度学习的仿蝠鲼航行器周期性实验数据增强方法。

背景技术

传统螺旋桨推进水下航行器运行噪声大、机动性不强,而研究发现水中蝠鲼等鳐科生物的对鳍拍动运动具有低噪声,高效率、高机动性的特点,因此研究人员开始大力投入仿蝠鲼航行器的研究。仿蝠鲼航行器的精确控制需要对航行器的各种扑动姿态进行水动力实验,运动姿态的控制通常涉及左右振幅频率,相位等多个参数组合。由于实验的时间与人力成本限制,对所有参数变化进行精细的组合实验较为困难。因此需要通过有限的实验数据,对未经过实验的插值输入数据结果进行拟合。

深度学习是一种是基于数据样本,进行特征识别、规律探索及数据回归的算法,在数据的插值预测方面也被广泛使用。但深度学习需要较大规模的原始数据集,如经典的mnist手写数字数据集具有60000个训练集与10000个验证集。而仿生航行器水动力获得的输入标签与测试数据组合通常不会超过数百组,这对于深度学习神经网络训练是远远不够的,训练过小的数据集会造成过拟合,即神经网络过度贴近喂入的数据,而无法拟合其它未训练数据。因此,需要对原数据进行数据增强操作,扩充数据集中的数据量,以提高深度学习模型的可迁移性。

数据增强是目标检测乃至整个深度学习中常用到的提高模型性能的方法,主要用于扩充训练数据集,让数据集尽可能的多样化,使得训练的模型具有更强的泛化能力。传统的数据增强方法分为高维数据(图片)与一维数据(声波)两种方面。针对图片数据,通常有翻转、裁剪、缩放、噪声、模糊等方式将一张图片变为不同风格进行增强;针对声波数据,通常有加权中心平均、移动窗口切片、伸缩片段切片、对抗神经网络等方法将一个长数据变为多个不同片段数据进行增强。仿生航行器因其周期性扑动的特点,其实验数据在一维数据的基础上,具有周期性变化特点。因此基于此特点,本发明提出了一种更适合其实验数据结构的数据增强方法。

公开号为CN109726195A的专利《一种数据增强方法及装置》中,提出一种用于多维时序数据的数据扩充方法,加权计算非主要特征数据,并结合主特征数据生产增强数据。该方法的不足之处在于,需要大量的人力进行主要与非主要数据的区分,可操作性不强。

发明内容

要解决的技术问题

为了避免现有技术的不足之处,本发明提供一种基于深度学习的仿生航行器多周期水动力实验数据增强方法,将实验测得的多扑动周期水动力数据切片,并通过深度学习方法扩充每组切片数据至相同数据长度,在不引入大量重复数据的前提下,有效扩充数据集大小,提高预测结果的准确性。

技术方案

一种基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法,其特征在于步骤如下:

步骤1:数据获取

通过仿生航行器水动力实验测得不同输入标签对应的样机周期性变化的六维力时间序列数据;所述输入标签为左振幅、右振幅、频率、相位差;

步骤2:数据切片

从每个循环周期的初始位置截取一个整周期数据;

步骤3:数据扩充

将每个截取的单周期数据均按前6个数为训练集,后4个数为验证集循环切片,输入深度学习神经网络中,训练神经网络;

步骤4:数据扩充

将每组数据的最后6个数字作为测试集,输入训练好的神经网络;随后将预测结果的第一个数字补至原测试集末尾,并删除原测试集的第一个数,作为新测试集;循环该过程,将单周期数据扩充至需要的数据长度;

步骤5:引入噪声

通过随机数引入随机噪声,与长度扩充后的数据集合并。

本发明进一步的技术方案:所述步骤1中,实验数据由仿蝠鲼航行器水动力实验获得,实验通过对仿蝠鲼航行器设置不同的运动参数组合,由仿蝠鲼航行器内六维力传感器测得展向、弦向及铅垂方向的仿蝠鲼航行器所受力与力矩随时间变化的序列数据。

本发明进一步的技术方案:所述步骤2中,数据切片方法为从每组数据的周期开始处截取一个整周期的数据,并将截取的数据与实验输入运动参数一一对应;由于每组数据对应的航行器扑动频率不同,所获初始切片的序列长度不同。

本发明进一步的技术方案:所述步骤3中数据集的截取方法具体为:将一组切片得到的序列数据的每个数据为起点,分别向后截取10个数字;在每组的10个数字中,将前6个数据与后4个数据分别划分;所有前6个数据的集合设置为神经网络训练的输入参数,后4个数据的集合设置为神经网络训练的输出参数;将输入与输出参数一一对应后,分别制作为张量数组;随机打乱对应的输入输出张量,并将打乱后的数组按9:1的比例划分训练集与验证集,以进行深度学习神经网络的训练。通过程序对每个序列进行此步骤,并分别喂入神经网络进行训练与预测。

本发明进一步的技术方案:所述步骤3神经网络为长短期记忆神经网络,长短期记忆神经网络包括三层:第一层包括20个记忆体,第二层包括50个记忆体,第三层包括1个记忆体;每层神经网络激活函数均设置为tanh;每层神经网络的输出均设置返回序列选项为布尔值真。

本发明进一步的技术方案:所述步骤4的数据扩充方法具体为:将未打乱数据集的最后一组数据的前6个数组成的数组作为输入,输入训练好的神经网络,可输出一组长度为4的一维数组;将输出数组的第一个数字补在输入数组的最后,并删除输入数组的第一个数字,形成新的输入数组喂入神经网络,获得第二组输出数组;循环该过程,不断将输出数据弥补至序列末尾,将单周期序列扩充至需要的数据长度。

本发明进一步的技术方案:所述步骤5中的噪声指五组均值为0,标准偏差为1的随机数序列;该序列长度与扩充后数据长度相同,将扩充后数组分别与每组噪声数组相加,即得到最终数据增强后的仿蝠鲼航行器水动力实验结果数据集。

有益效果

本发明提出的一种基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法,首先,可以有效对仿蝠鲼航行器实验结果数据的数据量进行扩充,视实验测得的拍动周期数,可扩充数据量至原工况数的50-100倍。其次,在数据扩充的过程中不会在数据序列中引入大量重复数据,提高了数据集的可靠性。较大的数据集可以有效防止后续实验结果预测时的过拟合现象,有效提高了神经网络模型的可迁移性与预测准确性。最后,对比专利CN109726195A提到的加权数据扩充方法,该方法不需要大量的人工分类数据操作,可以通过程序按梯度和阈值直接切分数据,操作更简便。

附图说明

附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。

图1为本发明获得数据的实验装置示意图;

图2为本发明实验测得的周期性水动力数据示意图;

图3为本发明的数据增强方法整体流程图;

图4为本发明增强后数据与原数据对比;

图5为本发明数据增强后扑动参数对应实验数据的预测流程图;

图6为本发明方法增强后数据集的预测效果;

图7为本发明数据增强后数据集与原数据集训练过程中验证集损失函数对比;

图8为本发明数据增强后数据集与原数据集验证集可视化结果对比(左:用原始数据集训练;右:用增强后数据集训练)。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。此外,下面描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

结合附图1、2说明该数据增强方法的原数据集结构。一种基于深度学习的仿蝠鲼航行器多周期水动力实验数据增强方法,其原周期性时间序列数据集由仿蝠鲼航行器中搭载的六维力传感器测得,具体包括展向、弦向及铅垂方向受力与力矩随时间的周期性变化数据。一组实验数据通常包括10个左右整周期,同时由于拍动频率不同,每组数据的周期长度有差异。

结合附图3、4说明该数据增强方法的具体操作过程:首先从每组数据的周期开始处截取一个整周期的数据。其次,将一组单周期数据的每个数字划为起点,分别向后截取10个数字。第三,将每组的前6个数据与后4个数据分别划分,将数据一一对应,并分别制作前6个与后4个数据的张量数组。第四,在保持一一对应关系的基础上,随机打乱步骤三得到的张量数组,并将前6个数组合的数组作为神经网络的输入张量,后4个数组合作为输出张量。第五,将打乱后的数组按9:1的比例划分训练集与验证集,以进行深度学习神经网络的训练。并对每个序列进行此步骤,并分别喂入神经网络进行训练。第六,将未打乱数据集的第一组数据的前6个数组成的数组作为输入,喂入训练好的神经网络,输出一组形状为(4,)的一维数组。第七,将输出数组的第一个数字补在输入数组末尾,并删除输入数组的第一个数字,形成新的输入数组喂入神经网络。不断循环该过程,将单周期序列扩充至需要的数据长度。最后,将五组均值为0,标准偏差为1的随机数噪声序列分别与扩充后的实验数据相加,得到最终增强后的数据集。

结合附图2、5、6说明该数据增强方法对预测结果的影响:以10个扑动周期的原数据集为例,假设原实验仅测得50组工况,通过以上数据增强方法,共可获得50*10*5=2500组可用于神经网络训练的数据集。将增强后数据集喂入附图5的用于实验数据预测的神经网络中,可以有效抑制模型的过拟合。最终预测结果如图6,预测数据基本可以准确拟合原数据集。

由图7、图8可以看出原数据集由于数据量小,在后续的水动力数据预测中,数据拟合速度高于本发明数据增强后数据集。但2000训练步后,原数据集会出现过拟合现象,即神经网络模型过度拟合训练集中的数据,模型的迁移泛化能力降低。而增强后的数据集在验证集上的表现一直十分稳定,表明该发明的数据增强方法能有效改善后续预测中的过拟合问题。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明公开的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号