数据增强
数据增强的相关文献在1999年到2023年内共计1430篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文552篇、会议论文2篇、专利文献656046篇;相关期刊289种,包括计算机工程、计算机工程与设计、计算机工程与应用等;
相关会议2种,包括香山科学会议第S42次学术会议、2020中国网络安全等级保护和关键信息基础设施保护大会等;数据增强的相关文献由4583位作者贡献,包括余正涛、俞凯、王帅等。
数据增强—发文量
专利文献>
论文:656046篇
占比:99.92%
总计:656600篇
数据增强
-研究学者
- 余正涛
- 俞凯
- 王帅
- 不公告发明人
- 张伟
- 李峰
- 胡海根
- 钱彦旻
- 陈又新
- 傅伟
- 刘红丽
- 周乾伟
- 庞建新
- 张勇
- 张磊
- 张鑫
- 朱晓慧
- 李程启
- 林颖
- 管秋
- 翟懿奎
- 舒畅
- 郑文杰
- 钱丽萍
- 陈天泽
- 陈浩
- 陈胜勇
- 陈龙
- 鲁统伟
- 刘业政
- 刘洋
- 周镇镇
- 姜元春
- 孔祥勇
- 孙哲
- 孙春华
- 孙晓
- 孙见山
- 应自炉
- 张云峰
- 张志文
- 张民
- 张睿
- 曾军英
- 朱婷婷
- 李伟
- 李思
- 李杰
- 李涛
- 李超
-
-
姜杉;
张红运;
杨志永;
张国彬
-
-
摘要:
三维肺部电子计算机断层扫描(computed tomography,CT)图像非刚性配准是医学图像配准领域中最重要的任务之一.但是,肺部组织受呼吸运动影响而产生的非线性形变与大尺度位移给三维肺部CT图像的非刚性配准带来巨大挑战.针对这一难题,设计开发了一种基于无监督学习端到端的配准方法.通过改进现有U-Net神经网络结构,在跳接之间引入Inception模块,充分融合多尺度深层特征生成高精度的稠密位移向量场.为保证位移向量场光滑,在损失函数中加入雅可比正则化项,以达到训练中显式惩罚位移向量场中奇点的目的.另外,为缓解现有公开数据资源有限导致的过拟合问题,提出了一种基于三维薄板样条(3D-thin plate spline,3D-TPS)变换的数据增强方法实现对训练数据的扩充,将具有60套三维肺部CT图像的训练数据集EMPIRE10扩充为6060套以满足卷积神经网络训练的需要.设计验证实验,通过与基于学习的Voxelmorph方法和两个包含传统方法配准工具包ANTs和Elastix进行比较.实验结果表明:在公开可用的DIR-Lab 4 DCT数据集上,所提出的方法在目标配准误差(target registra-tion error,TRE)上达到次优的2.09 mm,平均Dice得分达到最优的0.987,同时所生成的扭曲图像中几乎不存在折叠体素.
-
-
孙继璜;
张义博;
何志勇;
林嵩;
肖亚峰
-
-
摘要:
通过实验研究提出一种基于残差网络的钢板表面缺陷分类方法,以实现钢板表面缺陷准确分类。采用东北大学热轧钢带缺陷数据库,结合数据增强技术,共获得2160张样本图像。以残差网络为基准,改进残差块下采样的位置,同时在最后一层卷积层后连接2层全连接层,结合基于差异的领域自适应方法,提高模型的泛化性并大大减少模型的训练时长。实验结果表明,改进后的模型综合性能最好,在钢板表面缺陷检测上准确率可达99.9%。该模型支持钢板表面缺陷分类,具有良好的实际应用性。
-
-
赵聪
-
-
摘要:
针对太赫兹时域光谱数据匮乏导致基于深度学习算法的太赫兹时域光谱识别准确率较低的问题,提出了一种基于改进ACGAN样本增强的太赫兹时域光谱隐匿危险品识别方法。改进ACGAN在生成器中引入残差单元,以提高生成高保真的数据。在判别器中加入长短时记忆网络提高判别数据真伪的能力。实验首先采用反射型太赫兹光谱仪系统测量酒精、煤油、食用油、乳香油、松节油、松香油、樟脑油等7类易燃易爆液体的太赫兹时域光谱数据共1260条并喂入深度学习分类模型进行训练;随后将增强后的数据集分别注入训练好的分类模型,对识别精度指标进行分析测试,并与ACGAN和Mixup进行实验对比。使用改进ACGAN对原始样本增强扩充后ResNet、CNN、FCN和MLP分类模型的识别准确率分别提高了1.4%、1.63%、0.96%、1.07%,比ACGAN、Mixup提升的幅度更高。结果表明,改进ACGAN能够有效改善训练样本不足的问题,提高模型识别精度。
-
-
王天;
刘兆英;
张婷;
刘博文;
李玉鑑
-
-
摘要:
在时间序列分类任务中,针对时间序列数据少和多样性导致深度学习模型准确率不高的问题,提出Mixup数据增强的长短期记忆网络–全卷积网络(LSTM-FCN)时间序列分类算法。该算法首先使用Mixup对原始数据进行数据增强,通过简单的线性插值对时序数据进行混合,得到新的混合之后的增强数据;然后使用增强数据训练LSTM-FCN,并进行分类。在30个UCRArchive2018数据集上的实验结果表明,使用Mixup数据增强的LSTM-FCN在26数据集上取得了比LSTM-FCN好的分类准确率,最高提高了4.79%。实验结果说明了本文方法可以提高深度学习模型的分类准确率。
-
-
朱傥;
杨忠;
周国兴;
张驰;
韩家明
-
-
摘要:
针对算力有限的移动和嵌入式平台,提出了一种基于深度学习的轻量化火焰烟雾检测算法。利用数据增强来解决数据量较少的问题,使用one-stage目标检测方法中的YOLOv4作为火焰烟雾检测的模型框架,采用轻量化神经网络MobileNetV3替换YOLOv4的原主干特征提取网络,减少了模型参数量;再采用深度可分离卷积替换掉YOLOv4中的标准卷积块,进一步在加强特征提取网络和预测层减少了参数量;最后对空间金字塔池化部分进行改进,减少背景干扰带来的影响,减少最大池化导致的部分有用特征信息丢失。在该数据集上通过与原网络模型和其他主流目标检测方法进行对比分析,结果表明提出的轻量化网络不但保留了原模型精度,还大大减小了网络的训练参数量,提高了运行速度,更有利于模型搭载在摄像头等嵌入式设备上,实现火焰和烟雾的实时检测。
-
-
孙建波;
张叶;
常旭岭
-
-
摘要:
针对辅助驾驶或自动驾驶领域车载图像的车辆压线检测问题,以及检测过程中由于欠曝、阴影或实体遮挡等因素导致的漏检、误检问题,提出基于改进Mask R-CNN与LaneNet的车辆压线检测算法。在网络优化方面,在Mask RCNN网络的基础上将RoI Align层的图像缩放算法(双线性插值)改进为双三次插值,将全连接层卷积化的VGG16网络取代LaneNet的E-Net共享解码器;在图像增强方面,改进Gamma校正算法以实现欠曝图像的自动校正;在训练数据方面,完成Tusimple数据集中车辆目标的标注并基于改进的随机擦除算法在网络训练过程中进行数据增强。实验结果表明:车辆检测速度保持不变的同时车道线检测速度提升了28%,车辆漏检率、误检率分别降低了38.93%,89.04%,车道线漏检率、误检率分别降低了67.21%,87.05%,算法的性能指标可满足车辆压线判断的应用需求。
-
-
周强;
王彦华;
宋益恒;
李阳
-
-
摘要:
在雷达自动目标识别(RATR)中,数据驱动方法是强有力的工具之一。然而数据驱动方法的性能十分依赖数据集的质量,数据增强方法通过扩充数据集,能够提升数据驱动模型在现有数据集上的识别率。本文提出了用于高分辨距离像(HRRP)数据生成的一维基础生成对抗网络(BGAN)结构和条件生成对抗网络(CGAN)结构,并利用生成的人工样本补充不完备数据集完成了数据增强。实验表明,本文所提出的两种网络均能有效提升目标识别的准确率,提升效果优于传统的平移和镜像增强方法。基于BGAN的HRRP数据增强方法提升效果最优,但其模型时间与空间复杂度较高;基于CGAN的数据增强方法能够在保证识别率提升的同时降低模型的时间与空间复杂度,具有较高的应用前景。
-
-
李平;
郑颖;
冯继克;
李艳翠;
马玉琨
-
-
摘要:
小麦是我国的重要粮食作物,小麦籽粒识别和分类是谷物质量评估的重要任务.小麦在视觉上的表现因为角度不同而差别较大,为精确提取小麦特征,在已有数据集构建方法基础上采用同一小麦籽粒多幅图片,增加了分角度处理,基于小麦籽粒腹沟向上、腹沟向下和腹沟朝前3个角度构建了分角度小麦籽粒品种图片库.首先采集黄淮麦区种植面积较大的6个小麦品种各1000粒,分别拍摄每粒小麦,对所有图片进行自动更名和预处理得到包含18000张图片的分角度小麦籽粒分类数据库.为验证分角度数据采集的合理性,采用VGG16网络进行小麦籽粒识别,实验结果中角度统一后识别效果较好,特别腹沟朝前角度性能优于其他两个角度,数据增强后其准确率可达98.7%,优于角度混合数据集的识别准确率.实验结果表明,构建的多幅同一小麦籽粒图片分角度小麦籽粒分类数据库有助于分类模型更准确地提取小麦籽粒特征,避免了已有数据集中采集角度不统一造成的特征干扰问题,以较少数据量获得较高识别率,提高了品种识别的兼容性和准确性.
-
-
宋春宁;
盛勇;
宁正高
-
-
摘要:
在脑电(EEG)信号分析方法中,时频分析方法综合考虑了信号的时间与频率两者的分辨率,同时改善了单纯时间域或频率域分析方法的短板。本实验使用S变换代替短时傅里叶变换将左右手运动想象脑电信号转换为二维时频图像形式,然后构建卷积神经网络-极限学习机(CNN-ELM)模型进行分类。在面对小样本训练数据时模型能力受到限制,提出一种数据增强方法,通过ACGAN对时频图像进行生成,有效丰富了训练样本数量。实验结果表明:CNN-ELM模型识别效果好,泛化能力强,进行数据增强后识别正确率得到了进一步的提升。
-
-
王超;
张运楚;
孙绍涵;
张汉元
-
-
摘要:
钢筋是基建行业不可或缺的结构材料,无论是钢筋生产过程、还是施工现场,对钢筋进行准确计数是必不可少的环节.成捆钢筋存在端面密集、直径尺度不统一、端面边界粘连、端面与背景融合、端面之间存在遮挡等问题.针对上述问题,提出了一种改进的YOLOv5模型框架,以降低密集小目标漏检率、误检率.针对钢筋端面数据集稀缺、没有公开的大型数据集并且钢筋端面特征较弱的问题,自建了钢筋端面数据集,使用半自动标注法对数据集进行标注,并采用数据增强算法对钢筋端面数据集进行扩充.修改了YOLOv5中的主干网络,增加空间金字塔池(spatial pyramid pooling,SPP)和小目标检测层,以获取更大的特征图;使用特征金字塔模型(feature pyramid network,FPN)和路径聚合网络(path aggregation network,PAN)对多尺度特征图融合,提高密集小目标检测精度.在Data Fountain钢筋盘点竞赛数据集和自建钢筋数据集上设计了多组对照试验.实验结果表明,提出的改进算法YOLOv5-P2模型对钢筋端面的检测效果最佳,钢筋端面平均精度均值(mean average precision,mAP)达到了99.9%,相比于YOLOv3、YOLOv4、ScaledYOLOv4以及YOLOv5主流算法,模型的mAP分别提升了9.6%、7.9%、7.0%、1.1%,在工厂真实环境条件下进行测试时都有较稳定的表现,在测试集上相对于原始模型检测精度提升了2.1%.通过修改YOLOv5的主干网络中SPP模块位置和增加检测层都能够显著提升密集小目标检测精度,更好的提取到钢筋端面的边缘特征,取得99.9%的平均精度均值.