首页> 中文期刊> 《计算机科学与探索 》 >序列数据的数据增强方法综述

序列数据的数据增强方法综述

             

摘要

为了追求精度,深度学习模型框架的结构越来越复杂,网络越来越深.参数量的增加意味着训练模型需要更多的数据.然而人工标注数据的成本是高昂的,且受客观原因所限,实际应用时可能难以获得特定领域的数据,数据不足问题非常常见.数据增强通过人为地生成新的数据增加数据量来缓解这一问题.数据增强方法在计算机视觉领域大放异彩,让人们开始关注类似方法能否应用在序列数据上.除了翻转、裁剪等在时间域进行增强的方法外,也描述了在频率域实现数据增强的方法;除了人们基于经验或知识而设计的方法以外,对一系列基于GAN的通过机器学习模型自动生成数据的方法也进行了详细的论述.介绍了应用在自然语言文本、音频信号和时间序列等多种序列数据上的数据增强方法,亦有涉及它们在医疗诊断、情绪判断等问题上的表现.尽管数据类型不同,但总结了应用在这些类型上的数据增强方法背后的相似的设计思路.以这一思路为线索,梳理应用在各类序列数据类型上的多种数据增强方法,并进行了一定的讨论和展望.

著录项

  • 来源
    《计算机科学与探索 》 |2021年第7期|1207-1219|共13页
  • 作者单位

    通信信息控制和安全技术重点实验室 浙江嘉兴314033;

    中国电子科技集团公司第三十六研究所 浙江嘉兴314033;

    计算机软件新技术国家重点实验室(南京大学) 南京210023;

    计算机软件新技术国家重点实验室(南京大学) 南京210023;

    通信信息控制和安全技术重点实验室 浙江嘉兴314033;

    中国电子科技集团公司第三十六研究所 浙江嘉兴314033;

    计算机软件新技术国家重点实验室(南京大学) 南京210023;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工) ;
  • 关键词

    序列数据; 数据增强; 深度学习;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号