首页> 中文期刊>光谱学与光谱分析 >基于WGAN的不均衡太赫兹光谱识别

基于WGAN的不均衡太赫兹光谱识别

     

摘要

物质的太赫兹光谱具有唯一性.目前,结合先进的机器学习方法,研究基于规模光谱数据库的太赫兹光谱识别技术已成为太赫兹应用技术领域的重点.考虑到由于实验条件及实验设备的影响,很难收集到多物质均衡光谱数据,而这又是对太赫兹光谱数据进行分类的基础.针对这一问题,提出一种基于WGAN的不均衡太赫兹光谱识别方法.WGAN作为生成数据的一种新方法,将模型达到纳什均衡条件下的生成数据用来补充数据集,使其达到类别均衡.生成数据可以有效映射真实数据分布,通过将生成数据与真实数据混合训练可以提高识别不均衡光谱数据的准确率.采用三种特征谱较为相似的麦芽糖化合物的太赫兹透射光谱数据进行验证,首先利用S-G滤波和三次样条插值法对三种物质的光谱数据进行归一化处理,然后通过构建WGAN模型对三种物质的不均衡太赫兹光谱数据进行扩展,使其达到类别均衡.实验在同一测试集下进行验证,并利用三组对比实验证明WGAN在不均衡数据集处理中的效果.首先利用WGAN生成数据,随着迭代次数的增加,生成数据逐渐符合真实数据分布.实验结果证明,使用WGAN扩展后的数据集训练SVM模型,可以解决模型在测试集上小样本数据(Maltotriose,Malthexaose)偏向大样本数据(Maltohep-taose)的问题.在将WGAN与传统处理不均衡数据集方法FWSVM和COPY对比后发现,三种分类算法在dataset-1数据集上的训练集准确率都能达到90% 以上.但是由于模型泛化能力的限制,传统方法在测试集上的效果并不是很理想,而使用WGAN后的测试集准确率却能达到91.54%.在不同不均衡度方面,采用不均衡度为16,81和256的数据集进行验证,其三个测试集上的准确率分别为92.08%,91.54% 和90.27%,可满足实际工作中处理不同不均衡度的要求.

著录项

  • 来源
    《光谱学与光谱分析》|2021年第2期|425-429|共5页
  • 作者单位

    昆明理工大学信息工程与自动化学院 云南 昆明 650504;

    昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650504;

    昆明理工大学信息工程与自动化学院 云南 昆明 650504;

    昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650504;

    昆明理工大学信息工程与自动化学院 云南 昆明 650504;

    昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650504;

    昆明理工大学信息工程与自动化学院 云南 昆明 650504;

    昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650504;

    昆明理工大学信息工程与自动化学院 云南 昆明 650504;

    昆明理工大学云南省计算机技术应用重点实验室 云南 昆明 650504;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 各类光谱;
  • 关键词

    太赫兹光谱; WGAN; 不均衡数据; 机器学习;

  • 入库时间 2022-08-20 00:17:27

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号