首页> 中文期刊> 《光谱学与光谱分析》 >基于半监督模式的恒星光谱自动分类方法

基于半监督模式的恒星光谱自动分类方法

         

摘要

随着越来越多的大型光谱巡天计划的实施,产生了海量的恒星光谱数据,这对于恒星演化理论的研究具有重大意义,但也给传统的光谱分类和处理带来极大挑战。2021年发布的LAMOST DR7(v2.0版本)光谱数据集中,恒星光谱总量为百万量级,但其中O型星的数量仅为129条,远远小于其他六类恒星光谱数量。对于这种数据量大、数据集严重不平衡的情况,传统的机器学习分类方法达不到较好的效果,因此多用于对相邻两类、部分类或子类恒星光谱进行分类。针对以上问题,使用一维卷积神经网络(CNN)和一维生成对抗网络(GAN)相结合的半监督学习模式对七类恒星光谱进行全分类。实验首先对每条光谱进行裁剪和去噪,截取光谱波长范围为370.00~867.16 nm部分,然后进行均匀采样和归一化,生成大小为1×3700的数据集样本,送入CNN进行训练。为了避免过拟合并提高模型对未知数据的预测能力,在CNN的全连接层和池化层之间添加正则项Dropout。使用该网络对除O型星以外的六类光谱进行分类,平均分类准确率达到98.08%。针对O型星数量严重偏少的问题,采用GAN来扩充数据集。GAN的输入是1×900大小的噪声信号,经过生成器中全连接的三层跨步卷积运算,输出大小为1×3700的数据。通过对生成器和判别器进行单独交替迭代训练使GAN收敛,最终输出所需数量的O型星样本,达到扩充数据集的目的。和常见的通过过采样扩充数据集相比,利用GAN扩充数据集,结合一维CNN对恒星光谱进行全分类,可以将O型星的分类准确率由72.92%提升至97.92%,整个分类器的准确率达到96.28%。实验结果表明,使用这种半监督模式的恒星光谱自动分类方法可以实现对七类恒星光谱的快速、准确分类,也可以用于对标记为“Unknown”的未分类恒星光谱进行挖掘,达到充分利用光谱的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号