首页> 中文期刊>天文学报 >基于堆叠降噪自编码的恒星/星系分类研究∗

基于堆叠降噪自编码的恒星/星系分类研究∗

     

摘要

近年来,深度学习算法以其适应性强、准确率高、结构复杂等特性在数据挖掘算法中异军突起,但是在天文信息学中深度学习算法还鲜有问津。针对斯隆数字巡天(Sloan Digital Sky Survey, SDSS)恒星/星系分类中普遍存在的亮源集分类正确率高但暗源集分类正确率低等问题,引入了深度学习中较新的研究成果—堆叠降噪自编码(stacked denoising autoencoders, SDA)神经网络和dropout微调技术。从SDSS释放出的带有光谱证认(spectroscopic measurements)的测光数据中分别随机抽取DR7(Data Release 7)和DR12(Data Release 12)的亮源集和暗源集并对其进行预处理,再分别对它们的亮源集和暗源集做不放回随机抽样,得到它们亮源和暗源的训练集和测试集。最后用这些训练集分别训练得到了DR7和DR12亮源和暗源的SDA模型,并将SDA在DR12测试集上的测试结果与支持向量机软件包(Library for Support Vector Machines, LibSVM)、J48决策树(J48)、逻辑模型树(Logistic Model Trees, LMT)、支持向量机(Support Vector Machine, SVM)、逻辑回归(Logistic Regression)、单层决策树算法(Decision Stump)上的测试结果进行比较,同时将SDA在DR7测试集上的测试结果与6种决策树的测试结果进行比较。仿真表明SDA在SDSS-DR7和最新SDSS-DR12的暗源集上的分类性能明显优于其他算法,尤其是在使用完备函数(completeness function, CP)作为衡量指标时, SDA相比决策树算法在SDSS-DR7暗源集正确率提高了15%左右。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号