首页> 中文会议>第21届全国色谱学术报告会 >基于相关性组合变量的色谱数据分析方法

基于相关性组合变量的色谱数据分析方法

摘要

色谱作为一种分离和分析技术,由于其分离效率高、速度快、灵敏度高等特点,在分析化学、蛋白组学、代谢组学、石油化工以及医药卫生等领域有着广泛的应用.基于色谱技术的生物化学等数据通常维数较高,包含噪音,如何从色谱大数据中挖掘出富含信息的特征,是色谱技术应用研究的一个关键问题.主成分分析(PCA)、偏最小二乘法判别分析(PLS-DA)、SVM-RFE,随机森林(Random forest)等数据分析方法大量应用于色谱数据分析,滤去其中的噪音和无关变量,筛选富含信息的特征变量,建立有效的分类模型。在实际应用中,特征变量存在着相互关联,单一的、不含信息的特征变量相互关联,组合起来表征所研究的问题。因此,本文提出基于相关性特征和最大信息系数的特征选择算法(MICCOR),该算法采用线性相关构建特征的组合方式,扩大信息搜索空间,同时采用最大信息系数[2]评价原始变量和所构建的基于相关性的组合变量,选择富含信息的特征变量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号