基于互信息的变量选择方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

现代分析仪器的产生及计算机技术的进步，极大地促进了分析化学和生命科学的研究和发展。如今，我们能够通过含有成千上万个分析通道（如基因芯片，质谱的质荷比和近红外光谱、拉曼光谱等的波长）的仪器来获取实验样本的相关数据。然而，这也意味着我们将要面临一个新的难题，如何从这些庞大的数据集里挑选出有信息的变量，并建立起相应的分析识别模型？
　　为此，本文提出了一个新的变量选择方法，即MPA-MMIFS，它以交互信息为基础并结合了模型集群分析(Model Population Analysis，MPA)的概念，使得样本集中待选变量与样本类型的互信息最大，且与已选变量的互信息最小。此外，我们还引入了偏最小二乘线性判别分析(Partial Least Squares Linear Discriminant Analysis, PLS-LDA)的回归系数来调整变量的重要性。为了对我们提出的方法进行测试，我们选取了3个实际生活中的数据集（Estrogen基因表达数据，Ⅱ型糖尿病代谢数据与近红外数据食用醋分类数据）来进行变量筛选和样本建模，并同时采用了交叉验证法(Cross Validation，CV)和双交叉验证法(Double Cross Validation，DCV)来对模型进行评价。
　　通过与其他变量选择方法（MIFS、MMIFS和GA）的比较，其结果表明，我们提出的基于模型集群分析方法在这三个具有不同性质的数据上均表现出不同程度的优势。以Estrogen数据为例，其留一交互检验预测准确率为100％，且利用其选出的仅5个基因做主成分分析，就能得到两类样本非常明显的分类趋势。

著录项

作者
龙旭霞;
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科化学
授予学位硕士
导师姓名梁逸曾;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类分析化学基础理论;
关键词
变量选择; 交互信息; 模型集群分析; 回归系数;

相似文献

中文文献
外文文献
专利

1. 基于互信息变量选择与LSTM的电站锅炉NOx排放动态预测 [J] . 杨国田 ,王英男 ,李新利 . 华北电力大学学报(自然科学版) . 2020,第003期
2. 基于互信息的变量选择方法 [J] . 周生彬 ,黄叶金 . 统计与决策 . 2020,第1期
3. 基于条件互信息的NOx生成量模型变量-时滞联合选择方法 [J] . 刘长良 ,张丛 ,王梓齐 . 华北电力大学学报(自然科学版) . 2019,第006期
4. 基于互信息变量选择的SCR烟气脱硝系统非线性自回归神经网络建模 [J] . 赵文杰 ,张楷 . 热力发电 . 2018,第009期
5. 基于互信息和随机森林的混合变量选择算法 [J] . 赵伟卫 ,李艳颖 ,赵风芹 . 吉林大学学报（理学版） . 2017,第004期
6. 基于互信息的软测量变量选择 [C] . 杨慧中 ,章军 ,陶洪峰 . 第23届过程控制会议 . 2012
7. 基于互信息变量选择的热工过程数据建模 [A] . 褚福常 . 2018

基于互信息的变量选择方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅