首页> 中文学位 >色谱指纹数据处理算法研究及应用
【6h】

色谱指纹数据处理算法研究及应用

代理获取

目录

声明

摘要

1 绪论

1.1 代谢组学色谱分析技术

1.2 数据挖掘

1.3 本文主要工作

2 代谢组学色谱指纹数据分析技术

2.1 统计学方法

2.2 无监督数据挖掘技术

2.2.1 聚类

2.2.2 主成份分析

2.3 有监督数据挖掘技术

2.3.1 分类

2.3.2 分类器融合

2.3.3 特征选择

2.4 本章小结

3 烟草色谱指纹数据处理算法

3.1 植物代谢组学简介

3.2 研究问题背景介绍

3.3 贵州不同区域烤烟中重要致香成分色谱指纹图谱软件

3.3.1 TDFPAS系统体系结构

3.3.2 TDFPAS系统功能

3.4 数据融合技术去除初烤烟叶年份差异

3.4.1 数据融合技术

3.4.2 DF-SHTLS数据融合算法

3.4.3 样本数据信息

3.4.4 年份差异影响检测

3.4.5 去除年份差异效果对比

3.4.6 分类性能对比

3.4.7 数据融合特征分析

3.5 本章小结

4 数据挖掘算法在时间序列色谱数据分析中的应用

4.1 基于色谱指纹数据的代谢组学时间序列问题简介

4.2 时间序列决策树及随机森林在时间序列问题上的应用

4.2.1 时间序列决策树

4.2.2 时间序列随机森林

4.3 时间序列规律性变化评价指标

4.3.1 时间序列规律性变化度量

4.3.2 时间序列标准化

4.3.3 M-决策树和M-随机森林

4.4 蚕蛹时间序列问题

4.5 分类性能对比

4.6 时间序列变化趋势分析

4.7 本章小结

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

色谱分离检测技术是常用的代谢组学分析技术。通过对样本进行色谱分离检测,可以获取样本的代谢物色谱指纹轮廓,以进行后续的代谢组学分析。由色谱技术可以得到几百甚至上千个代谢物,而所检测的样本通常只有几十个。即代谢组学色谱指纹数据具有高维小样本的特点。如此高的代谢物维度及相对过少的样本,加大了代谢组学色谱指纹数据的分析难度。因此,研究人员引入数据挖掘技术用于处理代谢组学色谱指纹数据。
  对初烤烟叶色谱数据进行分析是植物代谢组学中的一个重要应用。为满足对烟草色谱数据存储和分析的需求,本文开发了一个烟草色谱指纹图谱数据分析系统,并已投入实际应用。同时,数据融合方法常应用于对多个年份中所采集的不同烟草样本的香型品质进行分析。然而,不同年份的生态气候差异会对香型差异造成干扰。为有效融合不同年份的色谱数据,本文提出了一种基于统计假设检验与局部尺度化相结合的数据融合方法。该方法只对受到年份影响的特征进行尺度化处理,去除年份差异的影响。在将该方法应用于对贵州两年的烤烟样本融合处理时,同现有的数据偏移修正融合方法相比,有效地去除了不同年份生态气候导致的差异,使得随机森林和支持向量机对烤烟香型的分类性能均得到了提高。
  本文的另一内容是对代谢组学时间序列色谱数据及时间序列随机森林分类算法进行研究,给出了一种与时间序列规律性变化度量相结合的时间序列随机森林算法。该算法和普通的时间序列随机森林相比,在选择决策树结点分划特征时,同时考虑了特征的区分能力及特征的时间序列变化规律特点。在将该算法应用在家蚕的时间序列分类问题的实验中,验证了该算法比普通时间序列随机森林的优越性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号