首页> 中文学位 >聚类方法在生物数据中的研究与应用-基因表达数据聚类方法研究
【6h】

聚类方法在生物数据中的研究与应用-基因表达数据聚类方法研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1生物信息学简介

1.1.1生物信息学的起源

1.1.2生物信息学的定义和目标

1.2基因芯片技术简介

1.2.1基因芯片技术的产生和原理

1.2.2基因芯片技术的研究现状

1.2.3基因芯片技术的意义

1.3本文的主要工作及结构安排

第二章基因表达数据分析与常用聚类方法

2.1引言

2.2基因表达数据分析

2.2.1基因表达数据的获得和表示

2.2.2基因表达数据的预处理

2.3聚类分析

2.3.1聚类分析的定义和分类

2.3.2相似性度量

2.3.3基因表达数据聚类分析的意义

2.4几种常用的聚类算法

2.4.1层次聚类算法

2.4.2 K-均值聚类算法

2.4.3自组织映射聚类算法

2.5基因表达数据集

2.5.1鼠中央神经系统发育数据集

2.5.2酵母GAL数据集

2.5.3酵母细胞周期数据集

第三章基于群智能的基因表达数据聚类算法

3.1引言

3.2基因表达数据聚类分析的研究进展

3.2.1基于基因的聚类方法

3.2.2基于样本的聚类方法

3.2.3两路聚类方法

3.2.4小结

3.3遗传K-均值基因表达数据聚类算法

3.3.1算法介绍

3.3.2实验结果与分析

3.4基于QPSO的基因表达数据聚类算法

3.4.1 QPSO算法

3.4.2基于OPSO的基因表达数据聚类算法

3.4.3基因表达数据集

3.4.4实验结果

3.4.5小结

3.5本章小结

第四章基因表达数据聚类算法的外部评价和参数选择

4.1引言

4.2聚类方法结果的外部评价

4.2.1 Rand指数和校正Rand指数的定义和计算

4.3四种聚类算法对相似度和数据转换方式的选择

4.3.1层次聚类对相似度和预处理方法的选择

4.3.2 K-均值聚类对相似度和预处理方法的选择

4.3.3 SOMs聚类对相似度和预处理方法的选择

4.3.4 OPSO聚类对相似度和预处理方法的选择

4.4标准化对数转换

4.5本章小结

第五章基因表达数据聚类方法的内部确认

5.1引言

5.2内部确认的定义和分类

5.3基因表达数据聚类方法的内部确认

5.3.1 FOM方法的基本思想

5.3.2 FOM与aFOM方法的定义与计算

5.3.3算法验证

5.3.4讨论

5.4本章小结

第六章总结与展望

6.1总结

6.2展望

致谢

参考文献

附录:作者在攻读硕士学位期间发表的论文

展开▼

摘要

基因芯片技术的迅速发展产生了海量的基因表达数据。如何分析和处理这些数据,从中提取出有意义的生物学信息,已经成为后基因组时代的研究热点。聚类方法是目前基因表达分析研究的主要计算技术之一,能将功能相关的基因按表达谱的相似程度归纳成共同表达的类别,有助于对基因功能、基因调控、细胞过程以及细胞亚型等进行综合的研究。目前,已有多种聚类方法被应用到基因表达数据分析之中,在取得了大量成果的同时也出现了一些问题。本文即围绕聚类方法在基因表达数据中的研究与应用开展各项研究工作。 本文首先依次介绍了生物信息学和基因芯片技术,从而引出基因表达数据,然后介绍了基因表达数据分析的基本内容和几种常用的聚类算法,包括四种层次聚类算法,K-均值聚类算法以及SOMs聚类算法,并在章节的末尾给出了四个具有外部标准的基因表达数据集。接着本文对基于群智能的基因表达数据聚类算法进行了深入的研究,先阐述了近几年来聚类算法在基因表达数据上的研究进展,接着介绍了遗传K-均值聚类算法,最后重点提出了一种新的基因表达数据聚类算法--基于QPSO的基因表达数据聚类算法,然后使用前文提到的数据集进行了大量实验。实验结果表明,基于QPSO的基因聚类算法具有良好的性能。然后在后续的章节中研究了基因表达数据聚类算法的外部评价和参数选择,介绍了rand指数并对前面提到的几种聚类算法关于相似度和数据转换方式的选择进行了探讨。最后介绍了聚类算法结果的内部确认技术并运用FOM方法对前文提及的相关基因表达数据聚类算法进行了验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号