首页> 中文学位 >一种用于挖掘基因表达数据的动态聚类算法
【6h】

一种用于挖掘基因表达数据的动态聚类算法

代理获取

目录

文摘

英文文摘

第1章引言

1.1背景

1.2研究内容及意义

1.3组织结构

第2章数据挖掘及聚类分析概述

2.1数据挖掘

2.2聚类分析

第3章基因表达谱及聚类分析

3.1微阵列及基因表达谱

3.2基因表达数据预处理

3.3基因表达数据相似度

3.4基因表达分析中的聚类技术

3.5存在的问题

第4章新的动态聚类算法

4.1原始数据集预处理

4.2聚类算法

第5章实验分析与验证

5.1实验数据样本

5.2实验环境

5.3实验及结果分析

5.4生物学验证

第6章总结及进一步的研究工作

6.1总结

6.2进一步的研究工作

参考文献

致谢

论文原创性声明

展开▼

摘要

为了揭示基因表达数据中所蕴含的信息,许多数据挖掘的技术被广泛的应用于基因表达数据的研究上来。由于基因表达数据量的庞大以及生物信息网络的复杂性,数据挖掘技术中的聚类分析技术被认为是一种非常有效的分析基因表达数据的方法。本文的目标就是提出一种新的用于挖掘基因表达数据的快速有效的聚类分析算法。  本文首先探讨了数据挖掘的基本特征、主要的数据挖掘技术、聚类技术的基本概念以及主要的聚类分析算法。在此基础上着重介绍了聚类技术在基因表达数据研究上的应用。其中,重点描述了两种普遍采用的聚类算法:K-平均值算法和层次聚类算法,并分析了这两种算法存在的问题。  本文提出一种新的动态聚类分析算法。在基因表达数据集预处理方面,采用一种基于主成分分析的方法,对数据集进行特征提取,从而有效的将原始数据集从高维度的特征空间转换到低维度的特征空间。在低维度的数据集上,探讨一种动态的聚类算法,依据贡献率的顺序,通过不断的对聚类进行拆分和合并操作,以达到最佳的聚类效果。最后,应用新算法分析和处理实际的实验数据,并与K-平均值聚类算法处理的结果进行对比,说明新算法的有效性。同时从生物学的角度对新算法进行验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号