首页> 中文学位 >基于基因表达微阵列数据集的加权双向聚类算法研究
【6h】

基于基因表达微阵列数据集的加权双向聚类算法研究

代理获取

目录

摘要

第1章 绪论

1.1 课题的研究背景及意义

1.2 国内外的研究现状

1.3 本文研究的内容和结构

第2章 基因生成网络

2.1 常见的基因生成网络方法

2.1.1 基于原始数据的基因生成网络

2.1.2 基于表达数据的基因生成网络

2.1.3 小结

2.2 最小生成森林法

2.2.1 Chow-Liu树

2.2.2 最小生成森林法

2.3 本章小结

第3章 加权双向聚类算法

3.1 双向聚类算法的简介

3.2 加权双向聚类算法

3.2.1 给基因分配权重

3.2.2 非负矩阵分解

3.2.3 加权双向聚类算法

3.3 双向聚类算法的验证指标

3.3.1 平均残差(AsR指标)

3.3.2 平均相关指标(ACV指标)

3.3.3 PBM指标

3.3.4 (T)指标

3.3.5 MNSR指标

3.4 本章小结

第4章 实验结果及分析

4.1 数据来源

4.2 数据处理过程

4.3 实验结果与分析

4.3.1 乳腺癌数据

4.3.2 青少年类风湿性关节炎

4.4 本章小结

结论

参考文献

致谢

攻读学位期问发表的学术论文

声明

展开▼

摘要

随着生物信息技术的迅速发展,基因芯片技术在生物界领域有了明显的进展,它不仅反映了当前细胞生理状态以及基因之间的相关性,而且对于癌症亚型的识别、药物靶点的检测、药物疗效的诊断以及揭示疾病发生机制等领域起到至关重要的作用,因此基于基因表达微阵列数据的一些相关研究是生物技术领域的核心.基于基因表达微阵列数据的分析方法一般是利用聚类方法来挖掘矩阵中所隐藏的重要信息.由于基因表达数据具有双向关联的特性,所以传统的聚类算法在基因表达数据的研究中就受到了一定的局限,传统的聚类算法只能单一对行或列进行聚类从而找出基因表达矩阵的全局信息,而最终却忽略了其中重要的局部信息,因此一般的聚类算法没有办法精确地映射出基因与条件之间的紧密关系.
  本文主要针对一般聚类方法的不足,提出了基于基因表达数据无监督的加权双向聚类算法,具体做了以下几项工作:首先,利用最小生成森林法生成了基因调控网络.而根据基因调控网络中基因的重要性给每一个基因分配相应的权重.其次,在基因生成网络的基础上提出了加权的双向聚类算法.最后,针对于已有的验证指标,即平均残差(ASR指标)进行了改进,然后将改进的指标与已提出的指标进行比较,最终确定了最优的聚类个数.并且我们将该方法应用到乳腺癌和青少年类风湿性关节炎两组数据上,实例表明本论文所提出的加权双向聚类算法具有很好的聚类效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号