首页> 中文学位 >局部叠加基因表达模式聚类分析方法研究
【6h】

局部叠加基因表达模式聚类分析方法研究

代理获取

目录

摘 要

ABSTRACT

目 录

Contents

第 1 章 绪论

1.1 研究背景及意义

1.2 研究现状及问题

1.2.1 传统聚类方法及其应用

1.2.2 子空间聚类方法及其应用

1.2.3 双路聚类方法及其应用

1.3 研究工作及特色

1.3.1 研究问题及内容

1.3.2 主要研究成果

1.3.3 研究特色及创新

1.4 论文结构

第 2 章 基因表达模式聚类分析方法概述

2.1 基因表达数据获取与基因表达数据分析

2.1.1 基因表达数据获取

2.1.2 基因表达数据分析

2.1.3 基因表达数据聚类分析

2.1.4 基于基因本体的基因表达数据聚类分析

2.2 聚类方法基础

2.2.1 不同的聚类类型

2.2.2 不同的簇类型

2.2.3 基因表达模式相似性度量方法

2.2.4 聚类有效性验证方法

2.3 基因表达模式聚类分析方法研究进展

2.3.1 聚类方法类型

2.3.2 传统聚类方法

2.3.3 模糊聚类方法

2.3.4 子空间聚类方法

2.3.5 双路聚类方法

2.4 小结

第 3 章 单向叠加局部基因表达模式分析

3.1 研究动机

3.2 模糊硬子空间聚类方法

3.2.1 硬子空间聚类算法:W-K-Means

3.2.2 模糊硬子空间聚类算法:模糊 W-K-Means

3.3 实验结果及分析

3.3.1 实验数据及实验设置

3.3.2 模糊 W-K-Means 算法与 FCM 算法性能对比分析

3.3.3 模糊 W-K-Means 算法挖掘局部叠加表达模式

3.4 小结

第 4 章 双向叠加局部基因表达模式分析

4.1 研究动机

4.2 模糊软子空间聚类方法

4.2.1 软子空间聚类算法:EWKM

4.2.2 模糊软子空间聚类算法:模糊 EWKM

4.3 基因聚类有效性验证方法

4.3.1 基于基因本体的聚类有效性验证

4.3.2 基于基因共表达网络的聚类有效性验证

4.4 实验结果及分析

4.4.1 实验数据及实验设置

4.4.2 基因聚类结果对比

4.4.3 变量权重与局部表达模式分析

4.4.4 共表达基因聚类关系分析

4.5 小结

第 5 章 局部基因表达模式的可视分析及后处理

5.1 研究动机

5.2 局部基因表达模式的可视分析及后处理方法

5.2.1 可变窗口方法

5.2.2 后处理方法

5.2.3 聚类有效性验证

5.3 实验数据及参数设置

5.3.1 实验数据及预处理

5.3.2 实验参数设置

5.3.3 噪声基因发现与清除

5.4 可变窗口方法发现相似表达基因

5.4.1 可变窗口方法确定局部表达模式边界

5.4.2 可变窗口方法发现共同表达基因

5.5 小结

结 论

参考文献

攻读博士学位期间发表的论文及其他成果

哈 尔 滨 工 业 大 学 学 位 论 文 原 创 性 声 明 及 使 用 授 权 说 明

致 谢

个人简历

展开▼

摘要

局部叠加基因表达模式是指一组基因的表达水平在条件选择性和表达多样性等生物学机制作用下表现出来的表达特征,该模式的研究与发现有助于揭示基因在不同细胞调控条件下承担的功能以及不同基因簇在整个细胞调控过程中潜在的生物学关系。然而,局部叠加基因表达模式分析问题的特殊性给聚类分析方法研究提出了挑战,不仅要求聚类分析方法能够有效挖掘不同表达子空间下的局部基因表达模式,同时还要求所挖掘的结果具有生物学一致性并符合基因表达选择性和多样性的生物学机制。
  本文针对局部叠加基因表达模式挖掘与分析涉及的四个密切相关的问题,即基因叠加局部表达模式的挖掘问题、基因和表达子空间双向叠加局部表达模式的挖掘问题、局部基因表达模式子空间边界模糊问题、以及局部基因表达模式的提取与优化问题,以模糊聚类和变量加权子空间聚类方法为基础,并结合了基于基因本体和基因共表达网络的基因聚类有效性验证方法,提出了模糊硬子空间聚类分析方法、模糊软子空间聚类分析方法、可变窗口分析方法和后处理分析方法,为开展局部叠加基因表达模式的挖掘与分析提供了新型有效的分析方法和工具。
  本文的总体研究思路是针对局部叠加基因表达模式分析的问题特性,在综合分析了现有的聚类方法特点的基础上,以模糊聚类和变量加权子空间聚类方法为基础,提出了模糊W-K-Means方法和模糊EWKM方法。所提出的方法不仅能够发现与局部基因表达模式相关的一组表达子空间以及该子空间下的局部表达基因聚类,而且能够同时实现基因与聚类之间的一对多映射,实验结果证明利用上述方法挖掘的局部叠加基因表达模式具有生物学一致性并符合基因表达的生物学机制,有效地解决了局部叠加基因表达模式的挖掘问题。此外,本文进一步针对所挖掘的局部表达基因聚类具有表达子空间边界模糊和表达模式受噪声干扰的问题,提出了可变窗口分析方法和后处理分析方法,通过交互式可视化方式查看基因聚类在不同表达子空间下局部表达模式的动态变化过程来确定基因聚类的局部表达子空间边界,并通过噪声清除、属性权重更新、表达模式建模和聚类有效性验证等一系列操作,实现局部叠加基因表达模式的增强,进一步提高了所挖掘的基因表达模式的质量。
  本文提出的分析方法瞄准了局部叠加基因表达模式分析问题的不同方面,并各有侧重。其中,本文提出的模糊W-K-Means方法和模糊EWKM方法集中解决了局部叠加基因表达模式挖掘问题,可变窗口方法和后处理方法集中对得到的聚类结果进行深入地分析和处理。同时,本文提出的四种分析方法都以变量加权子空间聚类方法为基础,可配合使用,作为解决局部叠加基因表达模式分析中所包括的模式挖掘、模式提取、模式优化、模式重用等问题的综合解决办法,为局部叠加基因表达模式分析的实际应用提供了新的途径。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号