首页> 中文学位 >基于Bi-cluster的基因表达双向关联模式发现
【6h】

基于Bi-cluster的基因表达双向关联模式发现

代理获取

目录

文摘

英文文摘

第一章 绪论

1.1 研究背景及意义

1.2 问题描述及国内外研究现状

1.2.1 问题描述

1.2.2 研究现状

1.3 本文主要研究内容和主要工作

1.4 本文的章节组织

第二章 双向聚类分析综述

2.1 传统聚类算法

2.2 双向聚类的定义

2.3 双向聚类的类型、模式与结构

2.3.1 双向聚类的类型

2.3.2 双向聚类的模式

2.3.3 双向聚类的结构

2.4 主要的双向聚类算法

2.5 双向聚类算法评价指标介绍

2.6 δ-Bicluster算法分析

2.6.1 δ-Bicluster算法描述

2.6.2 δ-Bicluster算法优缺点分析

第三章 ProBicluster算法的总体设计与描述

3.1 ProBicluster算法设计与描述

3.1.1 ProBicluster算法设计

3.1.2 ProBicluster算法描述

3.1.3 ProBicluster算法实现流程

3.2 ProBicluster算法的参数研究

3.3 双向聚类算法评价

3.3.1 人工模拟数据集

3.3.2 算法结果比较分析

3.4 基于ProBicluster的数据分析平台的设计与实现

3.4.1 数据分析平台的功能分析

3.4.2 数据分析平台的整体架构

3.4.3 数据分析平台的软件实现

第四章 酵母菌细胞周期数据上基因与条件的关联分析

4.1 实验数据的获取

4.2 数据的预处理

4.3 实验结果比较及分析

第五章 基因表达与药物活性数据上基因与药物的关联分析

5.1 实验数据的获取

5.2 数据的预处理

5.3 基因与药物的关联矩阵构建

5.4 实验结果与分析

5.4.1 主要结果

5.4.2 结果分析

第六章 总结与展望

6.1 全文总结

6.2 工作展望

参考文献

发表论文和参加科研情况说明

附录

致谢

展开▼

摘要

基因表达谱数据的分析研究对于生物学和生物信息学而言具有极其重要的意义,尤其是对基因功能与条件的关联研究尤为重要。传统的聚类方法是用相似性度量函数确定基因的相似程度,从而将基因分组。然而在很多情况下,对基因的聚类需要找出在一部分实验条件下表达水平上调或下调一致的基因组,即对基因进行聚类的同时对实验条件也进行聚类,由此引出了双向聚类问题。
   δ-Bicluster算法是基于MSR(最小均方残差)理论和迭代贪心搜索策略的一种经典双向聚类算法。在分析了该算法优缺点的基础之上,本文提出了ProBicluster算法。ProBicluster算法从两个方面入手:针对双向聚类模式单一性问题,通过二部图理论发现线性模式;针对交叉聚类问题,对结果进行二次聚类。并将算法在人工模拟数据集上测试,说明了ProBicluster算法改进的有效性。本文还实现了基于ProBicluster算法的数据分析平台。
   对酵母菌细胞周期数据集进行基因与条件的双向关联分析。将ProBicluster与其他四种聚类算法同时应用到酵母菌细胞周期数据集上,利用基因通路和双向聚类结果评价指标进行聚类结果比较及分析。评分结果表明,ProBicluster算法的相关系数评分均高于其他几种算法,恢复系数评分与OPSM算法各有高低。总体说明ProBicluster算法具有良好的准确性和有效性。
   在NCI60数据集上对基因与药物进行双向关联分析。利用ProBicluster算法进行双向聚类分析得到聚类结果,并从基因和药物两个角度对实验结果进行分析。利用通路对基因之间进行分析,同时从药物类别、理化属性等方面对药物进行分析。经过文献验证发现,在子模式一中基因CCND1对药物Cisplatin具有抗药性,说明双向聚类算法对于发现基因与药物双向关联的有效性,对进一步的药物筛选和药物设计提供帮助。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号