首页> 中文学位 >基于转录组学数据的癌症转化医学信息学
【6h】

基于转录组学数据的癌症转化医学信息学

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 前 言

1.1 癌症转化医学信息学介绍

1.2 转录组学的研究方法和进展

1.3 癌症相关microRNA的研究进展

1.4 癌症相关通路的研究进展

1.5 个性化生物标志物研究进展

1.6 本文的研究目的和意义

1.7 论文组织框架

第2章 肾透明细胞癌microRNA表达谱的整合分析

2.1 肾透明细胞癌概述

2.2 microRNA芯片表达谱数据收集

2.3 数据预处理

2.4 差异表达基因统计方法的比较

第3章 POMA模型寻找活性microRNA

3.1 POMA模型的构建

3.2 POMA优化差异microRNA列表

3.3 与RNA-Seq结果的比较

3.4 差异表达microRNA的聚类分析

3.5 microRNA诊断模型的ROC分析

第4章 生物功能和通路富集性分析

4.1 获取microRNA的靶基因

4.2 基于GO的功能富集分析

4.3 基于KEGG的通路富集分析

4.4 基于MetaCore的通路富集分析

4.5 新发现的ccRCC相关MetaCore通路

4.6 基因水平和通路水平的重复性比较

第5章 癌症相关通路在不同群体中的重复性分析

5.1 数据收集

5.2 基因芯片数据分析

5.3前列腺癌相关通路的区域性分布特征

5.4 芯片平台的影响分析

第6章 结论与展望

6.1 结论

6.2 未来工作展望

参考文献

攻读学位期间公开发表的论文和论著

附录

致谢

展开▼

摘要

随着基因芯片和下一代测序技术的广泛应用,癌症相关的转录组学数据日益增加。如何分析和整合这些高通量信息,实现从实验室到临床应用的转化,是转化医学信息学面临的主要任务。国内外已有众多实验室在分子水平上研究癌症基因表达模式的变化,挖掘癌症相关的分子标志物。然而不同实验室筛选得到的标志物重合度非常低。造成这种不一致性的原因不仅仅源于实验平台、分析方法的不统一,更重要的是由癌症本身的异质性和群体的差异性导致。  针对上述造成标记低重复性的原因,本论文分别提出了针对性解决方案,从不同水平上(分子、通路、群体)提高癌症诊断标记的重复性和有效性,并采用肾透明细胞癌和前列腺癌两种癌症转录组数据验证了方法的合理性,同时成功寻找到了具有诊断价值的癌症分子标记。  首先,我们在基因层次上挖掘不同来源的异质性数据之间内在的一致性。通过构建一个统一的癌症转录组荟萃分析平台,对5套独立的肾透明细胞癌microRNA表达谱数据进行整合分析。对5种差异基因筛选统计方法进行比较后,使用新型算法MOST筛选具有异质性激活模式的癌基因,降低结果的假阴性。  其次,我们构建了一个计算模型POMA以整合mRNA和microRNA两个层次的表达谱数据。该模型重构了肾透明细胞癌特异的mRNA-microRNA互作用网络,并用合理的打分算法得到具有调控活性的差异表达microRNA,降低假阳性发现,进一步提高各数据组之间一致性。最终获得不同数据组中高度重复的11个microRNA,与深度测序RNA-Seq的结果高度吻合。为了评价这些microRNA的诊断效力,我们使用独立数据组进行两路聚类和ROC曲线分析。结果表明,这些microRNA均具有较强的疾病识别能力。单一标志物中,miR-122-5p的ROC曲线下面积AUC最大(0.957),最高灵敏度和特异度分别在85%和95%。对microRNA进行两两组合测试,发现组合标志物具有更好的分类表现。miR-122-5p和miR-126-3p组合的AUC最高(0.978),灵敏度和特异性分别为90%和100%,该组合有望成为一个潜在的诊断标志。  为了寻找癌症发病机制在反应通路层次上的共同特征,我们利用基因功能数据库(GO)和反应通路数据库(KEGG,MetaCore)对肾透明细胞癌相关的microRNA靶基因进行功能水平以及通路水平的富集分析,证明了不同实验室的癌症表达谱数据在通路层次上所呈现的一致性特征。研究发现大部分富集通路和细胞骨架重构、DNA损伤和细胞周期相关。结合文献挖掘,验证了microRNA调控通路的有效性,发现了重要的肾透明细胞癌相关通路,其中包括未见报道的新信号通路:TGF,WNTandcytoskeletalremodelling和Brca1asatranscriptionregulator。  最后,我们在种群层次上研究癌症基因富集的通路在不同人群中的一致性。我们提出假设:不同个体的肿瘤分子标记的一致性取决于样本的遗传相似性。通过分析10套不同来源的前列腺癌基因表达数据,证明了具有相似遗传/环境背景的个人往往拥有着相似的特征通路。因此,在相似遗传背景的亚群中寻找高度重复的生物标记成功率会比较高。  本课题在分子、通路、群体这三个不同层次分析和解决了癌症生物标志物的不一致性,为深入理解癌症的分子机制提供了理论基础,为发现可靠和特异性的癌症生物标志物及其临床转化提供了新的研究手段。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号