首页> 中文学位 >基于基因表达谱和蛋白-蛋白相互作用网络的乳腺癌相关特异性基因的识别
【6h】

基于基因表达谱和蛋白-蛋白相互作用网络的乳腺癌相关特异性基因的识别

代理获取

目录

第一个书签之前

展开▼

摘要

乳腺癌是一种对女性健康产生严重威胁的恶性肿瘤,目前的诊断及治疗效果较差。进一步识别乳腺癌相关的基因对于乳腺癌的治疗和诊断精确度的提高具有重大意义。再者,目前生物信息学的方法广泛地应用于疾病相关基因识别,为实验提供了重要的理论指导。故本研究基于生物信息学的方法进行乳腺癌相关基因的识别。(1)以乳腺癌为研究对象,将GEO数据库中表达谱数据集作为数据源。对原始数据进行背景校正、标准化及汇总等预处理操作,随后利用最大相关最小冗余的特征提取算法和Dijkstra最短路径算法对乳腺癌相关基因进行预测。然后去随机因素,最终得到乳腺癌的候选基因。(2)以三阴性乳腺癌为研究对象,我们将GEO数据库中表达谱数据集作为数据源。同样方法获得与三阴性乳腺癌具有最强相关性的候选基因,将这些候选基因与上述从乳腺癌分析中获得的候选基因取交集,得到最终的三阴性乳腺癌的候选基因。最后对候选基因进行GO(Gene Ontology)和KEGG (Kyoto Encyclopedia of Genes and Genomes)富集分析。最终筛选出19个与乳腺癌具有最显著相关性的候选基因。这19个基因其中大部分已被报道与乳腺癌确有直接关系。GO富集分析表明这些基因主要与氧水平和转录相关。K EGG富集分析表明这些基因主要富集于前列腺癌路径、内分泌拮抗和癌症相关通路。最终得到54个与三阴性乳腺癌相关的基因。这些基因其中大部分已被报道确与乳腺癌有直接的关系,同时其中另一些基因如MAGOH、RPS3、JUN、HCFC1、OGT、PPP1CB、CFTR及ESR1目前少见报道,提示可能是乳腺癌相关的新特异基因,有待实验验证。GO富集分析表明这些基因主要与黏附作用和转录有关。K EGG富集分析表明这些基因可能与病毒致癌有关。 本研究的主要创新点:(1)将基因表达谱和PPI数据进行整合,用PPI网络的系统生物学方法研究基因表达谱数据。(2)将基因看作特征,基于最大相关最小冗余特征筛选算法以及最短路径算法筛选出与疾病显著相关的基因。最后利用GO分析与K EG G富集分析找出这些基因参与最多的信号通路和功能,以此推断与乳腺癌有关的重要潜在生物学机制和生物途径。本文为乳腺癌相关的基因识别提供了有效的方法和手段,对乳腺癌的进一步研究提供了一定的理论支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号