结肠直肠癌的发生、发展是一个多步骤、多阶段、多基因参与的复杂过程。本文对来自公共基因芯片数据库(GEO)的5组结肠直肠癌芯片数据集,利用生物信息学工具进行数据预处理,用COPA(Cancer Outlier Profile Analysis)方法筛选出差异基因,并选取KEGG和GeneGO数据库找出与差异基因相关的通路。基于GeneGO数据库的分析中,基因重复性低于通路重复性的比例占70%。本文找到的262条通路中有105条被证实与结肠直肠癌相关,4条通路至少在四组数据集中出现。通路(L)-selenoaminoacids incorporation in proteins during translation中有19.2%的基因被验证与结肠直肠癌有关,这条通路可能是新颖的与结肠直肠癌相关的通路,但还需要进一步的实验验证。本文在通路水平上对结肠直肠癌基因芯片表达谱数据进行荟萃分析,验证了在更高层次通路水平上的分析结果比在基因水平上的分析结果重复性更高,并且为更好的理解结肠直肠癌发生发展的分子机制提供了有意义的信息。
展开▼