摘要:
目的:慢性阻塞性肺疾病简称慢阻肺(Chronic Obstructive Pulmonary Disease,COPD)是一种极具破坏性的肺部疾病.研究表明,COPD的发生主要与肺部对香烟烟雾等有害气体产生的异常炎症反应有关.目前针对吸烟与COPD间关系的研究主要从通过动物模型实验或者采集临床标本进行组织病理检查,以及流行病学分析等进行,也有少量研究是针对若干个蛋白标记物进行测定和分析.但针对吸烟群体与COPD患者群体的全基因表达数据进行整体分析并探讨两者之间关系的研究很少,而从“量化”角度进行两者间一致性关系的研究,至今尚未发现.在精准医学和组学技术日益发展大背景下,有必要从全基因组的角度对吸烟与COPD的关系进行分析和挖掘. 方法:采用来自于NCBI中的GSE11784数据集,包括COPD样本(22例)和正常样本(14例),吸烟样本(72例)和不吸烟样本(63例)4类样本的基因芯片表达谱数据.首先,对基因芯片原始数据运用R语言进行预处理和标准化;然后利用T检验和改进的Relief算法提取COPD组与正常组、吸烟组和不吸烟组之间的差异基因,基于累积二项式分布模型对筛选的差异基因进行一致性分析;与此同时利用两两冗余算法进行差异基因去冗余处理,以得到更具有代表性、非相关的特征基因;最后进行通路富集以分析生物学功能通路. 结果:通过本文方法筛选得到COPD样本和正常样本间上调差异基因960个,下调差异基因2092个,吸烟组和不吸烟组之间的上调差异基因1932个,下调差异基因918个,利用累计超几何分布模型得到两组差异基因之间的一致性率为74.51%(P<1.11E-15).此外,基于Relief算法得到的差异基因在两两冗余处理前富集得到10条功能通路,在冗余处理后得到16条功能通路,这些通路均与基因突变,染色体异常以及蛋白质的合成异常有关等. 结论:COPD病变与吸烟导致的生物学特征变化之间具有显著的一致性关系(P<1.11E-15),一致性率达到74.51%.这表明,吸烟导致的人体生物学特征变化和COPD的病变特性具有较好的重叠性,吸烟是导致COPD病变的最重要因素之一(此外与老龄化、环境因素和遗传因素等也有相关性,故一致性率为75%左右).同时,COPD组与正常组、吸烟组和不吸烟组间的差异基因的生物学富集通路与基因突变,染色体异常以及蛋白质的合成异常密切相关,这些与香烟中的有害物质,如焦油、尼古丁以及吸烟时产生的一氧化碳(CO)等积累影响的生物学特征改变保持一致.