首页> 中文学位 >DNA酶I超敏感位点遗传变异与肺癌易感性的关联研究
【6h】

DNA酶I超敏感位点遗传变异与肺癌易感性的关联研究

代理获取

目录

第一个书签之前

目 录

摘 要

Abstract

前 言

一、研究设计和研究对象

对于OncoArray样本,采取一系列的质量控制 (Quality Control,QC) 措施。符合下述标准之一的样本即被剔除:(1) 分型成功率低于95%的样本;(2) 存在亲缘关系的样本 (Identity By Descent,IBD >0.45);(3) 性别核查不一致的样本。经过质控后,OncoArray数据集保留了18444例肺癌病例和14027例对照。对于DCEG GWAS样本,在剔除与OncoArray数据集重复的样本后,进一步采用与OncoArray数据一样的质控标准。经过样本...

2、基因型填补

为了提高芯片的覆盖度,对芯片未直接分型的位点进行了基因型填补。OncoArray数据集的基因型填补工作已经由McKay JD等人完成,具体的填补方法详见McKay JD等文章[32]。对于DCEG数据集,以1000 Genomes the Phase III 数据库(2504例样本)为参考,利用SHAPEIT v2推测各个样本最有可能携带的单体型。进一步采用IMPUTE2填补该单体型上各个位点上最有可能的等位基因。

3、DHS区域遗传变异质量控制及调控性位点筛选

为了探讨新发现的显著关联位点的潜在生物学功能,对发现的显著关联位点以及与它们存在关联的位点 (r2 >0.6,欧美人群) 进行了系统的功能注释。首先,运用3DSNP网站,注释这些位点所在调控区域情况,包括:启动子、增强子、转录因子结合位点[34]。对于每个位点,3DSNP不仅给出总体的功能性评分,还提供三维空间内与该位点存在相互作用的基因。其次,基于CADD数据库,获得每个位点对人类基因组的相对有害性信息,CADD评分越高,反映其对人类基因组相对有害性越大[35]。在此基础上,对于非编码区变异,G...

5、Motif-based分析

本次研究,在分析了单个位点与肺癌发病风险关联的基础上,进一步探索了各个基序上位点的总体效应。纳入分析的44619个SNPs可被注释到308个基序上,为了提高结果的可靠性以及代表性,只有所含SNPs大于或等于5的基序被纳入motif-based分析。运用SKAT (Sequence Kernel Association Test) 软件包计算各个基序上所有SNPs的综合结果。

6、基因表达调控及通路富集分析

为了进一步探索新发现的肺癌易感性相关位点与周围基因表达的关系,基于GTEx V6p数据库肺组织mRNA表达数据 (278例),进行基因表达调控分析。具体为分析位点与其1Mb范围内基因表达的关联,P值小于0.05定义为显著相关。除此之外,对于eQTL基因以及位点所在基因,利用TCGA数据库107对肺癌-癌旁组织 (其中,肺腺癌组织57对,肺鳞癌50对) 基因表达数据,分析这些基因在肺癌组织-癌旁组织的差异表达情况。基于GTEx v6p mRNA表达数据,进行基因共表达分析。具体为通过相关分析,筛选与...

7、统计分析方法

9. GTEx,https://www.gtexportal.org/home/

10. DAVID Bioinformatics Resources 6.8,https://david.ncifcrf.gov/home.jsp

11. Plink 1.9,http://zzz.bwh.harvard.edu/plink/

12. SKAT,https://CRAN.R-project.org/package=SKAT

13. R Version 3.3.3,https://cran.r-project.org/src/base/R-3/

15. SIFT,http://sift.jcvi.org/

16. NPInter,http://www.bioinfo.org/NPInter/index.htm

17. SHAPEIT v2,http://www.shapeit.fr/

18. IMPUTE2,http://mathgen.stats.ox.ac.uk/impute/ impute_v2.html

结 果

1、研究样本基线信息

表 1. 研究对象的基线特征

图 1. 研究流程图

2、DHS区域调控性位点与肺癌发病风险的关联

由表-2及图-2可知,8个SNPs中,5个位点位于15q25.1区域,与既往肺癌GWAS报道的rs55781567及rs4886591存在一定的连锁不平衡。19q13.2区域的rs12459249与既往报道的rs56113850存在中等的LD关联。为了分析这六个位点是否为新的独立的肺癌相关位点,进一步调整rs55781567,rs4886591及rs12459249以观察各位点与肺癌发病风险的关联结果变化。如表-3所示,在OncoArray样本中,调整rs55781567后,rs4886592 (...

最终,本次研究共发现了2个新的肺癌易感性位点,分别是:20q13区域的rs186332 (C>T,OR=1.17,95% CI: 1.10-1.24,P=8.45×10-7) 以及1p13区域的rs4839323 (T>C,OR=0.92,95% CI: 0.89-0.95,P=1.02×10-6)。

图2. DHS区域内调控性位点与肺癌发病风险关联结果的曼哈顿图

表 2. 8个显著位点与肺癌发病风险的关联结果

a: SNP所在的基序 (Motif);

c: E/Ref 效应等位基因/参考等位基因;

d: EAF,效应等位基因频率 (病例/对照);

e: 调整年龄,性别,PCA1,PCA2以及PCA3;

f: 调整年龄,性别,PCA;

g: 荟萃分析,固定效应模型结果。

表3. 调整既往报道位点后各位点与肺癌易感性的关联 (OncoArray)

a: 效应等位基因/参考等位基因;

d: 调整rs56113850,年龄,性别,PCA1,PCA2以及PCA3;

表4. 调整既往报道位点后各位点与肺癌易感性的关联 (DCEG GWAS)

a: 效应等位基因/参考等位基因;

d: 调整rs56113850,年龄,性别,PCA;

4、亚组分析结果

5、新发现的显著关联位点功能学评价

表5. 肺腺癌及男性亚组人群关联结果

a: E/R: 效应等位基因/参考等位基因;

b: EAF: 效应等位基因频率(病例/对照);

c: 荟萃分析,固定效应模型结果,异质性检验P值大于0.05。

表 6. 2个显著关联位点及其r2大于0.6位点功能注释结果

a: 与发现的显著位点之间的关联 (欧美人群),基于HaploReg v4.1 网站结果;

b: Promoter: 启动子;Enhancer: 增强子;TFBS: 转录因子结合位点;该结果来源于3DSNP网站,该网站还给出SNP的功能性评分,评分越高,显示其功能越丰富;

d: 基于GWAVA网站,功能性评分0-1之间,评分越高,功能性越强;

e: 基于PINES网站,提供功能性评分的P值,P值越低反映该SNP功能越丰富,越可能是功能性位点,基于此网站结果对各个信号内的SNP进行排序。

表 7. Motif-based关联分析结果

d: Bonferroni校正后的P值 (P/292)。

表 8. eQTL及基因差异表达分析结果

a: SNP所在基因或eQTL基因;

b: 效应等位基因;

c: SNP基因型与相应基因表达的回归系数及P值;

d: Mean_T,肺癌组织中基因表达的均值 (Log转换后);Mean_N: 癌旁组织中基因表达的均值 (Log转换后);基于TCGA 107对癌-癌旁配对样本;

e: T/N,癌组织中表达高于相应癌旁组织的样本所占的比例;

f: 基因癌-癌旁差异表达分析P值。

图3. Rs186332与MRGBP表达关联情况及MRGBP差异表达

(A) rs186332能够调节MRGBP在肺组织中的表达,基于GTEx v6p数据库278例正常肺组织mRNA表达数据;(B) MRGBP在107例肺癌组织中的表达均高于配对的癌旁组织,基于TCGA数据库。

图4. 肺癌组织-癌旁组织基因差异表达

(A) PTK6基因差异表达情况;(B) SRMS基因差异表达情况;(C) C20orf195差异表达情况;(D) MAGI3差异表达情况

图6. 位点rs77468143与SECISBP2L表达关联及SECISBP2L差异表达情况

(A) rs77468143与SECISBP2L表达显著相关;(B) SECISBP2L在肺癌组织中显著高表达;(C) SECISBP2L在肺腺癌组织中的表达显著高于肺鳞癌组织,基于TCGA数据库;(D) SECISBP2L表达与CEBPA显著相关,基于GTEx数据库

本研究采用两阶段大样本的病例对照研究设计,基于欧美人群20871例肺癌病例和15971例对照的基因型数据,全面评价了DHS区域内调控性遗传变异与肺癌发病风险的关联。在验证了2个既往GWAS报道区域的同时,发现了2个新的肺癌易感位点,分别是20q13.3区域的rs186332以及19q13.2区域的rs12459249。进一步的功能注释及基因表达调控分析提示,这些位点可能通过干扰特定转录因子的结合,继而调控周围相关靶基因的表达,最终影响肺癌的发病风险。

DHS区域包含多种调控元件,该区域的遗传变异可能通过影响启动子、增强子活性,干扰转录因子的结合等方式,进而调节周围相关基因的表达。因此,DHS区域内的遗传变异在肿瘤的发生及进展过程中发挥重要作用,并且疾病相关位点富集于该区域[26,39,40]。我们本次研究新发现的2个SNPs的CATO评分均大于0.1,提示这些遗传变异很可能影响某些特定转录因子 (如CEBPA 和CEBPB) 的结合。

位点rs186332位于20q13的PTK6基因上,PTK6为蛋白酪氨酸激酶家族成员,介导细胞内信号传导。既往研究表明,PTK6在前列腺癌、乳腺癌发生及进展过程中,发挥重要作用[42-45]。 而在肺癌中,PTK6的相关研究较少。2013年,Zhao等发现PTK6在非小细胞肺癌组织中表达显著高于正常肺组织,且PTK6的异常高表达与差的非小细胞肺癌预后有关[46]。本次研究,基于TCGA数据,进一步证实PTK6在肺癌组织中呈异常高表达,并且发现PTK6基因上的遗传变异与肺癌发病风险显著相关,提示PT...

位点rs4839323位于1p13 MAGI3基因上,包含在V_CEBPA_01基序内,其CATO评分为0.164,表明该位点的变异能够影响染色体对于转录因子CEBPA的亲和力。MAGI3编码膜相关鸟苷酸激酶,研究表明,MAGI3的过早聚腺苷酸化促进乳腺癌的发生及进展[50]。在神经胶质瘤中,MAGI3能够通过抑制Wnt/beta-catenin信号通路,进而抑制癌细胞的增殖[51,52]。然而,目前尚无有关MAGI3与肺癌关联的研究报道。本次研究,我们发现MAGI3在肺癌组织中显著低表达,提示M...

对我们发现的肺癌易感位点,基于多个生物信息学数据库对其进行了全面的功能注释,以对各个易感信号的位点进行功能优先级排序。此外,基于基序为单位的分析,我们发现了10个与肺癌易感性有关的基序。其中,基序JDP2_bZIP_1与肺癌发病风险的关联最为显著,P值为2.55×10-7。JDP2属于转录因子AP-1的组成部分,参与响应多种转录调节,例如紫外线介导的凋亡、细胞分化、癌变等。大量研究表明,JDP2能够影响多种肿瘤的发生、进程,包括肝癌、宫颈癌等[56,57]。

本次研究具有2个显著优势:(1) 首次系统分析了DHS区域内调控性位点与肺癌发病风险的关联;验证了既往报道的2个位点并发现了2个新的肺癌易感位点;(2) 整合肺癌OncoArray样本及NCI GWAS样本,样本量大 (20871例肺癌病例VS 15971例对照),研究结果可靠。同时,本次研究也存在一定的不足,尤其是对于新发现的位点,仅通过生物信息学方法推测其潜在的致病机制,缺乏功能实验的验证。

综上所述,我们通过对DHS区域内调控性位点进行系统的分析,发现了2个SNPs与肺癌发病风险有关。功能注释及基因表达调控分析等提示,这些SNPs可能通过改变染色体对于特定转录因子的亲和力,继而调节下游靶基因的表达,最终影响肺癌的易感性。

总 结

本研究,采用两阶段病例对照研究设计,基于欧美人群20871例肺癌病例及15971例对照的基因型数据,系统分析了DHS区域内调控性位点与肺癌发病风险的关联。研究结论如下:

本课题首次系统评价了DHS区域遗传变异与肺癌发病危险的关联。本研究为揭示DHS相关遗传变异在肺癌发生过程的作用及机制提供重要线索。

展开▼

摘要

研究目的:肺癌是全球范围内最常见的恶性肿瘤之一,其每年的发病和死亡人数均居各种肿瘤之首.流行病学研究表明,肺癌的发生是环境因素和遗传因素共同作用的结果.据估计,约85%的肺癌发病与烟草暴露有关.同为吸烟者中,不到20%的人发展为肺癌,说明个体对肺癌遗传易感性存在差异.前期,采用全基因组关联研究(Genome-wide association study)策略已经发现了数十个肺癌易感区域,如15q25、5p15和3q28等.据统计,在已经报道的86个肺癌易感性单核苷酸多态性位点中,有76个位于非编码区域,提示非编码区的遗传变异在肺癌的发生过程中扮演重要角色.其中,脱氧核糖核酸酶I高敏感位点(DNase Hypersensitive Site,DHS)是指脱氧核糖核酸酶I超敏感区域,该区域易于受到DNA酶I剪切,是非编码区域的重要组成部分,包含多种调控元件,如启动子(Promoter)、增强子(Enhancer)、转录因子结合位(Transcription factors binding sites,TFBS)等.多项研究表明,疾病(或性状)相关位点富集于DHS区域,且更可能为eQTL(expression Quantitative Trait Loci).然而,目前尚无研究系统地分析DHS区域相关遗传变异与肺癌发病风险的关联.2015年,Maurano MT等利用166个个体以及114种细胞系的DNase-seq数据,通过构建TF-centric模型,发现并公布了483415个可能影响转录因子结合的多态性位点.这一研究发现为我们系统地分析DHS区域内调控性位点与肺癌易感性的关联提供了前所未有的机遇.基于上述研究,我们推测:系统分析DHS区域内的遗传变异,可发现更多非编码区肺癌易感位点,进一步揭示肺癌发生的潜在生物学机制. 研究方法:本研究采用大样本、两阶段病例-对照研究设计,对DHS区域遗传变异与肺癌遗传易感性进行系统筛选和评价,并进一步结合多个功能相关数据库进行功能预测,初步探索DHS相关遗传变异影响肺癌发生的潜在生物学功能.初筛阶段的样本来自于国际肺癌联盟的OncoArray项目.目前,该项目已经整合全球十多个国家的5万余例肺癌及相应对照样本,采用Illumina公司设计的OncoArray芯片进行基因分型.经过前期样本和位点质控后,共有18444例肺癌病例和14027例对照纳入初筛阶段分析.验证阶段的样本来自美国国家癌症研究所(National Cancer Institute,NCI)公布的Division of Cancer Epidemiology and Genetics(DCEG GWAS).经过统一的质控后,共有2427例肺癌病例和1944例对照纳入验证阶段的分析.通过整合Maurano MT等发现的可能影响转录因子结合的位点以及可调控周围基因表达的调控性位点(即eQTL,基于GTEx v6p数据库),系统筛选DHS区域内潜在的调控性位点.最终,共保留20871例肺癌病例和15971例对照对应44619个DHS区域内调控性位点用于关联评价. 对于筛选出的调控性位点,采用SNPTEST(v2.5.4)软件进行单个遗传变异与肺癌发病风险的关联分析,计算各个位点的比值比(odds ratio,OR)以及95%可信区间(95%confidence interval,95%CI).调整年龄、性别以及主成分(principal components),以控制其潜在的混杂.对于初筛阶段发现的显著位点(P≤0.05),进一步纳入验证阶段进行验证.采用Meta分析的固定效应模型合并两阶段的结果.对于合并分析发现的新的肺癌易感位点(满足Bonferroni校正,P≤0.05/44619=1.12×10-6),基于GTEx、HaploReg、3DSNP以及PINES等生物信息数据库进行系统功能注释、转录调控预测及通路富集分析等,以探索潜在的生物学机制.为了评价位点所在基序与肺癌的发病关联,进一步进行基序分析(Motif-based analysis),具体为采用SKAT分析评价同一基序上所有位点的整体效应,以期发现肺癌发病风险相关的基序. 研究结果:初筛阶段,共有3069个SNPs与肺癌的易感性存在显著关联(P≤0.05).这些位点中,157个SNPs在验证阶段的遗传效应与初筛阶段一致,且存在统计学差异(P≤0.05).合并分析结果显示,共有8个SNPs满足Bonferroni校正(rs4886592,rs12459249,rs4886982,rs7182694,rs76681511,rs76412132,rs186332及rs4839323).其中,rs4886592,rs12459249,rs4886982,rs7182694,rs76681511及rs76412132与既往GWAS报道位点间存在一定的连锁不平衡.调整既往GWAS报道的位点后,上述6个位点与肺癌发病风险的关联不再显著.最终,本次研究共发现2个新的肺癌易感位点,分别是:20q13区域的rs186332(C>T,OR=1.17,95%CI:1.10-1.24,P=8.45×10-7)以及1p13区域的rs4839323(T>C,OR=0.92,95%CI:0.89-0.95,P=1.02×10-6).基序分析发现了以JDP2_bZIP_1为代表的10个基序与肺癌的发病风险显著相关,提示与这些基序相结合的转录因子可能在肺癌的发生过程中发挥重要作用.进一步的生物学预测结果表明,本次研究新发现的2个SNPs可影响特定转录因子的结合,并且能够调控周围基因的表达.基于上述结果,我们推测,DHS区域相关遗传变异可能通过影响染色体对特定转录因子的亲和力,从而影响转录因子结合,继而调节下游相关基因的表达,最终影响肺癌的发生. 结论:综上,本研究基于大样本两阶段病例对照研究设计,首次系统评价了DHS区域调控性位点与肺癌发病风险的关联.通过两阶段筛选和验证,发现了2个新的肺癌易感性位点,进一步结合功能预测结果表明这些位点可能通过影响特定转录因子的结合,调节靶基因的表达,从而影响肺癌的易感性.本研究结果为揭示DHS区域遗传变异在肺癌发生过程的作用及生物学机制提供了重要线索.

著录项

  • 作者

    李志华;

  • 作者单位

    南京医科大学;

  • 授予单位 南京医科大学;
  • 学科 流行病与卫生统计学
  • 授予学位 硕士
  • 导师姓名 沈洪兵;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    DNA酶; 超敏感; 位点; 遗传变异; 肺癌易感性;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号