首页> 中国专利> Ⅰ型血管紧张素Ⅱ受体基因的标签单核苷酸多态性位点及其组成的单体型

Ⅰ型血管紧张素Ⅱ受体基因的标签单核苷酸多态性位点及其组成的单体型

摘要

本发明涉及一种I型血管紧张素II受体(angiotensin II type I receptor,AGTR1)基因标签单核苷酸多态性位点及其检测方法和应用。本发明还涉及由AGTR1基因标签单核苷酸多态性位点组成的单体型及其检测方法和应用。本发明的AGTR1基因标签单核苷酸多态性位点组成的单体型在心肌梗塞的预防和/或诊断中有重要的应用前景。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-23

    未缴年费专利权终止 IPC(主分类):C12Q1/68 授权公告日:20101208 终止日期:20190623 申请日:20040623

    专利权的终止

  • 2010-12-08

    授权

    授权

  • 2007-08-29

    实质审查的生效

    实质审查的生效

  • 2005-12-28

    公开

    公开

说明书

技术领域

本发明涉及一种I型血管紧张素II受体(angiotensin II type I receptor,AGTR1)基因标签单核苷酸多态性位点及其检测方法和应用。本发明还涉及由AGTR1基因标签单核苷酸多态性位点组成的单体型及其检测方法和应用。

背景技术

冠状动脉粥样硬化性心脏病是由于动脉粥样硬化造成的冠状动脉管腔狭窄,从而使冠状动脉供血不足并导致心肌缺血,从而引起各种临床症状,简称冠心病。该病如果是心肌暂时性缺血,会引起心绞痛;如果是冠状动脉被凝血块堵塞,或发生神经性痉挛,血液不能流通,这就是心肌梗塞。心肌梗塞(myocardial infarction)通常表现为冠状动脉闭塞,血流中断,部分心肌因严重的持久性缺血而发生局部坏死。临床上有剧烈而较持久的胸骨后疼痛、发热、白细胞增多、红细胞沉降率加快、血清心肌酶活力增高及进行性心电图变化,可发生心律失常、休克或心力衰竭。目前,在西方国家急性心肌梗塞是发病率最高和最致命的疾病,1999年世界7个主要制药市场国家(美国、法国、德国、意大利、西班牙、英国和日本)有1700多万人患急性心肌梗塞,其中1/4死亡。仅在美国每年发生约80万例心肌梗塞。到2009年估计在上述7个国家中心肌梗塞人数将上升至200万人。我国每年急性心肌梗塞病人数约为110万人。年龄在40-74岁的人群心肌梗塞粗年发病率:124.7/10万;死亡率:58.4/10万。尽管我国急性心肌梗塞的发病率和死亡率低于多数发达国家,但上升速度很快,患者和死亡的绝对人数巨大。疾病监测和死因统计显示,今后20年在我国及世界范围内急性心肌梗塞的死亡率和发病率仍将呈上升趋势。

心肌梗塞的发生具有明显的遗传倾向,同时又受到环境因素的密切影响,因此它是典型的多因子疾病。从基础到临床,人们对此进行了大量的研究,并在心肌梗塞的危险因素和心肌梗塞发生的病理生理学方面积累了大量的知识,但是对于心肌梗塞发生的遗传基础的分析仍未取得重大突破。而从遗传学的角度来解释、预防、和/或诊断心肌梗塞是目前需要解决的首要问题。

血管紧张素II(Ang II)是肾素-血管紧张素系统(RAS)的一个重要产物,在血压调节和心血管系统中有着重要作用。位于细胞表面的I型Ang II受体(AGTR1)介导了Ang II几乎所有的心血管效应,包括血管和心肌收缩、垂体激素和醛固酮分泌、水钠重吸收及细胞增殖肥大等。血管平滑肌细胞、心肌及肾脏等器官都有广泛的AGTR1存在。AGTR1基因位于常染色体3q21-3q25,全长约45kb,由5个外显子组成,其中第5个外显子编码全部359个氨基酸,其表达蛋白属于G蛋白耦连受体家族,具有7个跨膜亲水区结构。AGTR1基因的GenBank序列号(Gene ID:185),基因结构如图1所示。但是,目前尚未有对AGTR1基因单体型的系统研究,也没有相关标签SNP(单核苷酸多态)的报道,更没有AGTR1基因变异与心肌梗塞之间的关系,以及这些变异在预测预报和新药开发中的应用的报道。

SNP(Single Nucleotide Polymorphisms)是单核苷酸多态的缩写,其是DNA序列的变体,当基因组序列中单个核苷酸(A,T,C或G)发生改变时就会出现SNP。在本发明中,SNP命名原则如下:第一个外显子的第一个核苷酸定义为+1位,5’上游方向核苷酸依次定义为-1、-2...,3’下游方向核苷酸依次定义为+2、+3...。单核苷酸多态若位于非编码区,则以核苷酸相应变化和该核苷酸在核苷酸序列中的位置定义此多态;若位于编码区,则以核苷酸相应变化和该核苷酸在核苷酸序列中的位置定义此多态或以该核苷酸编码的氨基酸相应变化和该氨基酸在氨基酸序列中的位置定义此多态。

发明内容

针对上述问题,本发明的一个目的是提供一种AGTR1基因的标签单核苷酸多态性位点;本发明的一个目的是提供一种由AGTR1基因的标签单核苷酸多态性位点组成的AGTR1基因保护性单体型;本发明的一个目的是提供一种由AGTR1基因的标签单核苷酸多态性位点组成的AGTR1基因危险性单体型;本发明的一个目的是提供一种检测本发明的AGTR1基因的标签单核苷酸多态性位点的方法;本发明的一个目的是提供一种检测AGTR1基因的保护性单体型或危险性单体型的方法;本发明的另一目的是提供一种体外检测心肌梗塞相关基因的方法;本发明的另一目的是提供一种体外检测待测样品中是否含有AGTR1基因保护性单体型或危险性单体型的方法;本发明的另一目的是提供一种体外预测待测个体患心肌梗塞的危险性的方法:本发明的另一目的是提供一种检测AGTR1基因的标签单核苷酸多态性位点的多态性的试剂盒。

本发明提供了AGTR1基因的标签单核苷酸多态性位点,该位点分别为AGTR1基因的-1106A/T、10208A/G、32091A/G、Leu191Leu(43730T/C)、44323A/C和45035A/G单核苷酸位点。上述多态性位点是在大量实验的基础上得出的。在本发明的一个实施方式中,对AGTR1基因启动子区、外显子区以及外显子/内含子交界区进行了大规模测序,并筛查出分布于其中16个SNP,并在此基础上,利用LD(连锁不平衡)分析发现某些SNPs之间具有较强LD,首次得出-1106A/T(第一个外显子的第一个核苷酸上游第1106位)、10208A/G(第一个外显子的第一个核苷酸下游第10208位)、32091A/G(第一个外显子的第一个核苷酸下游第32091位)、43730T/C(第一个外显子的第一个核苷酸下游第43730位)、44323A/C(第一个外显子的第一个核苷酸下游第44323位)和45035A/G(第一个外显子的第一个核苷酸下游第45035位)等6个SNPs可以作为AGTR1基因的标签SNPs。具体定义参见表4。这些标签SNPs为研究AGTR1基因提供了新的方法,因为在本发明的大量实验结果基础上,这些标签SNPs完全可以代表其它SNPs。这样在大规模关联研究中,标签SNPs的选择在保证研究把握度的前提下,能够有效减少研究环节,降低研究成本。

在上述标签SNP的基础上,本发明又对由-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G等6个tSNPs组成的常见单体型(频率>3%)进行了广泛的研究。结果发现:与单体型A-G-A-T-A-A(在-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G位点的单核苷酸分别为A、G、A、T、A、A)相比,单体型A-A-A-T-A-A(在-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G位点的单核苷酸分别为A、A、A、T、A、A)、T-A-G-C-A-A(在-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G位点的单核苷酸分别为T、A、G、C、A、A)和A-A-A-C-A-G(在-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G位点的单核苷酸分别为A、A、A、C、A、G)在第2个位置均为A等位基因,随着第1个位置T等位基因、第4个位置C等位基因和第6个位置G等位基因的依次出现,这样的个体患心肌梗塞的危险逐渐升高。

从而,一方面,本发明提供了由本发明的标签单核苷酸多态性位点组成的AGTR1基因保护性单体型,该单体型在-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G位点的单核苷酸分别为A、G、A、T、A、A(单体型A-G-A-T-A-A)。在本发明的一个实施方式中以确切的实验结果说明了该问题,应用haplo.score程序(Schaid等人,2001,http://www.mayo.edu/hsr/people/schaid.html),校正年龄、BMI、高血压、吸烟、饮酒、甘油三酯、高密度脂蛋白和血糖后,单体型A-G-A-T-A-A与心肌梗塞显著相关,并具有明显的保护作用(P=0.0064)。

另一方面,本发明提供了由本发明的标签单核苷酸多态性位点组成的AGTR1基因危险性单体型,该单体型在-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G位点的单核苷酸分别为A、A、A、T、A、A(单体型A-A-A-T-A-A);T、A、G、C、A、A(单体型T-A-G-C-A-A)或A、A、A、C、A、G(单体型A-A-A-C-A-G)。在本发明的一个实施方式中以确切的实验数据证明携带这样的危险性单体型的个体比携带保护性单体型的个体患心肌梗塞的危险性显著升高(OR值分别为1.33、1.75和2.64)。可以发现,这些危险性单体型在第10208位碱基均为A等位基因,随着-1106T、Leu191LeuC(43730C)和45035G等位基因的依次出现,个体患心肌梗塞的危险逐渐升高,提示这些位点之间具有协同作用。由此,可以看出,本发明采用单体型的方式检测个体忠心肌梗塞的危险性的方法比单独检测单核苷酸多态性的方法更具说服力,结果也更可靠。

本发明提供一种检测本发明的AGTR1基因的标签单核苷酸多态性位点的方法。可用

本领域已知的多种技术在DNA水平、RNA水平检测本发明AGTR1基因的标签单核苷酸多态性位点。例如,可以用放射性标记的反义RNA或DNA探针与扩增后的DNA序列杂交,以鉴别点突变。也可以基于已知的核苷酸顺序的改变,合成正常的和突变的PCR引物,在聚合酶链式反应(PCR反应)的底物中加入荧光标记的核苷酸,根据反应产物中有无荧光出现,确定在扩增所用的引物中有无碱基变化,从而检测突变。也可以采用限制性片段多态性分析(RFLP)来体外检测AGTR1基因序列的突变位点。限制性片断长度多态性分析方法的原理为:由于基因突变,导致限制性内切酶酶切位点改变、消失或产生新的位点,若用某种限制性内切酶酶切基因组DNA,则酶切后产生与正常基因组长度不同的DNA片段,检测这些DNA片段的大小和数量,判断是否产生突变。当与PCR结合后,这种检测方法的灵敏性和特异性更高。

在本发明的一个实施方式中,提供了一种利用以聚合酶链式反应与限制性片断长度多态性分析相结合(PCR-RFLP)来检测AGTR1基因的标签单核苷酸多态性位点的方法。这种利用PCR-RFLP来检测待测基因的具体方法是:在设计PCR扩增实验时,引物位于基因突变部位的两侧,先将目的基因扩增,使其易于检测,若突变引起已有的限制性内切酶位点改变,则可先用相应的限制性内切酶酶切扩增产物,再进行凝胶电泳观察,根据产物片断大小或数量与正常对照作出判断。若突变未能引起限制性内切酶位点改变,则通过碱基错配引入一个已知限制性内切酶位点,使得突变引起该限制性内切酶位点发生改变。在本发明的实施例1中给出一个示例性的方法,采用各自的PCR反应体系,对本发明AGTR1基因的标签单核苷酸多态性位点-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G位点进行PCR扩增反应,然后采用相应的限制性内切酶对PCR扩增产物进行酶切,根据产物片断大小或数量与正常对照作出判断。本领域普通技术人员已知,上述引物、限制性内切酶及其相应酶切图谱可以根据需要而改变只要适合检测本发明的标签单核苷酸多态性位点即可。

另外,通过DNA直接测序也可以直接揭示对照基因和携带突变基因之间的序列差异。目前可使用商业测序试剂盒或自动测序仪对DNA直接进行测序。各种DNA及DNA片段的核苷酸序列的测定也可用常规方法如双脱氧链终止法来完成。当与PCR结合使用时,这种方法的灵敏性大大提高。

在本发明的一个实施方式中(参见实施例1),提供了以聚合酶链式反应与直接测序法相结合来检测AGTR1基因的标签单核苷酸多态性位点的方法。具体方法如下:利用Oligo6.53软件设计PCR引物,扩增AGTR1基因的启动子区域(以转录起始位点上游大约1.2kb区域)、全部5个外显子,以及外显子/内含子交界区域,并在ABI3700测序仪上完成测序(测序结果分别为SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4或SEQ IDNO:5)。然后在SUN工作站上应用Phred/Phrap/consed程序进行序列拼接和DNA序列变异的识别(结果参见图2-17)。如果仅检测本发明AGTR1基因的标签单核苷酸多态性位点则可以只在该标签单核苷酸多态性位点附近设计引物(例如,本发明的实施例1中在PCR-RFLP用于PCR扩增的引物),扩增该标签单核苷酸多态性位点附近的区域,并在测序仪上完成测序。然后与Genbank公开的基因的相对序列进行比较,从而确定该标签单核苷酸多态性位点是否与Genbank公开的基因的相对序列一致,从而确定是否发生突变。

本发明还提供一种检测AGTR1基因的保护性单体型或危险性单体型的方法,该方法包括检测AGTR1基因的标签单核苷酸多态性位点。

检测AGTR1基因的标签单核苷酸多态性位点的方法可以为本领域已知的任何检测单核苷酸多态性的方法,例如可以为本说明书前面提到的利用放射性标记的反义RNA或DNA探针来检测,利用限制性片段多态性分析或直接测序等。优选利用聚合酶链式反应与限制性片断长度多态性分析相结合或聚合酶链式反应与直接测序法相结合来进行检测。此外,本发明检测AGTR1基因的保护性单体型或危险性单体型的方法还可包括对所述标签单核苷酸多态性位点的检测结果进行统计分析。统计分析可以是本领域常用的方法(如EH和PHASE等软件包)。在本发明的一个实施方式中,提供一种进行统计分析的方法,该方法利用haplo.score和haplo.glm程序(Schaid等人,2001,http://www.mayo.edu/hsr/people/schaid.html),校正年龄、BMI、高血压、吸烟、饮酒、甘油三酯、高密度脂蛋白和血糖后,对由本发明的标签单核苷酸多态性位点的结果进行统计分析,尤其对由本发明的标签单核苷酸多态性位点组成的单体型进行统计分析,从而得出了AGTR1基因的保护性单体型或危险性单体型。

本发明还提供一种体外检测心肌梗塞相关基因的方法,该方法包括检测AGTR1基因的标签单核苷酸多态性位点:-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G。本发明在大量实验及统计分析的基础上,选取了419例心肌梗塞男性患者和400例年龄匹配的男性健康对照作为研究对象,以确切的实验数据证明了AGTR1基因与心肌梗塞的关系,从而提供了心肌梗塞相关基因。

本发明还提供一种体外检测待测样品中是否含有AGTR1基因的保护性单体或危险性单体的方法,该方法包括:

1)提取待测样品的DNA,针对AGTR1基因的标签单核苷酸多态性位点:-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G设计引物进行PCR扩增;

2)对所述全部PCR产物进行分析;

3)鉴定-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G位点的单核苷酸多态,其构成的单体型是否为:A-G-A-T-A-A、A-A-A-T-A-A、T-A-G-C-A-A或A-A-A-C-A-G。

含有本发明的基因的待测样品可以从来自受试者的细胞获得,如来自血液、尿、唾液、胃液、头发,活组织检查和尸体解剖材料的细胞。优选来自血液。可以先从受试者的细胞获得含有本发明的基因的待测样品,然后按照常规方法提取基因的DNA,并针对AGTR1基因的标签单核苷酸多态性位点:-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G设计引物进行PCR扩增;对所述全部PCR产物进行分析,确定扩增片段是否合适;鉴定由-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G位点的单核苷酸多态构成的单体型是否为:A-G-A-T-A-A、A-A-A-T-A-A、T-A-G-C-A-A或A-A-A-C-A-G。

本发明提供一种体外预测待测个体患心肌梗塞的危险性的方法,该方法包括体外检测来自待测个体的样品中AGTR1基因的标签单核苷酸多态性位点:-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G,其中携带由上述位点的单核苷酸组成的单体型A-A-A-T-A-A、T-A-G-C-A-A或A-A-A-C-A-G的个体患心肌梗塞的危险性比携带单体型A-G-A-T-A-A的个体患心肌梗塞的危险性显著升高。所述待测个体优选为中国汉族人。本发明通过大量的实验(选取了419例心肌梗塞男性患者和400例年龄匹配的男性健康对照作为研究对象),应用haplo.glm程序(Lake等人,2003,http://www.mayo.edu/hsr/people/schaid.html),校正年龄、BMI、高血压、吸烟、饮酒、甘油三酯、高密度脂蛋白和血糖后,与单体型A-G-A-T-A-A相比,携带单体型A-A-A-T-A-A、T-A-G-C-A-A和A-A-A-C-A-G个体患心肌梗塞的危险显著升高(OR值分别为1.33、1.75和2.64)。尤其是携带A-A-A-C-A-G构象的单体型的个体患心肌梗塞的概率大大增加,风险增至2.64倍。据此,医生可以指导该个体改变不良生活习惯,降低环境因素对疾病的诱发。在本发明大样本的统计分析的基础上,可以单独使用本发明的方法,体外检测来自待测个体的样品中AGTR1基因的标签单核苷酸多态性位点:-1106A/T、10208A/G、32091A/G、43730T/C、44323A/C和45035A/G构成的单体型,以体外预测待测个体患心肌梗塞的危险性,也可以同时考虑其他环境危险因素,例如是否吸烟、是否高血压、是否糖尿病、是否血脂紊乱和是否有心梗家族史等,以达到体外预测待测个体患心肌梗塞危险性的目的。

另一方面,本发明还提供一种检测AGTR1基因的标签单核苷酸多态性位点的多态性的试剂盒,试剂盒含有:

1)扩增-1106A/T位点、10208A/G位点、32091A/G位点、43730T/C位点、44323A/C位点和/或45035A/G位点的引物;

2)PCR扩增酶及相应缓冲液;

3)检测-1106A/T、10208A/G位点、32091A/G位点、43730T/C位点、44323A/C位点和/或45035A/G位点的位点多态性的试剂。

所述试剂盒内可以装有一个或多个容器,容器内装有用以检测含有所述多态性位点的AGTR1基因的一种或多种组分。按照具体检测方法及检测多态性位点的不同,试剂盒可含有不同组分。与之同时提供的可以是经政府药物管理机构审核的、有关药品或生物制品制造、使用及销售的信息。本领域普通技术人员已知,所述扩增所述多态性位点的引物,可以依据本发明已知的核苷酸序列设计,通常为15-30个碱基,GC含量为45%-50%左右,在适当的温度下与模板特异性结合,其可以利用专门的计算机程序设计,例如(Oligo 6.53软件)。PCR扩增的酶可以为TagDNA聚合酶、Klenow片段,Tth DNA聚合酶,VENT DNA聚合酶等能够用于PCR扩增的酶。试剂盒中检测所述多态性的试剂根据检测方法的不同而不同。例如,采用聚合酶链式反应与限制性片断长度多态性分析相结合方法来检测所述多态性位点时,试剂盒中可以含有限制性内切酶和相应的酶切图谱,例如本发明实施例1中所述的限制性内切酶和相应的酶切图谱。所述检测AGTR1基因的标签单核苷酸多态性位点的多态性的试剂盒可以用于体外检测心肌梗塞相关基因,以及体外检测待测个体患心肌梗塞的危险性。

附图说明

图1 AGTR1基因在3号染色体的结构示意图。

图2 AGTR1基因-1106A/T多态测序图谱;从上至下,分别为AA、AT和TT基因型。

图3 AGTR1基因-778T/A多态测序图谱;从上至下,分别为AA、TT和TA基因型。

图4 AGTR1基因-681T/G多态测序图谱;从上至下,分别为GG、TT和TG基因型。

图5 AGTR1基因-478C/T多态测序图谱;从上至下,分别为TT、CT和CC基因型。

图6 AGTR1基因9920G/A多态测序图谱;从上至下,分别为GG和GA基因型。

图7 AGTR1基因10208A/G多态测序图谱;从上至下,分别为GG、GA和AA基因型。

图8 AGTR1基因32091A/G多态测序图谱;从上至下,分别为AA和AG基因型。

图9 AGTR1基因32203A/G多态测序图谱;从上至下,分别为AA和AG基因型。

图10 AGTR1基因32399A/G多态测序图谱;从上至下,分别为AA和AG基因型。

图11 AGTR1基因41880G/T多态测序图谱;从上至下,分别为GG和GT基因型。

图12 AGTR1基因41977T/C多态测序图谱;从上至下,分别为TT和TC基因型。

图13 AGTR1基因43042G/T多态测序图谱;从上至下,分别为GG和GT基因型。

图14 AGTR1基因Leu191Leu多态测序图谱;从上至下,分别为TT和TC基因型。

图15 AGTR1基因44323A/C多态测序图谱;从上至下,分别为AA和AC基因型。

图16 AGTR1基因45035A/G多态测序图谱;从上至下,分别为AA和AG基因型。

图17 AGTR1基因45126T/C多态测序图谱;从上至下,分别为TT和TC基因型。

图18 AGTR1基因-1106A/T酶切电泳结果示意图,其中泳道1为DNA标记DL2000。

图19 AGTR1基因10208A/G酶切电泳结果示意图,其中泳道9为DNA标记DL2000。

图20 AGTR1基因32091A/G酶切电泳结果示意图,其中泳道1为DNA标记DL2000。

图21 AGTR1基因Leu191Leu酶切电泳结果示意图,其中泳道9为DNA标记DL2000。

图22 AGTR1基因44323A/C酶切电泳结果示意图,其中泳道9为DNA标记DL2000。

图23 AGTR1基因45035A/G酶切电泳结果示意图,其中泳道1为DNA标记DL2000。

具体实施方式

实施例1 AGTR1基因标签SNPs的选择和检测

1、病例对照样本特征描述

病例的入选诊断标准为急性心肌梗塞诊断标准(根据WHO 1979年的诊断标准):即典型胸痛症状持续30分钟以上;心电图连续2个导联ST段抬高(肢体导联0.1mv,胸导联0.2mv)并有系列动态变化;心肌坏死的血清标记物浓度升高,如肌钙蛋白(TNT/TNI)升高,心肌同工酶(CK-MB)升高大于正常值高限的2倍。经各项检查除外心脏瓣膜疾病、先天性心脏病、心力衰竭、严重的肾脏及肝脏疾病、继发性高血压、心肌病、家族性高胆固醇血症及可疑冠心病患者。从1997年10月到2001年9月期间,随机选择在中国医学科学院阜外心血管病医院住院的北京地区的男性心肌梗塞患者共419例;同时随机选取居住在北京,年龄与病例匹配的社区男性人群400例。对照组入选标准:既往无冠心病或其他动脉粥样硬化病史,无胸痛、胸闷等心脏病症状,心电图无明显缺血性改变。病例组和对照组均为中国汉族人,且无血缘关系。临床特征描述见表1。

表1病例对照样本临床特征描述

    病例(n=419)    对照(n=400)    P值    年龄8BMI(kg/m2)收缩压(mmHg)舒张压(mmHg)高密度总胆固醇(mg/dl)低迷度总胆周醇(mg/dl)总胆固醇(mg/dl)甘油三酯(mg/dl)血糖(mg/dl)是否高血压患者(是/否)是否吸烟(是/否)是否饮酒(是/否)    54.27±9.7426.61±3.11127.42±19.8476.83±11.1840.52±9.10125.21±38.86198.91±40.94167.5±142.19106.32±34.36198/219321/98239/180    54.23±9.4124.56±3.15128.66±18.9980.91±10.3048.34±11.12124.5±33.65197.57±36.49123.96±76.1997.28±23.57137/263286/114208/191    0.9496<0.00010.3643<0.0001<0.00010.77900.6191<0.0001<0.00010.00010.09510.1585

数值为均值±标准差;BMI:体重指数

2、AGTR1基因序列变异筛查

从病例组中随机挑选48例心肌梗塞患者作为筛查对象,构成96条染色体,这个样本量可提供95%的把握度检测到少见等位基因频率大于1%的序列变异。所有个体均为汉族,且无任何血缘关系。从NCBI公开数据库中获得AGTR1全基因序列(Genbank序列号:185)。检测多态性的方法是利用PCR产物直接测序。利用Oligo6.53软件设计PCR引物,扩增AGTR1基因的启动子区域(以转录起始位点上游大约1.2kb区域)、全部5个外显子,以及外显子/内含子交界区域。引物序列见表2。

表2 AGTR1测序引物序列

反应类型测序区域5’上游引物3’下游引物序列扩增+测序反应外显子1-1相关区域5’CGTTGTCTTCCGTTATTATGTG 3’(SEQ ID NO:6)5’TTTCCTATGAGTAACTCGAACTT 3’(SEQ ID NO:7)序列扩增+测序反应外显子1-2相关区域5’TGTCCACCCTTGAATTTCATAAC 3’(SEQ ID NO:8)5’GAACGCCTTGCAGAGTCATAC 3’(SEQ ID NO:9)序列扩增+测序反应外显子2相关区域5’AAGAAATGGCTAGGAATGAGA 3’(SEQ ID NO:10)5’ATATTGGAGGGGATGTGGTAA 3’(SEQ ID NO:11)序列扩增+测序反应外显子3相关区域5’CCCCTTGCTGGTACTTTA 3’(SEQ ID NO:12)5’CCAGCAGGATGTCATCTAGT 3’(SEQ ID NO:13)序列扩增+测序反应外显子4相关区域5’GAAGGCAAAGAGACCACTTA 3’(SEQ ID NO:14)5’AATAGGTTTGGCTAGGATTATCA 3’(SEQ ID NO:15)序列扩增外显子5相关区域5’GCTTTCTTAGGCTTTATCAGTT 3’(SEQ ID NO:16)5’ACGATGTGTTTATTCCATGAC 3’(SEQ ID NO:17)测序反应外显子5-1相关区域5’GCTTTCTTAGGCTTTATCAGTT 3’(SEQ ID NO:18)外显子5-2相关区域5’ATTGCTTCAGCCAGCGTCAGT 3’(SEQ ID NO:19)外显子5-3相关区域5’TTCCCCACCAAATATTCACTT 3’(SEQ ID NO:20)外显子5-4相关区域5’CAGATGACGGCTGCTCGAAGA 3’(SEQ ID NO:21)外显子5-5相关区域5’ACGATGTGTTTATTCCATGAC 3’(SEQ ID NO:22)

表2中的测序引物,由于外显子1合并启动子区域大约有1.9kb,所以外显子1相关区域分成2个部分重叠的片段进行PCR和测序反应。同样道理,外显子5相关区域大约2kb,在序列扩增反应后,每大约500bp增加一条测序引物。在普通PCR仪上进行扩增及测序反应,其产物在ABI3700测序仪(美国PE公司)上读取序列。

其中,PCR反应体系(25μl)如下:基因组模板DNA 50ng(来自血液标本,按照常规方法将白细胞内的DNA用苯酚-氯仿法或者用盐析法提取出来即可)、dNTPs200μmol/L、Taq酶(Takara公司)1U、MgCl2 2.0mmol/L、Tris-HCl 10mmol/L、KCl 50mmol/L及引物200pmol/L。PCR反应条件见表3。

表3 AGTR1基因SNPs筛查PCR扩增反应条件

结果:在ABI3700(美国PE公司)测序仪上完成的测序结果如下:见SEQ ID NO:1(相当于AGTR1全基因序列的核苷酸序列第-1196-718位)、SEQ ID NO:2(相当于AGTR1全基因序列的核苷酸序列第9854-10384位)、SEQ ID NO:3(相当于AGTR1全基因序列的核苷酸序列第32109-32656位)、SEQ ID NO:4(相当于AGTR1全基因序列的核苷酸序列第41816-42414位)和SEQ ID NO:5(相当于AGTR1全基因序列的核苷酸序列第43035-45585位)。其中SEQ ID NO 1的第1197-1540位;SEQ ID NO 2的第308-391位;SEQ ID NO3的第289-346位;SEQ ID NO 4的第200-358位;SEQ ID NO 5的第172-1184位分别为外显子1、2、3、4和5。

在SUN工作站上应用Phred/Phrap/consed程序进行序列拼接和DNA序列变异的识别。Polypred是一个用于序列拼接的程序,可以用它来对DNA测序的结果进行分析,也可以用于寻找SNP位点。其工作平台是SUN工作站,远程用户可以在Linux界面下操作。它的看图原理就是分别将四种碱基赋予不同的颜色:A是绿色;T是红色;G是橙色;C是蓝色。Phred/Phrap/consed是其中的四个命令。具体操作如下:

登录进入Linux

创建四个文件夹:edit_dir;phd_dir;chromat_dir;poly_dir

将测序结果(图谱文件)输入到chromat_dir文件夹。

转入到edit_dir文件夹,运行Polyphrad和Consed命令

图谱分析结果出来,直接用目测可以看到系统用红色标出的SNP位点。

结果:16个SNPs的测序图谱见图2-17。其中,图5、8、9、10是DNA负链序列,这4个多态的命名根据与其互补的正链碱基定义。例如,图5显示G/A多态,取其互补碱基,则将第4个SNP定义为-478C/T多态。

3、AGTR1基因标签SNPs的选择

近几年来,SNP位点信息的有效利用以及基因组范围内连锁不平衡(linkagedisequilibrium,LD)研究的进一步发展,发现某些SNPs之间存在强LD,其中一些SNPs完全可以代表其它SNPs。这些具代表性的SNPs被称为标签SNPs或标签单核苷酸多态(taggingSNPs,tSNPs)。在大规模关联研究中,标签SNPs的选择在保证研究把握度的前提下,能够有效降低研究成本。目前,标签SNPs的选择方法大体可分两类:一是选择最少的SNPs解释最多的单体型(haplotype)变异度;二是基于相关系数(R2)选择与全部SNPs集合之间具有最大R2的最优SNPs集合。基于第一类方法的程序包有HaploBlockFinder(Zhang等人,2002,http://cgi.uc.edu/cgi-bin/kzhang/haploBlockFinder.cgi)、SNPtagger(Ke和Cardon,2003,http://www.well.ox.ac.uk/-xiayi/haplotype/index.html)等。基于第二类的程序包有tagSNPs(Stram等人,2003,http://www-rcf.usc.edu/-stram/tagsnpsvl.zip)和htSNP2(Chapman等人,2003,http://www-gene.cimr.cam.ac.uk/clayton/software)。本研究采用tagSNPs程序包,其算法基于R2选择可预测常见单体型的最优SNPs集合作为标签SNPs。参数设置:累计频率≥80%的单体型定义为常见单体型;R2≥0.7。

针对上述随机选择的48例病例,对AGTR1基因的启动子区域、全部5个外显子,以及外显子/内含子交界区域进行直接测序的基础上,共筛查到16个SNPs,其分布和频率见表4。LD分析发现某些SNPs之间具有较强LD(表5)。

表4 tSNPs在AGTR1基因上的位置、突变类型及少见等位基因频率

SNP名称分布区域在本发明AGTR1基因上的位置在序列表的序列中的位置突变类型dbSNP库编码*频率-1106A/T 5’侧翼-1106SEQ ID NO 1的第185位A突变为T  rs275650 0.202-778T/A 5’侧翼-778SEQ ID NO 1的第513位T突变为A  rs275651 0.202-681T/G 5’侧翼-681SEQ ID NO 1的第610位T突变为G  rs275652 0.202-478C/T 5’侧翼-478SEQ ID NO 1的第803位C突变为T  rs1492078 0.2629920G/A 内含子1(5’UTR)9920SEQ ID NO2的第162位G突变为ANONE0.02410208A/G 内含子2(5’UTR)10208SEQ ID NO2的第450位A突变为Grs22767360.34532091A/G 内含子2(5’UTR)32091SEQ ID NO 3的第78位A突变为Grs3889150.1932203A/G 内含子2(5’UTR)32203SEQ ID NO 3的第190位A突变为GNONE0.02432399A/G 内含子3(5’UTR)32399SEQ ID NO 3的第387位A突变为GNONE0.01241880G/T 内含子3(5’UTR)41880SEQ ID NO4的第160位G突变为TNONE0.01241977T/C 外显子4(5’UTR)41977SEQ ID NO4的第257位T突变为Crs18007660.17943042G/T 内含子4(5’UTR)43042SEQ ID NO 5的第103位G突变为TNONE0.036Leu191Leu 外显子5(Leu191Leu)43730SEQ ID NO 5的第791位T突变为Crs51820.2544323A/C 外显子5(3’UTR)44323SEQ ID NO 5的第1384位A突变为Crs51860.03645035A/G 外显子5(3’UTR)45035SEQ ID NO 5的第2096位A突变为Grs3804000.08345126T/C 3’侧翼45126SEQ ID NO 5的第2187位T突变为C  NONE 0.012

*NONE表示该多态不存在于dbSNP库

表5 16个SNPs之间的连锁不平衡系数(D’,下三角)和P值(上三角)

阴影表示校正120次多重检验后达到统计学显著性的D’值(P<0.0004)

结果:

本研究筛查出分布于AGTR1基因启动子区、外显子区以及外显子/内含子交界区的16个SNP,LD分析发现某些SNPs之间具有较强LD(表5)。应用tagSNPs程序包(Stram等,2003),依据上述参数定义,我们发现在中国汉族人群中,-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G等6个SNPs可以作为AGTR1基因的标签SNPs,其体R2值见表6。

表6中国北方汉族人群AGTR1基因单体型分布及标签SNP的选择

 IDa  单体型b    频率c(%)  累积频率(%)  Rh2d ABCDEF  000001000000000000000000000000001111001000101000111100000000000000000010001010000000000000001010    31.229.47.05.54.33.3  31.260.667.673.177.480.7  0.850.800.730.700.910.70

a单体型编号

b多态位点从左至右分别为SNP1-SNP16,0=常见多态,1=少见多态

c通过EM算法估计单体型频率(tagSNPs程序包提供)

d选择-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G等6个SNPs作为标签SNP得到的R2

4、AGTR1基因tSNPs的检测方法

利用PCR-RFLP方法检测的AGTR1基因tSNPs。

中国汉族人群中,AGTR1基因6个标签SNPs的PCR反应体系均为10μl:基因组模板DNA50ng、dNTPs200μmol/L、Taq酶(Takara公司)1U、MgCl2 2.0mmol/L、Tris-HCl 10mmol/L、KCl 50mmol/L及引物200pmol/L。PCR反应条件及酶切体系见表7。

表7标签SNPs基因分型PCR反应条件及酶切体系

AGTR1基因6个tSNPs的PCR引物及扩增序列和限制性内切酶如下:

1.-1106A/T

上游引物  5’TGTAGGCTTTGTCCATTTTT 3’(20bp)(SEQ ID NO:23)

下游引物  5’ATTGCACTGATTTGATCTTT 3’(20bp)(SEQ ID NO:24)

错配碱基  5’------------3’

限制性内切酶  DraI

PCR扩增序列  234bp

5’-TACTTCTTTAAATTTATTTTTATTGATACACAATAGATGTACACTTTTTAGGTACATGCAATAATTTAATGCCCCTCACTATAAATTCGGAGCTGCCTCCTCGCCGATGATTCCAGCGCCTGACAGCCAGGACCCCAGGCAGCAGCGAGTGACAGGACTTTTTAGGTACATGCAATAATTTAATGCATTCATAT

-3’(SEQ ID NO:25)

2.10208A/G

上游引物  5’CAGCAGTTTTCTTTAATGTGTCAcC 3’(25bp)(SEQ ID NO:26)

下游引物  5’AGAACACTGCTCAAAGGAATCA 3’(22bp)(SEQ ID NO:27)

错配碱基  5’------G->c------3’

限制性内切酶 HpaII

PCR扩增序列 282bp

5’-TGGGGAGAGCGCAAAAACCCACACACACCATTATCTTGTGAAAGAAGTAGAGGAAGCAGAAAATAATGAAATCCCAGTGTTACCACATCCCCTCCAATATACAGATTAAGAGCGTTTGTATTTATATGGTTTTAAACATAAATAACATCAGAATTACTAAGCTATTTCCATTCATGTACTGATAATGAATCATGTGAGAAAGTCCTTTGGCAAGGACTCCACATGGCCACAGG-3’(SEQ ID NO:28)

3.32091A/G

上游引物  5’CCCAATgTCTCTTACCCAAATTTGaT 3(26bp)(SEQ ID NO:29)

下游引物  5’TCTGGAAAATGATGATAATAATA 3’(23bp)(SEQ ID NO:30)

错配碱基  5’------T->g---C->a------3’

限制性内切酶 BclI

PCR扩增序列 239bp

5’-CAGGGAAAAAAATAAATTAAATTAGCCATTTACACCACAGTGTGAACTTAATAACACCAACAAAAGTTCCAAAGCTCTAGGGTCTCATAGCACCTCCAGATCCATGATCTCATTCGGTGTTTCCAACAATGTTTTGCACCAAACTGGACACATGCTTGCTACTTCATCATCCTCATCGTGAACATTAT-3’(SEQ ID NO:31)

4.Leu191Leu

上游引物  5’CAAAGTCACCTGCATCATCA 3’(20bp)(SEQ ID NO:32)

下游引物  5’AGGAAACAGGAAACCCAGTAT 3’(21bp)(SEQ ID NO:33)

错配碱基  5’--------3’

限制性内切酶 Hpy188I

PCR扩增序列 187bp

5’-TTTGGCTGCTGGCAGGCTTGGCCAGTTTGCCAGCTATAATCCATCGAAATGTATTTTTCATTGAGAACACCAATATTACAGTTTGTGCTTTCCATTATGAGTCCCAAAATTCAACCCTTCCGATAGGGCTGGGCCTGACCAAAAAT-3’(SEQ ID NO:34)

5.44323A/C

上游引物  5’CAGCACTTCACTACCAAATagGC 3’(23bp)(SEQ ID NO:35)

下游引物  5’GGAGATTGCATTTCTGTCAGTA 3’(22bp)(SEQ ID NO:36)

错配碱基  5’------G->a---A->g------3’

限制性内切酶 HaeIII

PCR扩增序列 236bp

5’-TTAGCTACTTTTCAGAATTGAAGGAGAAAATGCATTATGTGGACTGAACCGACTTTTCTAAAGCTCTGAACAAAAGCTTTTCTTTCCTTTTGCAACAAGACAAAGCAAAGCCACATTTTGCATTAGACAGATGACGGCTGCTCGAAGAACAATGTCAGAAACTCGATGAATGTGTTGATTTGAGAATTT-3’(SEQ ID NO:37)

6.45035A/G

上游引物5’AAAAGTATATATTCTACACAcATAT 3’(25bp)(SEQ ID NO:38)

下游引物  5’TCATTCAAGGTAGTCTTATT 3’(20bp)(SEQ ID NO:39)

错配碱基  5’------T->c------3’;

限制性内切酶 NdeI

PCR扩增序列 180bp

5’-TATATGTATATCTATATCTCTAAACTGCTGTTAATTGATTAAAATCTGGCAAAGTTATATTTACTTTAAAATAAAATAATTTTATTGCAATGTATTTATCTTCATTACTTAAAATAGATGCTAATTTATTTTAAAATAA-3’(SEQ ID NO:40)

上述扩增序列中,带有底纹的核苷酸序列为引物序列;带有下划线的核苷酸序列为限制性酶切识别位点;小写字母的核苷酸序列为错配碱基;斜体核苷酸为SNP突变。

AGTR1基因6个tSNPs的酶切电泳结果分别见图18-23。在酶切电泳结果中,DNA标记使用DL2000,从小到大片断分别为100bp、250bp、500bp、750bp、1000bp和2000bp。

(1)-1106A/T多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,56℃30秒,72℃40秒,循环35周后于72℃延伸7分钟。PCR产物选用DraI限制性内切酶(Takara公司,日本),酶切识别序列TTT*AAA(*代表酶切位置,下划线表示突变位点),酶切条件参见厂家操作手册。酶切体系(15μl):DraI酶10U、Buffer:1.5μl、ddH2O:2.8μl、PCR产物:10μl,37℃过夜。

结果:当SNP为A等位基因,234碱基长的PCR产物被切割为31和203两个片断;若为T等位基因,则PCR产物不被切割。如图18所示,1、2和8泳道产生234和203两种片断,所以为A/T杂合子;3、4、5和6泳道只产生203片断,所以为AA纯合子;7泳道只产生234片断,所以为TT纯合子。(注:切割下的31bp片断因为较小,未能显示在图上)

(2)10208A/G多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,61℃30秒,72℃40秒,循环30周后于72℃延伸7分钟。PCR产物选用HpaII限制性内切酶(MBI公司,加拿大),酶切识别序列C*CGG(*代表酶切位置,下划线表示突变位点),酶切条件参见厂家操作手册。酶切体系(15μl):HpaII酶10U、Buffer:1.5μl、ddH2O:2.5μl、PCR产物:10μl,37℃过夜。

结果:当SNP为G等位基因,282碱基长的PCR产物被切割为24和258两个片断;若为A等位基因,则PCR产物不被切割。如图19所示,1、2、3和6泳道产生282和258两种片断,所以为A/G杂合子;4泳道只产生258片断,所以为GG纯合子;5、7和8泳道只产生282片断,所以为AA纯合子。(注:切割下的24bp片断因为较小,未能显示在图上)

(3)32091A/G多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,56℃30秒,72℃40秒,循环30周后于72℃延伸7分钟。PCR产物选用BclI限制性内切酶(MBI公司,加拿大),酶切识别序列T*GATCA(*代表酶切位置,下划线表示突变位点),酶切条件参见厂家操作手册。酶切体系(15μl):BclI酶8U、Buffer:1.5μl、ddH2O:2.7μl、PCR产物:10μl,55℃过夜。

结果:当SNP为A等位基因,239碱基长的PCR产物被切割为23和216两个片断;若为G等位基因,则PCR产物不被切割。如图20所示,1和7泳道产生239和216两种片断,所以为A/G杂合子;2-6和8泳道只产生216片断,所以为AA纯合子。本图没有GG纯合子带型。(注:切割下的23bp片断因为较小,未能显示在图上)

(4)Leu191Leu(43730T/C)多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,60℃30秒,72℃40秒,循环35周后于72℃延伸7分钟。PCR产物选用Hpy188I限制性内切酶(NEB公司,美国),酶切识别序列TCN*GA(*代表酶切位置,下划线表示突变位点,N表示任意碱基),酶切条件参见厂家操作手册。酶切体系(15μl):Hpy188I酶8U、Buffer:1.5μl、ddH2O:2.7μl、PCR产物:10μl,37℃过夜。

结果:当SNP为T等位基因,187碱基长的PCR产物被切割为141和46两个片断;若为C等位基因,则PCR产物不被切割。如图21所示,1、2、4、5、6和8泳道产生187和141两种片断,所以为T/C杂合子;3泳道只产生141片断,所以为TT纯合子。7泳道只产生187片断,所以为CC纯合子。(注:切割下的46bp片断因为较小,未能显示在图上)

(5)44323A/C多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,56℃30秒,72℃40秒,循环30周后于72℃延伸7分钟。PCR产物选用HaeIII限制性内切酶(MBI公司,加拿大),酶切识别序列GG*CC(*代表酶切位置,下划线表示突变位点),酶切条件参见厂家操作手册。酶切体系(15μl):Haem酶10U、Buffer:1.5μl、ddH2O:2.5μl、PCR产物:10μl,37℃过夜。

结果:当SNP为C等位基因,236碱基长的PCR产物被切割为22和213两个片断;若为A等位基因,则PCR产物不被切割。如图22所示,3泳道产生236和213两种片断,所以为A/C杂合子;1、2和4-8泳道只产生236片断,所以为AA纯合子。本图没有CC纯合子带型。(注:切割下的22bp片断因为较小,未能显示在图上)

(6)45035A/G多态基因分型:PCR反应体系见上。在96孔PCR自动循环仪9700(美国PE公司)上进行PCR反应,PCR循环参数:95℃预变性5分钟,经94℃45秒,48℃30秒,72℃40秒,循环30周后于72℃延伸7分钟。PCR产物选用Nde限制性内切酶(Takara公司,日本),酶切识别序列CA*TATG(*代表酶切位置,下划线表示突变位点,N表示任意碱基),酶切条件参见厂家操作手册。酶切体系(15μl):Hpy188I酶8U、Buffer:1.5μl、ddH2O:2.5μl、PCR产物:10μl,37℃过夜。

结果:当SNP为G等位基因,180碱基长的PCR产物被切割为22和158两个片断;若为A等位基因,则PCR产物不被切割。如图23所示,3泳道产生180和158两种片断,所以为A/G杂合子;2和4-8泳道只产生180片断,所以为AA纯合子。1泳道只产生158片断,所以为GG纯合子。(注:切割下的22bp片断因为较小,未能显示在图上)。

实施例2中国汉族男性人群中AGTR1基因tSNPs和心肌梗塞的相关性

1、病例对照样本

特征描述具体见实施例1。

2、AGTR1基因tSNPs在病例对照样本中的频率分布

-1106A/T多态T等位基因频率病例组显著高于对照组,10208A/G多态A等位基因频率病例组显著高于对照组,45035A/G基因型分布在病例组和对照组有显著差异,其余多态基因型分布和等位基因频率在病例组和对照组均没有显著差异。见表8。

表8 AGTR1基因tSNPs在病例对照样本中的频率分布

 病例    对照  P值 (n=419)    (n=400) -1106A/T10208A/G32091A/GLeu191Leu44323A/C45035A/G  AA/AT/TTA/TAA/AG/GGA/GAA/AG/GGA/GTT/TC/CCT/CAA/AC/CCA/CAA/AG/GGA/G 300/101/160.84/0.16176/186/560.64/0.36273/126/180.81/0.19189/195/320.69/0.31372/44/10.94/0.06310/105/30.87/0.13    308/80/70.88/0.12145/174/710.59/0.41264/115/160.81/0.19204/158/350.71/0.29357/39/40.94/0.06319/71/60.90/0.10  NS0.0187NS0.04NSNSNSNSNSNS0.0286NS

NS:无统计学意义

3、AGTR1基因tSNPs组成的单体型

-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G等6个tSNPs组成的常见单体型(频率>3%)见表9。其中Leu191Leu是在第43730位的T/C多态。单体型中各个位点的顺序与这些位点在染色体上的顺序一致。

4、AGTR1基因tSNPs单体型与心肌梗塞的关系

应用haplo.score程序(Schaid等人,2001,http://www.mayo.edu/hsr/people/schaid.html),校正年龄、BMI、高血压、吸烟、饮酒、甘油三酯、高密度脂蛋白和血糖后,单体型A-G-A-T-A-A与心肌梗塞显著相关,并具有明显的保护作用(P=0.0064)。见表9。

表9校正环境因素后,AGTR1基因tSNPs单体型和心肌梗塞相关性的score检验

  单体型 含义*  单体型频率  Score值  P值  病例  对照  合计  Hap1Hap2Hap3Hap4Hap5Hap6Hap7Hap8 A-G-A-T-A-AA-A-G-C-C-AA-A-G-C-A-AA-G-A-C-A-GT-A-A-T-A-AA-A-A-T-A-AT-A-G-C-A-AA-A-A-C-A-G  0.2480.0270.0470.0630.0490.3550.0570.037  0.2900.0360.0610.0740.0500.3380.0430.021  0.2690.0320.0540.0680.0480.3460.0510.030  -2.73-0.71-0.25-0.240.690.731.351.94  0.00640.47920.80110.81260.48760.46510.17850.0528

*含义分别为对应于-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G多态性位点的单个核苷酸。例如,对于单体型Hap1,A-G-A-T-A-A的含义为在-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G位点的单核苷酸分别为A、G、A、T、A、A,其余类推。

5、提高心肌梗塞患病危险的AGTR1基因tSNPs单体型

应用haplo.glm程序(Lake等人,2003,http://www.mayo.edu/hsr/people/schaid.html),校正年龄、BMI、高血压、吸烟、饮酒、甘油三酯、高密度脂蛋白和血糖后,与单体型A-G-A-T-A-A(Hap1)相比,携带单体型A-A-A-T-A-A(Hap6)、T-A-G-C-A-A(Hap7)和A-A-A-C-A-G(Hap8)个体忠心肌梗塞的危险显著升高(OR值分别为1.33、1.75和2.64)。见表10。可以发现,Hap6-8在第10208位碱基均为A等位基因,随着-1106T、43730C和45035G等位基因的依次出现,个体患心肌梗塞的危险逐渐升高,提示这些位点之间具有协同作用。见表10。

表10 AGTR1基因tSNPs单体型对于心肌梗塞的相对危险性

  模型  变量 单体型含义  Odds Ratio(95%CI)  P值  环境变量单体型  高血压吸烟饮酒年龄BMI甘油三酯高密度脂蛋白血糖Hap1Hap2Hap3Hap4Hap5Hap6Hap7Hap8A-G-A-T-A-AA-A-G-C-C-AA-A-G-C-A-AA-G-A-C-A-GT-A-A-T-A-AA-A-A-T-A-AT-A-G-C-A-AA-A-A-C-A-G  1.27(0.909-1.769)1.06(0.727-1.556)1.06(0.757-1.476)1.01(0.994-1.029)1.15(1.091-1.216)1.00(0.998-1.002)0.93(0.916-0.951)1.01(1.001-1.013)1.00(参考)0.93(0.46-1.88)1.12(0.64-1.95)1.11(0.65-1.90)1.41(0.78-2.53)1.33(0.99-1.79)1.75(1.00-3.08)2.64(1.10-6.33)  0.08080.3750.3720.1031.75×10-70.3841.12×10-120.0142...0.4240.3460.3530.1270.0290.0260.015

*单体型含义分别为对应于-1106A/T、10208A/G、32091A/G、Leu191Leu、44323A/C和45035A/G多态性位点的单个核苷酸。

6、结论

根据上述研究,本发明发现了与心肌梗塞相关的6个重要AGTR1基因变异位点:-1106A/T、10208A/G、32091A/G、Leu191Leu(43730T/C)、44323A/C和45035A/G。这6个位点的特定组合,大大增加了个体罹患心肌梗塞的风险。这一发现在临床上具有潜在的应用价值:对AGTR1基因的这6个位点进行基因型鉴定,若是发现某个体携带A-A-A-T-A-A、T-A-G-C-A-A或A-A-A-C-A-G单体型,则该个体与携带A-G-A-T-A-A单体型的个体相比,患心肌梗塞的风险显著升高。尤其是携带-1106A 10208A 32019A 43730C 44323A 45035G构象的单体型的个体患心肌梗塞的概率大大增加,风险增至2.64倍。据此,医生可以指导该个体改变不良生活习惯,降低环境因素对疾病的诱发。可见,AGTR1基因标签SNP组成的单体型在心肌梗塞的预测和预防中有重要的应用前景。

                                序列表

<110>中国医学科学院阜外心血管病医院

     北京诺赛基因组研究中心有限公司

<120>AGTR1基因标签单核苷酸多态性位点及其组成的单体型

<130>D0404011F

<160>40

<170>PatentIn version 3.1

<210>1

<211>1914

<212>DNA

<213>智人

<400>1

cgttgtcttc cgttattatg tgtgatatta gttaagtttt tcataaataa acttcacagt     60

ttgaggaagt tcctattcct agtttgttga gtgttagcat gaaaaagtgt tgaattttgt     120

ccaatagttt ttaaaaattt ttttagacaa tcatgtaggc tttgtccatt ttttacttct     180

ttaaatttat ttttattgat acacaataga tgtacacttt ttaggtacat gcaataattt     240

aatgcccctc actataaatt cggagctgcc tcctcgccga tgattccagc gcctgacagc     300

caggacccca ggcagcagcg agtgacagga ctttttaggt acatgcaata atttaatgca     360

ttcatataaa gatcaaatca gtgcaattgg catatccatc accttaaata tttgtctttt     420

cttcatgcta gaaacattca agttattttc tcctagctac tctgaaatat acaatagatt     480

actgtaaact acagtcaccc tactcaccta tctaacatta attgattttt ggtaaactaa     540

tctaatcttg ctttctggca tcaacctcac ttgaccatgg tgtatagtcc ctttcatatg     600

ttattggatt caatttgcct acattttgtt gagaattttt atctatactc ttaagaaata     660

ttgatctgta gtctcgtgat gtctttatct ggttttgtta tcagggtgat actggcctca     720

tagcatgagt tgggagatca tccttactct tctatttttt ggaagagttt gtgaagaatt     780

gatattattt cttctttaaa tatttattgg gtttttaaaa tacattttta aaatgcaact     840

tgggtagcat gtccaatagg aacaaatgag tgtccaccct tgaatttcat aaccctggaa     900

ttaatccatg taatctatga tccacaactg tattaccaaa gttcgagtta ctcataggaa     960

agagaaagaa gttctctaat tcgtccttaa aagttttcca agttcagaaa aaaaaaatgt     1020

tgaagaacac gaatctccgc aggaaatgat actcctgtac ccccagctcg ctctccctca     1080

cgacccctcg ctaggcgggg ttcgggacca ggtgaacgct gatctgatag ttgacacggg     1140

acgactgtgg catcatcctt gctgccgtca atatcccgag agggaggagg ttgggccggg     1200

agggtctccc ggggcggggc ggaggaggag ggaatgcaaa acagagcctc gtccccggaa     1260

cccaagaagc agcaacgccc ctcactataa attcggagct gcctcctcgc caatgattcc     1320

agcgcctgac agccaggacc ccaggcagca gcgagtgaca ggacgtctgg accggcgcgc     1380

cgctagcagc tctgccgggc cgcggcggtg atcgatgggg agcggctgga gcggacccag     1440

cgagtgaggg cgcacagccg ggacgccgag gcggcgggcg ggagacccgc accagcgcag     1500

ccggccctcg gcgggacgtg acgcagcgcc cggggcgcgg gtgagtccgc gcggaccgcc     1560

aggcatgctt gggggacttc aagggcgggg tgctaagttt catgtcacgg tgtcctaact     1620

gctggctcta tactgggaag ctctcgggga ccaaggaaag agcgaccgta gttctggtca     1680

gcgcctgccc ctggagctgg ccacactttc ccaaatcagg tgaggggctt ctggaatggg     1740

agggaacaag gtaggtttgt ttgccacgtg cctcgaaatt ctcaatccat tttaaccaaa     1800

ctcttccgag tgcaaggaag aaatctacag aaataagatg caattcaata aactttcttc     1860

ctgaggcttt tagttaactc ttgtatttta gccatcatct gagcgggaag ccgg           1914

<210>2

<211>531

<212>DNA

<213>智人

<400>2

aagaaatggc taggaatgag actgcactat tttaccctaa aacgttcttt ttctctttgc     60

ctaatgtata tctacaaggg cattggggaa gatgttgacc acaggcagga agatgatgag     120

atcctgtgcc caccacttaa tgcagtctag ctctatataa ggaaaaatat gttcttgatg     180

tgaaccagat ggtttcactc ccttcaaaaa cactcttaag atgcagtgtg gaagcttact     240

ctgtaaatta aaaaataaaa acctgactat attcagtgga atgcgttaat catttttttc     300

tttttaggtt tgatatttga caaattgatc taaaatggct gggtttttat ctgaataact     360

cactgatgcc atcccagaaa gtcggcacca ggtaaatgcc ttacatctac agcagtgggt     420

ctgtcagcag ttttctttaa tgtgtcagca gtggggagag cgcaaaaacc cacacacacc     480

attatcttgt gaaagaagta gaggaagcag aaaataatga aatcccagtg t              531

<210>3

<211>548

<212>DNA

<213>智人

<400>3

ccccttgctg gtactttagt ttcttccact tctagcacca cgtgtagttt cccaatttct     60

cttacccaaa tttgctcgca gggaaaaaaa taaattaaat tagccattta caccacagtg     120

tgaacttaat aacaccaaca aaagttccaa agctctaggg tctcatagca cctccagatc     180

catgatctca ttcggtgttt ccaacaatgt tttgcaccaa actggacaca tgcttgctac     240

ttcatcatcc tcatcgtgaa cattattatt attatcatca ttttccagat gaagaaaatg     300

aatcacaagt caactgacag tccaaaggct ccacagctca gaggaggtaa atcatgtgct     360

taattcagaa cttttggctc ccatcactat gctcttccca ctgtcttaac tctggttgtc     420

acctgagcca ttgtgtttct tctcaggtag atcttagttc ttcctgagaa ggtatgaagg     480

tgggtattcc accctacctg aattatagga atttcagata tctgtgagca gctgcaaagg     540

ggatttta                                                              548

<210>4

<211>599

<212>DNA

<213>智人

<400>4

aaggcaaaga gaccacttaa gaactccttc acatgtgtta tgtcttaaaa gctgactact     60

ggagttgtat cccttgcaca gcatcccttt gcaccaaagt gaacactact ctaagaacat     120

gtgttcagct ctcctgaatg ccaagcacaa ccatgcttgg catggcagtg gtgtcttatt     180

tctgctcctc tttttcccca gggcatgcca ttgcaagaga atgctcagcc atgttcatct     240

ggggacctgc tcctggtaga gcaataggat ctgtgtgccc agcaccactg cccacctagc     300

tgtcctggcc tgtgcccaat gctgaccttc acctcagagt gtggctgtac cacattcggt     360

gatgtcactc tcactgaacc ttcagcctcc ttcctgggac ttcctgatgg actgttatcc     420

agggcagaat gtgttgattt tctaaatcac ataaatgaat agcttgactg ttgattatgt     480

agaaaatcag agcaaatatt tgcatggctt tgtgcagccc attcttgagc atctgattct     540

ccccagaatt ctaaaaaacc tgctgctttc tcaagccctc agtaaagaca tgctttctt      599

<210>5

<211>2551

<212>DNA

<213>智人

<400>5

gctttcttag gctttatcag ttcacagtgt ttccttaaga aatatgatcc agtatttttt    60

cctaagacta aagttgagtt actacgttta tgactgagaa atgaatgttt gttagtttgt    120

ttgtttacaa taagaatttt ttctttacca ttttattttt attttcccca ggtgtatttg    180

atatagtgtt tgcaacaaat tcgacccagg tgatcaaaat gattctcaac tcttctactg    240

aagatggtat taaaagaatc caagatgatt gtcccaaagc tggaaggcat aattacatat    300

ttgtcatgat tcctacttta tacagtatca tctttgtggt gggaatattt ggaaacagct    360

tggtggtgat agtcatttac ttttatatga agctgaagac tgtggccagt gtttttcttt    420

tgaatttagc actggctgac ttatgctttt tactgacttt gccactatgg gctgtctaca    480

cagctatgga ataccgctgg ccctttggca attacctatg taagattgct tcagccagcg    540

tcagtttcaa cctgtacgct agtgtgtttc tactcacgtg tctcagcatt gatcgatacc    600

tggctattgt tcacccaatg aagtcccgcc ttcgacgcac aatgcttgta gccaaagtca    660

cctgcatcat catttggctg ctggcaggct tggccagttt gccagctata atccatcgaa    720

atgtattttt cattgagaac accaatatta cagtttgtgc tttccattat gagtcccaaa    780

attcaaccct cccgataggg ctgggcctga ccaaaaatat actgggtttc ctgtttcctt    840

ttctgatcat tcttacaagt tatactctta tttggaaggc cctaaagaag gcttatgaaa    900

ttcagaagaa caaaccaaga aatgatgata tttttaagat aattatggca attgtgcttt    960

tctttttctt ttcctggatt ccccaccaaa tattcacttt tctggatgta ttgattcaac    1020

taggcatcat acgtgactgt agaattgcag atattgtgga cacggccatg cctatcacca    1080

tttgtatagc ttattttaac aattgcctga atcctctttt ttatggcttt ctggggaaaa    1140

aatttaaaag atattttctc cagcttctaa aatatattcc cccaaaagcc aaatcccact    1200

caaacctttc aacaaaaatg agcacgcttt cctaccgccc ctcagataat gtaagctcat    1260

ccaccaagaa gcctgcacca tgttttgagg ttgagtgaca tgttcgaaac ctgtccataa    1320

agtaattttg tgaaagaagg agcaagagaa cattcctctg cagcacttca ctaccaaatg    1380

agcattagct acttttcaga attgaaggag aaaatgcatt atgtggactg aaccgacttt    1440

tctaaagctc tgaacaaaag cttttctttc cttttgcaac aagacaaagc aaagccacat    1500

tttgcattag acagatgacg gctgctcgaa gaacaatgtc agaaactcga tgaatgtgtt    1560

gatttgagaa attttactga cagaaatgca atctccctag cctgcttttg tcctgttatt    1620

ttttatttcc acataaaggt atttagaata tattaaatcg ttagaggagc aacaggagat    1680

gagagttcca gattgttctg tccagtttcc aaagggcagt aaagttttcg tgccggtttt    1740

cagctattag caactgtgct acacttgcac ctggtactgc acattttgta caaagatatg    1800

ctaagcagta gtcgtcaagt tgcagatctt tttgtgaaat tcaacctgtg tcttataggt    1860

ttccactgcc aaaacaatgc ccgtaagatg gcttatttgt ataatggtgt tactaaagtc    1920

acatataaaa gttaaactac ttgtaaaggt gctgcactgg tcccaagtag tagtgtcttc    1980

ctagtatatt agtttgattt aatatctgag aagtgtatat agtttgtggt aaaaagatta    2040

tatatcataa agtatgcctt cctgtttaaa aaaagtatat attctacaca tatatgtata    2100

tgtatatcta tatctctaaa ctgctgttaa ttgattaaaa tctggcaaag ttatatttac    2160

tttaaaataa aataatttta ttgcaatgta tttatcttca ttacttaaaa tagatgctaa    2220

tttattttaa aataagacta ccttgaatga gtatgaatat atttttattt aaattttgat    2280

acaactgata gtttaatact attggttata gattttttat cctgacattg aaaagttaaa    2340

gaaaaaacat tttgttctac tgcatgtcat ggaataaaca catcgttttg aatttttcag    2400

tttttcacat aacaaagaaa aaaattaact cttgctataa tgctagaata atacattatt    2460

ttacaagtaa tttaataaca gaatttttct aattgtatac attatcattg taggaaagtt    2520

agaagatata gaataacata aaaataaaag t                                   2551

<210>6

<211>22

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>6

cgttgtcttc cgttattatg  tg                                             22

<210>7

<211>23

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>7

tttcctatga gtaactcgaa ctt                                             23

<210>8

<211>23

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>8

tgtccaccct tgaatttcat aac                                             23

<210>9

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>9

gaacgccttg cagagtcata c                                               21

<210>10

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>10

aagaaatggc taggaatgag a                                               21

<210>11

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>11

atattggagg ggatgtggta a                                               21

<210>12

<211>18

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>12

ccccttgctg gtacttta                                                   18

<210>13

<211>20

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>13

ccagcaggat gtcatctagt                                                 20

<210>14

<211>20

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>14

gaaggcaaag agaccactta                                                 20

<210>15

<211>23

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>15

aataggtttg gctaggatta tca                                             23

<210>16

<211>22

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>16

gctttcttag gctttatcag tt                                              22

<210>17

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>17

acgatgtgtt tattccatga c                                              21

<210>18

<211>22

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>18

gctttcttag gctttatcag tt                                            22

<210>19

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>19

attgcttcag ccagcgtcag t                                             21

<210>20

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>20

ttccccacca aatattcact t                                               21

<210>21

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>21

cagatgacgg ctgctcgaag a                                               21

<210>22

<211>21

<212>DNA

<213>人工序列

<220>

<223>测序引物

<400>22

acgatgtgtt tattccatga c                                               21

<210>23

<211>20

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>23

tgtaggcttt gtccattttt                                                 20

<210>24

<211>20

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>24

attgcactga tttgatcttt                                                 20

<210>25

<211>234

<212>DNA

<213>

<400>25

tgtaggcttt gtccattttt tacttcttta aatttatttt tattgataca caatagatgt    60

acacttttta ggtacatgca ataatttaat gcccctcact ataaattcgg agctgcctcc    120

tcgccgatga ttccagcgcc tgacagccag gaccccaggc agcagcgagt gacaggactt    180

tttaggtaca tgcaataatt taatgcattc atataaagat caaatcagtg caat          234

<210>26

<211>25

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>26

cagcagtttt ctttaatgtg tcacc                                           25

<210>27

<211>22

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>27

agaacactgc tcaaaggaat ca                                              22

<210>28

<211>282

<212>DNA

<213>

<400>28

 cagcagtttt ctttaatgtg tcaccggtgg ggagagcgca aaaacccaca cacaccatta    60

 tcttgtgaaa gaagtagagg aagcagaaaa taatgaaatc ccagtgttac cacatcccct    120

 ccaatataca gattaagagc gtttgtattt atatggtttt aaacataaat aacatcagaa    180

 ttactaagct atttccattc atgtactgat aatgaatcat gtgagaaagt cctttggcaa    240

 ggactccaca tggccacagg tgattccttt gagcagtgtt ct                       282

<210>29

<211>26

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>29

cccaatgtct cttacccaaa tttgat                                         26

<210>30

<211>23

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>30

tctggaaaat gatgataata ata                                           23

<210>31

<211>239

<212>DNA

<213>

<400>31

cccaatgtct cttacccaaa tttgatcaca gggaaaaaaa taaattaaat tagccattta    60

caccacagtg tgaacttaat aacaccaaca aaagttccaa agctctaggg tctcatagca    120

cctccagatc catgatctca ttcggtgttt ccaacaatgt tttgcaccaa actggacaca    180

tgcttgctac ttcatcatcc tcatcgtgaa cattattatt attatcatca ttttccaga     239

<210>32

<211>20

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>32

caaagtcacc tgcatcatca                                                20

<210>33

<211>21

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>33

aggaaacagg aaacccagta t                                              21

<210>34

<211>187

<212>DNA

<213>

<400>34

caaagtcacc tgcatcatca tttggctgct ggcaggcttg gccagtttgc cagctataat    60

ccatcgaaat gtatttttca ttgagaacac caatattaca gtttgtgctt tccattatga    120

gtcccaaaat tcaacccttc cgatagggct gggcctgacc aaaaatatac tgggtttcct    180

gtttcct                                                              187

<210>35

<211>23

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>35

cagcact tca ctaccaaata ggc                                           23

<210>36

<211>22

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>36

ggagattgca tttctgtcag ta                                             22

<210>37

<211>236

<212>DNA

<213>

<400>37

cagcacttca ctaccaaata ggccttagct acttttcaga attgaaggag aaaatgcatt    60

atgtggactg aaccgacttt tctaaagctc tgaacaaaag cttttctttc cttttgcaac    120

aagacaaagc aaagccacat tttgcattag acagatgacg gctgctcgaa gaacaatgtc    180

agaaactcga tgaatgtgtt gatttgagaa attttactga cagaaatgca atctcc        236

<210>38

<211>25

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>38

aaaagtatat attctacaca catat                                          25

<210>39

<211>20

<212>DNA

<213>人工序列

<220>

<223>扩增引物

<400>39

tcattcaagg tagtcttatt                                                20

<210>40

<211>180

<212>DNA

<213>

<400>40

aaaagtatat attctacaca catatgtata tgtatatcta tatctctaaa ctgctgttaa    60

ttgattaaaa tctggcaaag ttatatttac tttaaaataa aataatttta ttgcaatgta    120

tttatcttca ttacttaaaa tagatgctaa tttattttaa aataagacta ccttgaatga    180

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号