首页> 中国专利> 与深部静脉血栓形成关联的遗传缺陷存在的筛选方法

与深部静脉血栓形成关联的遗传缺陷存在的筛选方法

摘要

本发明涉及用于在个体中筛选其基因组中是深部静脉血栓形成风险增加指示的遗传标记的存在的方法,其中所述遗传标记是如图5A中给出的纤维蛋白原γ基因单元型2(FGG-H2)。遗传标记包括在编码纤维蛋白原γ的核酸材料中一组1、2、3或4个突变,所述突变选自129A/T(rs2066854)、7874G/A(rs20668β1)、9615C/T(rs2066864)和10034C/T(rs2066865)。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-08-07

    授权

    授权

  • 2008-05-28

    实质审查的生效

    实质审查的生效

  • 2008-04-02

    公开

    公开

说明书

本发明涉及筛选与静脉血栓形成特别是深部静脉血栓形成关联的 遗传缺陷存在的方法。本发明进一步涉及用于在该方法中使用的诊断 试剂盒。

静脉血栓形成(VT)是通过已在静脉中局部形成或已从其他地方 的血栓释放(栓塞形成)的凝块闭塞循环。血栓形成的通常位点是腿 的表面和深部静脉,但它也可以发生在脑、视网膜、肝和肠系膜中的 静脉中。主要并发症是血栓形成后综合征和由于肺栓塞的死亡,其分 别在20-40%和1-2%的患者中发生。在发达国家中,VT的年发生 率为约1/1000。

静脉血栓形成是多病因疾病。除了众所周知的获得性危险因素如 固定、近期手术或创伤、妊娠期及产褥期、以及最近使用口服避孕药 之外,还存在几种关于VT的遗传危险因子,如因子V Leiden和凝血 酶原20210A突变。

本发明的目的是提供筛选方法,其使得能够测定在个体中关于静 脉血栓形成特别是深部静脉血栓形成的遗传危险因子的存在。

这个目的通过鉴别纤维蛋白原γ单元型(haplotype)(在本上下 文中定义为一系列共同遗传的单核苷酸多态性(SNPs))来解决,其 与血浆纤维蛋白原γ′水平减少、纤维蛋白原γ′/总纤维蛋白原比率 (γ′/γ)减少和深部静脉血栓形成(DVT)危险增加相关。

纤维蛋白原是止血系统的主要成分,是纤维蛋白的前体,凝血级 联的最终产物。纤维蛋白原通过凝血酶的限制性蛋白水解转化为纤维 蛋白,这暴露纤维蛋白单体上的聚合位点。这些单体自发地缔合以形 成不溶性纤维蛋白。激活的因子XIII形成邻近的纤维蛋白单体之间的 共价键。这些交联增强纤维蛋白凝块并增加其对通过纤维蛋白溶解系 统的降解的抵抗力。

通过Fiona Green(http://www.well.ox.ac.uk/~ fionag/fibrinogen.shtml)在图1中描述的纤维蛋白原是分子量为 340kDa的血浆糖蛋白,其主要由肝细胞合成。它在血浆中以大约9μ M(3g/L)的浓度循环。纤维蛋白原分子是长45nm的结构,具有2 个外部D结构域,所述D结构域通过卷曲螺旋区段连接至中心E结构 域。它们由2个对称的半分子组成,各自包含一组称为Aα、Bβ和γ 的3条不同的多肽链。3条链由编码纤维蛋白原α(FGA)、纤维蛋白 原β(FGB)和纤维蛋白原γ(FGG)的3种分离的基因编码,所述3 种基因在染色体4q31.3上大约50kb的区域中成簇。

FGG基因包含10个外显子并且定位与包含6个外显子的FGA基因 串联。它们以与FGB基因相反的方向转录,所述FGB基因位于FGA基 因下游并且包含8个外显子。

可变剪接可以发生在FGA和FGG基因中。循环纤维蛋白原中占优 势的Aα链包含610个氨基酸残基,而可替代的Aα链包含846个氨基 酸残基。Bβ链由461个氨基酸组成。最丰富的γ链形式,即γA,由 411个氨基酸残基组成。变体γ′(γB)链包含427个氨基酸残基。

已知纤维蛋白原的异常影响深部静脉血栓形成(DVT)的危险。 Koster等人(Thromb.Haemost.71:719-722(1994))描述了血浆 纤维蛋白原的水平升高(>5g/L)增加了DVT的危险。这种影响的机 制不明。纤维蛋白原浓度在体外实验中对纤维蛋白凝块结构有深远的 影响。纤维蛋白肽A释放速率伴随纤维蛋白原水平升高而增加并且这 与更耐溶解且更密集和紧密的纤维蛋白网络形成相关(Blomb_ck, Thromb Res.75:327-328(1994);Siebenlist和Mosesson,J Biol Chem.68:315-320(1994))。

纤维蛋白原高水平可能促进血栓形成危险的另一机制是增加血液 粘度。另外,纤维蛋白原的遗传变体(异常纤维蛋白原血症)已在具 有血栓形成和延长的凝血酶时间的患者中发现(由Mosesson综述 (Semin.Thromb.Hemost.25:311-319(1999));Hanss和Biot (Ann.N.Y.Acad.Sci.,936:89-90(2001)))。大多数这些 患者在FGA或FGG基因中有突变,尽管这些突变的携带关系和静脉血 栓形成之间的确切联系很少有文件证明(Haverkate等人Thromb. Haemost.73:151-161(1995))。

本发明人因此假设纤维蛋白原基因中可能存在相对常见的变异, 其影响静脉血栓形成特别是深部静脉血栓形成的危险。这些变异可能 影响纤维蛋白原水平、纤维蛋白网络结构的形成或纤维蛋白凝块对纤 维蛋白溶解系统的敏感性。

在形成本发明的研究中,本发明人在关于静脉血栓形成的危险因 素的基于大量人群的病例-对照研究-Leiden血栓形成倾向研究 (LETS)中测定了在纤维蛋白原簇的3种基因中的15种单元型标记的 单核苷酸多态性(htSNPs,这是对单元型特异的SNPs)类型。此外, 在所有受试者中测量了包含纤维蛋白原γ链的可变剪接变体(γ′)的 纤维蛋白原同种型γA/γ′和γ′/γ′的组合水平。

发现FGB-H2、FGA-H2或FGG-H2纯合的个体都具有静脉血栓形成 增加的危险(FGB-H2:OR=1.9,95%CI:1.1-3.4;FGA-H2:OR=2.0, 95%CI:1.3-3.2;FGG-H2:OR=2.4,95%:1.5-3.9)。因为3种纤 维蛋白原基因位于50kb的单段DNA上,所以使用多重对数回归调整基 因之间的连锁不平衡。调整后,升高的危险只对FGG-H2纯合的个体保 留。如使用Clauss方法测量的,没有一种纤维蛋白原单元型与总纤维 蛋白原水平关联。FGG-H2也与纤维蛋白原γ′水平减少和纤维蛋白原 γ′/γ比率减少关联。对数回归显示纤维蛋白原γ′水平减少和总纤维 蛋白原水平增加都与DVT危险增加3倍关联,即使在对于FGG-H2调整 后。

在这个发现的基础上,得出结论:FGG-H2与纤维蛋白原γ′水平 减少关联并且在多变量分析中纤维蛋白原γ′水平减少与DVT发展的 危险增加3倍关联,证实FGG-H2单元型经由纤维蛋白原γ′水平减少 的表型作用于血栓形成危险。

因为纤维蛋白原γ′和总纤维蛋白原的血浆浓度都影响血栓形成 危险并且因为纤维蛋白原γ′水平总是依赖于总纤维蛋白原水平,所以 本发明人还分析了纤维蛋白原γ′/总纤维蛋白原比率(γ′/γ比率) 对静脉血栓形成危险的影响。他们发现与γ′/γ比率≥0.69的那些相 比γ′/γ比率低于0.69的个体具有静脉血栓形成增加的危险 (OR=2.4,95%CI:1.7-3.5),所述0.69的比率代表在对照受试者 中测量时的第10百分位数(P10)。因为FGG-H2与纤维蛋白原γ′水 平减少关联,还与γ′/γ比率减少关联,所以FGG-H 2连同γ′/γ比率 的P10一起输入同一对数回归模型中。与γ′/γ比率减少(<0.69)关 联的危险保留(OR=2.2,95%CI:1.3-3.5),而与FGG-H2纯合性关 联的危险大部分消失(OR=1.2,95%CI:0.6-2.3)。这表明FGG-H2 单元型经由减少γ′/γ比率作用于静脉血栓形成危险。82%对照以及 γ′/γ<0.69的91%病例是FGG-H2等位基因的纯合携带者。

进一步的研究显示通过在FGG-H2转录中增加多腺苷酸化信号2 (pA2)的使用(参见图2和图8)10034C>T负责γ′形成效率减少并 因此负责发现与静脉血栓形成危险关联的γ′含量减少。此外,发现 10034C是功能性切割刺激因子(CstF)共有区2a序列的一部分。对 于这点,制备小基因构建体,其包含FGG基因的外显子9、内含子9、 外显子10和3′-UTR,并将FGG-H2特异性SNPs一起或分开导入这个 构建体中。10034C>T的存在导致pA2的使用增加并且因此导致pA1/pA2 比率减少(图10)。此外,将改善并减少共有序列的突变导入CstF 位点中,以证实这个位点的确是功能性CstF位点。这显示10034C/T 突变引起静脉血栓形成(VT),特别是深部静脉血栓形成(DVT)的危 险。

基于这些发现,本发明提供了用于在个体中筛选其基因组中遗传 标记存在的方法,所述遗传标记是静脉血栓形成特别是深部静脉血栓 形成危险增加的指示,包括测定个体基因组中是静脉血栓形成特别是 深部静脉血栓形成危险增加的指示的遗传标记的存在,其中遗传标记 是如图5中给出的纤维蛋白原γ基因(FGG-H2)的单元型2。

如表1 A中所示,纤维蛋白原γ基因(FGG)的单元型2(H2)可 以通过与FGG参照序列(GenBank登记号AF350254,www.ncbi.nlm.nih.gov)比较时基因中存在一组突变而特异鉴别。核苷酸 编号根据Seattle数据库(Nickerson,D,SeattleSNP s.关于基因 组应用的NHLBI Program,UW-FHCRC.Seattle,WA.http: //pga.gs.Washington.edu 15-4-2003)。此类组包括选自编码纤维 蛋白原γ′的核酸材料,特别是在图5B描述的FGG基因(SEQ ID NO: 22)中的129A/T(rs2066854)、7874G/A(rs2066861)、9615C/T (rs2066864)和10034C/T(rs2066865)的1、2、3或4个突变。编 号指的是如图5中描述的纤维蛋白原γ基因的核苷酸位置。rs数目表 示根据dhSNP鉴别的SNPs(经由http://www.ncbi.nlm.nih.gov可 获得)。

表1A

  129   A/T   902   G/A   5836   G/A   7874   G/A   9340   T/C   9615   C/T   10034   C/T   单元型1   A   G   G   G   T   C   C   单元型2   T   A   G   A   T   T   T   单元型3   A   A   G   G   C   C   C   单元型4   A   G   A   G   T   C   C

用于鉴别单元型2的突变组选自表1B中列出的组。优选至少存在 突变10034C/T。突变组因此优选选自表1B中列出的组5-8、11、12、 14和15。特别地,FGG-H2的存在与编码纤维蛋白原γ的核酸材料中 突变10034C/T(rs2066865)的存在关联。在本申请中“组”可以包 括1、2、3或4个突变。

表1B

遗传标记所有可能的组合

  组   突变   1   129A/T   2   129A/T   7874G/A   3   129A/T   7874G/A   9615C/T   4   129A/T   9615C/T

  5   129A/T   9615C/T   10034C/T   6   129A/T   10034C/T   7   129A/T   7874G/A   10034C/T   8   129A/T   7874G/A   9615C/T   10034C/T   9   7874G/A   10   7874G/A   9615C/T   11   7874G/A   9615C/T   10034C/T   12   7874G/A   10034C/T   13   9615C/T   14   9615C/T   10034C/T   15   10034C/T

在本发明的方法中,遗传标记通过执行包含所述突变组的一段 DNA的靶核酸扩增反应并分析扩增的靶核酸中突变组的存在来检测。

用于扩增核酸的各种技术是本领域已知的,例如:

●在专利US-A-4,683,195、US-A-4,683,202和US-A-4,800,159 中描述的PCR(聚合酶链式反应),及其RT-PCR替代方法(逆转录PCR), 特别是如专利EP-B-0.569.272中所公开的其单步形式,

●在例如专利申请EP-A-0.201.184中陈述的LCR(连接酶链式反 应),

●在国际申请WO-A-90/01069中要求的RCR(修复链式反应),

●在专利申请WO-A-90/06995中描述的3SR(自主维持序列复制),

●例如在EP-B-0.397.269或US-A-5,466,586中公开的使用双链 DNA作为模板的NASBA(基于核酸序列的扩增),和

●TMA(转录介导的扩增),参见例如US-A-5,399,491专利。

用于特异性扩增DNA靶区段的技术的一个例子是所谓的“聚合酶 链式反应”(PCR),使用PCR技术,特定靶区段的拷贝数伴随循环数 指数增加。使用一对引物并且在每个循环中DNA引物与双链DNA靶序 列2条链中每一条的3’侧退火。引物在各种单核苷酸的存在下由于 DNA聚合酶而延伸,以再次产生双链DNA。双链DNA的链由于热变性作 用互相分开并且每条链充当随后循环中引物退火和后续延伸的模板。 PCR方法也已在Saiki等人,Science 230,135,1985以及专利 EP-B-0.200.362和EP-A-0.201.184中描述。

扩增产物中一个或多个突变的存在的检测可以以本领域众所周知 的各种方式进行,例如

-使用限制性内切酶

-等位基因特异性扩增

-肽核酸(PNA)介导的PCR锁止技术(PCR clamping)

-构象差异的检测,如单链构象多态性(SSCP)和变性梯度凝胶 电泳法(DGGE)

-使用标记的寡核苷酸探针伴随在膜上的检测步骤(斑点印迹) 的测定法

-伴随在微量滴定板中的检测步骤的测定法,如反向杂交、寡核 苷酸连接测定法(OLA,MLPA)、第一个核苷酸改变(FNC)技术、交 联技术

-快速循环PCR和同时荧光分析(例如5’核酸酶/Taqman)

-PCR,随后为使用质谱测定法或毛细管电泳的小型测序

本发明进一步涉及用于执行指示静脉血栓形成特别是深部静脉血 栓形成危险增加的方法的试剂盒,包括识别围绕包括至少一个突变的 至少一段核酸的核酸段并与之杂交的至少一对引物,所述突变是纤维 蛋白原γ基因的单元型2(FGG-H2)的遗传标记,以及用于检测扩增 的靶核酸中所述突变存在的工具。

更特别地,试剂盒包括识别围绕包括至少一个突变的一段核酸的 核酸段并与之杂交的一对引物,所述突变是所述纤维蛋白原γ基因单 元型2(FGG-H2)的遗传标记,以及用于检测扩增的靶核酸中所述突 变存在的至少一种探针。特别地,识别围绕包括至少一个突变的一段 核酸的核酸段并与之杂交的引物对包括选自129A/T、7874G/A、 9615C/T和10034C/T的至少一个突变,并且至少一种探针检测扩增的 靶核酸中的每个目的突变。

在第一个实施方案中,试剂盒包括

●第一种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:1:CTTCACAGAGGCAACTGATTC,

-SEQ ID NO:2:CCTTCAGACAAAGGGAAGATTG,

-SEQ ID NO:3:AGCTCCAGCCATTTGCAG,

-SEQ ID NO:4:TCAGGTCCACATTGTATTCC,

-SEQ ID NO:5:GGGAGTTGATAGAACCAGTGC,

-SEQ ID NO:6:TTCCAAGGAAGCATCCTACG,

-SEQ ID NO:7:GTAACTGGCAATGCACTTCG,

-SEQ ID NO:8:GAGAACATTTTAGAGTTTCAAATTC,或

-SEQ ID NO:9:ACATGCATTTCAATAAACCTTTTGTTTCCT,

或其互补序列,

●第二种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NQ:10:GTGTCAACCATGTTCATAGGC,

-SEQ ID NO:11:CCTTTTATGTAAGCTCCTGGG,

-SEQ ID NO:12:CATAATCAGGCATAATGTCACTG,

-SEQ ID NO:13:TGAGCTACGGTTCACAAGG,

-SEQ ID NO:14:GACTCCTGGAGAAAATGGTG,

-SEQ ID NO:15:GGTGGATTTCTTTAGAAGGGC,

-SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC,

-SEQ ID NO:17:GCTATTTCCTTTGTAACTCCC,或

-SEQ ID NO:18:GGTAAATTGGCAAAAAGTGGTGGT,

或其互补序列。

合适的组合是下列SEQ ID NOS的组合:1&10、1&11、1&12、1&13、 1&14、1&15、1&16、1&17、1&18、2&10、2&11、2&12、2&13、2&14、 2&15、2&16、2&17、2&18、3&10、3&11、3&12、3&13、3&14、3&15、 3&16、3&17、3&18、4&10、4&11、4&12、4&13、4&14、4&15、4&16、 4&17、4&18、5&10、5&11、5&12、5&13、5&14、5&15、5&16、5&17、 5&18、6&10、6&11、6&12、6&13、6&14、6&15、6&16、6&17、6&18、 6&10、6&11、6&12、6&13、6&14、6&15、6&16、6&17、6&18、7&10、 7&11、7&12、7&13、7&14、7&15、7&16、7&17、7&18、8&10、8&11、 8&12、8&13、8&14、8&15、8&16、8&17、8&18、9&10、9&11、9&12、 9&13、9&14、9&15、9&16、9&17、9&18。

在一个进一步的实施方案中,用于检测突变129A/T的试剂盒包括

●第一种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个核苷酸的片段:

-SEQ ID NO:1:CTTCACAGAGGCAACTGATTC,

或其互补序列,

●第二种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:2: CCTTCAGACAAAGGGAAGATTG,

-SEQ ID NO:3: AGCTCCAGCCATTTGCAG,

-SEQ ID NO:4: TCAGGTCCACATTGTATTCC,

-SEQ ID NO:5: GGGAGTTGATAGAACCAGTGC,

-SEQ ID NO:6: TTCCAAGGAAGCATCCTACG,

-SEQ ID NO:7: GTAACTGGCAATGCACTTCG,

-SEQ ID NO:8: GAGAACATTTTAGAGTTTCAAATTC,

-SEQ ID NO:9: ACATGCATTTCAATAAACCTTTTGTTTCCT,

-SEQ ID NO:10:GTGTCAACCATGTTCATAGGC,

-SEQ ID NO:11:CCTTTTATGTAAGCTCCTGGG,

-SEQ ID NO:12:CATAATCAGGCATAATGTCACTG,

-SEQ ID NO:13:TGAGCTACGGTTCACAAGG,

-SEQ ID NO:14:GACTCCTGGAGAAAATGGTG,

-SEQ ID NO:15:GGTGGATTTCTTTAGAAGGGC,

-SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC,

-SEQ ID NO:17:GCTATTTCCTTTGTAACTCCC,或

-SEQ ID NO:18:GGTAAATTGGCAAAAAGTGGTGGT,

或其互补序列。

合适的组合是下列SEQ ID NOS的组合:1&2、1&3、1&4、1&5、1&6、 1&7、1&8、1&9、1&10、1&11、1&12、1&13、1&14、1&15、1&16、1&17、 1&18。

优选地,用于检测突变129A/T的试剂盒包括寡核苷酸对,其中第 一种寡核苷酸长度为10-26个核苷酸,并且第二种寡核苷酸长度为 10-26个核苷酸并包括SEQ ID NO:10:GTGTCAACCATGTTCATAGGC, 或其至少10个连续核苷酸的片段,特别是片段GTGTCAACCA、 TGTCAACCAT、GTCAACCATG、TCAACCATGT、CAACCATGTT、AACCATGTTC、 ACCATGTTCA、CCATGTTCAT、CATGTTCATA、ATGTTCATAG、TGTTCATAGG或 GTTCATAGGC。

用于检测突变7874G/A的试剂盒包括

●第一种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:1: CTTCACAGAGGCAACTGATTC,

-SEQ ID NO:2: CCTTCAGACAAAGGGAAGATTG,

-SEQ ID NO:3: AGCTCCAGCCATTTGCAG,

-SEQ ID NO:4: TCAGGTCCACATTGTATTCC,

-SEQ ID NO:5: GGGAGTTGATAGAACCAGTGC,

-SEQ ID NO:6: TTCCAAGGAAGCATCCTACG,

-SEQ ID NO:10:GTGTCAACCATGTTCATAGGC,

-SEQ ID NO:11:CCTTTTATGTAAGCTCCTGGG,

-SEQ ID NO:12:CATAATCAGGCATAATGTCACTG,

-SEQ ID NO:13:TGAGCTACGGTTCACAAGG,

-SEQ ID NO:14:GACTCCTGGAGAAAATGGTG,或

-SEQ ID NO:15:GGTGGATTTCTTTAGAAGGGC,

或其互补序列,

●第二种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:7: GTAACTGGCAATGCACTTCG,

-SEQ ID NO:8: GAGAACATTTTAGAGTTTCAAATTC,

-SEQ ID NO:9: ACATGCATTTCAATAAACCTTTTGTTTCCT,

-SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC,

-SEQ ID NO:17:GCTATTTCCTTTGTAACTCCC,或

-SEQ ID NO:18:GGTAAATTGGCAAAAAGTGGTGGT,

或其互补序列。

合适的组合是下列SEQID NOS的组合:1&7、1&8、1&9、1&16、 1&17、1&18、2&7、2&8、2&9、2&16、2&17、2&18、3&7、3&8、3&9、 3&16、3&17、3&18、4&7、4&8、4&9、4&16、4&17、4&18、5&7、5&8、 5&9.、5&16、5&17、5&18、6&7、6&8、6&9、6&16、6&17、6&18、10&7、 10&8、10&9、10&16、10&17、10&18、11&7、11&8、11&9、11&16、11&17、 11&18、12&7、12&8、12&9、12&16、12&17、12&18、13&7、13&8、13&9、 13&16、13&17、13&18、14&7、14&8、14&9、14&16、14&17、14&18、 15&7、15&8、15&9、15&16、15&17、15&18。

优选地,第一种寡核苷酸长度为10-26个核苷酸,并且包括SEQ ID NO:6:TTCCAAGGAAGCATCCTACG或其至少10个连续核苷酸的片段, 特别是片段TTCCAAGGAA、TCCAAGGAAG、CCAAGGAAGC、CAAGGAAGCA、 AAGGAAGCAT、AGGAAGCATC、GGAAGCATCC、GAAGCATCCT、AAGCATCCTA、 AGCATCCTAC或GCATCCTACG,并且第二种寡核苷酸长度为10-26个核 苷酸并包括SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC的至少10个连 续核苷酸的片段,特别是片段GCTTTGCAAG、CTTTGCAAGT、TTTGCAAGTC、 TTGCAAGTCC、TGCAAGTCCA、GCAAGTCCAT、CAAGTCCATT、AAGTCCATTG、 AGTCCATTGT、GTCCATTGTC或TCCATTGTCC。

对于检测突变9615C/T,试剂盒包括

●第一种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:1: CTTCACAGAGGCAACTGATTC,

-SEQ ID NO:2: CCTTCAGACAAAGGGAAGATTG,

-SEQ ID NO:3: AGCTCCAGCCATTTGCAG,

-SEQ ID NO:4: TCAGGTCCACATTGTATTCC,

-SEQ ID NO:5: GGGAGTTGATAGAACCAGTGC,

-SEQ ID NO:6: TTCCAAGGAAGCATCCTACG,

-SEQ ID NO:7: GTAACTGGCAATGCACTTCG,

-SEQ ID NO:10:GTGTCAACCATGTTCATAGGC,

-SEQ ID NO:11:CCTTTTATGTAAGCTCCTGGG,

-SEQ ID NO:12:CATAATCAGGCATAATGTCACTG,

-SEQ ID NO:13:TGAGCTACGGTTCACAAGG,

-SEQ ID NO:14:GACTCCTGGAGAAAATGGTG,或

-SEQ ID NO:15:GGTGGATTTCTTTAGAAGGGC,

或其互补序列,

●第二种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个连续核苷酸的片段:

-SEQ ID NO:8: GAGAACATTTTAGAGTTTCAAATTC,

-SEQ ID NO:9: ACATGCATTTCAATAAACCTTTTGTTTCCT,

-SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC,

-SEQ ID NO:17:GCTATTTCCTTTGTAACTCCC,或

-SEQ ID NO:18:GGTAAATTGGCAAAAAGTGGTGGT,

或其互补序列。

合适的组合是下列SEQ ID NOS的组合:1&8、1&9、1&16、1&17、 1&18、2&8、2&9、2&16、2&17、2&18、3&8、3&9、3&16、3&17、3&18、 4&8、4&9、4&16、4&17、4&18、5&8、5&9、5&16、5&17、5&18、6&8、 6&9、6&16、6&17、6&18、7&8、7&9、7&16、7&17、7&18、10&8、1O&9、 10&16、1O&17、10&18、11&8、11&9、11&16、11&17、11&18、12&8、 12&9、12&16、12&17、12&18、13&8、13&9、13&16、13&17、13&18、 14&8、14&9、14&16、14&17、14&18、15&8、15&9、15&16、15&17、 15&18。

优选地,第一种寡核苷酸长度为10-26个核苷酸,并且包括SEQ ID NO:7:GTAACTGGCAATGCACTTCG或其至少10个连续核苷酸的片段, 特别是片段GTAACTGGCA、TAACTGGCAA、AACTGGCAAT、ACTGGCAATG、 CTGGCAATGC、TGGCAATGCA、GGCAATGCAC、GCAATGCACT、CAATGCACTT、 AATGCACTTC或ATGCACTTCG,并且第二种寡核苷酸长度为10-26个核 苷酸,并且包括SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC或其至少10 个核苷酸的片段,特别是片段GCTTTGCAAG、CTTTGCAAGT、TTTGCAAGTC、 TTGCAAGTCC、TGCAAGTCCA、GCAAGTCCAT、CAAGTCCATT、AAGTCCATTG、 AGTCCATTGT、GTCCATTGTC、TCCATTGTCC。

对于检测突变10034C/T,试剂盒包括

●第一种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个核苷酸的片段:

-SEQ ID NO:1: CTTCACAGAGGCAACTGATTC,

-SEQ ID NO:2: CCTTCAGACAAAGGGAAGATTG,

-SEQ ID NO:3: AGCTCCAGCCATTTGCAG,

-SEQ ID NO:4: TCAGGTCCACATTGTATTCC,

-SEQ ID NO:5: GGGAGTTGATAGAACCAGTGC,

-SEQ ID NO:6: TTCCAAGGAAGCATCCTACG,

-SEQ ID NO:7: GTAACTGGCAATGCACTTCG,

-SEQ ID NO:8: GAGAACATTTTAGAGTTTCAAATTC,

-SEQ ID NO:9: ACATGCATTTCAATAAACCTTTTGTTTCCT,

-SEQ ID NO:10:GTGTCAACCATGTTCATAGGC,

-SEQ ID NO:11:CCTTTTATGTAAGCTCCTGGG,

-SEQ ID NO:12:CATAATCAGGCATAATGTCACTG,

-SEQ ID NO:13:TGAGCTACGGTTCACAAGG,

-SEQ ID NO:14:GACTCCTGGAGAAAATGGTG,

-SEQ ID NO:15:GGTGGATTTCTTTAGAAGGGC,或

-SEQ ID NO:16:GCTTTGCAAGTCCATTGTCC,

或其互补序列,

●第二种寡核苷酸,其长度为10-50个核苷酸并且包括下列核苷 酸序列之一或其至少10个核苷酸的片段:

-SEQ ID NO:17:GCTATTTCCTTTGTAACTCCC,或

-SEQ ID NO:18:GGTAAATTGGCAAAAAGTGGTGGT,

或其互补序列。

合适的组合是下列SEQ ID NOS的组合:1&17、1&18、2&17、2&18、 3&17、3&18、4&17、4&18、5&17、5&18、6&17、6&18、7&17、7&18、 8&17、8&18、9&17、9&18、10&17、10&18、11&17、11&18、12&17、 12&18、13&17、13&18、14&17、14&18、15&17、15&18、16&17、16&18。

优选地,第一种寡核苷酸长度为10-26个核苷酸并且包括SEQ ID NO:8:GAGAACATTTTAGAGTTTCAAATTC,特别是片段AGAACATTTT、 GAACATTTTA、AACATTTTAG、ACATTTTAGA、CATTTTAGAG、ATTTTAGAGT、 TTTTAGAGTT、TTTAGAGTTT、TTAGAGTTTC、TAGAGTTTCA、AGAGTTTCAA、 GAGTTTCAAA、AGTTTCAAAT、GTTTCAAATT或TTTCAAATTC,或SEQ ID NO: 9:ACATGCATTTCAATAAACCTTTTGTTTCCT,特别是片段ACATGCATTT、 CATGCATTTC、ATGCATTTCA、TGCATTTCAA、GCATTTCAAT、CATTTCAATA、 ATTTCAATAA、TTTCAATAAA、TTCAATAAAC、TCAATAAACC、CAATAAACCT、 AATAAACCTT、ATAAACCTTT、TAAACCTTTT、AAACCTTTTG、AACCTTTTGT、 ACCTTTTGTT、CCTTTTGTTT、CTTTTGTTTC、TTTTGTTTCC、或TTTGTTTCCT, 或其至少10个连续核苷酸的片段,并且第二种寡核苷酸长度为10- 26个核苷酸。

在一个特别有利的实施方案中,试剂盒包括用于检测扩增的靶核 酸中每种目的突变(129A/T、7874G/A、9615C/T或10034C/T)的一 种探针,所述探针包括对应分析物核酸的核酸序列,所述分析物核酸 已产生突变以区别于非突变的分析物核酸。优选地,探针是分子信标。

通过结合10034T等位基因(突变10034C/T)用于检测FGG-H2单 元型的探针是或包含长度为10-50,优选10-26个核苷酸的寡核苷 酸,并且包括SEQ ID NO:19:ATGGTCAATAAAGATACCA或其至少10个 连续核苷酸的片段,特别是片段ATGGTCAATA、TGGTCAATAA、 GGTCAATAAA、GTCAATAAAG、TCAATAAAGA、CAATAAAGAT、AATAAAGATA、 ATAAAGATAC、TAAAGATACC、或AAAGATACCA。试剂盒可以进一步包含通 过结合10034C等位基因用于检测FGG-H2单元型的探针,所述探针是 或包含长度为10-50,优选10-26个核苷酸的寡核苷酸,并且所述 探针包括SEQ ID NO:2O:TTTTAATGGTCAATAAAGGTACCA,或其至少10 个连续核苷酸的片段,特别是片段TTTTAATGGT、TTTAATGGTC、 TTAATGGTCA、TAATGGTCAA、AATGGTCAAT、ATGGTCAATA、TGGTCAATAA、 GGTCAATAAA、GTCAATAAAG、TCAATAAAGG、CAATAAAGGT、AATAAAGGTA、 ATAAAGGTAC、TAAAGGTACC、或AAAGGTACCA。

每种试剂盒可以进一步包含合适的扩增反应物。然而这不是试剂 盒的必需部分,因为这些反应物也可以分开提供。

在生物学分析的许多方法中,固相必须与液相分离并随后洗涤。 为了洗涤固相,限定量的缓冲溶液用移液管移入包含固相的反应器皿 中以将固相悬浮于缓冲溶液中。随后分离固相和液相。液相随后通过 吸取(抽吸)去除并开始新的洗涤过程。通常进行多次洗涤循环,各 自包括悬浮、分离和抽吸过程。

磁性颗粒作为固相的使用并且通过永磁体的分离原则上是已知 的。永磁体将颗粒吸引至反应器皿的壁并使其保持在那里。

磁性颗粒通常在分离过程中使用。存在许多其中使用磁性颗粒的 生物学测定方法和纯化方法。例如,免疫测定法,核酸杂交测定法等。 磁性颗粒还可以在纯化方法中使用,以从其中包含它们的材料中分离 特定的组分、蛋白质、核酸。例如,颗粒可以用于从混合物中分离某 些组分,因为它们用对组分有特异性亲和力的反应物包被。磁性颗粒 可以移动至例如其中包含含有磁性颗粒的液体的容器的壁,并且可以 去除液体并,任选地用另一种液体替代。因此,颗粒可以与特定组分 将从其中去除的液体混合,组分将结合磁性颗粒,并且磁体可以用于 在液体中分离含有组分的颗粒与其余混合物。任选地磁性颗粒可以洗 涤,并且可以在另一种液体中分离。或者组分可以从颗粒中再次移至 另一种液体中。磁性颗粒的使用是非均质操作,因为检测在来自其余 样品的扩增子的扩增和分离后发生。

在均质操作中,扩增和检测无需分离反应组分而发生。扩增子在 扩增过程中检测。因此,扩增子的产生可以实时监控并且因此获得的 数据可以用于测定扩增子的存在或缺失或量。在此类均质技术中非常 有用的一种探针类型是分子信标。

分子信标是具有茎环结构的单链寡核苷酸。环部分包含与靶核酸 (DNA或RNA)互补的序列。茎由于3’端与5’端的互补序列杂交而 形成。茎可以与靶无关并且是双链的。茎的一个臂是用荧光染料(荧 光团)标记的,而另一个臂偶联至猝灭分子。在茎环状态下,探针不 产生荧光,因为荧光团的能量转移至猝灭分子。当分子信标与靶杂交 时,茎环结构失去,并且猝灭剂和荧光团分离。在那个阶段,可以检 测并定量由荧光团发出的荧光。

在本申请中,术语“分析物”、“扩增子”和“靶”或“靶序列” 可以互换使用。分析物是待检测的原始核酸分子。靶序列是通过引物 扩增的分析物的一部分。扩增导致形成扩增子,其是通过与探针杂交 物理检测的核酸分子。扩增子的序列与分析物内的靶序列相同或互补。

本发明在随后并且参照下列图的实施例中进一步阐明:

图1显示纤维蛋白原的结构。

图2显示γ链mRNA的可变mRNA加工。γA链由其中前-mRNA的所 有9个内含子已去除并且多腺苷酸化发生在外显子10下游的mRNA翻 译。相反,γ′链来自于FGG前-mRNA的可变加工。内含子9不被去除 并且多腺苷酸化在位于这个内含子中的可变位点处发生。这导致具有 独特的20个氨基酸延伸的多肽的翻译,所述氨基酸延伸由内含子9 编码,取代由外显子10编码的γ链羧基端的4个氨基酸。这个变体链 构成在血浆中发现的大约7-15%纤维蛋白原γ链。几乎所有γ′蛋白 质在体内作为含有γ A变体的异二聚体存在,其中一个D区包含γ′羧 基末端并且另一个D区包含γA羧基末端(γA/γ′纤维蛋白原)。

图3显示用于Leiden血栓形成倾向研究的基因分型的纤维蛋白原 基因簇中的htSNPs。核苷酸编号根据SeattleSNPs(在GenBank中作 为AF350254(FGG)、AF361104(FGA)、AF388026(FGB)存放)。3 种纤维蛋白原基因(FGG、FGA、FGB)中的单元型编号是任意的。F: 在Leiden血栓形成倾向研究的对照群体中的单元型频率。

图4显示对照受试者(n=471)中总纤维蛋白原水平(U/dL)和纤 维蛋白原γ′水平(U/dL)之间的FGG单元型依赖性相关性。

◆(----)FGG HxHx,□(......)FGG H2Hx,▲(-.-.-.-) FGG H2H2,(_____)全部

图5A显示纤维蛋白原γ基因的单元型2等位基因的序列。突变以 粗体大写字母显示。参照序列是GenBank登记号AF350254的FGG序列 (图5B)。

图6和7显示实施例2的结果。

图8显示小基因构建体的插入片段的图示。插入片段包含FGG基 因的外显子9、内含子9、外显子10和3′UTR,包含多态性9615C>T 和10034C>T。关于插入片段的细节参见图9中的文字。描述了与CstF 共有序列和CstF突变体比对的、扩大的包含SNP 10034C>T(有下划 线的)的构建体序列的一部分。CstF突变体构建体的突变核苷酸是粗 体和有下划线的。垂直线表明比对的构建体序列和CstF共有序列之间 的核苷酸(18个中的14个)。

图9A显示小基因构建体中的插入片段的核苷酸序列。

插入片段序列:FGG nt.9090-nt 10151

用于从DNA获得插入片段的引物

外显子9和外显子10

正常的:内含子9

3′UTR

斜体:编码γ′链的20个氨基酸的核苷酸序列

实时PCR的反向引物

粗体:实时PCR的探针

中间的C*:SNP 9615

末端的C**:SNP 10034

图9B显示彩色的相同图。

粉红色:用于从DNA获得插入片段的引物

蓝色:外显子9和外显子10

黑色:内含子9

绿色:3′UTR

褐色斜体:编码γ′链的20个氨基酸的核苷酸序列

橙色:实时PCR的反向引物

粗体:实时PCR的探针

中间的红C:SNP 9615

末端的红C:SNP 10034

实时PCR的引物和探针:

构建体上的正向:

TGCAGATATCCATCACACTGG(SEQ ID NO:23)

反向pA1-转录:

TCATCCTCAGGGTAAAGTGAGTC(SEQ ID NO:24)

反向pA2-转录:

GAAGTGAAGCTTTGCAAGTCC(SEQ ID NO:25)

探针pA1-转录:

AAACAGGTCAGACCAGAGCACCCT(SEQ ID NO:26)

探针pA2-转录:

CTGGAGACGTTTAAAAGACCGTTTC(SEQ ID NO:27)

图10显示在使用2种分开的构建体制剂的3次独立转染实验后, pA1和pA2的相对使用(pA1/pA2比率(%))。使用每种cDNA样品 一式三份地进行4次实时PCRs。参照构建体CC(9615C和10034C)设 定为100%;平均值±标准差TT(9615T和10034T):71.5%±12; CT(9615C和10034T):85.3%±3.3;TC(9615T和10034C):101.6 %±18。

图11显示在使用2种分开的构建体制剂的3次独立转染实验后, 关于不同CstF突变体小基因构建体的pA1和pA2的相对使用(pA1/pA2 比率(%))。使用每种cDNA样品一式三份地进行3次实时PCRs。 参照构建体CstFc设定为100%,平均值±标准差CstFmutl:142.4 %±26;CstFmut2:160.7%±23;CstFmut3:66.2%±6;CstFmut4: 59.7%±7。

实施例

实施例1

纤维蛋白原单元型和静脉血栓形成的危险

1.方法

1.1研究人群

Leiden血栓形成倾向研究的设计已在Koster等人,Lancet 342: 1503-1506(1993)和Van der Meer等人Thromb Haemost.78:631-635 (1997)中详细描述。

这个研究中总共包括客观证实深部静脉血栓形成第一次发作的 474名连续患者和474名对照,根据性别和年龄匹配频率。排除具有 活跃癌症的个体。对照受试者是患者的熟人或配偶,同样是没有癌症 的个体。2个组的平均年龄是45岁(对于患者范围为15-69,对于对 照为15-72)。2个组由272名(57.4%)女性和202名(42.6%) 男性组成。

静脉血收集到0.1体积的0.106mol/L柠檬酸三钠中。通过在 2000g和室温下离心10分钟制备血浆并贮存于-70℃。高分子量DNA 通过标准方法从白细胞中分离并贮存于-20℃。DNA样品从471名患者 和471名对照中获得。血浆样品从473名患者和474名对照获得。

1.2遗传分析

已知在FGG基因中有5种单元型,在FGA基因中有7种,并且在 FGB基因中有7种(图3)。为了标记这些单元型,所有受试者基因用 15种单元型-标记(ht)SNPs进行分型;FGG中4种,FGA中5种以及 FGB中6种(表2)。通过聚合酶链式反应和限制性片段长度多态性分 析进行FGB的基因分型。

  基因   SeattleSNP   Rs编号   单元型   FGG   129A/T   rs2066854   H2+H5   5836G/A   rs2066860   H4   7874G/A   rs2066861   H2   9340T/C   rs1049636   H3   9615C/T   rs2066864   H2   10034C/T   rs2066865   H2   FGA   251G/A   rs2070006   H2+H3   3655G/A   rs2070014   H7-   3807T/C   rs2070016   H4+H6   3845G/A   rs2070017   H5   6534A/G   rs6050   H2   FGB   1038G/A   rs1800791   H6   1643C/T   rs1800789   H2   3471T/C   rs2227432   H5   9952A/C   rs2227421   H1   10149C/T   rs2227439   H3   11046T/C   rs209502   H4+H5

表2:htSNPs的名称和rs数目

使用5’核酸酶/TaqMan测定法(Livak,Genet.Anal.14:143-149 (1999))进行FGA和FGG的基因分型。

使用荧光等位基因-特异性寡核苷酸探针的聚合酶链式反应 (Assay-by-Design/Assay-on-Demand,Applied Biosystems,Foster City,USA)在PTC-225(Biozym,Hessisch Oldendorf,Germany) 上进行,并且关于等位基因区别的荧光终末点读数在ABI 7900HT (Applied Biosystems,Foster City,USA)上进行。10名患者和9 名对照不能指定单元型,因为缺少DNA、基因分型失败或在基因内重 组。Arlequin群体遗传学软件(版本2)(Schneider等人(2000) Arlequin:a software for population genetics data analysis。 Genetics和Biometry Lab,Department of Antropology,University of Geneva)和Haploview软件v2.0530用于单元型和LD分析。

1.3测序

在选择的个体中,3种纤维蛋白原基因的所有启动子、5′UTRs、 外显子、内含子/外显子边界、和3′UTRs在ABI PRISM_310基因分 析仪(Perkin Elmer,Boston,USA)上测序。反应使用ABI PRISM_ BigDye Terminator Cycle Sequencing试剂盒(Perkin Elmer)进行。 引物在下文列出。

纤维蛋白原的序列引物:

  基因  靶   正向引物   反向引物   FGG   PR1         PR2   外显子1-4   外显子5-6   外显子7   外显子8   外显子9-10   3′UTR   CTTCACAGAGGCAACTGATTC   CCTTCAGACAAAGGGAAGATTG   AGCTCCAGCCATTTGCAG   TCAGGTCCACATTGTATTCC   GGGAGTTGATAGAACCAGTGC   TTCCAAGGAAGCATCCTACG   GTAACTGGCAATGCACTTCG   GAGAACATTTTAGAGTTTCAAATTC   GTGTCAACCATGTTCATAGGC   CCTTTTATGTAAGCTCCTGGG   CATAATCAGGCATAATGTCACTG   TGAGCTACGGTTCACAAGG   GACTCCTGGAGAAAATGGTG   GGTGGATTTCTTTAGAAGGGC   GCTTTGCAAGTCCATTGTCC   GCTATTTCCTTTGTAACTCCC   FGA    PR   外显子1   外显子2-3   外显子4   外显子5-1   外显子5-2   外显子5-3   外显子6   3′UTR   CCTTCAGGGCCAGCTTATC   CAGCCCCACCCTTAGAAAAG   CCTCTTCTGGCTAACATTGC   CTCAGCAGCTACTTCAATAACC   与外显子4相同   CCGATCTTGTCGAGGGTC   CTGGACCTCTGAGAGCTCTG   CCGTGCCTATCTTTGTAAAG   GACCCAATAGGCTGAAGAAG   CACTTAGGACCAGGCAGACG   CCTGGGGTCATAAAGCTAAGAGT   CAGGGATATTATGAAGGTATGTG   GTGCATAACTATCGCCTTCC   TTAATGCCTTCCACTCTGG   CATAGGTGAGAAGAAACCTGG   GACATGGCTCTGTACTGTTAGG   AAGACAGAGTGCTCCCATTC   GGGTGGTATACTGGATTGC   FGB    PR1          PR2   外显子1   外显子2-3   外显子4-5   外显子6-7   外显子8   3′UTR   GCATGCTGGATTGAATCC   CAAACCCTGATAACCTGCCATC   GTTCAGCCAACAAGTGAACC   GGGTGTTGGAATAGTTACATTC   AACTGCTTGGTGATAGCTCAG   AATGGACAGGGGATTCAGAT   GACTACTGTGCACACGAGTG   CCTTCTTCCCACAGCAATAG   CCAGTCAGTAATCCAAATCCC   GGTTCACTTGTTGGCTGAACC   GCTAAGCCATCCTCATCTTAAG   TTATCTGGCAAGTTGCAGG   CCAAGGTGCTGGAATTACAG   GAAATGCTTTCGAGTGATGC   GTCTGCTTGAGAGTTTTAGAGG   GAGGTTGTGAACGCTTCTCC

1.4纤维蛋白原测量

根据Clauss的方法使用Dade_凝血酶反应物(Baxter,Miami, FL,USA)测定总纤维蛋白原。测试在Electra 1000(MLA, Pleasantville,USA)上进行。总纤维蛋白原水平以U/dL表示,其中 100U/dL对应2.8g/L。根据Clauss测量的总纤维蛋白原与根据ELISA 使用商业兔抗纤维蛋白原抗体(DAKO A/S,Glostrup,Denmark)测量 的总纤维蛋白原关联良好(R2=0.902;n=60)。

1.5纤维蛋白原γ′抗原测量

纤维蛋白原γ′(即γA/γ′和γ′/γ′纤维蛋白原)抗原水平通过 ELISA使用针对肽产生的抗体2.G2.H9测量,所述肽由如 US2003/0003515中公开的γ′链的羧基末端序列 (VRPEHPAETEYDSLYPEDDL(SEQ ID NO:28))(从Campro Scientific, Veenendaal,Netherlands可获得)组成。这种抗体识别包括对于凝 血酶的高亲和力结合位点的表位并且对γ′链特异。

塑料96孔微量滴定板(Greiner,Alphena/d Rijn,Netherlands) 在于4℃过夜孵育的过程中用2μg/ml小鼠抗人γ′纤维蛋白原包被 (110μl/孔)。板用110μ11%牛血清白蛋白(BSA)在洗涤缓冲 液(50mM三乙醇胺,100mM NaCl,10mM EDTA,0.1%Tween-20, pH 7.5)中在室温下封闭1小时。在稀释缓冲液(50mM三乙醇胺, 100mM NaCl,10mM EDTA,0.1%Tween-20,10mM苄脒,pH 7.5) 中稀释的100μl血浆样品加入孔中并使板在室温下孵育1小时。样品 稀释液在室温下稳定至少3小时。

结合的纤维蛋白原γ′(γA/γ′加γ′/γ′)使用100μl1: 20,000稀释的HRP-缀合的兔抗人纤维蛋白原(DAKO A/S,Glostrup, Denmark)进行检测。在室温下孵育1小时后,板与100μl/孔底物 缓冲液(0.1M乙酸钠pH 5.0,0.1mg/ml四甲基联苯胺,0.01%H2O2) 一起孵育。15分钟后,反应通过加入1M H2SO4(50μl/孔)中止并 通过分光光度计阅读450nm处的吸光度。在所有孵育步骤之间,孔用 洗涤缓冲液洗涤3次。

校准曲线使用1∶2,000-1∶128,000稀释的混合正常血浆获得, 其包含100U/dL限定的纤维蛋白原γ′(γA/γ′加γ′/γ′)。血浆 样品的纤维蛋白原γ′抗原计算为2个不同的独立稀释度(1∶8,000, 1∶16,000)测量的平均结果。结果以U/dL表示。平均变异系数(CV) 是9.3%。测定法内变异为4.5%。

1.7统计分析

在健康对照中,关于每种htSNP的哈迪-温伯格平衡通过x2分析 测试。为了研究纤维蛋白原的单元型是否与血栓形成关联,根据Woolf (Ann.Hum.Genet.19:251-253(1955))的优势比(ORs)和95 %置信区间(95%CIs)计算为相对危险的度量,其表明相对于参照类 别(例如,非单元型2携带者)在显示类别(例如单元型2携带者) 中血栓形成发展的危险。

3种纤维蛋白原基因位于单段50kb DNA上。这导致高度连锁不平 衡(LD)。为了调整这点,每种基因的危险单元型的优势比通过多重 对数回归计算。

在病例-对照研究中关联的基本测量是根据优势比估计的相对危 险。这个优势比表明相对于没有危险因子(或危险因子的参照类别) 的那些中的危险,在具有危险因子(或危险因子类别)的那些中疾病 发展的危险。在病例-对照研究中,这个优势比计算为暴露的优势比, 即在病例中暴露的优势比超过对照中暴露的优势。这种优势比可以由 于混杂而是偏向的,这在疾病的外部决定子在研究下在危险因子类别 中不均匀分布时发生。在这种情况下,需要调整优势比,这通过计算 来自分层分析的共同估计来进行,分层基于混杂因子的类别。为了同 时适应多重混杂,主要分析技术是无限制的对数回归。简言之,

log(p/(1-p))=b0+b1x1+bkxk

p=1,如果是病例;如果是对照则为0

b0=截距

b1=目的变量的回归系数

X1=目的变量的类别

bk=关于潜在混杂拟合的对数回归系数(k=2,3,4....)

Xk=混杂变量的类别(k=2,3,4...)

在这个模型中,反对数(b1)是目的变量的优势比。对数回归算 法通过迭代操作估计系数,并且标准差来源于似然函数。这些标准差 用于构建95%置信区间。

为了研究各种纤维蛋白原单元型,血浆纤维蛋白原水平和纤维蛋 白原γ′水平之间的关联,计算具有95%CIs的平均水平。在对照受试 者中测量的纤维蛋白原γ′水平的四分位数用作评估纤维蛋白原γ′低 水平是否与静脉血栓形成危险关联的截止点。多重对数回归用于调整 关于总纤维蛋白原高水平(四分位数)和危险基因型/单元型(FGG-H2) 的纤维蛋白原γ′水平(四分位数)。在对照受试者中测量的γ′/γ比 率的第10百分位(P10)用作评估低γ′/γ比率是否与静脉血栓形成 的危险关联的截止点。

结果

所有942名受试者的基因分型显示15个选择的htSNP鉴别FGG 中的4种单元型、FGA中5种和FGB中6种(参见图3)。对于所有 htSNPs,在对照受试者中基因型的分布符合哈迪-温伯格平衡。检查由 Haploview的基因型数据显示,如预期的,3种不同的纤维蛋白原基因 的SNPs之间的高度连锁不平衡(数据未显示)。Arlequin输出显示 单元型在基因簇上是连续的。表3中显示了对照受试者中等位基因频 率>1%的连续单元型。大多数重组在FGB和FGA基因之间出现。

  FGG-FGA-FGB   频率对照   H1-H1-H1   21.1   H1-H1-H4   1.6   H1-H4-H1   1.9   H1-H4-H4   7.8   H1-H4-H5   1.8   H2-H2-H1   5.5   H2-H2-H2   16.7   H2-H2-H4   3.7   H3-H3-H3   10.3   H3-H7-H1   1.2   H3-H7-H4   1.2   H3-H7-H6   14.4   H4-H1-H1   2.7

表3:基因频率>1%的连续单元型

在所有3种基因中,与所有其他受试者相比,对于都命名为H2 的单元型之一纯合的受试者具有血栓形成增加的危险(表4a)。

  单元型   FGG   FGA   FGB   案例   (%)   对照   (%)   OR  (95%CI)   案例   (%)   对照   (%)   OR  (95%CI)   案例   (%)   对照   (%)   OR  (95%CI)   单元型1   H1Hx   222   (47.3)   236   (50.1)   0.8   (0.6-1.1)   192   (41.0)   200   (42.5)   1.0   (0.7-1.3)   212   (45.3)   210   (45.1)   1.1   (0.8-1.4)   H1H1   56   (11.9)   65   (13.8)   0.8   (0.5-1.2)   33   (7.0)   1.2   (0.7-2.0)   58   (12.4)   50   (10.7)   1.2   (0.8-1.9)   单元型2   H2Hx   201   (42.8)   198   (42.0)   1.2   (0.9-1.5)   200   (42.7)   202   (42.9)   1.1   (0.9-1.5)   165   (35.3)   151   (32.4)   1.2   (0.9-1.6)   H2H2   57   (12.2)   28   (6.0)   2.4   (1.5-3.9)   60   (12.8)   34   (7.2)   2.0   (1.3-3.2)   33   (7.1)   19   (4.1)   1.9   (1.1-3.4)

  单元型3   H3Hx   185   (39.4)   211   (44.8)   0.8   (0.6-1.0)   85   (18.2)   103   (21.9)   0.8   (0.6-1.1)   78   (16.7)   95   (20.4)   0.8   (0.6-1.1)   H3H3   32   (6.8)   39   (8.3)   0.7   (0.4-1.2)   (1.1)   7(1.5)   0.7   (0.2-2.2)   5   (1.1)   (1.1)   1.0   (0.3-3.3)   单元型4   H4Hx   38   (8.1)   32   (6.8)   1.2   (0.7-2.0)   94   (20.1)   101   (21.4)   0.9   (0.7-1.2)   119   (25.4)   123   (26.4)   0.9   (0.7-1.3)   H4H4   1   (0.2)   0   (0.0)    -   3   (0.6)   10   (2.1)   0.3   (0.1-1.1)   8   (1.7)   13   (2.8)   0.6   (0.2-1.5)   单元型5   H5Hx   NP   NP   11   (2.4)   16   (3.4)   0.7   (0.3-1.5)   H5H5   NP   NP   0   (0.0)   1   (0.2)    -   单元型6   H6Hx   NP   114   (24.4)   131   (28.1)   0.8   (0.6-1.1)   H6H6   Np   7   (1.5)   6   (1.3)   1.1(0.4-   3.3)   单元型7   H7Hx   129   (27.6)   142   (30.1)   0.9   (0.6-1.2)   13   (2.8)   16   (3.4)   0.8   (0.4-1.7)   H7H7   11   (2.4)   13   (2.8)   0.8   (0.4-1.9)   1   (0.2)   1   (0.2)   1.0   (0.1-15.9)

表4a:FGG、FGA和FGB的单元型的血栓形成危险

因为这些基因中的单元型不是独立地遗传,所以很难鉴别负责对 血栓形成的影响的基因(以及随后的SNP)。因此通过多重对数回归 计算每种基因的危险单元型(H2)和保护单元型(H3)的ORs和95% CIs。通过在一个模型中输入连续单元型的3种分离的单元型(例如 FGG-H2、FGA-H2和FGB-H2),可以相对另外2种基因的单元型校正一 种基因的单元型的影响。与FGA-H2H2(OR=0.5,95%CI:0.2-1.9) 和FGB-H2H2关联的危险几乎完全消失(OR=1.3,95%CI:0.6-2.8), 但与GG-H2H2关联的危险(OR=3.5,95%CI:1.0-12.5)保留。从这 点我们得出结论H2的原因突变(causal mutation)一定位于FGG基 因中某处。对于H3,减少的危险只在FGG-H3H3中保留(表4b)。

表4b在调整其他基因的分别的单元型H2或H3的影响后基因的 单元型H2和H3的ORs

  单元型   FGG   FGA   FGB   OR(95%CI)  OR(95%CI)  OR(95%CI)  单元型2   H2Hx   1.7(0.8-3.7)   0.6(0.3-1.4)   1.1(0.8-1.6)   H2H2   3.5(1.0-12.5)   0.5(0.1-1.9)   1.3(0.6-2.8)

  单元型3   H3Hx   0.7(0.5-1.0)   1.3(0.7-2.4)   0.8(0.4-1.4)   H3H3   0.7(0.3-1.3)   1.1(0.3-4.4)   1.4(0.3-1.7)

*所有ORs使用HxHx作为参照类别计算,OR=1

Hx:除了给出的一种外的所有单元型

通过多重对数回归调整连锁不平衡

因为纤维蛋白原水平增加与DVT的危险关联,所以首先在对照受 试者中研究FGG、FGA和FGB单元型是否与纤维蛋白原血浆水平关联。 在表5中显示了各种单元型的纯合携带者的平均纤维蛋白原水平。没 有一种单元型与血浆纤维蛋白原水平关联。

  单元型   N   平均值   (95%CI)   FGG   H1H1   65   320   (306-334)   H2H2   28   311   (292-329)   H3H3   39   318   (301-334)   FGA   H1H1   33   329   (304-354)   H2H2   34   313   (297-330)   H3H3   7   324   (281-367)   H4H4   10   336   (285-387)   H7H7   13   315   (280-350)   FGB   H1H1   50   320   (301-339)   H2H2   19   335   (311-360)   H3H3   5   313   (260-365)   H4H4   13   324   (290-359)   H5H5   1   281   H6H6   6   283   (243-323)   H7H7   1   282

表5:在纯合携带者(对照)中FGG、FGA和FGB单元型与纤维蛋 白原水平(U/dL)的关联

因为没有观察到FGG、FGA和FGB单元型中任何一种对血浆纤维蛋 白原水平的定量影响,所以FGG-H2(其增加血栓形成的危险)应包含 定性缺陷,即改变氨基酸序列以及纤维蛋白原γ链的某些功能特性的 SNP。因为在FGG基因中测定的4种FGG H2-标记的SNPs中没有一种 改变氨基酸序列,所以考虑部分FGG-H2携带者可能在FGG基因编码区 中具有另外变异。因此FGG-H2纯合的10名DVT患者的基因(20个 FGG-H2等位基因)在完整的基因簇上测序,包括启动子、5′UTRs、外 显子、内含子/外显子边界和3′UTRs,但没有发现新变异。这表明在 这个研究中对于FGG-H2特异的4种SNPs中的一种是危险增强性SNP。

这4种FGG-H2特异性SNPs中的一种位于启动子中(129A/T [rs2066854],一种位于内含子8中(7874G/A[rs2066861]),一 种位于内含子9中(9615C/T[rs2066864])还有一种位于3′非翻译 区的下游(10034C/T[rs2066865])。本发明人推论这最后2种SNPs (9615C/T或10034C/T)通过其分别与纤维蛋白原γ′和γA转录的 多腺苷酸化位点的紧密接近影响FGG前-mRNA可变剪接的效率,并且 因此改变纤维蛋白原γ′表达(图2)。

γ′链以2种形式存在-γA和γ′(图2)。γA链由其中已去除 前-mRNA的所有9个内含子的mRNA翻译。相反,γ′链来自于FGG前 -mRNA的可变加工。内含子9没有剪接掉并且多腺苷酸化在这个内含 子内发生。这导致具有由内含子9编码的独特的20个氨基酸延伸取代 由外显子10编码的羧基末端4个氨基酸的多肽的翻译。这种变体链构 成在血浆中发现的大约7-15%纤维蛋白原γ链。几乎所有γ′蛋白质 在体内作为与γA变体的异二聚体存在,其中一个D区包含γ′羧基末 端并且另一个包含γA羧基末端。

包含9615T和10034T的FGG-H2与γ′形成关联,并且γ′形成 造成血栓形成危险。为了鉴别H2-特异性SNPs 7874G/A和10034C/T 之间可能的重组,所有受试者都测定SNP 10034C/T类型。10034C/T 完全连接至7874G/A的发现排除了SNPs 7874G/A和10034C/T之 间重组的可能性。

在473名患者和474名对照中通过ELISA测量纤维蛋白原γ′(即 γA/γ′和γ′γ′)水平。由本发明人鉴别为危险单元型的FGG-H2与 纤维蛋白原γ′水平减少强烈关联(表6)。FGG-H2单元型对纤维蛋白 原γ′水平具有清楚的等位基因特异性和剂量依赖型效应,其中纯合 H2携带者一个H2-等位基因携带者具有中等水平。另外,FGG-H3等位 基因与纤维蛋白原γ′水平增加关联。

表6:FGG单元型与绝对和标准化的纤维蛋白原γ′水平的关联

  单元型   N   纤维蛋白原   γ′绝对水平   纤维蛋白原   γ′归-化   的水平   FGG   平均值(95%CI)   中值   范围   平均值(95%CI)   中值   范围   H2H2   28   0.67   (0.59-0.76)   0.61   0.34-1.22   0.60   (0.55-0.65)   0.58   0.36-0.96   H1H2   106   0.96   0.93   0.49-1.70   0.81   0.82   0.53-1.07   (0.90-1.01)   (0.79-0.84)   H2H3   83   1.03   (0.95-1.11)   0.95   0.53-2.48   0.89   (0.86-0.92)   0.88   0.62-1.35   H2H4   8   0.85   (0.70-1.01)   0.95   0.60-1.05   0.81   (0.71-0.90)   0.77   0.69-1.00   H2H5   1   1.09   0.73   H1H1   65   1.13   (1.06-1.20)   110   0.62-1.91   0.99   (0.95-1.02)   0.97   0.69-1.47   H1H4   13   1.23   (1.06-1.40)   1.24   0.87-1.64   1.06   (0.96-1.16)   1.01   0.88-1.47   H1H3   117   1.31   (1.25-1.38)   1.26   0.59-2.27   1.09   (1.05-1.12)   1.07   0.63-1.65   H3H3   39   1.31   (1.22-1.40)   1.32   0.88-1.92   1.15   (1.11-1.19)   1.15   0.84-1.41   H3H4   11   1.40   (1.20-1.60)   1.38   0.97-2.12   1.10   (1.00-1.21)   1.05   0.93-1.52

在患者(平均值:111U/dL,95%CI:107-115)和对照(平均值: 111U/dL,95%CI:108-114)之间的纤维蛋白原γ′水平中没有差异。 为了评估纤维蛋白原γ′水平减少是否与静脉血栓形成危险增加关联, 如对照受试者中测量的四分位数用作截止点。与最高的四分位数相比, 纤维蛋白原γ′水平减少(最低的四分位数)与危险轻微增加关联 (OR=1.3,95%CI:0.9-1.8)(表7a)。然而,纤维蛋白原γ′水平 不仅通过FGG前-mRNA的剪接和多腺苷酸化效率确定,还通过纤维蛋 白原合成、消耗和清除的速率确定。的确发现了总纤维蛋白原水平和 纤维蛋白原γ′水平之间的良好相关性(表4)。

表7a:以在对照受试者中测量时的四分位数的纤维蛋白原γ′水 平(U/dL)和总纤维蛋白原水平(U/dL)的血栓形成危险

  A   B   C   OR(95%CI)   OR调整的(95%CI)+   OR调整的(95%CI)   纤维蛋白原γ水平   ≥132   1  1  1  109-132   0.8(0.6-1.2)   1.2(0.8-1.8)   1.2(0.8-1.9)   86-109   0.9(0.6-1.3)   1.9(1.2-3.0)   -1.9(1.1-3.0)   <86   1.3(0.9-1.8)   3.0(1.8-4.9)   2.9(1.6-5.4)   总纤维蛋白原水平   <101   1  1  1  101-114   0.9(0.6-1.3)   1.1(0.7-1.6)   1.0(0.7-1.5)   114-130   1.0(0.7-1.5)   1.6(1.1-2.5)   1.6(1.0-2.4)   ≥130   1.5(1.1-2.2)   3.2(2.0-5.2)   3.2(1.8-5.4)   FGG单元型2   HxHx   1  -   1  H2Hx   1.2(0.9-1.5)   -   0.9(0.6-1.2)   H2H2   2.4(1.5-3.9)   -   1.4(0.8-2.5)

*参照类别

_通过多重对数回归互相调整的OR

因此本发明人计算了关于纤维蛋白原γ′水平的四分位数和关于 总纤维蛋白原水平的四分位数分层的静脉血栓形成危险(如在对照中 测量的)(表8)。在每个总纤维蛋白原四分位数中,当纤维蛋白原 γ′水平减少时静脉血栓形成的危险增加,而在每个纤维蛋白原γ′四 分位数中,当总纤维蛋白原水平增加时血栓形成危险增加。这显示纤 维蛋白原γ′水平减少和纤维蛋白原水平升高是静脉血栓形成的2种 分开的危险因素。为了证实这些发现,我们使用对数回归计算关于纤 维蛋白原γ′水平的四分位数和关于总纤维蛋白原水平的四分位数的 静脉血栓形成危险。这个分析显示纤维蛋白原γ′水平减少和总纤维蛋 白原水平增加都与静脉血栓形成危险增加关联(表7a,列B)。

表8:如在对照受试者中测量的关于纤维蛋白原γ′和总纤维蛋白 原的四分位数分层后的血栓形成危险(OR和95%CI)

  纤维蛋白原γ′   总纤维蛋白原   <86   86-108   109-131   ≥132   Ca   Co   Ca   Co   Ca   Co   Ca   Co   <101   68   69   32   36   5   13   2   0   OR=1  0.9(0.5-1.6)   0.4(0.1-1.2)   -   101-113   43   34   29   44   16   29   1   9   1.3(0.7-2.3)   0.7(0.4-1.2)   0.6(0.3-1.1)   0.1(0.0-0.9)   114-129   28   13   32   30   32   50   19   27   2.2(1.0-4.6)   1.1(0.6-2.0)   0.6(0.4-1.1)   0.7(0.4-1.4)   ≥130   9   1   16   9   43   27   93   80   9.1(1.1-   74.1)   1.8(0.7-4.4)   1.6(0.9-2.9)   1.2(0.8-1.9)

*参照类别;Ca:病例数目,Co:对照数目

因为FGG-H2与纤维蛋白原γ′水平减少和DVT危险增加关联,所 以FGG-H2连同纤维蛋白原γ′的四分位数和纤维蛋白原的四分位数一 起输入同一模型中(表7a,列C)。与纤维蛋白原γ′水平减少和总纤 维蛋白原水平升高关联的危险没有改变,而与FGG-H2纯合性关联的危 险几乎完全消失(OR=1.4,95%CI:0.8-2.5)。这表明FGG-H2的作 用通过其对纤维蛋白原γ′水平的影响介导。

因为纤维蛋白原γ′和总纤维蛋白原的血浆浓度都影响血栓形成 危险并且因为纤维蛋白原γ′水平总是取决于总纤维蛋白原水平,所以 还分析了纤维蛋白原γ′/总纤维蛋白原比率(γ′/γ比率)对静脉血 栓形成危险的影响。发现γ′/γ比率在患者(平均值:0.89,95%CI: 0.87-0.92)中比在对照(平均值:0.95,95%CI:0.93-0.97)中更 低。与γ′/γ比率≥0.69的那些比较,γ′/γ比率低于0.69的个体具 有静脉血栓形成增加的危险(OR=2.4,95%CI:1.7-3.5),所述0.69 代表在对照受试者中测量时的第10百分位数(P10)(表7b)。FGG-H2 与纤维蛋白原γ′水平减少关联,还与γ′/γ比率减少关联(表6)。 FGG-H2连同γ′/γ比率的P10一起输入到同一对数回归模型中。与γ ′/γ比率(<0.69)减少关联的危险保留(OR=2.2,95%CI:1.3-3.5), 而与FGG-H2纯合性关联的危险大部分消失(OR=1.2,95%CI: 0.6-2.3)。这显示FGG-H2单元型经由减少γ′/γ比率作用于静脉血 栓形成的危险。

  案例(%)   N=473   对照(%)   N=474   OR   95%CI   ≥0.69   373(78.9)   427(90.1)   1  -   <0.69   100(21.1)   47(9.9)   2.4   1.7-3.5

*参照类别

表7b:在对照受试者中测量时的γ′/γ比率的第10百分位数 (P10)的静脉血栓形成危险

讨论

在基于大量人群的病例对照研究-Leiden血栓形成倾向研究中 研究了FGG、FGA和FGB基因的最常见单元型对静脉血栓形成危险的影 响。发现3种单元型即FGG-H2、FGG-H2和FGB-H2增加血栓形成的 危险。调整3种基因之间的连锁不平衡后,只有FGG-H2单元型保留与 静脉血栓形成危险增加的关联。FGG-H2单元型的纯合携带者(5.9% 的人群)发展第一次静脉血栓形成事件的危险增加2.4倍(95%CI: 1.5-3.9)。FGG-H2单元型还发现与血浆纤维蛋白原γ′水平减少(γ A/γ′加γ′/γ′纤维蛋白原)关联并与纤维蛋白原γ′/总纤维蛋白原 比率(γ′/γ比率)减少关联。

进一步发现静脉血栓形成危险随纤维蛋白原水平增加和纤维蛋白 原γ′水平减少而剂量依赖性增加,即使在对于FGG-H2单元型的存在 调整后。得出结论:FGG-H2单元型通过减少纤维蛋白原γ′血浆水平 来增加静脉血栓形成危险。因为纤维蛋白原γ′水平与纤维蛋白原关联 (图5)并且因为纤维蛋白原水平升高也与静脉血栓形成危险增加关 联,所以考虑使用γ′/γ比率作为危险决定子更实际。γ′/γ比率低 于在健康受试者中测量时分布的P10(0.69)的个体中静脉血栓形成 的危险增加2.4倍,即使在对于FGG-H2单元型调整后。82%对照和γ ′/γ<0.69的91%病例是FGG-H2单元型的纯合携带者。

危险单元型FGG-H2通过4种完全连锁的多态性限定,其中罕见等 位基因对于这种单元型是独特的:129A/T(rs2066854)、7874G/A (rs2066861)、9615C/T(rs2066864)和10034C/T(rs2066865)。 rs数目表示根据dbSNP鉴别的SNPs(经由http://www.ncbi.nlm.nih.gov可获得)。同样地,在本研究940名个体的 群体中,在7874G/A和10034C/T多态性之间没有发现重组。本发明 人提出是10034C>T改变导致血浆纤维蛋白原γ′减少和γ′/γ比率减 少,因为它改善了CstF共有区位点。

FGG-H2鉴别为与静脉血栓形成危险增加关联的唯一单元型,而 FGG、FGA或FGB单元型中没有一种与健康对照受试者中的血浆纤维蛋 白原水平关联。因此,关于FGG-H2的测试可以用作诊断手段。

实施例2

纤维蛋白原γ10034C>T多态性的T等位基因通过增强在FGG基因中核苷酸10030-10047处关于CstF位点的共有性而减少纤维蛋白原γ基因的可变剪接的效率。

引言

在实施例1中报告了纤维蛋白原γ基因的单元型(FGG-H2)与深 部静脉血栓形成危险增加关联,还与纤维蛋白原γ′水平减少关联。检 查FGG-H2在这种单元型中存在的单元型标记单核苷酸多态性 (htSNPs)后,假设10034C>T多态性[rs2066865]的T等位基因(根 据SeattleSNPs编号(Nickerson D.SeattleSNPs.NHLBI Program for Genomic Applications,UW-FHCRC,Seattle,WA. http://pga.gs.washington.edu.15-4-2003),GenBank登记号 AF350254通过影响纤维蛋白原γ基因的可变剪接的效率负责纤维蛋 白原γ′水平的减少。

10034C>T多态性位于切割刺激因子(CstF)共有区2a(Beyer K 等人,J Biol Chem.(1997)272:26769-26779)序列 (YGTGTYTTYAYTGNNYGT,于nt 10030-10047)中,正好在第二个多腺 苷酸化(pA)信号(nt 9997-10002(pA2)下游;图8。这种多腺苷 酸化信号用于形成编码纤维蛋白原γA链的mRNA。用于形成编码纤维 蛋白原γ′链的mRNA的多腺苷酸化信号(pA1)位于内含子9中nt 9558 -9563处。在核苷酸10034处包含T(在CstF共有序列中有下划线的) 的FGG-H2中,与在第10034位处都具有C的其他常见FGG单元型(H1、 H3和H4)的那种比较,CstF序列被增强。

假设CstF共有区的这种改善导致在来源于FGG-H2等位基因的前 -mRNA中nt 9997-10002(pA2)处多腺苷酸化信号的更频繁使用并且 因此pA1(γ′特异性多腺苷酸化)相对较不频繁使用。FGG-H2因此预 期产生相对更多的γA转录物(使用pA2)和相对较少的γ′转录物(使 用pA1),其将对应在FGG-H2纯合携带者体内观察到的纤维蛋白原γ ′水平减少和纤维蛋白原γ′/总纤维蛋白原比率减少。

存在一种位于内含子9中的其它多态性,其对FGG-H2特异并且基 于其位置可能影响纤维蛋白原γ基因的可变剪接的效率。9615C>T [rs2066864]多态性位于内含子9中nt 9558-9563(pA1)处的第一个 多腺苷酸化信号位置3′,这导致纤维蛋白原γ′特异性转录。

为了研究多态性9615C>T和10034C>T对纤维蛋白原γ前-mRNA的 可变剪接效率的影响,制备不同的FGG小基因构建体(见表9)并转 染到肝来源的HepG2细胞中。转染后,从细胞中分离mRNAs并且对于 每种不同构建体通过实时PCR评估pA1和pA2的相对使用,作为可变 剪接效率的度量。为了证实nt 10030-10047处的CstF共有序列在确 定FGG前-mRNA可变剪接效率中的重要性,通过基于相同的共有序列 在其他位置处导入突变另外增强并减弱nt 10030-10047处的CstF共 有区(参见表10)。

方法

1.FGG单元型小基因构建体

在本研究中使用的小基因构建体基于包含强CMV启动子的表达载 体pcDNA3(Invitrogen)。包含纤维蛋白原γ基因的外显子9、内含 子9、外显子10和3′UTR的1090bp片段通过PCR使用高保真聚合酶 (Taq/Tgo混合物,Roche)在FGG-H1和FGG-H2纯合的基因组DNA样 品上扩增。正向引物(5′-GTC GAT CGG TCT AGA CCA CCA TGG GTG GCA CTT ACT CAA AAG CAT C-3′(SEQ ID NO:29))包含具有翻译起始 位点(斜体)以及导入的关于Xbal的限制性位点(有下划线的)的 Kozak序列。导入与外显子9的天然阅读框接读码框融合的起始密码 子以防止伴随剪接mRNAs的无义密码子介导的衰退的潜在问题。反向 引物(5′-CAA CTA GAA TGC AAA GAG TTA GGC ATA ACA TTT AGC A-3′ (SEQ ID NO:30)包含导入的关于BsmI的限制性位点(有下划线的)。

PCR产物和载体用XbaI和BsmI双重消化并将PCR产物克隆到载 体的XbaI和BsmI位点中。通过用XbaI和BsmI双重消化,从载体中 去除牛生长激素和SV40多腺苷酸化位点以防止对实验的干扰。

制备几种不同的FGG小基因构建体(表9)。构建体1(9615C, 10034C(FGG-H1))和构建体2(9615T,10034T(FGG-H2))各自携 带FGG的单元型。使用载体中片段下游的HindIII位点和插入片段nt 9908-9913处的内部HindIII位点,通过交换构建体1和2之间的 HindIII限制性片段获得构建体3(9615C,10034T)和构建体4(9615T, 10034C)。

表9FGG小基因构建体变体

  构建体   FGG单元型   SNP 9615   SNP 10034   1(野生型)   2   3   4   H1   H2   -   -   C   T   C   T   C   T   T   C

所有构建体通过测序进行分析以验证多态性位点的同一性并确保 没有导PCR人工产物。测序在ABI PRISM_3100Genetic Analyzer (Applied Biosystems)上进行。反应使用ABI PRISM_BigDye Terminator Cycle Sequencing试剂盒(Applied Biosystems)进行。 引物序列在下表中列出。

序列引物(5′-3′)

  pcDNA3Fw   TCACTATAGGGAGACCCAAGC(SEQ ID NO:31)   pcDNA3Rv   ACCATGATTACGCCAAGCTC(SEQ ID NO:32)   FGGex9-10Rv   GCTTTGCAAGTCCATTGTCC(SEQ ID NO:33)

  seqmut1Fw   AAAATAGGAGAACATTTTAGGTTTCAA(SEQ ID NO:34)   seqmut1Rv   GCTGAATGAAGCCATACCAAA(SEQ ID NO:35)   seqmut2Fw   TAGAGCTTGGCGTAATCATGG(SEQ ID NO:36)   seqmut2Rv   TTTTTCTGCGCGTAATCTGC(SEQ ID NO:37)

2.CstF共有区诱变

使用QuikchangeTM定点诱变试剂盒(Stratagene)根据制造商的 规程进行定点诱变。总共制备4种CstF共有区突变体(表10)。在 CstF突变体1中,10031G突变为A。在CstF突变体2中,10031G和 10042G突变为A。在CstF突变体3中,10033A突变为G并且在CstF 突变体4中,10033A和10046A突变为G。

表10在CstF位点中具有突变的FGG小基因构建体

  构建体   CstF共有区中的突变   SNP 9615   SNP 10034   野生型   突变体1   突变体2   突变体3   突变体4   no   10031G>A   1003lG>A;10042G>A   10033A>G   10033A>G;10046A>G   C   C   C   C   C   C   C   C   C   C

使用下列突变体寡聚物(突变的核苷酸有下划线):CstF突变体 1:5,-GAC TAG ATA CAT GAT ACC TTT ATT GAC CAT TAA AAA CCA CC-3′ (SEQ ID NO:38)和反向互补物,CstF突变体2:5′-GAC TAG ATA CAT GAT ACC TTT ATT AAC CAT TAA AAA CCA CC-3′(SEQ ID NO:39)和 反向互补物,CstF突变体3:5′-GAC TAG ATA CAT GGT GCC TTT ATT GAC CAT TAA AAA CCA CC-3′(SEQ ID NO:40)和反向互补物,CstF 突变体4:5′-GAC TAG ATA CAT GGT GCC TTT ATT GAC CGT TAA AAA CCA CC-3′(SEQ ID NO:41)和反向互补物。为了验证突变,所有突变的 构建体通过测序进行分析。

3.转染条件

将构建体转染到HepG2细胞中。产生内源性纤维蛋白原的高加索 人肝细胞癌细胞系HepG2(ECACC,#85011430),根据ECACC的说明 书进行培养。细胞在12孔板中培养并在24小时后在60-80%汇合时 使用Tfx-20反应物(Promega)根据制造商的规程进行转染。1μg 每种构建体使用在总体积400μl的生长培养基(补充10%(v/v) 胎牛白蛋白、60U/ml青霉素/链霉素和0.1mM非必需氨基酸的MEM) 中的3μl Tfx-20反应物转染。因为每种构建体产生2种转录物(γ A和γ′),所以无需校正转染效率中的差异。使用2种分开的构建体 制剂进行3次独立转染实验。

4.总RNA分离

通过胰蛋白酶消化收获细胞后,使用RNeasy小量试剂盒(Qiagen) 根据制造商的规程分离总RNA。每种RNA样品与10单位DNaseI(Roche) 一起于37℃孵育15分钟,随后于65℃灭活15分钟。每种总RNA样品 的质量通过琼脂糖凝胶电泳检查。

5.cDNA合成

使用用于逆转录酶(RT)的第一条链cDNA合成试剂盒 (SuperscriptTM II Reverse Transcriptase,Invitrogen)和来自 HepG2细胞的1μg RNA根据规程进行cDNA合成,使用修饰的oligo d(T)引物(5′-AGC TGG TCA GTC GTC AGC TGA(T)16-3′(SEQ ID NO:42))。使用这种引物,只有mRNA可以用作cDNA合成的模板。

6.实时PCR分析

对于每种样品,可变剪接的效率通过实时PCR使用荧光标记探针 进行测量。为了防止形成异双链体,分析在2个分开的PCR反应中的 pA1和pA2转录物的浓度。在2个反应中,正向引物(5′-TGC AGA TAT CCA TCA CAC TGG-3′(SEQ ID NO:43))位于载体上,以只扩增来 源于构建体转录物的cDNAs,而不扩增内源性纤维蛋白原mRNAs。

对于pA2转录物的测量,反向引物(5′-GAA GTG AAG CTT TGC AAG TCC-3′(SEQ ID NO:44))位于FGG的3′UTR中(参见图9)。对于 pA2转录物特异的探针(5′-FAM-GAC GTT TAA AAG ACC GTT TCA AA-BHQ-3′(SEQ ID NO:45))位于外显子10和3′UTR的边界上(图 9)。对于pA1转录物的测量,反向引物(5′-TCA TCC TCA GGG TAA AGT GAG TC-3′(SEQ ID NO:46))位于编码γ′链羧基末端的20个额外 氨基酸的内含子9的那部分中(图9)。对于pA1转录物特异的探针 (5′-TET-AGG TCA GAC CAG AGC ACC CT-BHQ-3′(SEQ ID NO:47)) 位于外显子9和γ′链羧基末端的20个额外氨基酸的边界上(图9)。 产物的大小为340bp(γA)和280bp(γ′)。

实时PCR效率由系列稀释的cDNA制剂的斜率计算。在指数阶段中 一个循环的相应实时PCR效率(E)根据方程式计算:E=10[-1/斜率](Pfaffl MW.Nucleic Acids Res.2001;29:e45)。pA2-和pA1-转录物显示 在具有高度线性(皮尔逊相关系数r>0.98)的未稀释到10-5稀释的 cDNA输入(n=6)研究范围中2.14的实时PCR效率比。

定量值由阈值循环数获得,在阈值循环中反应中产生的荧光超过 阈值(Ct值)。在2个反应中,在扩增在指数阶段(对于γA反应为 0.25并且对于γ′反应为0.10)中的某个点上选择固定的阈值。函数 2-Δct用作pA1转录物/pA2转录物比率的度量,ΔCt是CtpA1和CtpA2之 间的差异。

为了验证实时PCR的精确度和可重复性,每种cDNA样品在每次运 行中分析3次,并且在4次不同的运行中进行分析。当测定法内CV<1 %时Ct值被认可。测定法间CV<4%。在3次独立转染实验中比较所 有构建体的2种不同DNA制剂。

7.统计分析

为了分析构建体之间的pA1和pA2转录物表达中的差异,携带单 元型1的构建体(9615C,10034C)的pA1转录物与pA2转录物的相对 表达(pA1/pA2比率)设定为100%(野生型构建体)。以这种方式, pA2使用增加的构建体的pA1/pA2将低于100%。相反,pA2使用减少 的构建体的pA1/pA2比率将高于100%。使用双侧斯氏t检验(two sided student’s t-test)测试所有构建体的平均相对pA1/pA2比 率与野生型构建体的差异。

结果

1.FGG单元型小基因构建体

图10中显示了与野生型构建体(构建体1,FGG-H1)比较,关于 不同FGG小基因构建体的pA1和pA2转录物的平均相对使用(pA1/pA2 比率)。与从野生型构建体获得的比较,构建体2(FGG-H2)的pA1/pA2 比率减少(71.512%,p<0.001)。这对应我们以前的发现,即FGG-H2 在体内与纤维蛋白原γ′水平减少关联。因为FGG-H2在可变剪接区域 1中包含2个SNPs(9615C>T和10034C>T),所以制备交换构建体 (9615C,10034T)和4(9615T,10034C)。这些单元型在体内不存 在,但制备这些构建体以确定2种FGG-H2特异性SNPs中的哪一种引 起纤维蛋白原γ′表达减少。

与从野生型构建体获得的比较,构建体3的pA1/pA2比率减少 (85.33.3%,p=0.007),而构建体4的比率与野生型构建体的没 有明显差异(101.618.4%,p=0.881)。这表明与这个位置中的C 比较,第10034位中的T减少pA1的相对使用。

这些数据证实10034C>T改变负责pA2的使用相对增加和pA1的 使用减少,并且因此负责γ′含量减少,我们先前发现γ′含量减少与 静脉血栓形成危险关联。

2.CstF共有区突变体构建体

为了支持用于预测SNP 10034的T等位基因的功能性的CstF共有 区,制备其中CstF共有区在其他位置突变的构建体(参见表10)。 在CstF突变体1中,10031G突变为A。假定这种核苷酸改变将通过减 少pA2的使用而促进pA1的使用,因为这个突变减弱了CstF共有区。 这对于其中10031G和10042G突变为A的CstF突变体2将也是正确 的。在CstF突变体3和4中,预期在纤维蛋白原γ′表达中pA2使用 增加以及因此的pA1使用减少,因为在这些突变体中,CstF共有区由 1或2个核苷酸增强。在CstF突变体3中,10033A突变为G并且在 CstF突变体4中,10033A和10046A都突变为G。

图11显示与野生型构建体(9615C,10034C)比较,CstF突变体 构建体的pA1和pA2平均相对使用。在CstF突变体1(142.4%)和2 (160.7%)中,pA1使用比野生型构建体中相对更频繁(1:p=0.008, 2:p<0.001)。相反,在CstF突变体3(66.2%)和4(59.7%)中, 与野生型构建体中的比较,pA1的相对使用减少(3:p<0.001,4: p<0.001)。这些数据证实10034C是功能性CstF共有区位点的一部分。

实施例3

用于测定受试者中单元型FGG-H2的存在的方法

可以用于证实个体中FGG-H2单元型存在的一种方法是使用5′核 酸酶/TaqMan测定法基因分型那个个体的FGG-H2标记多态性 10034C/T。

在一般测定法中,90个DNA样品和6个空白在96孔板中进行分 析。为了FGG SNP 10034C/T的基因分型,使用在最终体积22μl中 的10ng基因组DNA、200μM每种dNTP、PCR缓冲液(KCl,Tris-HCl)、 3mM MgCl2、490nM每种引物、109nM每种探针和0.5U Hot Goldstar 聚合酶(Eurogentec)进行PCR。反应缓冲液、MgCl2、dNTP混合物和 Goldstar聚合酶来自Eurogentec,Seraing,Belgium(QpcrTMCore Kit, 目录编号RT-QP73-05)。

引物和探针作为单一混合物Assay-on-Demand从Applied Biosystems(Foster City,USA)获得。通过于95℃孵育10分钟, 随后为95℃变性15秒和60℃退火/延伸1分钟的40个循环进行热循 环。热反应在PTC-225热循环仪(Biozym,Hessisch Oldendorf, Germany)上进行并且用于等位基因区别的荧光终末点读数在ABI 7900 HT(Applied Biosystems,Foster City,USA)上进行。

可以获得的结果的一般例子在图6和7中给出,其中等位基因X 是FGG 10034C并且等位基因Y是FGG 10034T。具有基因型10034CC 的个体是红色的(右下),具有基因型10034CT的那些是绿色的(右 中)并且具有危险基因型10034TT的那些是蓝色的(左上)。空白是 黑色的(左下)。DNA样品随机选自Leiden血栓形成倾向研究,没有 关于患者/对照状态的信息。

使用下列引物和探针:

正向引物:5′-ACATGCATTTCAATAAACCTTTTGTTTCCT-3’(SEQ ID NO: 48)

反向引物:5′-GGTAAATTGGCAAAAAGTGGTGGT-3’(SEQ ID NO:49)

探针1(VIC标记):5′-TTTTAATGGTCAATAAAGGTACCA-3’(SEQ ID NO:50)

探针2(FAM标记):5′-ATGGTCAATAAAGATACCA-3’(SEQ ID NO: 51)

VIC和FAM是附着至探针3′端的荧光基团;TAMRA用作连接至探 针5′端的猝灭剂。探针2通过结合罕见的10034T等位基因检测FGG-H2 单元型。探针1通过结合10034C等位基因检测FGG的所有非FGG-H2 单元型。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号