法律状态公告日
法律状态信息
法律状态
2007-01-10
专利权的终止未缴年费专利权终止
专利权的终止未缴年费专利权终止
2005-06-29
授权
授权
2003-09-10
实质审查的生效
实质审查的生效
2003-06-25
公开
公开
技术领域:
本发明涉及人类基因,具体是Sorting Nexin(SNX)家族的人类新基因SNX21的cDNA全长克隆及它在人体心脏胚胎发育过程中和成年时期的详细表达。
背景技术:
受体蛋白的降解依赖于胞内定向运输,并受到多种蛋白质的调节,包括phox(PX)同源框蛋白。phox(PX)域大约包含100-120个氨基酸,在酵母研究中已经确定是NADPH酶的组成部分,并且具有Src homology3 (SH3)同源域的停泊位点,能够参与调节细胞膜内蛋白质的的分选与运输过程。包含PX域的基因广泛分布于从酵母到人类的各个物种,在酵母中的三个家族同源基因Vps10p,Vps5p和Vps17P,已经证明参与细胞内的蛋白质分选过程。这些蛋白质是一种细胞质复合体的一部分,这种复合体有助于细胞质到高尔基体的物质运输,在哺乳动物中酵母Vps蛋白的同源物SNX也是一个调节跨膜蛋白运输的家族。在人类的SNX家族中,已经发现的本家族成员无一例外均包含PX域。
包含PX同源域的基因在人类中目前发现了超过50个,其中SNX家族的成员已达29个,根据PX域在蛋白质中的位置不同,可以将所有成员分成几个类群,目前的研究主要集中在第一与第二类群。过去的研究证明,SNX家族的主要功能是蛋白质的分选,而目前这些被分选的蛋白质又主要是一些受体蛋白。SNX1在表皮生长因子受体和凝血酶(thrombin)因子的受体的分选中具有重要作用,而SNX2,4,6则分别被发现与酪氨酸激酶受体、凝血酶受体、血小板起源的生长因子以及胰岛素的受体在细胞内的运输有关,而另一个基因SNX9则被发现参与了一个大复合物的构成,该复合物与AP-2这个基因发挥功能有关。而SNX15的过多表达却反而可以抑制蛋白质从质膜到内涵体的正常运输。
发明内容:
本发明的目的在于提供一个人类SNX家族新基因SNX21,分析它在人体肝脏胚胎发育过程中和成年时期的表达,以探索其对肝细胞病变和肿瘤形成的关系,进而研制开发肝脏疾病的基因治疗药物。
在最新的研究中,我们分别鉴定了在人类前列腺中特异性表达和抑制肿瘤转移过程中特异性表达的G蛋白耦联的受体(Liu et al.,2000)。为了研究G蛋白耦联受体的降解和跨膜运输机制,我们用PX同源框的保守序列搜索NCBI数据库,得到一个新EST-AL521242。进一步的搜索找到了一些与EST-AL521242的3’端同源度为100%的EST。其中最长的一个EST-AL521241不属于任何已知基因,含有一个与EST-AL521242相同的250bp的片断。为了确定这两个EST是否属于同一个新基因,利用从胚胎肝脏中的反转录产物及分别位于AL521242和AL521241上一对引物(F1,R1,见后表)进行PCR。在96℃-1min,1个循环;58℃-1min,72℃-1min,30个循环的PCR反应条件下得到了一个420bp的产物。测序结果显示这一产物包括了这两个EST 250bp的重叠序列,所以可以确定这两个EST属于同一个基因。5’-和3’-端的RACE分别得到了一个590bp和834bp的片断。RACE得到的片断和计算机检索的结果拼接得到了新基因的1814bp的全长cDNA。这一序列已被提交到Genebank(Accession No.AF523834).新基因被命名为sorting nexin 21,并得到HUGO命名委员会的确认。
SNX21位于20q 12-13.1区,整个基因长度大约为8kb,有4个外显子和3个内含子。SNX21的cDNA全长为1814bp,包括一段96bp的5’端未翻译区域和一段621bp的3’端未翻译区域。开放阅读框为1092bp,编码的蛋白质为364个氨基酸,分子量约为40.3kDa。该蛋白质包括一个109个氨基酸的PX同源框和一个33个氨基酸的不完整tetratricopeptide repeat(TPR)区域。SNX21是一个亲水性蛋白。亲水性分析显示其PX同源框的N-部分基本上全部由亲水区构成,该同源框的C-端则是一个超螺旋结构域。
SNX1就包含一个位于N-部分的PX同源框和位于C-端3个超螺旋结构。据推测,这两个区域的作用与亚细胞结构定位及SNX家族成员之间的相互作用有关。其它一些SNX家族成员也含有超螺旋结构域,如SNX2和SNX4,及其它各种功能域,如SNX13/RGS-PX1中的RGS同源框,SNX9中的SH3同源框。
SNX21的PX同源框与保守的PX同源框区域的同源度为40%(见图1)。在已被研究过的SNX家族成员中,它与SNX15的结构较为相似。后者也有位于N-端的PX同源框和位于C-端的超螺旋结构域。除了PX同源框,SNX21和SNX15都有位于C-端的TPR同源框(Barr et al.,2000)。TPR同源框存在于大量蛋白质中,其功能很可能与蛋白质之间的相互作用有关。据推测,TPR蛋白质倾向于与WD-40蛋白或含有TPR同源框的蛋白质相互作用,形成多蛋白复合物。
SNX21的表达分析显示其转录产物在成年人的肝脏,胰脏和骨骼肌中有高水平的表达(见图2)。而在胚胎时期,SNX21仅仅在肝脏中有高水平的特异性表达(见图3)。该基因在成年人肝脏组织中表达水平的虽然下降,但表达的绝对量仍然不少,显示了SNX21在肝脏发育和再生过程中潜在的重要作用。
本发明的优点:
1.提供了一个人类新基因SNX21基因的全长cDNA序列,并描述了其编码的蛋白产物与重要结构域的同源性,证明了该基因是SNX家族的成员之一。
2.该基因编码的蛋白产物为亲水性蛋白,并且在人类成体组织大量限制在肝脏表达,有可能成为肝脏疾病治疗的基因工程产物。
3.该基因在胚胎发育期可检测到强表达水平,说明该基因作为转录因子在发育早期起着很重要的作用,可能参与胚胎肝脏的形成。
本发明通过以下附图和实施例作进一步阐述,但并不限制本发明的范围。
附图说明:
图1.SNX21的氨基酸与PX同源域、几个模式动物的同源基因比较。
图中黑色阴影表示氨基酸同源部分。图中的序列号为该同源蛋白在GeneBank内的Accession号码。PX(SNX21,人),NP_608709(果蝇),NP_082116(小鼠),和NM_037438(SNX15,人)
图2.SNX21在成人组织的Northern杂交
图中:1胰腺2肾3骨骼肌4肝5肺6胎盘7脑8心脏
图3.SNX21在人类胚胎组织的Northern杂交
3A-12周胚胎,3B-17周胚胎,3C-18周胚胎,3D-20周胚胎,
3E-23周胚胎,3F-25周胚胎
图中:1脾2胃3骨骼肌4肾5小脑6大脑7舌8肺9心脏10肾上腺11小肠12肝
具体实施方式:
一个人类SNX家族新基因SNX21的克隆、测序及其表达。
1:SNX21全长cDNA的克隆和测序 以检索获得的cDNA序列设计RACE引物、其它引物及反应条件(见下表):
Primer Sequence Programs Cycles
F1 5’-CGCCGTTACTCGGACTTT 96℃-1min 1
R1 5’-AGGGCCTTCTCACAGCAT 58℃-1min;72℃-Lnin 30
GSP 5’-GACTGCCCCACTGCCCA 50℃-30min;94℃-2min 1
F2 5’-GACGACGAGGACGAGGACGAC 94℃-1min 1
R2 5’-GCTCTGAGCTCTCC 56℃-1min;72℃-1min 30
F3 5’-TCGGGGATGGGACGTCA 94℃-1min 1
R3 5’-GGAAACTGCTCGGCCTCTG 58℃-1min;72℃-1min 30
F4 5’-CGCCCCTGAATGCACCGT 94℃-1min 1
R4 5’-CCTTAAATCTAGGCAAGGGTTCGTC 60℃-1min;72-2min 30
F1,R1用于检测EST AL521242和AL521241是否属于同一基因。
GSP用于肝mRNA的反转录
F2,R2,F3,R3用于反转录产物的多重PCR扩增。
F4,R4用于SNX21的开放阅读框的扩增。
本实验中取肝脏组织mRNA 5ug为模板。具体操作按该公司(takara)protocol进行。
将RACE产物克隆入T载体并测序获得SNX21的5`端和3`端序列,将RACE得到的片断和计算机检索的结果拼接得到了新基因的全长cDNA。2:Northern杂交(1).组织总RNA的提取(按王雁云,罗开梅等,一种快速的总RNA提取方法,生命科学研究,5(1):88-90(2001)进行)。(2).总RNA的电泳及转膜,均按《现代分子生物学实验技术》介绍的方法进行(卢圣栋主编,第二版)。(3).Northem杂交
将从CLONTECH公司买的成人组织mRNA膜和转有20ug人体胚胎多种组织以及总胚胎组织的总RNA的尼龙膜,放入培养皿中,加入经变性的68℃预热的快速杂交液(Clontech公司)10ml,68℃预杂交30分钟,加入经变性处理的同位素标记的SNX21的cDNA片段,68℃杂交过夜。用2XSSC,0.05%SDS,65℃洗两次,15分钟/次;0.1XSSC,0.1%SDS,65℃洗两次,15分钟/次。(4).-80℃曝光几天,洗X光片。(5).用0.1×SSC和0.5%SDS在95℃洗10分钟膜用β-actin cDNA重新标记,做Northem杂交进行阳性对照。
SNX21的cDNA核苷酸序列和编码氨基酸序列:gaacccggcc gacctccatg ggctgcgggg ggctgcaccc ggacccctgg ggcgcggcgc 60gcccctgaat gcaccgtggg acgcaggagg gtgcc 95atg gcc tcc cgg ctc ctg cac cgg ctg cgg cac gcc ttg gcc ggc 140Met Ala Ser Arg Leu Leu His Arg Leu Arg His Ala Leu Ala Gly1 5 10 15gac ggc ccc ggg gag gcg gcg gcc agt cca gag gcc gag cag ttt 185Asp Gly Pro Gly Glu Ala Ala Ala Ser Pro Glu Ala Glu Gln Phe
20 25 30ccg gag agc tca gag ctg gag gac gac gac gcc gag ggc ctg tcc 230Pro Glu Ser Ser Glu Leu Glu Asp Asp Asp Ala Glu Gly Leu Ser
35 40 45tcc cga ctc agc ggc acc ctc agc ttc acc agc gcc gag gac gac 275Ser Arg Leu Ser Gly Thr Leu Ser Phe Thr Ser Ala Glu Asp Asp
50 55 60gag gac gac gag gac gag gac gac gag gag gct ggc cct gac cag 320Glu Asp Asp Glu Asp Glu Asp Asp Glu Glu Ala Gly Pro Asp Gln
65 70 75ctg ccc ctc ggg gat ggg acg tca gga gaa gac gca gaa cgg agc 365Leu Pro Leu Gly Asp Gly Thr Ser Gly Glu Asp Ala Glu Arg Ser
80 85 90ccc cca cct gat ggg cag tgg ggc agt cag ctc ctg gcg cgg cag 410Pro Pro Pro Asp Gly Gln Trp Gly Ser Gln Leu Leu Ala Arg Gln
95 100 105ctg cag gat ttc tgg aag aag tcc cgg aac acc ttg gca ccc cag 455Leu Gln Asp Phe Trp Lys Lys Ser Arg Asn Thr Leu Ala Pro Gln
110 115 120cgg ctg ctc ttc gaa gtg acc agc gct aac gtt gtc aag gac ccg 500Arg Leu Leu Phe Glu Val Thr Ser Ala Asn Val Val Lys Asp Pro
125 130 135ccc tcc aag tac gtg ctc tac acc ctc gcc gtg atc ggc cca gga 545Pro Ser Lys Tyr Val Leu Tyr Thr Leu Ala Val Ile Gly Pro Gly
140 145 150ccg cca gat tgc cag cca gcc cag atc tct cgc cgt tac tcg gac 590Pro Pro Asp Cys Gln Pro Ala Gln Ile Ser Arg Arg Tyr Ser Asp
155 160 165ttt gag cgg ctg cac cga aac ctg cag cgg caa ttc cgg ggc cca 635Phe Glu Arg Leu His Arg Asn Leu Gln Arg Gln Phe Arg Gly Pro
170 175 180atg gct gcc atc tcc ttc ccc cgt aag cgg ctg cgc cgg aat ttt 680Met Ala Ala Ile Ser Phe Pro Arg Lys Arg Leu Arg Arg Asn Phe
185 190 195act gca gag acc att gcc cgc cgt agc cgg gcc ttt gag cag ttt 725Thr Ala Glu Thr Ile Ala Arg Arg Ser Arg Ala Phe Glu Gln Phe
200 205 210ttg ggt cac ctg cag gca gtg cct gag ctg cgc cat gcc ccg gac 770Leu Gly His Leu Gln Ala Val Pro Glu Leu Arg His Ala Pro Asp
215 220 225ctg cag gac ttc ttc gtg ctg ccg gag ctg cgg cgg gca cag agc 815Leu Gln Asp Phe Phe Val Leu Pro Glu Leu Arg Arg Ala Gln Ser
230 235 240ctc acc tgt act ggc ctc tat cgt gag gct ctg gca ctc tgg gcc 860Leu Thr Cys Thr Gly Leu Tyr Arg Glu Ala Leu Ala Leu Trp Ala
245 250 255aat gcc tgg cag ctg caa gcc cag ctg ggc acc ccc tct ggc cca 905Asn Ala Trp Gln Leu Gln Ala Gln Leu Gly Thr Pro Ser Gly Pro
260 265 270gac cgc ccc ctg ctg acc ctg gct ggg ctg gcc gtg tgc cac cag 950Asp Arg Pro Leu Leu Thr Leu Ala Gly Leu Ala Val Cys His Gln
275 280 285gag ctg gaa gac cct gga gag gcc cgg gca tgc tgt gag aag gcc 995Glu Leu Glu Asp Pro Gly Glu Ala Arg Ala Cys Cys Glu Lys Ala
290 295 300ctg cag ctg ctt ggg gac aag agc ctc cac cct ttg ctg gca ccc 1040Leu Gln Leu Leu Gly Asp Lys Ser Leu His Pro Leu Leu Ala Pro
305 310 315ttt ctg gag gcc cat gtc cgg ctc tcc tgg cgc ctg ggc ctg gac 1085Phe Leu Glu Ala His Val Arg Leu Ser Trp Arg Leu Gly Leu Asp
320 325 330aaa cgt caa tca gag gct cgg ctc caa gcc ctg cag gag gca ggc 1130Lys Arg Gln Ser Glu Ala Arg Leu Gln Ala Leu Gln Glu Ala Gly
335 340 345ctt acc ccc aca cca ccc ccc agt ctc aaa gaa ttg ctc atc aag 1175Leu Thr Pro Thr Pro Pro Pro Ser Leu Lys Glu Leu Leu Ile Lys
350 355 360gag gtg ctg gac taa cccttgccta 1200Glu Val Leu Asp Endgatttaaggc cactgtgagg agaggggttg ccccagaagg caggggaagg acctgatgag 1270aacagaatag ctgggaggct gcagagggtg ctgggagccc ctagaagttc caaaagagaa 1330tgtgaagcag atcaaggaaa cttctgttga gctaggctca gggtgagctt tggctggggt 1390tgcccttgtg tagtacaggg aagtctgaca cagcctctcc agcctataaa cagccggggg 1450gctgtggcac aggttggggc aatgttccct tgttggtggg cccccaagct ggcaaggcct 1510cttggctgaa ggccagggac tctgcccctg gagtcctgga gttaagggat gaaggcaagg 1570ctgcaggtct ggcccagggg aattaaaagc cagccactcc cagtggtatc agtctctcta 1630gttggatgtg agggccaaaa cgggactgta actcctgtct caggaatggg gatagatggg 1690aggttcttga agccccaggc gaagctggta cctctgctac agcttgctct ctggacctgg 1750cttcactcga tcacccctcc tggcacagtc acagctagac tccatcctac ccacagccct 1810gtagatcctg taga 1814SNX21的部分核苷酸序列:gaacccggcc gacctccatg ggctgcgggg ggctgcaccc ggacccctgg ggcgcggcgc 60gcccctgaat gcaccgtggg acgcaggagg gtgccatggc ctcccggctc ctgcaccggc 120tgcggcacgc cttggccggc gacggccccg gggaggcggc ggccagtcca gaggccgagc 180agtttccgga gagctcagag ctggaggacg acgacgccga gggcctgtcc tcccgactca 240gcggcaccct cagcttcacc agcgccgagg acgacgagga cgacgaggac gaggacgacg 300aggaggctgg ccctgaccag ctgcccctcg gggatgggac gtcaggagaagacgcagaac 360ggagcccccc acctgatggg cagtggggca gtcagctcct ggcgcggcag ctgcaggatt 420tctggaagaa gtcccggaac accttggcac cccagcggct gctcttcgaa gtgaccagcg 480ctaacgttgt caaggacccg ccctccaagt acgtgctcta caccctcgcc gtgatcggcc 540caggaccgcc agattgccag ccagcccaga tctctcgccg ttactcggac tttgagcggc 600tgcaccgaaa cctgcagcgg caattccggg gcccaatggc tgccatctcc ttcccccgta 660agcggctgcg ccggaatttt actgcagaga ccattgcccg ccgtagccgg gcctttgagc 720agtttttggg tcacctgcag gcagtgcctg agctgcgcca tgccccggac ctgcaggact 780tcttcgtgct gccggagctg cggcgggcac agagcctcac ctgtactggc ctctatcgtg 840aggctctggc actctgggcc aatgcctggc agctgcaagc ccagctgggc accccctctg 900gcccagaccg ccccctgctg accctggctg ggctggccgt gtgccaccag gagctggaag 960accctggaga ggcccgggca tgctgtgaga aggccctgca gctgcttggg gacaagagcc 1020tccacccttt gctggcaccc tttctggagg cccatgtccg gctctcctgg cgcctgggcc 1080tggacaaacg tcaatcagag gctcggctcc aagccctgca ggaggcaggc cttaccccca 1140caccaccccc cagtctcaaa gaattgctca tcaaggaggt gctggactaa cccttgccta 1200gatttaaggc cactgtgagg agaggggttg ccccagaagg caggggaagg acctgatgag 1260aacagaatag ctgggaggct gcagagggtg ctgggagccc ctagaagttc caaaagagaa 1320tgtgaagcag atcaaggaaa cttctgttga gctaggctca gggtgagctt tggctggggt 1380tgcccttgtg tagtacaggg aagtctgaca cagcctctcc agcctataaa cagccggggg 1440gctgtggcac aggttggggc aatgttccct tgttggtggg cccccaagct ggcaaggcct 1500cttggctgaa ggccagggac tctgcccctg gagtcctgga gttaagggat gaaggcaagg 1560ctgcaggtct ggcccagggg aattaaaagc cagccactcc cagtggtatc agtctctcta 1620gttggatgtg agggccaaaa cgggactgta actcctgtct caggaatggg gatagatggg 1680aggttcttga agccccaggc gaagctggta cctctgctac agcttgctct ctggacctgg 1740cttcactcga tcacccctcc tggcacagtc acagctagac tccatcctac ccacagccct 1800gtagatcctg taga 1814
机译: 新型G蛋白偶联受体家族成员,人类硫氧还蛋白家族成员,富含亮氨酸的重复家族成员和无名指家族成员
机译: SNX25或SNX27在溶酶体中LRRK2病理学的挽救
机译: SNX25或SNX27在溶酶体中LRRK2病理学的挽救