公开/公告号CN101892239A
专利类型发明专利
公开/公告日2010-11-24
原文格式PDF
申请/专利权人 中国农业科学院上海兽医研究所;
申请/专利号CN201010224645.5
申请日2010-07-15
分类号C12N15/12(20060101);C07K14/705(20060101);C07K16/28(20060101);C12N15/63(20060101);C12N1/15(20060101);C12N1/19(20060101);C12N1/21(20060101);C12N5/10(20060101);C12Q1/68(20060101);G01N33/53(20060101);A61K48/00(20060101);A61K38/17(20060101);A61P33/12(20060101);
代理机构31252 上海大邦律师事务所;
代理人周东萍
地址 200241 上海市闵行区闵行区紫月路518号
入库时间 2023-12-18 01:13:49
法律状态公告日
法律状态信息
法律状态
2014-01-15
著录事项变更 IPC(主分类):C12N15/12 变更前: 变更后: 申请日:20100715
著录事项变更
2013-04-10
专利权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20130322 申请日:20100715
专利申请权、专利权的转移
2012-05-23
授权
授权
2011-01-05
实质审查的生效 IPC(主分类):C12N15/12 申请日:20100715
实质审查的生效
2010-11-24
公开
公开
技术领域
本发明涉及生物工程技术领域,尤其涉及一种日本血吸虫Frizzled9基因、蛋白及用途。
背景技术
日本血吸虫病是一种分布广泛、危害严重的人畜共患寄生虫病。至今仍有76个国家、近2亿人口受到该病的威胁。近20年来,我国对日本血吸虫病的防治主要依赖于药物(吡喹酮)化疗为主的综合措施,但长期单一用药不能解决重复感染问题,也容易引发血吸虫的耐药性,因此新的治疗药物亟待开发。然而,要使新药研究取得突破性进展,充分了解血吸虫的生长发育过程及其相关的调控机制是重要基础。
日本血吸虫生活史复杂,在终末宿主体内虫体的生长发育过程都呈现显著的生物学和形态学变化,但是,以往研究者对血吸虫的研究主要集中于表观生物学及组织化学层面,对于虫体复杂的生长发育调控机理缺乏认识,因而在新药开发方面没有新的突破。生物体的生长发育由细胞间的信号网路系统调控,日本血吸虫也不例外。另外,全基因组测序分析发现,日本血吸虫存在Wnt、Notch等信号通路。因此对信号通路的研究有助于更好的理解血吸虫生长发育机制,也为新药的开发提供新思路。
其中,Wnt信号通路普遍存在于果蝇、小鼠、爪蟾等真核生物中,是调控胚胎发育以及成年生物体内环境平衡的重要信号途径。许多研究报道发现该通路的异常调控会导致胚胎发育发生表型突变,甚至肿瘤等疾病的产生。Wnt信号通路的激活,是由Wnt信号分子(一种分泌性糖蛋白),与细胞膜表面的Frizzled(Fz)家族受体结合触发下游信号的传递,且涉及许多不同的信号元件。
关于Wnt信号通路如何调控日本血吸虫生长发育的分子机制已经展开初步研究,目前已克隆到SjWnt4信号分子(陶丽红,姚利晓,傅志强等。日本血吸虫信号转导蛋白SjWnt4基因的克隆、表达及功能分析。生物工程学报2007年5月,23卷3期:392-397)和SjWnt10a信号分子(陶丽红,姚丽晓,苑纯秀等。日本血吸虫信号转导蛋白SjWntl0a基因的克隆及其在童虫和成虫中mRNA表达量的变化。中国兽医科学,2007,37(02):93-97)、SjFz5和SjFz7受体分子及其他成员组分,还有待于对它们进行具体的生物学功能分析。Wnt信号分子(配体)与Fz受体的相互作用是Wnt途径的启始步骤,阐明它们的相互作用机制,对了解血吸虫WNT途径的发育生物学功能具有重要意义。此外,由于一种Wnt可能和Fz受体家族不同成员作用,不同的Wnt也可能作用于同一种Fz受体,即受配体的结合主要取决于Fz受体及其所在的组织环境,因此有必要对日本血吸虫Fz家族成员的种类、表达特征、组织分布等进行研究。
发明内容
本发明要解决由于对日本血吸虫的生长发育调控机制缺乏认识而导致在新药研发方面难以取得突破的技术问题,提供一种日本血吸虫Frizzled9基因(简称SjFz9基因)和蛋白,该SjFz9基因是日本血吸虫Fz受体家族的新成员,参与调控血吸虫的生长发育及生殖系统发育,对开发控制血吸虫生长发育及生殖生理的新药具有较高的应用价值。
此外,还需要提供一种日本血吸虫Frizzled9基因和蛋白质的用途。
为了解决上述技术问题,本发明通过如下技术方案实现:
在本发明的一个方面,提供了一种日本血吸虫基因,所述基因具有编码Frizzled家族蛋白的核苷酸序列,该核苷酸序列包含下述DNA序列之一:
(1)编码SEQ ID NO.1氨基酸序列的DNA序列;
(2)编码SEQ ID NO.1所示氨基酸序列中缺失、添加、插入或取代一个或多个氨基酸所得到的具有SEQ ID NO.1相同活性的氨基酸序列的DNA序列。
优选的,所述基因具有SEQ ID NO.2所示的DNA序列。
在本发明的另一方面,提供了一种日本血吸虫蛋白质,所述蛋白质选自:
(1)具有SEQ ID NO.1氨基酸序列的蛋白质;
(2)具有SEQ ID NO.1中部分氨基酸序列的活性片段或保守性变异蛋白质;
(3)SEQ ID NO.1所示氨基酸序列中缺失、添加、插入或取代一个或多个氨基酸所得到的具有SEQ ID NO.1相同活性的氨基酸序列的蛋白质。
优选的,所述蛋白质具有SEQ ID NO.1所示氨基酸序列。
在本发明中,由于体内或纯化期间蛋白质本身的修饰等或由于编码蛋白基因的多态性及变异,天然存在的蛋白质会出现氨基酸的缺失、添加、插入、取代或其他变异。事实上,存在着一些生理和生物活性上基本等同于无变异蛋白质的蛋白。这些结构不同于相应的蛋白质但与该蛋白质没有明显的功能差异的多肽或蛋白称为功能等同变异体。
功能等同变异体同样适用于通过人工手段向一种蛋白质的氨基酸序列中导入这类变异而制成的多肽。尽管这样能获得更多不同形式的变异体,但所得的变异体作为功能等同变异体的前提是其生理活性基本等同于原始无变异蛋白质的活性。
例如,人白介素2(IL-2)的氨基酸序列中用丝氨酸替换特定的半胱氨酸残基所得到的多肽仍保留着IL-2的活性[Science,224,1431(1984)]。
此外,在用基因工程方法生产蛋白质时,常把所需蛋白质表达为融合蛋白质,例如,把源于其他蛋白质的N-末端肽链加到所需蛋白质的N-末端以提高所需蛋白质的表达,或者把一个合适的肽链加到所需蛋白的N-或C-末端,表达该蛋白并使用一种对所加肽链具有亲和力的载体使所需蛋白的纯化变得更加容易。
就决定基因上特定氨基酸的密码子(三联体碱基组合)而言,每种氨基酸存在1到6个密码子。因此尽管依赖于氨基酸序列,但仍有许多编码一种氨基酸的基因。在自然界中,基因并不稳定,常发生核酸变异。基因的变异可能不影响所编码的氨基酸序列(沉默变异),这种情况下,会产生编码相同氨基酸序列的不同基因。因此,即使分离出了编码特定氨基酸序列的基因,随着含有该基因生物体的传代,仍不可避免地会产生编码相同氨基酸序列的不同基因。
用各种基因工程技术人工产生编码相同氨基酸序列的各种基因并不困难。例如,当编码所需蛋白质的天然基因的密码子在用于以基因工程技术产生蛋白质的宿主中可利用性较低、表达的蛋白量不够时,可以人工将密码子转变成在该宿主中可利用性高的另一密码子而不改变所编码的氨基酸序列,即可增强所需蛋白质的表达。因此,这类人工生产的不同多核苷酸也包括在本发明的范围内,只要它能编码出本发明公开的氨基酸序列即可。
另外,由至少一种改变(如蛋白质的氨基酸序列中有一个或多个氨基酸残基的缺失、添加、插入或取代)所得的多肽或蛋白一般具有功能上等同于所述蛋白质的活性,编码这类多肽或蛋白的基因也包括在本发明的范围内,不管它是从天然来源分离还是人工生产的。
一般的,编码功能等同变异体的基因是同源的。因此,能与本发明的基因杂交且编码具有Frizzled9受体活性的蛋白质的核酸分子也包括在本发明的范围内。
在本发明的另一方面,还提供了一种包含上述日本血吸虫基因DNA序列的全部或部分序列的重组载体。
所述重组载体包括重组克隆载体或重组表达载体,重组表达载体包括重组原核表达载体、重组真核表达载体。
优选的,所述重组载体包含编码SEQ ID NO.1中55-244位氨基酸序列的DNA序列。
在本发明的另一方面,还提供了一种宿主细胞,包含上述重组载体,或已用上述基因序列转化或转染。
在本发明的另一方面,还提供了一种上述日本血吸虫基因的用途,用于制备预防或治疗血吸虫病的药物;或用于筛选预防或治疗血吸虫病的药物。
所述药物通过阻断血吸虫生长发育或阻断血吸虫生殖系统发育来发挥作用。
在本发明的另一方面,还提供了一种上述日本血吸虫蛋白质的用途,用于制备预防或治疗血吸虫病的药物;或用于筛选预防或治疗血吸虫病的药物。
所述药物通过阻断血吸虫生长发育或阻断血吸虫生殖系统发育来发挥作用。
本发明日本血吸虫Frizzled9基因,是日本血吸虫Fz受体家族的新成员。实时荧光定量PCR分析结果表明SjFz9基因可能介导了童虫阶段的发育及产卵初期、高峰期雌雄虫的发育调控;免疫组化实验结果显示SjFz9基因可能与日本血吸虫的运动相关,并且还参与调控血吸虫成虫生殖系统的发育,为开发阻断虫体发育的新药提供了新思路。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是本发明实施例1简并PCR反应产物的电泳检测图;
图2是本发明实施例1的SjFz9基因的3’和5’RACE产物电泳鉴定图;
图3是本发明实施例1利用生物信息学工具在线预测SjFz9蛋白的结构图;
图4是本发明实施例1不同物种的Frizzled 9分子亲缘关系和进化分析图;
图5是本发明实施例2的SjFz9基因在日本血吸虫不同发育阶段的mRNA表达水平差异分析图;
图6是本发明实施例3重组原核表达质粒pET28a-SjFz9的酶切鉴定图;
图7是本发明实施例3重组蛋白经纯化后的SDS-PAGE电泳图;
图8是本发明实施例3的pET28a-SjFz9重组表达蛋白的Western-blot鉴定图;
图9是本发明实施例3的SjFz9多抗的Western-blot检测图;
图10是本发明实施例3免疫组化分析SjFz9蛋白在日本血吸虫童虫、成虫体壁肌肉层细胞的定位图;
图11是本发明实施例3免疫组化分析SjFz9蛋白在日本血吸虫成虫生殖细胞的定位图。
具体实施方式
下列实施例中,未注明具体条件的实验方法,通常按常规条件,如《分子克隆实验指南》(J.萨姆布鲁克,D.W.拉塞尔著,黄培堂,汪嘉玺,朱厚础,等译.第3版,北京:科学出版社,2002)中所述的方法进行。
本发明利用简并引物PCR方法从日本血吸虫13d童虫cDNA中获得Frizzled家族新成员---Fz9同源的EST,然后通过RACE技术获得全长cDNA,再利用生物信息学软件分析该基因及其编码蛋白的结构。结果表明,该基因具有Fz家族受体的基本结构特征:含有一个信号肽,一段保守的半胱氨酸富集区(CRD,也是Wnt信号分子的区域),和一段七次跨膜疏水区。利用荧光实时定量PCR方法分析了SjFz9基因在日本血吸虫发育的不同时期的mRNA表达图式。成功制备了能够特异性识别天然虫体中SjFz9蛋白的多克隆抗体,并以该制备的多抗作为一抗,利用免疫组化方法对SjFz9蛋白进行组织定位研究分析,实验结果显示SjFz9可能与日本血吸虫的运动相关,并且还参与调控血吸虫成虫生殖系统的发育。表明该SjFz9基因编码蛋白可能对控制血吸虫生长发育及生殖生理的新药开发具有较高的应用价值。
实施例1SjFz9新基因的克隆
1.血吸虫虫体材料的收集及总RNA的提取
日本血吸虫(安徽株)尾蚴感染雄性新西兰杂交兔(3kg/只),腹部贴片,2,000~10,000条每只。在标准卫生条件下饲养,以肝门静脉灌注法收集感染兔体内不同期别的虫体,包括7d、13d、18d、23d、26d、29d、32d、35d、42d和50d虫体,并将26d,32d,35d,42d和50d虫体进行雌雄分开。将感染42d的兔肝组织剪碎、匀浆后,通过多重筛网过滤纯化方法收集兔肝组织中的虫卵。Trizol(invitrogen)抽提虫卵及各期别虫体总RNA(具体操作参照Trizol说明书进行),DNase I(Takara)除去残留DNA。1%非变性琼脂糖凝胶电泳检测RNA完整性,分光光度计(Eppendorf A G,Hambury)检测浓度,DEPC水溶解的RNA于-80℃冰箱保存。
2.日本血吸虫Fz9EST新基因的获得
参考文献(Daudet N,Ripoll C,Molès JP,et al.Expression of members of Wnt andFrizzled gene families in the postnatal rat cochlea.Mol Brain Res,2002,105:98-107;Wang Y,Macke JP,Abel la BS,et al.A large fami ly of putative transmembrane receptorshomologous to the product of the Drosophila tissue polarity gene frizzled.J BiolChem.1996,271:4468-4476),根据已获得的两个日本血吸虫Frizzled受体:SjFz5(Genbank登录号:EU370926)、SjFz7(Genbank登录号:EU370927),与其他物种的Fz家族成员比对结果,选取YPERP、WWVIL及VGIT氨基酸保守位点,根据氨基酸的简并性设计简并引物(见表1),引物由英俊生物技术公司合成。
表1钓取日本血吸虫Fz家族新基因的PCR反应简并引物
表1中,F:上游引物,R:下游引物;根据核苷酸标准命名法确定简并引物序列(N=A/C/G/T;R=A/G;M=A/C;Y=C/T;D=A/G/T)。
以保存的血吸虫13天童虫cDNA为模板进行touch-up PCR。PCR反应条件:94℃5min;(94℃1min,50℃1.5min,72℃2min)×5cycles;(94℃1min,53℃1.5min,72℃2min)×35cycles;72℃再延伸10min。Touch-up PCR开始以低于理论Tm值的温度退火,确保引物能与模板结合;然后逐渐升高退火温度,随着循环的增加特异性扩增产物得到积累,最终得到较特异的PCR产物。1.2%的琼脂糖凝胶电泳检测扩增产物,目的片段切胶回收后与pGEM-T Easy载体连接,转化大肠杆菌JM109感受态细胞,PCR鉴定为阳性的克隆由上海桑尼生物科技有限公司测序。
结果:以简并引物进行touch-up PCR(上升PCR)可见多个条带(见图1)。在图1中,1:以Fzp1/2为引物对进行PCR反应的产物;2:以Fzp1/3引物对进行PCR反应的产物。由设计引物的保守氨基酸序列间长度推测产物长度在200~400bp之间,选择图1中箭头所指约250bp大小的条带进行克隆。挑选150个阳性克隆测序,测序结果经blastx在线分析,发现其中一个克隆的序列与其它物种Fz家族成员相似,且不同于已获得的SjFz5和SjFz7基因,是血吸虫Fz家族的新成员。
3.日本血吸虫SjFz9新基因全长克隆及生物信息学分析
利用RACE(rapid amplication of cDNA ends,cDNA末端快速扩增技术)方法获得SjFz9基因全长序列。以获得的SjFz9EST序列为模板设计3’和5’RACE引物(见表2)。利用SMARTTMRACE cDNA Amplification kit(clontech)将13d童虫RNA反转录成3’race ready cDNA和5’race ready cDNA(参照试剂盒说明书完成)。1.0%琼脂糖凝胶电泳检测PCR产物,扩增片段切胶回收后与pMD18T载体(TaKaRa)连接,转化DH5α感受态细胞,阳性克隆测序结果用gene tool软件进行电子拼接。利用常规生物信息学软件对SjFz9基因及其编码蛋白结构进行预测分析。
表2SjFz9RACE PCR反应用引物
结果:
以该克隆序列为模板,利用引物3’GSP1/NGSP1和5’GSP1/NGSP1(表2)进行3’和5’RACE PCR(RACE PCR产物电泳鉴定图见图2)。图2中,1:3’RACE产物;2:5’RACE产物。其中箭头所指片段为切胶回收作克隆用。利用gene tool软件将两端延伸后的序列与模板序列进行拼接,拼接后的序列(2572bp)在NCBI网站的ORF Finder及blastp在线分析,预测的ORF编码的Fz蛋白结构不完整。在首次拼接序列基础上再设计3’GSP2/NGSP2和5’GSP2/NGSP2(表2),进行第二次RACE延伸。同样方法拼接得到的序列为3670bp,再次预测出的ORF编码蛋白具有Fz家族蛋白的完整结构,至此获得了血吸虫Frizzled家族新成员的全长cDNA序列。氨基酸序列相似性分析显示,该新获得Fz家族成员与其他物种的Fz9相似性最高,其中与斑马鱼、小鼠和人的同源性分别为33%、32%和31%,因此将该新获得的基因命名为日本血吸虫Frizzled9基因,简称SjFz9基因。
SjFz9基因的cDNA全长3670bp(SEQ ID NO.2),146~2917bp为编码区序列,编码923个氨基酸。理论相对分子量为103.97Ku,理论等电点8.65。
SjFz9基因的核苷酸和氨基酸序列如下,起始、终止密码子均用方框标出;曲线标出的序列为信号肽;连续10个半胱氨酸为保守的CRD结构,推测为Wnt结合位点;下划直线处为七个跨膜区段。
1 GGTCAAATAACAATTTAACATTATGAAAGATATATTTTCAAGTGTATATTTATGAATGTACTTACTTGTA
71 AAATGAAGTCATCTTAACAGAACTGAGCTGTTTAGTTGCTTTGTTGTGTTAATTTACATAAATTGTCACTCAGAG
146AAAATTGTAAGAATGAGTTTATTTAAAAAATTTAATTTGGTCAATTTCATAAATATTATAACAGTCATGTTA
1
221 ACTCAATGTCTCTCAGATACTACCTGTGCTGTCTATAAAATTCGAAGCTCAAATTTTCACTTTTATGATCAAATT
26T T C A V Y K I R S S N F H F Y D Q I
296 GATAAAGATGTTAATTTCAGTGGAAAGTATTTGCCTCGCTTACGAACACTAAGAGATGTTATACCTCTCATGTTT
51 D K D V N F S G K Y L P R L R T L R D V I P L M F
371 CCAATAAATTCAAAA GAAATTGAAGTACCCGATCATTTGAAAAATCTAATTGAAGTTAATCAAAATGGAAACCTA
76 P I N S K E I E V P D H L K N L I E V N Q N G N L
446 CCGAATCAAGTTTATCCAGATGAGAGTCCAGGTGAACAACAAGGAGAAATTGAAAATGGTATAGATGATGTAAAT
101P N Q V Y P D E S P G E Q Q G E I E N G I D D V N
521 CACTGTATTCCAATTCATGAACCAATTTGTCATGGTCTTCAATATACTCATACTTGGTTACCTAATTCAGTGGGT
126 H C I P I H E P I C H G L Q Y T H T W L P N S V G
596 CTAACGACACAAGAAGAGGCTGCAAAACGCATGAATGACTATCGTTCCCTCATCAATGTTGGTTGTTCACACTAT
151 L T T Q E E A A K R M N D Y R S L I N V G C S H Y
671 TTAAAATTTTTTCTG TGTACAGTTTATTTTCCAATGTGTACCCCAACACTGAATCCACCAGCTGCCTTACAGCCA
176 L K F F L C T V Y F P M C T P T L N P P A A L Q P
746 TGTCAAAATTTATGTCGTTATGTACAATCAAAGTGTGAACCAATTATGAAAAGTTTTAGCTTTCCATGGCCAATC
201 C Q N L C R Y V Q S K C E P I M K S F S F P W P I
821 GAACTTAATTGTAAAGCATTACCCTCAGATTCTGGAATGTGTATACAACCACAAAATTATGATTTAGATAAACAA
226 E L N C K A L P S D S G M C I Q P Q N Y D L D K Q
896 GGACAAATTATAAGCCCAGGGATCCCATCTGAAGCCCATGGAGCTATAGCTAATTTATTGCCAAATTTTAGTGAG
251 G Q I I S P G I P S E A H G A I A N L L P N F S E
971 TTTTTGGCCCAACAA AGTGCTCAAAACCAACTTTTGGCGAGTACACAGAACAATCAAACAGATAATACTAACGAG
276 F L A Q Q S A Q N Q L L A S T Q N N Q T D N T N E
1046 AAAATACTTTCAGTGAATGATAACCAATCCGGTTTGACAAGACATCATCTAATCCACAGGACAAAACTACAATCT
301 K I L S V N D N Q S G L T R H H L I H R T K L Q S
1121 TCAAAGTGCTATGTTGTCGAAATTCTTTTATATTCTGAACAGGCACATAATAATATTACATGCGCTCGTCGTTGT
326 S K C Y V V E I L L Y S E Q A H N N I T C A R R C
1196 AATGCTCATTTATTTTACAAACCAGTTGAAAAACGTTTCGCCAATATTTGGATGCTAGTTTGGTCCATAATATGT
351 N A H L F Y K P V E K R F A N I W M L V W S I I C
1271 TTGGGATCGTGTGCATTGACTATTATCACCTTTACCTTAAACCGCACACGTTTTGCTTATCCAGAACGACCGATT
376 L G S C A L T I I T F T L N R T R F A Y P E R P I
1346 ATTTACATATCAGTTTGTTGCTTCGTTTACTCTGCTGGATTTATTTTACACTCTCTGATTGGGCGTGATTTGGTG
401 I Y I S V C C F V Y S A G F I L H S L I G R D L V
1421 GCATGTAGGAACAAAGTTGAAACAATTTCGCCATCATTATTGACAAACGGGGTATCACAAGTTGGTACAAAGAAA
426 A C R N K V E T I S P S L L T N G V S Q V G T K K
1496 CTTTTTACAGGTTTAACTCAATTAAAAGTTAACGCTAGTTTCTTGATAACTTCAGGATATGAAGGTACATGGTGT
451 L F T G L T Q L K V N A S F L I T S G Y E G T W C
1571 ACTATTATATTTATT ATCCTGTTTTATTTCAGTCAAGCGAGTTATTTATGGTGGGTTATGTTAGCTACCTCATGG
476 T I I F I I L F Y F S Q A S Y L W W V M L A T S W
1646 TTTTTATCAGCTTCCTGTAAGTGGGGATGTGAAGGCATAGAGGCTGTCAGTAGTATCTTCCATATGCTCGCCTGG
501 F L S A S C K W G C E G I E A V S S I F H M L A W
1721 GCATTACCAGCATTAAAAACTATTATCATATTAATCATGCATCGTATTGACGCAGATGAGTTAACTGGATTATGC
526 A L P A L K T I I I L I M H R I D A D E L T G L C
1796 AACGTTGGTTATCAAAATTCAACGAGTTTACTCACATTGATATTACTACCACAAATCATCTACCTATTGTTGGGC
551 N V G Y Q N S T S L L T L I L L P Q I I Y L L L G
1871 ATCATGTTTTTATTG GTTGGTTTTCACTCCTTGATTTCCCTTCGATCAAACTTAAAACAACACGCTAAAAGCCTC
576 I M F L L V G F H S L I S L R S N L K Q H A K S L
1946 TTGCCTGCTACCAAAACAACAACAGCACCAGCAAACTGTTATAATTCTCAGTGCAAAAGAAATGCTTCAGCAACA
601 L P A T K T T T A P A N C Y N S Q C K R N A S A T
2021 GTAGCAATACCAACTATGACACTACAAACAATGACCACATCTAGTCCAGTCATCGCCCTCAACAATGGAAATATA
626 V A I P T M T L Q T M T T S S P V I A L N N G N I
2096 CGACGTTTAGATAAACTAATGATAAAAATAGGCATATTTTCAATGCTGTATATTATTCCATGTGCATGTGTTATT
651 R R L D K L M I K I G I F S M L Y I I P C A C V I
2171 GGTGTGAATATTTACAATTATATTAATTATCCGGAATGGATGAAAACATTGGATAGACTATCTAAACAAACAAAC
676 G V N I Y N Y I N Y P E W M K T L D R L S K Q T N
2246 TGTTTAACGGAATACGGTACAAGTTGGTCACTGGTCACTCAGTGTCTAGAAGATAATCACTTCCCATCAGCTGAA
701 C L T E Y G T S W S L V T Q C L E D N H F P S A E
2321 GCTAACATGTTACAAATATTCATGTCTCTAGTCGTCGGTATCACTTCAGGAATGTGGGTATGGTGTAATAGAAAA
726 A N M L Q I F M S L V V G I T S G M W V W C N R K
2396 TCTTCAGAAACATGGTTAAAATGCATAAAGAGGAGAAAGAAAAATTTATCTCAGCATAGTTTGAATTACCGTTAT
751 S S E T W L K C I K R R K K N L S Q H S L N Y R Y
2471 CATATTTGTGGGGATGTTGTCGCTGGTGATACTGTTGGAGAAACTAATAATGTGTCCCAAGTTGATCAAAAGGCA
776 H I C G D V V A G D T V G E T N N V S Q V D Q K A
2546 CAACTAATGAATACGACTTGTTGTAATTCAAGAGCGGCATGTGGAAAAAACAACCAGTATCCAGGAAACACCATG
801 Q L M N T T C C N S R A A C G K N N Q Y P G N T M
2621 AATTTCGATAATACAATGAACAATATTAACCAGCTGGTGGCTGATTCCACTCAGTATCATCAACAACAACACCAA
826 N F D N T M N N I N Q L V A D S T Q Y H Q Q Q H Q
2696 AATGAAATCGCACGAAACAACGTAAGAAATTTAATGCTTTCTGGATCATTTAACATGTCATCTGGAACAGCTTCA
851 N E I A R N N V R N L M L S G S F N M S S G T A S
2771 TGTACAAGTGCTCCACTATTATCACATGGTTTAGGAACAATAAATATGTCATTATTAAATTCATTTGAATCCAAT
876 C T S A P L L S H G L G T I N M S L L N S F E S N
2846 TATTGCACCCGTTCATCACAACGACAAACATTTAAAACTAGACCATCTAATACGGGAAGACCAGACTGTTTT
901 Y C T R S S Q R Q T F K T R P S N T G R P D C *
2921 GTTTGCTTCCTTGGTAAATAATGTAAATTTTTCTTGAATACACTTACCCATGATTACAAATTTATTTGTAACAGC
2996 TGATATTTACTCTACATTGCATAAGCCATTGCACAAACAAAACCTTGAGCGAAGATCAAATATGAAAAATAATCA
3071 TAAATCTTGTTCATCTCATTTTAATTTTGTATCAATTGATCGTTCATATTACATTCTGTAATCATTTTCTAAATG
3146 ATAGTTCTTTCGTTCTGCTTGTTTCATTCACGATTTATCAATTTGAACAAGTGATTACGCCTATCCGCACAGAAT
3221 GCTCATTTCTGTATATAAATTATTTTGTGACTTGTATTCCGGTTATCTTTTAACTTGAAAATAATTTCATTTATT
3296 CTTTATTTTTTAACTACAAATCAAGAAGCTATTGCTTGTCGCTTCACCTATTATGCTTTAATTTGATATTTTTTA
3371 CGATTAATTCAATTCAGACTTTGGTCAAACGTTTTCTTTAAACTTCACACTTTCAGAAAAAGAAAAACAAACCAT
3446 ACTAGAACAGTGGTACGGGTTAGTAATGAGGAATAAATGAACAATAAATAACTCAATTTGATCACAAAGCTCATT
3521 AATTCCATTTTCTTGAGTCACCTTGTATATGAGTAACTGTAGACTTGTATTTCCTTCAGTTTTCATTTGTTAATT
3596 TATTCACCTTTGCCAATAATTTAAAGACACTAATTATAGCCTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
利用生物信息学软件分析SjFz9蛋白结构,表明该蛋白具有Frizzled家族蛋白结构特征(见图3和SEQ ID NO.1):N-端1~31个氨基酸残基为信号肽;126~244个氨基酸残基段为半胱氨酸富集区(cystein rich domain,CRD),含有10个保守的半胱氨酸;364~748氨基酸区段为七个跨膜的α螺旋疏水区;C-端尾部位于胞内,含有磷酸化位点。
选择来自人(human,NP_003499.1)、类人猿(Pan troglodytes,XP_527779.2)、小鼠(Musculus,NP_034376.1)、斑马鱼(Danio,NP_571586.1)、爪蟾(Xenopus,AAD44332.1)、斑马(Taeniopygia,XP_002187952.1)等几个物种的Fz9蛋白以及曼氏血吸虫Frizzled受体(CAZ36662)进行氨基酸序列的多重比对。结果显示,SjFz9蛋白与曼氏血吸虫Frizzled受体相似性最高,达79%,其次与爪蟾Fz9的相似性为33%。另外,参与比对序列中除类人猿在CRD区缺少多个半胱氨酸,可能该序列在5’端不完整,其余物种的序列在CRD区内均含有10个保守的半胱氨酸,且跨膜区序列相当保守。从图4所示的Fz9的进化树上看,SjFz9与曼氏血吸虫Frizzled受体的亲缘关系最接近,其次,与爪蟾Fz9在进化关系上比较接近。
实施例2荧光定量PCR方法分析SjFz9基因的mRNA表达图式
1.实验方法
根据real time PCR引物设计原则,设计SjFz9基因引物:F(上游引物),5’TATCACTTCAGGAATGTGGGTATGG 3’(SEQ ID NO.15);R(下游引物),5’TTAGTTTCTCCAACAGTATCACCAG 3’(SEQ ID NO.16)。选择18s rRNA作内参,引物为:F,5’TTAGTTGGTGGAGCGATTTGTCTGG 3’(SEQ ID NO.17);R,5’CTGTTATTGCTCAATTTCGTGCGAC 3’(SEQ ID NO.18)。按照PrimeScriptTMRT reagent Kit(Takara)说明书,将虫卵及各期别虫体总RNA反转录成cDNA,SYBR Green I(SYBR Premix Ex Taq,Takara)作染料,在Rotor gene-3000A(corbett)仪器上进行Real time PCR。ΔΔGT法计算出各期别虫体中的目的基因相对于内参基因的初始模板量。
2.结果
以18s rRNA为内参,通过qPCR方法对SjFz9在血吸虫不同发育阶段的转录水平差异情况进行分析,重复3次实验,分析结果如图5。7、13、18d的虫体较小,无法进行雌雄分开,因此图5A显示的是在雌雄虫混合样品中对SjFz9mRNA表达水平的检测结果,可以看出在血吸虫童虫(7、13、18d)阶段,SjFz9转录水平较高。23d及其后的成虫虫体样品雌雄分开,图5B分析结果显示,23d雌雄虫中mRNA均有较高表达。但23d后的成虫体内mRNA表达水平变化较大:SjFz9mRNA在26、32、35、50d雌虫虫体中的表达水平较低,而在29d、42d又分别呈现很高的转录水平;SjFz9mRNA在26、29、32、35d雄虫虫体的表达量较低,而在42d、50d虫体又呈现很高表达水平(在42d虫体的表达量几乎是35d的6倍,P<0.05)。
实施例3SjFz9蛋白的组织定位分析
1.SjFz9蛋白在原核系统的表达、纯化与鉴定
选取SjFz9蛋白CRD结构功能域作为免疫组化定位的目标抗原,设计引物如下:F,5’GTGGATCCACAGTCATGTTAACTCAATGTCTCT 3’(SEQ ID NO.19);R,5’GTCTCGAGTTCACACTTTGATTGTACATAACGA 3’(SEQ ID NO.20),上下游引物中分别引入BamHI和Xho I限制性内切酶位点(引物序列中划线处标出)。以13d童虫cDNA为模板进行PCR扩增。将纯化的目的片段(567bp)克隆至pMD18T载体,转化大肠杆菌DH5α感受态细胞。提取阳性克隆的质粒,经BamH I和Xho I双酶切,切胶回收,连接到经同样双酶切的pET28a载体中,构建成重组原核表达质粒pET28a-SjFz9,将该pET28a-SjFz9重组质粒转化入DH5α感受态细胞后,阳性克隆进行测序和双酶切鉴定。图6所示为重组原核表达质粒pET28a-SjFz9的酶切鉴定图,在图6中,“1”代表重组表达质粒pET28a-SjFz9的BamH I和Xho I双酶切产物。经鉴定正确的重组表达质粒转化表达用工程菌BL21(DE3)感受态细胞。
分别挑取重组质粒转化表达菌的克隆及空载体转化克隆于试管LB培养基,37℃过夜培养。次日,以1∶100转接新鲜LB培养基,待菌液OD600为0.8~1.0时加入IPTG进行诱导表达,IPTG的终浓度为0.8mmol/L。8h后收集菌体诱导物,用1×PBS溶解,冰浴超声后,离心分离上清,用8M尿素溶解沉淀蛋白,分别取样进行12%SDS-PAGE凝胶电泳。参照Ni亲和柱使用说明书进行蛋白纯化。纯化的蛋白再利用SDS-PAGE凝胶电泳进行检测,结果如图7所示。与His标签融合的重组蛋白理论分子量为30.7kD,图7中所示纯化的重组蛋白大小与理论预测一致。
用Western-blot方法鉴定原核表达的重组蛋白(参照分子克隆操作指南进行)。用含0.05%吐温-20的TBS稀释一抗、二抗,以1∶100比例稀释血吸虫虫卵抗原免疫兔血清作一抗(本实验室制备),以1∶2000比例稀释HRP标记的羊抗兔IgG作二抗。(沉淀型)TMB(天根生物)为底物进行显色。Western-Blot结果如图8所示,表明pET28a-SjFz9原核表达的蛋白能被血吸虫虫卵蛋白免疫血清识别,具有良好的抗原性。
2.SjFz9多抗的制备及其特异性鉴定
取500ul纯化的重组蛋白(1mg/ml)与等体积完全弗氏佐剂混合乳化进行首免,背部脊柱两侧两点皮下注射免疫6只雄性Balb/c小鼠,免疫剂量为50μg/只;以后每隔两周进行加强免疫,将纯化蛋白与不完全弗氏佐剂混合,免疫剂量为75μg/只。在第4次加强免疫后一周进行摘眼球采血,分离血清。-70℃冰箱冻存备用。PBS与佐剂混合物免疫小鼠作对照。
通过Western-blot方法鉴定用重组蛋白制备的抗血清。用蛋白抽提试剂盒(Pierce,美国)抽提血吸虫18天虫体蛋白,在蛋白抽提过程中加入蛋白酶抑制剂PMSF和EDTA。抽提的虫体蛋白经SDS-PAGE凝胶电泳后电转移到硝酸纤维(NC)膜上(转印方法同上)。以1∶500比例稀释制备的多抗作一抗;以1∶2000的比例稀释IRDyeTM800标记的羊抗小鼠IgG(Rockland)作二抗,避光条件下孵育,通过Odyssey红外荧光扫描成像系统分析结果。
结果显示该抗血清识别的单一蛋白条带约104kD(见图9),与理论预测的SjFz9蛋白大小一致,说明制备的多抗血清能够特异性地识别天然虫体中的SjFz9蛋白,而检测PBS免疫血清的对照结果为阴性,表明该多抗可用于SjFz9蛋白的免疫组化定位分析。在图9中,a为阳性血清检测,b为PBS免疫血清检测对照。
3.SjFz9蛋白的虫体定位分析
选择性收集13d、18d童虫及23d、32d、42d雌、雄虫新鲜虫体,制备石蜡切片。通过小鼠S-P免疫组化检测试剂盒对SjFz9进行组织定位分析。
具体步骤如下:
经二甲苯脱蜡,2×15min。由高到低的梯度浓度酒精进行水化:100%→95%→90%→85%→75%→50%,每个梯度放置5min,然后放入蒸馏水中20~30min,还可在水中放置过夜。3%过氧化氢中放置20min,去除内源性过氧化物酶。PBS洗涤3次,3min/次。滴加经37℃预热的(0.25%)胰酶于切片上约3min进行抗原修复。PBS洗涤3次,3min/次。以正常山羊血清(工作浓度)封闭滴于切片上,湿盒内37℃孵育1h。甩掉封闭血清,滴加正常的小鼠血清及SjFz9的小鼠多抗血清的稀释液(1∶200)各50~80μL,37℃孵育1h。PBS洗涤4次,5min/次。滴加生物素化山羊抗鼠IgG。50~80μL,37℃孵育30min。PBS洗涤同上。加HRP标记的链霉卵白素工作液50~80μL,37℃孵育20~30min,PBS洗涤4次,加DAB(DAKO)显色液,同时光镜下观察显色情况。一旦着色即用蒸馏水洗涤。苏木素复染2min,自来水冲洗10min。脱水,透明,封片,镜检。
结果:
如图10所示,图10为免疫组化分析SjFz9蛋白在日本血吸虫童虫、成虫体壁肌肉层细胞的定位图,其中,A,B,C,D,E分别为13d、18d、23d、32d、42d虫体定位结果,F为阴性对照,箭头所指为阳性染色;at代表吸盘,ap代表前部,sm代表体壁肌细胞,p代表实质细胞,gc代表抱雌沟。图10所示的童虫虫体定位显示,SjFz9蛋白在虫体的分布比较广,主要在虫体的前部、口腹吸盘、体壁肌细胞层(见图10A,B),在实质细胞中也有少量表达,以正常阴性血清检测的对照没有任何染色(图10F)。而在成虫中的定位显示,SjFz9蛋白在23d、32d和42d虫体的吸盘、体壁肌肉层细胞上仍然有大量分布(图10C,D,E)。另外,更有意思的是,SjFz9蛋白在雌虫的卵细胞、卵黄腺细胞和雄虫的精子细胞内或细胞膜上都有大量表达(见图11A,B,C),相应期别的虫体对照组没有表达信号(图11D,E,F)。图11是免疫组化分析SjFz9蛋白在日本血吸虫成虫生殖细胞的定位图,是以SjFz9蛋白的多抗血清孵育虫体切片,以正常小鼠血清做阴性对照,以DAB为显色剂作的免疫组化实验结果图。图11中,A,D为雄虫的睾丸定位;B,E为雌虫的卵巢定位;C,F为雌虫的卵黄腺定位;A-C显示阳性结果,D-F为阴性对照;箭头所指为SjFz9蛋白的阳性染色;O代表卵巢;t代表睾丸;v代表卵黄腺细胞;ic代表肠腔。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110>中国农业科学院上海兽医研究所
<120>日本血吸虫Frizzled9基因、蛋白及用途
<160>20
<170>PatentIn version 3.3
<210>1
<211>923
<212>PRT
<213>Schistosoma japonicum
<220>
<221>SIGNAL
<222>(1)..(31)
<223>信号肽
<220>
<221>DOMAIN
<222>(126)..(244)
<223>半胱氨酸富集区
<220>
<221>TRANSMEM
<222>(264)..(748)
<223>跨膜区
<400>1
Met Lys Ile Val Arg Met Ser Leu Phe Lys Lys Phe Asn Leu Val Asn
1 5 10 15
Phe Ile Asn Ile Ile Thr Val Met Leu Thr Gln Cys Leu Ser Asp Thr
20 25 30
Thr Cys Ala Val Tyr Lys Ile Arg Ser Ser Asn Phe His Phe Tyr Asp
35 40 45
Gln Ile Asp Lys Asp Val Asn Phe Ser Gly Lys Tyr Leu Pro Arg Leu
50 55 60
Arg Thr Leu Arg Asp Val Ile Pro Leu Met Phe Pro Ile Asn Ser Lys
65 70 75 80
Glu Ile Glu Val Pro Asp His Leu Lys Asn Leu Ile Glu Val Asn Gln
85 90 95
Asn Gly Asn Leu Pro Asn Gln Val Tyr Pro Asp Glu Ser Pro Gly Glu
100 105 110
Gln Gln Gly Glu Ile Glu Asn Gly Ile Asp Asp Val Asn His Cys Ile
115 120 125
Pro Ile His Glu Pro Ile Cys His Gly Leu Gln Tyr Thr His Thr Trp
130 135 140
Leu Pro Asn Ser Val Gly Leu Thr Thr Gln Glu Glu Ala Ala Lys Arg
145 150 155 160
Met Asp Asp Tyr Arg Ser Leu Ile Asn Val Gly Cys Ser His Tyr Leu
165 170 175
Lys Phe Phe Leu Cys Thr Val Tyr Phe Pro Met Cys Thr Pro Thr Leu
180 185 190
Asn Pro Pro Ala Ala Leu Gln Pro Cys Gln Asn Leu Cys Arg Tyr Val
195 200 205
Gln Ser Lys Cys Glu Pro Ile Met Lys Ser Phe Ser Phe Pro Trp Pro
210 215 220
Ile Glu Leu Asn Cys Lys Ala Leu Pro Ser Asp Ser Gly Met Cys Ile
225 230 235 240
Gln Pro Gln Asn Tyr Asp Leu Asp Lys Gln Gly Gln Ile Ile Ser Pro
245 250 255
Gly Ile Pro Ser Glu Ala His Gly Ala Ile Ala Asn Leu Leu Pro Asn
260 265 270
Phe Ser Glu Phe Leu Ala Gln Gln Ser Ala Gln Asn Gln Leu Leu Ala
275 280 285
Ser Thr Gln Asn Asn Gln Thr Asp Asn Thr Asn Glu Lys Ile Leu Ser
290 295 300
Val Asn Asp Asn Gln Ser Gly Leu Thr Arg His His Leu Ile His Arg
305 310 315 320
Thr Lys Leu Gln Ser Ser Lys Cys Tyr Val Val Glu Ile Leu Leu Tyr
325 330 335
Ser Glu Gln Ala His Asn Asn Ile Thr Cys Ala Arg Arg Cys Asn Ala
340 345 350
His Leu Phe Tyr Lys Pro Val Glu Lys Arg Phe Ala Asn Ile Trp Met
355 360 365
Leu Val Trp Ser Ile Ile Cys Leu Gly Ser Cys Ala Leu Thr Ile Ile
370 375 380
Thr Phe Thr Leu Asn Arg Thr Arg Phe Ala Tyr Pro Glu Arg Pro Ile
385 390 395 400
Ile Tyr Ile Ser Val Cys Cys Phe Val Tyr Ser Ala Gly Phe Ile Leu
405 410 415
His Ser Leu Ile Gly Arg Asp Leu Val Ala Cys Arg Asn Lys Val Glu
420 425 430
Thr Ile Ser Pro Ser Leu Leu Thr Asn Gly Val Ser Gln Val Gly Thr
435 440 445
Lys Lys Leu Phe Thr Gly Leu Thr Gln Leu Lys Val Asn Ala Ser Phe
450 455 460
Leu Ile Thr Ser Gly Tyr Glu Gly Thr Trp Cys Thr Ile Ile Phe Ile
465 470 475 480
Ile Leu Phe Tyr Phe Ser Gln Ala Ser Tyr Leu Trp Trp Val Met Leu
485 490 495
Ala Thr Ser Trp Phe Leu Ser Ala Ser Cys Lys Trp Gly Cys Glu Gly
500 505 510
Ile Glu Ala Val Ser Ser Ile Phe His Met Leu Ala Trp Ala Leu Pro
515 520 525
Ala Leu Lys Thr Ile Ile Ile Leu Ile Met His Arg Ile Asp Ala Asp
530 535 540
Glu Leu Thr Gly Leu Cys Asn Val Gly Tyr Gln Asn Ser Thr Ser Leu
545 550 555 560
Leu Thr Leu Ile Leu Leu Pro Gln Ile Ile Tyr Leu Leu Leu Gly Ile
565 570 575
Met Phe Leu Leu Val Gly Phe His Ser Leu Ile Ser Leu Arg Ser Asn
580 585 590
Leu Lys Gln His Ala Lys Ser Leu Leu Pro Ala Thr Lys Thr Thr Thr
595 600 605
Ala Pro Ala Asn Cys Tyr Asn Ser Gln Cys Lys Arg Asn Ala Ser Ala
610 615 620
Thr Val Ala Ile Pro Thr Met Thr Leu Gln Thr Met Thr Thr Ser Ser
625 630 635 640
Pro Val Ile Ala Leu Asn Asn Gly Asn Ile Arg Arg Leu Asp Lys Leu
645 650 655
Met Ile Lys Ile Gly Ile Phe Ser Met Leu Tyr Ile Ile Pro Cys Ala
660 665 670
Cys Val Ile Gly Val Asn Ile Tyr Asn Tyr Ile Asn Tyr Pro Glu Trp
675 680 685
Met Lys Thr Leu Asp Arg Leu Ser Lys Gln Thr Asn Cys Leu Thr Glu
690 695 700
Tyr Gly Thr Ser Trp Ser Leu Val Thr Gln Cys Leu Glu Asp Asn His
705 710 715 720
Phe Pro Ser Ala Glu Ala Asn Met Leu Gln Ile Phe Met Ser Leu Val
725 730 735
Val Gly Ile Thr Ser Gly Met Trp Val Trp Cys Asn Arg Lys Ser Ser
740 745 750
Glu Thr Trp Leu Lys Cys Ile Lys Arg Arg Lys Lys Asn Leu Ser Gln
755 760 765
His Ser Leu Asn Tyr Arg Tyr His Ile Cys Gly Asp Val Val Ala Gly
770 775 780
Asp Thr Val Gly Glu Thr Asn Asn Val Ser Gln Val Asp Gln Lys Ala
785 790 795 800
Gln Leu Met Asn Thr Thr Cys Cys Asn Ser Arg Ala Ala Cys Gly Lys
805 810 815
Asn Asn Gln Tyr Pro Gly Asn Thr Met Asn Phe Asp Asn Thr Met Asn
820 825 830
Asn Ile Asn Gln Leu Val Ala Asp Ser Thr Gln Tyr His Gln Gln Gln
835 840 845
His Gln Asn Glu Ile Ala Arg Asn Asn Val Arg Asn Leu Met Leu Ser
850 855 860
Gly Ser Phe Asn Met Ser Ser Gly Thr Ala Ser Cys Thr Ser Ala Pro
865 870 875 880
Leu Leu Ser His Gly Leu Gly Thr Ile Asn Met Ser Leu Leu Asn Ser
885 890 895
Phe Glu Ser Asn Tyr Cys Thr Arg Ser Ser Gln Arg Gln Thr Phe Lys
900 905 910
Thr Arg Pro Ser Asn Thr Gly Arg Pro Asp Cys
915 920
<210>2
<211>3670
<212>DNA
<213>Schistosoma japonicum
<220>
<221>CDS
<222>(146)..(2917)
<400>2
ggtcaaataa caatttaaca ttatgaaaga tatattttca agtgtatatt tatgaatgta 60
cttacttgta aaatgaagtc atcttaacag aactgagctg tttagttgct ttgttgtgtt 120
aatttacata aattgtcact cagag atg aaa att gta aga atg agt tta ttt 172
Met Lys Ile Val Arg Met Ser Leu Phe
1 5
aaa aaa ttt aat ttg gtc aat ttc ata aat att ata aca gtc atg tta 220
Lys Lys Phe Asn Leu Val Asn Phe Ile Asn Ile Ile Thr Val Met Leu
10 15 20 25
act caa tgt ctc tca gat act acc tgt gct gtc tat aaa att cga agc 268
Thr Gln Cys Leu Ser Asp Thr Thr Cys Ala Val Tyr Lys Ile Arg Ser
30 35 40
tca aat ttt cac ttt tat gat caa att gat aaa gat gtt aat ttc agt 316
Ser Asn Phe His Phe Tyr Asp Gln Ile Asp Lys Asp Val Asn Phe Ser
45 50 55
gga aag tat ttg cct cgc tta cga aca cta aga gat gtt ata cct ctc 364
Gly Lys Tyr Leu Pro Arg Leu Arg Thr Leu Arg Asp Val Ile Pro Leu
60 65 70
atg ttt cca ata aat tca aaa gaa att gaa gta ccc gat cat ttg aaa 412
Met Phe Pro Ile Asn Ser Lys Glu Ile Glu Val Pro Asp His Leu Lys
75 80 85
aat cta att gaa gtt aat caa aat gga aac cta ccg aat caa gtt tat 460
Asn Leu Ile Glu Val Asn Gln Asn Gly Asn Leu Pro Asn Gln Val Tyr
90 95 100 105
cca gat gag agt cca ggt gaa caa caa gga gaa att gaa aat ggt ata 508
Pro Asp Glu Ser Pro Gly Glu Gln Gln Gly Glu Ile Glu Asn Gly Ile
110 115 120
gat gat gta aat cac tgt att cca att cat gaa cca att tgt cat ggt 556
Asp Asp Val Asn His Cys Ile Pro Ile His Glu Pro Ile Cys His Gly
125 130 135
ctt caa tat act cat act tgg tta cct aat tca gtg ggt cta acg aca 604
Leu Gln Tyr Thr His Thr Trp Leu Pro Asn Ser Val Gly Leu Thr Thr
140 145 150
caa gaa gag gct gca aaa cgc atg aat gac tat cgt tcc ctc atc aat 652
Gln Glu Glu Ala Ala Lys Arg Met Asn Asp Tyr Arg Ser Leu Ile Asn
155 160 165
gtt ggt tgt tca cac tat tta aaa ttt ttt ctg tgt aca gtt tat ttt 700
Val Gly Cys Ser His Tyr Leu Lys Phe Phe Leu Cys Thr Val Tyr Phe
170 175 180 185
cca atg tgt acc cca aca ctg aat cca cca gct gcc tta cag cca tgt 748
Pro Met Cys Thr Pro Thr Leu Asn Pro Pro Ala Ala Leu Gln Pro Cys
190 195 200
caa aat tta tgt cgt tat gta caa tca aag tgt gaa cca att atg aaa 796
Gln Asn Leu Cys Arg Tyr Val Gln Ser Lys Cys Glu Pro Ile Met Lys
205 210 215
agt ttt agc ttt cca tgg cca atc gaa ctt aat tgt aaa gca tta ccc 844
Ser Phe Ser Phe Pro Trp Pro Ile Glu Leu Asn Cys Lys Ala Leu Pro
220 225 230
tca gat tct gga atg tgt ata caa cca caa aat tat gat tta gat aaa 892
Ser Asp Ser Gly Met Cys Ile Gln Pro Gln Asn Tyr Asp Leu Asp Lys
235 240 245
caa gga caa att ata agc cca ggg atc cca tct gaa gcc cat gga gct 940
Gln Gly Gln Ile Ile Ser Pro Gly Ile Pro Ser Glu Ala His Gly Ala
250 255 260 265
ata gct aat tta ttg cca aat ttt agt gag ttt ttg gcc caa caa agt 988
Ile Ala Asn Leu Leu Pro Asn Phe Ser Glu Phe Leu Ala Gln Gln Ser
270 275 280
gct caa aac caa ctt ttg gcg agt aca cag aac aat caa aca gat aat 1036
Ala Gln Asn Gln Leu Leu Ala Ser Thr Gln Asn Asn Gln Thr Asp Asn
285 290 295
act aac gag aaa ata ctt tca gtg aat gat aac caa tcc ggt ttg aca 1084
Thr Asn Glu Lys Ile Leu Ser Val Asn Asp Asn Gln Ser Gly Leu Thr
300 305 310
aga cat cat cta atc cac agg aca aaa cta caa tct tca aag tgc tat 1132
Arg His His Leu Ile His Arg Thr Lys Leu Gln Ser Ser Lys Cys Tyr
315 320 325
gtt gtc gaa att ctt tta tat tct gaa cag gca cat aat aat att aca 1180
Val Val Glu Ile Leu Leu Tyr Ser Glu Gln Ala His Asn Asn Ile Thr
330 335 340 345
tgc gct cgt cgt tgt aat gct cat tta ttt tac aaa cca gtt gaa aaa 1228
Cys Ala Arg Arg Cys Asn Ala His Leu Phe Tyr Lys Pro Val Glu Lys
350 355 360
cgt ttc gcc aat att tgg atg cta gtt tgg tcc ata ata tgt ttg gga 1276
Arg Phe Ala Asn Ile Trp Met Leu Val Trp Ser Ile Ile Cys Leu Gly
365 370 375
tcg tgt gca ttg act att atc acc ttt acc tta aac cgc aca cgt ttt 1324
Ser Cys Ala Leu Thr Ile Ile Thr Phe Thr Leu Asn Arg Thr Arg Phe
380 385 390
gct tat cca gaa cga ccg att att tac ata tca gtt tgt tgc ttc gtt 1372
Ala Tyr Pro Glu Arg Pro Ile Ile Tyr Ile Ser Val Cys Cys Phe Val
395 400 405
tac tct gct gga ttt att tta cac tct ctg att ggg cgt gat ttg gtg 1420
Tyr Ser Ala Gly Phe Ile Leu His Ser Leu Ile Gly Arg Asp Leu Val
410 415 420 425
gca tgt agg aac aaa gtt gaa aca att tcg cca tca tta ttg aca aac 1468
Ala Cys Arg Asn Lys Val Glu Thr Ile Ser Pro Ser Leu Leu Thr Asn
430 435 440
ggg gta tca caa gtt ggt aca aag aaa ctt ttt aca ggt tta act caa 1516
Gly Val Ser Gln Val Gly Thr Lys Lys Leu Phe Thr Gly Leu Thr Gln
445 450 455
tta aaa gtt aac gct agt ttc ttg ata act tca gga tat gaa ggt aca 1564
Leu Lys Val Asn Ala Ser Phe Leu Ile Thr Ser Gly Tyr Glu Gly Thr
460 465 470
tgg tgt act att ata ttt att atc ctg ttt tat ttc agt caa gcg agt 1612
Trp Cys Thr Ile Ile Phe Ile Ile Leu Phe Tyr Phe Ser Gln Ala Ser
475 480 485
tat tta tgg tgg gtt atg tta gct acc tca tgg ttt tta tca gct tcc 1660
Tyr Leu Trp Trp Val Met Leu Ala Thr Ser Trp Phe Leu Ser Ala Ser
490 495 500 505
tgt aag tgg gga tgt gaa ggc ata gag gct gtc agt agt atc ttc cat 1708
Cys Lys Trp Gly Cys Glu Gly Ile Glu Ala Val Ser Ser Ile Phe His
510 515 520
atg ctc gcc tgg gca tta cca gca tta aaa act att atc ata tta atc 1756
Met Leu Ala Trp Ala Leu Pro Ala Leu Lys Thr Ile Ile Ile Leu Ile
525 530 535
atg cat cgt att gac gca gat gag tta act gga tta tgc aac gtt ggt 1804
Met His Arg Ile Asp Ala Asp Glu Leu Thr Gly Leu Cys Asn Val Gly
540 545 550
tat caa aat tca acg agt tta ctc aca ttg ata tta cta cca caa atc 1852
Tyr Gln Asn Ser Thr Ser Leu Leu Thr Leu Ile Leu Leu Pro Gln Ile
555 560 565
atc tac cta ttg ttg ggc atc atg ttt tta ttg gtt ggt ttt cac tcc 1900
Ile Tyr Leu Leu Leu Gly Ile Met Phe Leu Leu Val Gly Phe His Ser
570 575 580 585
ttg att tcc ctt cga tca aac tta aaa caa cac gct aaa agc ctc ttg 1948
Leu Ile Ser Leu Arg Ser Asn Leu Lys Gln His Ala Lys Ser Leu Leu
590 595 600
cct gct acc aaa aca aca aca gca cca gca aac tgt tat aat tct cag 1996
Pro Ala Thr Lys Thr Thr Thr Ala Pro Ala Asn Cys Tyr Asn Ser Gln
605 610 615
tgc aaa aga aat gct tca gca aca gta gca ata cca act atg aca cta 2044
Cys Lys Arg Asn Ala Ser Ala Thr Val Ala Ile Pro Thr Met Thr Leu
620 625 630
caa aca atg acc aca tct agt cca gtc atc gcc ctc aac aat gga aat 2092
Gln Thr Met Thr Thr Ser Ser Pro Val Ile Ala Leu Asn Asn Gly Asn
635 640 645
ata cga cgt tta gat aaa cta atg ata aaa ata ggc ata ttt tca atg 2140
Ile Arg Arg Leu Asp Lys Leu Met Ile Lys Ile Gly Ile Phe Ser Met
650 655 660 665
ctg tat att att cca tgt gca tgt gtt att ggt gtg aat att tac aat 2188
Leu Tyr Ile Ile Pro Cys Ala Cys Val Ile Gly Val Asn Ile Tyr Asn
670 675 680
tat att aat tat ccg gaa tgg atg aaa aca ttg gat aga cta tct aaa 2236
Tyr Ile Asn Tyr Pro Glu Trp Met Lys Thr Leu Asp Arg Leu Ser Lys
685 690 695
caa aca aac tgt tta acg gaa tac ggt aca agt tgg tca ctg gtc act 2284
Gln Thr Asn Cys Leu Thr Glu Tyr Gly Thr Ser Trp Ser Leu Val Thr
700 705 710
cag tgt cta gaa gat aat cac ttc cca tca gct gaa gct aac atg tta 2332
Gln Cys Leu Glu Asp Asn His Phe Pro Ser Ala Glu Ala Asn Met Leu
715 720 725
caa ata ttc atg tct cta gtc gtc ggt atc act tca gga atg tgg gta 2380
Gln Ile Phe Met Ser Leu Val Val Gly Ile Thr Ser Gly Met Trp Val
730 735 740 745
tgg tgt aat aga aaa tct tca gaa aca tgg tta aaa tgc ata aag agg 2428
Trp Cys Asn Arg Lys Ser Ser Glu Thr Trp Leu Lys Cys Ile Lys Arg
750 755 760
aga aag aaa aat tta tct cag cat agt ttg aat tac cgt tat cat att 2476
Arg Lys Lys Asn Leu Ser Gln His Ser Leu Asn Tyr Arg Tyr His Ile
765 770 775
tgt ggg gat gtt gtc gct ggt gat act gtt gga gaa act aat aat gtg 2524
Cys Gly Asp Val Val Ala Gly Asp Thr Val Gly Glu Thr Asn Asn Val
780 785 790
tcc caa gtt gat caa aag gca caa cta atg aat acg act tgt tgt aat 2572
Ser Gln Val Asp Gln Lys Ala Gln Leu Met Asn Thr Thr Cys Cys Asn
795 800 805
tca aga gcg gca tgt gga aaa aac aac cag tat cca gga aac acc atg 2620
Ser Arg Ala Ala Cys Gly Lys Asn Asn Gln Tyr Pro Gly Asn Thr Met
810 815 820 825
aat ttc gat aat aca atg aac aat att aac cag ctg gtg gct gat tcc 2668
Asn Phe Asp Asn Thr Met Asn Asn Ile Asn Gln Leu Val Ala Asp Ser
830 835 840
act cag tat cat caa caa caa cac caa aat gaa atc gca cga aac aac 2716
Thr Gln Tyr His Gln Gln Gln His Gln Asn Glu Ile Ala Arg Asn Asn
845 850 855
gta aga aat tta atg ctt tct gga tca ttt aac atg tca tct gga aca 2764
Val Arg Asn Leu Met Leu Ser Gly Ser Phe Asn Met Ser Ser Gly Thr
860 865 870
gct tca tgt aca agt gct cca cta tta tca cat ggt tta gga aca ata 2812
Ala Ser Cys Thr Ser Ala Pro Leu Leu Ser His Gly Leu Gly Thr Ile
875 880 885
aat atg tca tta tta aat tca ttt gaa tcc aat tat tgc acc cgt tca 2860
Asn Met Ser Leu Leu Asn Ser Phe Glu Ser Asn Tyr Cys Thr Arg Ser
890 895 900 905
tca caa cga caa aca ttt aaa act aga cca tct aat acg gga aga cca 2908
Ser Gln Arg Gln Thr Phe Lys Thr Arg Pro Ser Asn Thr Gly Arg Pro
910 915 920
gac tgt taa tttgtttgct tccttggtaa ataatgtaaa tttttcttga 2957
Asp Cys
atacacttac ccatgattac aaatttattt gtaacagctg atatttactc tacattgcat 3017
aagccattgc acaaacaaaa ccttgagcga agatcaaata tgaaaaataa tcataaatct 3077
tgttcatctc attttaattt tgtatcaatt gatcgttcat attacattct gtaatcattt 3137
tctaaatgat agttctttcg ttctgcttgt ttcattcacg atttatcaat ttgaacaagt 3197
gattacgcct atccgcacag aatgctcatt tctgtatata aattattttg tgacttgtat 3257
tccggttatc ttttaacttg aaaataattt catttattct ttatttttta actacaaatc 3317
aagaagctat tgcttgtcgc ttcacctatt atgctttaat ttgatatttt ttacgattaa 3377
ttcaattcag actttggtca aacgttttct ttaaacttca cactttcaga aaaagaaaaa 3437
caaaccatac tagaacagtg gtacgggtta gtaatgagga ataaatgaac aataaataac 3497
tcaatttgat cacaaagctc attaattcca ttttcttgag tcaccttgta tatgagtaac 3557
tgtagacttg tatttccttc agttttcatt tgttaattta ttcacctttg ccaataattt 3617
aaagacacta attatagcct tgaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 3670
<210>3
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(26)
<223>引物
<220>
<221>misc_feature
<222>(1)..(26)
<223>N=A/C/G/T;R=A/G;M=A/C;Y=C/T
<400>3
nnngaattct ayccngarmg nccnat 26
<210>4
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(24)
<223>引物
<220>
<221>misc_feature
<222>(1)..(24)
<223>N=A/C/G/T;R=A/G;Y=C/T
<400>4
nnnaagcttn arnaynaccc acca 24
<210>5
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(26)
<223>引物
<220>
<221>misc_feature
<222>(1)..(26)
<223>N=A/C/G/T;R=A/G;M=A/C;Y=C/T
<400>5
nnngaattct ayccngarmg nccnat 26
<210>6
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物
<220>
<221>misc_feature
<222>(1)..(21)
<223>N=A/C/G/T;D=A/G/T
<400>6
nnnaagcttn gtdtanccnt c 21
<210>7
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>7
ctatccggag cgacccatta tttac 25
<210>8
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>8
acactctctg attgggcgtg atttg 25
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>9
tgacccacca taaataactc gcttg 25
<210>10
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>10
caccatgtac cttcatatcc tgaag 25
<210>11
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>11
taacggaata cggtacaagt tggtc 25
<210>12
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>12
tatcacttca ggaatgtggg tatgg 25
<210>13
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>13
taagttcgat tggccatgga aagct 25
<210>14
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>14
accaacattg atgagggaac gatag 25
<210>15
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>15
tatcacttca ggaatgtggg tatgg 25
<210>16
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>16
ttagtttctc caacagtatc accag 25
<210>17
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>17
ttagttggtg gagcgatttg tctgg 25
<210>18
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(25)
<223>引物
<400>18
ctgttattgc tcaatttcgt gcgac 25
<210>19
<211>33
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(33)
<223>引物
<220>
<221>misc_signal
<222>(3)..(8)
<223>BamH I酶切位点
<400>19
gtggatccac agtcatgtta actcaatgtc tct 33
<210>20
<211>33
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>(1)..(33)
<223>引物
<220>
<221>misc_signal
<222>(3)..(8)
<223>Xho I酶切位点
<400>20
gtctcgagtt cacactttga ttgtacataa cga 33
机译: 对于人类的同源基因,对于负责Mehrfachresistenz的染色体7p15-21 kodierendes基因上的p糖蛋白及其用途
机译: 巴贝氏虫(Babesia caballi)的裂殖子编码蛋白的基因,利用该基因获得的重组蛋白及其用途
机译: 新型癌基因,衍生自癌基因的重组蛋白及其用途