首页> 中国专利> 日本血吸虫Frizzled9基因、蛋白及用途

日本血吸虫Frizzled9基因、蛋白及用途

摘要

本发明公开了一种日本血吸虫基因,所述基因具有编码Frizzled(Fz)家族蛋白的核苷酸序列,该核苷酸序列包含:编码SEQ ID NO.1氨基酸序列的DNA序列,或编码SEQ ID NO.1所示氨基酸序列中缺失、添加、插入或取代一个或多个氨基酸所得到的具有SEQ ID NO.1相同活性的氨基酸序列的DNA序列。本发明还公开了上述基因编码的蛋白质。本发明的日本血吸虫基因和蛋白,是日本血吸虫Fz受体家族的新成员,参与调控血吸虫的生长发育及生殖系统发育,对开发阻断血吸虫生长发育及生殖系统发育的新药具有很高的应用价值。

著录项

  • 公开/公告号CN101892239A

    专利类型发明专利

  • 公开/公告日2010-11-24

    原文格式PDF

  • 申请/专利权人 中国农业科学院上海兽医研究所;

    申请/专利号CN201010224645.5

  • 申请日2010-07-15

  • 分类号C12N15/12(20060101);C07K14/705(20060101);C07K16/28(20060101);C12N15/63(20060101);C12N1/15(20060101);C12N1/19(20060101);C12N1/21(20060101);C12N5/10(20060101);C12Q1/68(20060101);G01N33/53(20060101);A61K48/00(20060101);A61K38/17(20060101);A61P33/12(20060101);

  • 代理机构31252 上海大邦律师事务所;

  • 代理人周东萍

  • 地址 200241 上海市闵行区闵行区紫月路518号

  • 入库时间 2023-12-18 01:13:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-01-15

    著录事项变更 IPC(主分类):C12N15/12 变更前: 变更后: 申请日:20100715

    著录事项变更

  • 2013-04-10

    专利权的转移 IPC(主分类):C12N15/12 变更前: 变更后: 登记生效日:20130322 申请日:20100715

    专利申请权、专利权的转移

  • 2012-05-23

    授权

    授权

  • 2011-01-05

    实质审查的生效 IPC(主分类):C12N15/12 申请日:20100715

    实质审查的生效

  • 2010-11-24

    公开

    公开

说明书

技术领域

本发明涉及生物工程技术领域,尤其涉及一种日本血吸虫Frizzled9基因、蛋白及用途。

背景技术

日本血吸虫病是一种分布广泛、危害严重的人畜共患寄生虫病。至今仍有76个国家、近2亿人口受到该病的威胁。近20年来,我国对日本血吸虫病的防治主要依赖于药物(吡喹酮)化疗为主的综合措施,但长期单一用药不能解决重复感染问题,也容易引发血吸虫的耐药性,因此新的治疗药物亟待开发。然而,要使新药研究取得突破性进展,充分了解血吸虫的生长发育过程及其相关的调控机制是重要基础。

日本血吸虫生活史复杂,在终末宿主体内虫体的生长发育过程都呈现显著的生物学和形态学变化,但是,以往研究者对血吸虫的研究主要集中于表观生物学及组织化学层面,对于虫体复杂的生长发育调控机理缺乏认识,因而在新药开发方面没有新的突破。生物体的生长发育由细胞间的信号网路系统调控,日本血吸虫也不例外。另外,全基因组测序分析发现,日本血吸虫存在Wnt、Notch等信号通路。因此对信号通路的研究有助于更好的理解血吸虫生长发育机制,也为新药的开发提供新思路。

其中,Wnt信号通路普遍存在于果蝇、小鼠、爪蟾等真核生物中,是调控胚胎发育以及成年生物体内环境平衡的重要信号途径。许多研究报道发现该通路的异常调控会导致胚胎发育发生表型突变,甚至肿瘤等疾病的产生。Wnt信号通路的激活,是由Wnt信号分子(一种分泌性糖蛋白),与细胞膜表面的Frizzled(Fz)家族受体结合触发下游信号的传递,且涉及许多不同的信号元件。

关于Wnt信号通路如何调控日本血吸虫生长发育的分子机制已经展开初步研究,目前已克隆到SjWnt4信号分子(陶丽红,姚利晓,傅志强等。日本血吸虫信号转导蛋白SjWnt4基因的克隆、表达及功能分析。生物工程学报2007年5月,23卷3期:392-397)和SjWnt10a信号分子(陶丽红,姚丽晓,苑纯秀等。日本血吸虫信号转导蛋白SjWntl0a基因的克隆及其在童虫和成虫中mRNA表达量的变化。中国兽医科学,2007,37(02):93-97)、SjFz5和SjFz7受体分子及其他成员组分,还有待于对它们进行具体的生物学功能分析。Wnt信号分子(配体)与Fz受体的相互作用是Wnt途径的启始步骤,阐明它们的相互作用机制,对了解血吸虫WNT途径的发育生物学功能具有重要意义。此外,由于一种Wnt可能和Fz受体家族不同成员作用,不同的Wnt也可能作用于同一种Fz受体,即受配体的结合主要取决于Fz受体及其所在的组织环境,因此有必要对日本血吸虫Fz家族成员的种类、表达特征、组织分布等进行研究。

发明内容

本发明要解决由于对日本血吸虫的生长发育调控机制缺乏认识而导致在新药研发方面难以取得突破的技术问题,提供一种日本血吸虫Frizzled9基因(简称SjFz9基因)和蛋白,该SjFz9基因是日本血吸虫Fz受体家族的新成员,参与调控血吸虫的生长发育及生殖系统发育,对开发控制血吸虫生长发育及生殖生理的新药具有较高的应用价值。

此外,还需要提供一种日本血吸虫Frizzled9基因和蛋白质的用途。

为了解决上述技术问题,本发明通过如下技术方案实现:

在本发明的一个方面,提供了一种日本血吸虫基因,所述基因具有编码Frizzled家族蛋白的核苷酸序列,该核苷酸序列包含下述DNA序列之一:

(1)编码SEQ ID NO.1氨基酸序列的DNA序列;

(2)编码SEQ ID NO.1所示氨基酸序列中缺失、添加、插入或取代一个或多个氨基酸所得到的具有SEQ ID NO.1相同活性的氨基酸序列的DNA序列。

优选的,所述基因具有SEQ ID NO.2所示的DNA序列。

在本发明的另一方面,提供了一种日本血吸虫蛋白质,所述蛋白质选自:

(1)具有SEQ ID NO.1氨基酸序列的蛋白质;

(2)具有SEQ ID NO.1中部分氨基酸序列的活性片段或保守性变异蛋白质;

(3)SEQ ID NO.1所示氨基酸序列中缺失、添加、插入或取代一个或多个氨基酸所得到的具有SEQ ID NO.1相同活性的氨基酸序列的蛋白质。

优选的,所述蛋白质具有SEQ ID NO.1所示氨基酸序列。

在本发明中,由于体内或纯化期间蛋白质本身的修饰等或由于编码蛋白基因的多态性及变异,天然存在的蛋白质会出现氨基酸的缺失、添加、插入、取代或其他变异。事实上,存在着一些生理和生物活性上基本等同于无变异蛋白质的蛋白。这些结构不同于相应的蛋白质但与该蛋白质没有明显的功能差异的多肽或蛋白称为功能等同变异体。

功能等同变异体同样适用于通过人工手段向一种蛋白质的氨基酸序列中导入这类变异而制成的多肽。尽管这样能获得更多不同形式的变异体,但所得的变异体作为功能等同变异体的前提是其生理活性基本等同于原始无变异蛋白质的活性。

例如,人白介素2(IL-2)的氨基酸序列中用丝氨酸替换特定的半胱氨酸残基所得到的多肽仍保留着IL-2的活性[Science,224,1431(1984)]。

此外,在用基因工程方法生产蛋白质时,常把所需蛋白质表达为融合蛋白质,例如,把源于其他蛋白质的N-末端肽链加到所需蛋白质的N-末端以提高所需蛋白质的表达,或者把一个合适的肽链加到所需蛋白的N-或C-末端,表达该蛋白并使用一种对所加肽链具有亲和力的载体使所需蛋白的纯化变得更加容易。

就决定基因上特定氨基酸的密码子(三联体碱基组合)而言,每种氨基酸存在1到6个密码子。因此尽管依赖于氨基酸序列,但仍有许多编码一种氨基酸的基因。在自然界中,基因并不稳定,常发生核酸变异。基因的变异可能不影响所编码的氨基酸序列(沉默变异),这种情况下,会产生编码相同氨基酸序列的不同基因。因此,即使分离出了编码特定氨基酸序列的基因,随着含有该基因生物体的传代,仍不可避免地会产生编码相同氨基酸序列的不同基因。

用各种基因工程技术人工产生编码相同氨基酸序列的各种基因并不困难。例如,当编码所需蛋白质的天然基因的密码子在用于以基因工程技术产生蛋白质的宿主中可利用性较低、表达的蛋白量不够时,可以人工将密码子转变成在该宿主中可利用性高的另一密码子而不改变所编码的氨基酸序列,即可增强所需蛋白质的表达。因此,这类人工生产的不同多核苷酸也包括在本发明的范围内,只要它能编码出本发明公开的氨基酸序列即可。

另外,由至少一种改变(如蛋白质的氨基酸序列中有一个或多个氨基酸残基的缺失、添加、插入或取代)所得的多肽或蛋白一般具有功能上等同于所述蛋白质的活性,编码这类多肽或蛋白的基因也包括在本发明的范围内,不管它是从天然来源分离还是人工生产的。

一般的,编码功能等同变异体的基因是同源的。因此,能与本发明的基因杂交且编码具有Frizzled9受体活性的蛋白质的核酸分子也包括在本发明的范围内。

在本发明的另一方面,还提供了一种包含上述日本血吸虫基因DNA序列的全部或部分序列的重组载体。

所述重组载体包括重组克隆载体或重组表达载体,重组表达载体包括重组原核表达载体、重组真核表达载体。

优选的,所述重组载体包含编码SEQ ID NO.1中55-244位氨基酸序列的DNA序列。

在本发明的另一方面,还提供了一种宿主细胞,包含上述重组载体,或已用上述基因序列转化或转染。

在本发明的另一方面,还提供了一种上述日本血吸虫基因的用途,用于制备预防或治疗血吸虫病的药物;或用于筛选预防或治疗血吸虫病的药物。

所述药物通过阻断血吸虫生长发育或阻断血吸虫生殖系统发育来发挥作用。

在本发明的另一方面,还提供了一种上述日本血吸虫蛋白质的用途,用于制备预防或治疗血吸虫病的药物;或用于筛选预防或治疗血吸虫病的药物。

所述药物通过阻断血吸虫生长发育或阻断血吸虫生殖系统发育来发挥作用。

本发明日本血吸虫Frizzled9基因,是日本血吸虫Fz受体家族的新成员。实时荧光定量PCR分析结果表明SjFz9基因可能介导了童虫阶段的发育及产卵初期、高峰期雌雄虫的发育调控;免疫组化实验结果显示SjFz9基因可能与日本血吸虫的运动相关,并且还参与调控血吸虫成虫生殖系统的发育,为开发阻断虫体发育的新药提供了新思路。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明实施例1简并PCR反应产物的电泳检测图;

图2是本发明实施例1的SjFz9基因的3’和5’RACE产物电泳鉴定图;

图3是本发明实施例1利用生物信息学工具在线预测SjFz9蛋白的结构图;

图4是本发明实施例1不同物种的Frizzled 9分子亲缘关系和进化分析图;

图5是本发明实施例2的SjFz9基因在日本血吸虫不同发育阶段的mRNA表达水平差异分析图;

图6是本发明实施例3重组原核表达质粒pET28a-SjFz9的酶切鉴定图;

图7是本发明实施例3重组蛋白经纯化后的SDS-PAGE电泳图;

图8是本发明实施例3的pET28a-SjFz9重组表达蛋白的Western-blot鉴定图;

图9是本发明实施例3的SjFz9多抗的Western-blot检测图;

图10是本发明实施例3免疫组化分析SjFz9蛋白在日本血吸虫童虫、成虫体壁肌肉层细胞的定位图;

图11是本发明实施例3免疫组化分析SjFz9蛋白在日本血吸虫成虫生殖细胞的定位图。

具体实施方式

下列实施例中,未注明具体条件的实验方法,通常按常规条件,如《分子克隆实验指南》(J.萨姆布鲁克,D.W.拉塞尔著,黄培堂,汪嘉玺,朱厚础,等译.第3版,北京:科学出版社,2002)中所述的方法进行。

本发明利用简并引物PCR方法从日本血吸虫13d童虫cDNA中获得Frizzled家族新成员---Fz9同源的EST,然后通过RACE技术获得全长cDNA,再利用生物信息学软件分析该基因及其编码蛋白的结构。结果表明,该基因具有Fz家族受体的基本结构特征:含有一个信号肽,一段保守的半胱氨酸富集区(CRD,也是Wnt信号分子的区域),和一段七次跨膜疏水区。利用荧光实时定量PCR方法分析了SjFz9基因在日本血吸虫发育的不同时期的mRNA表达图式。成功制备了能够特异性识别天然虫体中SjFz9蛋白的多克隆抗体,并以该制备的多抗作为一抗,利用免疫组化方法对SjFz9蛋白进行组织定位研究分析,实验结果显示SjFz9可能与日本血吸虫的运动相关,并且还参与调控血吸虫成虫生殖系统的发育。表明该SjFz9基因编码蛋白可能对控制血吸虫生长发育及生殖生理的新药开发具有较高的应用价值。

实施例1SjFz9新基因的克隆

1.血吸虫虫体材料的收集及总RNA的提取

日本血吸虫(安徽株)尾蚴感染雄性新西兰杂交兔(3kg/只),腹部贴片,2,000~10,000条每只。在标准卫生条件下饲养,以肝门静脉灌注法收集感染兔体内不同期别的虫体,包括7d、13d、18d、23d、26d、29d、32d、35d、42d和50d虫体,并将26d,32d,35d,42d和50d虫体进行雌雄分开。将感染42d的兔肝组织剪碎、匀浆后,通过多重筛网过滤纯化方法收集兔肝组织中的虫卵。Trizol(invitrogen)抽提虫卵及各期别虫体总RNA(具体操作参照Trizol说明书进行),DNase I(Takara)除去残留DNA。1%非变性琼脂糖凝胶电泳检测RNA完整性,分光光度计(Eppendorf A G,Hambury)检测浓度,DEPC水溶解的RNA于-80℃冰箱保存。

2.日本血吸虫Fz9EST新基因的获得

参考文献(Daudet N,Ripoll C,Molès JP,et al.Expression of members of Wnt andFrizzled gene families in the postnatal rat cochlea.Mol Brain Res,2002,105:98-107;Wang Y,Macke JP,Abel la BS,et al.A large fami ly of putative transmembrane receptorshomologous to the product of the Drosophila tissue polarity gene frizzled.J BiolChem.1996,271:4468-4476),根据已获得的两个日本血吸虫Frizzled受体:SjFz5(Genbank登录号:EU370926)、SjFz7(Genbank登录号:EU370927),与其他物种的Fz家族成员比对结果,选取YPERP、WWVIL及VGIT氨基酸保守位点,根据氨基酸的简并性设计简并引物(见表1),引物由英俊生物技术公司合成。

表1钓取日本血吸虫Fz家族新基因的PCR反应简并引物

表1中,F:上游引物,R:下游引物;根据核苷酸标准命名法确定简并引物序列(N=A/C/G/T;R=A/G;M=A/C;Y=C/T;D=A/G/T)。

以保存的血吸虫13天童虫cDNA为模板进行touch-up PCR。PCR反应条件:94℃5min;(94℃1min,50℃1.5min,72℃2min)×5cycles;(94℃1min,53℃1.5min,72℃2min)×35cycles;72℃再延伸10min。Touch-up PCR开始以低于理论Tm值的温度退火,确保引物能与模板结合;然后逐渐升高退火温度,随着循环的增加特异性扩增产物得到积累,最终得到较特异的PCR产物。1.2%的琼脂糖凝胶电泳检测扩增产物,目的片段切胶回收后与pGEM-T Easy载体连接,转化大肠杆菌JM109感受态细胞,PCR鉴定为阳性的克隆由上海桑尼生物科技有限公司测序。

结果:以简并引物进行touch-up PCR(上升PCR)可见多个条带(见图1)。在图1中,1:以Fzp1/2为引物对进行PCR反应的产物;2:以Fzp1/3引物对进行PCR反应的产物。由设计引物的保守氨基酸序列间长度推测产物长度在200~400bp之间,选择图1中箭头所指约250bp大小的条带进行克隆。挑选150个阳性克隆测序,测序结果经blastx在线分析,发现其中一个克隆的序列与其它物种Fz家族成员相似,且不同于已获得的SjFz5和SjFz7基因,是血吸虫Fz家族的新成员。

3.日本血吸虫SjFz9新基因全长克隆及生物信息学分析

利用RACE(rapid amplication of cDNA ends,cDNA末端快速扩增技术)方法获得SjFz9基因全长序列。以获得的SjFz9EST序列为模板设计3’和5’RACE引物(见表2)。利用SMARTTMRACE cDNA Amplification kit(clontech)将13d童虫RNA反转录成3’race ready cDNA和5’race ready cDNA(参照试剂盒说明书完成)。1.0%琼脂糖凝胶电泳检测PCR产物,扩增片段切胶回收后与pMD18T载体(TaKaRa)连接,转化DH5α感受态细胞,阳性克隆测序结果用gene tool软件进行电子拼接。利用常规生物信息学软件对SjFz9基因及其编码蛋白结构进行预测分析。

表2SjFz9RACE PCR反应用引物

结果:

以该克隆序列为模板,利用引物3’GSP1/NGSP1和5’GSP1/NGSP1(表2)进行3’和5’RACE PCR(RACE PCR产物电泳鉴定图见图2)。图2中,1:3’RACE产物;2:5’RACE产物。其中箭头所指片段为切胶回收作克隆用。利用gene tool软件将两端延伸后的序列与模板序列进行拼接,拼接后的序列(2572bp)在NCBI网站的ORF Finder及blastp在线分析,预测的ORF编码的Fz蛋白结构不完整。在首次拼接序列基础上再设计3’GSP2/NGSP2和5’GSP2/NGSP2(表2),进行第二次RACE延伸。同样方法拼接得到的序列为3670bp,再次预测出的ORF编码蛋白具有Fz家族蛋白的完整结构,至此获得了血吸虫Frizzled家族新成员的全长cDNA序列。氨基酸序列相似性分析显示,该新获得Fz家族成员与其他物种的Fz9相似性最高,其中与斑马鱼、小鼠和人的同源性分别为33%、32%和31%,因此将该新获得的基因命名为日本血吸虫Frizzled9基因,简称SjFz9基因。

SjFz9基因的cDNA全长3670bp(SEQ ID NO.2),146~2917bp为编码区序列,编码923个氨基酸。理论相对分子量为103.97Ku,理论等电点8.65。

SjFz9基因的核苷酸和氨基酸序列如下,起始、终止密码子均用方框标出;曲线标出的序列为信号肽;连续10个半胱氨酸为保守的CRD结构,推测为Wnt结合位点;下划直线处为七个跨膜区段。

1           GGTCAAATAACAATTTAACATTATGAAAGATATATTTTCAAGTGTATATTTATGAATGTACTTACTTGTA

71     AAATGAAGTCATCTTAACAGAACTGAGCTGTTTAGTTGCTTTGTTGTGTTAATTTACATAAATTGTCACTCAGAG

146AAAATTGTAAGAATGAGTTTATTTAAAAAATTTAATTTGGTCAATTTCATAAATATTATAACAGTCATGTTA

1

221    ACTCAATGTCTCTCAGATACTACCTGTGCTGTCTATAAAATTCGAAGCTCAAATTTTCACTTTTATGATCAAATT

26T  T  C  A  V  Y  K  I  R  S  S  N  F  H  F  Y  D  Q  I

296    GATAAAGATGTTAATTTCAGTGGAAAGTATTTGCCTCGCTTACGAACACTAAGAGATGTTATACCTCTCATGTTT

51     D  K  D  V  N  F  S  G  K  Y  L  P  R  L  R  T  L  R  D  V  I  P  L  M  F

371    CCAATAAATTCAAAA GAAATTGAAGTACCCGATCATTTGAAAAATCTAATTGAAGTTAATCAAAATGGAAACCTA

76     P  I  N  S  K  E  I  E  V  P  D  H  L  K  N  L  I  E  V  N  Q  N  G  N  L

446    CCGAATCAAGTTTATCCAGATGAGAGTCCAGGTGAACAACAAGGAGAAATTGAAAATGGTATAGATGATGTAAAT

101P   N  Q  V  Y  P  D  E  S  P  G  E  Q  Q  G  E  I  E  N  G  I  D  D  V  N

521    CACTGTATTCCAATTCATGAACCAATTTGTCATGGTCTTCAATATACTCATACTTGGTTACCTAATTCAGTGGGT

126    H  C  I  P  I  H  E  P  I  C  H  G  L  Q  Y  T  H  T  W  L  P  N  S  V  G

596    CTAACGACACAAGAAGAGGCTGCAAAACGCATGAATGACTATCGTTCCCTCATCAATGTTGGTTGTTCACACTAT

151    L  T  T  Q  E  E  A  A  K  R  M  N  D  Y  R  S  L  I  N  V  G  C  S  H  Y

671    TTAAAATTTTTTCTG TGTACAGTTTATTTTCCAATGTGTACCCCAACACTGAATCCACCAGCTGCCTTACAGCCA

176    L  K  F  F  L  C  T  V  Y  F  P  M  C  T  P  T  L  N  P  P  A  A  L  Q  P

746    TGTCAAAATTTATGTCGTTATGTACAATCAAAGTGTGAACCAATTATGAAAAGTTTTAGCTTTCCATGGCCAATC

201    C  Q  N  L  C  R  Y  V  Q  S  K  C  E  P  I  M  K  S  F  S  F  P  W  P  I

821    GAACTTAATTGTAAAGCATTACCCTCAGATTCTGGAATGTGTATACAACCACAAAATTATGATTTAGATAAACAA

226    E  L  N  C  K  A  L  P  S  D  S  G  M  C  I  Q  P  Q  N  Y  D  L  D  K  Q

896    GGACAAATTATAAGCCCAGGGATCCCATCTGAAGCCCATGGAGCTATAGCTAATTTATTGCCAAATTTTAGTGAG

251    G  Q  I  I  S  P  G  I  P  S  E  A  H  G  A  I  A  N  L  L  P  N  F  S  E

971    TTTTTGGCCCAACAA AGTGCTCAAAACCAACTTTTGGCGAGTACACAGAACAATCAAACAGATAATACTAACGAG

276    F  L  A  Q  Q  S  A  Q  N  Q  L  L  A  S  T  Q  N  N  Q  T  D  N  T  N  E

1046   AAAATACTTTCAGTGAATGATAACCAATCCGGTTTGACAAGACATCATCTAATCCACAGGACAAAACTACAATCT

301    K  I  L  S  V  N  D  N  Q  S  G  L  T  R  H  H  L  I  H  R  T  K  L  Q  S

1121   TCAAAGTGCTATGTTGTCGAAATTCTTTTATATTCTGAACAGGCACATAATAATATTACATGCGCTCGTCGTTGT

326    S  K  C  Y  V  V  E  I  L  L  Y  S  E  Q  A H  N  N  I  T  C  A  R  R  C

1196   AATGCTCATTTATTTTACAAACCAGTTGAAAAACGTTTCGCCAATATTTGGATGCTAGTTTGGTCCATAATATGT

351    N  A  H  L  F  Y  K  P  V  E  K  R  F  A  N  I  W  M  L  V  W  S  I  I  C

1271   TTGGGATCGTGTGCATTGACTATTATCACCTTTACCTTAAACCGCACACGTTTTGCTTATCCAGAACGACCGATT

376    L  G  S  C  A  L  T  I  I  T  F  T  L  N  R  T  R  F  A  Y  P  E  R  P  I

1346   ATTTACATATCAGTTTGTTGCTTCGTTTACTCTGCTGGATTTATTTTACACTCTCTGATTGGGCGTGATTTGGTG

401    I  Y  I  S  V  C  C  F  V  Y  S  A  G  F  I  L  H  S  L  I  G  R  D  L  V

1421   GCATGTAGGAACAAAGTTGAAACAATTTCGCCATCATTATTGACAAACGGGGTATCACAAGTTGGTACAAAGAAA

426    A  C  R  N  K  V  E  T  I  S  P  S  L  L  T  N  G  V  S  Q  V  G  T  K  K

1496   CTTTTTACAGGTTTAACTCAATTAAAAGTTAACGCTAGTTTCTTGATAACTTCAGGATATGAAGGTACATGGTGT

451    L  F  T  G  L  T  Q  L  K  V N  A  S  F  L  I  T  S  G  Y  E  G  T  W  C

1571   ACTATTATATTTATT ATCCTGTTTTATTTCAGTCAAGCGAGTTATTTATGGTGGGTTATGTTAGCTACCTCATGG

476    T  I  I  F  I I  L  F  Y  F  S  Q  A  S  Y  L  W  W  V  M  L  A  T  S  W

1646   TTTTTATCAGCTTCCTGTAAGTGGGGATGTGAAGGCATAGAGGCTGTCAGTAGTATCTTCCATATGCTCGCCTGG

501    F  L  S  A  S  C  K  W  G  C  E  G  I  E  A  V  S  S  I  F  H  M  L  A  W

1721   GCATTACCAGCATTAAAAACTATTATCATATTAATCATGCATCGTATTGACGCAGATGAGTTAACTGGATTATGC

526    A  L  P  A  L  K  T  I  I  I  L  I  M  H  R I  D  A  D  E  L  T  G  L  C

1796   AACGTTGGTTATCAAAATTCAACGAGTTTACTCACATTGATATTACTACCACAAATCATCTACCTATTGTTGGGC

551    N  V  G  Y  Q  N  S  T  S  L L  T  L  I  L  L  P  Q  I  I  Y  L  L  L  G

1871   ATCATGTTTTTATTG GTTGGTTTTCACTCCTTGATTTCCCTTCGATCAAACTTAAAACAACACGCTAAAAGCCTC

576    I  M  F  L  L V  G  F  H  S  L  I  S  L  R  S  N  L  K  Q  H  A  K  S  L

1946   TTGCCTGCTACCAAAACAACAACAGCACCAGCAAACTGTTATAATTCTCAGTGCAAAAGAAATGCTTCAGCAACA

601    L  P  A  T  K  T  T  T  A  P  A  N  C  Y  N  S  Q  C  K  R N  A  S  A  T

2021   GTAGCAATACCAACTATGACACTACAAACAATGACCACATCTAGTCCAGTCATCGCCCTCAACAATGGAAATATA

626    V  A  I  P  T  M  T  L  Q  T  M  T  T  S  S P  V  I  A  L  N  N  G  N  I

2096   CGACGTTTAGATAAACTAATGATAAAAATAGGCATATTTTCAATGCTGTATATTATTCCATGTGCATGTGTTATT

651    R  R  L  D  K  L  M  I  K  I G  I  F  S  M  L  Y  I  I  P  C  A  C  V  I

2171   GGTGTGAATATTTACAATTATATTAATTATCCGGAATGGATGAAAACATTGGATAGACTATCTAAACAAACAAAC

676     G  V  N  I  Y N  Y  I  N  Y  P  E  W  M  K  T  L  D  R  L  S  K  Q  T  N

2246    TGTTTAACGGAATACGGTACAAGTTGGTCACTGGTCACTCAGTGTCTAGAAGATAATCACTTCCCATCAGCTGAA

701     C  L  T  E  Y  G  T  S  W  S  L  V  T  Q  C  L  E  D  N  H F  P  S  A  E

2321    GCTAACATGTTACAAATATTCATGTCTCTAGTCGTCGGTATCACTTCAGGAATGTGGGTATGGTGTAATAGAAAA

726     A  N  M  L  Q  I  F  M  S  L  V  V  G  I  T S  G  M  W  V  W  C  N  R  K

2396    TCTTCAGAAACATGGTTAAAATGCATAAAGAGGAGAAAGAAAAATTTATCTCAGCATAGTTTGAATTACCGTTAT

751     S  S  E  T  W  L  K  C  I  K R  R  K  K  N  L  S  Q  H  S  L  N  Y  R  Y

2471    CATATTTGTGGGGATGTTGTCGCTGGTGATACTGTTGGAGAAACTAATAATGTGTCCCAAGTTGATCAAAAGGCA

776     H  I  C  G  D V  V  A  G  D  T  V  G  E  T  N  N  V  S  Q  V  D  Q  K  A

2546    CAACTAATGAATACGACTTGTTGTAATTCAAGAGCGGCATGTGGAAAAAACAACCAGTATCCAGGAAACACCATG

801     Q  L  M  N  T  T  C  C  N  S  R  A  A  C  G  K  N  N  Q  Y  P  G  N  T  M

2621    AATTTCGATAATACAATGAACAATATTAACCAGCTGGTGGCTGATTCCACTCAGTATCATCAACAACAACACCAA

826     N  F  D  N  T  M  N  N  I  N  Q  L  V  A  D S  T  Q  Y  H  Q  Q  Q  H  Q

2696    AATGAAATCGCACGAAACAACGTAAGAAATTTAATGCTTTCTGGATCATTTAACATGTCATCTGGAACAGCTTCA

851     N  E  I  A  R  N  N  V  R  N L  M  L  S  G  S  F  N  M  S  S  G  T  A  S

2771    TGTACAAGTGCTCCACTATTATCACATGGTTTAGGAACAATAAATATGTCATTATTAAATTCATTTGAATCCAAT

876     C  T  S  A  P L  L  S  H  G  L  G  T  I  N  M  S  L  L  N  S  F  E  S  N

2846    TATTGCACCCGTTCATCACAACGACAAACATTTAAAACTAGACCATCTAATACGGGAAGACCAGACTGTTTT

901     Y  C  T  R  S  S  Q  R  Q  T  F  K  T  R  P  S  N  T  G  R  P  D  C *

2921    GTTTGCTTCCTTGGTAAATAATGTAAATTTTTCTTGAATACACTTACCCATGATTACAAATTTATTTGTAACAGC

2996    TGATATTTACTCTACATTGCATAAGCCATTGCACAAACAAAACCTTGAGCGAAGATCAAATATGAAAAATAATCA

3071    TAAATCTTGTTCATCTCATTTTAATTTTGTATCAATTGATCGTTCATATTACATTCTGTAATCATTTTCTAAATG

3146    ATAGTTCTTTCGTTCTGCTTGTTTCATTCACGATTTATCAATTTGAACAAGTGATTACGCCTATCCGCACAGAAT

3221    GCTCATTTCTGTATATAAATTATTTTGTGACTTGTATTCCGGTTATCTTTTAACTTGAAAATAATTTCATTTATT

3296    CTTTATTTTTTAACTACAAATCAAGAAGCTATTGCTTGTCGCTTCACCTATTATGCTTTAATTTGATATTTTTTA

3371    CGATTAATTCAATTCAGACTTTGGTCAAACGTTTTCTTTAAACTTCACACTTTCAGAAAAAGAAAAACAAACCAT

3446    ACTAGAACAGTGGTACGGGTTAGTAATGAGGAATAAATGAACAATAAATAACTCAATTTGATCACAAAGCTCATT

3521    AATTCCATTTTCTTGAGTCACCTTGTATATGAGTAACTGTAGACTTGTATTTCCTTCAGTTTTCATTTGTTAATT

3596    TATTCACCTTTGCCAATAATTTAAAGACACTAATTATAGCCTTGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

利用生物信息学软件分析SjFz9蛋白结构,表明该蛋白具有Frizzled家族蛋白结构特征(见图3和SEQ ID NO.1):N-端1~31个氨基酸残基为信号肽;126~244个氨基酸残基段为半胱氨酸富集区(cystein rich domain,CRD),含有10个保守的半胱氨酸;364~748氨基酸区段为七个跨膜的α螺旋疏水区;C-端尾部位于胞内,含有磷酸化位点。

选择来自人(human,NP_003499.1)、类人猿(Pan troglodytes,XP_527779.2)、小鼠(Musculus,NP_034376.1)、斑马鱼(Danio,NP_571586.1)、爪蟾(Xenopus,AAD44332.1)、斑马(Taeniopygia,XP_002187952.1)等几个物种的Fz9蛋白以及曼氏血吸虫Frizzled受体(CAZ36662)进行氨基酸序列的多重比对。结果显示,SjFz9蛋白与曼氏血吸虫Frizzled受体相似性最高,达79%,其次与爪蟾Fz9的相似性为33%。另外,参与比对序列中除类人猿在CRD区缺少多个半胱氨酸,可能该序列在5’端不完整,其余物种的序列在CRD区内均含有10个保守的半胱氨酸,且跨膜区序列相当保守。从图4所示的Fz9的进化树上看,SjFz9与曼氏血吸虫Frizzled受体的亲缘关系最接近,其次,与爪蟾Fz9在进化关系上比较接近。

实施例2荧光定量PCR方法分析SjFz9基因的mRNA表达图式

1.实验方法

根据real time PCR引物设计原则,设计SjFz9基因引物:F(上游引物),5’TATCACTTCAGGAATGTGGGTATGG 3’(SEQ ID NO.15);R(下游引物),5’TTAGTTTCTCCAACAGTATCACCAG 3’(SEQ ID NO.16)。选择18s rRNA作内参,引物为:F,5’TTAGTTGGTGGAGCGATTTGTCTGG 3’(SEQ ID NO.17);R,5’CTGTTATTGCTCAATTTCGTGCGAC 3’(SEQ ID NO.18)。按照PrimeScriptTMRT reagent Kit(Takara)说明书,将虫卵及各期别虫体总RNA反转录成cDNA,SYBR Green I(SYBR Premix Ex Taq,Takara)作染料,在Rotor gene-3000A(corbett)仪器上进行Real time PCR。ΔΔGT法计算出各期别虫体中的目的基因相对于内参基因的初始模板量。

2.结果

以18s rRNA为内参,通过qPCR方法对SjFz9在血吸虫不同发育阶段的转录水平差异情况进行分析,重复3次实验,分析结果如图5。7、13、18d的虫体较小,无法进行雌雄分开,因此图5A显示的是在雌雄虫混合样品中对SjFz9mRNA表达水平的检测结果,可以看出在血吸虫童虫(7、13、18d)阶段,SjFz9转录水平较高。23d及其后的成虫虫体样品雌雄分开,图5B分析结果显示,23d雌雄虫中mRNA均有较高表达。但23d后的成虫体内mRNA表达水平变化较大:SjFz9mRNA在26、32、35、50d雌虫虫体中的表达水平较低,而在29d、42d又分别呈现很高的转录水平;SjFz9mRNA在26、29、32、35d雄虫虫体的表达量较低,而在42d、50d虫体又呈现很高表达水平(在42d虫体的表达量几乎是35d的6倍,P<0.05)。

实施例3SjFz9蛋白的组织定位分析

1.SjFz9蛋白在原核系统的表达、纯化与鉴定

选取SjFz9蛋白CRD结构功能域作为免疫组化定位的目标抗原,设计引物如下:F,5’GTGGATCCACAGTCATGTTAACTCAATGTCTCT 3’(SEQ ID NO.19);R,5’GTCTCGAGTTCACACTTTGATTGTACATAACGA 3’(SEQ ID NO.20),上下游引物中分别引入BamHI和Xho I限制性内切酶位点(引物序列中划线处标出)。以13d童虫cDNA为模板进行PCR扩增。将纯化的目的片段(567bp)克隆至pMD18T载体,转化大肠杆菌DH5α感受态细胞。提取阳性克隆的质粒,经BamH I和Xho I双酶切,切胶回收,连接到经同样双酶切的pET28a载体中,构建成重组原核表达质粒pET28a-SjFz9,将该pET28a-SjFz9重组质粒转化入DH5α感受态细胞后,阳性克隆进行测序和双酶切鉴定。图6所示为重组原核表达质粒pET28a-SjFz9的酶切鉴定图,在图6中,“1”代表重组表达质粒pET28a-SjFz9的BamH I和Xho I双酶切产物。经鉴定正确的重组表达质粒转化表达用工程菌BL21(DE3)感受态细胞。

分别挑取重组质粒转化表达菌的克隆及空载体转化克隆于试管LB培养基,37℃过夜培养。次日,以1∶100转接新鲜LB培养基,待菌液OD600为0.8~1.0时加入IPTG进行诱导表达,IPTG的终浓度为0.8mmol/L。8h后收集菌体诱导物,用1×PBS溶解,冰浴超声后,离心分离上清,用8M尿素溶解沉淀蛋白,分别取样进行12%SDS-PAGE凝胶电泳。参照Ni亲和柱使用说明书进行蛋白纯化。纯化的蛋白再利用SDS-PAGE凝胶电泳进行检测,结果如图7所示。与His标签融合的重组蛋白理论分子量为30.7kD,图7中所示纯化的重组蛋白大小与理论预测一致。

用Western-blot方法鉴定原核表达的重组蛋白(参照分子克隆操作指南进行)。用含0.05%吐温-20的TBS稀释一抗、二抗,以1∶100比例稀释血吸虫虫卵抗原免疫兔血清作一抗(本实验室制备),以1∶2000比例稀释HRP标记的羊抗兔IgG作二抗。(沉淀型)TMB(天根生物)为底物进行显色。Western-Blot结果如图8所示,表明pET28a-SjFz9原核表达的蛋白能被血吸虫虫卵蛋白免疫血清识别,具有良好的抗原性。

2.SjFz9多抗的制备及其特异性鉴定

取500ul纯化的重组蛋白(1mg/ml)与等体积完全弗氏佐剂混合乳化进行首免,背部脊柱两侧两点皮下注射免疫6只雄性Balb/c小鼠,免疫剂量为50μg/只;以后每隔两周进行加强免疫,将纯化蛋白与不完全弗氏佐剂混合,免疫剂量为75μg/只。在第4次加强免疫后一周进行摘眼球采血,分离血清。-70℃冰箱冻存备用。PBS与佐剂混合物免疫小鼠作对照。

通过Western-blot方法鉴定用重组蛋白制备的抗血清。用蛋白抽提试剂盒(Pierce,美国)抽提血吸虫18天虫体蛋白,在蛋白抽提过程中加入蛋白酶抑制剂PMSF和EDTA。抽提的虫体蛋白经SDS-PAGE凝胶电泳后电转移到硝酸纤维(NC)膜上(转印方法同上)。以1∶500比例稀释制备的多抗作一抗;以1∶2000的比例稀释IRDyeTM800标记的羊抗小鼠IgG(Rockland)作二抗,避光条件下孵育,通过Odyssey红外荧光扫描成像系统分析结果。

结果显示该抗血清识别的单一蛋白条带约104kD(见图9),与理论预测的SjFz9蛋白大小一致,说明制备的多抗血清能够特异性地识别天然虫体中的SjFz9蛋白,而检测PBS免疫血清的对照结果为阴性,表明该多抗可用于SjFz9蛋白的免疫组化定位分析。在图9中,a为阳性血清检测,b为PBS免疫血清检测对照。

3.SjFz9蛋白的虫体定位分析

选择性收集13d、18d童虫及23d、32d、42d雌、雄虫新鲜虫体,制备石蜡切片。通过小鼠S-P免疫组化检测试剂盒对SjFz9进行组织定位分析。

具体步骤如下:

经二甲苯脱蜡,2×15min。由高到低的梯度浓度酒精进行水化:100%→95%→90%→85%→75%→50%,每个梯度放置5min,然后放入蒸馏水中20~30min,还可在水中放置过夜。3%过氧化氢中放置20min,去除内源性过氧化物酶。PBS洗涤3次,3min/次。滴加经37℃预热的(0.25%)胰酶于切片上约3min进行抗原修复。PBS洗涤3次,3min/次。以正常山羊血清(工作浓度)封闭滴于切片上,湿盒内37℃孵育1h。甩掉封闭血清,滴加正常的小鼠血清及SjFz9的小鼠多抗血清的稀释液(1∶200)各50~80μL,37℃孵育1h。PBS洗涤4次,5min/次。滴加生物素化山羊抗鼠IgG。50~80μL,37℃孵育30min。PBS洗涤同上。加HRP标记的链霉卵白素工作液50~80μL,37℃孵育20~30min,PBS洗涤4次,加DAB(DAKO)显色液,同时光镜下观察显色情况。一旦着色即用蒸馏水洗涤。苏木素复染2min,自来水冲洗10min。脱水,透明,封片,镜检。

结果:

如图10所示,图10为免疫组化分析SjFz9蛋白在日本血吸虫童虫、成虫体壁肌肉层细胞的定位图,其中,A,B,C,D,E分别为13d、18d、23d、32d、42d虫体定位结果,F为阴性对照,箭头所指为阳性染色;at代表吸盘,ap代表前部,sm代表体壁肌细胞,p代表实质细胞,gc代表抱雌沟。图10所示的童虫虫体定位显示,SjFz9蛋白在虫体的分布比较广,主要在虫体的前部、口腹吸盘、体壁肌细胞层(见图10A,B),在实质细胞中也有少量表达,以正常阴性血清检测的对照没有任何染色(图10F)。而在成虫中的定位显示,SjFz9蛋白在23d、32d和42d虫体的吸盘、体壁肌肉层细胞上仍然有大量分布(图10C,D,E)。另外,更有意思的是,SjFz9蛋白在雌虫的卵细胞、卵黄腺细胞和雄虫的精子细胞内或细胞膜上都有大量表达(见图11A,B,C),相应期别的虫体对照组没有表达信号(图11D,E,F)。图11是免疫组化分析SjFz9蛋白在日本血吸虫成虫生殖细胞的定位图,是以SjFz9蛋白的多抗血清孵育虫体切片,以正常小鼠血清做阴性对照,以DAB为显色剂作的免疫组化实验结果图。图11中,A,D为雄虫的睾丸定位;B,E为雌虫的卵巢定位;C,F为雌虫的卵黄腺定位;A-C显示阳性结果,D-F为阴性对照;箭头所指为SjFz9蛋白的阳性染色;O代表卵巢;t代表睾丸;v代表卵黄腺细胞;ic代表肠腔。

以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

序列表

 

<110>中国农业科学院上海兽医研究所

<120>日本血吸虫Frizzled9基因、蛋白及用途

<160>20

<170>PatentIn version 3.3

 

<210>1

<211>923

<212>PRT

<213>Schistosoma japonicum

 

<220>

<221>SIGNAL

<222>(1)..(31)

<223>信号肽

 

<220>

<221>DOMAIN

<222>(126)..(244)

<223>半胱氨酸富集区

 

<220>

<221>TRANSMEM

<222>(264)..(748)

<223>跨膜区

 

<400>1

Met Lys Ile Val Arg Met Ser Leu Phe Lys Lys Phe Asn Leu Val Asn

1               5                   10                  15

Phe Ile Asn Ile Ile Thr Val Met Leu Thr Gln Cys Leu Ser Asp Thr

            20                  25                  30

Thr Cys Ala Val Tyr Lys Ile Arg Ser Ser Asn Phe His Phe Tyr Asp

        35                  40                  45

Gln Ile Asp Lys Asp Val Asn Phe Ser Gly Lys Tyr Leu Pro Arg Leu

    50                  55                  60

Arg Thr Leu Arg Asp Val Ile Pro Leu Met Phe Pro Ile Asn Ser Lys

65                  70                  75                  80

Glu Ile Glu Val Pro Asp His Leu Lys Asn Leu Ile Glu Val Asn Gln

                85                  90                  95

Asn Gly Asn Leu Pro Asn Gln Val Tyr Pro Asp Glu Ser Pro Gly Glu

            100                 105                 110

Gln Gln Gly Glu Ile Glu Asn Gly Ile Asp Asp Val Asn His Cys Ile

        115                 120                 125

Pro Ile His Glu Pro Ile Cys His Gly Leu Gln Tyr Thr His Thr Trp

    130                 135                 140

Leu Pro Asn Ser Val Gly Leu Thr Thr Gln Glu Glu Ala Ala Lys Arg

145                 150                 155                 160

Met Asp Asp Tyr Arg Ser Leu Ile Asn Val Gly Cys Ser His Tyr Leu

                165                 170                 175

Lys Phe Phe Leu Cys Thr Val Tyr Phe Pro Met Cys Thr Pro Thr Leu

            180                 185                 190

Asn Pro Pro Ala Ala Leu Gln Pro Cys Gln Asn Leu Cys Arg Tyr Val

        195                 200                 205

Gln Ser Lys Cys Glu Pro Ile Met Lys Ser Phe Ser Phe Pro Trp Pro

    210                 215                 220

Ile Glu Leu Asn Cys Lys Ala Leu Pro Ser Asp Ser Gly Met Cys Ile

225                 230                 235                 240

Gln Pro Gln Asn Tyr Asp Leu Asp Lys Gln Gly Gln Ile Ile Ser Pro

                245                 250                 255

Gly Ile Pro Ser Glu Ala His Gly Ala Ile Ala Asn Leu Leu Pro Asn

            260                 265                 270

Phe Ser Glu Phe Leu Ala Gln Gln Ser Ala Gln Asn Gln Leu Leu Ala

        275                 280                 285

Ser Thr Gln Asn Asn Gln Thr Asp Asn Thr Asn Glu Lys Ile Leu Ser

    290                 295                 300

Val Asn Asp Asn Gln Ser Gly Leu Thr Arg His His Leu Ile His Arg

305                 310                 315                 320

Thr Lys Leu Gln Ser Ser Lys Cys Tyr Val Val Glu Ile Leu Leu Tyr

                325                 330                 335

Ser Glu Gln Ala His Asn Asn Ile Thr Cys Ala Arg Arg Cys Asn Ala

            340                 345                 350

His Leu Phe Tyr Lys Pro Val Glu Lys Arg Phe Ala Asn Ile Trp Met

        355                 360                 365

Leu Val Trp Ser Ile Ile Cys Leu Gly Ser Cys Ala Leu Thr Ile Ile

    370                 375                 380

Thr Phe Thr Leu Asn Arg Thr Arg Phe Ala Tyr Pro Glu Arg Pro Ile

385                 390                 395                 400

Ile Tyr Ile Ser Val Cys Cys Phe Val Tyr Ser Ala Gly Phe Ile Leu

                405                 410                 415

His Ser Leu Ile Gly Arg Asp Leu Val Ala Cys Arg Asn Lys Val Glu

            420                 425                 430

Thr Ile Ser Pro Ser Leu Leu Thr Asn Gly Val Ser Gln Val Gly Thr

        435                 440                 445

Lys Lys Leu Phe Thr Gly Leu Thr Gln Leu Lys Val Asn Ala Ser Phe

    450                 455                 460

Leu Ile Thr Ser Gly Tyr Glu Gly Thr Trp Cys Thr Ile Ile Phe Ile

465                 470                 475                 480

Ile Leu Phe Tyr Phe Ser Gln Ala Ser Tyr Leu Trp Trp Val Met Leu

                485                 490                 495

Ala Thr Ser Trp Phe Leu Ser Ala Ser Cys Lys Trp Gly Cys Glu Gly

            500                 505                 510

Ile Glu Ala Val Ser Ser Ile Phe His Met Leu Ala Trp Ala Leu Pro

        515                 520                 525

Ala Leu Lys Thr Ile Ile Ile Leu Ile Met His Arg Ile Asp Ala Asp

    530                 535                 540

Glu Leu Thr Gly Leu Cys Asn Val Gly Tyr Gln Asn Ser Thr Ser Leu

545                 550                 555                 560

Leu Thr Leu Ile Leu Leu Pro Gln Ile Ile Tyr Leu Leu Leu Gly Ile

                565                 570                 575

Met Phe Leu Leu Val Gly Phe His Ser Leu Ile Ser Leu Arg Ser Asn

            580                 585                 590

Leu Lys Gln His Ala Lys Ser Leu Leu Pro Ala Thr Lys Thr Thr Thr

        595                 600                 605

Ala Pro Ala Asn Cys Tyr Asn Ser Gln Cys Lys Arg Asn Ala Ser Ala

    610                 615                 620

Thr Val Ala Ile Pro Thr Met Thr Leu Gln Thr Met Thr Thr Ser Ser

625                 630                 635                 640

Pro Val Ile Ala Leu Asn Asn Gly Asn Ile Arg Arg Leu Asp Lys Leu

                645                 650                 655

Met Ile Lys Ile Gly Ile Phe Ser Met Leu Tyr Ile Ile Pro Cys Ala

            660                 665                 670

Cys Val Ile Gly Val Asn Ile Tyr Asn Tyr Ile Asn Tyr Pro Glu Trp

        675                 680                 685

Met Lys Thr Leu Asp Arg Leu Ser Lys Gln Thr Asn Cys Leu Thr Glu

    690                 695                 700

Tyr Gly Thr Ser Trp Ser Leu Val Thr Gln Cys Leu Glu Asp Asn His

705                 710                 715                 720

Phe Pro Ser Ala Glu Ala Asn Met Leu Gln Ile Phe Met Ser Leu Val

                725                 730                 735

Val Gly Ile Thr Ser Gly Met Trp Val Trp Cys Asn Arg Lys Ser Ser

            740                 745                 750

Glu Thr Trp Leu Lys Cys Ile Lys Arg Arg Lys Lys Asn Leu Ser Gln

        755                 760                 765

His Ser Leu Asn Tyr Arg Tyr His Ile Cys Gly Asp Val Val Ala Gly

    770                 775                 780

Asp Thr Val Gly Glu Thr Asn Asn Val Ser Gln Val Asp Gln Lys Ala

785                 790                 795                 800

Gln Leu Met Asn Thr Thr Cys Cys Asn Ser Arg Ala Ala Cys Gly Lys

                805                 810                 815

Asn Asn Gln Tyr Pro Gly Asn Thr Met Asn Phe Asp Asn Thr Met Asn

            820                 825                 830

Asn Ile Asn Gln Leu Val Ala Asp Ser Thr Gln Tyr His Gln Gln Gln

        835                 840                 845

His Gln Asn Glu Ile Ala Arg Asn Asn Val Arg Asn Leu Met Leu Ser

    850                 855                 860

Gly Ser Phe Asn Met Ser Ser Gly Thr Ala Ser Cys Thr Ser Ala Pro

865                 870                 875                 880

Leu Leu Ser His Gly Leu Gly Thr Ile Asn Met Ser Leu Leu Asn Ser

                885                 890                 895

Phe Glu Ser Asn Tyr Cys Thr Arg Ser Ser Gln Arg Gln Thr Phe Lys

            900                 905                 910

Thr Arg Pro Ser Asn Thr Gly Arg Pro Asp Cys

        915                 920

 

<210>2

<211>3670

<212>DNA

<213>Schistosoma japonicum

 

<220>

<221>CDS

<222>(146)..(2917)

 

<400>2

ggtcaaataa caatttaaca ttatgaaaga tatattttca agtgtatatt tatgaatgta     60

cttacttgta aaatgaagtc atcttaacag aactgagctg tttagttgct ttgttgtgtt    120

aatttacata aattgtcact cagag atg aaa att gta aga atg agt tta ttt      172

                            Met Lys Ile Val Arg Met Ser Leu Phe

                            1               5

aaa aaa ttt aat ttg gtc aat ttc ata aat att ata aca gtc atg tta      220

Lys Lys Phe Asn Leu Val Asn Phe Ile Asn Ile Ile Thr Val Met Leu

10                  15                  20                  25

act caa tgt ctc tca gat act acc tgt gct gtc tat aaa att cga agc      268

Thr Gln Cys Leu Ser Asp Thr Thr Cys Ala Val Tyr Lys Ile Arg Ser

                30                  35                  40

tca aat ttt cac ttt tat gat caa att gat aaa gat gtt aat ttc agt      316

Ser Asn Phe His Phe Tyr Asp Gln Ile Asp Lys Asp Val Asn Phe Ser

            45                  50                  55

gga aag tat ttg cct cgc tta cga aca cta aga gat gtt ata cct ctc    364

Gly Lys Tyr Leu Pro Arg Leu Arg Thr Leu Arg Asp Val Ile Pro Leu

        60                  65                  70

atg ttt cca ata aat tca aaa gaa att gaa gta ccc gat cat ttg aaa    412

Met Phe Pro Ile Asn Ser Lys Glu Ile Glu Val Pro Asp His Leu Lys

    75                  80                  85

aat cta att gaa gtt aat caa aat gga aac cta ccg aat caa gtt tat    460

Asn Leu Ile Glu Val Asn Gln Asn Gly Asn Leu Pro Asn Gln Val Tyr

90                  95                  100                 105

cca gat gag agt cca ggt gaa caa caa gga gaa att gaa aat ggt ata    508

Pro Asp Glu Ser Pro Gly Glu Gln Gln Gly Glu Ile Glu Asn Gly Ile

                110                 115                 120

gat gat gta aat cac tgt att cca att cat gaa cca att tgt cat ggt    556

Asp Asp Val Asn His Cys Ile Pro Ile His Glu Pro Ile Cys His Gly

            125                 130                 135

ctt caa tat act cat act tgg tta cct aat tca gtg ggt cta acg aca    604

Leu Gln Tyr Thr His Thr Trp Leu Pro Asn Ser Val Gly Leu Thr Thr

        140                 145                 150

caa gaa gag gct gca aaa cgc atg aat gac tat cgt tcc ctc atc aat    652

Gln Glu Glu Ala Ala Lys Arg Met Asn Asp Tyr Arg Ser Leu Ile Asn

    155                 160                 165

gtt ggt tgt tca cac tat tta aaa ttt ttt ctg tgt aca gtt tat ttt    700

Val Gly Cys Ser His Tyr Leu Lys Phe Phe Leu Cys Thr Val Tyr Phe

170                 175                 180                 185

cca atg tgt acc cca aca ctg aat cca cca gct gcc tta cag cca tgt    748

Pro Met Cys Thr Pro Thr Leu Asn Pro Pro Ala Ala Leu Gln Pro Cys

                190                 195                 200

caa aat tta tgt cgt tat gta caa tca aag tgt gaa cca att atg aaa    796

Gln Asn Leu Cys Arg Tyr Val Gln Ser Lys Cys Glu Pro Ile Met Lys

            205                 210                 215

agt ttt agc ttt cca tgg cca atc gaa ctt aat tgt aaa gca tta ccc    844

Ser Phe Ser Phe Pro Trp Pro Ile Glu Leu Asn Cys Lys Ala Leu Pro

        220                 225                 230

tca gat tct gga atg tgt ata caa cca caa aat tat gat tta gat aaa    892

Ser Asp Ser Gly Met Cys Ile Gln Pro Gln Asn Tyr Asp Leu Asp Lys

    235                 240                 245

caa gga caa att ata agc cca ggg atc cca tct gaa gcc cat gga gct    940

Gln Gly Gln Ile Ile Ser Pro Gly Ile Pro Ser Glu Ala His Gly Ala

250                 255                 260                 265

ata gct aat tta ttg cca aat ttt agt gag ttt ttg gcc caa caa agt    988

Ile Ala Asn Leu Leu Pro Asn Phe Ser Glu Phe Leu Ala Gln Gln Ser

                270                 275                 280

gct caa aac caa ctt ttg gcg agt aca cag aac aat caa aca gat aat    1036

Ala Gln Asn Gln Leu Leu Ala Ser Thr Gln Asn Asn Gln Thr Asp Asn

            285                 290                 295

act aac gag aaa ata ctt tca gtg aat gat aac caa tcc ggt ttg aca    1084

Thr Asn Glu Lys Ile Leu Ser Val Asn Asp Asn Gln Ser Gly Leu Thr

        300                 305                 310

aga cat cat cta atc cac agg aca aaa cta caa tct tca aag tgc tat    1132

Arg His His Leu Ile His Arg Thr Lys Leu Gln Ser Ser Lys Cys Tyr

    315                 320                 325

gtt gtc gaa att ctt tta tat tct gaa cag gca cat aat aat att aca    1180

Val Val Glu Ile Leu Leu Tyr Ser Glu Gln Ala His Asn Asn Ile Thr

330                 335                 340                 345

tgc gct cgt cgt tgt aat gct cat tta ttt tac aaa cca gtt gaa aaa    1228

Cys Ala Arg Arg Cys Asn Ala His Leu Phe Tyr Lys Pro Val Glu Lys

                350                 355                 360

cgt ttc gcc aat att tgg atg cta gtt tgg tcc ata ata tgt ttg gga    1276

Arg Phe Ala Asn Ile Trp Met Leu Val Trp Ser Ile Ile Cys Leu Gly

            365                 370                 375

tcg tgt gca ttg act att atc acc ttt acc tta aac cgc aca cgt ttt    1324

Ser Cys Ala Leu Thr Ile Ile Thr Phe Thr Leu Asn Arg Thr Arg Phe

        380                 385                 390

gct tat cca gaa cga ccg att att tac ata tca gtt tgt tgc ttc gtt    1372

Ala Tyr Pro Glu Arg Pro Ile Ile Tyr Ile Ser Val Cys Cys Phe Val

    395                 400                 405

tac tct gct gga ttt att tta cac tct ctg att ggg cgt gat ttg gtg    1420

Tyr Ser Ala Gly Phe Ile Leu His Ser Leu Ile Gly Arg Asp Leu Val

410                 415                 420                 425

gca tgt agg aac aaa gtt gaa aca att tcg cca tca tta ttg aca aac    1468

Ala Cys Arg Asn Lys Val Glu Thr Ile Ser Pro Ser Leu Leu Thr Asn

                430                 435                 440

ggg gta tca caa gtt ggt aca aag aaa ctt ttt aca ggt tta act caa    1516

Gly Val Ser Gln Val Gly Thr Lys Lys Leu Phe Thr Gly Leu Thr Gln

            445                 450                 455

tta aaa gtt aac gct agt ttc ttg ata act tca gga tat gaa ggt aca    1564

Leu Lys Val Asn Ala Ser Phe Leu Ile Thr Ser Gly Tyr Glu Gly Thr

        460                 465                 470

tgg tgt act att ata ttt att atc ctg ttt tat ttc agt caa gcg agt    1612

Trp Cys Thr Ile Ile Phe Ile Ile Leu Phe Tyr Phe Ser Gln Ala Ser

    475                 480                 485

tat tta tgg tgg gtt atg tta gct acc tca tgg ttt tta tca gct tcc    1660

Tyr Leu Trp Trp Val Met Leu Ala Thr Ser Trp Phe Leu Ser Ala Ser

490                 495                 500                 505

tgt aag tgg gga tgt gaa ggc ata gag gct gtc agt agt atc ttc cat    1708

Cys Lys Trp Gly Cys Glu Gly Ile Glu Ala Val Ser Ser Ile Phe His

                510                 515                 520

atg ctc gcc tgg gca tta cca gca tta aaa act att atc ata tta atc    1756

Met Leu Ala Trp Ala Leu Pro Ala Leu Lys Thr Ile Ile Ile Leu Ile

            525                 530                 535

atg cat cgt att gac gca gat gag tta act gga tta tgc aac gtt ggt    1804

Met His Arg Ile Asp Ala Asp Glu Leu Thr Gly Leu Cys Asn Val Gly

        540                 545                 550

tat caa aat tca acg agt tta ctc aca ttg ata tta cta cca caa atc    1852

Tyr Gln Asn Ser Thr Ser Leu Leu Thr Leu Ile Leu Leu Pro Gln Ile

    555                 560                 565

atc tac cta ttg ttg ggc atc atg ttt tta ttg gtt ggt ttt cac tcc    1900

Ile Tyr Leu Leu Leu Gly Ile Met Phe Leu Leu Val Gly Phe His Ser

570                 575                 580                 585

ttg att tcc ctt cga tca aac tta aaa caa cac gct aaa agc ctc ttg    1948

Leu Ile Ser Leu Arg Ser Asn Leu Lys Gln His Ala Lys Ser Leu Leu

                590                 595                 600

cct gct acc aaa aca aca aca gca cca gca aac tgt tat aat tct cag    1996

Pro Ala Thr Lys Thr Thr Thr Ala Pro Ala Asn Cys Tyr Asn Ser Gln

            605                 610                 615

tgc aaa aga aat gct tca gca aca gta gca ata cca act atg aca cta    2044

Cys Lys Arg Asn Ala Ser Ala Thr Val Ala Ile Pro Thr Met Thr Leu

        620                 625                 630

caa aca atg acc aca tct agt cca gtc atc gcc ctc aac aat gga aat    2092

Gln Thr Met Thr Thr Ser Ser Pro Val Ile Ala Leu Asn Asn Gly Asn

    635                 640                 645

ata cga cgt tta gat aaa cta atg ata aaa ata ggc ata ttt tca atg    2140

Ile Arg Arg Leu Asp Lys Leu Met Ile Lys Ile Gly Ile Phe Ser Met

650                 655                 660                 665

ctg tat att att cca tgt gca tgt gtt att ggt gtg aat att tac aat    2188

Leu Tyr Ile Ile Pro Cys Ala Cys Val Ile Gly Val Asn Ile Tyr Asn

                670                 675                 680

tat att aat tat ccg gaa tgg atg aaa aca ttg gat aga cta tct aaa    2236

Tyr Ile Asn Tyr Pro Glu Trp Met Lys Thr Leu Asp Arg Leu Ser Lys

            685                 690                 695

caa aca aac tgt tta acg gaa tac ggt aca agt tgg tca ctg gtc act    2284

Gln Thr Asn Cys Leu Thr Glu Tyr Gly Thr Ser Trp Ser Leu Val Thr

        700                 705                 710

cag tgt cta gaa gat aat cac ttc cca tca gct gaa gct aac atg tta    2332

Gln Cys Leu Glu Asp Asn His Phe Pro Ser Ala Glu Ala Asn Met Leu

    715                 720                 725

caa ata ttc atg tct cta gtc gtc ggt atc act tca gga atg tgg gta    2380

Gln Ile Phe Met Ser Leu Val Val Gly Ile Thr Ser Gly Met Trp Val

730                 735                 740                 745

tgg tgt aat aga aaa tct tca gaa aca tgg tta aaa tgc ata aag agg    2428

Trp Cys Asn Arg Lys Ser Ser Glu Thr Trp Leu Lys Cys Ile Lys Arg

                750                 755                 760

aga aag aaa aat tta tct cag cat agt ttg aat tac cgt tat cat att    2476

Arg Lys Lys Asn Leu Ser Gln His Ser Leu Asn Tyr Arg Tyr His Ile

            765                 770                 775

tgt ggg gat gtt gtc gct ggt gat act gtt gga gaa act aat aat gtg    2524

Cys Gly Asp Val Val Ala Gly Asp Thr Val Gly Glu Thr Asn Asn Val

        780                 785                 790

tcc caa gtt gat caa aag gca caa cta atg aat acg act tgt tgt aat    2572

Ser Gln Val Asp Gln Lys Ala Gln Leu Met Asn Thr Thr Cys Cys Asn

    795                 800                 805

tca aga gcg gca tgt gga aaa aac aac cag tat cca gga aac acc atg    2620

Ser Arg Ala Ala Cys Gly Lys Asn Asn Gln Tyr Pro Gly Asn Thr Met

810                 815                 820                 825

aat ttc gat aat aca atg aac aat att aac cag ctg gtg gct gat tcc    2668

Asn Phe Asp Asn Thr Met Asn Asn Ile Asn Gln Leu Val Ala Asp Ser

                830                 835                 840

act cag tat cat caa caa caa cac caa aat gaa atc gca cga aac aac    2716

Thr Gln Tyr His Gln Gln Gln His Gln Asn Glu Ile Ala Arg Asn Asn

            845                 850                 855

gta aga aat tta atg ctt tct gga tca ttt aac atg tca tct gga aca    2764

Val Arg Asn Leu Met Leu Ser Gly Ser Phe Asn Met Ser Ser Gly Thr

        860                 865                 870

gct tca tgt aca agt gct cca cta tta tca cat ggt tta gga aca ata    2812

Ala Ser Cys Thr Ser Ala Pro Leu Leu Ser His Gly Leu Gly Thr Ile

    875                 880                 885

aat atg tca tta tta aat tca ttt gaa tcc aat tat tgc acc cgt tca    2860

Asn Met Ser Leu Leu Asn Ser Phe Glu Ser Asn Tyr Cys Thr Arg Ser

890                 895                 900                 905

tca caa cga caa aca ttt aaa act aga cca tct aat acg gga aga cca    2908

Ser Gln Arg Gln Thr Phe Lys Thr Arg Pro Ser Asn Thr Gly Arg Pro

                910                 915                 920

gac tgt taa tttgtttgct tccttggtaa ataatgtaaa tttttcttga            2957

Asp Cys

atacacttac ccatgattac aaatttattt gtaacagctg atatttactc tacattgcat  3017

aagccattgc acaaacaaaa ccttgagcga agatcaaata tgaaaaataa tcataaatct    3077

tgttcatctc attttaattt tgtatcaatt gatcgttcat attacattct gtaatcattt    3137

tctaaatgat agttctttcg ttctgcttgt ttcattcacg atttatcaat ttgaacaagt    3197

gattacgcct atccgcacag aatgctcatt tctgtatata aattattttg tgacttgtat    3257

tccggttatc ttttaacttg aaaataattt catttattct ttatttttta actacaaatc    3317

aagaagctat tgcttgtcgc ttcacctatt atgctttaat ttgatatttt ttacgattaa    3377

ttcaattcag actttggtca aacgttttct ttaaacttca cactttcaga aaaagaaaaa    3437

caaaccatac tagaacagtg gtacgggtta gtaatgagga ataaatgaac aataaataac    3497

tcaatttgat cacaaagctc attaattcca ttttcttgag tcaccttgta tatgagtaac    3557

tgtagacttg tatttccttc agttttcatt tgttaattta ttcacctttg ccaataattt    3617

aaagacacta attatagcct tgaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa           3670

 

<210>3

<211>26

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(26)

<223>引物

 

<220>

<221>misc_feature

<222>(1)..(26)

<223>N=A/C/G/T;R=A/G;M=A/C;Y=C/T

 

<400>3

nnngaattct ayccngarmg nccnat    26

 

<210>4

<211>24

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(24)

<223>引物

<220>

<221>misc_feature

<222>(1)..(24)

<223>N=A/C/G/T;R=A/G;Y=C/T

 

<400>4

nnnaagcttn arnaynaccc acca    24

 

<210>5

<211>26

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(26)

<223>引物

 

<220>

<221>misc_feature

<222>(1)..(26)

<223>N=A/C/G/T;R=A/G;M=A/C;Y=C/T

 

<400>5

nnngaattct ayccngarmg nccnat    26

 

<210>6

<211>21

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(21)

<223>引物

 

<220>

<221>misc_feature

<222>(1)..(21)

<223>N=A/C/G/T;D=A/G/T

<400>6

nnnaagcttn gtdtanccnt c    21

 

<210>7

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>7

ctatccggag cgacccatta tttac    25

 

<210>8

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>8

acactctctg attgggcgtg atttg    25

 

<210>9

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

<400>9

tgacccacca taaataactc gcttg    25

 

<210>10

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>10

caccatgtac cttcatatcc tgaag    25

 

<210>11

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>11

taacggaata cggtacaagt tggtc    25

 

<210>12

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

<400>12

tatcacttca ggaatgtggg tatgg    25

 

<210>13

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>13

taagttcgat tggccatgga aagct    25

 

<210>14

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>14

accaacattg atgagggaac  gatag    25

 

<210>15

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

<400>15

tatcacttca ggaatgtggg tatgg    25

 

<210>16

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>16

ttagtttctc caacagtatc accag    25

 

<210>17

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

 

<400>17

ttagttggtg gagcgatttg tctgg    25

 

<210>18

<211>25

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(25)

<223>引物

<400>18

ctgttattgc tcaatttcgt gcgac    25

 

<210>19

<211>33

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(33)

<223>引物

 

<220>

<221>misc_signal

<222>(3)..(8)

<223>BamH I酶切位点

 

<400>19

gtggatccac agtcatgtta actcaatgtc tct    33

 

<210>20

<211>33

<212>DNA

<213>人工序列

 

<220>

<221>misc_feature

<222>(1)..(33)

<223>引物

 

<220>

<221>misc_signal

<222>(3)..(8)

<223>Xho I酶切位点

 

<400>20

gtctcgagtt cacactttga ttgtacataa cga    33

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号