首页> 中国专利> 源于一种深渊新物种的线粒体基因组序列

源于一种深渊新物种的线粒体基因组序列

摘要

本发明公开了源于一种深渊新物种的线粒体基因组序列,所述基因组序列如SEQ ID NO:1所示,本发明还提供了获得该基因组序列的方法;通过本发明方法获得的深渊小型端足类线粒体基因组序列是宝贵的深海生物基因资源,其线粒体基因组序列的组成、结构的分析,可对端足类系统发育、种质资源库的扩充及对深渊环境的适应机制奠定重要的分子生物学理论基础。

著录项

  • 公开/公告号CN108300720A

    专利类型发明专利

  • 公开/公告日2018-07-20

    原文格式PDF

  • 申请/专利权人 中国科学院深海科学与工程研究所;

    申请/专利号CN201810062978.9

  • 发明设计人 李俊元;贺丽生;闫国永;

    申请日2018-01-23

  • 分类号

  • 代理机构广州三环专利商标代理有限公司;

  • 代理人陈欢

  • 地址 570100 海南省三亚市天涯镇海榆西线黑土村6号

  • 入库时间 2023-06-19 05:57:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-11

    授权

    授权

  • 2018-08-14

    实质审查的生效 IPC(主分类):C12N15/12 申请日:20180123

    实质审查的生效

  • 2018-07-20

    公开

    公开

说明书

技术领域

本发明涉及生物技术领域,具体涉及源于一种深渊新物种的线粒体基因组序列。

背景技术

线粒体是细胞中进行生物氧化及能量供应的重要细胞器。真核生物的线粒体基因组DNA通常为裸露的共价双链闭合环状分子,由重链和轻链两条链组成。线粒体基因组DNA一般由37个编码基因及非编码的控制区组成,其中编码基因包括:13个疏水蛋白基因、22个tRNA基因及两个rRNA基因。与细胞核基因组DNA相比,线粒体基因组具有分子量小、母系遗传、拷贝数多、重组率低、进化速率快等特点,已广泛应用于系统发育及物种鉴定、遗传学、生物地理学、保护生物学等各领域的研究;同时,对于濒危物种及新物种,线粒体基因组亦是一类重要的基因资源。

海斗深渊是大洋的最深处,其深度范围在6000m-11000m。深渊端足类(Amphipoda)是深渊环境中主要生物群落之一,对高压、低温、寡营养源等极端环境具有良好的适应能力,同时,深渊端足类在深渊生态系统的维持中起到重要作用。端足类在节肢动物门中种类繁多,分类关系复杂,对深渊端足类线粒体基因组的研究有利于了解其分类学地位及解析对深海极端环境的适应机制。目前,针对深渊端足类线粒体基因组的研究非常稀少。仅有的一例则是马里亚纳海沟Hirondellea gigas的线粒体基因组序列。中国科学院深海科学与工程研究所利用自制诱捕装置于马里亚纳海沟,于深度10908m诱捕到体长不足1cm的小型端足类,目前,对于该物种的线粒体基因组研究尚未见报道。

发明内容

针对以上现有技术的不足之处,本发明获得了一种深渊新物种的线粒体基因组序列,并结合深渊端足类Hirondellea gigas及非深渊物种线粒体基因组的比较分析,揭示了深渊端足类线粒体基因组的组成、结构特点,明确了该物种独特的分类学地位,为解析深渊端足类适应深渊极端环境奠定理论基础。

本发明采取的技术方案如下:

源于一种深渊新物种的线粒体基因组序列,所述基因组序列如SEQ ID NO:1所示。

优选的,所述线粒体基因组序列通过以下方法获得:

(1)小型端足类基因组DNA的提取;

(2)获取线粒体基因组DNA中12S rDNA,16S rDNA及COI基因的部分序列:

三个基因各对应一对节肢动物线粒体DNA的通用引物,名称分别为12SF,12SR;16SF,16SR;COIF,COIR;

以小型端足类DNA作为模板,进行PCR反应,对扩增产物进行测序,得到12S rDNA,16S rDNA及COI基三个基因的部分序列;

(3)利用步骤(2)得到的序列,进行长片段PCR反应引物的设计,获得COI至12S rDNA的间隔序列与COI至16S rDNA的间隔序列,引物名称分别为:LCOIF,L12SR及L16SF,LCOIR;以小型端足类DNA作为模板,进行LA-PCR反应,对扩增产物进行测序,实现间隔序列的获得;

(4)对步骤(2)和(3)得到的序列进行拼接。

优选的,所述12SF的序列如SEQ ID NO:2所示,所述12SR的序列如SEQ ID NO:3所示,所述16SF的序列如SEQ ID NO:4所示,所述16SR的序列如SEQ ID NO:5所示,所述COIF的序列如SEQ ID NO:6所示,所述COIR的序列如SEQ ID NO:7所示。

优选的,所述LCOIF的序列如SEQ ID NO:8所示,所述L12SR的序列如SEQ ID NO:9所示,所述L16SF的序列如SEQ ID NO:10所示,所述LCOIR的序列如SEQ ID NO:11所示。

优选的,所述步骤(1)为:

1)取3-10mg小型端足类组织冷冻样品,放入到加有WTL buffer的离心管中,将组织剪碎;

2)向离心管中加入蛋白酶K,涡旋震荡15-20s,60-65℃放置6小时以上,离心以除去挂在管壁的水珠;

3)离心管冷却至室温,加入PCP buffer,涡旋震荡25-30s,冰浴5-10min;

4)以13000-15000g的转速离心3-5min,将上清液转移到另外一个离心管中;

5)向离心管中加入300-350μl异丙醇溶液,将溶液混合,冰浴1-2h;

6)以13000-15000g的转速离心3-5min,倒掉上清液;

7)加入700-750μl乙醇溶液,13000-15000g的转速离心3-5min,倒掉上清液;

8)重复步骤7);

9)于无菌环境中将离心管中残余酒精风干10-15min;

10)加入50-100μl无菌水将DNA充分溶解后保存。

更优选的,所述步骤(1)为:

1)取3mg小型端足类组织冷冻样品,放入到加有300μl WTL buffer的离心管中,将组织剪碎;

2)向离心管中加入5μl 20mg/ml的蛋白酶K,涡旋震荡15s,60℃放置6小时以上,离心以除去挂在管壁的水珠;

3)离心管冷却至室温,加入100μl的PCP buffer,涡旋震荡30s,冰浴5min;

4)以13000g的转速离心3min,将上清液转移到另外一个离心管中;

5)向离心管中加入300μl异丙醇溶液,将溶液混合,冰浴1h;

6)以13000g的转速离心5min,倒掉上清液;

7)加入700μl 70%乙醇溶液,颠倒离心管使溶液混匀,13000g的转速离心5min,倒掉上清液;

8)重复步骤7);

9)于无菌环境中将离心管中残余酒精风干10min;

10)加入50μl无菌水将DNA充分溶解后于-20℃冰箱中保存。

与现有技术相比,本发明的有益效果是:

本发明获得的深渊小型端足类线粒体基因组有助于了解深渊物种线粒体基因组特有的碱基组成及结构特点。

通过分析发现:深渊端足类的线粒体基因组蛋白编码基因与非深渊物种相比,其AT skew为-0.204~-0.302,低于非深渊物种(-0.143~-0.176),GC skew为0.200~0.299高于非深渊物种(-0.087~0.082),tRNA序列与非深渊物种相比也呈现AT skew低,GC skew高的特点。深渊端足类线粒体基因组的有效密码子数目(ENC)在31.8~41.8之间,而非深渊物种的ENC范围在36.5~52.3之间,表明深渊端足类对密码子的使用有较强的偏好性。深渊端足类线粒体基因组对非极性氨基酸的使用比例在64.0%~64.5%之间,高于浅海种所对应的比例(61.1%~63.4%),而对极性不带电氨基酸及极性带负点氨基酸的使用比例(25.3%~25.5%;4.0%~4.2%)低于浅海种(25.9%~27.5%;4.0%~4.4%)。深渊端足类22个tRNA中tRNA-Ser(UCU)及tRNA-Val(UAC)具有非典型的tRNA三叶草结构,其D-loop臂消失;大部分非深渊端足类tRNA-Cln(UUG)的TψC臂消失,而深渊端足类的tRNA-Cln(UUG)具有完整的三叶草结构。甲壳动物祖先种Pancrustacea的线粒体基因需要经过一次移位(transposition),两次反向移位(reverse transposition),两次反向变换(reversal)及三次TDRL变换(tandem duplications with subsequentrandom loss)才能形成现有的小型深渊端足类的线粒体基因组,并且其中一次反向变换竟涉及到20个线粒体基因同时参与,该现象在其他端足类线粒体基因组中从未发现。由于反向变换,导致其两个rRNA基因同时位于线粒体轻链中,而其他端足类的两个rRNA基因均位于线粒体的重链。通过系统发育分析,该小型深渊端足类与NCBI中已经公布线粒体基因组信息的端足类均不属于同一超科(图1),表明该物种具有独特的进化地位。

本发明获得的深渊小型端足类线粒体基因组序列是宝贵的深海生物基因资源,其线粒体基因组序列的组成、结构的分析,可对端足类系统发育、种质资源库的扩充及对深渊环境的适应机制奠定重要的分子生物学理论基础。

附图说明

图1为利用本发明得到的深渊端足类线粒体基因组与其他端足类线粒体基因组构建的系统发育树;

图中椭圆中标注为本发明中的深渊物种。

图2为本发明得到的小型端足类线粒体基因组扩增产物的凝胶电泳图;

图中从左至右分别是分子标记物,引物12SF,12SR扩增得到的条带,引物16SF,16SR扩增得到的条带,引物COIF,COIR扩增得到的条带,分子标记物。

图3为本发明得到的小型端足类线粒体基因组扩增产物的凝胶电泳图;

图中从左至右分别是分子标记物,引物LCOIF,L12SR扩增得到的条带,引物L16SF,LCOIR扩增得到的条带,分子标记物。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

1.样品采集:利用诱捕装置对马里亚纳海沟10908m处的深渊端足类进行采集,采集后的样品于-80℃冰箱中进行保存。

2.DNA提取:使用OMEGA biotek公司的SQ Tissue DNA Kit,对深渊小型端足类的基因组进行提取,具体方法如下:

1)取10mg小型端足类组织冷冻样品,放入到加有300μl WTL buffer的1.5ml灭菌后的离心管中,用清洗并灼烧后的剪刀将组织剪碎;

2)向离心管中加入5μl 20mg/ml的蛋白酶K,涡旋震荡20s;65℃放置6小时以上,简短离心以出去挂在管壁的水珠;

3)离心管冷却至室温,加入100μl的PCPbuffer,涡旋震荡30s,冰浴10min;

4)以15000g的转速离心5min,将上清液转移到另外一个无菌的1.5ml离心管中,弃去留有沉淀的离心管;

5)向离心管中加入350μl纯度100%的异丙醇溶液,轻轻将溶液混合,冰浴2h;

6)以15000g的转速离心3min,倒掉上清液;

7)加入750μl 70%乙醇溶液,轻轻颠倒离心管数次,15000g的转速离心3min,倒掉上清液;

8)重复步骤7);

9)于无菌环境中将离心管中残余酒精风干15min;

10)加入100μl无菌水将DNA充分溶解后于-20℃冰箱中保存。

3.普通PCR扩增及测序:对小型端足类线粒体基因组DNA的12s rDNA,16s rDNA及COI基因的部分序列进行扩增,具体方法如下:

用于扩增小型端足类线粒体基因组DNA的12s rDNA,16s rDNA及COI基因部分序列的引物序列为:

12SF:GTA CAY CTA CTA TGT TAC GAC TT

12SR:GTG CCA GCA GYY GCG GTT ANA C

16SF:GAC CGT GCK AAG GTA GCA TAA TC

16SR:AGA TAG AAA CCA ACC TGG

COIF:GGT CWA CAA AYC ATA AAG AYA TTG G

COIR:TAA ACY TCA GGR TGA CCR AAR AAY CA

利用Takara公司高保真酶试剂盒进行上述三个片段的扩增反应:模板为上述提取的深渊小型端足类基因组DNA 50ng,每个反应50μl体系,其中2.0μl浓度为10μM的引物,10.0μl 5×PrimeSTAR buffer(Mg2+plus),4.0μl浓度为10mM的dNTP,1.0μl高保真酶(PrimeSTAR>

12S rDNA的PCR反应条件为:98℃预变性10s;98℃变性10s,48℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

16S rDNA的PCR反应条件为:98℃预变性10s;98℃变性10s,45℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

COI的PCR反应条件为:98℃预变性10s;98℃变性10s,40℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

PCR产物利用1%琼脂糖凝胶电泳进行检测。

4.长片段PCR扩增及测序:

利用Primer Premier5.0软件,以前期得到的12S rDNA,16S rDNA及COI基因的部分序列为模板,设计引物,用来扩增基因的间隔区,引物设计结果如下:

LCOIF:GTG GAA AGT GGA GTT GGG ACA GGA TG

L12SR:CTT ATC TCA AAG AGA GTG ACG GGC AAT

L16SF:GAA CGG GAA TGA ATG GTT TGA CAA T

LCOIR:CAA ATC CAC AGA AGC CCC CCT ATG

利用Takara公司LA Taq试剂盒对COI至12S rDNA的间隔序列与COI至16S rDNA的间隔序列进行扩增反应:模板为上述提取的深渊小型端足类基因组DNA 100ng,每个反应50μl体系,其中5μl浓度为10μM的引物,5.0μl 10×LATaq Buffer II(Mg2+plus),8.0μl浓度为2.5mM的dNTP,0.5μl>

PCR反应条件均为:94℃预变性1min;98℃变性10s,55℃退火12min,循环30次,最终72℃延伸10min。

PCR产物利用1%琼脂糖凝胶电泳进行检测。

5.序列拼接

利用DNAMAN软件对测序得到的各DNA片段进行拼接。

实施例2

1.样品采集:利用诱捕装置对马里亚纳海沟10908m处的深渊端足类进行采集,采集后的样品于-80℃冰箱中进行保存。

2.DNA提取:使用OMEGA biotek公司的SQ Tissue DNA Kit,对深渊小型端足类的基因组进行提取,具体方法如下:

1)取3mg小型端足类组织冷冻样品,放入到加有300μl WTL buffer的1.5ml灭菌后的离心管中,用清洗并灼烧后的剪刀将组织剪碎;

2)向离心管中加入5μl 20mg/ml的蛋白酶K,涡旋震荡15s;60℃放置6小时以上,简短离心以出去挂在管壁的水珠;

3)离心管冷却至室温,加入100μl的PCP buffer,涡旋震荡30s,冰浴5min;

4)以13000g的转速离心3min,将上清液转移到另外一个无菌的1.5ml离心管中,弃去留有沉淀的离心管;

5)向离心管中加入300μl纯度100%的异丙醇溶液,轻轻将溶液混合,冰浴1h;

6)以13000g的转速离心5min,倒掉上清液;

7)加入700μl70%乙醇溶液,轻轻颠倒离心管数次,13000g的转速离心5min,倒掉上清液;

8)重复步骤7);

9)于无菌环境中将离心管中残余酒精风干10min;

10)加入50μl无菌水将DNA充分溶解后于-20℃冰箱中保存。

3.普通PCR扩增及测序:对小型端足类线粒体基因组DNA的12s rDNA,16s rDNA及COI基因的部分序列进行扩增,具体方法如下:

用于扩增小型端足类线粒体基因组DNA的12s rDNA,16s rDNA及COI基因部分序列的引物序列为:

12SF:GTA CAY CTA CTA TGT TAC GAC TT

12SR:GTG CCA GCA GYY GCG GTT ANA C

16SF:GAC CGT GCK AAG GTA GCA TAA TC

16SR:AGA TAG AAA CCA ACC TGG

COIF:GGT CWA CAA AYC ATA AAG AYA TTG G

COIR:TAA ACY TCA GGR TGA CCR AAR AAY CA

利用Takara公司高保真酶试剂盒进行上述三个片段的扩增反应:模板为上述提取的深渊小型端足类基因组DNA 50ng,每个反应50μl体系,其中2.0μl浓度为10μM的引物,10.0μl 5×PrimeSTAR buffer(Mg2+plus),4.0μl浓度为10mM的dNTP,1.0μl高保真酶(PrimeSTAR>

12S rDNA的PCR反应条件为:98℃预变性10s;98℃变性10s,48℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

16S rDNA的PCR反应条件为:98℃预变性10s;98℃变性10s,45℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

COI的PCR反应条件为:98℃预变性10s;98℃变性10s,40℃退火15s,72℃延伸30s,循环30次,最终72℃延伸5min。

PCR产物利用1%琼脂糖凝胶电泳进行检测,如图2所示,其PCR产物片段大小范围在450bp-750bp之间,将扩增的PCR片段送往北京六合华大基因科技有限公司广州分公司进行测序,扩增结果利用blastn程序于Genbank数据库中进行比对,结果发现,三条序列均与节肢动物相似度最高,可以作为后续长片段PCR实验的引物设计参考。

4.长片段PCR扩增及测序:

利用Primer Premier 5.0软件,以前期得到的12S rDNA,16S rDNA及COI基因的部分序列为模板,设计引物,用来扩增基因的间隔区,引物设计结果如下:

LCOIF:GTG GAA AGT GGA GTT GGG ACA GGA TG

L12SR:CTT ATC TCA AAG AGA GTG ACG GGC AAT

L16SF:GAA CGG GAA TGA ATG GTT TGA CAA T

LCOIR:CAA ATC CAC AGA AGC CCC CCT ATG

利用Takara公司LA Taq试剂盒对COI至12S rDNA的间隔序列与COI至16S rDNA的间隔序列进行扩增反应:模板为上述提取的深渊小型端足类基因组DNA 100ng,每个反应50μl体系,其中5μl浓度为10μM的引物,5.0μl 10×LATaq Buffer II(Mg2+plus),8.0μl浓度为2.5mM的dNTP,0.5μl>

PCR反应条件均为:94℃预变性1min;98℃变性10s,55℃退火12min,循环30次,最终72℃延伸10min。

PCR产物利用1%琼脂糖凝胶电泳进行检测,如图3所示,其PCR产物片段大小范围在5.5kb-8.5kb到之间,将扩增的PCR片段送往北京六合华大基因科技有限公司广州分公司进行测序。

5.序列拼接

利用DNAMAN软件对测序得到的各DNA片段进行拼接,最终得到小型深渊端足类的线粒体基因组的长度为13831bp(如SEQ ID NO:1所示),利用blastn程序将该序列于Genbank数据库中进行比对,该序列与端足目中Parhyale hawaiensis的线粒体基因组(登录号:AY639937.1)相似度最高为75%,从而确定该测序方法得到了新的、有效的端足类线粒体基因组。

6.基因注释

参考已经报道的端足类线粒体基因组DNA序列,利用在线工具MITOS及NCBI的Blast查找该线粒体基因组的13个蛋白编码序列,利用在线工具ARWEN及MITOS查找到22个tRNA基因及2个rRNA基因。

7.碱基成分分析:利用DNAMAN软件分别对蛋白编码基因、tRNA基因及rRNA基因进行AT含量分析、AT skew分析及GC skew分析并与其他端足类(Hirondellea gigas、Metacrangonyx longipes、Gondogeneia antarctica、Pseudoniphargus gorbeanus、Pseudoniphargus sorbasiensis、Onisimus nanseni、Brachyuropus grewingkii、Caprella scaura、Caprella mutica、Longipodacrangonyxsp.、Eulimnogammarus vittatus、Parhyale hawaiensis)线粒体基因组进行比较,其中Hirondellea gigas也为深渊种。AT skew=(A-T)/(A+T),GC skew=(G-C)/(G+C)。

通过分析发现:深渊端足类的线粒体基因组蛋白编码基因与非深渊物种相比,其AT skew为-0.204~-0.302,低于非深渊物种(-0.143~-0.176),GC skew为0.200~0.299高于非深渊物种(-0.087~0.082),tRNA序列与非深渊物种相比也呈现AT skew低,GC skew高的特点。

8、密码子及氨基酸偏好性分析:利用在线工具Sequence Manipulation Suite对蛋白编码基因的64个密码子及20种氨基酸进行统计及偏好性分析,利用INCA 2.1软件计算有效密码子数目(ENC),其数值越低表明密码子使用的偏好度越大。

通过分析发现:深渊端足类线粒体基因组的有效密码子数目(ENC)在31.8~41.8之间,而非深渊物种的ENC范围在36.5~52.3之间,表明深渊端足类对密码子的使用有较强的偏好性。深渊端足类线粒体基因组对非极性氨基酸的使用比例在64.0%~64.5%之间,高于浅海种所对应的比例(61.1%~63.4%),而对极性不带电氨基酸及极性带负点氨基酸的使用比例(25.3%~25.5%;4.0%~4.2%)低于浅海种(25.9%~27.5%;4.0%~4.4%)。

9、tRNA结构分析:基于6中得到的tRNA序列利用ARWEN及MITOS在线工具对22个tRNA基因的结构进行预测,并与另外12个端足类的线粒体基因组进行比较。

10、基因重排分析:利用在线工具CREx以甲壳动物祖先种Pancrustacea线粒体基因组的各基因顺序作为参考,推演深渊新物种线粒体基因组各基因顺序的衍生过程,并与另外12个端足类的线粒体基因组进行比较。

通过分析发现:深渊端足类22个tRNA中tRNA-Ser(UCU)及tRNA-Val(UAC)具有非典型的tRNA三叶草结构,其D-loop臂消失;大部分非深渊端足类tRNA-Cln(UUG)的TψC臂消失,而深渊端足类的tRNA-Cln(UUG)具有完整的三叶草结构。甲壳动物祖先种Pancrustacea的线粒体基因需要经过一次移位(transposition),两次反向移位(reverse transposition),两次反向变换(reversal)及三次TDRL变换(tandem duplications with subsequent random loss)才能形成现有的小型深渊端足类的线粒体基因组,并且其中一次反向变换竟涉及到20个线粒体基因同时参与,该现象在其他端足类线粒体基因组中从未发现。由于反向变换,导致其两个rRNA基因同时位于线粒体轻链中,而其他端足类的两个rRNA基因均位于线粒体的重链。

11、系统发育树的构建:利用muscle软件,将6中注释得到的13个蛋白编码基因与另外已报到的12个端足类线粒体基因组中的蛋白编码基因分别进行比对;利用DAMBE去除碱基替换饱和的基因;利用Gblock软件将未饱和的基因中比对效果不好的区域进行去除,并将各基因的比对结果进行连接;利用Jmodeltest预测构建系统发育树的最优模型,根据预测结果,利用raxml GUI软件中的GTR+G模型进行系统发育树的构建(如图1),bootstrap值为1000。

通过系统发育分析,该小型深渊端足类与NCBI中已经公布线粒体基因组信息的端足类均不属于同一超科(图1),表明该物种具有独特的进化地位。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。

序列表

<110> 中国科学院深海科学与工程研究所

<120> 源于一种深渊新物种的线粒体基因组序列

<160> 11

<170> SIPOSequenceListing 1.0

<210> 4

<211> 13831

<212> DNA

<213> 深渊端足类(Amphipoda)

<400> 4

gtagcataat catttgtttt ttaattaaga acgggaatga atggtttgac aataataaac 60

tttaattttt tttaaagtca aaaaattttt agtttaagta aaaatgctta aataaattag 120

agggacgata agaccctaaa agcttttttt aggcaataat ttaaaagtaa ttttatttag 180

ataaaattaa ctggggaagt agttatttat atataataat ttattttaca gaaaaaatgg 240

tatatgatct tttaaataag aataaattga gttagttact ttagggataa cagcataata 300

gttttgaaga gttcttattt ataaaactga ttatgacctc gatgttgaat taaaaattct 360

taacaaggaa aaaggtgtta gagaaggttt gttcaacctt taaattttta catgatttga 420

gttcaaaccg gtttaagcca ggttggtttc tatcttttaa acataacaaa tttattttag 480

tacgaaagga ttaaataatt tttatactat actatattgg cagaagtatg tgatagggtt 540

aggtcctagt aaagagatta tttattctca tgtagtaata tttttagtat taaaagtaat 600

tattagatat ggttttttgg ttatttgtgt tttattgaga gtggcaattg ttactttaat 660

ggaacagaaa attattgggg catctcaagt acgtattgga cctaatgttg taggatactg 720

aggattatta cagccttttg cagatgctgt aaaattattt tttaaagagg gattaattcc 780

tcttataaga tttaatttaa tgatttattt tatttccccg gcagttatat tattattagc 840

tttattattt tgggttttat acccgtatat tactggtggt atagactata aactaggggt 900

tttatgattt ttatgtatta gaggtttggg ggtatatcct attttaaggg ggggttgggt 960

gtctaattgt aaatattctt tattaggtag attacgaaga gttgctcaaa taatctctta 1020

tgaagtaaga ttattattaa ttttattaag gatgatttga tgttttaata cttatgattt 1080

attattaatt ataaaaagtc agatatatat ttgggcaggt attatgttta tacctttaat 1140

aatagtttgg ttagtatcta gtctagctga gactaatcgt tctccatatg atttttcaga 1200

aggagaatct gaattagttt ctggatttaa tacggaatat tcggcaggtg ggtttacttt 1260

gatctttata agggaatata gaaatatttt attcataagc ttattatttg taatgttatt 1320

ttttaggaga gagtttaatt gattttcggt aataaaaggt atattagtta tatatttgtt 1380

tgtatgagtg cgcactagtt atcctcgtta tcgatatgat aaattaatat atttagcttg 1440

aaaaaagttt ttgcctttta ttttaatgag gttcattttt ttttttttgt taagttagta 1500

atgataagtg ttgagtataa tttcaaaaaa tagttttaag ctaaaaatat taattttggg 1560

aattaaagat atatatttat ttttttgaat tatagtgtat tttaaaatga cacagtttta 1620

taatgtttaa aattaatata atctataaat tttgggggta tagattaagg gtatttttat 1680

tattttcatt gtgggggtat atacattttt gtttaaaaga gtataggtga tttattgaat 1740

gggaaatttt tagtttaagg ggagtgcata ttactgtaag attaattttt gattctataa 1800

gatgtatttt tttgagagta gtaattttaa tttctattag tattttatat tataggattt 1860

attatataag tggagataaa agggtgcttc gatttatttt attaatatta ttttttattg 1920

gttcaataat tattttaatt attaggccta atttaattag tttattgtta ggttgagatg 1980

gattgggatt aacttcttat ttattagtga tttattatca aaatgaagca gttagatctg 2040

ctggaatgtt gactatttta agtaatcgta ttggagacgt ggccatttta atagctatta 2100

gtttgttatt tgtgaagggg agttgaaatt ttatattatt atcttattat gactatatgt 2160

ttgggttatt aattatttta gctggtttaa ctaagagagc acaaataccc ttttcagcat 2220

gactacccgc ggctatagcc gcgcctactc ccgtatcagc cttggttcac tcttctactt 2280

tagtaacggc tggggtttat ttattaatcc gatttaatga tattttaata aataaatatt 2340

taatattatt attaacagta gtcgcaatta ttactatatt agtatccggg ataagagcta 2400

ttatagaaag agatttaaaa aaagtagtgg ctttttcaac tttaagacaa cttgggctta 2460

taatattaac attaagttta ggttatagaa caatagcttt ttttcatctt ttaactcatg 2520

ccttatttaa atctacttta tttatatgtg cggggtatat aattcattgt ttatctaata 2580

gtcaagatat tcgtaaattg tcagggttaa atttttatgc cccagtgtta ataagagtgt 2640

ttaatgtaac taattttgct ctgtgtggta taccattttt aacaggattt tattctaaag 2700

atacgatctt agaaatttta tttagtcatg gaatgaggtt tattctttta atattaacat 2760

gatttactac atgtttgact cttatttata gcttacggtt tatatattta agagttaatt 2820

ttgttcctaa cttagtatta gttatatgta ataggttaga aatatattta gtacaaggaa 2880

ttttattact atttttttta agtgtagtag ggggtagaag tcttatgtgg ttaatatttc 2940

cagtaaaagg aattagaatt ttattgggag gaataaaata tatagtatat gggggcatgt 3000

taataggggg aatatcgtta ataatgaaaa aaaaaacttt tttaaaaatt tatagtgtat 3060

ataattatgt tttttttagg agtatttgat atactccctt ttttaggggt caatttttta 3120

ctgggcaatt tttaagaagc ggcggaataa gggataagat tagagattca ggttgattag 3180

aattatacgg ggctcgtgga ggacaatcta aacttgtttt tttaagggct tatggtcaat 3240

taagtcagat aagtattttg gtaagaacat ttttttttag ttttatattt tgggggttag 3300

ttatctatat atgagtttag tttaaataac ttaatgagag tattatattg aagttgtaat 3360

tgtgattttt tatctttaga caatatttat attaattttt aaaaattttt tagctttatc 3420

ttgaaaggat aatgtgttta tatttacact ataaaaataa ttagttaaga taatattatc 3480

aataagatta ttaacaataa tctacctcta tttggtttta aactagtaag ataaaacgat 3540

taatcgcttt aggcagatta gaaatctgat ttatatttat cttaaaaaga gattagtctg 3600

taaacatttt ttaagtgcaa attaaatatt tttattaaat tatagtctct aagttgttat 3660

aggatgattt agtttaatag attaatagtt aattttatta actttaaaaa tcaaaatttt 3720

atgtgctcgt tacactaaac taatcaataa tataattcta attaaaagtt ttttcaagtt 3780

tgcaacttga cgtgttagat ttaatacact atagaatata agatttttaa ttatagaata 3840

taataattca tttataagtt tacaacttac tatctagttt tcgatcatat aattttgttt 3900

ataaagtgcc tgaggattaa agggctattt tgatgtaata gagatgtagt aattaccttt 3960

ataataaaag ataagctaat ttaaagctta tgggttcata cctcatttat gagtaatttc 4020

tcttttaata ttttttttca tcctgttaat attttattta taggaacatt aattttttct 4080

ttatgtttaa tcttttctat aaacacatga gttatagtgt ggttaggatt ggaacttaac 4140

cttttatcgt ttattcctat tatattaaaa aaaaataata agtataatgt agaagcggga 4200

ttaaaatatt ttttaattca atctcttggt tcaatatatt tattaatgag atttattttt 4260

ggatttttaa tatttagtaa gggagttaga ttttttattt tagtagctct gtttataaaa 4320

atgggggcgg ctcccactca ttcttgattt ccgtctgtta ttgaaggatt gacatgacct 4380

catgcttttg ttttaatgac gttgcagaag ttaggacctt tgtctttaat cccttttgta 4440

ttgatgaatt caagatcatt ttatattgtt tatttttatt tggtttcatc ggctcttgta 4500

ggtgctgtaa taggtcttaa tcagtcttct ttacgtaaga ttttagcttt ttcttctatt 4560

aatcatacag gctgaatatt agcttgttgt tgtttaacta agctgtattg aattatttat 4620

attttagtgt atagacttat tttggtacct attattctag tattgtataa attacaatta 4680

ttttttatta atcatgtatt taagattcct aatttttttt ttaacattat atttagggtt 4740

tcatttatat ctttaggagg tttacctcct tttacagggt ttatattaaa attgttagta 4800

gtaaaggaat taattaattt tataactaat tattttattt tatttatttt gttgttttca 4860

tcttttttta gtttgtttta ttattttcgt ttaatacttt attattttat actttcgttt 4920

acaaatagga ttaatttttt tttttttaat aagttttctt tctttttagt tatgttgaat 4980

gtgtcaggta tttttatttt ggtttttttt tattttattt aataaatttt aagttataaa 5040

aaactataaa ccttcaaagt ttaaaatgag agtattctta agtttaaatt ttagggcgat 5100

gatttttttc taccaatcat aaagatattg ggactcttta ttttatttta ggggcatggg 5160

ccagtgcgtt aggtacttct ttaagagtag ttattcgatc agagttaata actccaggat 5220

ttttaattgg agatgatcaa atctataatg tcattgtaac tgctcatgca tttgtgataa 5280

ttttttttat ggtaatacct attatgatcg gagggtttgg aaactggctt atccctttaa 5340

tattgggaag tcccgatatg gcatttcccc gaataaataa tataagattt tgattacttc 5400

cacctgctct atctttgtta atattgagtg gattagtgga aagtggagtt gggacaggat 5460

gaactgtcta tcctccctta gctagggcag tagcccatag gggggcttct gtggatttgg 5520

caattttttc attgcatttg gcaggagcgt cttctattct cggggctgta aattttattt 5580

caactgtgat taatatacga agcccgggta taacgtggga acaagttcct ttgtttgtgt 5640

ggtcagtttt agtaactact gtcttgttat tattatcttt acctgtattg gcaggggcaa 5700

ttactatatt attaacagat cgaaatttaa atacttcatt ttttgatcct tcgggaggtg 5760

gagatcctat tttatatcaa catttatttt ggttttttgg ccatcctgaa gtttatattt 5820

tagttttacc cgcttttgga atagtatctc atgtagtaac ccatgaagct agaaaaaaag 5880

aaacgtttgg tactttagga ataattcatg ctatattggc aattggtatt atagggtttt 5940

tagtgtgggc acatcatata tttacggtag ggatagatgt tgatactcgg gcttatttta 6000

cctctgccac tatattaatt gcagtaccta cagggattaa agtatttagt tggttgagga 6060

ctttgcaggg gggtaaattg tatttatctc cacctttatt atggtctttg ggttttattt 6120

ttttatttac tgtaggtggc ttaacaggca ttattttggc aaattcttca ttagatattg 6180

ttttacatga tacttattac gtagtagctc attttcatta tgtattatct atgggggcag 6240

tgtttggaat ttttactggg ttattttatt gatacccact tataaccggt ttagtgttta 6300

actcaaagtt tacaaagcct catttttttt taatattttt aggagtaaat ttaacatttt 6360

ttcctcagca ttttttaggg ttgtctggaa tacctcgtcg ttattcagat tatcctgatt 6420

ctttctcttg ttggaatatt gtctcatcta taggtagtac tttgactata atttctttta 6480

ttttatttat tattatatta ttagaatcta taatttctcg acgtgaagta ttatttaagt 6540

tttatttatc tacgtctttg gagtgaactc atagatatcc tcctgctgat catagttatt 6600

ctgatttacc actattaact aatttttaaa atggcagatt agtgcattag ggttaagttc 6660

tataaatgag atatttctct tttaaaaata gctacatggt ctatattaag gtttcaagat 6720

acggcttcac ctgttatgac acaattaata atattttatg attttgtaat gattgtagtt 6780

attataatta tgactgtggt tggtttgatt ataatattta tagtaaggta taaatttact 6840

aataagtata tacttcaaga acaatgggta gaaacaattt ggactatttt acctatgcta 6900

gtcatgtttg ttattgtatt acctgctttt cgtactcttt atttattgga cgatccgttt 6960

atgtctaggt taaccctaaa aactacggga catcaatggt attgatcgta tgaatattct 7020

gattttccaa atgtggagtt tgactcttat atagttccta aggaattaag tttaaatcgt 7080

ttgttagatg tagacaataa tactatttta ccagtataca ctcaggtacg ggtaattttg 7140

tctagtacag atgtaattca tgcatgaacg gttccggcat taggtattaa gtcagatgcc 7200

gtaccggggc ggttaaatca agttttattt tttattgacc gattgggaaa ttattatggt 7260

caatgttctg aaatttgtgg agcaaatcat agatttatgc ctattaaaat tgagtctact 7320

tttataaaaa attttttaag ttggttatca catatatttt ttttaggtga ctgaattaag 7380

tgtaaatctt ttaaatttat tatagtgttc aatttagcac ttctaaaaaa ttagttaatt 7440

attataatat tagtttgtca gactaaagtt actcgggagt atttttttat ccctcaaata 7500

agacctatat tgtgagttcc tattactata tttgtgcaag ttagatttct aagttttgta 7560

tttattattt atttttatgg ttatgtgagt atatttgatc aacaaagtgc atctgttagg 7620

gttattaaaa gagttataag atgataagaa atctgttttc aatttttgat ccgagaacta 7680

cgtttttttt aagtttaaat ttgtgttcga cggttatttt tttattgttt tttccaagat 7740

tagtaatggt tatatcttct cgttatagat ctttttattt tggcttatta aattatttaa 7800

agagagaata tttgccatta aggttaaagg ttccatattt tgtattattt tttgtttctt 7860

tatttatatt tattatattt aataatgtat taggattatt tccatatatt tttacagcta 7920

caagtcatat atctttttct ttagcattag cgctacctct atgattaggg ttgatatttt 7980

acggatgaag aagaaatata tataatttat tcgcacattt aattcccgta ggaactccgg 8040

cggttcttgt ttcttttata gttttaattg aaacagtaag aaatattatt cgtccaggta 8100

cgttagctat tcgattgagg gctaatatag tagctggaca tttgttaatt acattattga 8160

ggtcttcaac tcctattact ccttgaggag tgttgccact tttagttggg gctcagttgg 8220

ctctaagaat actagagatt gctgtggcga taattcaagc ttatgtcttt agaattttga 8280

ttacattata cacaaatgaa gtaatttaat gataaattta ttacataatc acccttttca 8340

tatagtcgaa aagagccctt gaccagttat tgcttcgtta aatgcttttc ttataactac 8400

tgggttggct agtcttttcc acagaaaaaa tagttttatt ttaatattgg gattggtttc 8460

gatacttatg gctagttttc aatggtgacg tgatattagt cgagaaagga cccatcaagg 8520

attacatact ataaaagttc agacaaattt acagtttggt ataatcttat ttattgtatc 8580

agaagtaata tttttttttt catttttttg ggcctttttt catagtaggt tggttcctac 8640

agatgtttta gggggagtat gacctcctat tttggtaatt ccttttaatc cttttcagat 8700

tcctttatta aatacagcca ttttattatc tagaggtgtt agagtcactt gggcccatca 8760

ttctttaatt aggggtaatc attctcaagc cttacagggt ttatgtttga ctgttttttt 8820

aggattttat tttacgattt tacagttgat cgagtatata gagtctagat tttcgattgc 8880

ggattcagta tatggggcaa ctttttttgt ggctactgga tttcacggat tacatgttat 8940

tatcgggtct atatttttat ttgtgtgtac actgcgtcat tttataaaac atttttcttc 9000

taatcatcat tttggggtag aagcggctat ttgatattgg cattttgtag acgtggtttg 9060

gttattttta tttgtgtcta tttattgatg aggatgttaa tttctttagt ataataagta 9120

cagatagttt ccatttataa agttaaaagt taaagaaata atttatacag ttttaagagt 9180

taggttattt tctttcattg tggcgtatgg tattatatta ttagcattga tgttagggat 9240

taagtcaaaa aaaacacggg agaaattatc ttcttttgag tgtgggtttg atcctatgac 9300

taaagtacgg gccccctttt cgttaaaatt ttttttaatt acaattattt ttttaatttt 9360

tgatgtagaa attgctctat tattaccatt gggggttgtt atagattctc tttcttatat 9420

ttatttgagg gttacttgct tatttattat tttaatttta attgttgggt tattccatga 9480

gtggaatgag ggggccttag attgaaacta ttaaaaatca aaagtaaaaa ttacattcag 9540

tttcggtttg aaaatattag atattatcta ttgatttaaa ttgtatattt taaactttaa 9600

agtgttttta tttccacaaa ataatgattt aataattaat ctattaaaat agattatata 9660

atgagatctg tgcatatgat taataatcct aagaggcttc agtgcaagaa tgagataaaa 9720

tggtttatta ggtagtttat gttatattta ttatgaaaaa aaattctttc accatgttga 9780

gatatggaaa acaggtaaag cctgtaggcg gccctaaaaa atgaaatacc cctcagaaga 9840

gcaattcttg taatttctca attgattata ctaataaata aattaatttc tcctaaaagg 9900

tttactgtgg gaggggcggc catattactt gcgagtaata aaaatcatct aagggacaaa 9960

ctaggtatta tgtttattat tcccttacta aaaattattc tgcggctatg agtacgctca 10020

tatactaaat tagctaaaaa aaaaagtccg gcagaacata gtccatgtcc tactattaca 10080

catattctac cttttagtcc tcaatcattt agggttagta gtcctcctaa acagaggcct 10140

atatgaacca ctgaagaata ggcaataata gattttatat ctattattcg taaacaattt 10200

aacctaataa taattcctcc tcatagactt aaagacaaaa aaaaaataaa aaggatggag 10260

ttagtttcta ttaaaattga aaatatacgg attaggccat agcctcccag ttttagtaaa 10320

atacccgcta aaattattga gcctgcaacg ggggcttcta cgtgggcttt aggaagtcat 10380

aaatgtacta tgtatatagg aaattttatt ataaacgcaa gtacaaagaa aattgtccac 10440

actaatttta tttttaaaat aaaaaaaaaa taatcatgac caatattagt tttaattcat 10500

aagatggtca ttagaagggg taatgaagct aaaaaagtgt aaaaaaatat atagatcccg 10560

gcacggatac gttctggctg atagccccac cccagaatca agaaaaatgt tggaatcaac 10620

gatagttcaa atattatata aaataataaa taattggaaa aagaaaatct tataattaag 10680

gttaataata agattacaca ggttaaacta aatatagtta taaaattatt gtatcattta 10740

atttttactc tactgaaaat agataaaata atgattcata ctcttaggat gattagaact 10800

ttgtttactc aatcaatttc attgtatatt ataactacta atctatagtc atttcttata 10860

ataaggagga ggattataac taatattata attaatagta attctcctca gaaggagcct 10920

aatcatagta gggtaattaa tgaaatataa aactttaaca tataaggaca tctaatcttt 10980

ttaaatagtc tgaggaatat ctaaagatca ctacaactaa tagtactagt cctagtactc 11040

cttctcttac tattagtact agtaagtata aggaaaaata attttctact cctaaatata 11100

aaaatcttaa aaaaagtcct ataaatagac ctaatgaaat aaattctaat cttaggagtc 11160

tgtttaataa atggttataa tttaaaatta aactcacaat tcccgctata gagatataaa 11220

ttcagatatt taatacacag aacattttaa gataaatgaa taagtaattg tagtttttat 11280

agtttaacaa aaacattaat tttgtatatt aaaattagat tttttcttaa aaattagctt 11340

tattatatat ttttttttac ttttaaatat gtctttaatg tttatttata ctgtaggtcc 11400

tttaggtctt gggttaatta ttgtaattca gacacttttt atctcggggg cgttatttat 11460

agttaggact ataacttgat tttcttatgt gttaattata atttttttaa gtggtataat 11520

agtgttattt atttatgtag cttgtttagc ttctaatgaa atagtttcta tctcttattt 11580

taatataatt actggaggag tatttagggg ggtgtttagt atttatattt gaagtaatca 11640

agagagagaa gatatgccgt tagttggtat aaattttttt tatgaggggg tttcttctag 11700

attggtgtat aaagttttct ctgagatagt tgtactaata tcatttttta tgatcttata 11760

tctgttattg gttttaattg tttctgtcta tatttcttat ttatctaaag ggcctataca 11820

aataaaaatt taatgatagt taataatact acaactcata atccgtcaat tttaagtata 11880

aaccacatat taataaattt accggcccct attaatttgt cttttatatg gaatttagga 11940

tttatattat ttaggtgttt gattattcaa gtaattactg ggttggtttt agcttcatac 12000

tatgccccta gtgcagaatt aaggttttat agtgtaaggt taatggttga attcactgaa 12060

tttaattgat tagcccggag tattcatgct aatggagcga cacttttttt tttttttttg 12120

tatattcata tagcccgggg catttattat cattcgtatg gtttggtata tacgtgaata 12180

gtgggagttg tgattttaat cttagtaatg gctacagctt ttataggtta tgtgttaccc 12240

tataaccaga tgtcttattg aggggcgtca gttattacta acttattttc agaagttccg 12300

tatattggga aagatttagt acgtttaatt tgggggagtg cgtcagtgag ggatcctact 12360

attactcgat tttttacgtt ccattttata ttaccttttg taattatggc tatgactata 12420

gtgcatttaa attatttaca tctaagaggt tcaaggaatc caattggggt tacggtaaaa 12480

aaaggtttat ttcatttatc ttcgtctttg aaggatgtta ctcttttaag agttataata 12540

ttaattttta tgtttatttt tatattttta cctttgctgt ttagggataa tgataatttt 12600

gttatagcag actctttagt gacacctaat catattcagc ctgaatgata ttttttattt 12660

gcttatgcaa ttttacgttc tattccaaat aaattagggg gggtaattgc tctaggtatg 12720

tctatcatag tttttttttc tttaccttat acaggtactt atataagtaa gagtaaatat 12780

gtttttattt cggcaaaggc ggttttttgg tgatttattg tgattgtcat tttgttaact 12840

tgggcagggg cttgtcctgt ggaggatcct tatattgtta taagtcagat gttaactttt 12900

gtgtattttt tatattttgt tctaaacccc cttttttttc caaagtgata aaaggtttat 12960

aattattaag tttaaataca tatgttttga aaacataaat aagaatatat ttctattaat 13020

ttttattaaa ggttagagta tatttatctt taattaagta tttattttta ttgaggtaaa 13080

atttatttta tggataagta tattataaaa atagattttt atttaaggta tacatataca 13140

ataaaaaaaa aattaattct tgctaaagat taagtaataa gatgagagat ataaaaaatt 13200

tttgttcttt tagttaaata tagattatta aattttgttg ttgaaggtgt caggttcttt 13260

ttattatatg taaatagttt aggtattttt attaattagt agtaaaattt gtgccagcaa 13320

ctgcggttag actaatacta aattaatttt tttaaagata tagttaataa attaaaataa 13380

tgtagtatat tttattggtg aaatgaaatt ttgtatattt aaataatatt ttatatgaga 13440

gatataataa aactaggatt agatacccta ttataaataa aaaattaaaa gagtatagat 13500

aaaataaaag aatttggcgg ccttagaagt ctatttagag gaacttgttt tataatcgat 13560

aatcctcgag ataaataact ggtttttttt ttatataccg ccatttaagc atttttttaa 13620

aaaaaagttt atttagtttt taaaaaatag gtcaaggtgt agatatgagt cagtaaaaat 13680

tagttacatt ataaattaat aagcggaatg ttgattagtt atttggcata aagtaggatt 13740

taatggtaaa ttattaaatt atatttaatt gaaatagcgc tttttggtgt acaaattgcc 13800

cgtcactctc tttgagataa gtcgtaacat a 13831

<210> 2

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gtacayctac tatgttacga ctt 23

<210> 3

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gtgccagcag yygcggttan ac 22

<210> 4

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

gaccgtgcka aggtagcata atc 23

<210> 5

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

agatagaaac caacctgg 18

<210> 6

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggtcwacaaa ycataaagay attgg 25

<210> 7

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

taaacytcag grtgaccraa raayca 26

<210> 8

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gtggaaagtg gagttgggac aggatg 26

<210> 9

<211> 27

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

cttatctcaa agagagtgac gggcaat 27

<210> 10

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

gaacgggaat gaatggtttg acaat 25

<210> 11

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

caaatccaca gaagcccccc tatg 24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号