首页> 中国专利> 调节EIF4A3表达以调控肝癌细胞增殖能力的应用

调节EIF4A3表达以调控肝癌细胞增殖能力的应用

摘要

本发明涉及一种调节EIF4A3表达以调控肝癌细胞增殖能力的应用,通过生物信息学分析EIF4A3在肝癌的作用及探索与EIF4A3相关基因富集的通路和功能,随后预测并构建了EIF4A3参与肝癌细胞增殖的综合调控网络。在以上基础,以肝癌细胞系LM3和Hep3B为来源构建干扰EIF4A3表达的细胞系,进一步阐明干扰EIF4A3表达对肝癌细胞增殖的影响,有助于在肝癌进展中的作用提供了新的见解,并有助于确定该疾病的潜在治疗靶点,为EIF4A3应用于基因工程、肿瘤学及在临床上肝癌的诊断指标和治疗靶标提供可靠的理论依据。

著录项

  • 公开/公告号CN113025718A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 叶甲舟;

    申请/专利号CN202110421241.3

  • 申请日2021-04-19

  • 分类号C12Q1/6886(20180101);C12Q1/6858(20180101);G16B30/00(20190101);G16B40/00(20190101);

  • 代理机构44214 广州市红荔专利代理有限公司;

  • 代理人胡昌国

  • 地址 530000 广西壮族自治区南宁市河堤路71号

  • 入库时间 2023-06-19 11:37:30

说明书

技术领域

本发明涉及生物信息学技术领域和基因工程技术领域,公开一种调节EIF4A3表达以调控肝癌细胞增殖能力的应用,具体涉及一种调节EIF4A3表达以影响肝癌细胞增殖的分子机制及应用。

背景技术

原发性肝癌是全球癌症相关死亡的第二大原因,原发性肝癌包括肝细胞癌(Hepatocellular carcinoma,HCC,以下简称肝癌)、肝内胆管癌(ICCA)和其他罕见的肿瘤(Sia D,Villanueva A,Friedman SL,et al.Liver Cancer Cell of Origin,MolecularClass,and Effects on Patient Prognosis[J].Gastroenterology,2016,152(4):745.)。肝癌是我国死亡率最高的消化系统肿瘤,肝癌的早期治疗极其重要,然而患者常常被发现时已经是肝癌晚期,索拉菲尼是治疗晚期肝细胞癌(HCC)的靶标药物,然而其总体效果却不佳,报告出严重的不良事件及患者出现对索拉菲尼的耐药(Zhu Y J,Zheng B,Wang H Y,etal.New knowledge of the mechanisms of sorafenib resistance in liver cancer[J].Acta Pharmacologica Sinica,2017,38(005):614-622.)。肝癌的晚期治疗极其有限,虽然已经涌现了一批靶向治疗肝癌药物和免疫药物,但是由于其高昂的治疗费用与其不理想的治疗效果,使得许多患者望而却步。肝癌细胞过度增殖是肝癌难以治愈的原因之一,因此亟需寻找影响肝癌增殖的机制,将会为治疗肝癌提供坚实的理论基础。

外显子连接复合体(EJC)是一种蛋白质复合物,通过剪接而在mRNA的外显子-外显子连接处组装。EJC蛋白在剪接后事件中起着重要作用,包括mRNA输出、细胞质定位和无意义介导的衰变。EJC可能参与提高剪接mRNA翻译的效率(Hl.W,Sh.L,Br.C.Exon junctioncomplexes mediate the enhancing effect of splicing on mRNA expression[J].Proceedings of the National Academy of ences,2003,100(20):11327-11332.;Dreyfuss G,Kim VN,Kataoka N.Messenger-RNA-binding proteins and the messagesthey carry.[J].Nature Reviews Molecular Cell Biology,2002,3(3):195.)。最近的证据表明mRNA的翻译也受转录体剪接历史的影响。EIF4A3是一个Dead-box RNA解旋酶,是一种依赖ATP的RNA解旋酶,也是翻译起始因子EIF4A家族的成员,是EJC的一个新的组成部分(Chan C C,

肝癌细胞过度增殖是肝癌难以治愈的原因之一,因此分析EIF4A3促进肝癌细胞增殖的机制能为治疗肝癌提供理论基础。

发明内容

为解决现有技术的问题,本发明通过生物信息学分析EIF4A3在肝癌的作用及探索与EIF4A3相关基因富集的通路和功能,随后预测并构建了EIF4A3参与肝癌细胞增殖的综合调控网络。在以上基础,以肝癌细胞系LM3和Hep3B为来源构建干扰EIF4A3表达的细胞系,进一步阐明干扰EIF4A3表达对肝癌细胞增殖的影响,有助于在肝癌进展中的作用提供了新的见解,并有助于确定该疾病的潜在治疗靶点,为EIF4A3应用于基因工程、肿瘤学及在临床上肝癌的诊断指标和治疗靶标提供可靠的理论依据。

本发明通过以下技术方案进行实现:

一方面,本发明提供一种调节EIF4A3表达以影响肝癌细胞增殖的综合调控网络的构建方法,包括如下步骤:

(1)数据处理:从癌症基因组图集数据库中下载肝癌数据,并对这些肝癌数据进行预处理;所述肝癌数据包括基于Affymetrix人类基因组U133a阵列平台的RNA_Seq的基因表达谱、甲基化的基因表达谱、SNP的数据和CNV的数据;

(2)差异表达分析:对肝癌数据分别在EIF4A3低表达的样本和EIF4A3高表达的样本中的情况进行差异表达分析以寻找与EIF4A3表达相关的基因;

(3)加权基因共表达网络分析:提取在EIF4A3低表达的样本和EIF4A3高表达的样本中分别低表达和高表达的mRNA,执行WGCNA以探索与肝癌相关的模块;

(4)构建综合调控网络:对与表型相关性最大的模块基因进行功能富集分析,构建调节EIF4A3表达以影响肝癌细胞增殖的综合调控网络。

进一步地,所述数据处理步骤如下:

在CNV数据中有375个肝癌样本和391个对照样本,对CNV数据进行基因注释,将拷贝数位点转换为基因symbol,以供后续分析;

在肝癌甲基化的基因表达谱数据中有380个肝癌样本和50个对照样本,使用R软件包ChAMP进行甲基化阵列分析,对数据进行过滤,随后用函数champ.norm对数据进行标准化处理,最后计算差异甲基化;

所述SNP的数据总共有387个样本,其中包括345个肝癌样本和42个对照样本,使用MATLAB2018b软件计算出SNP位点的Pvalue值,查看基因突变的显著性;

在所述RNA-seq的基因表达谱的数据中总共有387个样本其中包括345个肝癌样本和42个对照样本。

进一步地,所述差异表达分析的步骤如下:

使用perl语言对肝癌的CNV数据进行正常样本比肝癌样本的差异表达分析;

使用R软件包limma对RNA表达谱数据进行差异表达分析;进一步地,基于背景集Homo_sapiens.GRCh38.98.chr.gtf提取mRNA和lncRNA表达谱,并且与健康对照相比,对肝癌样本进行差异表达分析;进一步地,limma包中的normalize Between Arrays函数被用来对表达谱进行标准化;进一步地,当某一个RNA对应多个探针,则选择这些探针的平均表达值作为该RNA的表达值。

进一步地,所述加权基因共表达网络分析包括如下步骤:

使用hclust函数对提取的与EIF4A3显著相关的上调和下调的7574个mRNA进行层次聚类分析;利用pick Soft Threshold函数筛选模块构建过程中的软阈值功率值;用候选功率检验不同模块的平均连通度及其独立度;WGCNA R包用于构建共表达网络;最小模块大小被设置为30,并且每个模块被分配一个唯一的颜色;基于string数据库,构建了蛋白质互作网络,只保留了与联合得分>500的交互作用。进一步地,所述候选功率为1~30。进一步地,当独立度>0.9时,选择合适的功率值。

进一步地,所述构建综合调控网络包括如下步骤:

应用clusterProfiler包对与EIF4A3表型相关性最大的3个模块的1619个mRNA进行功能富集分析,以探索模块基因参与的功能和信号通路;

应用基因集富集分析(GSEA)探索富集在肝癌样本和EIF4A3高表达样本通路,并对通过基因集变异分析(GSVA)获得每条通路在肝癌样本和EIF4A3高表达样本的GSVA评分;在肝癌样本具有高GSVA评分的通路可能是参与肝癌发生过程的通路,在EIF4A3高表达样本中具有高GSVA评分的通路可能是被EIF4A3影响的参与肝癌的通路;

基于RNAInter数据库提取能够调控EIF4A3的lncRNA,结合富集结果获得的通路构建了lncRNA靶向EIF4A3介导的影响肝癌细胞增殖的综合调控网络。

另一方面,本发明提供一种调节EIF4A3表达以调控肝癌细胞增殖能力中的应用,包括如下步骤:

步骤A:构建稳定感染的敲除EIF4A3细胞系;

步骤B:构建稳定感染过表达EIF4A3基因的细胞系;

步骤C:检测干扰EIF4A3基因表达对肝癌细胞的增殖能力的影响。

进一步地,步骤A的过程如下:针对EIF4A3序列设计shRNA,构建EIF4A3干扰慢病毒质粒并包装慢病毒;制备重组EIF4A3-shRNA慢病毒;在LM3细胞感染敲除EIF4A3基因的慢病毒载体,获得稳定感染的敲除EIF4A3细胞系。

进一步地,所述稳定感染的敲除EIF4A3细胞系制备步骤如下:

(1)将核苷酸序列如SED ID NO:1所示的的shRNA模板连接至序列如SED ID NO:2所示的慢病毒载体,获得EIF4A3干扰慢病毒载体;

(2)利用EIF4A3干扰慢病毒载体包装制备序列如SED ID NO:3所示的EIF4A3干扰慢病毒;EIF4A3干扰慢病毒感染肝癌细胞株,培养感染后细胞,用抗生素进行筛选,获得稳定敲低EIF4A3基因的细胞株。

进一步地,所述包装的条件为:室温混匀20min,转染20h,收集。

进一步地,所述连接的条件为:22℃连接1h。

进一步地,所述慢病毒载体为hU6-MCS-CMV-zsGreen1-PGK-puromycin;所述抗生素为嘌呤霉素。

进一步地,所述肝癌细胞株选自LM3细胞。

进一步地,所述方法还包括利用qRT-PCR和western blot方法对所得稳定敲低EIF4A3基因的细胞株中EIF4A3表达量进行验证。

进一步地,步骤B的过程如下:利用CMV-MCS-3XFlag-PGK-Puro载体构建了标记EIF4A3的表达质粒,并将该质粒转染293T细胞;利用这些细胞的重组逆转录病毒多重感染感染肝癌细胞系Hep3B,使细胞感染过表达EIF4A3基因的慢病毒载体,以获得稳定感染过表达EIF4A3基因的细胞系。

进一步地,所述稳定感染过表达EIF4A3基因的细胞系的制备步骤如下:

(a)分别用限制性内切酶XhoI和EcoR酶切序列如SED ID NO:4所示的慢病毒载体,电泳,获得序列如SED ID NO:5所示的线性化的载体;

(b)从新鲜组织标本中提取组织总RNA,经反转录成cDNA,PCR扩增获得序列如SEDID NO:6所示的EIF4A3基因片段;

(c)将线性化的载体与EIF4A3基因片段用DNA连接酶连接获得EIF4A3过表达慢病毒载体;

(d)利用EIF4A3过表达慢病毒载体包装制备序列如SED ID NO:7所示的EIF4A3过表达慢病毒,经EIF4A3过表达慢病毒感染肝癌细胞株,利用抗生素进行药物筛选,获得稳定过表达EIF4A3基因的细胞株。

进一步地,所述包装的条件为:室温混匀20min,转染20h,收集。

进一步地,所述电泳条件为:1%琼脂糖凝胶,230V,30min。

进一步地,所述PCT扩增的体系如下:

模板1-2μg;引物1 2μL;引物2 2μL;PCR mix 25μL;ddH2O补足50μL

此处引物1的序列:CTACCGGACTCAGATCTCGAGGCCACCATGGCGACCACGGCCACGAT;

引物2的序列为:GTCATCCTTGTAATCGAATTCGATAAGATCAGCAACGTTCATCGG;

进一步地,所述连接的条件为:37C°水浴30min,转化。

进一步地,所述慢病毒载体为CMV-MCS-3XFlag-PGK-Puro;所述抗生素为嘌呤霉素。

进一步地,所述肝癌细胞株选自Hep3B细胞。

进一步地,所述方法还包括利用qRT-PCR和western blot方法对所得稳定过表达EIF4A3基因的细胞株中EIF4A3表达量进行验证。

本发明通过将EIF4A3过表达慢病毒直接感染肝癌细胞,构建了稳定过表达EIF4A3基因的细胞株;并且利用qRT-PCR和western blot方法验证了细胞株中EIF4A3基因的表达量,显示构建的细胞株表达量高于对照细胞株。通过验证表明EIF4A3基因在构建的细胞株中能够高效、稳定过表达。

进一步地,步骤C的过程如下:分别将稳定感染过表达EIF4A3基因的细胞系和稳定感染的敲除EIF4A3细胞系接种于96孔板中;在不同时间点,向每个孔中加入CCK-8溶液,孵育后测定吸光度,检测细胞增殖情况以判断干扰EIF4A3基因表达对肝癌细胞的增殖能力的影响。

相对于现有技术,本发明提供的技术方案具备有益效果如下:

本发明通过构建EIF4A3参与肝癌细胞增殖的综合调控网络,筛选出EIF4A3通过FOXO信号通路对肝癌的细胞增殖产生影响,进而说明EIF4A3参与肝癌细胞增殖的作用机制。通过构建过表达或敲除EIF4A3基因的细胞系,对本发明构建的综合调控网络进一步进行验证,为后续探索EIF4A3参与肝癌细胞增殖的分子机制提供理论依据,也为肝癌的诊断指标和治疗靶标提供可靠的理论依据。

本发明构建综合调控网络过程中通过对大样本的生物信息数据进行挖掘和有效信息的提取,采用差异表达分析提取表达一致的mRNA,应用加权基因共表达网络分析探索与肝癌相关的模块,运用分析EIF4A3影响的模块基因参与的功能和通路并构建EIF4A3调控肝癌细胞增殖的调控网络,能满足标准分析需求同时满足个性化分析需求,为研究肝癌标记物筛选、分子机制提供有意义的探索和依据,为肝癌的诊断提供检测标志物及新的治疗通路,为疾病的预防和治疗提供可靠的科学依据。

本发明通过成功构建敲除或过表达EIF4A3的细胞系,可稳定低表达或高表达ELF4A3蛋白,研究肝癌标记物筛选、分子机制提供有意义的探索和依据,提供了一种肝癌治疗的新思路,为研究肝癌药物治疗靶点提供了新途径。

附图说明

图1调节EIF4A3表达以影响肝癌细胞增殖的分子机制及应用的流程图

图2EIF4A3在肝癌样本和对照样本中的SNP,CNV和甲基化情况。

图3加权基因共表达网络分析探索EIF4A3相关的分子表达共失调景观。

图4EIF4A3介导的影响肝癌细胞增殖的分子机制的综合网络景观图。

图5敲除或过表达EIF4A3后的转染效率图。

图6调节EIF4A3表达以影响肝癌细胞增殖结果图。

具体实施方式

以下实施例旨在说明本发明内容,而不是对本发明保护范围的进一步限定。

实施例1

如图1所示,本发明提供一种调节EIF4A3表达以影响肝癌细胞增殖的分子机制及应用的流程图。从TCGA数据库中获得四类肝癌数据,经过差异表达分析后,鉴定与EIF4A3表达相关的基因,通过加权基因共表达网络分析探索与肝癌相关的模块,再经功能富集分析,构建EIF4A3参与肝癌细胞增殖的综合调控网络。

如图1所示,本发明提供一种调节EIF4A3表达以影响肝癌细胞增殖的综合调控网络的构建方法,包括如下步骤:

(1)数据处理:

从癌症基因组图集(TCGA)数据库中下载肝癌的数据,以获得包括RNA_Seq,Methylation(甲基化)2种组学的基因表达谱及其临床信息及肝癌SNP和CNV的数据;其中基因表达谱是基于Affymetrix人类基因组U133a阵列平台(Affymetrix;Thermo FisherScientiIFC Inc.,Waltham,MA,USA)。

在CNV数据中有375个肝癌样本和391个对照样本,对CNV数据进行基因注释,将拷贝数位点转换为基因symbol,以供后续分析;

在肝癌甲基化谱有380个肝癌样本和50个对照样本,使用R软件包ChAMP进行甲基化阵列分析,对数据进行过滤,随后对数据进行标准化处理,最后计算差异甲基化;

SNP的数据总共有387个样本其中包括345个肝癌样本和42个对照样本,使用MATLAB2018b软件计算出SNP位点的Pvalue值,查看基因突变的显著性;

在RNA-seq数据中总共有387个样本其中包括345个肝癌样本和42个对照样本。

(2)差异表达分析,具体如下:

使用perl语言对肝癌的CNV数据进行正常样本比肝癌样本的差异表达分析;

使用R软件包limma对RNA表达谱数据进行差异表达分析,基于背景集Homo_sapiens.GRCh38.98.chr.gtf提取mRNA和lncRNA表达谱,并且与健康对照相比,对肝癌样本进行差异表达分析,limma包中的normalizeBetweenArrays函数被用来对表达谱进行标准化。当一个基因对应多个探针,则选择这些探针的平均表达值作为该基因的表达值。

与EIF4A3低表达的样本相比,在EIF4A3高表达的样本进行差异表达分析以寻找差异表达的基因。

如图2所示,EIF4A3在肝癌样本和对照样本中的SNP、CNV和甲基化情况;其中图2A是EIF4A3的SNP变异情况,图2B是EIF4A3的CNV拷贝数情况,图2C是EIF4A3在各个表型的甲基化情况。

(3)加权基因共表达网络分析,具体如下:提取在两个分组均高表达和低表达的mRNA,执行WGCNA以探索与肝癌相关的模块。

首先,使用hclust函数对提取与EIF4A3显著相关上调和下调的7574个mRNA进行层次聚类分析,然后利用pick Soft Threshold函数筛选模块构建过程中的软阈值功率值。用候选功率(1~30)检验不同模块的平均连通度及其独立性。当独立度>0.9时,选择合适的功率值。WGCNA R包用于构建共表达网络(modules);最小模块大小被设置为30,并且每个模块被分配一个唯一的颜色。

如图3所示,本发明实施例中加权基因共表达网络分析探索EIF4A3相关的分子表达共失调景观。其中图3A确定了加权基因共表达网络分析的权值为7,图3B得到了19个与EIF4A3显著相关的模块并且每个模块被分配了唯一的颜色,图3C为各个模块的表达热图,图3D为19个模块与与表型的相关性及其显著性,图3E是对19个模块根据共表达聚类距离进行构建模块树图。

(4)富集分析及构建调节EIF4A3表达以影响肝癌细胞增殖的网络,具体如下:

应用clusterProfiler包对与EIF4A3表型相关性最大的1619个mRNA进行功能富集分析,以探索模块基因参与的功能和信号通路。P<0.05被认为是差异显著的。

应用基因集富集分析(GSEA)探索富集在肝癌样本和EIF4A3高表达样本和通路,并对通过基因集变异分析(GSVA)获得每条通路在肝癌样本和EIF4A3高表达样本的GSVA评分。在肝癌样本具有高GSVA评分的通路可能是参与肝癌发生过程的通路,在EIF4A3高表达样本中具有高GSVA评分的通路可能是被EIF4A3影响的参与肝癌的通路。

最后,基于RNAInter数据库库提取能够调控EIF4A3的lncRNA,构建了lncRNA靶向EIF4A3介导的肝癌全局失调的综合网络。结果显示:与5个lncRNA与EIF4A3互作并通过289个模块基因调控43条KEGG通路进而介导的肝癌全局失调的综合网络,基于文献参考我们可以发现EIF4A3可以通过FoxO信号通路促进肝癌细胞增殖。

如图4所示,本发明实施例中EIF4A3介导的影响肝癌细胞增殖的分子机制的综合网络景观,表明EIF4A3可以通过FoxO信号通路促进肝癌的细胞增殖。其中图4A是EIF4A3表型正相关性最大的3个模块共1619个基因所参与的生物学功能,图4B是与EIF4A3表型正相关性最大的3个模块共1619个基因所参与的KEGG通路,图4C是在GSEA验证得到富集在肝癌样本的通路,其GSVA分数在肝癌样本-健康对照样本组的表达情况,图4D是GSEA验证得到富集在EIF4A3高表达样本的通路,其GSVA分数在EIF4A3高表达样本-EIF4A3低表达样本组的表达情况,图4E是lncRNA互作EIF4A3通过FoxO信号通路促进肝癌的细胞增殖,图4F是EIF4A3通过FoxO信号通路促进肝癌的细胞增殖的机制。

实施例2

(1)构建敲除EIF4A3的细胞系:

制备重组EIF4A3-shRNA慢病毒和阴性对照(NC)慢病毒;在LM3细胞感染敲除EIF4A3基因的慢病毒载体(EIF4A3-KD),获得稳定感染的敲除EIF4A3细胞系和对照细胞系。如图5A所示敲除EIF4A3后的转染效率,表明肝癌细胞系LM3确实敲除了EIF4A3。具体过程如下:

采用qRT-PCR进行检测,测序结果和EIF4A3序列比对分析。登陆Public TRCPortal网站,检索EIF4A3并从结果中选择经过验证且得分较高的EIF4A3的shRNA干涉序列5′-GGATGAAGCTGATGAAATG-3′,并通过BLAST同源性比较。将合成的shRNA模板(核苷酸序列如SED ID NO:1所示,具体为GGATGAAGCTGATGAAATG;具体合成过程针对目的基因靶基因序列,利用公用网站中提供的RNA干扰序列设计原则,设计多个RNA干扰靶点序列,根据我们的设计经验和设计软件进行评估测定,选择最佳的动力学参数的靶点进入后续实验流程)与慢病毒载体连接(22℃连接1h),获得的EIF4A3干扰慢病毒载体。

将获得的EIF4A3干扰慢病毒载体包装制备EIF4A3干扰慢病毒(条件为:室温混匀20min,转染20h,收集病毒),EIF4A3干扰慢病毒感染LM3细胞。

用抗生素选择阳性克隆(LM3细胞为2μg/mL),建立14天稳定细胞系LM3-EIF4A3-KD细胞。

通过qRT-PCR和western blot检测EIF4A3敲低的效率,结论如图5A。

所述慢病毒载体为hU6-MCS-CMV-zsGreen1-PGK-puromycin;所述抗生素为嘌呤霉素。

此处慢病毒载体序列如SED ID NO:2所示,具体为:

此处EIF4A3干扰慢病毒序列如SED ID NO:3所示,具体为:

构建过表达EIF4A3的细胞系,具体过程如下:

分别用限制性内切酶XhoI和EcoRI酶切慢病毒载体,对载体酶切产物进行琼脂糖凝胶电泳(1%琼脂糖凝胶,230V,30min),回收目的条带,获得线性化的载体(质粒)。

此处慢病毒载体的序列如SED ID NO:4所示,具体如下:

此处线性化的载体的序列如SED ID NO:5所示,具体如下:

序列表

<110> 叶甲舟

<120> 调节EIF4A3表达以调控肝癌细胞增殖能力的应用

<130> 2021

<141> 2021-03-19

<160> 7

<170> SIPOSequenceListing 1.0

<210> 1

<211> 19

<212> DNA

<213> Artificial Sequence

<400> 1

ggatgaagct gatgaaatg 19

<210> 2

<211> 8997

<212> DNA

<213> Artificial Sequence

<400> 2

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgggc aggaagaggg cctatttccc atgattcctt 2220

catatttgca tatacgatac aaggctgtta gagagataat tagaattaat ttgactgtaa 2280

acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2340

cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2400

tcgatttctt ggctttatat atcttgtgga aaggacgagg atccggacaa gcttcgaatt 2460

ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 2520

gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 2580

tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 2640

aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 2700

caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 2760

acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 2820

ccatggtgat gcggttttgg cagtacatca atgggcgtgg atagcggttt gactcacggg 2880

gatttccaag tctccacccc attgacgtca atgggagttt gttttggcac caaaatcaac 2940

gggactttcc aaaatgtcgt aacaactccg ccccattgac gcaaatgggc ggtaggcgtg 3000

tacggtggga ggtctatata agcagagctg gtttagtgaa ccgtcagatc cgctagcgct 3060

accggtcgcc accatggccc agtccaagca cggcctgacc aaggagatga ccatgaagta 3120

ccgcatggag ggctgcgtgg acggccacaa gttcgtgatc accggcgagg gcatcggcta 3180

ccccttcaag ggcaagcagg ccatcaacct gtgcgtggtg gagggcggcc ccttgccctt 3240

cgccgaggac atcttgtccg ccgccttcat gtacggcaac cgcgtgttca ccgagtaccc 3300

ccaggacatc gtcgactact tcaagaactc ctgccccgcc ggctacacct gggaccgctc 3360

cttcctgttc gaggacggcg ccgtgtgcat ctgcaacgcc gacatcaccg tgagcgtgga 3420

ggagaactgc atgtaccacg agtccaagtt ctacggcgtg aacttccccg ccgacggccc 3480

cgtgatgaag aagatgaccg acaactggga gccctcctgc gagaagatca tccccgtgcc 3540

caagcagggc atcttgaagg gcgacgtgag catgtacctg ctgctgaagg acggtggccg 3600

cttgcgctgc cagttcgaca ccgtgtacaa ggccaagtcc gtgccccgca agatgcccga 3660

ctggcacttc atccagcaca agctgacccg cgaggaccgc agcgacgcca agaaccagaa 3720

gtggcacctg accgagcacg ccatcgcctc cggctccgcc ttgccctaac tcgagtaatt 3780

ctaccgggta ggggaggcgc ttttcccaag gcagtctgga gcatgcgctt tagcagcccc 3840

gctgggcact tggcgctaca caagtggcct ctggcctcgc acacattcca catccaccgg 3900

taggcgccaa ccggctccgt tctttggtgg ccccttcgcg ccaccttcta ctcctcccct 3960

agtcaggaag ttcccccccg ccccgcagct cgcgtcgtgc aggacgtgac aaatggaagt 4020

agcacgtctc actagtctcg tgcagatgga cagcaccgct gagcaatgga agcgggtagg 4080

cctttggggc agcggccaat agcagctttg ctccttcgct ttctgggctc agaggctggg 4140

aaggggtggg tccgggggcg ggctcagggg cgggctcagg ggcggggcgg gcgcccgaag 4200

gtcctccgga ggcccggcat tctgcacgct tcaaaagcgc acgtctgccg cgctgttctc 4260

ctcttcctca tctccgggcc tttcgacctg cagcccaagc ttaccatgac cgagtacaag 4320

cccacggtgc gcctcgccac ccgcgacgac gtccccaggg ccgtacgcac cctcgccgcc 4380

gcgttcgccg actaccccgc cacgcgccac accgtcgatc cggaccgcca catcgagcgg 4440

gtcaccgagc tgcaagaact cttcctcacg cgcgtcgggc tcgacatcgg caaggtgtgg 4500

gtcgcggacg acggcgccgc ggtggcggtc tggaccacgc cggagagcgt cgaagcgggg 4560

gcggtgttcg ccgagatcgg cccgcgcatg gccgagttga gcggttcccg gctggccgcg 4620

cagcaacaga tggaaggcct cctggcgccg caccggccca aggagcccgc gtggttcctg 4680

gccaccgtcg gcgtctcgcc cgaccaccag ggcaagggtc tgggcagcgc cgtcgtgctc 4740

cccggagtgg aggcggccga gcgcgccggg gtgcccgcct tcctggagac ctccgcgccc 4800

cgcaacctcc ccttctacga gcggctcggc ttcaccgtca ccgccgacgt cgaggtgccc 4860

gaaggaccgc gcacctggtg catgacccgc aagcccggtg cctgaacgcg tctggaacaa 4920

tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 4980

ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 5040

ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 5100

gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 5160

ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 5220

tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 5280

gggcactgac aattccgtgg tgttgtcggg gaagctgacg tcctttccat ggctgctcgc 5340

ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 5400

tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 5460

ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcctg gaattaattc 5520

tgcagtcgag acctagaaaa acatggagca atcacaagta gcaatacagc agctaccaat 5580

gctgattgtg cctggctaga agcacaagag gaggaggagg tgggttttcc agtcacacct 5640

caggtacctt taagaccaat gacttacaag gcagctgtag atcttagcca ctttttaaaa 5700

gaaaagaggg gactggaagg gctaattcac tcccaacgaa gacaagatat ccttgatctg 5760

tggatctacc acacacaagg ctacttccct gattagcaga actacacacc agggccaggg 5820

gtcagatatc cactgacctt tggatggtgc tacaagctag taccagttga gccagataag 5880

gtagaagagg ccaataaagg agagaacacc agcttgttac accctgtgag cctgcatggg 5940

atggatgacc cggagagaga agtgttagag tggaggtttg acagccgcct agcatttcat 6000

cacgtggccc gagagctgca tccggagtac ttcaagaact gctgatatcg agcttgctac 6060

aagggacttt ccgctgggga ctttccaggg aggcgtggcc tgggcgggac tggggagtgg 6120

cgagccctca gatcctgcat ataagcagct gctttttgcc tgtactgggt ctctctggtt 6180

agaccagatc tgagcctggg agctctctgg ctaactaggg aacccactgc ttaagcctca 6240

ataaagcttg ccttgagtgc ttcaagtagt gtgtgcccgt ctgttgtgtg actctggtaa 6300

ctagagatcc ctcagaccct tttagtcagt gtggaaaatc tctagcagta gtagttcatg 6360

tcatcttatt attcagtatt tataacttgc aaagaaatga atatcagaga gtgagaggcc 6420

ttgacattgc tagcgtttac cgtcgacctc tagctagagc ttggcgtaat catggtcata 6480

gctgtttcct gtgtgaaatt gttatccgct cacaattcca cacaacatac gagccggaag 6540

cataaagtgt aaagcctggg gtgcctaatg agtgagctaa ctcacattaa ttgcgttgcg 6600

ctcactgccc gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca 6660

acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 6720

gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg 6780

gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa 6840

ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga 6900

cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag 6960

ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct 7020

taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg 7080

ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc 7140

ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt 7200

aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta 7260

tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac 7320

agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc 7380

ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat 7440

tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc 7500

tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt 7560

cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta 7620

aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct 7680

atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg 7740

cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga 7800

tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt 7860

atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt 7920

taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt 7980

tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat 8040

gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc 8100

cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc 8160

cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat 8220

gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag 8280

aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt 8340

accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc 8400

ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa 8460

gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg 8520

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 8580

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tcgacggatc 8640

gggagatcaa cttgtttatt gcagcttata atggttacaa ataaagcaat agcatcacaa 8700

atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc aaactcatca 8760

atgtatctta tcatgtctgg atcaactgga taactcaagc taaccaaaat catcccaaac 8820

ttcccacccc ataccctatt accactgcca attacctgtg gtttcattta ctctaaacct 8880

gtgattcctc tgaattattt tcattttaaa gaaattgtat ttgttaaata tgtactacaa 8940

acttagtagt ttttaaagaa attgtatttg ttaaatatgt actacaaact tagtagt 8997

<210> 3

<211> 9039

<212> DNA

<213> Artificial Sequence

<400> 3

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgatctgggc aggaagaggg cctatttccc atgattcctt 2220

catatttgca tatacgatac aaggctgtta gagagataat tagaattaat ttgactgtaa 2280

acacaaagat attagtacaa aatacgtgac gtagaaagta ataatttctt gggtagtttg 2340

cagttttaaa attatgtttt aaaatggact atcatatgct taccgtaact tgaaagtatt 2400

tcgatttctt ggctttatat atcttgtgga aaggacgagg atccggatga agctgatgaa 2460

atgttcaaga gacatttcat cagcttcatc cttttttgaa ttctagttat taatagtaat 2520

caattacggg gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg 2580

taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 2640

atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 2700

ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg 2760

acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact 2820

ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 2880

ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 2940

ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 3000

gtaacaactc cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata 3060

taagcagagc tggtttagtg aaccgtcaga tccgctagcg ctaccggtcg ccaccatggc 3120

ccagtccaag cacggcctga ccaaggagat gaccatgaag taccgcatgg agggctgcgt 3180

ggacggccac aagttcgtga tcaccggcga gggcatcggc taccccttca agggcaagca 3240

ggccatcaac ctgtgcgtgg tggagggcgg ccccttgccc ttcgccgagg acatcttgtc 3300

cgccgccttc atgtacggca accgcgtgtt caccgagtac ccccaggaca tcgtcgacta 3360

cttcaagaac tcctgccccg ccggctacac ctgggaccgc tccttcctgt tcgaggacgg 3420

cgccgtgtgc atctgcaacg ccgacatcac cgtgagcgtg gaggagaact gcatgtacca 3480

cgagtccaag ttctacggcg tgaacttccc cgccgacggc cccgtgatga agaagatgac 3540

cgacaactgg gagccctcct gcgagaagat catccccgtg cccaagcagg gcatcttgaa 3600

gggcgacgtg agcatgtacc tgctgctgaa ggacggtggc cgcttgcgct gccagttcga 3660

caccgtgtac aaggccaagt ccgtgccccg caagatgccc gactggcact tcatccagca 3720

caagctgacc cgcgaggacc gcagcgacgc caagaaccag aagtggcacc tgaccgagca 3780

cgccatcgcc tccggctccg ccttgcccta actcgagtaa ttctaccggg taggggaggc 3840

gcttttccca aggcagtctg gagcatgcgc tttagcagcc ccgctgggca cttggcgcta 3900

cacaagtggc ctctggcctc gcacacattc cacatccacc ggtaggcgcc aaccggctcc 3960

gttctttggt ggccccttcg cgccaccttc tactcctccc ctagtcagga agttcccccc 4020

cgccccgcag ctcgcgtcgt gcaggacgtg acaaatggaa gtagcacgtc tcactagtct 4080

cgtgcagatg gacagcaccg ctgagcaatg gaagcgggta ggcctttggg gcagcggcca 4140

atagcagctt tgctccttcg ctttctgggc tcagaggctg ggaaggggtg ggtccggggg 4200

cgggctcagg ggcgggctca ggggcggggc gggcgcccga aggtcctccg gaggcccggc 4260

attctgcacg cttcaaaagc gcacgtctgc cgcgctgttc tcctcttcct catctccggg 4320

cctttcgacc tgcagcccaa gcttaccatg accgagtaca agcccacggt gcgcctcgcc 4380

acccgcgacg acgtccccag ggccgtacgc accctcgccg ccgcgttcgc cgactacccc 4440

gccacgcgcc acaccgtcga tccggaccgc cacatcgagc gggtcaccga gctgcaagaa 4500

ctcttcctca cgcgcgtcgg gctcgacatc ggcaaggtgt gggtcgcgga cgacggcgcc 4560

gcggtggcgg tctggaccac gccggagagc gtcgaagcgg gggcggtgtt cgccgagatc 4620

ggcccgcgca tggccgagtt gagcggttcc cggctggccg cgcagcaaca gatggaaggc 4680

ctcctggcgc cgcaccggcc caaggagccc gcgtggttcc tggccaccgt cggcgtctcg 4740

cccgaccacc agggcaaggg tctgggcagc gccgtcgtgc tccccggagt ggaggcggcc 4800

gagcgcgccg gggtgcccgc cttcctggag acctccgcgc cccgcaacct ccccttctac 4860

gagcggctcg gcttcaccgt caccgccgac gtcgaggtgc ccgaaggacc gcgcacctgg 4920

tgcatgaccc gcaagcccgg tgcctgaacg cgtctggaac aatcaacctc tggattacaa 4980

aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata 5040

cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc 5100

cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg 5160

tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac 5220

ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat 5280

cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt 5340

ggtgttgtcg gggaagctga cgtcctttcc atggctgctc gcctgtgttg ccacctggat 5400

tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc 5460

ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag 5520

tcggatctcc ctttgggccg cctccccgcc tggaattaat tctgcagtcg agacctagaa 5580

aaacatggag caatcacaag tagcaataca gcagctacca atgctgattg tgcctggcta 5640

gaagcacaag aggaggagga ggtgggtttt ccagtcacac ctcaggtacc tttaagacca 5700

atgacttaca aggcagctgt agatcttagc cactttttaa aagaaaagag gggactggaa 5760

gggctaattc actcccaacg aagacaagat atccttgatc tgtggatcta ccacacacaa 5820

ggctacttcc ctgattagca gaactacaca ccagggccag gggtcagata tccactgacc 5880

tttggatggt gctacaagct agtaccagtt gagccagata aggtagaaga ggccaataaa 5940

ggagagaaca ccagcttgtt acaccctgtg agcctgcatg ggatggatga cccggagaga 6000

gaagtgttag agtggaggtt tgacagccgc ctagcatttc atcacgtggc ccgagagctg 6060

catccggagt acttcaagaa ctgctgatat cgagcttgct acaagggact ttccgctggg 6120

gactttccag ggaggcgtgg cctgggcggg actggggagt ggcgagccct cagatcctgc 6180

atataagcag ctgctttttg cctgtactgg gtctctctgg ttagaccaga tctgagcctg 6240

ggagctctct ggctaactag ggaacccact gcttaagcct caataaagct tgccttgagt 6300

gcttcaagta gtgtgtgccc gtctgttgtg tgactctggt aactagagat ccctcagacc 6360

cttttagtca gtgtggaaaa tctctagcag tagtagttca tgtcatctta ttattcagta 6420

tttataactt gcaaagaaat gaatatcaga gagtgagagg ccttgacatt gctagcgttt 6480

accgtcgacc tctagctaga gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 6540

ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 6600

gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 6660

gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 6720

tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 6780

gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 6840

ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 6900

ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 6960

acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 7020

tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 7080

ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 7140

ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 7200

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 7260

actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 7320

gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 7380

tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 7440

caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 7500

atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 7560

acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 7620

ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 7680

ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 7740

tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 7800

tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 7860

gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 7920

tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 7980

tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 8040

ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 8100

tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 8160

ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 8220

gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 8280

ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 8340

cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 8400

ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 8460

ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 8520

gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 8580

ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 8640

gcgcacattt ccccgaaaag tgccacctga cgtcgacgga tcgggagatc aacttgttta 8700

ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 8760

ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 8820

ggatcaactg gataactcaa gctaaccaaa atcatcccaa acttcccacc ccatacccta 8880

ttaccactgc caattacctg tggtttcatt tactctaaac ctgtgattcc tctgaattat 8940

tttcatttta aagaaattgt atttgttaaa tatgtactac aaacttagta gtttttaaag 9000

aaattgtatt tgttaaatat gtactacaaa cttagtagt 9039

<210> 4

<211> 8148

<212> DNA

<213> Artificial Sequence

<400> 4

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgataagctt gggagttccg cgttacataa cttacggtaa 2220

atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 2280

ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 2340

aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 2400

tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 2460

ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 2520

agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 2580

ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 2640

acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 2700

gcagagctcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc tgttttgacc 2760

tccatagaag acaccgactc tactagagga tcgctagcgc taccggactc agatctcgag 2820

acaacgttcg aacgcgtaca agcgcggccg cacaacgtct agagaattcg attacaagga 2880

tgacgacgat aaggactata aggacgatga tgacaaggac tacaaagatg atgacgataa 2940

atgaggatcc accggatcta gataactgat cataattcta ccgggtaggg gaggcgcttt 3000

tcccaaggca gtctggagca tgcgctttag cagccccgct gggcacttgg cgctacacaa 3060

gtggcctctg gcctcgcaca cattccacat ccaccggtag gcgccaaccg gctccgttct 3120

ttggtggccc cttcgcgcca ccttctactc ctcccctagt caggaagttc ccccccgccc 3180

cgcagctcgc gtcgtgcagg acgtgacaaa tggaagtagc acgtctcact agtctcgtgc 3240

agatggacag caccgctgag caatggaagc gggtaggcct ttggggcagc ggccaatagc 3300

agctttgctc cttcgctttc tgggctcaga ggctgggaag gggtgggtcc gggggcgggc 3360

tcaggggcgg gctcaggggc ggggcgggcg cccgaaggtc ctccggaggc ccggcattct 3420

gcacgcttca aaagcgcacg tctgccgcgc tgttctcctc ttcctcatct ccgggccttt 3480

cgacctgcag cccaagctta ccatgaccga gtacaagccc acggtgcgcc tcgccacccg 3540

cgacgacgtc cccagggccg tacgcaccct cgccgccgcg ttcgccgact accccgccac 3600

gcgccacacc gtcgatccgg accgccacat cgagcgggtc accgagctgc aagaactctt 3660

cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc gcggacgacg gcgccgcggt 3720

ggcggtctgg accacgccgg agagcgtcga agcgggggcg gtgttcgccg agatcggccc 3780

gcgcatggcc gagttgagcg gttcccggct ggccgcgcag caacagatgg aaggcctcct 3840

ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc accgtcggcg tctcgcccga 3900

ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc ggagtggagg cggccgagcg 3960

cgccggggtg cccgccttcc tggagacctc cgcgccccgc aacctcccct tctacgagcg 4020

gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa ggaccgcgca cctggtgcat 4080

gacccgcaag cccggtgcct gaccgcgtct ggaacaatca acctctggat tacaaaattt 4140

gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 4200

ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 4260

ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 4320

tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 4380

agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 4440

cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 4500

tgtcggggaa gctgacgtcc tttccatggc tgctcgcctg tgttgccacc tggattctgc 4560

gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 4620

gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 4680

tctccctttg ggccgcctcc ccgcctggaa ttaattctgc agtcgagacc tagaaaaaca 4740

tggagcaatc acaagtagca atacagcagc taccaatgct gattgtgcct ggctagaagc 4800

acaagaggag gaggaggtgg gttttccagt cacacctcag gtacctttaa gaccaatgac 4860

ttacaaggca gctgtagatc ttagccactt tttaaaagaa aagaggggac tggaagggct 4920

aattcactcc caacgaagac aagatatcct tgatctgtgg atctaccaca cacaaggcta 4980

cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac tgacctttgg 5040

atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca ataaaggaga 5100

gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg agagagaagt 5160

gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag agctgcatcc 5220

ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg ctggggactt 5280

tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat cctgcatata 5340

agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga gcctgggagc 5400

tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct tgagtgcttc 5460

aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc agaccctttt 5520

agtcagtgtg gaaaatctct agcagtagta gttcatgtca tcttattatt cagtatttat 5580

aacttgcaaa gaaatgaata tcagagagtg agaggccttg acattgctag cgttttaccg 5640

tcgacctcta gctagagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 5700

tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 5760

gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 5820

ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 5880

cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 5940

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 6000

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 6060

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 6120

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 6180

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 6240

ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 6300

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 6360

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 6420

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 6480

ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 6540

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 6600

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 6660

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 6720

taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 6780

aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 6840

tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 6900

tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 6960

gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 7020

gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 7080

aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 7140

gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 7200

ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 7260

tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 7320

atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 7380

ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 7440

ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 7500

ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 7560

atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 7620

gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 7680

tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 7740

ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 7800

acatttcccc gaaaagtgcc acctgacgtc gacggatcgg gagatcaact tgtttattgc 7860

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt 7920

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat 7980

caactggata actcaagcta accaaaatca tcccaaactt cccaccccat accctattac 8040

cactgccaat tacctgtggt ttcatttact ctaaacctgt gattcctctg aattattttc 8100

attttaaaga aattgtattt gttaaatatg tactacaaac ttagtagt 8148

<210> 5

<211> 6899

<212> DNA

<213> Artificial Sequence

<400> 5

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 60

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 120

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 180

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 240

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 300

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 360

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 420

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 480

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 540

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 600

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 660

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 720

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 780

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 840

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 900

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 960

acagcagaga tccagtttat cgataagctt gggagttccg cgttacataa cttacggtaa 1020

atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 1080

ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 1140

aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 1200

tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 1260

ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 1320

agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 1380

ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 1440

acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 1500

gcagagctcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc tgttttgacc 1560

tccatagaag acaccgactc tactagagga tcgctagcgc taccggactc agatctcgag 1620

gattacaagg atgacgacga taaggactat aaggacgatg atgacaagga ctacaaagat 1680

gatgacgata aatgaggatc caccggatct agataactga tcataattct accgggtagg 1740

ggaggcgctt ttcccaaggc agtctggagc atgcgcttta gcagccccgc tgggcacttg 1800

gcgctacaca agtggcctct ggcctcgcac acattccaca tccaccggta ggcgccaacc 1860

ggctccgttc tttggtggcc ccttcgcgcc accttctact cctcccctag tcaggaagtt 1920

cccccccgcc ccgcagctcg cgtcgtgcag gacgtgacaa atggaagtag cacgtctcac 1980

tagtctcgtg cagatggaca gcaccgctga gcaatggaag cgggtaggcc tttggggcag 2040

cggccaatag cagctttgct ccttcgcttt ctgggctcag aggctgggaa ggggtgggtc 2100

cgggggcggg ctcaggggcg ggctcagggg cggggcgggc gcccgaaggt cctccggagg 2160

cccggcattc tgcacgcttc aaaagcgcac gtctgccgcg ctgttctcct cttcctcatc 2220

tccgggcctt tcgacctgca gcccaagctt accatgaccg agtacaagcc cacggtgcgc 2280

ctcgccaccc gcgacgacgt ccccagggcc gtacgcaccc tcgccgccgc gttcgccgac 2340

taccccgcca cgcgccacac cgtcgatccg gaccgccaca tcgagcgggt caccgagctg 2400

caagaactct tcctcacgcg cgtcgggctc gacatcggca aggtgtgggt cgcggacgac 2460

ggcgccgcgg tggcggtctg gaccacgccg gagagcgtcg aagcgggggc ggtgttcgcc 2520

gagatcggcc cgcgcatggc cgagttgagc ggttcccggc tggccgcgca gcaacagatg 2580

gaaggcctcc tggcgccgca ccggcccaag gagcccgcgt ggttcctggc caccgtcggc 2640

gtctcgcccg accaccaggg caagggtctg ggcagcgccg tcgtgctccc cggagtggag 2700

gcggccgagc gcgccggggt gcccgccttc ctggagacct ccgcgccccg caacctcccc 2760

ttctacgagc ggctcggctt caccgtcacc gccgacgtcg aggtgcccga aggaccgcgc 2820

acctggtgca tgacccgcaa gcccggtgcc tgaccgcgtc tggaacaatc aacctctgga 2880

ttacaaaatt tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg 2940

tggatacgct gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt 3000

ctcctccttg tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag 3060

gcaacgtggc gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc 3120

caccacctgt cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga 3180

actcatcgcc gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa 3240

ttccgtggtg ttgtcgggga agctgacgtc ctttccatgg ctgctcgcct gtgttgccac 3300

ctggattctg cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct 3360

tccttcccgc ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca 3420

gacgagtcgg atctcccttt gggccgcctc cccgcctgga attaattctg cagtcgagac 3480

ctagaaaaac atggagcaat cacaagtagc aatacagcag ctaccaatgc tgattgtgcc 3540

tggctagaag cacaagagga ggaggaggtg ggttttccag tcacacctca ggtaccttta 3600

agaccaatga cttacaaggc agctgtagat cttagccact ttttaaaaga aaagagggga 3660

ctggaagggc taattcactc ccaacgaaga caagatatcc ttgatctgtg gatctaccac 3720

acacaaggct acttccctga ttagcagaac tacacaccag ggccaggggt cagatatcca 3780

ctgacctttg gatggtgcta caagctagta ccagttgagc cagataaggt agaagaggcc 3840

aataaaggag agaacaccag cttgttacac cctgtgagcc tgcatgggat ggatgacccg 3900

gagagagaag tgttagagtg gaggtttgac agccgcctag catttcatca cgtggcccga 3960

gagctgcatc cggagtactt caagaactgc tgatatcgag cttgctacaa gggactttcc 4020

gctggggact ttccagggag gcgtggcctg ggcgggactg gggagtggcg agccctcaga 4080

tcctgcatat aagcagctgc tttttgcctg tactgggtct ctctggttag accagatctg 4140

agcctgggag ctctctggct aactagggaa cccactgctt aagcctcaat aaagcttgcc 4200

ttgagtgctt caagtagtgt gtgcccgtct gttgtgtgac tctggtaact agagatccct 4260

cagacccttt tagtcagtgt ggaaaatctc tagcagtagt agttcatgtc atcttattat 4320

tcagtattta taacttgcaa agaaatgaat atcagagagt gagaggcctt gacattgcta 4380

gcgttttacc gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg 4440

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 4500

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 4560

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 4620

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 4680

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 4740

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 4800

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 4860

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 4920

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 4980

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 5040

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 5100

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 5160

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 5220

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 5280

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 5340

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 5400

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 5460

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 5520

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 5580

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 5640

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 5700

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 5760

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 5820

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 5880

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 5940

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 6000

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 6060

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 6120

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 6180

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 6240

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 6300

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 6360

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 6420

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 6480

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 6540

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cgacggatcg ggagatcaac 6600

ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 6660

aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 6720

catgtctgga tcaactggat aactcaagct aaccaaaatc atcccaaact tcccacccca 6780

taccctatta ccactgccaa ttacctgtgg tttcatttac tctaaacctg tgattcctct 6840

gaattatttt cattttaaag aaattgtatt tgttaaatat gtactacaaa cttagtagt 6899

<210> 6

<211> 1233

<212> DNA

<213> Artificial Sequence

<400> 6

atggcgacca cggccacgat ggcgacctcg ggctcggcgc gaaagcggct gctcaaagag 60

gaagacatga ctaaagtgga attcgagacc agcgaggagg tggatgtgac ccccacgttc 120

gacaccatgg gcctgcggga ggacctgctg cggggcatct acgcttacgg ttttgaaaaa 180

ccatcagcaa tccagcaacg agcaatcaag cagatcatca aagggagaga tgtcatcgca 240

cagtctcagt ccggcacagg aaaaacagcc accttcagta tctcagtcct ccagtgtttg 300

gatattcagg ttcgtgaaac tcaagctttg atcttggctc ccacaagaga gttggctgtg 360

cagatccaga aggggctgct tgctctcggt gactacatga atgtccagtg ccatgcctgc 420

attggaggca ccaatgttgg cgaggacatc aggaagctgg attacggaca gcatgttgtc 480

gcgggcactc cagggcgtgt ttttgatatg attcgtcgca gaagcctaag gacacgtgct 540

atcaaaatgt tggttttgga tgaagctgat gaaatgttga ataaaggttt caaagagcag 600

atttacgatg tatacaggta cctgcctcca gccacacagg tggttctcat cagtgccacg 660

ctgccacacg agattctgga gatgaccaac aagttcatga ccgacccaat ccgcatcttg 720

gtgaaacgtg atgaattgac tctggaaggc atcaagcaat ttttcgtggc agtggagagg 780

gaagagtgga aatttgacac tctgtgtgac ctctacgaca cactgaccat cactcaggcg 840

gtcatcttct gcaacaccaa aagaaaggtg gactggctga cggagaaaat gagggaagcc 900

aacttcactg tatcctcaat gcatggagac atgccccaga aagagcggga gtccatcatg 960

aaggagttcc ggtcgggcgc cagccgagtg cttatttcta cagatgtctg ggccaggggg 1020

ttggatgtcc ctcaggtgtc cctcatcatt aactatgatc tccctaataa cagagaattg 1080

tacatacaca gaattgggag atcaggtcga tacggccgga agggtgtggc cattaacttt 1140

gtaaagaatg acgacatccg catcctcaga gatatcgagc agtactattc cactcagatt 1200

gatgagatgc cgatgaacgt tgctgatctt atc 1233

<210> 7

<211> 9344

<212> DNA

<213> Artificial Sequence

<400> 7

tggaagggct aattcactcc caaagaagac aagatatcct tgatctgtgg atctaccaca 60

cacaaggcta cttccctgat tagcagaact acacaccagg gccaggggtc agatatccac 120

tgacctttgg atggtgctac aagctagtac cagttgagcc agataaggta gaagaggcca 180

ataaaggaga gaacaccagc ttgttacacc ctgtgagcct gcatgggatg gatgacccgg 240

agagagaagt gttagagtgg aggtttgaca gccgcctagc atttcatcac gtggcccgag 300

agctgcatcc ggagtacttc aagaactgct gatatcgagc ttgctacaag ggactttccg 360

ctggggactt tccagggagg cgtggcctgg gcgggactgg ggagtggcga gccctcagat 420

cctgcatata agcagctgct ttttgcctgt actgggtctc tctggttaga ccagatctga 480

gcctgggagc tctctggcta actagggaac ccactgctta agcctcaata aagcttgcct 540

tgagtgcttc aagtagtgtg tgcccgtctg ttgtgtgact ctggtaacta gagatccctc 600

agaccctttt agtcagtgtg gaaaatctct agcagtggcg cccgaacagg gacttgaaag 660

cgaaagggaa accagaggag ctctctcgac gcaggactcg gcttgctgaa gcgcgcacgg 720

caagaggcga ggggcggcga ctggtgagta cgccaaaaat tttgactagc ggaggctaga 780

aggagagaga tgggtgcgag agcgtcagta ttaagcgggg gagaattaga tcgcgatggg 840

aaaaaattcg gttaaggcca gggggaaaga aaaaatataa attaaaacat atagtatggg 900

caagcaggga gctagaacga ttcgcagtta atcctggcct gttagaaaca tcagaaggct 960

gtagacaaat actgggacag ctacaaccat cccttcagac aggatcagaa gaacttagat 1020

cattatataa tacagtagca accctctatt gtgtgcatca aaggatagag ataaaagaca 1080

ccaaggaagc tttagacaag atagaggaag agcaaaacaa aagtaagacc accgcacagc 1140

aagcggccgg ccgctgatct tcagacctgg aggaggagat atgagggaca attggagaag 1200

tgaattatat aaatataaag tagtaaaaat tgaaccatta ggagtagcac ccaccaaggc 1260

aaagagaaga gtggtgcaga gagaaaaaag agcagtggga ataggagctt tgttccttgg 1320

gttcttggga gcagcaggaa gcactatggg cgcagcgtca atgacgctga cggtacaggc 1380

cagacaatta ttgtctggta tagtgcagca gcagaacaat ttgctgaggg ctattgaggc 1440

gcaacagcat ctgttgcaac tcacagtctg gggcatcaag cagctccagg caagaatcct 1500

ggctgtggaa agatacctaa aggatcaaca gctcctgggg atttggggtt gctctggaaa 1560

actcatttgc accactgctg tgccttggaa tgctagttgg agtaataaat ctctggaaca 1620

gatttggaat cacacgacct ggatggagtg ggacagagaa attaacaatt acacaagctt 1680

aatacactcc ttaattgaag aatcgcaaaa ccagcaagaa aagaatgaac aagaattatt 1740

ggaattagat aaatgggcaa gtttgtggaa ttggtttaac ataacaaatt ggctgtggta 1800

tataaaatta ttcataatga tagtaggagg cttggtaggt ttaagaatag tttttgctgt 1860

actttctata gtgaatagag ttaggcaggg atattcacca ttatcgtttc agacccacct 1920

cccaaccccg aggggacccg acaggcccga aggaatagaa gaagaaggtg gagagagaga 1980

cagagacaga tccattcgat tagtgaacgg atctcgacgg tatcgccttt aaaagaaaag 2040

gggggattgg ggggtacagt gcaggggaaa gaatagtaga cataatagca acagacatac 2100

aaactaaaga attacaaaaa caaattacaa aaattcaaaa ttttcgggtt tattacaggg 2160

acagcagaga tccagtttat cgataagctt gggagttccg cgttacataa cttacggtaa 2220

atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 2280

ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 2340

aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 2400

tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 2460

ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 2520

agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 2580

ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 2640

acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag gtctatataa 2700

gcagagctcg tttagtgaac cgtcagatcg cctggagacg ccatccacgc tgttttgacc 2760

tccatagaag acaccgactc tactagagga tcgctagcgc taccggactc agatctcgag 2820

gccaccatgg cgaccacggc cacgatggcg acctcgggct cggcgcgaaa gcggctgctc 2880

aaagaggaag acatgactaa agtggaattc gagaccagcg aggaggtgga tgtgaccccc 2940

acgttcgaca ccatgggcct gcgggaggac ctgctgcggg gcatctacgc ttacggtttt 3000

gaaaaaccat cagcaatcca gcaacgagca atcaagcaga tcatcaaagg gagagatgtc 3060

atcgcacagt ctcagtccgg cacaggaaaa acagccacct tcagtatctc agtcctccag 3120

tgtttggata ttcaggttcg tgaaactcaa gctttgatct tggctcccac aagagagttg 3180

gctgtgcaga tccagaaggg gctgcttgct ctcggtgact acatgaatgt ccagtgccat 3240

gcctgcattg gaggcaccaa tgttggcgag gacatcagga agctggatta cggacagcat 3300

gttgtcgcgg gcactccagg gcgtgttttt gatatgattc gtcgcagaag cctaaggaca 3360

cgtgctatca aaatgttggt tttggatgaa gctgatgaaa tgttgaataa aggtttcaaa 3420

gagcagattt acgatgtata caggtacctg cctccagcca cacaggtggt tctcatcagt 3480

gccacgctgc cacacgagat tctggagatg accaacaagt tcatgaccga cccaatccgc 3540

atcttggtga aacgtgatga attgactctg gaaggcatca agcaattttt cgtggcagtg 3600

gagagggaag agtggaaatt tgacactctg tgtgacctct acgacacact gaccatcact 3660

caggcggtca tcttctgcaa caccaaaaga aaggtggact ggctgacgga gaaaatgagg 3720

gaagccaact tcactgtatc ctcaatgcat ggagacatgc cccagaaaga gcgggagtcc 3780

atcatgaagg agttccggtc gggcgccagc cgagtgctta tttctacaga tgtctgggcc 3840

agggggttgg atgtccctca ggtgtccctc atcattaact atgatctccc taataacaga 3900

gaattgtaca tacacagaat tgggagatca ggtcgatacg gccggaaggg tgtggccatt 3960

aactttgtaa agaatgacga catccgcatc ctcagagata tcgagcagta ctattccact 4020

cagattgatg agatgccgat gaacgttgct gatcttatcg aattcgatta caaggatgac 4080

gacgataagg actataagga cgatgatgac aaggactaca aagatgatga cgataaatga 4140

ggatccaccg gatctagata actgatcata attctaccgg gtaggggagg cgcttttccc 4200

aaggcagtct ggagcatgcg ctttagcagc cccgctgggc acttggcgct acacaagtgg 4260

cctctggcct cgcacacatt ccacatccac cggtaggcgc caaccggctc cgttctttgg 4320

tggccccttc gcgccacctt ctactcctcc cctagtcagg aagttccccc ccgccccgca 4380

gctcgcgtcg tgcaggacgt gacaaatgga agtagcacgt ctcactagtc tcgtgcagat 4440

ggacagcacc gctgagcaat ggaagcgggt aggcctttgg ggcagcggcc aatagcagct 4500

ttgctccttc gctttctggg ctcagaggct gggaaggggt gggtccgggg gcgggctcag 4560

gggcgggctc aggggcgggg cgggcgcccg aaggtcctcc ggaggcccgg cattctgcac 4620

gcttcaaaag cgcacgtctg ccgcgctgtt ctcctcttcc tcatctccgg gcctttcgac 4680

ctgcagccca agcttaccat gaccgagtac aagcccacgg tgcgcctcgc cacccgcgac 4740

gacgtcccca gggccgtacg caccctcgcc gccgcgttcg ccgactaccc cgccacgcgc 4800

cacaccgtcg atccggaccg ccacatcgag cgggtcaccg agctgcaaga actcttcctc 4860

acgcgcgtcg ggctcgacat cggcaaggtg tgggtcgcgg acgacggcgc cgcggtggcg 4920

gtctggacca cgccggagag cgtcgaagcg ggggcggtgt tcgccgagat cggcccgcgc 4980

atggccgagt tgagcggttc ccggctggcc gcgcagcaac agatggaagg cctcctggcg 5040

ccgcaccggc ccaaggagcc cgcgtggttc ctggccaccg tcggcgtctc gcccgaccac 5100

cagggcaagg gtctgggcag cgccgtcgtg ctccccggag tggaggcggc cgagcgcgcc 5160

ggggtgcccg ccttcctgga gacctccgcg ccccgcaacc tccccttcta cgagcggctc 5220

ggcttcaccg tcaccgccga cgtcgaggtg cccgaaggac cgcgcacctg gtgcatgacc 5280

cgcaagcccg gtgcctgacc gcgtctggaa caatcaacct ctggattaca aaatttgtga 5340

aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 5400

aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 5460

atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 5520

gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 5580

cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 5640

ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 5700

ggggaagctg acgtcctttc catggctgct cgcctgtgtt gccacctgga ttctgcgcgg 5760

gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 5820

gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 5880

cctttgggcc gcctccccgc ctggaattaa ttctgcagtc gagacctaga aaaacatgga 5940

gcaatcacaa gtagcaatac agcagctacc aatgctgatt gtgcctggct agaagcacaa 6000

gaggaggagg aggtgggttt tccagtcaca cctcaggtac ctttaagacc aatgacttac 6060

aaggcagctg tagatcttag ccacttttta aaagaaaaga ggggactgga agggctaatt 6120

cactcccaac gaagacaaga tatccttgat ctgtggatct accacacaca aggctacttc 6180

cctgattagc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 6240

tgctacaagc tagtaccagt tgagccagat aaggtagaag aggccaataa aggagagaac 6300

accagcttgt tacaccctgt gagcctgcat gggatggatg acccggagag agaagtgtta 6360

gagtggaggt ttgacagccg cctagcattt catcacgtgg cccgagagct gcatccggag 6420

tacttcaaga actgctgata tcgagcttgc tacaagggac tttccgctgg ggactttcca 6480

gggaggcgtg gcctgggcgg gactggggag tggcgagccc tcagatcctg catataagca 6540

gctgcttttt gcctgtactg ggtctctctg gttagaccag atctgagcct gggagctctc 6600

tggctaacta gggaacccac tgcttaagcc tcaataaagc ttgccttgag tgcttcaagt 6660

agtgtgtgcc cgtctgttgt gtgactctgg taactagaga tccctcagac ccttttagtc 6720

agtgtggaaa atctctagca gtagtagttc atgtcatctt attattcagt atttataact 6780

tgcaaagaaa tgaatatcag agagtgagag gccttgacat tgctagcgtt ttaccgtcga 6840

cctctagcta gagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 6900

cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 6960

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 7020

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 7080

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 7140

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 7200

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 7260

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 7320

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 7380

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 7440

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 7500

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 7560

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 7620

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 7680

agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 7740

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 7800

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 7860

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 7920

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 7980

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 8040

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 8100

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 8160

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 8220

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 8280

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 8340

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 8400

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 8460

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 8520

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 8580

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 8640

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 8700

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 8760

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 8820

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 8880

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 8940

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 9000

ttccccgaaa agtgccacct gacgtcgacg gatcgggaga tcaacttgtt tattgcagct 9060

tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 9120

ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatcaac 9180

tggataactc aagctaacca aaatcatccc aaacttccca ccccataccc tattaccact 9240

gccaattacc tgtggtttca tttactctaa acctgtgatt cctctgaatt attttcattt 9300

taaagaaatt gtatttgtta aatatgtact acaaacttag tagt 9344

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号