技术领域
本发明属于生物技术领域,具体涉及一种超级增强子基因序列在促进人B2M基因和膜HLA-I 类蛋白表达中的用途。
背景技术
该背景技术的描述仅仅是对为了方便理解本发明的内容的一般描述,不构成对本发明的任何限制。
移植排斥发生与否主要取决于供、受体之间的组织相容性,其中主要组织相容性抗原即MHC 分子的匹配程度尤为重要。人类的MHC分子也称人类白细胞抗原(HLA),具有高度多态性,由于供者和受者之间HLA分子型通常是不完全相同的,导致HLA配型一直是人体细胞和器官移植临床治疗的关键瓶颈问题。
HLA按其分布和功能分为Ⅰ类抗原(HLA-I)、Ⅱ类抗原(HLA-II)和III类抗原(HLA-III)。β2微球蛋白也叫B2M,在人体中β2微球蛋是由B2M基因所编码,是HLA-I类分子中的重要组成成分。HLA-I作为一种膜蛋白,其表达量直接决定细胞的免疫原性强弱,而B2M(Beta2 Microglobulin,也叫β2M)作为HLA-I的组成成分,对于HLA-I类蛋白固定到的胞膜表面起着至关重要的作用。在缺少B2M表达的情况下,在细胞表面几乎很少能检测到HLA-I类蛋白[1]。
尽管目前普遍认为干细胞具有低免疫原性特点,但是大量的实验数据证明直接移植天然干细胞仍无法避免被免疫排斥的厄运[2-4]。相较于成体细胞,干细胞的低免疫原性表现为HLA-I类抗原的低表达和HLA-II类抗原的不表达。但是我们课题组前期研究表明间充质干细胞(MSC)的免疫原性具有可诱导性。IFN-γ是免疫排斥反应中最常见的促炎症因子之一,在炎症因子IFN-γ作用下MSC的HLA表达水平上升,免疫原性随之升高[5];IFN-γ刺激后的MSC相比于未刺激组,总HLA-I表达量和膜HLA-I表达量均显著上调,且更易被机体排斥[6]。给予IFN-γ刺激后,ESC 和iPSC细胞表面的HLA-I分子表达量会升高,并足以在体内外引起CD8
尽管现有的关于B2M基因的报道大多是通过基因敲除(knockout)的方式来研究B2M基因对细胞免疫原性的影响。这种基因水平上的切割,导致了不可逆的DNA变化,有诸如基因脱靶等许多缺点。然而,关于B2M基因表达的表观调控报道不多,机制更是尚未阐明清楚。
发明内容
针对现有技术存在的问题,本发明从表观遗传学角度出发,通过ChIP-Seq技术,比较了IFN-γ刺激前后增强子标志物H3K27ac修饰区域信号变化情况,首次在B2M基因上发现一段增强子序列,该增强子在IFN-γ刺激后具有超级增强子(Super Enhancer,SE)的特点,并且显著地提高了B2M基因的表达。通过敲低或沉默所述增强子序列,则可显著降低B2M基因和膜HLA-I类蛋白的表达。
本发明发现的增强子序列区域位于:chr15:45002906-45022119,在IFN-γ刺激后具有超级增强子的特点,并且显著地提高了B2M基因的表达。相反,如果能够表观修饰该序列,或者采用其他技术手段来沉默该序列,例如采用现在的基因编辑技术来切断或者剪切其中的一些核苷酸,让其不能起到增强或者降低增强的作用,从而,让B2M基因的转录或者翻译水平降低,就可以降低膜HLA-I类蛋白的表达,从而降低或者减少排斥反应。这是因为,在缺少或者降低B2M表达的情况下,在细胞表面几乎很少能检测到HLA-I类蛋白。而该增强子是影响B2M表达的关键因素之一。
本发明通过生物信息学手段证明了该增强子属于SE,并发现SE抑制剂JQ1可以显著逆转 IFN-γ上调B2M表达的作用。进一步通过CRISPR/Cas9基因编辑技术敲低(knockdown,所谓的敲低就是采用改造的基因编辑技术降低某段序列的活性,也称敲降,区别于切割该序列导致的敲除) 该SE,导致B2M基因转录受到显著抑制,且可实现对IFN-γ的刺激减敏。
在此基础上,本发明构建了一种适用于同种异体移植的通用干细胞,该干细胞中的B2M基因的核心增强子基因序列被部分敲低,或者被沉默,或者部分序列被沉默或者部分序列被敲低。
现有的构建通用干细胞的方法通常依赖于各种载体介导的免疫抑制分子高表达,这就需要在干细胞的基因组上引入外源DNA,存在未知的安全隐患。而且上述方法往往涉及数次基因编辑,得到的多重工程干细胞甚至存在核型不稳定等缺陷,这些细胞的安全性和质量控制均不稳定。此外,某些方案的基因组编辑策略非常繁琐,且多重基因工程操作会影响干细胞基因组的完整性。本发明拟从我们发现的该SE的角度出发,探索和开发更为安全可靠的通用干细胞。
本发明通过CRISPR基因编辑技术敲低或沉默SE,导致B2M基因转录受到显著抑制,即可实现对IFN-γ的刺激减敏,从而构建了一种可以在炎症环境下维持低免疫原性的MSC(以下称为 hypo-MSC)。hypo-MSC低表达膜HLA-I类蛋白,对炎症因子IFN-γ刺激减敏,不引起同种异体 PBMC细胞的免疫反应,能够同时躲避同种异体CD8
一方面,本发明提供了一种增强子,所述增强子位于B2M基因附近,在IFN-γ刺激下能形成超级增强子。
本发明提供了一种核酸序列,是一种增强子,能够增强B2M和膜HLA-I类蛋白表达;如果该序列被沉默或者敲低,则显著降低或者减弱B2M和膜HLA-I类蛋白的表达,从而降低细胞的免疫原性及免疫排斥反应。
在一些方式中,本发明提供的核酸序列,该序列可以增强在炎症因子IFN-γ作用下MSC的 HLA-I类基因的表达水平上升。
本发明描述的增强是指上述核酸序列并不直接转录、翻译HLA-I类基因,但是能够增强HLA-I 基因转录。所以,又称为增强子序列,当增强子存在的时候,可以增强目标基因序列的表达能力,但是本身并不直接表达目的基因。例如,直接表达HLA-I类的基因是该基因,即基因的DNA序列(包括外显子和内含子)转录为RNA,外显子部分的RNA再翻译为蛋白序列,本发明提供的增强子序列能够显著增强该基因的表达,也就是调控该基因的表达(所谓的调控可以是增强,也可以是减弱,甚至让其不表达)。
进一步地,所述增强子区域位于chr15:45002906-45022119,所述chr15:45002906-45022119 具有如SEQ ID NO:7所示的序列。
本发明提供的增强子序列位于B2M基因附近,所述B2M基因附近是指该增强子序列位于 B2M基因的上游或下游,有些为B2M基因的内含子(图1)。本发明发现的增强子区域序列位于:chr15:45002906-45022119,即该增强子的起始位置是15号染色体的45002906位点,终止位置是15号染色体的45022119位点,全长为19214bp,如SEQ ID NO:7所示的序列。
进一步地,所述增强子区域具有6个活性序列,分别为E1~E6,所述E1~E6分别具有如SEQ ID NO:1~SEQ ID NO:6所述的序列。
增强子是能使基因转录频率明显增加的DNA序列,主要存在于真核生物基因中,可以存在于基因的上游、下游、或是为基因中的内含子,因此,在增强子所在区域,具有多段活性序列,这些活性序列可以是基因中的内含子,或是上游或下游序列等。
内含子为基因中的非编码序列,在mRNA加工过程中被剪切掉,故成熟mRNA上无内含子编码序列。内含子对翻译产物的结构无意义,不影响基因的表达。
本发明经大量研究发现,B2M的第一内含子也是增强子的一部分,E2和E3都位于B2M的第一内含子,当E2或E3被敲低、敲除或沉默,都会显著降低B2M基因的表达。
增强子所在区域,及其活性序列与B2M基因的位置关系如图1所示。
所述E1~E6分别位于chr15:45002980-45003650、chr15:45003850-45005400、chr15:45005530-45007575、chr15:45010414-45015507、chr15:45017960-45021156、chr15:45021762-45023541,分别具有如SEQ ID NO:1~SEQ ID NO:6所述的序列。任何一个活性区域被敲低、敲除或沉默,都会降低B2M基因的表达,但是降低的程度有所不同。
进一步地,所述增强子区域的核心增强子片段为E2,所谓核心增强子就是影响B2M基因表达程度最高的增强子区域。
另一方面,本发明提供了如上所述的增强子用于增强B2M基因表达中的用途。
进一步地,所述增强子在IFN-γ刺激下能形成超级增强子,所述超级增强子能进一步促进B2M 基因的表达。
再一方面,本发明提供了一种低表达B2M基因的方法,所述B2M基因的增强子的全部或部分序列敲低或沉默,所述增强子的区域具有如SEQ ID NO:7所示的序列。
再一方面,本发明提供了一种低表达膜HLA-I类蛋白的方法,所述膜HLA-I类蛋白包括HLA-A、 HLA-B、HLA-C中的一种以及B2M蛋白;所述B2M基因的增强子的全部或部分序列敲低或沉默,所述增强子的区域具有如SEQ ID NO:7所示的序列。
再一方面,本发明提供了一种降低膜HLA-I类蛋白表达的方法,主要通过将如上所述的增强子的全部或部分序列敲低或沉默。
进一步地,所述膜HLA-I类蛋白包括HLA-A、HLA-B、HLA-C中的一种以及B2M蛋白。
进一步地,所述方法包括以下步骤:
(1)通过CRISPR基因编辑方法敲低增强子的全部或部分序列;
(2)分选出敲低了增强子全部或部分序列的细胞。
本发明通过CRISPR基因编辑技术敲低(所谓的敲低就是采用改造的基因编辑技术降低某段序列的活性,而不是导致这段序列的缺失)或沉默该增强子,导致B2M基因表达受到显著抑制。
进一步地,所述CRISPRi的引导核苷酸序列分别为sgRNA F和sgRNA R,所述sgRNAF和 sgRNA R的序列分别如SEQ ID NO:16和SEQ ID NO:17所示;所述被敲低的增强子序列位于 chr15:45,004,417-45,004,436。
从理论上说,增强子的任何一个活性序列都能显著促进B2M基因的表达,因此敲低E1~E6 任何一个活性序列,都能降低B2M基因的表达。
本发明发现,SE区域的核心增强子片段为E2,敲低E2区后,对于降低B2M基因的表达的效果最明显。
本发明所述的B2M基因和膜HLA-I类蛋白对于干细胞具有普适性,理论上适用于任何人源细胞。
进一步地,所述干细胞为MSC或ADSC。
再一方面,本发明提供了一种人干细胞,所述干细胞B2M基因的核心增强子的全部或部分序列敲低或者沉默。
在一些方式中,核心增强子的序列被部分敲低,或者被沉默,或者部分序列被沉默或者部分序列被敲出;或者部分序列被沉默,同时部分序列被敲低。
进一步地,所述增强子区域位于chr15:45002906-45022119,所述chr15:45002906-45022119 具有如SEQ ID NO:7所示的序列。
进一步地,所述增强子区域具有6个活性序列,分别为E1~E6,所述E1~E6分别具有如SEQ ID NO:1~SEQ ID NO:6所述的序列。
进一步地,所述增强子区域的核心增强子片段为E2;所述干细胞为MSC或ADSC细胞。理论上所有有核人源细胞,不仅限于干细胞,都可以用于构建本发明提供的低免疫原性的通用型细胞。因此MSC或ADSC的干细胞种类并不是对本发明的限制。
在一些方式中,所述增强子的部分序列被敲低,被敲低的序列位于chr15: 45,004,417-45,004,436。
再一方面,本发明提供了一种干细胞的制备方法,主要通过将B2M基因的核心增强子的全部或部分序列敲低或沉默。
进一步地,所述方法包括以下步骤:
(1)通过CRISPRi敲低增强子序列上的全部或部分片段,所述增强子区域位于chr15:45002906-45022119;
(2)分选出被敲低增强子全部或部分序列片段的细胞。
进一步地,所述CRISPRi的引导核苷酸序列分别为sgRNA F和sgRNA R,所述sgRNAF和 sgRNA R的序列分别如SEQ ID NO:16和SEQ ID NO:17所示。
进一步地,步骤(2)所述的细胞为MSC或ADSC细胞;被敲低的序列位于 chr15:45,004,417-45,004,436。
理论上所有有核人源细胞,不仅限于干细胞,都可以用于构建本发明提供的低免疫原性的通用型细胞。因此MSC或ADSC的干细胞种类并不是对本发明的限制。
在一些方式中,该方法包括如下步骤:提供细胞;将核心质粒(pHR-SFFV-KRAB-dCas9-P2A-mCherry或pLV-U6-gRNA-UbC-eGFP-P2A-Bsr;包装质粒psPAX2、包膜质粒pMD2.G与细胞共培养;获得筛选双阳性的细胞作为增强子敲低的细胞。
再一方面,本发明提供了一种干细胞用于遏制同种异体免疫排斥反应中的用途,所述干细胞的B2M基因的核心增强子区域的全部或部分序列敲低或者沉默。
在一些方式中,所述的干细胞中的B2M基因的增强子基因被沉默或者被敲低,或者部分序列被沉默,或者部分序列被敲低;或者部分序列被沉默,同时部分序列被敲低。
进一步地,所述增强子区域位于chr15:45002906-45022119,所述chr15:45002906-45022119 具有如SEQ ID NO:7所示的序列;所述干细胞为MSC或ADSC细胞。
本发明所述的基因敲低、沉默、切割,都是为了让目的基因的功能降低、丧失或者不能正常发挥增强子的作用。
本发明的有益效果为:
1、首次阐释了B2M基因上一段对IFN-γ刺激产生响应的增强子序列;
2、首次发现该序列在IFN-γ刺激前具有增强子特点,刺激后有SE特点,增强B2M基因的表达;
3、首次发现该序列在IFN-γ刺激下促进B2M基因的表达,进而促进了膜HLA-I蛋白表达;
4、首次阐明了炎症因子IFN-γ通过诱导SE调控B2M基因表达的表观遗传学新机制;
5、为构建低免疫原性的人源细胞提供新的靶点;
6、运用CRISPRi技术,在干细胞内基因编辑该SE,构建出的通用型干细胞,可以实现低免疫原性、逃避同种异体免疫反应;
7、构建通用型干细胞时无需引入免疫抑制分子等外源DNA,也无需多重基因编辑,因此更简便易行;
8、本发明使用可逆的表观修饰,无需更改DNA序列,因此构建的通用型干细胞(如hypo-MSC) 也更安全可靠;
9、本发明提供的方法具有普适性,不是MSC细胞特有,在ADSC细胞中也可实现,理论上可以适用于任何人源干细胞和其他有核人细胞构建通用型细胞。
附图说明
图1为增强子所在区域,及其活性序列与B2M基因的位置关系示意图。
图2为实施例1中的三组MSC的RNA的提取和实时荧光定量PCR检测HLA-A、HLA-B、HLA-C及B2M的表达水平结果的示意图。
图3为实施例2中的五组MSC分别采用q-PCR和流式细胞术进行HLA-A、HLA-B、HLA-C及B2M的表达水平检测结果,其中3A为q-PCR检测结果,3B为流式细胞术检测结果。
图4为实施例3中的H3K27ac ChIP-Seq分析和生物信息学分析结果示意图,其中4A为 H3K27ac ChIP-Seq分析结果示意图,4B为生物信息学分析结果示意图。
图5为实施例4中的超级增强子大片段敲低的实验过程和对HLA-I表达量的检测结果示意图,其中5A为超级增强子的部分DNA序列被敲低的实验过程示意图,5B为对HLA-I表达量的检测结果示意图。
图6为实施例5中慢病毒介导的CRISPRi技术获得改造的hypo-MSC细胞结果示意图,其中 6A为hypo-MSC细胞流式荧光分选结果;6B为慢病毒介导的CRISPRi技术流程示意图;6C为 MSC和ADSC在SE修饰前后的B2M表达水平对比示意图。
图7为实施例6中PBMC与hypo-MSC或MSC共同培养结果示意图,其中7A和7B是PBMC与hypo-MSC或MSC共同培养流式收样检测增殖情况结果示意图;7C是人人γ干扰素(IFN-γ)酶联免疫吸附测定hypo-MSC或MSC中的B2M表达水平对比示意图。
图8为实施例7中NK细胞与hypo-MSC或MSC共同培养结果示意图,其中8A和8B是检测NK细胞的激活标志分子(CD107a)结果示意图;8C是测NK细胞的细胞毒性(LDH)结果示意图。
图9为实施例8中CD8
具体实施方式
本发明所列的具体实施方式仅仅说明本发明如何实现,并不能构成对本发明的限制,而本发明的范围以权利要求为准。
名词英文缩写和中文含义对照:MSC:Mesenchymal Stem Cells,间充质干细胞;ADSC: Adipose-derived Mesenchymal Stem Cell,脂肪间质干细胞;B2M:Beta 2Microglobulin,β2微球蛋白;ESC:Embryonic Stem Cells,胚胎干细胞;iPSC:inducedPluripotent Stem Cells,诱导多能干细胞;SE:Super Enhancer超级增强子;TE:TypicalEnhance,典型增强子;KD:knockdown,敲低。
参考文献:
[1]Lanza R,Russell DW,Nagy A.Engineering universal cells that evadeimmune detection.Nature reviews Immunology.2019;19:723-33.
[2]Aron Badin R,Bugi A,Williams S,Vadori M,Michael M,Jan C,et al.MHCmatching fails to prevent long-term rejection of iPSC-derived neurons in non-human primates.Nat Commun.2019;10:4357.
[3]Dhodapkar KM,Feldman D,Matthews P,Radfar S,Pickering R,Turkula S,et al.Natural immunity to pluripotency antigen OCT4 in humans.Proc Natl AcadSci U S A.2010;107:8718-23.
[4]Zhao T,Zhang ZN,Rong Z,Xu Y.Immunogenicity of induced pluripotentstem cells.Nature. 2011;474:212-5.
[5]Liu H,Lu K,MacAry PA,Wong KL,Heng A,Cao T,et al.Soluble moleculesare key in maintaining the immunomodulatory activity of murine mesenchymalstromal cells.J Cell Sci.2012;125:200-8.
[6]Wang Y,Huang J,Gong L,Yu D,An C,Bunpetch V,et al.The Plasticity ofMesenchymal Stem Cells in Regulating Surface HLA-I.iScience.2019;15:66-78.
[7]Dressel R,Guan K,Nolte J,Elsner L,Monecke S,Nayernia K,etal.Multipotent adult germ-line stem cells,like other pluripotent stem cells,can be killed by cytotoxic T lymphocytes despite low expression of majorhistocompatibility complex class I molecules.Biol Direct.2009;4:31.
实施例1:IFN-γ上调MSC的HLA-I基因表达
本实施例通过具体实验来证明,IFN-γ能上调MSC的HLA-I基因的表达。
1.1细胞培养及处理
MSC培养条件:L-DMEM培养基(含10%胎牛血清)、5%CO2、37℃恒温培养。处理前24小时,将MSC以5×10
将培养得到的MSC分三组,第一组为空白对照,第二组按100ng/ml浓度将IFN-γ加入到培养基中,继续培养24小时;第三组,按100ng/ml浓度将IFN-γ加入到培养基中,继续培养48小时;收集细胞做后续提取RNA等处理。
1.2 MSC的RNA提取和荧光定量PCR(qRT-PCR)
(1)RNA提取:
1)、分别往收集的三组MSC细胞中加入1ml Trizol细胞裂解液;
2)、加入200μl(1/5体积)三氯甲烷,涡旋振荡,静置10min;
3)、预冷离心机,离心:12000g,4℃,15min;
4)、将上清转移到新的1.5ml RNase-free EP管中;
5)、加入等量异丙醇,上下颠倒充分混匀,室温静置10min;
6)、离心:12000g,4℃,15min;
7)、弃上清,加入75%的乙醇1ml,轻轻上下颠倒洗涤;
8)、离心:12000×g,4℃,10min;
9)、弃上清,风干10min;
10)、根据沉淀大小,加入20μl DEPC水,4℃溶解RNA,静置30min,测浓度。
(2)实时荧光定量PCR(qRT-PCR)
1)采用TOYOBO反转录试剂盒(货号:FSQ-201)将上一步提取到的RNA逆转录得到cDNA,体系如下:
2)按照Takara公司(货号:RR420A)的SYBR mix试剂盒说明书上的体系对cDNA进行实时荧光定量PCR:
实时荧光定量PCRⅶ7仪器PCR反应循环条件如下:
所使用的引物序列列表如下表所示:
通过实时荧光定量PCR分别检测三组MSC中的HLA-A、HLA-B、HLA-C、及B2M的含量,三组MSC的RNA的提取和实时荧光定量PCR结果如图2所示。
从q-PCR结果(图2)可以看出,100ng/ml浓度的IFN-γ均可以显著增加MSC的HLA-I基因(HLA-A、HLA-B、HLA-C(也可以简称HLA-ABC)及B2M)的转录水平(即mRNA的含量);且随着IFN-γ作用时间延长,MSC的HLA-I分子的转录水平也随之增加,48小时(h)即可达到转录高峰。
该实验证明IFN-γ可以让与HLA-I家族相关的几个基因的转录水平显著或者极显著提高,则表示可以显著或者极显著提高抗原的表达,抗原蛋白的表达越高则表示引起排斥反应的可能性越大(直接基因的转录水平)。
实施例2:IFN-γ刺激HLA-I表达的过程中有增强子的参与的实验
本实施例分别用125、250和500nmol/ml三种浓度JQ1(购买自:abcam;货号:ab146612;批号:APN15092-1-1;一种增强子抑制剂)进行2小时预处理MSC后,再添加100ng/ml的IFN-γ处理MSC,继续培养48小时后收集细胞并提取RNA做qPCR检测HLA-I相关基因表达情况,并设置相应的MSC空白对照,以及MSC空白对照加IFN-γ处理,共计五组MSC进行比较,分别采用q-PCR和流式细胞术进行检测,结果如图3所示,其中q-PCR的具体过程和序列参见实施例 1的过程和条件,q-PCR结果见图3A,为五组MSC的HLA-A、HLA-B、HLA-C及B2M的表达水平;流式细胞术检测结果见图3B。
1、q-PCR结果
从q-PCR结果(图3A)可以看出,IFN-γ可以显著增加MSC细胞HLA-I基因(HLA-A、HLA-B、 HLA-C及B2M)的转录水平。但这种刺激作用可以被小分子JQ1(一种增强子抑制剂)所抑制,且存在剂量反应关系,随着JQ1的浓度增加,抑制作用增强。
2、流式细胞术结果:
具体过程如下:
(1)收集上述培养的五组MSC细胞,计数,取1×10
(2)加1mL PBS重悬清洗细胞;
(3)200×g离心5min,弃上清;
(4)用40μL稀释后Anti-Mouse 488二抗(Invitrogen,Catalog#A-21202)重悬混匀细胞,冰上避光孵育15min;
(5)加1mL PBS重悬清洗细胞;
(6)200×g离心5min,弃上清;
(7)用300μL PBS重悬细胞,移至流式管,流式上机。
本实施例先用q-PCR检测了HLA-I的mRNA水平,然后进一步采用流式细胞术检测细胞膜上HLA-I蛋白表达情况。流式的结果(图3B)与q-PCR结果一致,当MSC被IFN-γ刺激后,膜 HLA-I表达量上升(峰值右移),当用JQ1预处理的MSC被IFN-γ刺激后,虽然膜HLA-I表达量有一定程度的上升,但峰值右移程度没有IFN-γ刺激组明显,即IFN-γ可以上调MSC细胞膜表面的HLA-I表达量,但JQ1可以明显抑制IFN-γ的作用,意味着当细胞的增强子被JQ1抑制以后, IFN-γ刺激HLA-I上调的作用就被阻断。由这些结果可以推测IFN-γ刺激HLA-I表达过程中可能有增强子的参与,但是该增强子具体如何参与,由下面的实施例来进行证明。
实施例3、IFN-γ对B2M基因附近的增强子开放和活化有促进作用
为进一步了解IFN-γ刺激后HLA-I相关基因的附近是否有增强子参与,以及和那个基因的表达有直接关系,我们进行了H3K27ac ChIP-Seq分析和生物信息学分析。
1、H3K27ac ChIP-Seq分析的过程如下:
室温下将1×10
H3K27ac ChIP-Seq分析结果发现,MSC被IFN-γ刺激后在B2M基因附近H3K27ac信号显著增强,并且有新的H3K27ac信号产生(图4A)。这里证明B2M基因有增强子序列存在,而且是新的序列。图4A上方是IFN-γ刺激前B2M基因附近的增强子情况,下方是IFN-γ刺激后B2M 基因附近的增强子情况,可以看到IFN-γ刺激后H3K27ac的峰值信号明显增强,说明IFN-γ刺激后,这些增强子被激活。
2、SE鉴定的生物信息学分析:
1)H3K27ac ChIP-Seq数据预处理
首先使用FastQC(v0.11.9)评估原始测序数据质量,接着使用trimmomatic(v0.38,默认参数)软件去除测序数据中存在的低质量碱基和接头序列,最后仅保留长度大于50个碱基的序列进行后续分析,并使用FastQC对过滤后的测序数据质量进行重新评估。然后使用二代测序数据比对软件bowtie2(v2.4.1,--very-sensitive)将过滤后的质量合格的序列比对到人参考基因。为了避免 PCR重复对后续分析的影响,使用MarkDuplicates(Picard)标记并去除PCR造成的冗余序列。
2)H3K27ac ChIP-Seq结果可视化
为了更直观的观察H3K27ac ChIP-Seq测序读段在参考基因组上的丰度分布,使用bamCoverage(deepTools,v3.5.1,--binSize 200--smoothLength 600)将比对后的BAM格式的文件转换成bedGraph格式,然后使用UCSC基因组浏览器(UCSC Genome Browser)展示H3K27ac ChIP-Seq读段在参考基因上的丰度分布特征。
3)寻找增强子和超级增强子
基于比对后的BAM格式文件,使用callpeak(MACS2,v 2.2.6)算法识别出H3K27acChIP-Seq 读段显著富集的基因组区域,这些区域被认为是存在H3K27ac修饰。接着我们使用麻省理工学院Richard A.Young实验室开发的一种基于比对后的BAM文件和MACS2识别的H3K27ac修饰区域文件寻找增强子和超级增强子的ROSE(RANK ORDERING OF SUPER-ENHANCERS)软件,该软件首先识别增强子区域,然后对距离小于15kb的相邻增强子进行合并,最后比较合并后的增强子区域内的H3K27ac读段丰度分布情况来识别超级增强子。基于IFN-γ刺激前后hMSC的H3K27ac 数据,可以识别出IFN-γ刺激后hMSC中新出现的超级增强子。
经过生物信息学分析发现,这些区域在未经IFN-γ刺激的MSC细胞中属于典型的增强子,在 IFN-γ刺激后具有超级增强子的特点(图4B)。图4B是对H3K27ac的测序结果进行生物信息学分析,左边是IFN-γ刺激前MSC所有基因的增强子信号情况,可以看到HLA-I相关基因(HLA-A、 HLA-B、HLA-C及B2M)均位于两条虚线交叉点下方,即IFN-γ刺激前HLA-I相关基因的增强子均未达到超级增强子的阈值,不属于超级增强子范畴;右边IFN-γ刺激后MSC所有基因的增强子信号情况,可以看到HLA-I相关基因(HLA-A、HLA-B、HLA-C及B2M)中,只有B2M的增强子达到超级增强子的阈值,即属于超级增强子范畴。这也说明,该增强子序列处于B2M基因的附近,而不位于其它基因HLA-A、HLA-B、HLA-C的附近。
实施例4、超级增强子大片段敲除后降低膜HLA-I表达量
利用配对sgRNA CRISPR基因编辑方法(paired-gRNA CRISPR-Cas9)中成对的sgRNA可在同一基因中造成两处断裂的特点,对超级增强子的部分DNA序列(图5A中红色箭头所示位置,敲出的位置为:chr15:45004785-45006364,敲出序列的长度为1579bp进行大片段敲除,该大片段横跨了E2和E3的部分区域,用流式荧光细胞分选方式将敲除细胞(KO)分选出来。
配对的sgRNA序列如下,sg-KO1-F:ATTCTCCAGAGCAAACTGGG(SEQ ID NO:19); sg-KO1-R:CCCAGTTTGCTCTGGAGAAT(SEQ ID NO:20);sg-KO2-F: TAGTTTACAGCAATCACCTG(SEQID NO:21);sg-KO2-R:CAGGTGATTGCTGTAAACTA(SEQ ID NO:22)。
SE核心序列敲除实验表明,当敲除该序列之后,KO细胞的膜HLA-I表达量较MSC对照组明显下降,甚至几乎检测不到;且对IFN-γ刺激减敏,IFN-γ刺激后,KO细胞的膜HLA-I表达量较 MSC对照组刺激后的表达量,明显下降。
图5A是实验的示意图,即在峰1的前后位置设计两个sgRNA,运用CRISPR技术在两个 sgRNA位置造成DNA断裂,从而实现部分增强子的大片段DNA序列敲除。经流式细胞术分析,结果如图5B显示,增强子被敲除之后(KO组),相较于未敲除组(MSC组),膜HLA-I表达量明显下降(峰值左移),与blank组相比,几乎处于完全未表达B2M基因的水平;且当用IFN-γ刺激KO组后(KO+IFN-γ组),膜HLA-I表达量的上升程度没有未敲低组(MSC+IFN-γ组)明显,与blank组相比,也几乎处于完全未表达B2M基因的水平,说明增强子敲除后的MSC对IFN-γ刺激完全减敏了。也证明,该增强子的大片段序列的缺失,严重影响了B2M基因的表达,从而也降低了膜HLA-I表达量。
因此,大片段敲除容易导致B2M基因几乎完全不表达,这增加了MSC的免疫原性(因为缺失B2M会引起自然杀伤细胞的免疫排斥反应),并不能用于构建通用干细胞,进一步表明敲低的方法比敲除更适合构建通用干细胞。
实施例5:慢病毒介导的CRISPRi技术获得改造的hypo-MSC细胞
为了构建通用干细胞hypo-MSC,本实施例采用针对增强子中的核心增强子片段E2中的部分序列进行小片段敲低,从而顺利构建得到hypo-MSC细胞。
本实施例提供的hypo-MSC细胞的制备主要通过以下步骤来实现:
(1)sgRNA设计及重组质粒构建:
针对增强子序列(SEQ NO:1)来设计sgRNA(Benchling网站:
分别在sgRNA两端加酶切位点,在sgRNA序列的正义链的5’端添加CACC,反义链的5’端添加AAAC,从而形成与pLV-U6-gRNA-UbC-eGFP-P2A-Bsr质粒(Addgene:#83925)经FastDigest Bbs I酶切后互补的粘性末端。如果正义链的5’端第一个碱基不是G,则在5’端CACC后面增加一个G,相应的反义链3’端再增加一个C。pLV-U6-gRNA-UbC-eGFP-P2A-Bsr为含有U6启动子的 sgRNA骨架表达载体,带有GFP绿色荧光蛋白基因和氨苄青霉素抗性。
①用Fast Digest Bbs I对pLV-U6-gRNA-UbC-eGFP-P2A-Bsr进行酶切,DNA凝胶电泳后回收线性化的载体。
②用T4 PNK对sgRNA序列进行磷酸化和退火;用T4 ligase将线性的 pLV-U6-gRNA-UbC-eGFP-P2A-Bsr质粒载体分别与退火后的sgRNA双链序列室温连接1h。连接产物转化感受态细菌Trans 109,冰浴30min,42℃45s,冰上2min。在氨苄抗性的LB平板上筛选克隆。挑取阳性克隆摇菌,送测序。测序引物为U6启动子的正向引物序列, 5’-GAGGGCCTATTTCCCATGATTCC-3’(SEQ ID NO:18)。测序正确的克隆即为重组质粒。
(2)提前一天按2×106/皿将HEK293FT细胞种于10cm细胞培养皿,保证第二天细胞融合度达到60%作用。
(3)种板后12-18小时为最佳转染时间。按ViaFect转染试剂说明书,将核心质粒(pHR-SFFV-KRAB-dCas9-P2A-mCherry(Addgene:#60954)或步骤1中的重组质粒、包装质粒psPAX2(Addgene:#12260)、包膜质粒pMD2.G(Addgene:#12259)按照4:3:2的比例共转染HEK293FT细胞。
(4)分别在转染后24小时、48小时和72小时连续收集3次病毒原液,每次收集的病毒液需用0.45μm滤膜过滤去除细胞碎片及其他杂质。
(5)提前一天按1×10
(6)感染前用新鲜培养基等体积混合病毒原液(步骤3),加入2μl 10mg/ml的聚凝胺(终浓度为10μg/ml)混匀后,加入六孔板内。如此反复感染三次。
(7)感染后48小时,待细胞融合度达到80-90%后,进行流式荧光分选,将mCherry(红色荧光)和GFP(绿色荧光)双阳性的细胞分选出来,扩增培养。理论上存活的MSC为稳定敲低该增强子基因的细胞株。
基于已发现的B2M基因上响应IFN-γ刺激的超级增强子SE,本实施例运用慢病毒CRISPRi 的方法对该SE进行表观修饰,敲低了增强子的E2活性序列中的部分片段,位于chr15: 45,004,417-45,004,436。
结果表明,表观抑制该SE后,能够显著降低B2M基因表达,且能大幅阻遏IFN-γ刺激的 B2M基因表达。我们进一步在原代ADSC细胞中验证了该方法的可行性和重复性,ADSC中得到的结果与MSC结果一致(具体见图6A和图6B)。这说明我们这种构建低免疫原性细胞的方法不是MSC专用的,具有普适性。我们将此方法构建的低免疫原性MSC称为hypo-MSC。
可以理解,在其他任何细胞中,采用此方法都是可以让本发明发现的SE序列进行修饰、部分基因序列的敲低、或者反向基因的沉默等等技术授权,让SE被抑制,抑制后,降低B2M基因表达,从而降低其他类似基因的活性,减少免疫原性,从而降低排斥反应。也可以理解,除了本发明的敲低该序列的基因可以改变或者抑制SE基因,在其它位置,也是可以显著抑制该基因的活性或者功能,从而降低B2M基因表达。
从图6A可以看出,BF(明场)用来做荧光信号(红色荧光或绿色荧光)强弱的对照,进行了基因敲低的细胞具有mCherry(红色荧光)和GFP(绿色荧光)出现,表示稳定的敲低SE的细胞的存在。
图6C为MSC和ADSC在SE修饰前后的B2M表达水平对比示意图,其中,MSC-KRAB代表稳定表达dCas9-KRAB的MSC,MSC-sgRNA代表同时稳定表达dCas9-KRAB和sgRNA的MSC。只有在sgRNA的引导下,dCas9-KRAB才能发挥作用。本实施例针对增强子设计了一对sgRNA (正、反两条),这对sgRNA可以引导dCas9-KRAB到达增强子区域,发挥敲低增强子作用。而 MSC-KRAB细胞由于缺乏这对sgRNA,不能发挥增强子敲低作用,用来做对照细胞。
从图6C的B2M的表达水平来看,对于MSC细胞,没有经过SE修饰的细胞和经过SE序列修饰的细胞,MSC表达量为显著差异。同样,对于IFN-γ刺激的B2M基因表达的时候,两者也表现出显著差异。这充分说明,本发明的方法可以抑制SE活性,从而显著降低B2M基因的表达水平。对于ADSC细胞是一样的结论。
但是与实施例4的大片段敲除相比,本实施例经过对核心增强子片段的进行小片段的敲低,不会完全抑制B2M的正常表达,从而能够构建得到通用干细胞hypo-MSC。
实施例6、hypo-MSC不引起同种异体PBMC的免疫反应
本实施例将同种异体PBMC用CFSE染料标记后,与hypo-MSC(实施例5制备的细胞)、MSC(对照)共同培养,流式收样检测PBMC细胞增殖情况(PBMC的增殖情况可反应免疫排斥反应的强烈程度),并通过人γ干扰素(IFN-γ)酶联免疫吸附测定来检测免疫反应中炎症因子分泌情况,具体步骤如下:
1、PBMC混合培养
(1)用PBS将血液稀释;
(2)取适量Ficoll于15mL离心管,在Ficoll上层缓慢添加稀释后的血液;
(3)300×g,30min离心后取中间絮状层于新的离心管,加PBS清洗,计数;
(4)根据CFDA-SE细胞增殖与示踪检测试剂盒说明书对分离的反应细胞PBMC(同种异体) 进行染色37℃,10min。然后用完全细胞培养液清洗2次,离心,用完全细胞培养液重悬细胞计数,作为反应细胞;
(9)MSC和hypo-MSC贴壁后,用5ng/mL丝裂霉素37℃,15min孵育处理后,然后用完全细胞培养液清洗2次,离心,用完全细胞培养液重悬细胞计数,作为刺激细胞;
(10)以1×10
(11)以1×10
(12)将U型96孔板放回细胞培养箱分别培养3~5天后,流式收样检测反应细胞的增殖情况。
2、人γ干扰素(IFN-γ)酶联免疫吸附测定:
(1)预先计算好所需的板条数,实验前30min,拿出试剂盒,恢复至室温;
(2)每个反应孔中加入100μl标准品工作液及检测样本(若样本浓度高于检测范围,需用标准品&样本稀释液稀释后取样),标准品需做复孔,封板后于37℃孵箱孵育90min;
(3)弃去液体,甩干,每个反应孔中加入100μl生物素标记γ干扰素抗体工作液至反应孔中 (共培养的两个处理,PBMC+hypo-MSC;PBMC+MSC),封板后于37℃孵箱孵育60min;
(4)洗涤:弃去液体,甩干,每个反应孔中加入350μl洗涤液,浸泡1-2min,甩干洗涤液,重复4次;
(5)每个反应孔中加入100μl HRP标记链霉亲和素工作液至反应孔中,封板后于37℃孵箱孵育30min;
(6)洗涤:每个反应孔中加入300μl洗涤液,间隔30s,甩干洗涤液。重复4次;
(7)每个反应孔中加入90μl显色剂(避光)至反应孔中,封板后于37℃避光显色15min 左右;
(8)每个反应孔中加入50μl终止液,即刻用酶标仪450nm波长下测量OD值(5min内);
(9)用酶标仪450nm波长测定OD值;
(10)计算标准品、样品的平均OD值:每个标准品和样本的OD值应减去零孔的OD值;
(11)以标准品浓度为横坐标,吸光度OD值为纵坐标,用软件绘制标准曲线(作图时去掉空白组的值)。
(12)若样本OD值高于标准曲线上限,应做适当稀释后重新检测,计算浓度时再乘以稀释倍数。
将同种异体PBMC用CFSE染料标记后,与hypo-MSC(实施例5的细胞)、MSC(对照)共培养,图7A和7B是PBMC与hypo-MSC或MSC共同培养流式收样检测增殖情况结果示意图,其中E/T是指Effector:Target ratio(效应细胞(这里是指PBMC)与靶细胞(这里是指MSC或hypo-MSC细胞)的比值),结果表明MSC组可引起强烈的免疫反应,PBMC大量增殖,而hypo-MSC 组的PBMC几乎没有增殖现象(图7A和7B)。阳性对照是两种不同来源的PBMC混合培养,由于来源不同,所以一定会引起免疫排斥反应,故叫阳性对照;阴性对照是单独培养的PBMC,没有与其他细胞混合,因此一定不会发生免疫排斥反应;阴阳对照一起用来说明本实验成功,没有假阳性和假阴性的情况发生。
一步检测共培养前后的hypo-MSC和MSC的免疫原性变化情况,结果表明,MSC在与PBMC 共培养之后B2M基因明显上调,而hypo-MSC在共培养前后均可维持低水平的B2M基因表达。说明hypo-MSC具有低免疫原性,且可在炎症环境下维持低免疫原性(图7C)。
实施例7、hypo-MSC能够逃避NK细胞的杀伤
将PBMC中的NK细胞(自然杀伤细胞)分离出来,NK细胞分别以1:1、3:1和10:1的比例关系与hypo-MSC、MSC继续共培养(所谓共培养就是将两种不同类型的细胞放到同一个培养体系里面混合培养,这里是指将NK细胞分别与hypo-MSC、MSC共培养,检测NK细胞对两种的排斥情况),检测NK细胞的激活标记物质marker(CD107a)和细胞毒性(LDH)。
结果表明,在NK细胞与hypo-MSC或MSC分别在1:1、3:1和10:1三种混合比列共培养情况下,hypo-MSC和MSC激活的NK细胞比例均无差异(图8A和8B),LDH也无统计学差异(图8C),说明hypo-MSC的低免疫原性不足以激活同种异体NK细胞。
实施例8、hypo-MSC能够逃避CD8+T细胞的杀伤
事先用MSC和PBMC混合培养五天,将其中CD8+T细胞分离出来,与hypo-MSC、MSC继续共培养,检测CD8+T细胞的激活marker(CD69)、细胞毒性(LDH)和炎症因子IFN-γ分泌情况。
结果表明,hypo-MSC较MSC组,显示更低的CD8+T激活(图9A)、更低的T细胞杀伤作用(图9B)及更低的IFN-γ分泌(图9C);CD8+T细胞增殖实验也证实,hypo-MSC几乎不能引起CD8+T细胞增殖(图9D和9E)。说明hypo-MSC的低免疫原性能够逃避同种异体CD8+T细胞的杀伤。
缺少本文中所具体公开的任何元件、限制的情况下,可以实现本文所示和所述的发明。所采用的术语和表达法被用作说明的术语而非限制,并且不希望在这些术语和表达法的使用中排除所示和所述的特征或其部分的任何等同物,而且应该认识到各种改型在本发明的范围内都是可行的。因此应该理解,尽管通过各种实施例和可选的特征具体公开了本发明,但是本文所述的概念的修改和变型可以被本领域普通技术人员所采用,并且认为这些修改和变型落入所附权利要求书限定的本发明的范围之内。
本文中所述或记载的文章、专利、专利申请以及所有其他文献和以电子方式可得的信息的内容在某种程度上全文包括在此以作参考,就如同每个单独的出版物被具体和单独指出以作参考一样。申请人保留把来自任何这种文章、专利、专利申请或其他文献的任何及所有材料和信息结合入本申请中的权利。
序列表
<110> 浙江大学
<120> 超级增强子基因序列在促进人B2M基因表达中的用途
<160> 22
<170> SIPOSequenceListing 1.0
<210> 1
<211> 671
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
aaagccctag cagttactgc ttttactatt agtggtcgtt tttttctccc ccccgccccc 60
cgacaaatca acagaacaaa gaaaattacc taaacagcaa ggacataggg aggaacttct 120
tggcacagaa ctttccaaac actttttcct gaagggatac aagaagcaag aaaggtactc 180
tttcactagg accttctctg agctgtcctc aggatgcttt tgggactatt tttcttaccc 240
agagaatgga gaaaccctgc agggaattcc caagctgtag ttataaacag aagttctcct 300
tctgctaggt agcattcaaa gatcttaatc ttctgggttt ccgttttctc gaatgaaaaa 360
tgcaggtccg agcagttaac tggctggggc accattagca agtcacttag catctctggg 420
gccagtctgc aaagcgaggg ggcagcctta atgtgcctcc agcctgaagt cctagaatga 480
gcgcccggtg tcccaagctg gggcgcgcac cccagatcgg agggcgccga tgtacagaca 540
gcaaactcac ccagtctagt gcatgccttc ttaaacatca cgagactcta agaaaaggaa 600
actgaaaacg ggaaagtccc tctctctaac ctggcactgc gtcgctggct tggagacagg 660
tgacggtccc t 671
<210> 2
<211> 1551
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cccgctctgc accctctgtg gccctcgctg tgctctctcg ctccgtgact tcccttctcc 60
aagttctcct tggtggcccg ccgtggggct agtccagggc tggatctcgg ggaagcggcg 120
gggtggcctg ggagtgggga agggggtgcg cacccgggac gcgcgctact tgcccctttc 180
ggcggggagc aggggagacc tttggcctac ggcgacggga gggtcgggac aaagtttagg 240
gcgtcgataa gcgtcagagc gccgaggttg ggggagggtt tctcttccgc tctttcgcgg 300
ggcctctggc tcccccagcg cagctggagt gggggacggg taggctcgtc ccaaaggcgc 360
ggcgctgagg tttgtgaacg cgtggagggg cgcttggggt ctgggggagg cgtcgcccgg 420
gtaagcctgt ctgctgcggc tctgcttccc ttagactgga gagctgtgga cttcgtctag 480
gcgcccgcta agttcgcatg tcctagcacc tctgggtcta tgtggggcca caccgtgggg 540
aggaaacagc acgcgacgtt tgtagaatgc ttggctgtga tacaaagcgg tttcgaataa 600
ttaacttatt tgttcccatc acatgtcact tttaaaaaat tataagaact acccgttatt 660
gacatctttc tgtgtgccaa ggactttatg tgctttgcgt catttaattt tgaaaacagt 720
tatcttccgc catagataac tactatggtt atcttctgcc tctcacagat gaagaaacta 780
aggcaccgag attttaagaa acttaattac acaggggata aatggcagca atcgagattg 840
aagtcaagcc taaccagggc ttttgcggga gcgcatgcct tttggctgta attcgtgcat 900
ttttttttaa gaaaaacgcc tgccttctgc gtgagattct ccagagcaaa ctgggcggca 960
tgggccctgt ggtcttttcg tacagagggc ttcctctttg gctctttgcc tggttgtttc 1020
caagatgtac tgtgcctctt actttcggtt ttgaaaacat gagggggttg ggcgtggtag 1080
cttacgcctg taatcccagc acttagggag gccgaggcgg gaggatggct tgaggtccgt 1140
agttgagacc agcctggcca acatggtgaa gcctggtctc tacaaaaaat aataacaaaa 1200
attagccggg tgtggtggct cgtgcctgtg gtcccagctg ctccggtggc tgaggcggga 1260
ggatctcttg agcttaggct tttgagctat catggcgcca gtgcactcca gcgtgggcaa 1320
cagagcgaga ccctgtctct caaaaaagaa aaaaaaaaaa aaagaaagag aaaagaaaag 1380
aaagaaagaa gtgaaggttt gtcagtcagg ggagctgtaa aaccattaat aaagataatc 1440
caagatggtt accaagactg ttgaggacgc cagagatctt gagcactttc taagtacctg 1500
gcaatacact aagcgcgctc accttttcct ctggcaaaac atgatcgaaa g 1551
<210> 3
<211> 2046
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
acaatctgat atttaaaaaa aaatcttatt ttgaaaattt ccaaagtaat acatgccatg 60
catagaccat ttctggaaga taccacaaga aacatgtaat gatgattgcc tctgaaggtc 120
tattttcctc ctctgacctg tgtgtgggtt ttgtttttgt tttactgtgg gcataaatta 180
atttttcagt taagttttgg aagcttaaat aactctccaa aagtcataaa gccagtaact 240
ggttgagccc aaattcaaac ccagcctgtc tgatacttgt cctcttctta gaaaagatta 300
cagtgatgct ctcacaaaat cttgccgcct tccctcaaac agagagttcc aggcaggatg 360
aatctgtgct ctgatccctg aggcatttaa tatgttctta ttattagaag ctcagatgca 420
aagagctctc ttagctttta atgttatgaa aaaaatcagg tcttcattag attccccaat 480
ccacctcttg atggggctag tagcctttcc ttaatgatag ggtgtttcta gagagatata 540
tctggtcaag gtggcctggt actcctcctt ctccccacag cctcccagac aaggaggagt 600
agctgccttt tagtgatcat gtaccctgaa tataagtgta tttaaaagaa ttttatacac 660
atatatttag tgtcaatctg tatatttagt agcactaaca cttctcttca ttttcaatga 720
aaaatataga gtttataata ttttcttccc acttccccat ggatggtcta gtcatgcctc 780
tcattttgga aagtactgtt tctgaaacat taggcaatat attcccaacc tggctagttt 840
acagcaatca cctgtggatg ctaattaaaa cgcaaatccc actgtcacat gcattactcc 900
atttgatcat aatggaaagt atgttctgtc ccatttgcca tagtcctcac ctatccctgt 960
tgtattttat cgggtccaac tcaaccattt aaggtatttg ccagctcttg tatgcattta 1020
ggttttgttt ctttgttttt tagctcatga aattaggtac aaagtcagag aggggtctgg 1080
catataaaac ctcagcagaa ataaagaggt tttgttgttt ggtaagaaca taccttgggt 1140
tggttgggca cggtggctcg tgcctgtaat cccaacactt tgggaggcca aggcaggctg 1200
atcacttgaa gttgggagtt caagaccagc ctggccaaca tggtgaaatc ccgtctctac 1260
tgaaaataca aaaattaacc aggcatggtg gtgtgtgcct gtagtcccag gaatcacttg 1320
aacccaggag gcggaggttg cagtgagctg agatctcacc actgcacact gcactccagc 1380
ctgggcaatg gaatgagatt ccatcccaaa aaataaaaaa ataaaaaaat aaagaacata 1440
ccttgggttg atccacttag gaacctcaga taataacatc tgccacgtat agagcaattg 1500
ctatgtccca ggcactctac tagacacttc atacagttta gaaaatcaga tgggtgtaga 1560
tcaaggcagg agcaggaacc aaaaagaaag gcataaacat aagaaaaaaa atggaagggg 1620
tggaaacaga gtacaataac atgagtaatt tgatgggggc tattatgaac tgagaaatga 1680
actttgaaaa gtatcttggg gccaaatcat gtagactctt gagtgatgtg ttaaggaatg 1740
ctatgagtgc tgagagggca tcagaagtcc ttgagagcct ccagagaaag gctcttaaaa 1800
atgcagcgca atctccagtg acagaagata ctgctagaaa tctgctagaa aaaaaacaaa 1860
aaaggcatgt atagaggaat tatgagggaa agataccaag tcacggttta ttcttcaaaa 1920
tggaggtggc ttgttgggaa ggtggaagct catttggcca gagtggaaat ggaattggga 1980
gaaatcgatg accaaatgta aacacttggt gcctgatata gcttgacacc aagttagccc 2040
caagtg 2046
<210> 4
<211> 5094
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ccacttggta aaaaatgtga accccttgta tatagagttt ggctcacagt gtaaagggcc 60
tcagtgattc acattttcca gattaggaat ctgatgctca aagaagttaa atggcatagt 120
tggggtgaca cagctgtcta gtgggaggcc agccttctat attttagcca gcgttctttc 180
ctgcgggcca ggtcatgagg agtatgcaga ctctaagagg gagcaaaagt atctgaagga 240
tttaatattt tagcaaggaa tagatataca atcatccctt ggtctccctg ggggattggt 300
ttcaggaccc cttcttggac accaaatcta tggatattta agtcccttct ataaaatggt 360
atagtatttg catataacct atccacatcc tcctgtatac tttaaatcat ttctagatta 420
cttgtaatac ctaatacaat gtaaatgcta tgcaaatagt tgttattgtt taaggaataa 480
tgacaagaaa aaaaagtctg tacatgctca gtaaagacac aaccatccct ttttttcccc 540
agtgtttttg atccatggtt tgctgaatcc acagatgtgg agcccctgga tacggaaggc 600
ccgctgtact ttgaatgaca aataacagat ttaaaatttt caaggcatag ttttatacct 660
gatggccagc tttgtttatt tgaccaagaa tctgagttag ctagttctag gtactgacag 720
gataaataaa acacaacact gctcccgatc ttctcagttt agcagaggga cagatatgca 780
ctcaaataat taaaatatat cctgataaga atatagcata ggtacgcgcg aagaacttgg 840
caatcgaaat tttgttgttc aggctgggcg aggtgtctca tgtctgtaat cccagcactt 900
tgggaggcca tggtaggatg atcgcttgag cccaggagtc cgagaccagc ctgggcaaca 960
taacaagacc ctgtctcaat tcaaagaatt gaattaaaaa aaacaaaaaa taattttttt 1020
aaaaaagaaa tgttgttgtt caaggaacaa caacaaaaat ctagggaggt gttagagaag 1080
ccatttgcct gagctgagag taagttgcta gtggttctct tgattggtag gtggggcctg 1140
ggtttccagg catggtagcc aggaaggaca gccacatggc aggtttgggt aattccaaac 1200
agtggaggaa gggtgtctgg gggaagactt gtaggaactc agctgaaaaa attgggggat 1260
gatactctga aagaaaaaca aagttttaaa atttctactc ttacacttaa cacataatgc 1320
ttctgtgacc ggatatttag gggttttccc cccacactct gttaggagaa aaattttaga 1380
cagattaaat ttaacagagt ttaactgagc aaaaatgatt ctcgaaccag gcagctgccg 1440
gagccagaat aggttcaaaa tgactctggg ggtgccacat ggttggatga catttaggga 1500
cagaaaaagg aaagtgatgt gcagaaaatg gaagtcaggg gcagaagcag ccagattggt 1560
tgcagttcag catttgcctc atttaaacag ggtttgaaga gttggccacc tgtgattggc 1620
tgagactctg tggtataaga gtaagttaca gtctgtttac acatccagtt aggttacagt 1680
tcactatgca gagagaaatc tttagcctga acttacacag ggaggcagtt ttatttattt 1740
atttaatttt ttttttttga gacaaggtct cactctgtca cccgggctgg agttcagtgg 1800
tatgatcatg gcttattgca gcctcgactt cctggcctca agcaatcctt ccgcctcagg 1860
ctctagagta gctgggacta caggcacatg tcagcatgcc tggctaattt tgttttttaa 1920
tttttagtag agatgaactc ctggccttgc acaattcttt cgcctcagcc tccgaaaatg 1980
ctgggattac aggtgtgagc cactgtgccc agctaaggca actttaggct aaaccttttt 2040
ttgagacaga gtttctctct tgttgtctag gctggagtgc agttgcacca tcttggctca 2100
ctgcaacctc cacctccagg gttcaagtga ttctcgttcc tcagcctccc gagtaactgg 2160
gattacaggc atgcgccacc acgcctggct aattttgtgt ttttagtaga gatggtgttt 2220
caccatgttg tccaggctgg tctcaaactc ctggcctcaa gtgatcctct ggcctcagct 2280
tcccagagta ctgagattac aggcatgagc cactgtgccc tgcctaggct aaacttaatt 2340
taacaacacc aaacaatctc cagcagacac caactgggta tcccataatt caattcgatt 2400
ttgattggat ctacctggag atggtgtcag atcccgctgg ttgagggttc agtcccacaa 2460
gactgccctc cacttcagat gccaatcaca cattgtaggt tgttacctct acttctgact 2520
gaccagctgg aaaccagaac tcccatgact gcctccttga ctttggttaa tttgctagga 2580
cagttcatat ttaccaatct attataaaag attaaaggct acagacgaat aactagatga 2640
aaagatgaat agggctatat gtagggggtt gtggtggtga cagtccatgc cctctccagg 2700
tgtatgccac cctcccagca cctccacaca ttcagcaaac aggaagctca tcgttcaaga 2760
gtttttatag agcttgatct ccagctcccc ttcaccttcc cagaggtgga tgggtggggg 2820
tggaagttcc aacacactaa tcttctcatc acttggtctt tctggtgact agcaccatcc 2880
tgaggctatc taggggccca aacctatgag tataacctca ttagcatata ctcaagggtt 2940
accaaagagg cttattatta ataataaaag acactcctat cactcaaaat tcaaaggatt 3000
ttaggaactt ctgacaggaa ctggggacaa agaccaaatg tgtttcatat tataccacac 3060
ttacctaggc cattcattaa ctcttcacct ggctgcaaac taaaattaca tgtagagttt 3120
gtaagaacaa aacaaacaca cacacagaca cacacacaca cacacacaca cacacacaca 3180
cacacacaca aaacaacaag gcaggcacgg tggctcacgc ctgtaagccc aacactttgg 3240
aaagtcaagg tgagcagatt acgaggagtt caagaccagc ctggctaaca tggtgaaacc 3300
ctgtctctac taagaataca aaaattagcc aggcatggtg gcacgtgcct ataatcccag 3360
ctactcagga ggctgaggca agagaatcgc ttgaacctcg gaggcagagg ttgcagtgag 3420
ccgagatcat gccattgcac tccagcctga gtgacagagt gagactccat ctcaaaaaca 3480
gcaacaacaa caacaacaac aacaacaaca acaacaacaa ctcaccagct tcccagactc 3540
ccatccaggc caattaaacc ataatctctc ggtatggagc ccaggtatag tgttattttt 3600
taaaaaacct ctagatagtt ttaatgtaca tccaagattg acagacccat tgagttcagt 3660
cataaagaac tctctctcca ttccatatca ttcaacagag ctattttgtg aggggctgct 3720
ctgctggctg atattacaag gtaatactat gtcaaagtca aatgaaatat agagttgaat 3780
ctctgaaatt aaaatgtttt atttgggagg aaagaattgc aactcagggc atacacacag 3840
accagctggt ctttggcatg tctgaagtac aaaaaggttt tataaaatgg gaaaatgtta 3900
cttatcgctc tgagaaaatt tcactggtgc tagtaaagtt ttgaggagct ggcaagtttt 3960
gattggcaaa tgatgacaat aaacagaact agtctcagag ttgtagcagg tcatttcagt 4020
agccattagt taaacctggt ttcagatgat agcaggcagt ttcagcttcc aggcttgcag 4080
aaaatcgcat ttttggaaca atgttttgtg ccctgagtgc ttctccctgg cttcttgact 4140
ctgttttagt tgagtaagac aaaaatgacc cagtttgatg accaactttc acagttcctt 4200
tggagcatgc cttagtttct ctttttagaa gagagcaagc aaagaggagg aatacaggaa 4260
gcttaattaa ccttattaaa tataattgtg caatgcaaat taaactgaaa agtcccaaca 4320
tcagtaatag agaagtagat cctacatact gacatggaag catacccata ctatattgct 4380
gaaacaaaaa ttagtttcta caaaatatgt gtaagaagcc actttaaaaa aacaaactag 4440
gtggggcatg gtggctcaca cctgtaatcc cagcattttt ggaggccaag gtgggaggac 4500
tgcgtgagct aagaagtttg agacaagcct gggcaacata gtgagaccca gtctctctct 4560
ctatttatgt atttatttat gtatgtacat atttattgat ttatttattt gagacggagt 4620
cttgccctgt cacccaggct ggagtgcaat gtcgtgatct cagctcactg caacctccac 4680
ctcccaggtt caaacgattc tcctgcctca gcctcctgag tagctggaat tacaggcacc 4740
cgccaccata cccagctaat tattttttgt atttttagta gagacgggat ttcatcatgt 4800
tggtcaggct ggtctcaaac tcctgacctc atgatccacc cgcctcggcc tcccaaagtg 4860
ctgggattac aggtgtgagc caccgcgccc ggccgagacc cagtctcttt aaaaaaaaat 4920
ggctaacatg gtgaaacccc atctctacta aaaatacaaa aattagctgg gtgtggtggt 4980
acatacctgt aatcccagct acttgggagg ctgaggcagg agaatcactt gaacccagga 5040
ggcggaggtt gcagtgagcg gagattgcat caccgcacac tagcctgggt gaca 5094
<210> 5
<211> 3197
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gagatggagt cttgctaggt cacccaggct ggagtgcagt ggtgcgatct cggctcactg 60
caacctctgc ctcctgggtt cacaccattc tcctgcctca gcctcccaag tagctgggac 120
tacaggtgcc tgccaccacg ccaggttaat tttttgtatt tttagtagag acagggtttc 180
accgtgttag ccaggatggt ctcgatctcc tgacctcatg atccacccat cttggcctcc 240
caaagtgctg ggattacagg catgaaccac tgcgcccggc cgcatcgcta gtttttaaaa 300
actttttgta gagacagatt cttactatgt tgccaaggct ggtctcaaac tcctggcctc 360
aagagatcct ccagtcttcg gcctcccaaa aagatgggat tacaggcatg agccacctca 420
cctggcctct tttttttgta tattacctga tctcaggtat tctgctatag caacagaaag 480
acgaagacag aatccttagc tgtctgcaag tgtgcatgcc attttcatca tctgaagagt 540
cagcgagtgt cttaggtgga gtcttgcaaa agcaggccct gagccaaaga tttggatgca 600
aatgacttgt taagaaaggg ctcttcgaga ccgtgccatt gcactccagc ccgggcaaga 660
agagtgaaac tctgtttcaa aaaaaaaaaa gtggggggct cctaggaaaa gaacagtaaa 720
ggagtggggg atgaaggaca gggaatggga agaagccaag cgagagcatg atttccgaag 780
tcctacactc agcctgatca cacgggaagc tttagaacaa agaacacacc tcagagtttt 840
tcctgcctca acacaaagga gctgggcttt ggtgctcttc atcagcctgt ctttggctat 900
ccagggttgt ggaacgaggt gaaacataaa actccgaggt acttccggct ccctccagtg 960
tctgagggta atctgcagga ctgagggtaa ttgcagatgc tagctgttag cagcaaacta 1020
tgcaaaagct gaggactggc ttataaagcc agatctgggt gagtcatgtt tcctgtcaac 1080
atcctctgct gggcccataa cacatgcaac cccaaacttc cattacaagt tcaaagtttc 1140
taaggggata gcattacagt gtgtatgata ttggactcag acctgagttt gaatcctaat 1200
tccacaaaag aaattggaaa agagtcatat tgctgacttg accctttgtc accatatcca 1260
taaaatggga taattattcc tatatcataa atttacttat ttattcactt agtcatttgt 1320
taaataaata tggagtgtct actttgtgcc gggcactctt tttagggtgg ttctgagaag 1380
gggatggcaa tgagaagggc tctctaagat gcaagactcc aggcaactgc ttttacttcc 1440
agtggttctt tattttcaca gctcattaga gcaaattacc acagcaggga gatacaggtt 1500
gagtatccct tatccgaaaa gcctggcacc agaagtgttt taaattttgg attttttttt 1560
gatttttgga atatttgtta attatcagtt gagcatctct aatgtgaaaa tctaaaatcc 1620
aaaatgcccc agtgaccctt tcctttgagc atcatgttgg tgctcaaaaa gtttgagatg 1680
ttggagcatt taggatttca gatttttgga ttaaggatac tcattttgta caatggaaaa 1740
cttcttggca ctaatctgat gaaagaagaa actacgggag aatccctttc cctaaaaggc 1800
tttcagtaac aagatggccc tgactcattc tggacagttc ctccaaaggt aggcctacag 1860
gtagaactct tttctggcag cataggggtt ttccagaatg aaggtgtatt ttttttttac 1920
tgaggccagg aaaggtgaag agaatgaagg gttcctagtg acgatgcagc aaccaagtca 1980
tttatgtaat ggagccttat ctgacagatt tctaggatag aaactcagta tccaagctca 2040
ggcttggcag actgaggtgg gcaccgtccc caggattgca gtgtggatta gaggtttcaa 2100
ccccaatcat attcaacagc tccctttccc ccaacaaccc ctttttataa caattgtttt 2160
gtggtgattc ttttactaat atgatcatga aaattaagta atttagcttg tgaatgctct 2220
agcttggctg cactgctggt ataaagaagt gccagacact tgcaactgcc taggatctct 2280
gtgaaccagc ggcatggaag actgagaggc acgctggatt gatggctcag attcaagtat 2340
ggtattgcag gttctggtgt aattttctaa aatggcgaaa atctctaggt aaaactccaa 2400
aaataaaaaa ccaacataca tcttcctttg agttacctgg tagttatatt cctggaaaat 2460
tcagtgtata tgagcctgag gtagtagatg gtcaataaat actcaagaaa taaaaaaata 2520
aaaaaatata aaaatataaa acacatttct tacatgtcct tggtgcttgt aagcccagat 2580
tatatgcagg cttttttttg gacggagtct ctgttgccca ggctggagtg aagtggcgag 2640
atctgggctc actgcaacct ccacctcctg ggttcaagcg atcctcctgc ctcagcctcc 2700
tgagtagctg ggattacagg cacgcgccac caccctcagc tgatctttgt atttttagta 2760
gagaaggggt ttcaccatgt tggccaggct gatgtagaac tcctgacctc aagtgatccg 2820
cccacctcgg cctcccaaag tgttgggatt acaggcgtga gtcacagcgc ccggctgctt 2880
ttttatacat taagtgtgct tgcagaggac tgcgacctct ggccctcggc ctcttaataa 2940
atactccaag tgacttcatt ggaacaacca ctgagaatca cttatctaga gagtgggaag 3000
ttgctgatct catcactgca tggggtgggg tgagggaagc aaccctgccc ttcccctttc 3060
tcggaaagca gctggctttg aagaaagaga aaccaggacg ggaaagtcct gatttctaat 3120
ctgaaacagc gctttttgtc cagagaccgg tgacgagcga ccctgggctc gggttttgat 3180
tgggcagttc ggaaact 3197
<210> 6
<211> 1780
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ggtgcatgca ggggagcgca gagccctaag cccttctctg gggtccgccc gttttcctgc 60
tgggcttctc atttcctcac taggttctac ggtttgccga tctaaatcca gttcgtgtcc 120
tattgtattg tgtaacattt ttggcagctt acatctttgt ttattgagat atagttcaca 180
aaccatacaa ttaacatatt taagtgtaca tttcagtggg ttttagtata ttcacagggt 240
tgtgtaacca cctcaatttt aggacatttt cgtcactccc aaaagaaatt ttgtaccagt 300
tcggtgtcac tcccatttct cccaaacccc tagtcctagg aaaccaccaa tctttctgtc 360
tctatgggtt tgcctattag tatttcatag aaacagaaac atataatatg tggtcttttg 420
taactggctt ctgttttcaa aggtcgtcat attgtagcaa ggatcagttc ttcattccta 480
tttattgatg aatattactc tactgtatag atatactaag ttttgtttat ccatctatag 540
ttaatgggca tttggattgt ttccactctt cggctactga gaataaaatg tggttatcaa 600
tattcatgta taaatttttg gtgtggacat agattttcaa ttctcttgag tatatatgca 660
ggagtggaat tgctgggtga tatggtaact ctatgtttaa tcttttaagg aactactagg 720
ctgttctcca aagctgaatg taccattgtg tatgagagtt ccaatttttc tacatcctca 780
ccaatacttt taatcttttt ttattataac cattctagtg gatacgaaat ggtatctctt 840
tatggttttg atttgtattt ccctaatgac tatgcattat tttaaaatta taagctaatt 900
aatttttaca aagatttaca tgctgtgatt ttgacaactt aacttctagg tcacatgctc 960
aaaagtcaca gagcctagac ccaaaccaag cctttctatg gctaatgctc gaactccatc 1020
ctctctttcc tagaaggcaa tctgggataa atttttcaga actccatttg ttgcctctgt 1080
tagaaagaaa acactgggca agatgaacct gcaagtagag taaatggttt atttcttatt 1140
tgcttttagg agtatgtaag gagatttttt ggtctcccgt ttttacttta taaaaaatga 1200
gtgagtgggc caagcgctgt ggctcatgcc tgtgatccca gcactttggg agaccgaggc 1260
aggcagatca cctgaggtca ggagtttgat atcagcctga ccaacatggc aaaaccccat 1320
ctctgctaaa aatacaaaaa ttagccgggt gtagtgccat gcacctgtaa ttccagctat 1380
atgggaggct gaggcatgaa cattgcttga accccgggga gacggaggtt gcagtgagcc 1440
aagattgcac cactgcactc cagcctgggt gacagagtga ggctctttct caaaaaaaaa 1500
aaaaaggaaa gagaaagctc ttaattgaag tagtaaccct ttcttgggtg ttcaatgata 1560
ttgtgcttct cttcatgtaa gtgcccctta gattcctcct cctcactacc atcaggtcat 1620
agaataggga ggggcactca gtttcaacag cagtggcctc caaattttgt tcaaatgcat 1680
aactataaaa agttttttgt atacattctc tatatatagc tatacatttt atacatacac 1740
tactatcagt cttgatttag acattactaa agcttaattt 1780
<210> 7
<211> 19214
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
acctactatg tgccagcccc tgttctaggg tggaaactaa gagaatgatg tacctagagg 60
gcgctggaag ctctaaagcc ctagcagtta ctgcttttac tattagtggt cgtttttttc 120
tcccccccgc cccccgacaa atcaacagaa caaagaaaat tacctaaaca gcaaggacat 180
agggaggaac ttcttggcac agaactttcc aaacactttt tcctgaaggg atacaagaag 240
caagaaaggt actctttcac taggaccttc tctgagctgt cctcaggatg cttttgggac 300
tatttttctt acccagagaa tggagaaacc ctgcagggaa ttcccaagct gtagttataa 360
acagaagttc tccttctgct aggtagcatt caaagatctt aatcttctgg gtttccgttt 420
tctcgaatga aaaatgcagg tccgagcagt taactggctg gggcaccatt agcaagtcac 480
ttagcatctc tggggccagt ctgcaaagcg agggggcagc cttaatgtgc ctccagcctg 540
aagtcctaga atgagcgccc ggtgtcccaa gctggggcgc gcaccccaga tcggagggcg 600
ccgatgtaca gacagcaaac tcacccagtc tagtgcatgc cttcttaaac atcacgagac 660
tctaagaaaa ggaaactgaa aacgggaaag tccctctctc taacctggca ctgcgtcgct 720
ggcttggaga caggtgacgg tccctgcggg ccttgtcctg attggctggg cacgcgttta 780
atataagtgg aggcgtcgcg ctggcgggca ttcctgaagc tgacagcatt cgggccgaga 840
tgtctcgctc cgtggcctta gctgtgctcg cgctactctc tctttctggc ctggaggcta 900
tccagcgtga gtctctccta ccctcccgct ctggtccttc ctctcccgct ctgcaccctc 960
tgtggccctc gctgtgctct ctcgctccgt gacttccctt ctccaagttc tccttggtgg 1020
cccgccgtgg ggctagtcca gggctggatc tcggggaagc ggcggggtgg cctgggagtg 1080
gggaaggggg tgcgcacccg ggacgcgcgc tacttgcccc tttcggcggg gagcagggga 1140
gacctttggc ctacggcgac gggagggtcg ggacaaagtt tagggcgtcg ataagcgtca 1200
gagcgccgag gttgggggag ggtttctctt ccgctctttc gcggggcctc tggctccccc 1260
agcgcagctg gagtggggga cgggtaggct cgtcccaaag gcgcggcgct gaggtttgtg 1320
aacgcgtgga ggggcgcttg gggtctgggg gaggcgtcgc ccgggtaagc ctgtctgctg 1380
cggctctgct tcccttagac tggagagctg tggacttcgt ctaggcgccc gctaagttcg 1440
catgtcctag cacctctggg tctatgtggg gccacaccgt ggggaggaaa cagcacgcga 1500
cgtttgtaga atgcttggct gtgatacaaa gcggtttcga ataattaact tatttgttcc 1560
catcacatgt cacttttaaa aaattataag aactacccgt tattgacatc tttctgtgtg 1620
ccaaggactt tatgtgcttt gcgtcattta attttgaaaa cagttatctt ccgccataga 1680
taactactat ggttatcttc tgcctctcac agatgaagaa actaaggcac cgagatttta 1740
agaaacttaa ttacacaggg gataaatggc agcaatcgag attgaagtca agcctaacca 1800
gggcttttgc gggagcgcat gccttttggc tgtaattcgt gcattttttt ttaagaaaaa 1860
cgcctgcctt ctgcgtgaga ttctccagag caaactgggc ggcatgggcc ctgtggtctt 1920
ttcgtacaga gggcttcctc tttggctctt tgcctggttg tttccaagat gtactgtgcc 1980
tcttactttc ggttttgaaa acatgagggg gttgggcgtg gtagcttacg cctgtaatcc 2040
cagcacttag ggaggccgag gcgggaggat ggcttgaggt ccgtagttga gaccagcctg 2100
gccaacatgg tgaagcctgg tctctacaaa aaataataac aaaaattagc cgggtgtggt 2160
ggctcgtgcc tgtggtccca gctgctccgg tggctgaggc gggaggatct cttgagctta 2220
ggcttttgag ctatcatggc gccagtgcac tccagcgtgg gcaacagagc gagaccctgt 2280
ctctcaaaaa agaaaaaaaa aaaaaaagaa agagaaaaga aaagaaagaa agaagtgaag 2340
gtttgtcagt caggggagct gtaaaaccat taataaagat aatccaagat ggttaccaag 2400
actgttgagg acgccagaga tcttgagcac tttctaagta cctggcaata cactaagcgc 2460
gctcaccttt tcctctggca aaacatgatc gaaagcagaa tgttttgatc atgagaaaat 2520
tgcatttaat ttgaatacaa tttatttaca acataaagga taatgtatat atcaccacca 2580
ttactggtat ttgctggtta tgttagatgt cattttaaaa aataacaatc tgatatttaa 2640
aaaaaaatct tattttgaaa atttccaaag taatacatgc catgcataga ccatttctgg 2700
aagataccac aagaaacatg taatgatgat tgcctctgaa ggtctatttt cctcctctga 2760
cctgtgtgtg ggttttgttt ttgttttact gtgggcataa attaattttt cagttaagtt 2820
ttggaagctt aaataactct ccaaaagtca taaagccagt aactggttga gcccaaattc 2880
aaacccagcc tgtctgatac ttgtcctctt cttagaaaag attacagtga tgctctcaca 2940
aaatcttgcc gccttccctc aaacagagag ttccaggcag gatgaatctg tgctctgatc 3000
cctgaggcat ttaatatgtt cttattatta gaagctcaga tgcaaagagc tctcttagct 3060
tttaatgtta tgaaaaaaat caggtcttca ttagattccc caatccacct cttgatgggg 3120
ctagtagcct ttccttaatg atagggtgtt tctagagaga tatatctggt caaggtggcc 3180
tggtactcct ccttctcccc acagcctccc agacaaggag gagtagctgc cttttagtga 3240
tcatgtaccc tgaatataag tgtatttaaa agaattttat acacatatat ttagtgtcaa 3300
tctgtatatt tagtagcact aacacttctc ttcattttca atgaaaaata tagagtttat 3360
aatattttct tcccacttcc ccatggatgg tctagtcatg cctctcattt tggaaagtac 3420
tgtttctgaa acattaggca atatattccc aacctggcta gtttacagca atcacctgtg 3480
gatgctaatt aaaacgcaaa tcccactgtc acatgcatta ctccatttga tcataatgga 3540
aagtatgttc tgtcccattt gccatagtcc tcacctatcc ctgttgtatt ttatcgggtc 3600
caactcaacc atttaaggta tttgccagct cttgtatgca tttaggtttt gtttctttgt 3660
tttttagctc atgaaattag gtacaaagtc agagaggggt ctggcatata aaacctcagc 3720
agaaataaag aggttttgtt gtttggtaag aacatacctt gggttggttg ggcacggtgg 3780
ctcgtgcctg taatcccaac actttgggag gccaaggcag gctgatcact tgaagttggg 3840
agttcaagac cagcctggcc aacatggtga aatcccgtct ctactgaaaa tacaaaaatt 3900
aaccaggcat ggtggtgtgt gcctgtagtc ccaggaatca cttgaaccca ggaggcggag 3960
gttgcagtga gctgagatct caccactgca cactgcactc cagcctgggc aatggaatga 4020
gattccatcc caaaaaataa aaaaataaaa aaataaagaa cataccttgg gttgatccac 4080
ttaggaacct cagataataa catctgccac gtatagagca attgctatgt cccaggcact 4140
ctactagaca cttcatacag tttagaaaat cagatgggtg tagatcaagg caggagcagg 4200
aaccaaaaag aaaggcataa acataagaaa aaaaatggaa ggggtggaaa cagagtacaa 4260
taacatgagt aatttgatgg gggctattat gaactgagaa atgaactttg aaaagtatct 4320
tggggccaaa tcatgtagac tcttgagtga tgtgttaagg aatgctatga gtgctgagag 4380
ggcatcagaa gtccttgaga gcctccagag aaaggctctt aaaaatgcag cgcaatctcc 4440
agtgacagaa gatactgcta gaaatctgct agaaaaaaaa caaaaaaggc atgtatagag 4500
gaattatgag ggaaagatac caagtcacgg tttattcttc aaaatggagg tggcttgttg 4560
ggaaggtgga agctcatttg gccagagtgg aaatggaatt gggagaaatc gatgaccaaa 4620
tgtaaacact tggtgcctga tatagcttga caccaagtta gccccaagtg aaataccctg 4680
gcaatattaa tgtgtctttt cccgatattc ctcaggtact ccaaagattc aggtttactc 4740
acgtcatcca gcagagaatg gaaagtcaaa tttcctgaat tgctatgtgt ctgggtttca 4800
tccatccgac attgaagttg acttactgaa gaatggagag agaattgaaa aagtggagca 4860
ttcagacttg tctttcagca aggactggtc tttctatctc ttgtactaca ctgaattcac 4920
ccccactgaa aaagatgagt atgcctgccg tgtgaaccat gtgactttgt cacagcccaa 4980
gatagttaag tggggtaagt cttacattct tttgtaagct gctgaaagtt gtgtatgagt 5040
agtcatatca taaagctgct ttgatataaa aaaggtctat ggccatacta ccctgaatga 5100
gtcccatccc atctgatata aacaatctgc atattgggat tgtcagggaa tgttcttaaa 5160
gatcagatta gtggcacctg ctgagatact gatgcacagc atggtttctg aaccagtagt 5220
ttccctgcag ttgagcaggg agcagcagca gcacttgcac aaatacatat acactcttaa 5280
cacttcttac ctactggctt cctctagctt ttgtggcagc ttcaggtata tttagcactg 5340
aacgaacatc tcaagaaggt ataggccttt gtttgtaagt cctgctgtcc tagcatccta 5400
taatcctgga cttctccagt actttctggc tggattggta tctgaggcta gtaggaaggg 5460
cttgttcctg ctgggtagct ctaaacaatg tattcatggg taggaacagc agcctattct 5520
gccagcctta tttctaacca ttttagacat ttgttagtac atggtatttt aaaagtaaaa 5580
cttaatgtct tccttttttt tctccactgt ctttttcata gatcgagaca tgtaagcagc 5640
atcatggagg taagtttttg accttgagaa aatgtttttg tttcactgtc ctgaggacta 5700
tttatagaca gctctaacat gataaccctc actatgtgga gaacattgac agagtaacat 5760
tttagcaggg aaagaagaat cctacagggt catgttccct tctcctgtgg agtggcatga 5820
agaaggtgta tggccccagg tatggccata ttactgaccc tctacagaga gggcaaagga 5880
actgccagta tggtattgca ggataaaggc aggtggttac ccacattacc tgcaaggctt 5940
tgatctttct tctgccattt ccacattgga catctctgct gaggagagaa aatgaaccac 6000
tcttttcctt tgtataatgt tgttttattc ttcagacaga agagaggagt tatacagctc 6060
tgcagacatc ccattcctgt atggggactg tgtttgcctc ttagaggttc ccaggccact 6120
agaggagata aagggaaaca gattgttata acttgatata atgatactat aatagatgta 6180
actacaagga gctccagaag caagagagag ggaggaactt ggacttctct gcatctttag 6240
ttggagtcca aaggcttttc aatgaaattc tactgcccag ggtacattga tgctgaaacc 6300
ccattcaaat ctcctgttat attctagaac agggaattga tttgggagag catcaggaag 6360
gtggatgatc tgcccagtca cactgttagt aaattgtaga gccaggacct gaactctaat 6420
atagtcatgt gttacttaat gacggggaca tgttctgaga aatgcttaca caaacctagg 6480
tgttgtagcc tactacacgc ataggctaca tggtatagcc tattgctcct agactacaaa 6540
cctgtacagc ctgttactgt actgaatact gtgggcagtt gtaacacaat ggtaagtatt 6600
tgtgtatcta aacatagaag ttgcagtaaa aatatgctat tttaatctta tgagaccact 6660
gtcatatata cagtccatca ttgaccaaaa catcatatca gcattttttc ttctaagatt 6720
ttgggagcac caaagggata cactaacagg atatactctt tataatgggt ttggagaact 6780
gtctgcagct acttctttta aaaaggtgat ctacacagta gaaattagac aagtttggta 6840
atgagatctg caatccaaat aaaataaatt cattgctaac ctttttcttt tcttttcagg 6900
tttgaagatg ccgcatttgg attggatgaa ttccaaattc tgcttgcttg ctttttaata 6960
ttgatatgct tatacactta cactttatgc acaaaatgta gggttataat aatgttaaca 7020
tggacatgat cttctttata attctacttt gagtgctgtc tccatgtttg atgtatctga 7080
gcaggttgct ccacaggtag ctctaggagg gctggcaact tagaggtggg gagcagagaa 7140
ttctcttatc caacatcaac atcttggtca gatttgaact cttcaatctc ttgcactcaa 7200
agcttgttaa gatagttaag cgtgcataag ttaacttcca atttacatac tctgcttaga 7260
atttggggga aaatttagaa atataattga caggattatt ggaaatttgt tataatgaat 7320
gaaacatttt gtcatataag attcatattt acttcttata catttgataa agtaaggcat 7380
ggttgtggtt aatctggttt atttttgttc cacaagttaa ataaatcata aaacttgatg 7440
tgttatctct tatatctcac tcccactatt acccctttat tttcaaacag ggaaacagtc 7500
ttcaagttcc acttggtaaa aaatgtgaac cccttgtata tagagtttgg ctcacagtgt 7560
aaagggcctc agtgattcac attttccaga ttaggaatct gatgctcaaa gaagttaaat 7620
ggcatagttg gggtgacaca gctgtctagt gggaggccag ccttctatat tttagccagc 7680
gttctttcct gcgggccagg tcatgaggag tatgcagact ctaagaggga gcaaaagtat 7740
ctgaaggatt taatatttta gcaaggaata gatatacaat catcccttgg tctccctggg 7800
ggattggttt caggacccct tcttggacac caaatctatg gatatttaag tcccttctat 7860
aaaatggtat agtatttgca tataacctat ccacatcctc ctgtatactt taaatcattt 7920
ctagattact tgtaatacct aatacaatgt aaatgctatg caaatagttg ttattgttta 7980
aggaataatg acaagaaaaa aaagtctgta catgctcagt aaagacacaa ccatcccttt 8040
ttttccccag tgtttttgat ccatggtttg ctgaatccac agatgtggag cccctggata 8100
cggaaggccc gctgtacttt gaatgacaaa taacagattt aaaattttca aggcatagtt 8160
ttatacctga tggccagctt tgtttatttg accaagaatc tgagttagct agttctaggt 8220
actgacagga taaataaaac acaacactgc tcccgatctt ctcagtttag cagagggaca 8280
gatatgcact caaataatta aaatatatcc tgataagaat atagcatagg tacgcgcgaa 8340
gaacttggca atcgaaattt tgttgttcag gctgggcgag gtgtctcatg tctgtaatcc 8400
cagcactttg ggaggccatg gtaggatgat cgcttgagcc caggagtccg agaccagcct 8460
gggcaacata acaagaccct gtctcaattc aaagaattga attaaaaaaa acaaaaaata 8520
atttttttaa aaaagaaatg ttgttgttca aggaacaaca acaaaaatct agggaggtgt 8580
tagagaagcc atttgcctga gctgagagta agttgctagt ggttctcttg attggtaggt 8640
ggggcctggg tttccaggca tggtagccag gaaggacagc cacatggcag gtttgggtaa 8700
ttccaaacag tggaggaagg gtgtctgggg gaagacttgt aggaactcag ctgaaaaaat 8760
tgggggatga tactctgaaa gaaaaacaaa gttttaaaat ttctactctt acacttaaca 8820
cataatgctt ctgtgaccgg atatttaggg gttttccccc cacactctgt taggagaaaa 8880
attttagaca gattaaattt aacagagttt aactgagcaa aaatgattct cgaaccaggc 8940
agctgccgga gccagaatag gttcaaaatg actctggggg tgccacatgg ttggatgaca 9000
tttagggaca gaaaaaggaa agtgatgtgc agaaaatgga agtcaggggc agaagcagcc 9060
agattggttg cagttcagca tttgcctcat ttaaacaggg tttgaagagt tggccacctg 9120
tgattggctg agactctgtg gtataagagt aagttacagt ctgtttacac atccagttag 9180
gttacagttc actatgcaga gagaaatctt tagcctgaac ttacacaggg aggcagtttt 9240
atttatttat ttaatttttt ttttttgaga caaggtctca ctctgtcacc cgggctggag 9300
ttcagtggta tgatcatggc ttattgcagc ctcgacttcc tggcctcaag caatccttcc 9360
gcctcaggct ctagagtagc tgggactaca ggcacatgtc agcatgcctg gctaattttg 9420
ttttttaatt tttagtagag atgaactcct ggccttgcac aattctttcg cctcagcctc 9480
cgaaaatgct gggattacag gtgtgagcca ctgtgcccag ctaaggcaac tttaggctaa 9540
accttttttt gagacagagt ttctctcttg ttgtctaggc tggagtgcag ttgcaccatc 9600
ttggctcact gcaacctcca cctccagggt tcaagtgatt ctcgttcctc agcctcccga 9660
gtaactggga ttacaggcat gcgccaccac gcctggctaa ttttgtgttt ttagtagaga 9720
tggtgtttca ccatgttgtc caggctggtc tcaaactcct ggcctcaagt gatcctctgg 9780
cctcagcttc ccagagtact gagattacag gcatgagcca ctgtgccctg cctaggctaa 9840
acttaattta acaacaccaa acaatctcca gcagacacca actgggtatc ccataattca 9900
attcgatttt gattggatct acctggagat ggtgtcagat cccgctggtt gagggttcag 9960
tcccacaaga ctgccctcca cttcagatgc caatcacaca ttgtaggttg ttacctctac 10020
ttctgactga ccagctggaa accagaactc ccatgactgc ctccttgact ttggttaatt 10080
tgctaggaca gttcatattt accaatctat tataaaagat taaaggctac agacgaataa 10140
ctagatgaaa agatgaatag ggctatatgt agggggttgt ggtggtgaca gtccatgccc 10200
tctccaggtg tatgccaccc tcccagcacc tccacacatt cagcaaacag gaagctcatc 10260
gttcaagagt ttttatagag cttgatctcc agctcccctt caccttccca gaggtggatg 10320
ggtgggggtg gaagttccaa cacactaatc ttctcatcac ttggtctttc tggtgactag 10380
caccatcctg aggctatcta ggggcccaaa cctatgagta taacctcatt agcatatact 10440
caagggttac caaagaggct tattattaat aataaaagac actcctatca ctcaaaattc 10500
aaaggatttt aggaacttct gacaggaact ggggacaaag accaaatgtg tttcatatta 10560
taccacactt acctaggcca ttcattaact cttcacctgg ctgcaaacta aaattacatg 10620
tagagtttgt aagaacaaaa caaacacaca cacagacaca cacacacaca cacacacaca 10680
cacacacaca cacacacaaa acaacaaggc aggcacggtg gctcacgcct gtaagcccaa 10740
cactttggaa agtcaaggtg agcagattac gaggagttca agaccagcct ggctaacatg 10800
gtgaaaccct gtctctacta agaatacaaa aattagccag gcatggtggc acgtgcctat 10860
aatcccagct actcaggagg ctgaggcaag agaatcgctt gaacctcgga ggcagaggtt 10920
gcagtgagcc gagatcatgc cattgcactc cagcctgagt gacagagtga gactccatct 10980
caaaaacagc aacaacaaca acaacaacaa caacaacaac aacaacaact caccagcttc 11040
ccagactccc atccaggcca attaaaccat aatctctcgg tatggagccc aggtatagtg 11100
ttatttttta aaaaacctct agatagtttt aatgtacatc caagattgac agacccattg 11160
agttcagtca taaagaactc tctctccatt ccatatcatt caacagagct attttgtgag 11220
gggctgctct gctggctgat attacaaggt aatactatgt caaagtcaaa tgaaatatag 11280
agttgaatct ctgaaattaa aatgttttat ttgggaggaa agaattgcaa ctcagggcat 11340
acacacagac cagctggtct ttggcatgtc tgaagtacaa aaaggtttta taaaatggga 11400
aaatgttact tatcgctctg agaaaatttc actggtgcta gtaaagtttt gaggagctgg 11460
caagttttga ttggcaaatg atgacaataa acagaactag tctcagagtt gtagcaggtc 11520
atttcagtag ccattagtta aacctggttt cagatgatag caggcagttt cagcttccag 11580
gcttgcagaa aatcgcattt ttggaacaat gttttgtgcc ctgagtgctt ctccctggct 11640
tcttgactct gttttagttg agtaagacaa aaatgaccca gtttgatgac caactttcac 11700
agttcctttg gagcatgcct tagtttctct ttttagaaga gagcaagcaa agaggaggaa 11760
tacaggaagc ttaattaacc ttattaaata taattgtgca atgcaaatta aactgaaaag 11820
tcccaacatc agtaatagag aagtagatcc tacatactga catggaagca tacccatact 11880
atattgctga aacaaaaatt agtttctaca aaatatgtgt aagaagccac tttaaaaaaa 11940
caaactaggt ggggcatggt ggctcacacc tgtaatccca gcatttttgg aggccaaggt 12000
gggaggactg cgtgagctaa gaagtttgag acaagcctgg gcaacatagt gagacccagt 12060
ctctctctct atttatgtat ttatttatgt atgtacatat ttattgattt atttatttga 12120
gacggagtct tgccctgtca cccaggctgg agtgcaatgt cgtgatctca gctcactgca 12180
acctccacct cccaggttca aacgattctc ctgcctcagc ctcctgagta gctggaatta 12240
caggcacccg ccaccatacc cagctaatta ttttttgtat ttttagtaga gacgggattt 12300
catcatgttg gtcaggctgg tctcaaactc ctgacctcat gatccacccg cctcggcctc 12360
ccaaagtgct gggattacag gtgtgagcca ccgcgcccgg ccgagaccca gtctctttaa 12420
aaaaaaatgg ctaacatggt gaaaccccat ctctactaaa aatacaaaaa ttagctgggt 12480
gtggtggtac atacctgtaa tcccagctac ttgggaggct gaggcaggag aatcacttga 12540
acccaggagg cggaggttgc agtgagcgga gattgcatca ccgcacacta gcctgggtga 12600
cagagcaaga ctttgtcaca cacacacaca caaaaaagtg gacgcttgca tcacttgagc 12660
ctgggaggtt gaggctgcag tgagcagaga tcaggacact acactccagc ctgggtgatg 12720
aagcaagtcc ctcaaaaagg aaaaaaaaaa aaagtagacc cttgcacccc aaatctgtat 12780
tgttcaaagg ttaactgtat cctcctttaa aaaaggggtt actgttaaat aataattttt 12840
atatcttact ttttttcatg atccctaagg aaaacatgtc acaaatggat atgtctttct 12900
agttttgtca acaaccactt tcacggtatt tttgggctgt tgctttttac ttgtcatttt 12960
tgtgttgtaa acccttgaag caaaactcaa ggtcttttct ttttttcttt tcttttcttt 13020
tctgagacag ggtattaccc tgtcacccag gcttgtgtgc agaggcacaa tcttggctca 13080
ctgcagcctc agcctcttgg actcaagcaa tcctcccatc tcagcctccc aagtagctga 13140
gaccacaggt gtgcaccacc cattcctggc taattttttt tgtgtatttt tttgtagaga 13200
tgggggtctc actatgtttc cctggctggt cttgaactct tgggttcaag cgatcctcca 13260
gtctcgcctc tcaaagtgct gggattacag agccaccaca ctcagccatt tcctataata 13320
aaaaaatatt ttgtctgtga tgtagccatc aaagttttag ggggaaaaat tggcattgtc 13380
tttccctgga gtctagacct ataggaaaaa aattgaaggc taatatttgg gttctagata 13440
acgcaaaata aataataaaa catctgtgat taccttgatt gaaaagtttg tgcatagaaa 13500
ttattctggt actttggaga gctacaagaa ggcctaacag aaaaaaaaac tgataaatac 13560
aattaaaata acagtcgagc atatattaaa gcacttacta tgcactaaac tctatatatc 13620
tcctgtcatt agttggatgc aattattaga catctttggt cctccacaac ataggtgatt 13680
aaaaagccta agaaactgaa gcgttatcta tgtctttggt aagacacaca ggcccaagtg 13740
aagcctgcaa tgatgtgcag gcttcccctc ccccacggac cacatggacc acttcctctt 13800
tttttttttt tttttttttc tttagacaga gtctcactgt atcgcctagg ctggagtgca 13860
gtggcgcaat ctcggctcac tgcaacctct gcttcctggg ttcaagtgat tctcctgcct 13920
cagcctcccg agtagctggg aatacaggca tgcaccacca tgcctgacta atttttttat 13980
gtgtgtgttt ttggtagaga tggggtttca ccatgctggc caggctggtc tcaaactcct 14040
gacctcgtga tctgctcgcc ttggcctccc aaagtgctgg gattacaggc acttcctctt 14100
tttactgttt tcacttagaa aaactgagag gacttttgct gccactgaat gacacagcat 14160
agttgaagtg gttttctcgt catttattat ggctcgaatg tttgtccctt ctgaaattca 14220
tgttgaaact taatcctggc tgggcacagt ggctcacact tctaatccca gcattttggg 14280
aggctgagac tggaggatcg catgagccca ggagtttgag accagcctgg gcaacatagt 14340
gagtcctcct ctctacaaaa tcaaacaaac aaaaattagc tgggtgtggt agcacacacc 14400
tgtggtccca gctacttgga aggcggaggc aggaggattg tttgaaccca ggaggagttt 14460
aagagcagtc tgggcaatat agtgagacct catatctgtc tatctatgta tctatgtatc 14520
tatgtatcta tgtatctatc tatctatcta tctatctaaa ataaattaaa ttaaaaaata 14580
aaaaataatg aggcaaagaa aagaaagtta atcctcaata taacagtatt aagaagtagg 14640
gcatttaaga ggtgactggg tcatgagggc tccttcatga atggattaat ggattaatgg 14700
gttatcctga gaatgggtct gttataaaag ccagtttcgc tctttctctt gtgcccctct 14760
aaatctttat ctttagccat gttatgatgc ctctctgata tctttaccca tgttatgatg 14820
cggaacaaag ccctcaccca aagcaaacca gatacagccc ctcaatgttg aacttctcag 14880
cctcttccat acatttttct tcctttcttt tttttgagat aggatcttgc tctgccattg 14940
tgccattgca gcctcaaact cttgggctca agtgatcctg ctgcttcagc atcctgagta 15000
gcggggctta cagatgcaca cccccatgca tcactaattt tttttttttt ttttgagatg 15060
gagtcttgct aggtcaccca ggctggagtg cagtggtgcg atctcggctc actgcaacct 15120
ctgcctcctg ggttcacacc attctcctgc ctcagcctcc caagtagctg ggactacagg 15180
tgcctgccac cacgccaggt taattttttg tatttttagt agagacaggg tttcaccgtg 15240
ttagccagga tggtctcgat ctcctgacct catgatccac ccatcttggc ctcccaaagt 15300
gctgggatta caggcatgaa ccactgcgcc cggccgcatc gctagttttt aaaaactttt 15360
tgtagagaca gattcttact atgttgccaa ggctggtctc aaactcctgg cctcaagaga 15420
tcctccagtc ttcggcctcc caaaaagatg ggattacagg catgagccac ctcacctggc 15480
ctcttttttt tgtatattac ctgatctcag gtattctgct atagcaacag aaagacgaag 15540
acagaatcct tagctgtctg caagtgtgca tgccattttc atcatctgaa gagtcagcga 15600
gtgtcttagg tggagtcttg caaaagcagg ccctgagcca aagatttgga tgcaaatgac 15660
ttgttaagaa agggctcttc gagaccgtgc cattgcactc cagcccgggc aagaagagtg 15720
aaactctgtt tcaaaaaaaa aaaagtgggg ggctcctagg aaaagaacag taaaggagtg 15780
ggggatgaag gacagggaat gggaagaagc caagcgagag catgatttcc gaagtcctac 15840
actcagcctg atcacacggg aagctttaga acaaagaaca cacctcagag tttttcctgc 15900
ctcaacacaa aggagctggg ctttggtgct cttcatcagc ctgtctttgg ctatccaggg 15960
ttgtggaacg aggtgaaaca taaaactccg aggtacttcc ggctccctcc agtgtctgag 16020
ggtaatctgc aggactgagg gtaattgcag atgctagctg ttagcagcaa actatgcaaa 16080
agctgaggac tggcttataa agccagatct gggtgagtca tgtttcctgt caacatcctc 16140
tgctgggccc ataacacatg caaccccaaa cttccattac aagttcaaag tttctaaggg 16200
gatagcatta cagtgtgtat gatattggac tcagacctga gtttgaatcc taattccaca 16260
aaagaaattg gaaaagagtc atattgctga cttgaccctt tgtcaccata tccataaaat 16320
gggataatta ttcctatatc ataaatttac ttatttattc acttagtcat ttgttaaata 16380
aatatggagt gtctactttg tgccgggcac tctttttagg gtggttctga gaaggggatg 16440
gcaatgagaa gggctctcta agatgcaaga ctccaggcaa ctgcttttac ttccagtggt 16500
tctttatttt cacagctcat tagagcaaat taccacagca gggagataca ggttgagtat 16560
cccttatccg aaaagcctgg caccagaagt gttttaaatt ttggattttt ttttgatttt 16620
tggaatattt gttaattatc agttgagcat ctctaatgtg aaaatctaaa atccaaaatg 16680
ccccagtgac cctttccttt gagcatcatg ttggtgctca aaaagtttga gatgttggag 16740
catttaggat ttcagatttt tggattaagg atactcattt tgtacaatgg aaaacttctt 16800
ggcactaatc tgatgaaaga agaaactacg ggagaatccc tttccctaaa aggctttcag 16860
taacaagatg gccctgactc attctggaca gttcctccaa aggtaggcct acaggtagaa 16920
ctcttttctg gcagcatagg ggttttccag aatgaaggtg tatttttttt ttactgaggc 16980
caggaaaggt gaagagaatg aagggttcct agtgacgatg cagcaaccaa gtcatttatg 17040
taatggagcc ttatctgaca gatttctagg atagaaactc agtatccaag ctcaggcttg 17100
gcagactgag gtgggcaccg tccccaggat tgcagtgtgg attagaggtt tcaaccccaa 17160
tcatattcaa cagctccctt tcccccaaca accccttttt ataacaattg ttttgtggtg 17220
attcttttac taatatgatc atgaaaatta agtaatttag cttgtgaatg ctctagcttg 17280
gctgcactgc tggtataaag aagtgccaga cacttgcaac tgcctaggat ctctgtgaac 17340
cagcggcatg gaagactgag aggcacgctg gattgatggc tcagattcaa gtatggtatt 17400
gcaggttctg gtgtaatttt ctaaaatggc gaaaatctct aggtaaaact ccaaaaataa 17460
aaaaccaaca tacatcttcc tttgagttac ctggtagtta tattcctgga aaattcagtg 17520
tatatgagcc tgaggtagta gatggtcaat aaatactcaa gaaataaaaa aataaaaaaa 17580
tataaaaata taaaacacat ttcttacatg tccttggtgc ttgtaagccc agattatatg 17640
caggcttttt tttggacgga gtctctgttg cccaggctgg agtgaagtgg cgagatctgg 17700
gctcactgca acctccacct cctgggttca agcgatcctc ctgcctcagc ctcctgagta 17760
gctgggatta caggcacgcg ccaccaccct cagctgatct ttgtattttt agtagagaag 17820
gggtttcacc atgttggcca ggctgatgta gaactcctga cctcaagtga tccgcccacc 17880
tcggcctccc aaagtgttgg gattacaggc gtgagtcaca gcgcccggct gcttttttat 17940
acattaagtg tgcttgcaga ggactgcgac ctctggccct cggcctctta ataaatactc 18000
caagtgactt cattggaaca accactgaga atcacttatc tagagagtgg gaagttgctg 18060
atctcatcac tgcatggggt ggggtgaggg aagcaaccct gcccttcccc tttctcggaa 18120
agcagctggc tttgaagaaa gagaaaccag gacgggaaag tcctgatttc taatctgaaa 18180
cagcgctttt tgtccagaga ccggtgacga gcgaccctgg gctcgggttt tgattgggca 18240
gttcggaaac tgtaaaagcg aattaaaagg gtgacaagct agtgttttag cctatccagt 18300
tccgggagtt tgcacgcaga cgctctgctt cgtgaccttg gctctgctct gtgggcgccg 18360
cccccagcct gggcgcgtcc atcgtcgagt accttctcct ctgcctcccc ctccctctgc 18420
ttctatctct ctccaattgc cctccctggc ctgcggccgc ccggtcctcc ttcccagccc 18480
agtgcagcca ggcacccggg ttcggcttgc tcaggtctct gtccgggact gggaagccac 18540
ggagggccgg gaaagtggca cactcctgga gctcaagctt cctactctct catcgctgaa 18600
taactaccgg gcaggactgg gtggaacaga cagcatattt aggtcattga tgggctgctg 18660
ggtggatgga gctggaaagt gatgggcact gctttctggg gctgcccagg ttccttccga 18720
gggctcgctt ttcctgggca gagcgggaaa gaggaggggc aggccggtcg cgaaacgcaa 18780
atagtcgaga atagcgatcc ggggagaagc aggtgtctgt ggggcccaag agaagtacca 18840
tctcggtaag taggccggtg catgcagggg agcgcagagc cctaagccct tctctggggt 18900
ccgcccgttt tcctgctggg cttctcattt cctcactagg ttctacggtt tgccgatcta 18960
aatccagttc gtgtcctatt gtattgtgta acatttttgg cagcttacat ctttgtttat 19020
tgagatatag ttcacaaacc atacaattaa catatttaag tgtacatttc agtgggtttt 19080
agtatattca cagggttgtg taaccacctc aattttagga cattttcgtc actcccaaaa 19140
gaaattttgt accagttcgg tgtcactccc atttctccca aacccctagt cctaggaaac 19200
caccaatctt tctg 19214
<210> 8
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tccttggagc tgtgatcact 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aagggcagga acaactcttg 20
<210> 10
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cctagcagtt gtggtcatcg g 21
<210> 11
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ctccctcctt ttccacctga ac 22
<210> 12
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
tcctggttgt cctagctgtc 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
caggctttac aagtgatgag 20
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
gagtgctgtc tccatgtttg atg 23
<210> 15
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
aagttgccag ccctcctaga 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tgcttggctg tgatacaaag 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ctttgtatca cagccaagca 20
<210> 18
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gagggcctat ttcccatgat tcc 23
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
attctccaga gcaaactggg 20
<210> 20
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
cccagtttgc tctggagaat 20
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tagtttacag caatcacctg 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
caggtgattg ctgtaaacta 20
机译: 表达增强子及其在提高重组基因表达产量中的用途
机译: 涉及转移形成的转移性癌中表达的人类抗原的人类基因序列的鉴定及其在癌症诊断,预后和治疗中的用途
机译: CD4多肽,糖基化的人CD4分子,其片段,融合蛋白,基因序列及其在非人灵长类动物中的用途