首页> 中国专利> 核酸分子及其用于非病毒基因疗法的用途

核酸分子及其用于非病毒基因疗法的用途

摘要

本公开文本提供了核酸分子,其包含第一反向末端重复(ITR)、第二ITR和编码靶序列的基因盒。在一些实施例中,靶序列编码miRNA和/或治疗性蛋白质。在某些实施例中,治疗性蛋白质包含凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合。在一些实施例中,第一ITR和/或第二ITR是非腺相关病毒(AAV)的ITR。本公开文本还提供了治疗受试者中的肝脏代谢病症的方法,其包括将核酸分子或由其编码的多肽施用于受试者。

著录项

说明书

相关申请

本申请要求2018年8月9日提交的美国临时专利申请序列号62/716,826的优先权,将所述申请的全部公开内容通过提述在此并入本文。

对电子提交的序列表的引用

以ASCII文本文件电子提交的序列表(名称:SA9-465PC_SL_ST25.txt;大小:460,648字节;创建日期:2019年8月8日)的内容通过引用以其整体并入本文。

背景技术

基因疗法提供了治疗多种疾病的持久手段的可能性。过去,许多基因疗法治疗通常依赖于使用病毒。有多种可以选择用于这个目的的病毒剂,每种病毒剂具有不同特性,这使得它们更适于或更不适于基因疗法。Zhou等,Adv Drug Deliv Rev.106(Pt A):3-26,2016。然而,一些病毒载体的不期望特性(包括其免疫原性谱或其引起癌症的倾向)已经导致临床安全性问题,并且直到最近,限制其在某些应用(例如,疫苗和溶瘤策略)中的临床使用。Cotter等,Front Biosci.10:1098-105(2005)。

腺相关病毒(AAV)是一种最常研究的基因疗法载体。AAV是包围并保护大约4.8千碱基(kb)的小的单链DNA基因组的蛋白质外壳。Naso等,BioDrugs,31(4):317-334,2017。AAV属于细小病毒家族并且依赖于与其他病毒(主要是腺病毒)共感染以复制。同上。其单链基因组含有三个基因Rep(复制)、Cap(衣壳)和aap(组装)。同上。这些编码序列侧接有基因组复制和包装所需的反向末端重复(ITR)。同上。这两个顺式作用AAV ITR的长度为大约145个核苷酸,具有中断的回文序列,所述回文序列可以折叠成在DNA复制的起始期间起引物作用的T形发夹结构。

然而,使用常规AAV作为基因递送载体具有某些缺点。一个主要缺点与AAV的约4.5kb异源DNA的有限病毒包装能力有关。(Dong等,Hum Gene Ther.7(17):2101-12,1996)。另外,施用AAV载体可诱导人的免疫应答。虽然已显示AAV的免疫原性低于一些其他病毒(即腺病毒),但是衣壳蛋白可以触发人免疫系统的多种组分。参见Naso等,2017。AAV是人群中的常见病毒,并且大多数人已经暴露于AAV,因此大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括中和抗体(NAb)和T细胞,它们可降低随后用AAV再感染的临床功效和/或已经被转导的细胞的消除,这可能使具有预先存在的抗AAV免疫力的患者没有资格接受基于AVV的基因疗法治疗。此外,有证据表明,AAV ITR的T形发夹环易受结合AAV ITR的T形发夹结构的宿主细胞蛋白质/蛋白质复合物的抑制。参见例如,Zhou等,Scientific Reports 7:5432(2017年7月14日)。

因此,本领域需要在体外和体内环境中有效且持久地表达靶序列(例如,治疗性蛋白质和/或miRNA),同时避免现有AAV载体技术的一些无意的结果和限制。

发明内容

在某些方面中,提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些示例性实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:181中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:184中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ ID NO:185中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:186中所述的核苷酸序列。在某些示例性实施例中,第一ITR包含SEQ IDNO:187中所述的核苷酸序列,并且第二ITR包含SEQ ID NO:188中所述的核苷酸序列。

在某些示例性实施例中,第一ITR和/或第二ITR由SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列组成。在某些示例性实施例中,第一ITR和第二ITR是彼此的反向互补物。

在某些示例性实施例中,核酸分子还包含启动子。在某些示例性实施例中,激活子是组织特异性启动子。在某些示例性实施例中,启动子驱动异源多核苷酸序列在选自以下的器官中的表达:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些示例性实施例中,启动子驱动异源多核苷酸序列在以下细胞中的表达:肝细胞、内皮细胞、心肌细胞、骨骼肌细胞、窦状细胞、传入神经元、传出神经元、中间神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、室管膜细胞、肺上皮细胞、许旺细胞(Schwann cell)、卫星细胞、感光细胞、视网膜神经节细胞或其任何组合。在某些示例性实施例中,启动子定位于异源多核苷酸序列的5'。在某些示例性实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(TTP)启动子、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、α1-抗胰蛋白酶(AAT)、肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)、结蛋白(DES)、SPc5-12、2R5Sc5-12、dMCK、tMCK和磷酸甘油酸激酶(PGK)启动子。

在某些示例性实施例中,异源多核苷酸序列还包含内含子序列。在某些示例性实施例中,内含子序列定位于异源多核苷酸序列的5'。在某些示例性实施例中,内含子序列定位于启动子的3'。在某些示例性实施例中,内含子序列包含合成内含子序列。在某些示例性实施例中,内含子序列包含SEQ ID NO:115或192。

在某些示例性实施例中,基因盒还包含转录后调控元件。在某些示例性实施例中,转录后调控元件定位于异源多核苷酸序列的3'。在某些示例性实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(WPRE)、微小RNA结合位点、DNA核靶向序列或其任何组合。在某些示例性实施例中,微小RNA结合位点包含与miR142-3p的结合位点。

在某些示例性实施例中,基因盒还包含3'UTR多聚(A)尾序列。在某些示例性实施例中,3'UTR多聚(A)尾序列选自bGH多聚(A)、肌动蛋白多聚(A)、血红蛋白多聚(A)及其任何组合。在某些示例性实施例中,3'UTR多聚(A)尾序列包含bGH多聚(A)。

在某些示例性实施例中,基因盒还包含增强子序列。在某些示例性实施例中,增强子序列定位于第一ITR与第二ITR之间。

在某些示例性实施例中,核酸分子从5'至3'包含:第一ITR、基因盒和第二ITR;其中基因盒包含组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。在某些示例性实施例中,基因盒从5'至3'包含:组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'UTR多聚(A)尾序列。在某些示例性实施例中,组织特异性启动子序列包含TTT启动子;内含子是合成内含子;转录后调控元件包含WPRE;并且3'UTR多聚(A)尾序列包含bGHpA。

在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。

在某些示例性实施例中,异源多核苷酸序列编码凝血因子、生长因子、激素、细胞因子、抗体、其片段或其任何组合。

在某些示例性实施例中,异源多核苷酸序列编码选自以下的生长因子:肾上腺髓质素(AM)、血管生成素(Ang)、自分泌运动因子、骨形态发生蛋白(BMP)(例如,BMP2、BMP4、BMP5、BMP7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF))、表皮生长因子(EGF)、肝配蛋白(例如,肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2、肝配蛋白B3)、促红细胞生成素(EPO)、成纤维细胞生长因子(FGF)(例如,FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22、FGF23)、胎牛促体素(FBS)、GDNF家族成员(例如,神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白(persephin)、阿特敏蛋白(artemin))、生长分化因子-9(GDF9)、肝细胞生长因子(HGF)、肝细胞瘤衍生的生长因子(HDGF)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(IGF-1)或IGF-2、白介素(IL)(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7)、角质形成细胞生长因子(KGF)、迁移刺激因子(MSF)、巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))、肌生成抑制蛋白(GDF-8)、神经调节蛋白(例如,神经调节蛋白1(NRG1)、NRG2、NRG3、NRG4)、神经营养蛋白(例如,脑衍生的神经营养因子(BDNF)、神经生长因子(NGF)、神经营养蛋白-3(NT-3)、NT-4、胎盘生长因子(PGF)、血小板衍生的生长因子(PDGF)、肾胺酶(renalase)(RNLS)、T细胞生长因子(TCGF)、血小板生成素(TPO)、转化生长因子(例如,转化生长因子α(TGF-α)、TGF-β、肿瘤坏死因子-α(TNF-α)和血管内皮生长因子(VEGF)及其任何组合。

在某些示例性实施例中,异源多核苷酸序列编码激素。

在某些示例性实施例中,异源多核苷酸序列编码细胞因子。

在某些示例性实施例中,异源多核苷酸序列编码抗体或其片段。

在某些示例性实施例中,异源多核苷酸序列编码选自以下的基因:X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白(frataxin))、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)及其任何组合。

在某些示例性实施例中,异源多核苷酸序列编码微小RNA(miRNA)。在某些示例性实施例中,miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO及其任何组合。

在某些示例性实施例中,异源多核苷酸序列编码选自以下的凝血因子:因子I(FI)、因子II(FII)、因子III(FIII)、因子IV(FVI)、因子V(FV)、因子VI(FVI)、因子VII(FVII)、因子VIII(FVIII)、因子IX(FIX)、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FVIII)、血管性血友病因子(Von Willebrand factor,VWF)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)及其任何组合。

在某些示例性实施例中,凝血因子是FVIII。在某些示例性实施例中,FVIII包含全长成熟FVIII。在某些示例性实施例中,FVIII包含与具有SEQ ID NO:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。

在某些示例性实施例中,FVIII包含A1结构域、A2结构域、A3结构域、C1结构域、C2结构域以及部分或无B结构域。在某些示例性实施例中,FVIII包含与SEQ ID NO:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。

在某些示例性实施例中,凝血因子包含异源部分。在某些示例性实施例中,异源部分选自白蛋白或其片段、免疫球蛋白Fc区、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、PAS序列、HAP序列、转铁蛋白或其片段、白蛋白结合部分、其衍生物或其任何组合。在某些示例性实施例中,异源部分连接至FVIII的N末端或C末端或者插入FVIII的两个氨基酸之间。在某些示例性实施例中,异源部分在选自表4中所列插入位点的一个或多个插入位点插入两个氨基酸之间。

在某些示例性实施例中,FVIII还包含A1结构域、A2结构域、C1结构域、C2结构域、任选的B结构域和异源部分,其中异源部分紧邻对应于成熟FVIII(SEQ ID NO:106)的氨基酸745的下游插入。

在某些示例性实施例中,FVIII还包含FcRn结合配偶体。在某些示例性实施例中,FcRn结合配偶体包含免疫球蛋白恒定结构域的Fc区。

在某些示例性实施例中,编码FVIII的核酸序列经密码子优化。在某些示例性实施例中,编码FVIII的核酸序列经密码子优化以供在人体内表达。

在某些示例性实施例中,编码FVIII的核酸序列包含与SEQ ID NO:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。

在某些示例性实施例中,编码FVIII的核酸序列包含与SEQ ID NO:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。

在某些示例性实施例中,异源多核苷酸序列经密码子优化。在某些示例性实施例中,异源多核苷酸序列经密码子优化以供在人体内表达。

在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。在某些示例性实施例中,递送剂选自脂质体、非脂质聚合分子和内体及其任何组合。

在某些示例性实施例中,核酸分子经配制用于静脉内、经皮、皮内、皮下、经肺或口服递送或其任何组合。在某些示例性实施例中,核酸分子经配制用于静脉内递送。

在某些方面中,提供了包含如本文所述的核酸分子的载体。

在某些方面中,提供了包含如本文所述的核酸分子的宿主细胞。

在某些方面中,提供了药物组合物,其包含如本文所述的核酸分子或载体以及医药上可接受的赋形剂。

在某些方面中,提供了药物组合物,其包含如本文所述的宿主细胞以及医药上可接受的赋形剂。

在某些方面中,提供了套组(试剂盒),其包含如本文所述的核酸分子以及用于将核酸分子施用于有需要的受试者的说明书。

在某些方面中,提供了用于产生如本文所述的核酸分子的杆状病毒系统。

在某些示例性实施例中,在昆虫细胞中产生如本文所述的核酸分子。

在某些方面中,提供了包含如本文所述的核酸分子的纳米颗粒递送系统。

在某些方面中,提供了产生多肽的方法,其包括在适宜条件下培养如本文所述的宿主细胞和回收多肽。

在某些方面中,提供了产生具有凝血活性的多肽的方法,其包括:在适宜条件下培养如本文所述的宿主细胞和回收具有凝血活性的多肽。

在某些方面中,提供了在有需要的受试者体内表达异源多核苷酸序列的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。

在某些方面中,提供了在有需要的受试者体内表达凝血因子的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。

在某些方面中,提供了治疗有需要的受试者的疾病或病症的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。

在某些方面中,提供了治疗患有凝血因子缺乏的受试者的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。

在某些方面中,提供了治疗有需要的受试者中的凝血因子缺乏的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。

在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。

在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。

在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。

在某些示例性实施例中,相对于施用前受试者体内的FVIII活性,将核酸分子施用于受试者导致增加的FVIII活性,其中FVIII活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。

在某些示例性实施例中,受试者患有出血病症。在某些示例性实施例中,出血病症是血友病。在某些示例性实施例中,出血病症是血友病A。

在某些方面中,提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些方面中,提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII(FVIII)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。

在某些示例性实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。

在某些示例性实施例中,肝脏代谢病症选自苯丙酮尿症(PKU)、尿素循环疾病、溶酶体贮积病症和糖原贮积病。在某些示例性实施例中,肝脏代谢病症是苯丙酮尿症(PKU)。

在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。

在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。

在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。

在某些方面中,提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。

在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。

在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中。

在某些示例性实施例中,SbcCD复合物中的破坏包含SbcC基因和/或SbcD基因中的基因破坏。在某些示例性实施例中,SbcCD复合物中的破坏包含SbcC基因中的基因破坏。在某些示例性实施例中,SbcCD复合物中的破坏包含SbcD基因中的基因破坏。

在某些示例性实施例中,核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一和/或第二ITR是非腺相关病毒(非AAV)ITR。

在某些示例性实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在某些示例性实施例中,核酸分子还包含基因盒,其中基因盒侧接有第一ITR和第二ITR。

在某些示例性实施例中,基因盒包含异源多核苷酸序列。

在某些示例性实施例中,适宜载体是低拷贝载体。在某些示例性实施例中,适宜载体是pBR322。

在某些示例性实施例中,细菌宿主菌株不能拆分十字形DNA结构。

在某些示例性实施例中,细菌宿主菌株是PMC103,其包含基因型sbcC、recD、mcrA、ΔmcrBCF。在某些示例性实施例中,细菌宿主菌株是PMC107,其包含基因型recBC、recJ、sbcBC、mcrA、ΔmcrBCF。在某些示例性实施例中,细菌宿主菌株是SURE,其包含基因型recB、recJ、sbcC、mcrA、ΔmcrBCF、umuC、uvrC。

在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

附图简述

图1A-1B是单链凝血因子(例如,FVIII)表达盒的示意图。显示了来自非AAV的5'ITR(在ssDNA结构的末端具有发夹环)、来自非AAV的3'ITR(具有发夹环)、启动子序列(例如,TTPp或CAGp)和转基因序列(例如,在B结构域内插入XTEN144的FVIIIco6XTEN序列)的位置。示例性表达盒还显示了其他可能的组件,例如内含子序列、WPREmut序列和bGHpA序列。

图1C-1F是用于制备单链凝血因子表达盒(如图1A-1B中所示的盒)的质粒的示意图,其中盒的ITR衍生自AAV2(图1C)、B19(图1D)、GPV(图1E),或者是野生型B19 ITR序列(图1F)。用PvuII(在PvuII位点)(图1C)或LguI(在LguI位点)(图1D-1F)消化包含如此处所示的ssFVIII表达盒的质粒构建体,以精确释放包含ITR和表达盒的序列。使双链DNA在95℃下热变性以产生ssDNA,然后在4℃下温育以允许ITR结构形成。

图2A是系统发生树,其说明了各种细小病毒家族成员之间的关系。B19、AAV-2和GPV用轮廓框标记。

图2B是包括发夹结构在内的各种盒的示意图。

图3A和3B是B19、GPV和AAV2的ITR(图3A)以及B19和GPV的ITR(图3B)的比对。灰色阴影显示了同源性。

图4A-4C显示了在Hem A小鼠体内在通过流体力学注射(HDI)施用单链FVIII-AAV裸DNA(ssAAV-FVIII;图1C)、ssDNA-B19 FVIII(图1D)或ssDNA-GPV FVIII(图1E)后的FVIII血浆活性。在用50μg/小鼠(图4C)、20μg/小鼠(图4A和4B)、10μg/小鼠(图4A、4B和4C)或5μg/小鼠(图4A)的ssDNA的单次HDI处理的小鼠体内,在24小时、3天、2周、3周、1个月、2个月、3个月、4个月、5个月和6个月时,量测血浆样品中的FVIII活性(作为人体内正常生理水平的百分比)。给出5μg/小鼠的质粒DNA的HDI作为对照(图4A、4B和4C)。

图5显示了在单次流体力学注射等摩尔量的单链裸DNA(ssAAV-FVIII,图1A)、含有ITR序列的双链AAV-FVIII DNA(dsDNA)、不含ITR序列的双链FVIII DNA(无ITR的dsDNA)或不含ITR或细菌序列的环化双链FVIII DNA(微环)后,血友病A小鼠血浆中的FVIII活性。dsDNA是通过用PvuII对AAV-FVIII质粒(图2C)进行酶切割来产生,但没有进行热变性。无ITR的dsDNA是通过用AflII对AAV-FVIII质粒(图2C)进行酶切割来产生并且随后进行纯化。微环DNA是通过在AflII位点连接无ITR DNA的dsDNA来产生。经3个月或4个月收集小鼠血浆并且通过生色活性测定来确定FVIII。

图6显示了在流体力学注射30μg单链裸FVIII-DNA(图1A、图1D-1F)后,血友病A小鼠血浆中的FVIII活性。每周收集血浆持续7周并且通过生色测定来确定FVIII活性。在35天(描绘为黑色箭头)后,通过流体力学注射向接受FVIII-B19d135和FVIII-GPVd162 ssDNA的小鼠再次施用30μg。

图7A是单链鼠类苯丙氨酸羟化酶(例如,PAH)表达盒的示意图。显示了来自非AAV的5'ITR(在ssDNA结构的末端具有发夹环)、来自非AAV的3'ITR(具有发夹环)、启动子序列(例如,CAGp)和转基因序列(例如,3xFLAG_mPAH序列)的位置。示例性表达盒还显示了其他可能的组件,例如WPREmut序列和bGHpA序列。

图7B-7D显示了在通过流体力学注射单次施用含有鼠类PAH cDNA和非AAV ITRB19d135或GPVd162的单链DNA之前(第0天)和之后,苯丙酮尿症(PKU)小鼠体内苯丙氨酸(Phe)的血浆浓度。在ssDNA施用后第3、7、14、28、42和56天收集血浆。残余苯丙氨酸水平显示为以μg/ml计的浓度(图7B-7C)或显示为施用前的百分比(图7D)。水平线描绘了施用前的基线Phe水平。

图7E显示了来自用含有鼠类PAH转基因和B19d135或GPVd165 ITR的ssDNA处理的PKU小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用M2抗FLAG抗体侦检FLAG标记的鼠类PAH蛋白,并且包括GAPDH上样对照以供比较。

图8A-B显示了在用囊封FVIII-AAV DNA(图1A-1C)的脂质纳米颗粒转导后,Huh7细胞上清液中的FVIII活性水平。将在CAGp启动子(图1B)下的质粒FVIII-AAV以等于3的胺与磷酸(NP)比率囊封,并且以通过picogreen测定确定的不同浓度应用于Huh7细胞(图8A)。将在TTPp启动子(图1A)下的质粒、双链线性(ds)和单链(ss)AAV-FVIII以等于2的NP比率也囊封于脂质纳米颗粒中,并且用于以不同DNA浓度转导Huh7细胞(图8B)。与人FACT血浆标准品相比,通过生色活性测定来量测FVIII。

发明详述

本公开文本描述了质粒样核酸分子,其包含第一反向末端重复(ITR)、第二ITR和基因盒(例如,编码靶序列(本文中也称作异源多核苷酸序列),例如治疗性蛋白质或miRNA),其中第一ITR和/或第二ITR是非腺相关病毒的ITR(例如,第一ITR和/或第二ITR来自非AAV)。在一些实施例中,基因盒编码治疗性蛋白质,例如,靶序列编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、激素、细胞因子、抗体、其片段或其组合。在一些实施例中,基因盒编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合。

在一些实施例中,治疗性蛋白质包含凝血因子。在一个特定实施例中,治疗性蛋白质包含FVIII或FIX蛋白。

在一些实施例中,基因盒编码miRNA。在某些实施例中,miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO或其任何组合。

在某些实施例中,非AAV选自病毒科细小病毒科(Parvoviridae)的成员及其任何组合。本公开文本还涉及在有需要的受试者体内表达治疗性蛋白质(例如,凝血因子(例如,FVIII))的方法,其包括将包含第一反向末端重复(ITR)、第二ITR和基因盒(例如,编码治疗性蛋白质或miRNA)的核酸分子施用于受试者,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在某些实施例中,本公开文本描述了分离的核酸分子,其包含与选自SEQ IDNO:113和120的核苷酸序列具有序列同源性的核苷酸序列。

在某些实施例中,本公开文本提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含异源多核苷酸序列,其中第一和/或第二ITR衍生自细小病毒B19或鹅细小病毒(GPV)。

本公开文本的示例性构建体说明于附图和序列表中。为了提供对说明书和申请专利范围的清晰理解,下文提供了以下定义。

I.定义

应注意,术语“一个/一种(a)”或“一个/一种(an)”实体是指一个/一种或多个/多种所述实体:例如,“一个核苷酸序列”应理解为代表一个或多个核苷酸序列。类似地,“一种治疗性蛋白质”和“一种miRNA”应理解为分别代表一种或多种治疗性蛋白质和一种或多种miRNA。因此,术语“一个/一种(a)”(或“一个/一种(an)”)、“一个/一种或多个/多种”和“至少一个/一种”在本文中可互换使用。

术语“约”在本文中用于意指大约、大致、大约地或在…左右。在术语“约”结合数字范围使用时,其通过扩展所述数值上下的边界来修饰所述范围。通常,术语“约”在本文中用于向上或向下(较高或较低)以10%的差异修饰高于和低于所述值的数值。

同样如本文所用,“和/或”是指并且涵盖一个或多个相关列示项目的任何和所有可能组合,以及在替代方案(“或”)中解释时组合的缺少。

“核酸”、“核酸分子”、“核苷酸”、“一个或多个核苷酸的序列”和“多核苷酸”可互换使用并且是指呈单链形式或双链螺旋的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯聚合形式或其任何磷酸酯类似物,如硫代磷酸酯和硫代酸酯。单链核酸序列是指单链DNA(ssDNA)或单链RNA(ssRNA)。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子、特别是DNA或RNA分子仅仅是指分子的一级和二级结构,并且不将其限制为任何特定三级形式。因此,这个术语包括尤其在线性或环状DNA分子(例如,限制性片段)、质粒、超螺旋化DNA和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构时,在本文中可以根据常规习惯描述序列,仅沿DNA的非转录链(即,具有与mRNA同源的序列的链)以5’至3’方向给出序列。“重组DNA分子”是已经经历分子生物学操纵的DNA分子。DNA包括但不限于cDNA、基因组DNA、质粒DNA、合成DNA和半合成DNA。本公开文本的“核酸组合物”包含如本文所述的一种或多种核酸。

如本文所用,“反向末端重复”(或“ITR”)是指位于单链核酸序列的5'端或3'端的核酸子序列,其包含一组核苷酸(初始序列),之后下游是其反向互补物,即回文序列。初始序列与反向互补物之间的插入核苷酸序列可以具有任何长度,包括零。在一个实施例中,可用于本公开文本的ITR包含一个或多个“回文序列”。ITR可以具有任何数目的功能。在一些实施例中,本文所述的ITR形成发夹结构。在一些实施例中,ITR形成T形发夹结构。在一些实施例中,ITR形成非T形发夹结构,例如U形发夹结构。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的长期存活。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的永久存活(例如,持续细胞的整个寿命)。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的稳定性。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的保留。在一些实施例中,ITR促进核酸分子在细胞的细胞核中的持久性。在一些实施例中,ITR抑制或防止核酸分子在细胞的细胞核中的降解。

在一个实施例中,初始序列和/或反向互补物包含约2-600个核苷酸、约2-550个核苷酸、约2-500个核苷酸、约2-450个核苷酸、约2-400个核苷酸、约2-350个核苷酸、约2-300个核苷酸或约2-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-600个核苷酸、约10-600个核苷酸、约15-600个核苷酸、约20-600个核苷酸、约25-600个核苷酸、约30-600个核苷酸、约35-600个核苷酸、约40-600个核苷酸、约45-600个核苷酸、约50-600个核苷酸、约60-600个核苷酸、约70-600个核苷酸、约80-600个核苷酸、约90-600个核苷酸、约100-600个核苷酸、约150-600个核苷酸、约200-600个核苷酸、约300-600个核苷酸、约350-600个核苷酸、约400-600个核苷酸、约450-600个核苷酸、约500-600个核苷酸或约550-600个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-550个核苷酸、约5至500个核苷酸、约5-450个核苷酸、约5至400个核苷酸、约5-350个核苷酸、约5至300个核苷酸或约5-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约10-550个核苷酸、约15-500个核苷酸、约20-450个核苷酸、约25-400个核苷酸、约30-350个核苷酸、约35-300个核苷酸或约40-250个核苷酸。在某些实施例中,初始序列和/或反向互补物包含约225个核苷酸、约250个核苷酸、约275个核苷酸、约300个核苷酸、约325个核苷酸、约350个核苷酸、约375个核苷酸、约400个核苷酸、约425个核苷酸、约450个核苷酸、约475个核苷酸、约500个核苷酸、约525个核苷酸、约550个核苷酸、约575个核苷酸或约600个核苷酸。在特定实施例中,初始序列和/或反向互补物包含约400个核苷酸。

在其他实施例中,初始序列和/或反向互补物包含约2-200个核苷酸、约5-200个核苷酸、约10-200个核苷酸、约20-200个核苷酸、约30-200个核苷酸、约40-200个核苷酸、约50-200个核苷酸、约60-200个核苷酸、约70-200个核苷酸、约80-200个核苷酸、约90-200个核苷酸、约100-200个核苷酸、约125-200个核苷酸、约150-200个核苷酸或约175-200个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-150个核苷酸、约5-150个核苷酸、约10-150个核苷酸、约20-150个核苷酸、约30-150个核苷酸、约40-150个核苷酸、约50-150个核苷酸、约75-150个核苷酸、约100-150个核苷酸或约125-150个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-100个核苷酸、约5-100个核苷酸、约10-100个核苷酸、约20-100个核苷酸、约30-100个核苷酸、约40-100个核苷酸、约50-100个核苷酸或约75-100个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-50个核苷酸、约10-50个核苷酸、约20-50个核苷酸、约30-50个核苷酸、约40-50个核苷酸、约3-30个核苷酸、约4-20个核苷酸或约5-10个核苷酸。在另一个实施例中,初始序列和/或反向互补物由2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸组成。在其他实施例中,初始序列与反向互补物之间的插入核苷酸是(例如,由以下组成)0个核苷酸、1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸。

因此,如本文所用的“ITR”可以折叠回于自身并形成双链区段。例如,在折叠形成双螺旋时,序列GATCXXXXGATC包含GATC的初始序列及其补体(3'CTAG5')。在一些实施例中,ITR包含初始序列与反向互补物之间的连续回文序列(例如,GATCGATC)。在一些实施例中,ITR包含初始序列与反向互补物之间的中断的回文序列(例如,GATCXXXXGATC)。在一些实施例中,连续或中断的回文序列的互补部分彼此相互作用以形成“发夹环”结构。如本文所用,在单链核苷酸分子上的至少两个互补序列碱基配对形成双链部分时,产生“发夹环”结构。在一些实施例中,仅ITR的一部分形成发夹环。在其他实施例中,整个ITR形成发夹环。

在本公开文本中,至少一个ITR是非腺病毒相关病毒(非AAV)的ITR。在某些实施例中,ITR是病毒科细小病毒科的非AAV成员的ITR。在一些实施例中,ITR是依赖病毒属(Dependovirus)或红病毒属(Erythrovirus)的非AAV成员的ITR。在特定实施例中,ITR是以下病毒的ITR:鹅细小病毒(GPV)、番鸭细小病毒(MDPV)或红病毒属细小病毒B19(也称为细小病毒B19、灵长类红细小病毒1、B19病毒和红病毒)。在某些实施例中,两个ITR中的一个ITR是AAV的ITR。在其他实施例中,构建体中两个ITR中的一个ITR是选自以下的AAV血清型的ITR:血清型1、2、3、4、5、6、7、8、9、10、11及其任何组合。在一个特定实施例中,ITR衍生自AAV血清型2,例如AAV血清型2的ITR。

在本公开文本的某些方面中,核酸分子包含两个ITR,5'ITR和3'ITR,其中5'ITR位于核酸分子的5'末端,并且3'ITR位于核酸分子的3'末端。5'ITR和3'ITR可以衍生自相同病毒或不同病毒。在某些实施例中,5'ITR衍生自AAV并且3'ITR并非衍生自AAV病毒(例如,非AAV)。在一些实施例中,3'ITR衍生自AAV并且5'ITR并非衍生自AAV病毒(例如,非AAV)。在其他实施例中,5'ITR并非衍生自AAV病毒(例如,非AAV),并且3'ITR衍生自相同或不同的非AAV病毒。

如本文所用的术语“细小病毒”涵盖细小病毒科,包括但不限于自主复制的细小病毒和依赖病毒。自主细小病毒包括例如以下属的成员:博卡病毒属(Bocavirus)、依赖病毒属、红病毒属、阿留申病毒属(Amdovirus)、细小病毒属(Parvovirus)、浓核病毒属(Densovirus)、重复病毒属(Iteravirus)、康特拉病毒属(Contravirus)、禽细小病毒属(Aveparvovirus)、反刍类细小病毒属(Copiparvovirus)、原细小病毒属(Protoparvovirus)、四型细小病毒属(Tetraparvovirus)、双义浓核病毒属(Ambidensovirus)、短浓核病毒属(Brevidensovirus)、肝胰浓核病毒属(Hepandensovirus)和对虾浓核病毒属(Penstyldensovirus)。

示例性自主细小病毒包括但不限于猪细小病毒、小鼠微小病毒、犬细小病毒、水貂肠炎病毒、牛细小病毒、鸡细小病毒、猫瘟病毒、猫细小病毒、鹅细小病毒、H1细小病毒、番鸭细小病毒、蛇细小病毒和B19病毒。其他自主细小病毒是本领域的技术人员已知的。参见例如,FIELDS等VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。

如本文所用的术语“非AAV”涵盖来自细小病毒科的核酸、蛋白质和病毒,不包括细小病毒科的任何腺相关病毒(AAV)。“非AAV”包括但不限于以下属的自主复制成员:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属和对虾浓核病毒属。

如本文所用,术语“腺相关病毒”(AAV)包括但不限于AAV 1型、AAV 2型、AAV 3型(包括3A型和3B型)、AAV 4型、AAV 5型、AAV 6型、AAV7型、AAV 8型、AAV 9型、AAV 10型、AAV11型、AAV 12型、AAV 13型、蛇AAV、禽AAV、牛AAV、犬AAV、马AAV、绵羊AAV、山羊AAV、虾AAV、Gao等(J.Virol.78:6381(2004))和Moris等(Virol.33:375(2004))所披露的那些AAV血清型和进化枝以及目前已知或将来发现的任何其他AAV。参见例如,FIELDS等VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。

如本文所用,术语“衍生自”是指组分从指定分子或生物体分离或使用指定分子或生物体制备,或者信息(例如,氨基酸或核酸序列)来自指定分子或生物体。例如,衍生自第二核酸序列(例如,ITR)的核酸序列(例如,ITR)可包括与第二核酸序列的核苷酸序列相同或基本上相似的核苷酸序列。在核苷酸或多肽的情况下,衍生的物质可以通过例如天然存在的突变诱发、人工定向突变诱发或人工随机突变诱发来获得。用于衍生核苷酸或多肽的突变诱发可以是有意定向的或有意随机的,或者是各自的混合。突变诱发核苷酸或多肽以产生衍生自第一核苷酸或多肽的不同核苷酸或多肽可以是随机事件(例如,由于聚合酶失真而引起),并且所衍生的核苷酸或多肽的鉴定可通过适当的筛选方法(例如,如本文所讨论)来进行。多肽的突变诱发通常需要操纵编码多肽的多核苷酸。在一些实施例中,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少90%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少80%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少70%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少60%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)至少50%相同,其中非AAV(或AAV)ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。

在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成。在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸,并且其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。在某些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸,并且其中衍生自非AAV(或AAV)的ITR的ITR保留非AAV ITR(或分别地,AAV ITR)的功能特性。

在一些实施例中,衍生自非AAV(或AAV)的ITR的ITR包含非AAV(或AAV)的ITR的片段或由所述片段组成,其中所述片段包含非AAV(或AAV)的ITR的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。

在某些实施例中,在正确比对时,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少90%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少80%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAVITR(或分别地,AAV ITR)的同源部分至少70%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少60%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非AAV(或AAV)的ITR的ITR与非AAV ITR(或分别地,AAV ITR)的同源部分至少50%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。

“无衣壳(capsid-free)”或“无衣壳(capsid-less)”载体或核酸分子是指不具有衣壳的载体构建体。在一些实施例中,无衣壳载体或核酸分子不含编码例如AAV Rep蛋白的序列。

如本文所用,“编码区”或“编码序列”是多核苷酸中由可翻译成氨基酸的密码子组成的部分。虽然“终止密码子”(TAG、TGA或TAA)通常不翻译成氨基酸,但是可以认为其是编码区的一部分,但是任何侧接序列(例如启动子、核糖体结合位点、转录终止子、内含子等)不是编码区的一部分。编码区的边界通常由5’末端的起始密码子(编码所得多肽的胺基末端)和3’末端的翻译终止密码子(编码所得多肽的羧基末端)来决定。两个或更多个编码区可存在于单一多核苷酸构建体中(例如,在单一载体上),或者存在于单独的多核苷酸构建体中(例如,在单独的(不同的)载体上)。然后,结果就是单一载体可仅含有单个编码区,或者包含两个或更多个编码区。

哺乳动物细胞分泌的某些蛋白质与分泌信号肽相关,一旦生长中的蛋白质链跨越糙面内质网的输出已经起始所述分泌信号肽便从成熟蛋白质切割下来。本领域的技术人员知道,信号肽通常融合至多肽的N末端,并且是从完整或“全长”多肽切割下来以产生多肽的分泌或“成熟”形式。在某些实施例中,天然信号肽或所述序列的保留指导多肽分泌的能力的功能衍生物与所述多肽可操作地相关。可替代地,可以使用异源哺乳动物信号肽(例如,人组织纤溶酶原激活物(TPA)或小鼠β-葡糖醛酸糖苷酶信号肽)或其功能衍生物。

术语“下游”是指核苷酸序列位于参考核苷酸序列的3’。在某些实施例中,下游核苷酸序列是指转录起点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。

术语“上游”是指核苷酸序列位于参考核苷酸序列的5’。在某些实施例中,上游核苷酸序列是指位于编码区或转录起点的5’侧的序列。例如,大多数启动子位于转录起始位点的上游。

如本文所用,术语“基因调控区”或“调控区”是指位于编码区的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码区的转录、RNA加工、稳定性或翻译的核苷酸序列。调控区可以包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、RNA加工位点、效应子结合位点或茎环结构。如果意图在真核细胞中表达编码区,则多聚腺苷酸化信号和转录终止序列通常将位于编码序列的3’。

编码产物(例如,miRNA或基因产物(例如,多肽,如治疗性蛋白质))的多核苷酸可以包括与一个或多个编码区可操作地缔合的启动子和/或其他表达(例如,转录或翻译)控制组件。在可操作缔合中,以将基因产物的表达置于一个或多个调控区的影响或控制下的方式将基因产物(例如,多肽)的编码区与所述一个或多个调控区缔合。例如,如果启动子功能的诱导引起编码由编码区所编码的基因产物的mRNA的转录,并且如果启动子与编码区之间的连接的性质不干扰启动子指导基因产物表达的能力或者不干扰DNA模板被转录的能力,则编码区和启动子“可操作地缔合”。除了启动子以外的其他表达控制组件(例如,增强子、操纵子、阻遏物和转录终止信号)也可以与编码区可操作地缔合以指导基因产物表达。

“转录控制序列”是指提供编码序列在宿主细胞中的表达的DNA调控序列,如启动子、增强子、终止子等。多种转录控制区是本领域的技术人员已知的。这些转录控制区包括但不限于作用于脊椎动物细胞中的转录控制区,例如但不限于来自巨细胞病毒(立即早期启动子,与内含子-A结合)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其他转录控制区包括衍生自脊椎动物基因的那些控制区,如肌动蛋白、热休克蛋白、牛生长激素和兔β-珠蛋白,以及能够控制真核细胞中的基因表达的其他序列。其他适宜转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导型启动子(例如,可由干扰素或白介素诱导的启动子)。

类似地,多种翻译控制组件是本领域的技术人员已知的。这些翻译控制组件包括但不限于核糖体结合位点、翻译起始和终止密码子以及衍生自微小核糖核酸病毒的组件(特别是内部核糖体进入位点,或IRES,也称为CITE序列)。

如本文所用的术语“表达”是指多核苷酸产生基因产物(例如,RNA或多肽)的过程。其包括但不限于多核苷酸转录为信使RNA(mRNA)、转移RNA(tRNA)、小发夹RNA(shRNA)、小干扰RNA(siRNA)或任何其他RNA产物,以及mRNA翻译为多肽。表达产生“基因产物”。如本文所用,基因产物可以是核酸(例如,通过基因转录产生的信使RNA)或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰(例如,多聚腺苷酸化或剪接)的核酸,或者具有翻译后修饰(例如,甲基化、糖基化、脂质添加、与其他蛋白质亚基缔合或蛋白质水解切割)的多肽。如本文所用,术语“产量”是指通过基因表达产生的多肽的量。

“载体”是指用于将核酸克隆和/或转移至宿主细胞中的任何媒剂。载体可以是复制子,另一核酸区段可以与其连接以实现所连接区段的复制。“复制子”是指在体内起自主复制单元的作用(即,能够在其自身控制下复制)的任何基因组件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括在体外、离体或在体内将核酸引入细胞中的媒剂。本领域已知并使用大量载体,包括例如质粒、经修饰真核病毒或经修饰细菌病毒。将多核苷酸插入适宜载体中可以通过将适当多核苷酸片段连接至具有互补粘性末端的所选载体中来完成。

可以对载体进行工程化以编码可选标记或报告物,其提供对已经并入载体的细胞的选择或鉴定。可选标记或报告物的表达允许鉴定和/或选择并入并表达含于载体上的其他编码区的宿主细胞。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。本领域已知并使用的报告物的例子包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。还可以将可选标记视为报告物。

如本文所用的术语“宿主细胞”是指例如可以或已经用作ssDNA或载体的接受者的微生物、酵母细胞、昆虫细胞和哺乳动物细胞。所述术语包括已经转导的初始细胞的后代。因此,如本文所用的“宿主细胞”通常是指已经用外源DNA序列转导的细胞。应理解,由于天然、偶然或刻意突变,单个亲代细胞的后代的形态或基因组或总DNA补体可能不一定与初始亲代完全相同。在一些实施例中,宿主细胞可以是体外宿主细胞。

术语“可选标记”是指能够基于标记基因的效应(即,对抗生素的抗性、对除草剂的抗性、比色标记、酶、荧光标记等)加以选择的鉴定因子(通常是抗生素或化学抗性基因),其中所述效应用于跟踪所关注核酸的遗传和/或鉴定已经遗传所关注核酸的细胞或生物体。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。

术语“报告基因”是指编码能够基于报告基因的效应加以鉴定的鉴定因子的核酸,其中所述效应用于跟踪所关注核酸的遗传性、鉴定已经遗传所关注核酸的细胞或生物体和/或量测基因表达诱导或转录。本领域已知并使用的报告基因的例子包括:荧光素酶(Luc)、绿色荧光蛋白(GFP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶(LacZ)、β-葡糖醛酸糖苷酶(Gus)等。也可以将可选标记基因视为报告基因。

“启动子”与“启动子序列”可互换使用并且是指能够控制编码序列或功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3'。启动子可以整体衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同组件构成,或者甚至包含合成DNA区段。本领域的技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子一般被称为“组成型启动子”。使基因在特定细胞类型中表达的启动子一般被称为“细胞特异性启动子”或“组织特异性启动子”。使基因在发育或细胞分化的特定阶段表达的启动子一般被称为“发育特异性启动子”或“细胞分化特异性启动子”。在用诱导启动子的试剂、生物分子、化学品、配位体、光等暴露或处理细胞后被诱导并且使基因表达的启动子一般被称为“诱导型启动子”或“可调型启动子”。还认识到,由于在大多数情况下,尚未完全界定调控序列的确切边界,所以不同长度的DNA片段可以具有相同的启动子活性。

启动子序列通常在其3’末端以转录起始位点为界,并向上游(5’方向)延伸以包括以高于背景的可侦检水平起始转录所必需的最小数目的碱基或组件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1标示(mapping)方便地界定)以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。

在一些实施例中,核酸分子包含组织特异性启动子。在某些实施例中,组织特异性启动子驱动治疗性蛋白质(例如,凝血因子)在肝脏中(例如,在肝细胞和/或内皮细胞中)的表达。在特定实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(TTP)启动子、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)启动子及其任何组合。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(AAT))、肌肉特异性启动子(例如,肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)和结蛋白(DES))、合成启动子(例如,SPc5-12、2R5Sc5-12、dMCK和tMCK)及其任何组合。在一个特定实施例中,启动子包含TTP启动子。

术语“限制性内切核酸酶”与“限制酶”可互换使用并且是指在双链DNA内的特定核苷酸序列内结合并切割的酶。

术语“质粒”是指通常携带并非细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式的染色体外组件。此类组件可以是衍生自任何来源的单链或双链DNA或RNA的线性、环状或超螺旋化的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经接合或重组至独特构建体中,所述构建体能够将用于所选基因产物的启动子片段和DNA序列以及适当的3'非翻译序列引入细胞中。

可以使用的真核病毒载体包括但不限于腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如,牛痘病毒载体)、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染剂)、DNA-蛋白质复合物和生物聚合物。

“克隆载体”是指“复制子”,其是单位长度的连续复制的核酸并且其包含复制起点,如质粒、噬菌体或粘粒,另一核酸区段可以与所述复制子连接以实现所连接区段的复制。某些克隆载体能够在一种细胞类型(例如,细菌)中复制,并在另一细胞类型(例如,真核细胞)中表达。克隆载体通常包含一个或多个可以用于选择包含载体的细胞的序列和/或一个或多个用于插入所关注核酸序列的多重克隆位点。

术语“表达载体”是指设计为使得所插入核酸序列在插入宿主细胞中之后能够表达的媒剂。将所插入核酸序列以如上所述的与调控区可操作地缔合地放置。

通过业内熟知的方法将载体引入宿主细胞中,所述方法是例如转染、电穿孔、显微注射、转导、细胞融合、DEAE葡聚糖、磷酸钙沈淀、脂转染(溶酶体融合)、使用基因枪或DNA载体转运蛋白。如本文所用,“培养(culture)”、“培养(to culture)”和“培养(culturing)”意指在允许细胞生长或分裂的体外条件下温育细胞或使细胞维持存活状态。如本文所用,“所培养细胞”意指在体外繁殖的细胞。

如本文所用,术语“多肽”旨在涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不涉及产物的具体长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条或多条链的任何其他术语包括于“多肽”的定义内,并且术语“多肽”可以代替这些术语中的任一个术语或与其互换使用。术语“多肽”还意图指多肽的表达后修饰的产物,所述修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生、蛋白质水解切割或通过非天然存在的氨基酸修饰。多肽可以从天然生物来源衍生或通过重组技术产生,但不一定是从指定的核酸序列翻译。其能以任何方式产生,包括通过化学合成产生。

术语“氨基酸”包括丙氨酸(Ala或A);精氨酸(Arg或R);天冬酰胺(Asn或N);天冬氨酸(Asp或D);半胱氨酸(Cys或C);谷氨酰胺(Gln或Q);谷氨酸(Glu或E);甘氨酸(Gly或G);组氨酸(His或H);异亮氨酸(Ile或I);亮氨酸(Leu或L);赖氨酸(Lys或K);甲硫氨酸(Met或M);苯丙氨酸(Phe或F);脯氨酸(Pro或P);丝氨酸(Ser或S);苏氨酸(Thr或T);色氨酸(Trp或W);酪氨酸(Tyr或Y);和缬氨酸(Val或V)。非传统氨基酸也在本公开文本的范围内,并且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,如Ellman等Meth.Enzym.202:301-336(1991)中所述的那些。为了产生此类非天然存在的氨基酸残基,可使用Noren等Science 244:182(1989)和Ellman等(同上)的程序。简言之,这些程序涉及用非天然存在的氨基酸残基化学激活抑制剂tRNA,之后进行RNA的体外转录和翻译。引入非传统氨基酸也可使用本领域已知的肽化学来实现。如本文所用,术语“极性氨基酸”包括具有零个净电荷,但是在其侧链的不同部分具有非零部分电荷的氨基酸(例如,M、F、W、S、Y、N、Q、C)。这些氨基酸可参与疏水相互作用和静电相互作用。如本文所用,术语“带电氨基酸”包括在其侧链上具有非零净电荷的氨基酸(例如,R、K、H、E、D)。这些氨基酸可参与疏水相互作用和静电相互作用。

本公开文本中还包括多肽的片段或变异体及其任何组合。术语“片段”或“变异体”在涉及本公开文本的多肽结合结构域或结合分子时包括保留参考多肽的至少一些特性(例如,对FcRn结合结构域或Fc变异体的FcRn结合亲和性、对FVIII变异体的凝结活性或对VWF片段的FVIII结合活性)的任何多肽。除了本文中其他地方讨论的特定抗体片段以外,多肽片段包括蛋白质水解片段以及缺失片段,但是不包括天然存在的全长多肽(或成熟多肽)。本公开文本的多肽结合结构域或结合分子的变异体包括如上所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变异体可以是天然存在的或非天然存在的。非天然存在的变异体可以使用本领域已知的突变诱发技术来产生。变异体多肽可以包含保守或非保守氨基酸取代、缺失或添加。

“保守氨基酸取代”是用具有类似侧链的氨基酸残基替代氨基酸残基的取代。业内已经定义具有类似侧链的氨基酸残基的家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果用来自相同侧链家族的另一氨基酸替代多肽中的氨基酸,则将取代视为保守的。在另一个实施例中,氨基酸串可以用结构上类似但侧链家族成员的顺序和/或组成不同的串来保守地替代。

如本领域已知的术语“同一性百分比”是两个或更多个多肽序列或者两个或更多个多核苷酸序列之间的关系,如通过比较序列所确定。在业内,根据具体情况,“同一性”也意指多肽或多核苷酸序列之间的序列关联性程度,如通过此类序列的串之间的匹配所确定。“同一性”可通过已知方法容易地计算,所述方法包括但不限于以下文献中所述的那些方法:Computational Molecular Biology(Lesk,A.M.编)Oxford University Press,NewYork(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编)AcademicPress,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.编)Humana Press,New Jersey(1994);Sequence Analysis in MolecularBiology(von Heinje,G.编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编)Stockton Press,New York(1991)。确定同一性的较佳方法设计为给出所测试序列之间的最佳匹配。确定同一性的方法被编纂于可公开获得的计算机程序中。序列比对和同一性百分比计算可使用序列分析软件来进行,所述序列分析软件是例如LASERGENE生物信息学计算套件的Megalign程序(DNASTAR Inc.,威斯康星州麦迪逊市)、GCG程序套件(Wisconsin Package 9.0版,Genetics Computer Group(GCG),威斯康星州麦迪逊市)、BLASTP、BLASTN、BLASTX(Altschul等,J.Mol.Biol.215:403(1990))和DNASTAR(DNASTAR,Inc.1228S.Park St.威斯康星州麦迪逊市53715 USA)。在本申请的上下文中将理解,如果使用序列分析软件进行分析,除非另外指定,否则分析结果将基于所参考程序的“缺省值”。如本文所用的“缺省值”将意指在首次初始化时最初用软件加载的任一组值或参数。出于确定本公开文本的治疗性蛋白质(例如,凝血因子)序列与参考序列之间的同一性百分比的目的,仅使用参考序列中对应于本公开文本的治疗性蛋白质(例如,凝血因子)序列中的核苷酸的核苷酸来计算同一性百分比。例如,在比较含有B结构域的全长FVIII核苷酸序列与本公开文本的优化的B结构域缺失(BDD)FVIII核苷酸序列时,将使用包括A1、A2、A3、C1和C2结构域的比对部分来计算同一性百分比。全长FVIII序列的编码B结构域的部分(其将在比对中产生大的“空位”)中的核苷酸将不会被计为错配。另外,在确定本公开文本的优化的BDD FVIII序列或其指定部分(例如,SEQ ID NO:3的核苷酸58-2277和2320-4374)与参考序列之间的同一性百分比时,将通过比对、用匹配核苷酸数除以如本文所述的优化的BDD-FVIII序列或其指定部分的完整序列中的核苷酸总数来计算同一性百分比。

如本文所用,对应于本公开文本的特定序列中的核苷酸的核苷酸是通过比对本公开文本的序列以最大化与参考序列的同一性来鉴定。用于鉴定参考序列中的等效氨基酸的编号是基于用于鉴定本公开文本的序列中的相应氨基酸的编号。

“融合”或“嵌合”蛋白包含连接至第二氨基酸序列的第一氨基酸序列,所述第一氨基酸序列在自然界中并非天然地与所述第二氨基酸序列连接。可以使通常存在于单独蛋白质中的氨基酸序列在融合多肽中聚在一起,或者可以将通常存在于相同蛋白质中的氨基酸序列以新排列置于融合多肽(例如,本公开文本的因子VIII结构域与Ig Fc结构域的融合物)中。例如通过化学合成或通过产生并翻译其中以所需关系编码肽区的多核苷酸来产生融合蛋白。嵌合蛋白还可以包含通过共价非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。

如本文所用,术语“插入位点”是指多肽或其片段、变异体或衍生物中的如下位置,其紧邻可插入异源部分的位置的上游。将“插入位点”指定为编号,所述编号是氨基酸在参考序列中的编号。例如,FVIII中的“插入位点”是指成熟天然FVIII(SEQ ID NO:15)中插入位点所对应的氨基酸序列的编号,其紧邻插入位置的N末端。例如,词组“a3在对应于SEQ IDNO:15的氨基酸1656的插入位点包含异源部分”指示,异源部分位于对应于SEQ ID NO:15的氨基酸1656和氨基酸1657的两个氨基酸之间。

如本文所用的词组“紧邻氨基酸的下游”是指与氨基酸的末端羧基紧紧相邻的位置。类似地,词组“紧邻氨基酸的上游”是指与氨基酸的末端胺基紧紧相邻的位置。

如本文所用的术语“插入(inserted)”、“被插入(is inserted)”、“插入于(inserted into)”或语法相关术语涉及相对于亲代多肽中的类似位置,异源部分在多肽(例如,凝血因子)中的位置。例如,在某些实施例中,“插入”等涉及相对于天然成熟人FVIII中的类似位置,异源部分在重组FVIII多肽中的位置。如本文所用,所述术语是指多肽的特征,并且并非指示、暗示或意味着制备多肽的任何方法或工艺。

如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可以表示为施用于受试者的数量的一半被从动物的循环和/或其他组织中清除所需的时间。在将给定多肽的清除曲线构建为时间函数时,所述曲线通常是二相的,具有快速的α相和较长的β相。α相通常代表所施用的Fc多肽在血管内与血管外空间之间的平衡,并且部分取决于多肽的大小。β相通常代表多肽在血管内空间中的分解代谢。在一些实施例中,治疗性蛋白质(例如,凝血因子,例如FVIII)和包含所述治疗性蛋白质的嵌合蛋白是单相的,并且因此不具有α相,而是只具有单一β相。因此,在某些实施例中,如本文所用的术语半衰期是指多肽在β相中的半衰期。

如本文所用的术语“连接”是指第一氨基酸序列或核苷酸序列分别与第二氨基酸序列或核苷酸序列共价或非共价接合。第一氨基酸或核苷酸序列可以与第二氨基酸或核苷酸序列直接接合或并置,或者可替代地,插入序列可以将第一序列共价接合至第二序列。术语“连接”不仅意指第一氨基酸序列与第二氨基酸序列在C末端或N末端融合,还包括将完整的第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或分别地,第一氨基酸序列)中的任两个氨基酸之间。在一个实施例中,第一氨基酸序列可通过肽键或接头连接至第二氨基酸序列。第一核苷酸序列可通过磷酸二酯键或接头连接至第二核苷酸序列。接头可为肽或多肽(对于多肽链)或者核苷酸或核苷酸链(对于核苷酸链)或者任何化学部分(对于多肽和多核苷酸链二者)。术语“连接”还通过连字符(-)来指示。

如本文所用的止血意指停止或减慢出血(bleeding)或出血症(hemorrhage);或者停止或减慢血液流经血管或身体部分。

如本文所用的止血病症意指遗传上的遗传性或获得性病症,特征在于由于形成纤维蛋白凝块的能力受损或无能,倾向于自发地或由于创伤而出血。此类病症的例子包括血友病。三种主要形式是血友病A(因子VIII缺乏)、血友病B(因子IX缺乏或“克雷司马斯病”)和血友病C(因子XI缺乏,轻度出血倾向)。其他止血病症包括例如血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、GPIb缺陷或缺乏的巨血小板综合征。vWF受体GPIb可能缺陷并导致缺少初级凝块形成(初级止血)和增加的出血倾向、以及Glanzman和Naegeli的血小板无力症(Glanzmann血小板无力症)。在肝功能衰竭(急性和慢性形式)中,肝脏的凝结因子产生不足;这可能增加出血风险。

可以预防性地使用本公开文本的分离的核酸分子、分离的多肽或包含分离核酸分子的载体。如本文所用,术语“预防性治疗”是指在出血发作之前施用分子。在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的多核苷酸、多肽或载体可以作为预防药在手术之前或之后施用。本公开文本的多核苷酸、多肽或载体可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除、牙科手术或干细胞移植。

本公开文本的分离的核酸分子、分离的多肽或载体也用于按需治疗。术语“按需治疗”是指响应出血发作的症状或者在可能引起出血的活动之前施用分离的核酸分子、分离的多肽或载体。在一个方面中,可以在出血开始时(如在损伤后)或在预期要出血时(如在手术前),将按需治疗施用于受试者。在另一个方面中,可以在增加出血风险的活动(如接触运动)之前施用按需治疗。

如本文所用,术语“急性出血”是指不论潜在原因的出血发作。例如,受试者可能患有创伤、尿毒症、遗传性出血病症(例如,因子VII缺乏)、血小板病症或由于产生针对凝血因子的抗体而产生的抗性。

如本文所用的治疗(treat)、治疗(treatment)、治疗(treating)是指例如疾病或病症的严重程度的降低;病程持续时间的减少;与疾病或病症相关的一种或多种症状的改善;向患有疾病或病症的受试者提供有益作用,但不一定治愈疾病或病症;或者预防与疾病或病症相关的一种或多种症状。在一个实施例中,术语“治疗(treating)”或“治疗(treatment)”意指在受试者体内通过施用本公开文本的分离的核酸分子、分离的多肽或载体维持例如FVIII谷水平为至少约1 IU/dL、2 IU/dL、3 IU/dL、4 IU/dL、5 IU/dL、6 IU/dL、7 IU/dL、8 IU/dL、9 IU/dL、10 IU/dL、11 IU/dL、12 IU/dL、13 IU/dL、14 IU/dL、15 IU/dL、16 IU/dL、17 IU/dL、18 IU/dL、19 IU/dL、20 IU/dL、25 IU/dL、30 IU/dL、35 IU/dL、40IU/dL、45 IU/dL、50 IU/dL、55 IU/dL、60 IU/dL、65 IU/dL、70 IU/dL、75 IU/dL、80 IU/dL、85 IU/dL、90 IU/dL、95 IU/dL、100 IU/dL、105 IU/dL、110 IU/dL、115 IU/dL、120 IU/dL、125 IU/dL、130 IU/dL、135 IU/dL、140 IU/dL、145 IU/dL或150 IU/dL。在另一个实施例中,治疗(treating)或治疗(treatment)意指维持FVIII谷水平为约1-约150IU/dL、约1-约125 IU/dL、约1-约100IU/dL、约1-约90 IU/dL、约1-约85 IU/dL、约1-约80 IU/dL、约1-约75 IU/dL、约1-约70 IU/dL、约1-约65 IU/dL、约1-约60 IU/dL、约1-约55 IU/dL、约1-约50 IU/dL、约1-约45 IU/dL、约1-约40 IU/dL、约1-约35 IU/dL、约1-约30 IU/dL、约1-约25IU/dL、约25-约125 IU/dL、约50-约100 IU/dL、约50-约75 IU/dL、约75-约100 IU/dL、约1-约20 IU/dL、约2-约20 IU/dL、约3-约20 IU/dL、约4-约20 IU/dL、约5-约20 IU/dL、约6-约20 IU/dL、约7-约20 IU/dL、约8-约20 IU/dL、约9-约20 IU/dL或约10-约20 IU/dL。疾病或病症的治疗(treatment)或治疗(treating)还可以包括维持受试者体内的FVIII活性为以下水平:与非血友病受试者体内的FVIII活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%相当。治疗所需的最低谷水平可通过一种或多种已知方法来量测,并且可针对每个个人加以调节(增加或减小)。

如本文所用,“施用”意指通过医药上可接受的途径将本公开文本的医药上可接受的核酸分子、从所述核酸分子表达的多肽或包含所述核酸分子的载体施用于受试者。施用途径可为静脉内的,例如静脉内注射和静脉内输注。其他施用途径包括例如皮下、肌内、口服、经鼻和经肺施用。核酸分子、多肽和载体可作为包含至少一种赋形剂的药物组合物的一部分来施用。

如本文所用的术语“医药上可接受的”是指分子实体和组合物在施用于人时在生理上可耐受并且通常不会产生毒性或过敏反应或类似的不良反应(如胃部不适、头晕等)。任选地,如本文所用,术语“医药上可接受的”意指由联邦政府或州政府的管理机构批准或者在美国药典或其他公认药典中列示用于动物,更特别是用于人。

如本文所用,词组“有需要的受试者”包括将受益于本公开文本的核酸分子、多肽或载体的施用于例如以改良止血的受试者(如哺乳动物受试者)。在一个实施例中,受试者包括但不限于患有血友病的个体。在另一个实施例中,受试者包括但不限于已经产生针对治疗性蛋白质(例如,凝血因子,例如FVIII)的抑制剂,并且因此需要绕路疗法的个体。受试者可以是成年人或未成年人(例如,小于12岁)。

如本文所用,术语“治疗性蛋白质”是指本领域已知可以施用于受试者的任何多肽。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、抗体、其功能片段或其组合。如本文所用,术语“凝血因子”是指天然存在的或重组产生的分子或其类似物,其预防受试者的出血发作或缩短出血发作的持续时间。换句话说,其意指具有促凝血活性(即,负责将纤维蛋白原转化为不溶性纤维蛋白的网状物,从而引起血液凝结或凝血)的分子。如本文所用的“凝血因子”包括激活的凝血因子、其酶原或可激活的凝血因子。“可激活的凝血因子”是呈无活性形式(例如,呈其酶原形式)的凝血因子,其能够被转化为活性形式。术语“凝血因子”包括但不限于因子I(FI)、因子II(FII)、因子V(FV)、FVII、FVIII、FIX、因子X(FX)、因子XI(FXI)、因子XII(FXII)、因子XIII(FXIII)、血管性血友病因子(VWF)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)、其酶原、其激活形式或其任何组合。

如本文所用的凝血活性意指参与生化反应级联的能力,所述级联以形成纤维蛋白凝块告终和/或降低出血症或出血发作的严重程度、持续时间或频率。

如本文所用,“生长因子”包括本领域已知的包括细胞因子和激素在内的任何生长因子。在一些实施例中,生长因子选自肾上腺髓质素(AM)、血管生成素(Ang)、自分泌运动因子、骨形态发生蛋白(BMP)(例如,BMP2、BMP4、BMP5、BMP7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)、粒细胞巨噬细胞集落刺激因子(GM-CSF))、表皮生长因子(EGF)、肝配蛋白(例如,肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2、肝配蛋白B3)、促红细胞生成素(EPO)、成纤维细胞生长因子(FGF)(例如,FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22、FGF23)、胎牛促体素(FBS)、GDNF家族成员(例如,神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白、阿特敏蛋白)、生长分化因子-9(GDF9)、肝细胞生长因子(HGF)、肝细胞瘤衍生的生长因子(HDGF)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(IGF-1)或IGF-2、白介素(IL)(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7)、角质形成细胞生长因子(KGF)、迁移刺激因子(MSF)、巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))、肌生成抑制蛋白(GDF-8)、神经调节蛋白(例如,神经调节蛋白1(NRG1)、NRG2、NRG3、NRG4)、神经营养蛋白(例如,脑衍生的神经营养因子(BDNF)、神经生长因子(NGF)、神经营养蛋白-3(NT-3)、NT-4、胎盘生长因子(PGF)、血小板衍生的生长因子(PDGF)、肾胺酶(RNLS)、T细胞生长因子(TCGF)、血小板生成素(TPO)、转化生长因子(例如,转化生长因子α(TGF-α)、TGF-β、肿瘤坏死因子-α(TNF-α)和血管内皮生长因子(VEGF)。

在一些实施例中,治疗性蛋白质由选自以下的基因编码:X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合。

如本文所用,术语“异源的”或“外源的”是指此类分子通常在给定背景下(例如,在细胞中或在多肽中)未发现。例如,可以将外源或异源分子引入细胞中并且仅在例如通过转染或其他形式的遗传工程化操纵细胞之后存在,或者异源氨基酸序列可以存在于其天然不存在的蛋白质中。

如本文所用,术语“异源核苷酸序列”是指不与给定多核苷酸序列一起天然存在的核苷酸序列。在一个实施例中,异源核苷酸序列编码能够延长治疗性蛋白质(例如,凝血因子,例如FVIII)的半衰期的多肽。在另一个实施例中,异源核苷酸序列编码增加治疗性蛋白质(例如,凝血因子,例如FVIII)的流体力学半径的多肽。在其他实施例中,异源核苷酸序列编码改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能(例如,促凝血活性)的多肽。在一些实施例中,治疗性蛋白质通过接头与异源核苷酸序列编码的多肽连接或相连。异源核苷酸序列编码的多肽部分的非限制性例子尤其包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的PAS多肽、HAP序列、转铁蛋白或其片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、白蛋白结合小分子、XTEN序列、FcRn结合部分(例如,完整Fc区或其结合至FcRn的部分)、单链Fc区(ScFc区,例如如US 2008/0260738、WO 2008/012543或WO 2008/1439545中所述)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的两种类型氨基酸的6-40个氨基酸的肽和短多肽(具有从小于50%至大于50%变化的二级结构程度)、或其两个或更多个组合。在一些实施例中,异源核苷酸序列编码的多肽连接至非多肽部分。非多肽部分的非限制性例子包括聚乙二醇(PEG)、白蛋白结合小分子、聚唾液酸、羟乙基淀粉(HES)、其衍生物或其任何组合。

如本文所用,术语“Fc区”定义为多肽中对应于天然Ig的Fc区的部分,即如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的Fc结构域。

在一个实施例中,“Fc区”是指单条Ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的C末端。因此,完整Fc结构域至少包含铰链结构域、CH2结构域和CH3结构域。

根据Ig同种型,Ig恒定区的Fc区可以包括CH2、CH3和CH4结构域以及铰链区。包含Ig的Fc区的嵌合蛋白赋予嵌合蛋白若干种所需特性,包括增加的稳定性、增加的血清半衰期(参见Capon等,1989,Nature 337:525)以及与Fc受体(如新生Fc受体(FcRn))的结合(美国专利号6,086,875、6,485,726、6,030,613;WO 03/077834;US2003-0235536A1),将上述文献通过引用以其整体并入本文。

“参考核苷酸序列”在本文中用作与本公开文本的核苷酸序列的比较时,是与本公开文本的核苷酸序列基本上相同的多核苷酸序列,但是所述参考序列未经优化。例如,由SEQ ID NO:1的密码子优化的BDD FVIII和在其3'端连接至SEQ ID NO:1的编码单链Fc区的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由SEQ ID NO:16的初始(或“亲代”)BDD FVIII和在其3'端连接至SEQ ID NO:16的编码单链Fc区的相同异源核苷酸序列组成的核酸分子。

如本文所用,关于核苷酸序列的术语“优化”是指编码多肽的多核苷酸序列,其中所述多核苷酸序列已经突变以增强所述多核苷酸序列的特性。在一些实施例中,进行优化以增加转录水平、增加翻译水平、增加稳态mRNA水平、增加或减少调控蛋白(如通用转录因子)的结合、增加或减少剪接或增加多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行以使其优化的变化的例子包括密码子优化、G/C含量优化、去除重复序列、去除富含AT的组件、去除隐蔽剪接位点、去除阻遏转录或翻译的顺式作用组件、添加或去除多聚T或多聚A序列、在转录起始位点周围添加增强转录的序列(如Kozak共有序列)、去除可以形成茎环结构的序列、去除去稳定序列及其两个或更多个组合。

II.核酸分子

本公开文本涉及编码靶序列的质粒样无衣壳的核酸分子,其中靶序列编码治疗性蛋白质或可以调节靶蛋白(例如,miRNA)的表达的基因。衣壳是病毒的蛋白质外壳,包封病毒的遗传物质。已知衣壳通过保护病毒基因组、将基因组递送至宿主和与宿主相互作用来辅助病毒粒子的功能。然而,尤其在用于基因疗法中时,病毒衣壳可以是限制载体的包装能力和/或诱导免疫应答方面的因素。

AAV载体已经作为一种更常见类型的基因疗法载体出现。然而,衣壳的存在限制了AAV载体在基因疗法中的效用。具体地,衣壳自身可能将载体中包括的转基因的大小限制到低至小于4.5kb。即使在添加调控组件之前,可用于基因疗法中的多种治疗性蛋白质也可以轻易超过这个大小。

此外,构成衣壳的蛋白质可能起到受试者的免疫系统可靶向的抗原的作用。AAV在一般群体中非常常见,大多数人在其一生中已经暴露于AAV。因此,大多数潜在的基因疗法接受者可能已经产生过针对AAV的免疫应答,并且因此更有可能排斥所述疗法。

本公开文本的某些方面旨在克服AAV载体的这些缺陷。具体地,本公开文本的某些方面涉及核酸分子,其包含第一ITR、第二ITR和基因盒(例如,编码治疗性蛋白质和/或miRNA)。在一些实施例中,第一ITR和第二ITR侧接于包含异源多核苷酸序列的基因盒。在一些实施例中,核酸分子不包含编码衣壳蛋白、复制蛋白和/或组装蛋白的基因。在一些实施例中,基因盒编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含凝血因子。在一些实施例中,基因盒编码miRNA。在某些实施例中,基因盒定位于第一ITR与第二ITR之间。在一些实施例中,核酸分子还包含一个或多个非编码区。在某些实施例中,所述一个或多个非编码区包含启动子序列、内含子、转录后调控元件、3'UTR多聚(A)序列或其任何组合。

在一个实施例中,基因盒是单链核酸。在另一个实施例中,基因盒是双链核酸。

在一个实施例中,核酸分子包含:

(a)作为细小病毒科的非AAV家族成员的ITR(例如,B19或GPV ITR)的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;

(g)作为细小病毒科的非AAV家族成员的ITR(例如,B19或GPV ITR)的第二ITR。

在一个实施例中,核酸分子包含:

(a)作为细小病毒科的非AAV家族成员的ITR的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码miRNA的核苷酸,其中所述miRNA下调选自以下的靶基因的表达:SOD1、HTT、RHO及其任何组合;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;

(g)作为细小病毒科的非AAV家族成员的ITR的第二ITR。

在一个实施例中,核酸分子包含:

(a)作为细小病毒科的非AAV家族成员的ITR的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合的核苷酸;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;

(g)作为细小病毒科的非AAV家族成员的ITR的第二ITR。

在一个实施例中,核酸分子包含:

(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII的核苷酸;其中所述核苷酸与选自SEQ ID NO:1-14或SEQ ID NO:71的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性,其中所述核苷酸编码的FVIII保留FVIII活性;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和

(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。

在一个实施例中,核酸分子包含:

(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码miRNA的核苷酸,其中所述miRNA下调靶基因的表达,所述靶基因是例如SOD1、HTT、RHO及其任何组合;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和

(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。

在一个实施例中,核酸分子包含:

(a)作为AAV(例如,AAV血清型2基因组)的ITR的第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码X连锁肌营养不良蛋白、MTM1(肌微管素)、酪氨酸羟化酶、AADC、环水解酶、SMN1、FXN(线粒体型共济失调蛋白)、GUCY2D、RS1、CFH、HTRA、ARMS、CFB/CC2、CNGA/CNGB、Prf65、ARSA、PSAP、IDUA(MPS I)、IDS(MPS II)、PAH、GAA(酸性α-葡糖苷酶)或其任何组合的核苷酸;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和

(g)作为AAV(例如,AAV血清型2基因组)的ITR的第二ITR。

在另一个实施例中,核酸分子包含:

(a)第一ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和

(g)第二ITR,

其中第一ITR或第二ITR中的一个是细小病毒科的非AAV家族成员的ITR,并且另一个ITR是AAV(例如,AAV血清型2基因组)的ITR。

在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:111中所述的AAV2 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:124中所述的AAV2 3’ITR序列的3’ITR。

在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:111中所述的AAV2 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:193中所述的AAV2 3’ITR序列的3’ITR。

在另一个实施例中,核酸分子包含:

(a)第一ITR;

(b)组织特异性启动子序列,TTP激活子;

(c)内含子,例如合成内含子;

(d)编码miRNA或治疗性蛋白质(例如,凝血因子)的核苷酸;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和

(g)第二ITR,

其中第一ITR是合成ITR,第二ITR是合成ITR,或者第一ITR和第二ITR二者都是合成ITR。

在另一个实施例中,核酸分子包含:

(a)第一B19 ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二B19 ITR。

在另一个实施例中,核酸分子包含:

(a)第一GPV ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二GPV ITR。

在另一个实施例中,核酸分子包含:

(a)第一B19 ITR;

(b)泛在启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二B19 ITR。

在另一个实施例中,核酸分子包含:

(a)第一GPV ITR;

(b)泛在启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二GPV ITR。

在另一个实施例中,核酸分子包含:

(a)第一B19 ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二B19 ITR。

在另一个实施例中,核酸分子包含:

(a)第一GPV ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)第二GPV ITR。

在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:180中所述的B19d135 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:181中所述的B19d135 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:183中所述的GPVd162 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:184中所述的GPVd162 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:185中所述的全长B19 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:186中所述的全长B19 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:187中所述的全长GPV 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如TTP启动子;

(c)内含子,例如合成内含子;

(d)编码FVIII(例如,FVIIIco6XTEN)的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:188中所述的全长GPV 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:180中所述的B19d135 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码PAH的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:181中所述的B19d135 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:183中所述的GPVd162 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码PAH的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:184中所述的GPVd162 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:185中所述的全长B19 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码PAH的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:186中所述的全长B19 3’ITR序列的3’ITR。在另一个实施例中,核酸分子包含:

(a)带有SEQ ID NO:187中所述的全长GPV 5’ITR序列的5’ITR;

(b)组织特异性启动子序列,例如CAG启动子;

(c)内含子,例如合成内含子;

(d)编码PAH的异源多核苷酸序列;

(e)转录后调控元件,例如WPRE;

(f)3'UTR多聚(A)尾序列,例如bGHpA;和/或

(g)带有SEQ ID NO:188中所述的全长GPV 3’ITR序列的3’ITR。

A.反向末端重复

本公开文本的某些方面涉及核酸分子,其包含第一ITR(例如,5'ITR)和第二ITR(例如,3'ITR)。通常,ITR参与细小病毒(例如,AAV)从原核质粒进行DNA复制和拯救或切除(Samulski等,1983,1987;Senapathy等,1984;Gottlieb和Muzyczka,1988)。另外,ITR似乎是AAV原病毒整合和将AAV DNA包装至病毒粒子中所需的最小序列(McLaughlin等,1988;Samulski等,1989)。这些组件是细小病毒基因组的有效操纵必需的。假设,对于ITR功能必不可少的最小限定组件是Rep结合位点(例如,RBS;对于AAV2,GCGCGCTCGCTCGCTC(SEQ IDNO:104))和末端解链位点(例如,TRS;对于AAV2,AGTTGG(SEQ ID NO:105))加上允许发夹形成的可变回文序列。回文核苷酸区域通常作为DNA复制的起点以及作为病毒的包装信号以顺式一起作用。ITR中的互补序列在DNA复制期间折叠成发夹结构。在一些实施例中,ITR折叠成发夹T形结构。在其他实施例中,ITR折叠成非T形发夹结构,例如折叠成U形发夹结构。数据表明,AAV ITR的T形发夹结构可以抑制由ITR侧接的转基因的表达。参见例如,Zhou等,Scientific Reports7:5432(2017年7月14日)。通过利用不形成T形发夹结构的ITR,可以避免这种形式的抑制。因此,在某些方面中,与包含形成T形发夹的AAV ITR的多核苷酸相比,包含非AAV ITR的多核苷酸具有改良的转基因表达。

在一些实施例中,ITR包含天然存在的ITR,例如,ITR包含细小病毒ITR的全部或一部分。在一些实施例中,ITR包含合成序列。在一个实施例中,第一ITR或第二ITR包含合成序列。在另一个实施例中,第一ITR和第二ITR各自包含合成序列。在一些实施例中,第一ITR或第二ITR包含天然存在的序列。在另一个实施例中,第一ITR和第二ITR各自包含天然存在的序列。

在一些实施例中,ITR包含天然存在的ITR的一部分(例如,截短的ITR)或由所述部分组成。在一些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中ITR保留天然存在的ITR的功能特性。在某些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸;其中ITR保留天然存在的ITR的功能特性。在某些实施例中,ITR包含天然存在的ITR的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸;其中ITR保留天然存在的ITR的功能特性。

在一些实施例中,ITR包含天然存在的ITR的一部分或由所述部分组成,其中所述片段包含天然存在的ITR的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%;其中所述片段保留天然存在的ITR的功能特性。

在某些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在其他实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少90%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少80%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少70%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少60%的序列同一性;其中ITR保留天然存在的ITR的功能特性。在一些实施例中,ITR包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的ITR的同源部分具有至少50%的序列同一性;其中ITR保留天然存在的ITR的功能特性。

在一些实施例中,ITR包含来自AAV基因组的ITR。在一些实施例中,ITR是选自以下的AAV基因组的ITR:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11及其任何组合。在一个特定实施例中,ITR是AAV2基因组的ITR。在另一个实施例中,ITR是经遗传工程化以在其5′和3′端包括衍生自一个或多个AAV基因组的ITR的合成序列。

在一些实施例中,ITR并非衍生自AAV基因组。在一些实施例中,ITR是非AAV的ITR。在一些实施例中,ITR是来自选自但不限于以下的病毒科细小病毒科的非AAV基因组的ITR:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在某些实施例中,ITR衍生自红病毒属细小病毒B19(人病毒)。在另一个实施例中,ITR衍生自番鸭细小病毒(MDPV)株。在某些实施例中,MDPV株被减弱,例如MDPV株FZ91-30。在其他实施例中,MDPV株是病原性的,例如MDPV株YY。在一些实施例中,ITR衍生自猪细小病毒,例如猪细小病毒U44978。在一些实施例中,ITR衍生自小鼠微小病毒,例如小鼠微小病毒U34256。在一些实施例中,ITR衍生自犬细小病毒,例如犬细小病毒M19296。在一些实施例中,ITR衍生自水貂肠炎病毒,例如水貂肠炎病毒D00765。在一些实施例中,ITR衍生自依赖细小病毒(Dependoparvovirus)。在一个实施例中,依赖细小病毒是依赖病毒属鹅细小病毒(GPV)株。在一个具体实施例中,GPV株被减弱,例如GPV株82-0321V。在另一个具体实施例中,GPV株是病原性的,例如GPV株B。

核酸分子的第一ITR和第二ITR可以衍生自相同基因组(例如,衍生自相同病毒的基因组),或衍生自不同基因组(例如,衍生自两种或更多种不同病毒基因组的基因组)。在某些实施例中,第一ITR和第二ITR衍生自相同的AAV基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个ITR是相同的,并且特别地可以是AAV2 ITR。在其他实施例中,第一ITR衍生自AAV基因组并且第二ITR并非衍生自AAV基因组(例如,非AAV基因组)。在其他实施例中,第一ITR并非衍生自AAV基因组(例如,非AAV基因组)并且第二ITR衍生自AAV基因组。在仍其他实施例中,第一ITR和第二ITR二者都并非衍生自AAV基因组(例如,非AAV基因组)。在一个特定实施例中,第一ITR和第二ITR是相同的。

在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第一ITR和第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一ITR和第二ITR衍生自相同的基因组。在其他实施例中,第一ITR和第二ITR衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一ITR和第二ITR衍生自不同的基因组。

在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自红病毒属细小病毒B19(人病毒)。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自红病毒属细小病毒B19(人病毒)。

在某些实施例中,第一ITR和/或第二ITR包含衍生自B19的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的B19 ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:167、168、169、170和171的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:167中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:168中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:169中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:170中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:171中所述的核苷酸序列或由所述核苷酸序列组成。

表1.样品细小病毒ITR序列。

在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:167组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:168中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:168组成。在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,保留衍生出它的B19ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ IDNO:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在某些实施例中,第一ITR和/或第二ITR包含衍生自B19的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第二ITR是第一ITR的反向互补物。在一些实施例中,第一ITR是第二ITR的反向互补物。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的B19 ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:180中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:180组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:181中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:181组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:185中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:185组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:186中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:186组成。

在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:180、181、185和186的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ IDNO:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:181中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:186中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:185中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自GPV。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自GPV。

在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:172组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:173中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:173组成。在某些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自SEQID NO:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:172、173、174、175和176的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:172中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ IDNO:173中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:174中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:175中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:176中所述的核苷酸序列或由所述核苷酸序列组成。

在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在某些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQ ID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含核苷酸序列,其中所述核苷酸序列包含SEQ ID NO:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与SEQID NO:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在某些实施例中,第一ITR和/或第二ITR包含衍生自GPV的ITR的全部或一部分,或由所述ITR的全部或一部分组成。在一些实施例中,第二ITR是第一ITR的反向互补物。在一些实施例中,第一ITR是第二ITR的反向互补物。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的GPV ITR的功能特性。在一些实施例中,第一ITR和/或第二ITR包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自SEQ ID NO:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。

在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:183中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:183组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:184中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:184组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:187中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:187组成。在某些实施例中,第一ITR和/或第二ITR包含与SEQ ID NO:188中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一ITR和/或第二ITR由SEQ ID NO:188组成。

在一些实施例中,第一ITR和/或第二ITR包含选自SEQ ID NO:183、184、187和188的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ IDNO:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:184中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR包含SEQ ID NO:188中所述的核苷酸序列或由所述核苷酸序列组成,并且第二ITR包含SEQ ID NO:187中所述的核苷酸序列或由所述核苷酸序列组成。

在某些实施例中,第一ITR或第二ITR中的一个包含衍生自AAV2的ITR的全部或一部分或由所述ITR的全部或一部分组成。在一些实施例中,第一ITR或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR保留衍生出它的AAV2 ITR的功能特性。在一些实施例中,第一ITR或第二ITR包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一ITR和/或第二ITR能够形成发夹结构。在某些实施例中,发夹结构不包含T形发夹。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:177或178中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:177中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一ITR和/或第二ITR包含SEQ ID NO:178中所述的核苷酸序列或由所述核苷酸序列组成。

在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自番鸭细小病毒(MDPV)株。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自番鸭细小病毒(MDPV)株。在某些实施例中,MDPV株被减弱,例如MDPV株FZ91-30。在其他实施例中,MDPV株是病原性的,例如MDPV株YY。

在一些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自依赖细小病毒。在一些实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自依赖细小病毒。在其他实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自依赖病毒属鹅细小病毒(GPV)株。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自依赖病毒属GPV株。在某些实施例中,GPV株被减弱,例如GPV株82-0321V。在其他实施例中,GPV株是病原性的,例如GPV株B。

在某些实施例中,第一ITR衍生自AAV基因组,并且第二ITR衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株U44978;小鼠微小病毒,例如小鼠微小病毒株U34256;犬细小病毒,例如犬细小病毒株M19296;水貂肠炎病毒,例如水貂肠炎病毒株D00765;及其任何组合。在其他实施例中,第二ITR衍生自AAV基因组,并且第一ITR衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株U44978;小鼠微小病毒,例如小鼠微小病毒株U34256;犬细小病毒,例如犬细小病毒株M19296;水貂肠炎病毒,例如水貂肠炎病毒株D00765;及其任何组合。

在另一个特定实施例中,ITR是经遗传工程化以在其5′和3′端包括并非衍生自AAV基因组的ITR的合成序列。在另一个特定实施例中,ITR是经遗传工程化以在其5′和3′端包括衍生自一个或多个非AAV基因组的ITR的合成序列。存在于本发明的核酸分子中的这两个ITR可为相同或不同的非AAV基因组。具体地,ITR可衍生自相同的非AAV基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个ITR是相同的,并且特别地可为AAV2 ITR。

在一些实施例中,ITR序列包含一个或多个回文序列。本文所公开的ITR的回文序列包括但不限于天然回文序列(即,在自然界中发现的序列)、合成序列(即,未在自然界中发现的序列)(如伪回文序列)及其组合或经修饰形式。“伪回文序列”是包括不完美的回文序列在内的回文DNA序列,其与形成二级结构的天然AAV或非AAV回文序列中的序列共享小于80%(包括小于70%、60%、50%、40%、30%、20%、10%或5%或无)核酸序列同一性。天然回文序列可以从本文所公开的任何基因组获得或衍生。合成回文序列可以基于本文所公开的任何基因组。

回文序列可以是连续或中断的。在一些实施例中,回文序列是中断的,其中回文序列包含第二序列的插入。在一些实施例中,第二序列包含启动子、增强子、整合酶的整合位点(例如,Cre或Flp重组酶的位点)、基因产物的开放阅读框或其组合。

在一些实施例中,ITR形成发夹环结构。在一个实施例中,第一ITR形成发夹结构。在另一个实施例中,第二ITR形成发夹结构。仍然在另一个实施例中,第一ITR和第二ITR二者都形成发夹结构。在一些实施例中,第一ITR和/或第二ITR不形成T形发夹结构。在某些实施例中,第一ITR和/或第二ITR形成非T形发夹结构。在一些实施例中,非T形发夹结构包含U形发夹结构。

在一些实施例中,本文所述的核酸分子中的ITR可以是转录激活的ITR。转录激活的ITR可以包含已经通过包括至少一个转录活性元件而被转录激活的野生型ITR的全部或一部分。多种类型的转录活性元件适用于这个背景。在一些实施例中,转录活性元件是组成型转录活性元件。组成型转录活性元件提供持续水平的基因转录,并且在需要持续表达转基因时是较佳的。在其他实施例中,转录活性元件是诱导型转录活性元件。诱导型转录活性元件通常在诱导物(或诱导条件)不存在下展现低活性,并且在诱导物存在下(或切换至诱导条件)上调。当仅在某些时间或在某些位置需要表达时或当需要使用诱导剂逐步增加表达水平时,诱导型转录活性元件可能是较佳的。转录活性元件也可以具有组织特异性;也就是说,其仅在某些组织或细胞类型中展现活性。

能以多种方式将转录活性元件并入ITR中。在一些实施例中,将转录活性元件并入ITR的任何部分的5′或ITR的任何部分的3′。在其他实施例中,转录激活的ITR的转录活性元件位于两个ITR序列之间。如果转录活性元件包含两个或更多个必须被间隔开的组件,则那些组件可与ITR的部分交替。在一些实施例中,ITR的发夹结构缺失并用转录组件的反向重复来替代。这后一种排列将产生仿真结构中的缺失部分的发夹。多个串联转录活性元件也可存在于转录激活的ITR中,并且这些组件可以相邻或间隔开。另外,可将蛋白质结合位点(例如,Rep结合位点)引入转录激活的ITR的转录活性元件中。转录活性元件可包含使得能够通过RNA聚合酶受控转录DNA以形成RNA的任何序列,并且可包含例如如下文所定义的转录活性元件。

转录激活的ITR向具有相对受限的核苷酸序列长度的核酸分子提供转录激活和ITR功能二者,这有效地使可以携带并从核酸分子表达的转基因的长度最大化。将转录活性元件并入ITR中能以多种方式来完成。对ITR序列和转录活性元件的序列需求的比较可以提供对编码ITR内的组件的方式的了解。例如,可以通过在复制转录活性元件的功能组件的ITR序列中引入特定变化将转录活性添加至ITR。业内存在多种技术可有效添加、缺失和/或改变特定位点的具体核苷酸序列(参见例如,Deng和Nickoloff(1992)Anal.Biochem.200:81-88)。产生转录激活的ITR的另一方式涉及在ITR中的所需位置引入限制位点。另外,可以使用本领域已知的方法将多个转录激活元件并入转录激活的ITR中。

通过说明,可以通过包括一个或多个如以下等转录活性元件来产生转录激活的ITR:TATA盒、GC盒、CCAAT盒、Sp1位点、Inr区、CRE(cAMP调控组件)位点、ATF-1/CRE位点、APBβ盒、APBα盒、CArG盒、CCAC盒或如本领域已知参与转录的任何其他组件。

本公开文本的多个方面提供了克隆本文所述的核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入适宜细菌宿主菌株中。如本领域已知,核酸的复杂二级结构(例如,长回文区)可能不稳定并且难以在细菌宿主菌株中克隆。例如,本公开文本的包含第一ITR和第二ITR(例如,非AAV细小病毒ITR,例如B19或GPV ITR)的核酸分子可能难以使用常规方法来克隆。长DNA回文序列抑制DNA复制并且在大肠杆菌(E.coli)、芽孢杆菌属(Bacillus)、链球菌属(Steptococcus)、链霉菌属(Streptomyces)、酿酒酵母(S.cerevisiae)、小鼠和人的基因组中不稳定。这些效应是由于通过链内碱基配对形成发夹或十字形结构所致。在大肠杆菌中,在SbcC或SbcD突变体中可以显著克服对DNA复制的抑制。SbcD是核酸酶亚基,并且SbcC是SbcCD复合物的ATP酶亚基。大肠杆菌SbcCD复合物是负责防止长回文序列复制的外切核酸酶复合物。SbcCD复合物是具有ATP依赖性双链DNA外切核酸酶活性和ATP非依赖性单链DNA内切核酸酶活性的核复合物。SbcCD可以识别DNA回文序列并通过攻击所产生的发夹结构来瓦解复制叉。

在某些实施例中,适宜细菌宿主菌株不能拆分十字形DNA结构。在某些实施例中,适宜细菌宿主菌株包含SbcCD复合物中的破坏。在一些实施例中,SbcCD复合物中的破坏包含SbcC基因和/或SbcD基因中的基因破坏。在某些实施例中,SbcCD复合物中的破坏包含SbcC基因中的基因破坏。包含SbcC基因中的基因破坏的各种细菌宿主菌株是本领域已知的。例如但不限于,细菌宿主菌株PMC103包含基因型sbcC、recD、mcrA、ΔmcrBCF;细菌宿主菌株PMC107包含基因型recBC、recJ、sbcBC、mcrA、ΔmcrBCF;并且细菌宿主菌株SURE包含基因型recB、recJ、sbcC、mcrA、ΔmcrBCF、umuC、uvrC。因此,在一些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株PMC103、PMC107或SURE中。在某些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株PMC103中。

适宜载体是本领域已知的并且描述于本文中的其他地方。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是低拷贝载体。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是pBR322。

因此,本公开文本提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含SbcCD复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(ITR)和第二ITR,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

B.治疗性蛋白质

本公开文本的某些方面涉及包含第一ITR、第二ITR和编码靶序列的基因盒的核酸分子,其中靶序列编码治疗性蛋白质。在一些实施例中,基因盒编码一种治疗性蛋白质。在一些实施例中,基因盒编码多于一种治疗性蛋白质。在一些实施例中,基因盒编码相同治疗性蛋白质的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在一些实施例中,基因盒编码两种或更多种不同的治疗性蛋白质。

本公开文本的某些实施例涉及包含第一ITR、第二ITR和编码治疗性蛋白质的基因盒的核酸分子,其中治疗性蛋白质包含凝血因子。在一些实施例中,凝血因子选自FI、FII、FIII、FIV、FV、FVI、FVII、FVIII、FIX、FX、FXI、FXII、FXIII、VWF、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶III、肝素辅因子II、蛋白质C、蛋白质S、蛋白质Z、蛋白质Z相关蛋白酶抑制剂(ZPI)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tPA)、尿激酶、纤溶酶原激活物抑制剂-1(PAI-1)、纤溶酶原激活物抑制剂-2(PAI2)、其任何酶原、其任何活性形式及其任何组合。在一个实施例中,凝血因子包含FVIII或其变异体或片段。在另一个实施例中,凝血因子包含FIX或其变异体或片段。在另一个实施例中,凝血因子包含FVII或其变异体或片段。在另一个实施例中,凝血因子包含VWF或其变异体或片段。

1.凝血因子

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VIII多肽。除非另外指定,否则如本文所用的“因子VIII”在整个本申请中缩写为“FVIII”,意指具有其在凝结中的正常作用的功能性FVIII多肽。因此,术语FVIII包括功能性变异体多肽。“FVIII蛋白”可与FVIII多肽(或蛋白质)或FVIII互换使用。FVIII功能的例子包括但不限于激活凝结的能力、作为因子IX的辅因子作用的能力或在Ca

a.FVIII和编码FVIII蛋白的多核苷酸序列

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VIII多肽。除非另外指定,否则如本文所用的“因子VIII”在整个本申请中缩写为“FVIII”,意指具有其在凝结中的正常作用的功能性FVIII多肽。因此,术语FVIII包括功能性变异体多肽。“FVIII蛋白”可与FVIII多肽(或蛋白质)或FVIII互换使用。FVIII功能的例子包括但不限于激活凝结的能力、作为因子IX的辅因子作用的能力或在Ca

本文所用的嵌合蛋白中的FVIII部分具有FVIII活性。FVIII活性可以通过业内任何已知方法来量测。多种测试可用于评估凝结系统的功能:激活部分促凝血酶原激酶时间(aPTT)测试、生色测定、ROTEM测定、凝血酶原时间(PT)测试(也用于确定INR)、纤维蛋白原测试(通常通过克劳斯法进行)、血小板计数、血小板功能测试(通常通过PFA-100进行)、TCT、出血时间、混合测试(如果将患者的血浆与正常血浆混合,是否矫正异常)、凝结因子测定、抗磷脂抗体、D-二聚体、遗传测试(例如,因子V Leiden、凝血酶原突变G20210A)、稀释鲁塞尔蝰蛇毒时间(dRVVT)、杂项血小板功能测试、凝血弹性描记法(TEG或Sonoclot)、凝血弹性量测法(

aPTT测试是量测“固有”(也称为接触激活路径)和常见凝结路径二者的功效的表达指示物。这个测试一般用于量测市售重组凝血因子(例如,FVIII)的凝血活性。其与量测外在路径的凝血酶原时间(PT)结合使用。

ROTEM分析提供关于止血的整体动力学的信息:凝血时间、凝块形成、凝块稳定性和溶解。凝血弹性量测法中的不同参数依赖于血浆凝结系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的许多因素。这个分析可以提供次级止血的全面见解。

生色测定机制是基于血液凝结级联的原理,其中在激活的因子IX、磷脂和钙离子存在下,激活的FVIII加速因子X转化为因子Xa。因子Xa活性是通过水解对因子Xa具有特异性的对硝基苯胺(pNA)底物来评估。在405nM下量测的对硝基苯胺的初始释放速率与因子Xa活性成正比,并且因此与样品中的FVIII活性成正比。

生色测定得到了国际血栓形成与止血学会(ISTH)的科学标准化委员会(SSC)的FVIII和因子IX小组委员会的推荐。从1994以来,生色测定也已经是欧洲药典中用于指定FVIII浓缩物效力的参考方法。因此,在一个实施例中,包含FVIII的嵌合多肽具有与包含成熟FVIII或BDD FVIII的嵌合多肽(例如,

在另一个实施例中,本公开文本的包含FVIII的嵌合蛋白的因子Xa产生速率与包含成熟FVIII或BDD FVIII的嵌合蛋白(例如,

为了将因子X激活为因子Xa,激活的因子IX(因子IXa)在Ca

另外,FVIII结合至血管性血友病因子,同时在循环中无活性。FVIII在不结合至VWF时快速降解,并且通过凝血酶的作用从VWF释放。在一些实施例中,包含FVIII的嵌合多肽以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,

可在钙和磷脂存在下通过激活的蛋白质C使FVIII失活。激活的蛋白质C在A1结构域中的精氨酸336之后切割FVIII重链,从而破坏因子X底物相互作用位点,并在A2结构域中的精氨酸562之后切割,从而增强A2结构域的解离并且破坏与因子IXa的相互作用位点。这种切割还对切A2结构域(43kDa)并产生A2-N(18kDa)和A2-C(25kDa)结构域。因此,激活的蛋白质C可催化重链中的多个切割位点。在一个实施例中,通过激活的蛋白质C以与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,

在其他实施例中,包含FVIII的嵌合蛋白具有与包含成熟FVIII序列或BDD FVIII的嵌合多肽(例如,

如本文所用的FVIII的“B结构域”与本领域已知的B结构域相同,所述B结构域是通过成熟人FVIII的内部氨基酸序列同一性和凝血酶的蛋白质水解切割位点(例如,残基Ser741-Arg1648)来定义。其他人FVIII结构域是相对于成熟人FVIII,通过以下氨基酸残基来定义:成熟FVIII的A1,残基Ala1-Arg372;A2,残基Ser373-Arg740;A3,残基Ser1690-Ile2032;C1,残基Arg2033-Asn2172;C2,残基Ser2173-Tyr2332。除非另外指示,否则在不提及任何SEQ ID编号的情况下,本文中使用的序列残基编号对应于不含信号肽序列(19个氨基酸)的FVIII序列。A3-C1-C2序列(也称为FVIII重链)包括残基Ser1690-Tyr2332。其余序列(残基Glu1649-Arg1689)通常被称为FVIII轻链激活肽。猪、小鼠和犬FVIII的所有结构域(包括B结构域)的边界的位置也是本领域已知的。在一个实施例中,FVIII的B结构域缺失(“B结构域缺失的FVIII”或“BDD FVIII”)。BDD FVIII的例子是

“B结构域缺失的FVIII”可以具有以下文献中披露的完全或部分缺失:美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563以及国际公开号WO 2015106052 A1(PCT/US2015/010738)。在一些实施例中,用于本公开文本的方法中的B结构域缺失的FVIII序列包含美国专利号6,316,226(也在US 6,346,513中)的第4栏第4行至第5栏第28行和实例1-5中披露的缺失中的任何一个。在另一个实施例中,B结构域缺失的因子VIII是S743/Q1638 B结构域缺失的因子VIII(SQ BDD FVIII)(例如,具有氨基酸744至氨基酸1637的缺失的因子VIII,例如具有成熟FVIII的氨基酸1-743和氨基酸1638-2332的因子VIII)。在一些实施例中,用于本公开文本的方法中的B结构域缺失的FVIII具有美国专利号5,789,203(还有US 6,060,447、US 5,595,886和US 6,228,620)的第2栏第26-51行和实例5-8中披露的缺失。在一些实施例中,B结构域缺失的因子VIII具有以下文献中所述的缺失:美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4栏第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利号6,458,563的第4栏第25-53行。在一些实施例中,B结构域缺失的FVIII具有大部分B结构域的缺失,但是仍含有将初级翻译产物在体内蛋白质水解加工为两条多肽链所必需的B结构域的胺基末端序列,如WO 91/09122中所披露。在一些实施例中,B结构域缺失的FVIII构建为具有氨基酸747-1638的缺失,即实际上完全缺失B结构域。Hoeben R.C.等J.Biol.Chem.265(13):7318-7323(1990)。B结构域缺失的因子VIII还可以含有FVIII的氨基酸771–1666或氨基酸868-1562的缺失。Meulien P.等Protein Eng.2(4):301-6(1988)。作为本发明的一部分的其他B结构域缺失包括:氨基酸982至1562或760至1639(Toole等,Proc.Natl.Acad.Sci.U.S.A.(1986)83,5939-5942)、797至1562(Eaton,等Biochemistry(1986)25:8343-8347)、741至1646(KaufmaN(PCT公开申请号WO 87/04187))、747-1560(Sarver等,DNA(1987)6:553-564)、741至1648(Pasek(PCT申请号88/00831))或者816至1598或741至1648(Lagner(Behring Inst.Mitt.(1988)第82期:16-25、EP 295597))的缺失。在一个特定实施例中,B结构域缺失的FVIII包含成熟FVIII的氨基酸残基746至1648的缺失。在另一个实施例中,B结构域缺失的FVIII包含成熟FVIII的氨基酸残基745至1648的缺失。在一些实施例中,BDD FVIII包含含有对应于成熟全长FVIII的氨基酸765至1652中的缺失的单链FVIII(也称为rVIII-SingleChain和

在其他实施例中,BDD FVIII包括含有B结构域的如下片段的FVIII多肽,所述片段保留一个或多个N连接糖基化位点,例如对应于全长FVIII序列的氨基酸序列的残基757、784、828、900、963或任选地943。B结构域片段的例子包括B结构域的226个氨基酸或163个氨基酸,如Miao,H.Z.等,Blood 103(a):3412-3419(2004);Kasuda,A等,J.Thromb.Haemost.6:1352-1359(2008)和Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)中所披露(即,保留B结构域的前226个氨基酸或163个氨基酸)。在仍其他实施例中,BDD FVIII还包含在残基309处的点突变(从Phe至Ser)以改良BDD FVIII蛋白的表达。参见Miao,H.Z.等,Blood 103(a):3412-3419(2004)。在仍其他实施例中,BDD FVIII包括含有B结构域的一部分,但是不含一个或多个弗林蛋白酶切割位点(例如,Arg1313和Arg 1648)的FVIII多肽。参见Pipe,S.W.等,J.Thromb.Haemost.9:2235-2242(2011)。在一些实施例中,BDD FVIII包含含有对应于成熟全长FVIII的氨基酸765至1652中的缺失的单链FVIII(也称为rVIII-SingleChain和

已知众多种功能FVIII变异体,如上文和下文所讨论。另外,已经在血友病患者体内鉴定出FVIII中的数百种非功能性突变,并且已经确定,这些突变对FVIII功能的影响更多归因于其在FVIII的三维结构内的位置而不是取代的性质(Cutler等,Hum.Mutat.19:274-8(2002)),将所述文献通过引用以其整体并入本文。另外,来自人和其他物种的FVIII之间的比较已经鉴定出可能为功能所需的保守残基(Cameron等,Thromb.Haemost.79:317-22(1998);US 6,251,632),将所述文献通过引用以其整体并入本文。

在一些实施例中,FVIII多肽包含其FVIII变异体或片段,其中其FVIII变异体或片段具有FVIII活性。在一些实施例中,基因盒编码全长FVIII多肽。在其他实施例中,基因盒编码B结构域缺失的(BDD)FVIII多肽,其中缺失FVIII的B结构域的全部或一部分。在一个特定实施例中,基因盒编码包含与SEQ ID NO:106、107、109、110、111或112具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽。在一些实施例中,基因盒编码具有SEQ ID NO:17的氨基酸序列的多肽或其片段。在一些实施例中,基因盒编码具有SEQ ID NO:106的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与SEQ ID NO:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒编码具有SEQ ID NO:109的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与SEQ ID NO:16具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。

在一些实施例中,本公开文本的基因盒编码包含信号肽的FVIII多肽或其片段。在其他实施例中,基因盒编码缺少信号肽的FVIII多肽。在一些实施例中,信号肽包含SEQ IDNO:17的氨基酸1-19。

在一些实施例中,基因盒包含编码FVIII多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含国际申请号PCT/US2017/015879中披露的核苷酸序列,将所述申请通过引用以其整体并入本文。在一些实施例中,基因盒包含编码FVIII多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含与选自SEQ IDNO:1-14的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:71具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与SEQ ID NO:19具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。

i.编码FVIII多肽的密码子优化的核苷酸序列

在一些实施例中,本公开文本的核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中第一ITR和第二ITR衍生自AAV基因组,并且其中基因盒包含编码FVIII多肽的密码子优化的核苷酸序列。在一些实施例中,密码子优化的核苷酸序列编码全长FVIII多肽。在其他实施例中,密码子优化的核苷酸序列编码B结构域缺失的(BDD)FVIII多肽,其中缺失FVIII的B结构域的全部或一部分。在一个特定实施例中,密码子优化的核苷酸序列编码包含与SEQ ID NO:17具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽或其片段。在一个实施例中,密码子优化的核苷酸序列编码具有SEQ ID NO:17的氨基酸序列的多肽或其片段。

在一些实施例中,密码子优化的核苷酸序列编码包含信号肽的FVIII多肽或其片段。在其他实施例中,密码子优化的序列编码缺少信号肽的FVIII多肽。在一些实施例中,信号肽包含SEQ ID NO:17的氨基酸1-19。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791或(ii)SEQ ID NO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个特定实施例中,第一核酸序列与SEQ ID NO:3的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在另一个实施例中,第一核酸序列与SEQ ID NO:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第一核苷酸序列包含SEQ ID NO:3的核苷酸58-1791或SEQ ID NO:4的核苷酸58-1791。

在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸1-1791或(ii)SEQ ID NO:4的核苷酸1-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第一核苷酸序列包含SEQ ID NO:3的核苷酸1-1791或SEQ ID NO:4的核苷酸1-1791。在另一个实施例中,第二核苷酸序列与SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含SEQ IDNO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374。在仍另一个实施例中,第二核苷酸序列与SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374)具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含SEQ ID NO:3的核苷酸1792-2277和2320-4374或SEQ ID NO:4的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1792-4374或SEQ ID NO:4的核苷酸1792-4374)。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374或(ii)SEQ ID NO:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在某些实施例中,第二核酸序列与SEQ ID NO:5的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与SEQ ID NO:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含SEQ IDNO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。

在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)或(ii)SEQ IDNO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQID NO:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在某些实施例中,第二核酸序列与SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含SEQ ID NO:5的核苷酸1792-2277和2320-4374或SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374或SEQ ID NO:6的核苷酸1792-4374)。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸58-1791或SEQ ID NO:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与SEQ ID NO:5的核苷酸1-1791或SEQ ID NO:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:1的核苷酸58-1791、(ii)SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在其他实施例中,第一核苷酸序列包含SEQ ID NO:1的核苷酸58-1791、SEQ ID NO:2的核苷酸58-1791、(iii)SEQ ID NO:70的核苷酸58-1791或(iv)SEQ ID NO:71的核苷酸58-1791。

在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:1的核苷酸1-1791、(ii)SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第一核苷酸序列包含SEQID NO:1的核苷酸1-1791、SEQ ID NO:2的核苷酸1-1791、(iii)SEQ ID NO:70的核苷酸1-1791或(iv)SEQ ID NO:71的核苷酸1-1791。在另一个实施例中,与第一核苷酸序列连接的第二核苷酸序列与SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,与第一核苷酸序列连接的第二核苷酸序列包含(i)SEQID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在其他实施例中,与第一核苷酸序列连接的第二核苷酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个实施例中,第二核苷酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个特定实施例中,第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-4374、(ii)SEQ ID NO:2的核苷酸1792-4374、(iii)SEQ ID NO:70的核苷酸1792-4374或(iv)SEQ ID NO:71的核苷酸1792-4374。在一些实施例中,编码FVIII多肽的密码子优化的序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQID NO:71的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374)具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中N末端部分和C末端部分一起具有FVIII多肽活性。在一个实施例中,第二核酸序列包含(i)SEQ ID NO:1的核苷酸1792-2277和2320-4374、(ii)SEQ ID NO:2的核苷酸1792-2277和2320-4374、(iii)SEQ ID NO:70的核苷酸1792-2277和2320-4374或(iv)SEQ ID NO:71的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1792-4374、SEQ ID NO:2的核苷酸1792-4374、SEQ ID NO:70的核苷酸1792-4374或SEQ ID NO:71的核苷酸1792-4374)。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:1的核苷酸58至4374具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ IDNO:1的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQID NO:1的核苷酸58-4374)具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:1具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:1的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸58-4374)或SEQ ID NO:1的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:1的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1的核苷酸1-4374)或SEQ ID NO:1的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:2的核苷酸58至4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:2的核苷酸58-2277和2320-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:2具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:2的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:2的核苷酸58-4374)或SEQ ID NO:2的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ IDNO:2的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ IDNO:2的核苷酸1-4374)或SEQ ID NO:2的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:70的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:70的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:70的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸58-4374)或SEQ ID NO:70的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:70的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:70的核苷酸1-4374)或SEQ ID NO:70的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:71的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:71具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸58-4374)或SEQ ID NO:71的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:71的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:71的核苷酸1-4374)或SEQ ID NO:71的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:3的核苷酸58至4374具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸58-4374)具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:3具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸58-4374)或SEQ ID NO:3的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:3的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:3的核苷酸1-4374)或SEQ IDNO:3的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:4的核苷酸58至4374具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:4的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸58-4374)具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与SEQ ID NO:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含SEQ ID NO:4的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸58-4374)或SEQ ID NO:4的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:4的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:4的核苷酸1-4374)或SEQ ID NO:4的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:5的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:5的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:5具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:5的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸58-4374)或SEQ ID NO:5的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:5的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1-4374)或SEQ ID NO:5的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与SEQ ID NO:6的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与SEQ ID NO:6的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与SEQ ID NO:6具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含SEQ ID NO:6的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸58-4374)或SEQ ID NO:6的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含SEQ ID NO:6的核苷酸1-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1-4374)或SEQ ID NO:6的核苷酸1至4374。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码信号肽的核酸序列。在某些实施例中,信号肽是FVIII信号肽。在一些实施例中,编码信号肽的核酸序列经密码子优化。在一个特定实施例中,编码信号肽的核酸序列与(i)SEQ ID NO:1的核苷酸1至57;(ii)SEQ ID NO:2的核苷酸1至57;(iii)SEQ ID NO:3的核苷酸1至57;(iv)SEQ IDNO:4的核苷酸1至57;(v)SEQ ID NO:5的核苷酸1至57;(vi)SEQ ID NO:6的核苷酸1至57;(vii)SEQ ID NO:70的核苷酸1至57;(viii)SEQ ID NO:71的核苷酸1至57;或(ix)SEQ IDNO:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。

SEQ ID NO:1-6、70和71是起始或“亲代”或“野生型”FVIII核苷酸序列SEQ ID NO:16的优化形式。SEQ ID NO:16编码B结构域缺失的人FVIII。虽然SEQ ID NO:1-6、70和71衍生自FVIII的特定B结构域缺失形式(SEQ ID NO:16),但是应理解,本公开文本还包括编码FVIII的其他形式的核酸的优化形式。例如,FVIII的其他形式可以包括全长FVIII、FVIII的其他B结构域缺失(本文所述)或保留FVIII活性的其他FVIII片段。

在一个实施例中,基因盒包含FVIII构建体,其包括如表2A-2F中所列示的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2A中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2B中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2C中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2D中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2E中所述的多核苷酸序列。在一个实施例中,基因盒包含FVIII构建体,其包括表2F中所述的多核苷酸序列。

在某些实施例中,分离的核酸分子包含与SEQ ID NO:179、182、189或194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:179的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:182的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:189的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性FVIII蛋白的能力。

表2A:示例性AAV-FVIII构建体(核苷酸1-6526;SEQ ID NO:110)

表2B:带有B19d135 ITR的示例性B19-FVIII构建体(核苷酸1-6762;SEQ ID NO:179)

表2C:带有GPVd162 ITR的示例性GPV-FVIII构建体(核苷酸1-6830;SEQ ID NO:182)

表2D:带有全长B19 ITR的示例性B19-FVIII构建体(核苷酸1-7032;SEQ ID NO:189)

表2E:示例性AAV-FVIII构建体(核苷酸1-6824;SEQ ID NO:190)

表2F:带有全长GPV ITR的示例性GPV-FVIII构建体(核苷酸1-7154;SEQ ID NO:194)

在一个实施例中,基因盒包含苯丙氨酸羟化酶(PAH)构建体,其包括如表10A和10B中所列示的多核苷酸序列。在一个实施例中,基因盒包含PAH构建体,其包括表10A中所述的多核苷酸序列。在一个实施例中,基因盒包含PAH构建体,其包括表10B中所述的多核苷酸序列。

在某些实施例中,分离的核酸分子包含与SEQ ID NO:197或198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:197的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与SEQ ID NO:198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性苯丙氨酸羟化酶的能力。

A.密码子适应指数

在一个实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。例如,密码子优化的核苷酸序列可具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)或至少约0.99(99%)。在一些实施例中,密码子优化的核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(91%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(97%)的人密码子适应指数。

在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)或至少约.91(91%)。在一个特定实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.91(91%)的人密码子适应指数。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-2277和2320-4374或(ii)SEQ ID NO:6的核苷酸1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。

在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码具有FVIII活性的多肽的核苷酸序列,其中所述核苷酸序列包含与选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列的人密码子适应指数相对于SEQ ID NO:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约0.75(75%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.91(91%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.97(97%)的人密码子适应指数。

在一些实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16增加的最优密码子频率(FOP)。在某些实施例中,编码FVIII多肽的密码子优化的核苷酸序列的FOP是至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85或至少约90。

在其他实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16增加的同义密码子相对使用度(RCSU)。在一些实施例中,分离的核酸分子的RCSU大于1.5。在其他实施例中,分离的核酸分子的RCSU大于2.0。在某些实施例中,分离的核酸分子的RCSU是至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。

在仍其他实施例中,本公开文本的编码FVIII多肽的密码子优化的核苷酸序列具有相对于SEQ ID NO:16减少的密码子有效数。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下密码子有效数:小于约50、小于约45、小于约40、小于约35、小于约30或小于约25。在一个特定实施例中,分离的核酸分子具有以下密码子有效数:约40、约35、约30、约25或约20。

B.G/C含量优化

在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%或至少约60%。

在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高百分比的G/C核苷酸。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%或至少约58%。在一个特定实施例中,编码具有FVIII活性的多肽的核苷酸序列具有至少约58%的G/C含量。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374)或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有以下G/C含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%或至少约57%。在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约52%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约55%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约57%的G/C含量。

在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中与SEQ ID NO:16中的G/C核苷酸的百分比相比,所述核苷酸序列含有更高百分比的G/C核苷酸。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约45%的G/C含量。在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约52%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约55%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约57%的G/C含量。在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约58%的G/C含量。在仍另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列具有至少约60%的G/C含量。

“G/C含量”(或鸟嘌呤-胞嘧啶含量)或“G/C核苷酸的百分比”是指DNA分子中是鸟嘌呤或胞嘧啶的含氮碱基的百分比。G/C含量可使用下式计算:

人基因的G/C含量具有高异质性,其中一些基因的G/C含量低至20%,并且其他基因的G/C含量高至95%。通常,富含G/C的基因具有更高表达。事实上,已证实,增加基因的G/C含量可导致基因表达增加,这主要是由于转录增加和较高稳态mRNA水平所致。参见Kudla等,PLoS Biol.,4(6):e180(2006)。

C.基质附着区样序列

在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。

在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中所述核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。

在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374或(ii)SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个MARS/ARS序列。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多1个MARS/ARS序列。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含MARS/ARS序列。

已经鉴定出人FVIII核苷酸序列中富含AT的组件,其与酿酒酵母(Saccharomycescerevisiae)自主复制序列(ARS)和核基质附着区(MAR)共享序列相似性。(Fallux等,Mol.Cell.Biol.16:4264-4272(1996))。已经证实这些组件中的一种在体外结合核因子并阻遏氯霉素乙酰转移酶(CAT)报告基因的表达。同上。已经假设,这些序列可能有助于人FVIII基因的转录阻遏。因此,在一个实施例中,在本公开文本的编码FVIII多肽的密码子优化的核苷酸序列中消除所有MAR/ARS序列。在亲代FVIII序列(SEQ ID NO:16)中存在4个MAR/ARS ATATTT序列(SEQ ID NO:21)和3个MAR/ARS AAATAT序列(SEQ ID NO:22)。所有这些位点都发生突变以破坏优化的FVIII序列(SEQ ID NO:1-6)中的MAR/ARS序列。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于下表3中。

表3:阻遏组件的变化概述

D.去稳定序列

在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。

在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少去稳定元件。在其他实施例中,编码具有FVIII活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。

在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQID NO:16含有更少去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含去稳定元件。

在亲代FVIII序列(SEQ ID NO:16)中存在10个去稳定元件:6个ATTTA序列(SEQ IDNO:23)和4个TAAAT序列(SEQ ID NO:24)。在一个实施例中,这些位点的序列发生突变以破坏优化的FVIII SEQ ID NO:1-6、70和71中的去稳定元件。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于表3中。

E.潜在启动子结合位点

在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。

在一个特定实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。

在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于SEQ ID NO:16含有更少潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码FVIII多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。

TATA盒是通常在真核生物的启动子区中发现的调控序列。其用作通用转录因子TATA结合蛋白(TBP)的结合位点。TATA盒通常包含序列TATAA(SEQ ID NO:28)或相似变异体。然而,编码序列内的TATA盒可以抑制全长蛋白质的翻译。在野生型BDD FVIII序列(SEQID NO:16)中存在10个潜在启动子结合序列:5个TATAA序列(SEQ ID NO:28)和5个TTATA序列(SEQ ID NO:29)。在一些实施例中,在本公开文本的FVIII基因中消除至少1个、至少2个、至少3个或至少4个激活子结合位点。在一些实施例中,在本公开文本的FVIII基因中消除至少5个激活子结合位点。在其他实施例中,在本公开文本的FVIII基因中消除至少6个、至少7个或至少8个激活子结合位点。在一个实施例中,在本公开文本的FVIII基因中消除至少9个激活子结合位点。在一个特定实施例中,在本公开文本的FVIII基因中消除所有启动子结合位点。优化的序列中每个潜在启动子结合位点的位置以及相应核苷酸的序列显示于表3中。

F.其他顺式作用负调控组件

除了上述的MAR/ARS序列、去稳定元件和潜在启动子位点以外,在野生型BDDFVIII序列(SEQ ID NO:16)中还可以鉴定出若干个其他潜在抑制性序列。在未经优化的BDDFVIII序列中可以鉴定出两个富含AU的序列组件(ARE)(ATTTTATT(SEQ ID NO:30);和ATTTTTAA(SEQ ID NO:31))以及多聚A位点(AAAAAAA;SEQ ID NO:26)、多聚T位点(TTTTTT;SEQ ID NO:25)和剪接位点(GGTGAT;SEQ ID NO:27)。这些组件中的一个或多个可以从优化的FVIII序列去除。优化的序列中这些位点各自的位置以及相应核苷酸的序列显示于表3中。

在某些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。

在另一个实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第二核酸序列与(i)SEQ ID NO:5的核苷酸1792-4374;(ii)SEQ ID NO:6的核苷酸1792-4374;(iii)SEQ ID NO:5的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:5的核苷酸1792-4374);或(iv)SEQ ID NO:6的核苷酸1792-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。

在其他实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚T序列、多聚A序列、ARE序列或其任何组合。

在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含多聚T序列(SEQID NO:25)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ ID NO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含多聚A序列(SEQ ID NO:26)。在一些实施例中,编码FVIII多肽的密码子优化的核苷酸序列包含编码FVIII多肽的N末端部分的第一核酸序列和编码FVIII多肽的C末端部分的第二核酸序列;其中第一核酸序列与(i)SEQ ID NO:3的核苷酸58-1791;(ii)SEQ ID NO:3的核苷酸1-1791;(iii)SEQ ID NO:4的核苷酸58-1791;或(iv)SEQ IDNO:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中N末端部分和C末端部分一起具有FVIII多肽活性;并且其中密码子优化的核苷酸序列不含ARE组件(SEQ ID NO:30或SEQ ID NO:31)。

在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含剪接位点GGTGAT(SEQ ID NO:27)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ IDNO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚T序列(SEQ ID NO:25)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚A序列(SEQ ID NO:26)。在一些实施例中,基因盒包含编码FVIII多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自SEQID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自SEQ ID NO:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码B结构域或B结构域片段的核苷酸的SEQ ID NO:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含ARE组件(SEQ ID NO:30或SEQ ID NO:31)。

在其他实施例中,本公开文本的优化的FVIII序列不含抗病毒基序、茎环结构和重复序列中的一个或多个。

在仍其他实施例中,转录起始位点周围的核苷酸变为kozak共有序列(GCCGCCACCATGC(SEQ ID NO:32),其中加下划线的核苷酸是起始密码子)。在其他实施例中,可添加或去除限制位点以有助于克隆过程。

b.FIX和编码FIX蛋白的多核苷酸序列

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含FIX多肽。在一些实施例中,FIX多肽包含FIX或其变异体或片段,其中FIX或其变异体或片段具有FIX活性。

人FIX是丝氨酸蛋白酶,其是血液凝结级联的固有路径的重要组分。如本文所用的“因子IX”或“FIX”是指凝结因子蛋白和种类及其序列变异体,并且包括但不限于人FIX前体多肽(“prepro”)的461单链氨基酸序列、成熟人FIX(SEQ ID NO:125)的415单链氨基酸序列和R338L FIX(Padua)变异体(SEQ ID NO:126)。FIX包括具有血液凝结FIX的典型特征的任何形式的FIX分子。如本文所用,“因子IX”和“FIX”旨在涵盖包含以下的多肽:结构域GlA(含有γ-羧基谷氨酸残基的区域)、EGF1和EGF2(含有与人表皮生长因子同源的序列的区域)、激活肽(由成熟FIX的残基R136-R180形成的“AP”)和C末端蛋白酶结构域(“Pro”)或本领域已知的这些结构域的同义词,或者可为保留天然蛋白的生物学活性的至少一部分的截短片段或序列变异体。已经克隆出FIX或序列变异体,如美国专利号4,770,999和7,700,734中所述,并且编码人FIX的cDNA已经被分离,表征并克隆至表达载体中(参见例如,Choo等,Nature 299:178-180(1982);Fair等,Blood 64:194-204(1984);和Kurachi等,Proc.Natl.Acad.Sci.,U.S.A.79:6461-6464(1982))。由Simioni等在2009年表征的FIX的一种特定变异体R338L FIX(Padua)变异体(SEQ ID NO:2)包含获得功能突变,所述突变与Padua变异体活性相对于天然FIX的几乎8倍增加相关(表4)。FIX变异体还可包括具有一个或多个不影响FIX多肽的FIX活性的保守氨基酸取代的任何FIX多肽。在一些实施例中,FIX变异体包含通过可切割接头(例如,

表4:示例性FIX序列

*灰色阴影=信号肽;下划线=XTEN序列;粗体=Fc。

**美国专利号9,856,468的SEQ ID NO:67,所述专利通过引用以其整体并入本文。

FIX多肽为55kDa,合成为由三个区域构成的前原多肽链(SEQ ID NO:125):28个氨基酸的信号肽(SEQ ID NO:127的氨基酸1至28)、谷氨酸残基的γ-羧基化所需的18个氨基酸的前肽(氨基酸29至46)和415个氨基酸的成熟因子IX(SEQ ID NO:125或126)。前肽是γ-羧基谷氨酸结构域N末端的18个氨基酸残基的序列。前肽结合维生素K依赖性γ羧化酶,然后通过内源蛋白酶从FIX的前体多肽切割,所述内源蛋白酶最可能是PACE(成对碱性氨基酸切割酶),也称为弗林蛋白酶或PCSK3。在不进行γ羧基化的情况下,Gla结构域不能结合钙以采取将蛋白质锚定至带负电的磷脂表面所必需的正确构象,从而使因子IX无功能。即使将其羧基化,Gla结构域也依赖于前肽的切割以获得正常功能,因为保留的前肽干扰与钙和磷脂的最优结合所必需的Gla结构域的构象变化。在人体内,所得成熟因子IX由肝细胞作为无活性酶原分泌至血流中,所述酶原是415个氨基酸残基的单链蛋白,其含有以重量计大约17%的碳水化合物(Schmidt,A.E.等(2003)Trends Cardiovasc Med,13:39)。

成熟FIX由若干个结构域构成,所述结构域以N末端至C末端构型是:GLA结构域、EGF1结构域、EGF2结构域、激活肽(AP)结构域和蛋白酶(或催化)结构域。短接头连接EGF2结构域与AP结构域。FIX含有两种激活肽,分别由R145-A146和R180-V181形成。在激活后,单链FIX变为2链分子,其中两条链通过二硫键连接。凝血因子可以通过替代其激活肽来工程化,从而得到改变的激活特异性。在哺乳动物体内,成熟FIX必须由激活的因子XI激活以产生因子IXa。在将FIX激活为FIXa之后,蛋白酶结构域提供FIX的催化活性。激活的因子VIII(FVIIIa)是完全表达FIXa活性的特定辅因子。

在某些实施例中,FIX多肽包含血浆衍生的FIX的Thr148等位基因形式,并且具有与内源FIX类似的结构和功能特征。

许多功能性FIX变异体是本领域已知的。国际公开号WO 02/040544 A3在第4页第9-30行和第15页第6-31行披露了展现增加的对肝素抑制的抗性的突变体。国际公开号WO03/020764 A2在表2和表3(在第14-24页)和第12页第1-27行披露了具有降低的T细胞免疫原性的FIX突变体。国际公开号WO 2007/149406 A2在第4页第1行至第19页第11行披露了功能性突变体FIX分子,其展现增加的蛋白质稳定性、增加的体内和体外半衰期以及增加的蛋白酶抗性。WO 2007/149406 A2在第19页第12行至第20行第9行还披露了嵌合的和其他变异体FIX分子。国际公开号WO 08/118507 A2在第5页第14行至第6页第5行披露了展现增加的凝血活性的FIX突变体。国际公开号WO 09/051717 A2在第9页第11行至第20页第2行披露了FIX突变体,其具有增加的N连接和/或O连接糖基化位点数目,这导致增加的半衰期和/或回收率。国际公开号WO 09/137254 A2在第2页第[006]段至第5页第[011]段以及第16页第[044]段至第24页第[057]段还披露了具有增加的糖基化位点数目的因子IX突变体。国际公开号WO 09/130198 A2在第4页第26行至第12页第6行披露了功能性突变体FIX分子,其具有增加的糖基化位点数目,这导致增加的半衰期。国际公开号WO 09/140015 A2在第11页第[0043]段至第13页第[0053]段披露了功能性FIX突变体,其具有增加的可用于聚合物(例如,PEG)缀合的Cys残基数。2011年7月11日提交并且作为WO 2012/006624于2012年1月12日公开的国际申请号PCT/US2011/043569中所述的FIX多肽也通过引用以其整体并入本文。在一些实施例中,FIX多肽包含融合至白蛋白的FIX多肽(例如,FIX-白蛋白)。在某些实施例中,FIX多肽是

另外,已经在血友病受试者体内鉴定出FIX中的数百个非功能性突变,其中许多突变披露于国际公开号WO 09/137254 A2的第11-14页的表6中。此类非功能性突变不包括于本发明中,但提供了哪些突变更有可能或更不可能产生功能性FIX多肽的额外指导。

在一个实施例中,FIX多肽(或融合多肽的因子IX部分)包含与SEQ ID NO:1或2中所述的序列(SEQ ID NO:125或126的氨基酸1至415)或者可替代地与前肽序列或与前肽和信号序列(全长FIX)至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。在另一个实施例中,FIX多肽包含与SEQ ID NO:2中所述的序列至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。

FIX促凝剂活性表示为一个或多个国际单位(IU)。1 IU的FIX活性大致对应于1毫升正常人血浆中FIX的量。若干种测定可用于量测FIX活性,包括一步式凝血测定(激活部分促凝血酶原激酶时间;aPTT)、凝血酶产生时间(TGA)和旋转凝血弹性量测法

在某些实施例中,FIX序列经过密码子优化。密码子优化的FIX序列的例子包括但不限于国际公开号WO 2016/004113 A1的SEQ ID NO:1和54-58,将所述专利通过引用以其整体并入本文。

c.FVII和编码FVII蛋白的多核苷酸序列

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子VII多肽。在一些实施例中,FVII多肽包含FVII或其变异体或片段,其中其变异体或片段具有FVII活性。

“因子VII”(“FVII”或“F7”;也称为因子7、凝结因子VII、血清因子VII、血清凝血酶原转化加速因子、SPCA、前转化素(proconvertin)和依他凝血素α(eptacogα))是丝氨酸蛋白酶,其是凝结级联的一部分。在一个实施例中,本文所述的核酸中的凝血因子是FVII。重组激活的因子VII(“FVII”)已经广泛用于治疗大出血,如发生在患有以下疾病的患者中的大出血:血友病A或B、缺乏凝结因子XI、FVII、血小板功能缺陷、血小板减少症或血管性血友病。

重组激活的FVII(rFVIIa;

在一个实施例中,基因盒编码FVII的成熟形式或其变异体。FVII包括Gla结构域、两个EGF结构域(EGF-1和EGF-2)以及丝氨酸蛋白酶结构域(或肽酶S1结构域),所述丝氨酸蛋白酶结构域在丝氨酸蛋白酶的肽酶S1家族的所有成员之间高度保守,如例如糜蛋白酶的情况。FVII作为单链酶原(即,可激活的FVII)和完全激活的双链形式出现。

C.生长因子

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含生长因子。生长因子可以选自本领域已知的任何生长因子。在一些实施例中,生长因子是激素。在其他实施例中,生长因子是细胞因子。在一些实施例中,生长因子是趋化因子。

在一些实施例中,生长因子是肾上腺髓质素(AM)。在一些实施例中,生长因子是血管生成素(Ang)。在一些实施例中,生长因子是自分泌运动因子。在一些实施例中,生长因子是骨形态发生蛋白(BMP)。在一些实施例中,BMP选自BMP2、BMP4、BMP5和BMP7。在一些实施例中,生长因子是睫状神经营养因子家族成员。在一些实施例中,睫状神经营养因子家族成员选自睫状神经营养因子(CNTF)、白血病抑制因子(LIF)、白介素-6(IL-6)。在一些实施例中,生长因子是集落刺激因子。在一些实施例中,集落刺激因子选自巨噬细胞集落刺激因子(m-CSF)、粒细胞集落刺激因子(G-CSF)和粒细胞巨噬细胞集落刺激因子(GM-CSF)。在一些实施例中,生长因子是表皮生长因子(EGF)。在一些实施例中,生长因子是肝配蛋白。在一些实施例中,肝配蛋白选自肝配蛋白A1、肝配蛋白A2、肝配蛋白A3、肝配蛋白A4、肝配蛋白A5、肝配蛋白B1、肝配蛋白B2和肝配蛋白B3。在一些实施例中,生长因子是促红细胞生成素(EPO)。在一些实施例中,生长因子是成纤维细胞生长因子(FGF)。在一些实施例中,FGF选自FGF1、FGF2、FGF3、FGF4、FGF5、FGF6、FGF7、FGF8、FGF9、FGF10、FGF11、FGF12、FGF13、FGF14、FGF15、FGF16、FGF17、FGF18、FGF19、FGF20、FGF21、FGF22和FGF23。在一些实施例中,生长因子是胎牛促体素(FBS)。在一些实施例中,生长因子是GDNF家族成员。在一些实施例中,GDNF家族成员选自神经胶质细胞系衍生的神经营养因子(GDNF)、神经秩蛋白、普塞芬蛋白和阿特敏蛋白。在一些实施例中,生长因子是生长分化因子-9(GDF9)。在一些实施例中,生长因子是肝细胞生长因子(HGF)。在一些实施例中,生长因子是肝细胞瘤衍生的生长因子(HDGF)。在一些实施例中,生长因子是胰岛素。在一些实施例中,生长因子是胰岛素样生长因子。在一些实施例中,胰岛素样生长因子是胰岛素样生长因子-1(IGF-1)或IGF-2。在一些实施例中,生长因子是白介素(IL)。在一些实施例中,IL选自IL-1、IL-2、IL-3、IL-4、IL-5、IL-6和IL-7。在一些实施例中,生长因子是角质形成细胞生长因子(KGF)。在一些实施例中,生长因子是迁移刺激因子(MSF)。在一些实施例中,生长因子是巨噬细胞刺激蛋白(MSP或肝细胞生长因子样蛋白(HGFLP))。在一些实施例中,生长因子是肌生成抑制蛋白(GDF-8)。在一些实施例中,生长因子是神经调节蛋白。在一些实施例中,神经调节蛋白选自神经调节蛋白1(NRG1)、NRG2、NRG3和NRG4。在一些实施例中,生长因子是神经营养蛋白。在一些实施例中,生长因子是脑衍生的神经营养因子(BDNF)。在一些实施例中,生长因子是神经生长因子(NGF)。在一些实施例中,NGF是神经营养蛋白-3(NT-3)或NT-4。在一些实施例中,生长因子是胎盘生长因子(PGF)。在一些实施例中,生长因子是血小板衍生的生长因子(PDGF)。在一些实施例中,生长因子是肾胺酶(RNLS)。在一些实施例中,生长因子是T细胞生长因子(TCGF)。在一些实施例中,生长因子是血小板生成素(TPO)。在一些实施例中,生长因子是转化生长因子。在一些实施例中,转化生长因子是转化生长因子α(TGF-α)或TGF-β。在一些实施例中,生长因子是肿瘤坏死因子-α(TNF-α)。在一些实施例中,生长因子是血管内皮生长因子(VEGF)。

D.微小RNA(miRNA)

微小RNA(miRNA)是通过抑制翻译或诱导信使RNA(mRNA)降解来负调控基因表达的小非编码RNA分子(约18-22个核苷酸)。从其发现以来,miRNA已经参与多种细胞过程,包括细胞凋亡、分化和细胞增生,并且其已显示在致癌中具有关键作用。miRNA调控基因表达的能力使得体内miRNA表达成为基因疗法中有价值的工具。

本公开文本的某些方面涉及质粒样核酸分子,其包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码miRNA,并且其中第一ITR和/或第二ITR是非腺相关病毒的ITR(例如,第一ITR和/或第二ITR来自非AAV)。miRNA可以是本领域已知的任何miRNA。在一些实施例中,miRNA下调靶基因的表达。在某些实施例中,靶基因选自SOD1、HTT、RHO或其任何组合。

在一些实施例中,基因盒编码一种miRNA。在一些实施例中,基因盒编码多于一种miRNA。在一些实施例中,基因盒编码两种或更多种不同的miRNA。在一些实施例中,基因盒编码相同miRNA的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在某些实施例中,基因盒编码一种或多种miRNA以及一种或多种治疗性蛋白质。

在一些实施例中,miRNA是天然存在的miRNA。在一些实施例中,miRNA是工程化miRNA。在一些实施例中,miRNA是人工miRNA。在某些实施例中,miRNA包含Evers等,Molecular Therapy 26(9):1-15(印刷版之前的电子版,2018年6月)披露的miHTT工程化的miRNA。在某些实施例中,miRNA包含Dirren等,Annals of Clinical and TranslationalNeurology 2(2):167-84(2015年2月)披露的miR SOD1人工miRNA。在某些实施例中,miRNA包含miR-708,其靶向RHO(参见Behrman等,JCB 192(6):919-27(2011))。

在一些实施例中,miRNA通过下调基因抑制剂的表达来上调所述基因的表达。在一些实施例中,抑制剂是天然(例如,野生型)抑制剂。在一些实施例中,抑制剂得自突变的、异源性和/或错误表达的基因。

E.异源部分

在一些实施例中,核酸分子包含第一ITR、第二ITR和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含至少一个异源部分。在一些实施例中,异源部分融合至治疗性蛋白质的N末端或C末端。在其他实施例中,异源部分插入治疗性蛋白质内的两个氨基酸之间。

在一些实施例中,治疗性蛋白质包含FVIII多肽和异源部分,所述异源部分插入FVIII多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入FVIII多肽内。在一些实施例中,异源氨基酸序列可以在以下文献中披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内:国际公开号WO 2013/123457 A1、WO2015/106052 A1或美国公开号2015/0158929 A1,将上述文献通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含FVIII和异源部分,其中所述异源部分紧邻相对于成熟FVIII的氨基酸745下游插入FVIII内。在一个特定实施例中,治疗性蛋白质包含FVIII和XTEN,其中所述XTEN紧邻相对于成熟FVIII的氨基酸745下游插入FVIII内。在一个特定实施例中,FVIII包含对应于成熟人FVIII(SEQ ID NO:15)的氨基酸746-1646的缺失,并且异源部分紧邻对应于成熟人FVIII(SEQ ID NO:15)的氨基酸745下游插入。

表5:FVIII异源部分插入位点

在一些实施例中,治疗性蛋白质包含FIX多肽和异源部分,所述异源部分插入FIX多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入FIX多肽内。在一些实施例中,异源氨基酸序列可以在国际申请号PCT/US2017/015879中所披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内,将所述申请通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含FIX多肽和异源部分,其中所述异源部分紧邻相对于成熟FIX的氨基酸166下游插入FIX多肽内。在一个特定实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中所述XTEN紧邻相对于成熟FVIII的氨基酸166下游插入FIX内。

表6:FIX异源部分插入位点

在其他实施例中,本公开文本的治疗性蛋白质还包含2个、3个、4个、5个、6个、7个或8个异源核苷酸序列。在一些实施例中,所有异源部分是相同的。在一些实施例中,至少一个异源部分与其他异源部分不同。在一些实施例中,本公开文本可包含2个、3个、4个、5个、6个或多于7个串联的异源部分。

在一些实施例中,异源部分增加治疗性蛋白质的半衰期(是“半衰期延长剂”)。

在一些实施例中,异源部分是具有非结构化或结构化特征的肽或多肽,所述特征与并入本公开文本的蛋白质中时体内半衰期的延长相关。非限制性例子包括白蛋白、白蛋白片段、免疫球蛋白的Fc片段、人绒毛膜促性腺激素的β亚基的C末端肽(CTP)、HAP序列、XTEN序列、转铁蛋白或其片段、PAS多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分或者这些多肽的任何片段、衍生物、变异体或组合。在一个特定实施例中,异源氨基酸序列是免疫球蛋白恒定区或其部分、转铁蛋白、白蛋白或PAS序列。在一些方面中,异源部分包括血管性血友病因子或其片段。在其他相关方面中,异源部分可以包括非多肽部分的附着位点(例如,半胱氨酸氨基酸),所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。在一些方面中,异源部分包含半胱氨酸氨基酸,其用作非多肽部分的附着位点,所述非多肽部分是例如聚乙二醇(PEG)、羟乙基淀粉(HES)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。

在一个具体实施例中,第一异源部分是本领域已知的半衰期延长分子,并且第二异源部分是本领域已知的半衰期延长分子。在某些实施例中,第一异源部分(例如,第一Fc部分)和第二异源部分(例如,第二Fc部分)彼此缔合形成二聚体。在一个实施例中,第二异源部分是第二Fc部分,其中第二Fc部分与第一异源部分(例如,第一Fc部分)连接或缔合。例如,第二异源部分(例如,第二Fc部分)可以通过接头连接至第一异源部分(例如,第一Fc部分),或者通过共价或非共价键与第一异源部分缔合。

在一些实施例中,异源部分是如下多肽,其包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个或至少约4000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。在其他实施例中,异源部分是如下多肽,其包含约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。

在某些实施例中,异源部分改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能。

在某些实施例中,异源部分增加本公开文本的治疗性蛋白质的体内和/或体外半衰期。在其他实施例中,异源部分有助于本公开文本的治疗性蛋白质或其片段(例如,在FVIII蛋白的蛋白质水解切割后包含异源部分的片段)的可视化或定位。本公开文本的治疗性蛋白质或其片段的可视化和/或定位可以是体内的、体外的、离体的或其组合。

在其他实施例中,异源部分增加本公开文本的治疗性蛋白质或其片段(例如,在治疗性蛋白质(例如,凝血因子)的蛋白质水解切割后包含异源部分的片段)的稳定性。如本文所用,术语“稳定性”是指本领域公认的响应环境条件(例如,升高或降低的温度)维持治疗性蛋白质的一种或多种物理特性的量度。在某些方面中,物理特性可以是维持治疗性蛋白质的共价结构(例如,不存在蛋白质水解切割、不期望的氧化或脱酰胺作用)。在其他方面中,物理特性还可以是处于正确折叠状态的治疗性蛋白质的存在(例如,不存在可溶性或不溶性聚集体或沈淀物)。在一个方面中,治疗性蛋白质的稳定性是通过测定治疗性蛋白质的生物物理特性来量测,所述生物物理特性是例如热稳定性、pH解折叠谱、糖基化的稳定去除、溶解度、生化功能(例如,结合至蛋白质、受体或配位体的能力)等和/或其组合。在另一个方面中,生化功能是通过相互作用的结合亲和性来证实。在一个方面中,蛋白质稳定性的量度是热稳定性,即对热激发的抗性。稳定性可以使用本领域已知的方法来量测,如HPLC(高效液相色谱)、SEC(尺寸排阻色谱)、DLS(动态光散射)等。量测热稳定性的方法包括但不限于差式扫描量热法(DSC)、差式扫描荧光测定法(DSF)、圆二色性(CD)和热激发测定。

在某些方面中,由本公开文本的核酸分子编码的治疗性蛋白质包含至少一种半衰期延长剂,即相对于缺少这种异源部分的相应治疗性蛋白质的体内半衰期增加治疗性蛋白质的体内半衰期的异源部分。治疗性蛋白质的体内半衰期可以通过本领域的技术人员已知的任何方法来确定,例如活性测定(例如,生色测定或一步式凝血aPTT测定,其中治疗性蛋白质包含FVIII多肽)、ELISA、

在一些实施例中,一种或多种半衰期延长剂的存在导致治疗性蛋白质的半衰期与缺少这一种或多种半衰期延长剂的相应蛋白质的半衰期相比有所增加。包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应治疗性蛋白质的体内半衰期的至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍长。

在一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应蛋白质的体内半衰期的约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍长。在另一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期与缺少这种半衰期延长剂的相应蛋白质的体内半衰期相比延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。

在其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。

在仍其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是约15小时至约2周、约16小时至约1周、约17小时至约1周、约18小时至约1周、约19小时至约1周、约20小时至约1周、约21小时至约1周、约22小时至约1周、约23小时至约1周、约24小时至约1周、约36小时至约1周、约48小时至约1周、约60小时至约1周、约24小时至约6天、约24小时至约5天、约24小时至约4天、约24小时至约3天或约24小时至约2天。

在一些实施例中,包含半衰期延长剂的治疗性蛋白质的每名受试者的平均半衰期是约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约6天、约7天(1周)、约8天、约9天、约10天、约11天、约12天、约13天或约14天。

一种或多种半衰期延长剂可融合至治疗性蛋白质的C末端或N末端或插入治疗性蛋白质内。

1.免疫球蛋白恒定区或其部分

在另一个方面中,异源部分包含一个或多个免疫球蛋白恒定区或其部分(例如,Fc区)。在一个实施例中,本公开文本的分离的核酸分子还包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施例中,免疫球蛋白恒定区或其部分是Fc区。

免疫球蛋白恒定区包括表示为CH(恒定重)结构域(CH1、CH2等)的结构域。根据同种型(即IgG、IgM、IgA、IgD或IgE),恒定区可以包括3个或4个CH结构域。一些同种型(例如IgG)恒定区还含有铰链区。参见Janeway等2001,Immunobiology,Garland Publishing,N.Y.,N.Y。

本公开文本的免疫球蛋白恒定区或其部分可以从多种不同来源获得。在一个实施例中,免疫球蛋白恒定区或其部分衍生自人免疫球蛋白。然而,应理解,免疫球蛋白恒定区或其部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可以衍生自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在一个实施例中,使用人同种型IgG1。

多个免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)能以可公开获得的存放物的形式获得。可选择具有特定效应子功能(或缺少特定效应子功能)或具有特定修饰的恒定区结构域序列以降低免疫原性。已经公开了许多抗体和抗体编码基因的序列并且适宜的Ig恒定区序列(例如,铰链、CH2和/或CH3序列或其部分)可使用本领域公认的技术衍生自这些序列。然后可改变或合成使用任何前述方法获得的遗传物质以获得本公开文本的多肽。应进一步了解,本公开文本的范围涵盖恒定区DNA序列的等位基因、变异体和突变。

免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链式反应和所选用于扩增所关注结构域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞分离mRNA,逆转录成DNA,并通过PCR扩增抗体基因。PCR扩增方法详细描述于以下文献中:美国专利号4,683,195;4,683,202;4,800,159;4,965,188;以及例如,“PCR Protocols:A Guide to Methods and Applications”Innis等编,Academic Press,San Diego,CA(1990);Ho等1989.Gene 77:51;Horton等1993.Methods Enzymol.217:270。PCR可以基于所公开的重链和轻链DNA和氨基酸序列由共有恒定区引物或由更具特异性的引物来起始。PCR还可用于分离编码抗体轻链和重链的DNA克隆。在这种情况下,可通过共有引物或较大同源探针(如小鼠恒定区探针)筛选文库。适于扩增抗体基因的多个引物组是本领域已知的(例如,基于经纯化抗体的N末端序列的5’引物(Benhar和Pastan.1994.ProteinEngineering 7:1509);cDNA末端的快速扩增(Ruberti,F.等1994.J.Immunol.Methods173:33);抗体前导序列(Larrick等1989Biochem.Biophys.Res.Commun.160:1250))。抗体序列的克隆还描述于Newman等于1995年1月25日提交的美国专利号5,658,570中,将所述专利通过引用并入本文。

本文所用的免疫球蛋白恒定区可以包括所有结构域和铰链区或其部分。在一个实施例中,免疫球蛋白恒定区或其部分包含CH2结构域、CH3结构域和铰链区,即Fc区或FcRn结合配偶体。

如本文所用,术语“Fc区”定义为多肽中对应于天然Ig的Fc区的部分,即如通过其两条重链的相应Fc结构域的二聚缔合所形成。天然Fc区与另一Fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的Fc区”或“单链Fc区”(scFc区)是指合成二聚Fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的Fc结构域。参见国际公开号WO 2012/006635,通过引用以其整体并入本文。

在一个实施例中,“Fc区”是指单条Ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,IgG中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的C末端。因此,完整Fc区至少包含铰链结构域、CH2结构域和CH3结构域。

免疫球蛋白恒定区或其部分可为FcRn结合配偶体。FcRn在成人上皮组织中有活性并在肠腔、肺气道、鼻表面、阴道表面、结肠和直肠表面中表达(美国专利号6,485,726)。FcRn结合配偶体是免疫球蛋白的结合至FcRn的一部分。

已经从包括人类在内的若干哺乳动物物种分离出FcRn受体。人FcRn、猴FcRn、大鼠FcRn和小鼠FcRn的序列是已知的(Story等1994,J.Exp.Med.180:2377)。FcRn受体在相对低pH下结合IgG(但不结合其他免疫球蛋白类别,如IgA、IgM、IgD和IgE),以内腔至浆膜方向跨细胞主动转运IgG,然后在间质液中发现的相对高pH下释放IgG。其在成人上皮组织中表达(美国专利号6,485,726、6,030,613、6,086,875;WO 03/077834;US2003-0235536A1),包括肺和肠上皮(Israel等1997,Immunology 92:69)、肾近端小管上皮(Kobayashi等2002,Am.J.Physiol.Renal Physiol.282:F358)以及鼻上皮、阴道表面和胆道系统表面。

可用于本公开文本中的FcRn结合配偶体涵盖可由FcRn受体特异性结合的分子,包括完整IgG、IgG的Fc片段和包括FcRn受体的完整结合区的其他片段。已经基于X射线晶体学描述了IgG的Fc部分中结合至FcRn受体的区域(Burmeister等1994,Nature 372:379)。Fc与FcRn的主要接触区域靠近CH2和CH3结构域的接合点。Fc-FcRn接触全部位于单条Ig重链内。FcRn结合配偶体包括完整IgG、IgG的Fc片段和IgG的包括FcRn的完整结合区的其他片段。主要接触位点包括CH2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436。对免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的提及都是基于Kabat等1991,Sequences of Proteins ofImmunological Interest,U.S.Department of Public Health,Bethesda,Md。

结合至FcRn的Fc区或FcRn结合配偶体可以通过FcRn有效穿梭跨越上皮障壁,由此提供全身施用所需治疗分子的非侵入性手段。另外,包含Fc区或FcRn结合配偶体的融合蛋白被表达FcRn的细胞内吞。但是这些融合蛋白再次再循环进循环中,而不是经标记以供降解,由此增加这些蛋白质的体内半衰期。在某些实施例中,免疫球蛋白恒定区的部分是Fc区或FcRn结合配偶体,其通常通过二硫键和其他非特异性相互作用与另一Fc区或另一FcRn结合配偶体缔合,以形成二聚体和更高阶多聚体。

两个FcRn受体可以结合单个Fc分子。晶体学数据表明,每个FcRn分子结合Fc同二聚体的单一多肽。在一个实施例中,将FcRn结合配偶体(例如,IgG的Fc片段)与生物活性分子连接提供口服、经颊、舌下、经直肠、经阴道、作为经鼻施用的气溶胶或通过肺途径或通过眼部途径递送生物活性分子的手段。在另一个实施例中,凝血因子蛋白能以侵入性方式(例如,皮下、静脉内)施用。

FcRn结合配偶体区域是可由FcRn受体特异性结合,随后通过Fc区的FcRn受体主动转运的分子或其部分。特异性结合是指两个分子形成在生理条件下相对稳定的复合物。特异性结合的特征在于区分于通常具有低亲和性和中至高容量的非特异性结合的高亲和性和低至中容量。通常,在亲和常数KA高于10

在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含一个或多个截短Fc区,但是其足以将Fc受体(FcR)结合特性赋予Fc区。例如,Fc区中结合至FcRn的部分(即,FcRn结合部分)包含IgG1的约氨基酸282-438,EU编号(主要接触位点是CH2结构域的氨基酸248、250-257、272、285、288、290-291、308-311和314以及CH3结构域的氨基酸残基385-387、428和433-436)。因此,本公开文本的Fc区可以包含FcRn结合部分或由所述FcRn结合部分组成。FcRn结合部分可以衍生自任何同种型(包括IgGl、IgG2、IgG3和IgG4)的重链。在一个实施例中,使用来自人同种型IgG1的抗体的FcRn结合部分。在另一个实施例中,使用来自人同种型IgG4的抗体的FcRn结合部分。

Fc区可以从多种不同来源获得。在一个实施例中,多肽的Fc区衍生自人免疫球蛋白。然而,应理解,Fc部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,Fc结构域或其部分的多肽可以衍生自任何免疫球蛋白类别(包括IgM、IgG、IgD、IgA和IgE)以及任何免疫球蛋白同种型(包括IgG1、IgG2、IgG3和IgG4)。在另一个实施例中,使用人同种型IgG1。

在某些实施例中,Fc变异体赋予至少一种由包含所述野生型Fc结构域的Fc部分赋予的效应子功能的变化(例如,Fc区结合至Fc受体(例如FcγRI、FcγRII或FcγRIII)或补体蛋白(例如,C1q)或触发抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)的能力的改进或降低)。在其他实施例中,Fc变异体提供工程化半胱氨酸残基。

本公开文本的Fc区可利用本领域公认的Fc变异体,已知所述Fc变异体可赋予效应子功能和/或FcR或FcRn结合的变化(例如,增强或降低)。具体来说,本公开文本的Fc区可包括例如在以下文献中披露的一个或多个氨基酸位置处的变化(例如,取代):国际PCT公开案WO 88/07089A1、WO 96/14339A1、WO 98/05787A1、WO 98/23289A1、WO 99/51642A1、WO 99/58572A1、WO 00/09560A2、WO 00/32767A1、WO 00/42072A2、WO 02/44215A2、WO 02/060919A2、WO 03/074569A2、WO 04/016750A2、WO 04/029207A2、WO 04/035752A2、WO 04/063351A2、WO 04/074455A2、WO 04/099249A2、WO 05/040217A2、WO 04/044859、WO 05/070963A1、WO 05/077981A2、WO 05/092925A2、WO 05/123780A2、WO 06/019447A1、WO 06/047350A2和WO 06/085967A2;美国专利公开号US 2007/0231329、US 2007/0231329、US2007/0237765、US 2007/0237766、US 2007/0237767、US 2007/0243188、US 20070248603、US 20070286859、US 20080057056;或美国专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091,将每篇文献通过引用并入本文。在一个实施例中,可在一个或多个所公开的氨基酸位置进行特定变化(例如,业内披露的一个或多个氨基酸的特定取代)。在另一个实施例中,可在一个或多个所公开氨基酸位置进行不同变化(例如,业内披露的一个或多个氨基酸位置的不同取代)。

IgG的Fc区或FcRn结合配偶体可根据公认程序(如定点突变诱发等)来修饰,以产生将由FcRn结合的经修饰IgG或其Fc片段或部分。此类修饰包括远离FcRn接触位点的修饰以及在接触位点内的修饰,所述修饰保留或甚至增强与FcRn的结合。例如,可在不显著损失Fc对FcRn的结合亲和性的情况下取代人IgG1 Fc(Fcγ1)中的以下单个氨基酸残基:P238A、S239A、K246A、K248A、D249A、M252A、T256A、E258A、T260A、D265A、S267A、H268A、E269A、D270A、E272A、L274A、N276A、Y278A、D280A、V282A、E283A、H285A、N286A、T289A、K290A、R292A、E293A、E294A、Q295A、Y296F、N297A、S298A、Y300F、R301A、V303A、V305A、T307A、L309A、Q311A、D312A、N315A、K317A、E318A、K320A、K322A、S324A、K326A、A327Q、P329A、A330Q、P331A、E333A、K334A、T335A、S337A、K338A、K340A、Q342A、R344A、E345A、Q347A、R355A、E356A、M358A、T359A、K360A、N361A、Q362A、Y373A、S375A、D376A、A378Q、E380A、E382A、S383A、N384A、Q386A、E388A、N389A、N390A、Y391F、K392A、L398A、S400A、D401A、D413A、K414A、R416A、Q418A、Q419A、N421A、V422A、S424A、E430A、N434A、T437A、Q438A、K439A、S440A、S444A和K447A,其中例如P238A代表在位置编号238处由丙氨酸取代的野生型脯氨酸。作为例子,一个具体实施例并入N297A突变,从而去除高度保守的N糖基化位点。除了丙氨酸以外,可在上文指定的位置用其他氨基酸取代野生型氨基酸。可将突变单独引入Fc中,从而产生多于一百个与天然Fc不同的Fc区。另外,这些单独突变中的2个、3个或更多个的组合可一起引入,从而产生另外数百个Fc区。

某些上述突变可以对Fc区或FcRn结合配偶体赋予新功能。例如,一个实施例并入N297A,从而去除高度保守的N糖基化位点。这个突变的作用是降低免疫原性,由此增强Fc区的循环半衰期,并使Fc区不能结合至FcγRI、FcγRIIA、FcγRIIB和FcγRIIIA,并且不损害对FcRn的亲和性(Routledge等1995,Transplantation 60:847;Friend等1999,Transplantation68:1632;Shields等1995,J.Biol.Chem.276:6591)。作为从上述突变产生的新功能的另一例子,对FcRn的亲和性可以增加,在一些情况下超过野生型的亲和性。这种增加的亲和性可以反映增加的“缔合”速率、降低的“解离”速率或增加的“缔合”速率与降低的“解离”速率二者。相信可赋予增加的对FcRn的亲和性的突变的例子包括但不限于T256A、T307A、E380A和N434A(Shields等2001,J.Biol.Chem.276:6591)。

另外,至少三种人Fcγ受体似乎识别IgG上下铰链区内的结合位点,通常是氨基酸234-237。因此,如例如通过将人IgG1的氨基酸233-236“ELLG”(SEQ ID NO:45)替代为来自IgG2的相应序列“PVA”(一个氨基酸缺失),可以从这个区域的突变产生新功能的另一例子和可能降低的免疫原性。已经显示,在已经引入此类突变时,介导多种效应子功能的FcγRI、FcγRII和FcγRIII不会结合至IgG1。Ward和Ghetie 1995,Therapeutic Immunology2:77;和Armour等1999,Eur.J.Immunol.29:2613。

在另一个实施例中,免疫球蛋白恒定区或其部分包含铰链区或其部分中的与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键的氨基酸序列。第二免疫球蛋白恒定区或其部分可以连接至第二多肽,使治疗性蛋白质与第二多肽结合在一起。在一些实施例中,第二多肽是增强子部分。如本文所用,术语“增强子部分”是指能够增强治疗性蛋白质的活性的分子、其片段或多肽组分。增强子部分可以是辅因子,如其中治疗性蛋白质是凝血因子、可溶性组织因子(sTF)或促凝血肽。因此,在激活凝血因子后,增强子部分可用于增强凝血因子活性。

在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含对免疫球蛋白恒定区或其部分的氨基酸取代(例如,Fc变异体),所述氨基酸取代改变Ig恒定区的抗原非依赖性效应子功能,特别是蛋白质的循环半衰期。

2.scFc区

在另一个方面中,异源部分包含scFc(单链Fc)区。在一个实施例中,本公开文本的分离的核酸分子还包含编码scFc区的异源核酸序列。scFc区在同一线性多肽链内包含至少两个免疫球蛋白恒定区或其部分(例如,Fc部分或结构域(例如,2、3、4、5、6个或更多个Fc部分或结构域)),所述恒定区或其部分能够折叠(例如,分子内或分子间折叠)以形成一个由Fc肽接头连接的功能性scFc区。例如,在一个实施例中,本公开文本的多肽能够通过其scFc区结合至至少一种Fc受体(例如,FcRn、FcγR受体(例如,FcγRIII)或补体蛋白(例如,C1q)),以改良半衰期或触发免疫效应子功能(例如,抗体依赖性细胞毒性(ADCC)、吞噬作用或补体依赖性细胞毒性(CDCC)和/或改善可制造性)。

3.CTP

在另一个方面中,异源部分包含人绒毛膜促性腺激素的β亚基的一种C末端肽(CTP)或其片段、变异体或衍生物。已知插入重组蛋白中的一种或多种CTP肽增加所述蛋白质的体内半衰期。参见例如,美国专利号5,712,122,通过引用以其整体并入本文。

示例性CTP肽包括DPRFQDSSSSKAPPPSLPSPSRLPGPSDTPIL(SEQ ID NO:33)或SSSSKAPPPSLPSPSRLPGPSDTPILPQ(SEQ ID NO:34)。参见例如,美国专利申请公开号US2009/0087411 A1,通过引用并入。

4.XTEN序列

在一些实施例中,异源部分包含一个或多个XTEN序列、其片段、变异体或衍生物。如本文所用,“XTEN序列”是指延伸长度的多肽,其具有非天然存在的基本上不重复的序列,所述序列主要由小亲水氨基酸构成,并且所述序列在生理条件下具有较低程度的或不具有二级或三级结构。作为异源部分,XTEN可以用作半衰期延长部分。另外,XTEN可以提供所需特性,包括但不限于增强的药物代谢动力学参数和溶解度特征。

将包含XTEN序列的异源部分并入本公开文本的蛋白质中可以赋予蛋白质以下有利特性中的一种或多种:构象柔性、增强的水溶解度、高蛋白酶抗性程度、低免疫原性、与哺乳动物受体的低结合或增加的流体力学(或斯托克斯(Stokes))半径。

在某些方面中,XTEN序列可以增加药物代谢动力学特性,如较长体内半衰期或增加的曲线下面积(AUC),使得与相同的但不具有XTEN异源部分的蛋白质相比,本公开文本的蛋白质保持在体内并且持续增加的时间段具有促凝血活性。

在一些实施例中,可用于本公开文本的XTEN序列是具有大于约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸残基的肽或多肽。在某些实施例中,XTEN是具有大于约20至约3000个氨基酸残基、大于30至约2500个残基、大于40至约2000个残基、大于50至约1500个残基、大于60至约1000个残基、大于70至约900个残基、大于80至约800个残基、大于90至约700个残基、大于100至约600个残基、大于110至约500个残基或大于120至约400个残基的肽或多肽。在一个特定实施例中,XTEN包含长度长于42个氨基酸并且短于144个氨基酸的氨基酸序列。

本公开文本的XTEN序列可以包含一个或多个5至14(例如,9至14)个氨基酸残基的序列基序或与所述序列基序至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,其中所述基序包含4至6种类型的选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P)的氨基酸(例如,5种氨基酸),基本上由所述氨基酸组成或由所述氨基酸组成。参见US 2010-0239554 A1。

在一些实施例中,XTEN包含非重迭序列基序,其中约80%、或至少约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%或约100%的序列由选自从表7选择的单一基序家族的非重迭序列的多个单元组成,从而得到家族序列。如本文所用,“家族”意指,XTEN具有仅选自表7的单一基序类别的基序;即,AD、AE、AF、AG、AM、AQ、BC或BD XTEN,并且选择XTEN中并非来自家族基序的任何其他氨基酸以实现所需特性,如允许通过编码核苷酸并入限制位点、并入切割序列,或实现与治疗性蛋白质的更佳连接。在XTEN家族的一些实施例中,XTEN序列包含AD基序家族、或AE基序家族、或AF基序家族、或AG基序家族、或AM基序家族、或AQ基序家族、或BC家族、或BD家族的非重迭序列基序的多个单元,并且所得XTEN展现上述同源性范围。在其他实施例中,XTEN包含来自表7的两个或更多个基序家族的基序序列的多个单元。可以选择这些序列以实现所需的物理/化学特征,包括如净电荷、亲水性、缺少二级结构或缺少重复性等由基序的氨基酸组成所赋予的特性,更全面地描述于下文中。在本段落的上述实施例中,可以使用本文所述方法选择并组装并入XTEN中的基序,以得到约36至约3000个氨基酸残基的XTEN。

表7.12个氨基酸的XTEN序列基序和基序家族

*表示单独基序序列,其在以各种排列一起使用时产生“家族序列”

可以用作本公开文本的治疗性蛋白质中的异源部分的XTEN序列的例子披露于例如以下文献中:美国专利公开号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199A1或2011/0172146 A1,或者国际专利公开号WO2010091122 A1、WO 2010144502 A2、WO 2010144508A1、WO 2011028228 A1、WO 2011028229A1或WO 2011028344 A2,将每篇文献通过引用以其整体并入本文。

XTEN可具有变化的长度以供插入或连接至治疗性蛋白质。在一个实施例中,所述一个或多个XTEN序列的长度是基于要在融合蛋白中实现的特性或功能来选择。根据预期的特性或功能,XTEN可以是可用作载剂的短或中等长度的序列或较长的序列。在某些实施例中,XTEN包括约6至约99个氨基酸残基的短区段、约100至约399个氨基酸残基的中等长度和约400至约1000以及多达约3000个氨基酸残基的较长长度。因此,插入或连接至治疗性蛋白质的XTEN可具有约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500或多达约3000个氨基酸残基的长度。在其他实施例中,XTEN序列的长度为约6至约50、约50至约100、约100至150、约150至250、约250至400、约400至约500、约500至约900、约900至1500、约1500至2000或约2000至约3000个氨基酸残基。在对治疗性蛋白质的活性没有不利影响的情况下,插入或连接至治疗性蛋白质的XTEN的精确长度可以变化。在一个实施例中,本文所用的一个或多个XTEN具有42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸的长度,并且可选自一个或多个XTEN家族序列;即,AD、AE、AF、AG、AM、AQ、BC或BD。

在一些实施例中,治疗性蛋白质包含FVIII多肽和XTEN,其中XTEN包含288个氨基酸。在一个实施例中,治疗性蛋白质包含FVIII多肽和XTEN,其中XTEN包含288个氨基酸,并且XTEN插入FVIII多肽的B结构域内。在一个特定实施例中,治疗性蛋白质包含FVIII多肽和包含SEQ ID NO:109的XTEN,并且XTEN插入FVIII多肽的B结构域内。在一个特定实施例中,治疗性蛋白质包含FVIII多肽和包含SEQ ID NO:109的XTEN,并且XTEN紧邻成熟FVIII的氨基酸745下游插入FVIII多肽内。

在一些实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中XTEN包含72个氨基酸。在一个实施例中,治疗性蛋白质包含FIX多肽和XTEN,其中XTEN包含72个氨基酸,并且XTEN紧邻成熟FIX的氨基酸166下游插入FIX多肽内。

在一些实施例中,用于本公开文本中的XTEN序列与选自以下的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同:AE42、AG42、AE48、AM48、AE72、AG72、AE108、AG108、AE144、AF144、AG144、AE180、AG180、AE216、AG216、AE252、AG252、AE288、AG288、AE324、AG324、AE360、AG360、AE396、AG396、AE432、AG432、AE468、AG468、AE504、AG504、AF504、AE540、AG540、AF540、AD576、AE576、AF576、AG576、AE612、AG612、AE624、AE648、AG648、AG684、AE720、AG720、AE756、AG756、AE792、AG792、AE828、AG828、AD836、AE864、AF864、AG864、AM875、AE912、AM923、AM1318、BC864、BD864、AE948、AE1044、AE1140、AE1236、AE1332、AE1428、AE1524、AE1620、AE1716、AE1812、AE1908、AE2004A、AG948、AG1044、AG1140、AG1236、AG1332、AG1428、AG1524、AG1620、AG1716、AG1812、AG1908、AG2004及其任何组合。参见US 2010-0239554 A1。在一个特定实施例中,XTEN包含AE42、AE72、AE144、AE288、AE576、AE864、AG 42、AG72、AG144、AG288、AG576、AG864或其任何组合。

可用作本公开文本的治疗性蛋白质中的异源部分的示例性XTEN序列包括XTENAE42-4(SEQ ID NO:46,由SEQ ID NO:47编码)、XTEN AE144-2A(SEQ ID NO:48,由SEQ IDNO:49编码)、XTEN AE144-3B(SEQ ID NO:50,由SEQ ID NO:51编码)、XTEN AE144-4A(SEQID NO:52,由SEQ ID NO:53编码)、XTEN AE144-5A(SEQ ID NO:54,由SEQ ID NO:55编码)、XTEN AE144-6B(SEQ ID NO:56,由SEQ ID NO:57编码)、XTEN AG144-1(SEQ ID NO:58,由SEQ ID NO:59编码)、XTEN AG144-A(SEQ ID NO:60,由SEQ ID NO:61编码)、XTEN AG144-B(SEQ ID NO:62,由SEQ ID NO:63编码)、XTEN AG144-C(SEQ ID NO:64,由SEQ ID NO:65编码)和XTEN AG144-F(SEQ ID NO:66,由SEQ ID NO:67编码)。在一个特定实施例中,XTEN由SEQ ID NO:18编码。

在另一个实施例中,XTEN序列选自AE36(SEQ ID NO:130)、AE42(SEQ ID NO:131)、AE72(SEQ ID NO:132)、AE78(SEQ ID NO:133)、AE144(SEQ ID NO:134)、AE144_2A(SEQ IDNO:48)、AE144_3B(SEQ ID NO:50)、AE144_4A(SEQ ID NO:52)、AE144_5A(SEQ ID NO:54)、AE144_6B(SEQ ID NO:135)、AG144(SEQ ID NO:136)、AG144_A(SEQ ID NO:137)、AG144_B(SEQ ID NO:62)、AG144_C(SEQ ID NO:64)、AG144_F(SEQ ID NO:66)、AE288(SEQ ID NO:138)、AE288_2(SEQ ID NO:139)、AG288(SEQ ID NO:140)、AE576(SEQ ID NO:141)、AG576(SEQ ID NO:142)、AE864(SEQ ID NO:143)、AG864(SEQ ID NO:144)、XTEN_AE72_2A_1(SEQID NO:145)、XTEN_AE72_2A_2(SEQ ID NO:146)、XTEN_AE72_3B_1(SEQ ID NO:147)、XTEN_AE72_3B_2(SEQ ID NO:148)、XTEN_AE72_4A_2(SEQ ID NO:149)、XTEN_AE72_5A_2(SEQ IDNO:150)、XTEN_AE72_6B_1(SEQ ID NO:151)、XTEN_AE72_6B_2(SEQ ID NO:152)、XTEN_AE72_1A_1(SEQ ID NO:153)、XTEN_AE72_1A_2(SEQ ID NO:154)、XTEN_AE144_1A(SEQ IDNO:155)、AE150(SEQ ID NO:156)、AG150(SEQ ID NO:157)、AE294(SEQ ID NO:158)、AG294(SEQ ID NO:159)及其任何组合。在一个具体实施例中,XTEN序列选自下组:AE72、AE144和AE288。本发明的某些XTEN序列的氨基酸序列显示于表8中。

表8.XTEN序列

在一些实施例中,XTEN的小于100%的氨基酸选自甘氨酸(G)、丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、谷氨酸(E)和脯氨酸(P),或者小于100%的序列由来自表7的序列基序或本文所提供的XTEN序列组成。在此类实施例中,XTEN的其余氨基酸残基选自其他14种天然L-氨基酸中的任一种,但是可优先地选自亲水氨基酸,使得XTEN序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的亲水氨基酸。缀合构建体中所利用的XTEN中疏水氨基酸的含量可以小于5%、或小于2%、或小于1%疏水氨基酸含量。在XTEN构建中较不有利的疏水残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,XTEN序列可含有小于5%或小于4%或小于3%或小于2%或小于1%或无以下氨基酸:甲硫氨酸(例如,以避免氧化)、或天冬酰胺和谷氨酰胺(以避免脱酰胺)。

所述一个或多个XTEN序列可以插入治疗性蛋白质的C末端或N末端处,或者插入治疗性蛋白质的氨基酸序列中的两个氨基酸之间。例如,如果治疗性蛋白质包含FVIII多肽,则XTEN可以在选自表5的一个或多个插入位点插入两个氨基酸之间。如果治疗性蛋白质包含FIX多肽,则XTEN可以在选自表5的一个或多个插入位点插入两个氨基酸之间。

可以根据本发明使用的XTEN序列的其他例子披露于以下文献中:美国专利公开号2010/0239554 A1、2010/0323956 A1、2011/0046060 A1、2011/0046061 A1、2011/0077199A1或2011/0172146 A1,或者国际专利公开号WO 2010091122 A1、WO 2010144502 A2、WO2010144508 A1、WO 2011028228 A1、WO 2011028229 A1、WO 2011028344 A2、WO 2014/011819 A2或WO 2015/023891。

5.白蛋白或其片段、衍生物或变异体

在一些实施例中,异源部分包含白蛋白或其功能片段。人血清白蛋白(HSA或HA)是其全长形式的609个氨基酸的蛋白质,负责血清渗透压的大部分,并且还用作内源和外源配位体的载剂。如本文所用的术语“白蛋白”包括全长白蛋白或其功能片段、变异体、衍生物或类似物。白蛋白或其片段或变异体的例子披露于以下文献中:美国专利公开号2008/0194481A1、2008/0004206 A1、2008/0161243 A1、2008/0261877 A1或2008/0153751 A1,或者PCT申请公开号2008/033413 A2、2009/058322 A1或2007/021494 A2,将上述文献通过引用以其整体并入本文。

在一个实施例中,本公开文本的治疗性蛋白质包含进一步连接至第二异源部分的白蛋白、其片段或变异体,所述第二异源部分选自免疫球蛋白恒定区或其部分(例如,Fc区)、PAS序列、HES、PEG及其任何组合。

6.白蛋白结合部分

在某些实施例中,异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合结构域、白蛋白结合抗体片段或其任何组合。

例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或抗体片段,包括结构域抗体(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白结合结构域,如一种链球菌蛋白G(Konig,T.和Skerra,A.(1998)J.Immunol.Methods 218,73-83)。可以用作缀合配偶体的白蛋白结合肽的其他例子是例如具有Cys-Xaa

如Kraulis等,FEBS Lett.378:190-194(1996)和Linhult等,Protein Sci.11:206-213(2002)所披露的来自链球菌蛋白G的结构域3是细菌白蛋白结合结构域的例子。白蛋白结合肽的例子包括具有核心序列DICLPRWGCLW(SEQ ID NO:35)的一系列肽。参见例如,Dennis等,J.Biol.Chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的例子披露于以下文献中:Muller和Kontermann,Curr.Opin.Mol.Ther.9:319-326(2007);Roovers等,Cancer Immunol.Immunother.56:303-317(2007);和Holt等,Prot.Eng.Design Sci.,21:283-288(2008),将上述文献通过引用以其整体并入本文。这种白蛋白结合部分的例子是如Trussel等,Bioconjugate Chem.20:2286-2292(2009)所披露的2-(3-马来酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸酯(“Albu”标签)。

脂肪酸、特别是长链脂肪酸(LCFA)和长链脂肪酸样白蛋白结合化合物可以用于延长本公开文本的凝血因子蛋白的体内半衰期。LCFA样白蛋白结合化合物的例子是16-(l-(3-(9-(((2,5-二氧代吡咯烷-l-基氧基)羰氧基)-甲基)-7-磺基-9H-芴-2-基胺基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见例如,WO 2010/140148)。

7.PAS序列

在其他实施例中,异源部分是PAS序列。如本文所用的PAS序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成随机螺旋构象。因此,PAS序列是包含丙氨酸、丝氨酸和脯氨酸、基本上由所述氨基酸组成或由所述氨基酸组成的结构单元、氨基酸聚合物或序列盒,其可以用作嵌合蛋白中异源部分的一部分。然而,熟习此项技术者知道,在添加除了丙氨酸、丝氨酸和脯氨酸以外的残基作为PAS序列中的次要成分时,氨基酸聚合物还可以形成随机螺旋构象。如本文所用的术语“次要成分”意指,可以在PAS序列中添加除了丙氨酸、丝氨酸和脯氨酸以外的氨基酸至某种程度,例如,高达约12%,即PAS序列的100个氨基酸中的约12个;高达约10%,即PAS序列的100个氨基酸中的约10个;高达约9%,即100个氨基酸中的约9个;高达约8%,即100个氨基酸中的约8个;约6%,即100个氨基酸中的约6个;约5%,即100个氨基酸中的约5个;约4%,即100个氨基酸中的约4个;约3%,即100个氨基酸中的约3个;约2%,即100个氨基酸中的约2个;约1%,即100个氨基酸中的约1个。与丙氨酸、丝氨酸和脯氨酸不同的氨基酸可以选自Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Thr、Trp、Tyr和Val。

在生理条件下,PAS序列段形成随机螺旋构象,由此可以介导凝血因子蛋白的增加的体内和/或体外稳定性。由于随机螺旋结构域自身不具有稳定结构或功能,基本上保留了由凝血因子蛋白介导的生物学活性。在其他实施例中,尤其关于血浆中的蛋白质水解、免疫原性、等电点/静电行为、与细胞表面受体的结合或内化,形成随机螺旋结构域的PAS序列具有生物惰性,但仍然是生物可降解的,这提供了优于如PEG等合成聚合物的明显优势。

形成随机螺旋构象的PAS序列的非限制性例子包含选自以下的氨基酸序列:ASPAAPAPASPAAPAPSAPA(SEQ ID NO:36)、AAPASPAPAAPSAPAPAAPS(SEQ ID NO:37)、APSSPSPSAPSSPSPASPSS(SEQ ID NO:38)、APSSPSPSAPSSPSPASPS(SEQ ID NO:39)、SSPSAPSPSSPASPSPSSPA(SEQ ID NO:40)、AASPAAPSAPPAAASPAAPSAPPA(SEQ ID NO:41)、ASAAAPAAASAAASAPSAAA(SEQ ID NO:42)及其任何组合。PAS序列的其他例子是从例如以下文献得知:美国专利公开号2010/0292130 A1和PCT申请公开号WO 2008/155134 A1。

8.HAP序列

在某些实施例中,异源部分是富含甘氨酸的同氨基酸聚合物(HAP)。HAP序列可以包含甘氨酸的重复序列,所述重复序列的长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施例中,HAP序列能够延长融合至或连接至HAP序列的部分的半衰期。HAP序列的非限制性例子包括但不限于(Gly)

9.转铁蛋白或其片段

在某些实施例中,异源部分是转铁蛋白或其片段。任何转铁蛋白都可用于制备本公开文本的凝血因子蛋白。作为例子,野生型人TF(TF)是679个氨基酸的蛋白质,大约75KDA(不计糖基化),具有似乎源自基因重复的两个主要结构域N(约330个氨基酸)和C(约340个氨基酸)。参见GenBank登录号NM001063、XM002793、M12530、XM039845、XM 039847和S95936(www.ncbi.nlm.nih.gov/),将所有登录号通过引用以其整体并入本文。转铁蛋白包含两个结构域N结构域和C结构域。N结构域包含两个子结构域N1结构域和N2结构域,并且C结构域包含两个子结构域C1结构域和C2结构域。

在一个实施例中,转铁蛋白异源部分包括转铁蛋白剪接变异体。在一个例子中,转铁蛋白剪接变异体可以是人转铁蛋白的剪接变异体,例如Genbank登录号AAA61140。在另一个实施例中,嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如N结构域、C结构域、N1结构域、N2结构域、C1结构域、C2结构域或其任何组合。

10.清除受体

在某些实施例中,异源部分是清除受体、其片段、变异体或衍生物。LRP1是600kDa膜内在蛋白,其参与受体介导的如因子X等多种蛋白质的清除。参见例如,Narita等,Blood91:555-560(1998)。

11.血管性血友病因子或其片段

在某些实施例中,异源部分是血管性血友病因子(VWF)或其一个或多个片段。

VWF(也称为F8VWF)是存在于血浆中的大多聚糖蛋白,并且在内皮(在怀布尔-帕拉德体(Weibel-Palade body)中)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中组成性地产生。基本VWF单体是2813个氨基酸的蛋白质。每个单体含有多个具有特定功能的特定结构域,即D'和D3结构域(其一起结合至因子VIII)、A1结构域(其结合至血小板GPIb-受体、肝素和/或可能地胶原)、A3结构域(其结合至胶原)、C1结构域(其中RGD结构域在被激活时结合至血小板整联蛋白αIIbβ3)和在蛋白质C末端的“半胱氨酸结”结构域(其是VWF与血小板衍生的生长因子(PDGF)、转化生长因子-β(TGFβ)和β-人绒毛膜促性腺激素(βHCG)共享的)。

人VWF的2813单体氨基酸序列是作为Genbank中的登录号NP000543.2来报道。编码人VWF的核苷酸序列是作为Genbank中的登录号NM000552.3来报道。SEQ ID NO:129是由SEQID NO:128编码的氨基酸序列。D’结构域包括SEQ ID NO:129的氨基酸764至866。D3结构域包括SEQ ID NO:44的氨基酸867至1240。

在血浆中,95%-98%的FVIII以与全长VWF的紧密非共价复合物来循环。这种复合物的形成对于在体内维持适当的FVIIII血浆水平是重要的。Lenting等,Blood.92(11):3983-96(1998);Lenting等,J.Thromb.Haemost.5(7):1353-60(2007)。在FVIII由于在重链中的位置372和740以及轻链中的位置1689的蛋白质水解而被激活时,从激活的FVIII去除结合至FVIII的VWF。

在某些实施例中,异源部分是全长血管性血友病因子。在其他实施例中,异源部分是血管性血友病因子片段。如本文所用,本文所用的术语“VWF片段(VWF fragment)”或“VWF片段(VWF fragments)”意指任何VWF片段,其与FVIII相互作用并保留至少一种或多种通常由全长VWF提供给FVIII的特性,所述特性是例如防止过早激活为FVIIIa、防止过早蛋白质水解、防止可导致过早清除的与磷脂膜的缔合、防止与可以结合裸FVIII而不是VWF结合FVIII的FVIII清除受体结合和/或稳定FVIII重链和轻链相互作用。在一个具体实施例中,异源部分是包含VWF的D’结构域和D3结构域的(VWF)片段。包含D’结构域和D3结构域的VWF片段还可以包含选自以下的VWF结构域:A1结构域、A2结构域、A3结构域、D1结构域、D2结构域、D4结构域、B1结构域、B2结构域、B3结构域、C1结构域、C2结构域、CK结构域、其一个或多个片段及其任何组合。融合至VWF片段的具有FVIII活性的多肽的其他例子披露于以下文献中:2012年7月3日提交的美国临时专利申请号61/667,901和美国公开号2015/0023959 A1,将这两篇文献都通过引用以其整体并入本文。

12.接头部分

在某些实施例中,异源部分是肽接头。

如本文所用,术语“肽接头”或“接头部分”是指连接多肽链的线性氨基酸序列中的两个结构域的肽或多肽序列(例如,合成肽或多肽序列)。

在一些实施例中,肽接头可插入本公开文本的治疗性蛋白质与上述异源部分(如白蛋白)之间。肽接头可向嵌合多肽分子提供柔性。接头通常不被切割,但是可能需要这种切割。在一个实施例中,在加工期间不去除这些接头。

可存在于本公开文本的嵌合蛋白中的一种类型的接头是蛋白酶可切割的接头,其包含切割位点(即,蛋白酶切割位点底物,例如因子XIa、Xa或凝血酶切割位点)并可在切割位点的N末端或C末端或两侧上包括其他接头。这些可切割接头在并入本公开文本的构建体中时产生具有异源切割位点的嵌合分子。

在一个实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含两个或更多个Fc结构域或部分,其通过cscFc接头连接以形成包含于单条多肽链中的Fc区。cscFc接头侧接有至少一个细胞内加工位点,即由细胞内酶切割的位点。多肽在所述至少一个细胞内加工位点的切割产生包含至少两条多肽链的多肽。

其他肽接头可以任选地用于本公开文本的构建体中,例如以将凝血因子蛋白连接至Fc区。可以结合本公开文本使用的一些示例性接头包括例如更详细地描述于下文中的包含GlySer氨基酸的多肽。

在一个实施例中,肽接头是合成的,即非天然存在的。在一个实施例中,肽接头包括包含如下氨基酸序列的肽(或多肽)(其可以是或可以不是天然存在的),所述氨基酸序列将第一线性氨基酸序列与在自然界中并非与其天然地连接或遗传融合的第二线性氨基酸序列连接或遗传融合。例如,在一个实施例中,肽接头可以包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变,如添加、取代或缺失)。在另一个实施例中,肽接头可以包含非天然存在的氨基酸。在另一个实施例中,肽接头可以包含存在于在自然界中不存在的线性序列中的天然存在的氨基酸。在仍另一个实施例中,肽接头可以包含天然存在的多肽序列。

例如,在某些实施例中,肽接头可以用于融合相同的Fc部分,由此形成同二聚scFc区。在其他实施例中,肽接头可以用于融合不同的Fc部分(例如野生型Fc部分和Fc部分变异体),由此形成异二聚scFc区。

在另一个实施例中,肽接头包含gly-ser接头或由所述gly-ser接头组成。在一个实施例中,scFc或cscFc接头包含免疫球蛋白铰链的至少一部分和gly-ser接头。如本文所用,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施例中,所述gly-ser接头可以插入肽接头的两个其他序列之间。在其他实施例中,gly-ser接头连接于肽接头的另一序列的一个或两个末端。在又其他实施例中,两个或更多个gly-ser接头串联并入肽接头中。在一个实施例中,本公开文本的肽接头包含上铰链区的至少一部分(例如,衍生自IgG1、IgG2、IgG3或IgG4分子)、中铰链区的至少一部分(例如,衍生自IgG1、IgG2、IgG3或IgG4分子)和一系列gly/ser氨基酸残基。

本公开文本的肽接头的长度为至少一个氨基酸并且可以具有变化的长度。在一个实施例中,本公开文本的肽接头的长度为约1至约50个氨基酸。如在此上下文中所用,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,长度为约1至约50个氨基酸的长度意指长度为1-3至48-52个氨基酸的长度。在另一个实施例中,本公开文本的肽接头的长度为约10至约20个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约50个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约20至约45个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约35或约20至约30个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000或2000个氨基酸。在一个实施例中,本公开文本的肽接头的长度为20或30个氨基酸。

在一些实施例中,肽接头可以包含至少2、至少3、至少4、至少5、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90或至少100个氨基酸。在其他实施例中,肽接头可以包含至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1,000个氨基酸。在一些实施例中,肽接头可以包含至少约10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个氨基酸。肽接头可以包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。

可使用本领域已知的技术将肽接头引入多肽序列中。可通过DNA序列分析来确认修饰。可使用质粒DNA转化宿主细胞用于稳定产生所产生的多肽。

13.单体-二聚体杂合物

在一些实施例中,本公开文本的治疗性蛋白质包含含有凝血因子的单体-二聚体杂合物分子。

本文所用的术语“单体-二聚体杂合物”是指包含通过二硫键相互缔合的第一多肽链和第二多肽链的嵌合蛋白,其中第一链包含凝血因子(例如,FVIII)和第一Fc区,并且第二链包含无凝血因子的第二Fc区,基本上由所述第二Fc区组成或由所述第二Fc区组成。因此,单体-二聚体杂合构建体是包含仅具有一种凝血因子的单体方面和具有两个Fc区的二聚体方面的杂合物。

14.表达控制序列

在一些实施例中,本公开文本的核酸分子还包含至少一个表达控制序列。如本文所用的表达控制序列是有助于与其可操作地连接的编码核酸的有效转录和翻译的任何调控核苷酸序列,如启动子序列或启动子-增强子组合。例如,本公开文本的核酸分子可以可操作地连接至至少一个转录控制序列。基因表达控制序列可以是例如哺乳动物或病毒启动子,如组成型或诱导型启动子。

组成型哺乳动物启动子包括但不限于以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(HPRT)、腺苷脱胺酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成性地发挥作用的示例性病毒启动子包括例如来自以下病毒的启动子:巨细胞病毒(CMV)、猿猴病毒(例如,SV40)、乳头状瘤病毒、腺病毒、人免疫缺陷病毒(HIV)、劳斯肉瘤病毒、巨细胞病毒、莫罗尼白血病病毒的长末端重复(LTR)和其他逆转录病毒、以及单纯疱疹病毒的胸苷激酶启动子。其他组成型启动子是本领域的技术人员已知的。可用作本公开文本的基因表达序列的启动子还包括诱导型启动子。诱导型启动子是在诱导剂存在下表达。例如,在某些金属离子存在下诱导金属硫蛋白启动子以促进转录和翻译。其他诱导型启动子是本领域的技术人员已知的。

在一个实施例中,本公开文本包括转基因在组织特异性启动子和/或增强子控制下的表达。在另一个实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞、窦状细胞和/或内皮细胞中的表达。在一个特定实施例中,启动子或其他表达控制序列选择性地增强转基因在内皮细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在以下中的表达:肌肉细胞、中枢神经系统、眼睛、肝脏、心脏或其任何组合。肝脏特异性启动子的例子包括但不限于小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子和小鼠白蛋白启动子。在一个特定实施例中,启动子包含mTTR启动子。mTTR启动子描述于R.H.Costa等,1986,Mol.Cell.Biol.6:4697中。F8启动子描述于Figueiredo和Brownlee,1995,J.Biol.Chem.270:11828-11838中。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(AAT))、肌肉特异性启动子(例如,肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)和结蛋白(DES))、合成启动子(例如,SPc5-12、2R5Sc5-12、dMCK和tMCK)及其任何组合。

在一个实施例中,启动子选自小鼠甲状腺素启动子(mTTR)、内源人因子VIII启动子(F8)、人α-1-抗胰蛋白酶启动子(hAAT)、人白蛋白最小启动子、小鼠白蛋白启动子、TTPp、CASI启动子、CAG启动子、巨细胞病毒(CMV)启动子、α1-抗胰蛋白酶(AAT)、肌肉肌酸激酶(MCK)、肌球蛋白重链α(αMHC)、肌红蛋白(MB)、结蛋白(DES)、SPc5-12、2R5Sc5-12、dMCK和tMCK、磷酸甘油酸激酶(PGK)启动子及其任何组合。

可以使用一种或多种增强子进一步增强表达水平以实现治疗功效。一种或多种增强子可以单独提供,或与一种或多种启动子组件一起提供。通常,表达控制序列包含多个增强子组件和组织特异性启动子。在一个实施例中,增强子包含一个或多个拷贝的α-1-微球蛋白/比库宁蛋白(bikunin)增强子(Rouet等,1992,J.Biol.Chem.267:20765-20773;Rouet等,1995,Nucleic Acids Res.23:395-404;Rouet等,1998,Biochem.J.334:577-584;Ill等,1997,Blood Coagulation Fibrinolysis 8:S23-S30)。在另一个实施例中,增强子衍生自肝脏特异性转录因子结合位点,如EBP、DBP、HNF1、HNF3、HNF4、HNF6和Enh1,包含HNF1、(有义)-HNF3、(有义)-HNF4、(反义)-HNF1、(反义)-HNF6、(有义)-EBP、(反义)-HNF4(反义)。

在一个特定例子中,可用于本公开文本的启动子包含SEQ ID NO:69(即,ET启动子),其还作为GenBank编号AY661265而已知。还参见Vigna等,Molecular Therapy 11(5):763(2005)。其他适宜载体和基因调控组件的例子描述于以下文献中:WO 02/092134、EP1395293或美国专利号6,808,905、7,745,179或7,179,903,将上述文献通过引用以其整体并入本文。

在一个实施例中,本公开文本的核酸分子还包含内含子序列。在一些实施例中,内含子序列定位于编码FVIII多肽的核酸序列的5'。在一些实施例中,内含子序列是天然存在的内含子序列。在一些实施例中,内含子序列是合成序列。在一些实施例中,内含子序列衍生自天然存在的内含子序列。在某些实施例中,内含子序列包含SV40小T内含子。在一个实施例中,内含子序列包含SEQ ID NO:115。

在一些实施例中,核酸分子还包含转录后调控元件。在某些实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(WPRE)。在一个特定实施例中,转录后调控元件包含SEQ ID NO:120。

在一些实施例中,核酸分子包含微小RNA(miRNA)结合位点。在一个实施例中,miRNA结合位点是miR-142-3p的miRNA结合位点。在其他实施例中,miRNA结合位点选自Rennie等,RNA Biol.13(6):554-560(2016)所披露的miRNA结合位点以及可在http://sfold.wadsworth.org/starmirDB.php获得的STarMirDB,将上述文献通过引用以其整体并入本文。

在一些实施例中,核酸分子包含一个或多个DNA核靶向序列(DTS)。DTS促进含有此类序列的DNA分子易位至核中。在某些实施例中,DTS包含SV40增强子序列。在某些实施例中,DTS包含c-Myc增强子序列。在一些实施例中,DTS介于第一ITR与第二ITR之间。在一些实施例中,DTS在第一ITR的3'和治疗性蛋白质的5'。在其他实施例中,DTS在治疗性蛋白质的3'和第二ITR的5'。

在一些实施例中,核酸分子还包含3'UTR多聚(A)尾序列。在一个实施例中,3'UTR多聚(A)尾序列包含bGH多聚(A)。在一个实施例中,3'UTR多聚(A)尾包含肌动蛋白多聚(A)位点。在一个实施例中,3'UTR多聚(A)尾包含血红蛋白多聚(A)位点。

在一个特定实施例中,3'UTR多聚(A)尾序列包含SEQ ID NO:122。

III.组织特异性表达

在某些实施例中,有用的是在载体内包括一个或多个miRNA靶序列,其例如与凝血因子转基因可操作地连接。因此,本公开文本还提供了至少一个与凝血因子核苷酸序列可操作地连接或以其他方式插入载体内的miRNA序列靶标。载体中包括的多于一个拷贝的miRNA靶序列可以增加系统的有效性。还包括不同miRNA靶序列。例如,表达多于一种转基因的载体可以具有在多于一个可以相同或不同的miRNA靶序列控制下的转基因。miRNA靶序列可以是串联的,但是也包括其他排列。含有miRNA靶序列的转基因表达盒也能以反义定向插入载体内。反义定向可用于产生病毒颗粒,以避免原本可能对产生细胞有毒的基因产物的表达。在其他实施例中,载体包含1、2、3、4、5、6、7或8个拷贝的相同或不同的miRNA靶序列。然而,在某些其他实施例中,载体将不包括任何miRNA靶序列。是否要包括miRNA靶序列(以及数量)的选择将通过如预期的组织靶标、所需的表达水平等已知参数来指导。

在一个实施例中,靶序列是miR-223靶标,已经报道其可在骨髓定向祖细胞中以及至少部分地在更原始的HSPC中最有效地阻断表达。miR-223靶标可以在分化的髓样细胞(包括粒细胞、单核细胞、巨噬细胞、髓样树突细胞)中阻断表达。miR-223靶标还可以适于依赖于淋巴或红细胞谱系中的稳健转基因表达的基因疗法应用。miR-223靶标还可在人HSC中非常有效地阻断表达。

在另一个实施例中,靶序列是miR142靶标(tccataaagt aggaaacact acA(SEQ IDNO:43))。在一个实施例中,载体包含4个拷贝的miR-142靶序列。在某些实施例中,将造血特异性微小RNA(如miR-142(142T))的互补序列并入载体(例如,慢病毒载体(LV))的3'非翻译区中,使得编码转基因的转录物易发生miRNA介导的下调。通过这种方法,可以在造血谱系抗原呈递细胞(APC)中防止转基因表达,同时在非造血细胞中维持所述转基因表达(Brown等,Nat Med 2006)。这种策略可以对转基因表达施加严格的转录后控制,并且由此使得能够稳定递送和长期表达转基因。在一些实施例中,miR-142调控防止经转导细胞的免疫介导的清除和/或诱导抗原特异性调控T细胞(T reg),并且介导对转基因编码抗原的稳固的免疫耐受。

在一些实施例中,靶序列是miR181靶标。Chen C-Z和Lodish H,Seminars inImmunology(2005)17(2):155-165披露了miR-181,它是在小鼠骨髓内的B细胞中特异性表达的miRNA(Chen和Lodish,2005)。所述文献还披露,一些人miRNA与白血病相关。

靶序列可以与miRNA完全或部分互补。术语“完全互补”意指,靶序列的核酸序列与识别所述靶序列的miRNA的序列100%互补。术语“部分互补”意指,靶序列与识别所述靶序列的miRNA的序列仅部分互补,借此部分互补的序列仍然被miRNA识别。换句话说,在本公开文本的上下文中,部分互补的靶序列有效识别相应miRNA,并且实现在表达所述miRNA的细胞中防止或减少转基因表达。miRNA靶序列的例子描述于以下文献中:WO 2007/000668、WO2004/094642、WO 2010/055413或WO 2010/125471,将上述文献通过引用以其整体并入本文。

在一些实施例中,转基因表达靶向肝脏。在某些实施例中,转基因表达靶向肝细胞。在其他实施例中,转基因表达靶向内皮细胞。在一个特定实施例中,转基因表达靶向天然表达内源FVIII的任何组织。

在一些实施例中,转基因表达靶向中枢神经系统。在某些实施例中,转基因表达靶向神经元。在一些实施例中,转基因表达靶向传入神经元。

在一些实施例中,转基因表达靶向传出神经元。在一些实施例中,转基因表达靶向中间神经元。在一些实施例中,转基因表达靶向神经胶质细胞。

在一些实施例中,转基因表达靶向星形胶质细胞。在一些实施例中,转基因表达靶向少突胶质细胞。在一些实施例中,转基因表达靶向小神经胶质细胞。在一些实施例中,转基因表达靶向室管膜细胞。在一些实施例中,转基因表达靶向许旺细胞。在一些实施例中,转基因表达靶向卫星细胞。

在一些实施例中,转基因表达靶向肌肉组织。在一些实施例中,转基因表达靶向平滑肌。在一些实施例中,转基因表达靶向心肌。在一些实施例中,转基因表达靶向骨骼肌。

在一些实施例中,转基因表达靶向眼睛。在一些实施例中,转基因表达靶向感光细胞。在一些实施例中,转基因表达靶向视网膜神经节细胞。

IV.宿主细胞

本公开文本还提供了包含本公开文本的核酸分子或载体的宿主细胞。如本文所用,术语“转化”应在广义上使用,是指将DNA引入受体宿主细胞中,这改变了基因型并因此导致受体细胞的变化。

“宿主细胞”是指已经用使用重组DNA技术构建并且编码至少一种异源基因的载体转化的细胞。本公开文本的宿主细胞较佳地具有哺乳动物来源;最佳地具有人或小鼠来源。相信本领域的技术人员有能力优先地确定最适合于其目的的特定宿主细胞系。示例性宿主细胞系包括但不限于CHO、DG44和DUXB11(中国仓鼠卵巢系,DHFR-)、HELA(人宫颈癌)、CVI(猴肾系)、COS(具有SV40 T抗原的CVI的衍生物)、R1610(中国仓鼠成纤维细胞)、BALBC/3T3(小鼠成纤维细胞)、HAK(仓鼠肾系)、SP2/O(小鼠骨髓瘤)、P3x63-Ag3.653(小鼠骨髓瘤)、BFA-1c1BPT(牛内皮细胞)、RAJI(人淋巴细胞)、

将本公开文本的核酸分子或载体引入宿主细胞中可以通过本领域的技术人员熟知的多种技术来完成。这些技术包括但不限于转染(包括电泳和电穿孔)、原生质粒融合、磷酸钙沈淀、与包膜DNA的细胞融合、显微注射和完整病毒感染。参见Ridgway,A.A.G.“Mammalian Expression Vectors”第24.2章,第470-472页Vectors,Rodriguez和Denhardt编(Butterworths,Boston,Mass.1988)。最佳地,通过电穿孔将质粒引入宿主中。使转化的细胞在适于产生轻链和重链的条件下生长,并测定重链和/或轻链蛋白质合成。示例性测定技术包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、或荧光激活细胞分选仪分析(FACS)、免疫组织化学等。

使包含本公开文本的分离的核酸分子或载体的宿主细胞在适当生长培养基中生长。如本文所用,术语“适当生长培养基”意指含有细胞生长所需营养素的培养基。细胞生长所需的营养素可以包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,培养基可含有一种或多种选择因子。任选地,培养基可含有小牛血清或胎牛血清(FCS)。在一个实施例中,培养基基本上不含IgG。生长培养基通常将例如通过药物选择或必需营养素的缺乏来选择含有DNA构建体的细胞,所述营养素通过DNA构建体上或与DNA构建体共转染的可选标记来补充。所培养的哺乳动物细胞通常在市售的含血清或无血清培养基(例如,MEM、DMEM、DMEM/F12)中生长。在一个实施例中,培养基是CDoptiCHO(Invitrogen,加利福尼亚州卡尔斯巴德)。在另一个实施例中,培养基是CD17(Invitrogen,加利福尼亚州卡尔斯巴德)。适合于所用特定细胞系的培养基的选择在本领域的技术人员的水平内。

V.多肽的制备

本公开文本还提供了由本公开文本的核酸分子编码的多肽。在其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的载体编码。在又其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的宿主细胞产生。

在其他实施例中,本公开文本还提供了产生具有凝血因子(例如,FVIII)活性的多肽的方法,其包括在产生具有凝血因子(例如,FVIII)活性的多肽的条件下培养本公开文本的宿主细胞,以及回收具有凝血因子(例如,FVIII)活性的多肽。在一些实施例中,具有凝血因子(例如,FVIII)活性的多肽的表达相对于在相同条件下培养但包含参考核苷酸序列(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所增加。

在其他实施例中,本公开文本提供了增加具有凝血因子(例如,FVIII)活性的多肽的表达的方法,其包括在由核酸分子表达具有凝血因子(例如,FVIII)活性的多肽的条件下培养本公开文本的宿主细胞,其中具有凝血因子(例如,FVIII)活性的多肽的表达相对于在相同条件下培养但包含参考核酸分子(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所增加。

在其他实施例中,本公开文本提供了改良具有凝血因子(例如,FVIII)活性的多肽的产量的方法,其包括在通过本文所公开的核酸分子产生具有凝血因子(例如,FVIII)活性的多肽的条件下培养宿主细胞,其中具有凝血因子(例如,FVIII)活性的多肽的产量相对于在相同条件下培养但包含参考核酸序列(例如,SEQ ID NO:16,亲代FVIII基因序列)的宿主细胞有所提高。

本公开文本的治疗性蛋白质(例如,凝血因子)可以在转基因动物(如啮齿类动物、山羊、绵羊、猪或牛)体内合成。术语“转基因动物”是指已经将外来基因并入基因组中的非人动物。因为这个基因是在种系组织中存在,其从亲代传递给后代。将外源基因引入单细胞胚胎中(Brinster等1985,Proc.Natl.Acad.Sci.USA 82:4438)。产生转基因动物的方法是本领域已知的,包括产生免疫球蛋白分子的转基因学(Wagner等1981,Proc.Natl.Acad.Sci.USA 78:6376;McKnight等1983,Cell 34:335;Brinster等1983,Nature 306:332;Ritchie等1984,Nature 312:517;Baldassarre等2003,Theriogenology59:831;Robl等2003,Theriogenology 59:107;Malassagne等2003,Xenotransplantation 10(3):267)。

VII.药物组合物

含有本公开文本的核酸分子、核酸分子编码的多肽、载体或宿主细胞的组合物可含有适宜的医药上可接受的载剂。例如,所述组合物可含有有助于将活性化合物加工成设计用于递送至作用位点的制剂的赋形剂和/或助剂。

在一个实施例中,本公开文本涉及药物组合物,其包含(a)本文所公开的核酸分子、载体、多肽或宿主细胞;和(b)医药上可接受的赋形剂。

在一些实施例中,药物组合物还包含递送剂。在某些实施例中,递送剂包含脂质纳米颗粒(LNP)。在其他实施例中,药物组合物还包含脂质体、其他聚合分子和外来体。

如本文所用,“脂质纳米颗粒”是指包含多个通过分子间力相互物理缔合的脂质分子的纳米颗粒。脂质纳米颗粒可以是例如微球体(包括单层和多层囊泡,例如脂质体)、乳液中的分散相、胶束或悬浮液中的内相。

在一些实施例中,本公开文本提供了包封的核酸分子组合物,其可以包括包封本发明的核酸分子的脂质纳米颗粒宿主。脂质纳米颗粒可以包含一种或多种脂质(例如,阳离子脂质、非阳离子脂质和PEG修饰的脂质)。在某些实施例中,本公开文本的脂质纳米颗粒配制为将本发明的一种或多种核酸分子递送至一种或多种靶细胞。适宜脂质的例子包括但不限于磷脂酰基化合物(例如,磷脂酰基乙醇胺、鞘脂、磷脂酰基胆碱、磷脂酰基丝氨酸、磷脂酰基甘油、神经节苷脂和脑苷脂)。“阳离子脂质”是指在某一pH(例如,生理pH)下携带净正电荷的任何脂质种类。

在某些实施例中,本公开文本的脂质纳米颗粒具有某一N/P比率。如本文所用,“N/P比率”或“NP比率”是指可带正电的聚合物胺基与带负电的核酸磷酸基的比率。脂质纳米颗粒/核酸分子复合物的N/P特征可以影响如表面净电荷、稳定性和大小等特性。如本文所述的脂质纳米颗粒的NP比率可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100和其间的任何比率。例如,如本文所述的脂质纳米颗粒的NP比率可以是约18、约36或约72。

因此,在某些实施例中,药物组合物包含包封于脂质纳米颗粒中的本公开文本的核酸分子以及医药上可接受的赋形剂。

药物组合物可经配制用于通过推注注射肠胃外施用(即静脉内、皮下或肌内)。注射用配制物能以单位剂型存在,例如在添加有防腐剂的安瓿中或多剂量容器中。组合物可采取如于油性或水性媒剂中的悬浮液、溶液或乳液等形式,并且含有如悬浮剂、稳定剂和/或分散剂等配制剂。可替代地,活性成分可呈粉末形式,用于用适宜媒剂(例如,无热原水)来构造。

适于肠胃外施用的配制物还包括呈水溶性形式(例如,水溶性盐)的活性化合物的水溶液。另外,可以施用作为适当油性注射悬浮液的活性化合物的悬浮液。适宜亲脂溶剂或媒剂包括脂肪油(例如,芝麻油)或合成脂肪酸酯(例如,油酸乙酯或甘油三酯)。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和葡聚糖。任选地,悬浮液还可以含有稳定剂。脂质体还可以用于包封本公开文本的分子,用于递送至细胞或间质空间中。示例性医药上可接受的载剂是生理上相容的溶剂、分散介体、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施例中,组合物包含等渗剂,例如糖、多元醇(如甘露醇、山梨醇)或氯化钠。在其他实施例中,组合物包含增强活性成分的贮存期限或有效性的医药上可接受的物质(如润湿剂)或少量辅助物质(如润湿剂或乳化剂、防腐剂或缓冲剂)。

本公开文本的组合物可以呈多种形式,包括例如液体(例如,可注射和可输注的溶液)、分散液、悬浮液、半固体和固体剂型。较佳形式取决于施用方式和治疗应用。

组合物可以配制为溶液、微乳液、分散液、脂质体或其他适于高药物浓度的有序结构。无菌可注射溶液可以通过以下方式制备:将活性成分以所需量并入视需要具有上文所列举成分中的一种或组合的适当溶剂中,之后过滤灭菌。通常,分散液是通过以下方式来制备:将活性成分并入无菌媒剂中,所述媒剂含有基础分散介体和来自上文所列举的那些成分的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,较佳制备方法是真空干燥和冷冻干燥,其从预先无菌过滤的溶液产生活性成分加上任何其他所需成分的粉末。可以例如通过以下方式维持溶液的适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。可注射组合物的延长吸收可以通过以下方式来实现:在组合物中包括延迟吸收的试剂,例如单硬脂酸盐和明胶。

活性成分可以用受控释放配制物或装置来配制。此类配制物和装置的例子包括植入物、经皮贴剂和微包封递送系统。可以使用生物可降解的生物兼容性聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备此类配制物和装置的方法是本领域已知的。参见例如,Sustained and Controlled Release Drug Delivery Systems,J.R.Robinson编,Marcel Dekker,Inc.,New York,1978。

可注射长效配制物可以通过以下方式来制备:形成药物于生物可降解聚合物(如聚丙交酯-聚乙交酯)中的微包封基质。根据药物与聚合物的比率以及所采用聚合物的性质,可以控制药物释放速率。其他示例性生物可降解聚合物是聚原酸酯和聚酐。可注射长效配制物还可以通过将药物捕集于脂质体或微乳液中来制备。

可以将补充性活性化合物并入组合物中。在一个实施例中,用凝血因子或其变异体、片段、类似物或衍生物配制本公开文本的核酸分子。例如,凝血因子包括但不限于因子V、因子VII、因子VIII、因子IX、因子X、因子XI、因子XII、因子XIII、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rsTF)或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。

可以调节剂量方案以提供最佳所需反应。例如,可以施用单次推注,可以随时间施用若干次分开剂量,或者可以如治疗情况的紧迫性所示的成比例地减少或增加剂量。有利的是以剂量单位形式配制肠胃外组合物,以便于施用和剂量均匀。参见例如,Remington'sPharmaceutical Sciences(Mack Pub.Co.,Easton,Pa.1980)。

除了活性化合物以外,液体剂型还可以含有惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和山梨聚糖的脂肪酸酯。

适宜药物载剂的非限制性例子也描述于E.W.Martin的Remington'sPharmaceutical Sciences中。赋形剂的一些例子包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、水稻、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂乳粉、甘油、丙烯、二醇、水、乙醇等。组合物还可以含有pH缓冲试剂以及润湿剂或乳化剂。

对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。

对于经颊施用,组合物可以采取根据常规方案的片剂或锭剂的形式。

对于通过吸入施用,根据本公开文本使用的化合物便捷地以含有或不含赋形剂的雾化气溶胶的形式或以气溶胶喷雾剂的形式从任选地具有推进剂的加压包或雾化器递送,所述推进剂是例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可以配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。

药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。

在一些实施例中,组合物是通过选自以下的途径来施用:局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服施用。肠胃外施用可以是静脉内或皮下施用。

VIII.治疗方法

在一些方面中,本公开文本涉及治疗有需要的受试者的疾病或病症的方法,其包括施用本文所公开的核酸分子、载体、多肽或药物组合物。

在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码治疗性蛋白质,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症影响选自以下的器官:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道及其任何组合。在一些实施例中,受试者患有选自以下的疾病或病症:DMD(杜氏肌营养不良)、XLMTM(X连锁肌小管性肌病)、帕金森病、SMA(脊髓性肌萎缩)、弗里德赖希共济失调、GUCY2D-LCA(利伯先天性黑矇)、XLRS(X连锁视网膜劈裂症)、AMD(年龄相关性黄斑变性)、ACHM(全色盲)、RPF65介导的IRD及其任何组合。

在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码miRNA,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症包含肌萎缩侧索硬化(ALS)、亨廷顿病和/或常染色体显性色素性视网膜炎。

在一些实施例中,核酸分子包含第一ITR、第二ITR和基因盒,其中基因盒编码靶序列,其中靶序列编码凝血因子,并且其中核酸分子用于治疗有需要的受试者的出血疾病或病症。出血疾病或病症选自出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤(trauma capitis)、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血及其任何组合。在仍其他实施例中,安排受试者进行手术。在又其他实施例中,治疗是预防性的或按需的。

本公开文本提供了治疗出血病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,出血病症的特征在于缺乏凝血因子(例如,FVIII)。在一些实施例中,出血病症是血友病。在一些实施例中,出血病症是血友病A。在治疗出血病症的方法的一些实施例中,在施用于后24小时,凝血因子(例如,FVIII)的血浆活性相对于施用参考核酸分子(例如,SEQ ID NO:16,亲代FVIII基因序列)、包含参考核酸分子的载体或参考核酸分子编码的多肽的受试者有所增加。

本公开文本还涉及治疗、改善或预防受试者的止血病症的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子或由本公开文本的核酸分子编码的具有凝血因子(例如,FVIII)活性的多肽。通过分离的核酸分子或所编码多肽进行的治疗、改善和预防可以是绕路疗法。接受绕路疗法的受试者可能已经产生针对凝血因子(例如,FVIII)的抑制剂,或者正在产生凝血因子抑制剂。

本公开文本的核酸分子、载体或多肽通过促进纤维蛋白凝块的形成治疗或预防止血病症。由本公开文本的核酸分子编码的具有凝血因子(例如,FVIII)活性的多肽可以激活凝结级联的成员。凝血因子可以是外在路径、固有路径或二者的参与者。

本公开文本的核酸分子、载体或多肽可用于治疗已知可用凝血因子治疗的止血病症。可使用本公开文本的方法治疗的止血病症包括但不限于血友病A、血友病B、血管性血友病、因子XI缺乏(PTA缺乏)、因子XII缺乏、以及纤维蛋白原、凝血酶原、因子V、因子VII、因子X或因子XIII的缺乏或结构异常、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。

在一些实施例中,止血病症是遗传性病症。在一个实施例中,受试者患有血友病A。在其他实施例中,止血病症是缺乏凝血因子的结果。在其他实施例中,止血病症是缺乏FVIII的结果。在其他实施例中,止血病症可能是缺陷性FVIII凝血因子的结果。

在另一个实施例中,止血病症可以是获得性病症。获得性病症可能源自潜在的继发性疾病或病症。无关病症可以是(作为例子但不限制)癌症、自身免疫疾病或妊娠。获得性病症可能源自衰老或源自治疗潜在继发性病症的药物疗法(例如,癌症化学疗法)。

本公开文本还涉及治疗未患止血病症或导致获得止血病症的继发性疾病或病症的受试者的方法。本公开文本因此涉及治疗需要通用止血剂的受试者的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子、载体或多肽。例如,在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的分离的核酸分子、载体或多肽可以作为预防药在手术之前或之后施用。本公开文本的分离的核酸分子、载体或多肽可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除或干细胞移植。

在另一个实施例中,本公开文本的分离的核酸分子、载体或多肽可以用于治疗患有急性出血发作但未患止血病症的受试者。急性出血发作可能源自严重创伤(例如,手术)、车祸、伤口、枪击撕裂(laceration gun shot)或导致不受控制的出血的任何其他创伤性事件。

分离的核酸分子、载体或蛋白质可以用于预防性治疗患有止血病症的受试者。分离的核酸分子、载体或蛋白质可以用于治疗患有止血病症的受试者的急性出血发作。

在另一个实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白不诱导受试者的免疫应答。在一些实施例中,免疫应答包含产生针对凝血因子的抗体。在一个实施例中,免疫应答包含产生针对FVIII的抗体。在一些实施例中,免疫应答包含细胞因子分泌。在一些实施例中,免疫应答包含激活B细胞、T细胞或B细胞和T细胞二者。在一些实施例中,免疫应答是抑制性免疫应答,其中相对于未产生免疫应答的受试者的凝血因子的活性,受试者的免疫应答降低凝血因子蛋白的活性。在某些实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白预防针对凝血因子蛋白或从分离的核酸分子或载体表达的凝血因子蛋白的抑制性免疫应答。

在一些实施例中,本公开文本的分离的核酸分子、载体或蛋白质组合物与至少一种促进止血的其他药剂组合施用。促进止血的所述其他药剂是具有已证实的凝血活性的治疗剂。作为例子但不限制,止血剂可以包括FV、FVII、FIX、FX、FXI、FXII、FXIII、凝血酶原或纤维蛋白原或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。

在本公开文本的一个实施例中,组合物(例如,分离的核酸分子、载体或多肽)是凝血因子在施用于受试者时以可激活的形式存在的组合物。这种可激活的分子可以在施用于受试者后在体内于凝血位点被激活。

因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病A的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码因子VIII的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

本公开文本还提供了治疗肝脏代谢病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,肝脏代谢病症选自苯丙酮尿(

图7E显示了来自用含有鼠类PAH转基因和B19d135或GPCd165 ITR的ssDNA处理的PKU小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用M2抗FLAG抗体侦检FLAG标记的鼠类PAH蛋白,并且包括GAPDH上样对照以供比较。

)、尿素循环疾病(例如,缺乏转胺甲酰酶(OTC)或精胺琥珀酸合成酶(ASS))、溶酶体贮积病症(例如,粘多糖贮积症)和糖原贮积病(例如,I、II、III、IV型糖原贮积病)。其他肝脏代谢病症包括但不限于威尔森病(Wilson’s disease)、α-1抗胰蛋白酶缺乏、妊娠期同种免疫肝病(GALD)、脂肪酸氧化缺陷、半乳糖血症、脂质贮积病、酪氨酸血症和过氧化物酶体病症。

在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列,其中第一ITR和/或第二ITR是非腺相关病毒(非AAV)的ITR。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶(PAH)的异源多核苷酸序列,其中第一ITR和/或第二ITR包含SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(PKU)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(ITR)和第二ITR,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一ITR和/或第二ITR包含与SEQ ID NO:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。

分离的核酸分子、载体或多肽可以用以下方式施用:静脉内、皮下、肌内或通过任何粘膜表面,例如口服、舌下、经颊、舌下、经鼻、经直肠、经阴道或通过经肺途径。可以将凝血因子蛋白植入生物聚合物固相支持体内或与所述固相支持体连接,从而允许将嵌合蛋白缓慢释放至所需位点。

对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。

对于经颊和舌下施用,组合物可以采取根据常规方案的片剂、锭剂或速溶薄膜的形式。

对于通过吸入施用,根据本公开文本使用的具有凝血因子活性的多肽便捷地以气溶胶喷雾剂的形式从具有适宜推进剂(例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体)的加压包或雾化器(例如,于PBS中)递送。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。

在一个实施例中,分离的核酸分子、载体或多肽的施用途径是肠胃外的。如本文所用的术语肠胃外包括静脉内、动脉内、腹膜内、肌内、皮下、直肠或阴道施用。肠胃外施用的静脉内形式是较佳的。虽然所有这些施用形式都明确地考虑在本公开文本的范围内,但是施用形式可以是注射用溶液,特别是用于静脉内或动脉内注射或滴注。通常,适于注射的药物组合物可以包含缓冲液(例如乙酸盐、磷酸盐或柠檬酸盐缓冲液)、表面活性剂(例如聚山梨醇酯)、任选地稳定剂(例如人白蛋白)等。然而,在与本文的传授内容兼容的其他方法中,可以将分离的核酸分子、载体或多肽直接递送至不良细胞群的位点,由此增加患病组织对治疗剂的暴露。

用于肠胃外施用的制剂包括无菌的水性或非水性溶液、悬浮液和乳液。非水性溶剂的例子是丙二醇、聚乙二醇、植物油如橄榄油、以及可注射的有机酯如油酸乙酯。水性载剂包括水、醇性/水性溶液、乳液或悬浮液,包括盐水和缓冲介体。在本公开文本中,医药上可接受的载剂包括但不限于0.01-0.1M且较佳地0.05M磷酸盐缓冲液或0.8%盐水。其他常见肠胃外媒剂包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏液或固定油。静脉内媒剂包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。也可以存在防腐剂和其他添加剂,如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。

更具体地,适于注射使用的药物组合物包括无菌的水性溶液(水溶性的)或分散液、以及用于临时制备无菌可注射溶液或分散液的无菌粉末。在此类情况下,组合物必须是无菌的并且应当是易于注射的程度的流体。其在制造和储存条件下应当稳定,并且将较佳地抵抗微生物(如细菌和真菌)的污染作用而保存。载剂可以是溶剂或分散介体,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)及其适宜混合物。可以例如通过以下方式维持适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。

药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。

用于治疗病症的本公开文本的组合物的有效剂量根据许多不同因素而变化,所述因素包括施用方式、靶位点、患者的生理状态、患者是人还是动物、所施用的其他药物以及治疗是预防性的还是治疗性的。通常,患者是人,但是也可治疗非人哺乳动物,包括转基因哺乳动物。治疗剂量可使用本领域的技术人员已知的常规方法逐步增加,以优化安全性和功效。

本公开文本的核酸分子、载体或多肽可以任选地与在需要治疗(例如,预防性或治疗性)的病症或病症的治疗中有效的其他药剂组合施用。

如本文所用,与辅助疗法结合或组合的本公开文本的分离的核酸分子、载体或多肽的施用意指依序、同时、同延、并行、伴随或同期施用或施用所述疗法和所公开多肽。本领域的技术人员应了解,组合治疗方案中各种组分的施用或施用可以定时以增强治疗的整体有效性。基于所选辅助疗法和本说明书的传授内容,熟习此项技术者(例如,医师)在不进行过度实验的情况下便能够容易地辨别有效的组合治疗方案。

应进一步了解,本公开文本的分离的核酸分子、载体或多肽可以与一种或多种药剂结合或组合使用(例如,以提供组合治疗方案)。本公开文本的多肽或多核苷酸可以组合的示例性药剂包括代表用于所治疗的特定病症的当前护理标准的药剂。此类药剂在本质上可以是化学的或生物的。术语“生物剂(biologic)”或“生物剂(biologic agent)”是指预期用作治疗剂的从活的生物体和/或其产物制备的任何药学活性剂。

要与本公开文本的多核苷酸或多肽组合使用的药剂的量可以随受试者变化,或者可以根据本领域的知识来施用。参见例如,Bruce A Chabner等,Antineoplastic Agents,于Goodman&Gilman's The Pharmacological Basis of Therapeutics 1233-1287(JoelG.Hardman等编,第9版1996).。在另一个实施例中,施用符合护理标准的量的这种药剂。

在一个实施例中,本文还公开了套组,其包含本文所公开的核酸分子以及将核酸分子施用于有需要的受试者的说明书。在另一个实施例中,本文公开了用于产生本文所提供的核酸分子的杆状病毒系统。核酸分子是在昆虫细胞中产生。在另一个实施例中,提供了表达构建体的纳米颗粒递送系统。表达构建体包含本文所公开的核酸分子。

IX.基因疗法

本公开文本的某些方面提供了在受试者体内表达基因构建体的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在一些方面中,本公开文本提供了增加受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在其他方面中,本公开文本提供了调节有需要的受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含miRNA的核酸序列)施用于受试者。在一些方面中,本公开文本提供了下调有需要的受试者体内靶基因的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含miRNA的核酸序列)施用于受试者。

已经探索出体基因疗法作为多种病症的可能的治疗,所述病症包括但不限于血友病A。基因疗法是血友病的非常有吸引力的治疗,因为其可能在载体的单次施用于后通过连续内源性产生凝血因子(例如,FVIII)治愈所述疾病。血友病A非常适合于基因替代方法,因为其临床表达可完全归因于缺少以微小量(200ng/ml)在血浆中循环的单一基因产物(例如,FVIII)。

已经显示使用常规的基于病毒的基因递送诱导人的免疫应答。病毒衣壳蛋白可触发人免疫系统的多种组分。基于AAV的基因递送一直是有吸引力的,因为AAV是人群中的常见病毒,大多数人已经暴露于AAV,并且已经显示AAV的免疫原性低于例如腺病毒。因此,大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括NAb和T细胞,它们可降低随后用AAV再感染的临床功效和/或已经被转导的细胞的消除,这使具有预先存在的抗AAV免疫力的患者没有资格接受基于AVV的基因疗法治疗。本公开文本的核酸分子可用于基于非病毒的基因疗法。由于使用本公开文本的核酸分子的基因递送不需要病毒衣壳,所以除非之后向受试者再次施用(或再次给药),否则不会产生针对病毒组分的免疫力。因此,本公开文本的核酸分子允许长期基因递送策略的再次给药。

另外,如本文所述,本公开文本的核酸分子包含非AAV细小病毒ITR,所述ITR侧接于基因盒以在施用后驱动稳定的转基因表达。ITR的存在是稳定的转基因表达所必需的,如图5中所示,其中不含ITR的核酸不能实现稳定的转基因表达(参见,“无ITR的dsDNA”和“微环”)。

本公开文本的凝血因子蛋白可以在哺乳动物(例如,人患者)体内产生,使用基因治疗方法对于选自以下的出血疾病或病症的治疗将是治疗上有益的:出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一个实施例中,出血疾病或病症是血友病。在另一个实施例中,出血疾病或病症是血友病A。

其他病症也适于使用本文所公开的核酸分子治疗。在某些实施例中,使用本文所述方法治疗影响选自以下的靶器官的疾病或病症:肌肉、中枢神经系统(CNS)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些实施例中,使用本文所述方法治疗选自以下的疾病或病症:DMD(杜氏肌营养不良)、XLMTM(X连锁肌小管性肌病)、帕金森病、SMA(脊髓性肌萎缩)、弗里德赖希共济失调、GUCY2D-LCA(利伯先天性黑矇)、XLRS(X连锁视网膜劈裂症)、AMD(年龄相关性黄斑变性)、ACHM(全色盲)、RPF65介导的IRD(表9)。

表9.可通过本文所公开的方法治疗的疾病和病症。

1:SOD1基因的突变占遗传性ALS病例的20%。野生型SOD1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体SOD1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的SOD1表达可能在ALS中抑制运动神经元变性。2:HD是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。HTT含有重复多次的三个DNA碱基(胞嘧啶-腺嘌呤-鸟嘌呤(CAG))的序列(即...CAGCAGCAG...),称为三核苷酸重复。CAG是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列CAG导致产生称为聚谷氨酰胺段(或聚Q段)的谷氨酰胺链以及基因的重复部分聚Q区。通常,人们在聚Q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mHTT),增加某些神经元类型的衰变率。通常,CAG重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改HD机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,HD具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型HD、运动不能-僵硬或韦斯特法尔(Westphal)变异体HD。这种情况占HD载剂的约7%。3:大多数导致色素性视网膜炎的RHO基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。

在一些实施例中,使用本文所述方法治疗溶酶体贮积病症。在一些实施例中,溶酶体贮积病症选自MLD(异染性脑白质营养不良)、MPS(粘多糖贮积症)、PKU(苯丙酮尿症)、庞贝糖原贮积病II型或其任何组合。

在一些实施例中,本文所述方法用于微小RNA(miRNA)疗法中。在一些实施例中,miRNA治疗因基因或蛋白质过表达而引起的病症。在一些实施例中,miRNA治疗因蛋白质积累而引起的病症。在一些实施例中,miRNA治疗因基因或蛋白质错误表达而引起的病症。在一些实施例中,miRNA治疗因突变体基因表达而引起的病症。在一些实施例中,miRNA治疗因异源基因表达而引起的病症。在某些实施例中,miRNA疗法治疗选自以下的病症:ALS(肌萎缩侧索硬化)、亨廷顿病、AdRP(常染色体显性色素性视网膜炎)及其任何组合。在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗ALS,其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向SOD1的表达。在某些实施例中,miRNA包含Dirren等,Annals of Clinical and Translational Neurology 2(2):167-84(2015年2月)披露的miR SOD1人工miRNA。SOD1基因的突变占遗传性ALS病例的20%。野生型SOD1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体SOD1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的SOD1表达可能在ALS中抑制运动神经元变性。

在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗亨廷顿病,其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向HTT的表达。在某些实施例中,miRNA包含Evers等,Molecular Therapy26(9):1-15(印刷版之前的电子版,2018年6月)披露的miHTT工程化的miRNA。亨廷顿病是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。HTT含有重复多次的三个DNA碱基(胞嘧啶-腺嘌呤-鸟嘌呤(CAG))的序列(即...CAGCAGCAG...),其被称为三核苷酸重复。CAG是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列的这些重复导致产生称为聚谷氨酰胺段(或聚Q段)的谷氨酰胺链以及基因的重复部分聚Q区。通常,人们在聚Q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mHTT),增加某些神经元类型的衰变率。通常,CAG重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改亨廷顿病机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,亨廷顿病具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型亨廷顿病、运动不能-僵硬或韦斯特法尔变异体亨廷顿病。这种情况占亨廷顿病载剂的约7%。

在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗常染色体显性色素性视网膜炎(AdRP),其中核酸分子包含编码miRNA的基因盒,其中miRNA靶向RHO(视紫质)的表达。在某些实施例中,miRNA包含miR-708(参见Behrman等,JCB192(6):919-27(2011))。大多数导致色素性视网膜炎的RHO基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。

本文所述的所有各个方面、实施例和选择都能以任何和所有变化组合。

本说明书中所提到的所有出版物、专利和专利申请都通过引用并入本文,并入程度如同指示每个单独出版物、专利或专利申请明确且单独地通过引用并入一般。

已经一般性地描述了本公开文本,通过参考本文所提供的实例可以获得进一步的理解。这些实例仅用于说明的目的,而不旨在是限制性的。

实施例

实施例1.带有AAV和非AAV细小病毒ITR的FVIII表达构建体的产生。

实例1a.将密码子优化的FVIII基因和来自AAV的反向末端重复(ITR)区克隆至基因盒中。

FVIII基因盒是基于AAV血清型2的基因组来产生。然而,源自任何血清型(包括合成的)的ITR区可以用于这种方法中(图1A)。

设计在肝脏特异性启动子(TTPp)或泛在启动子(CAGp,图1A和1B)调控下编码侧接有来自AAV的反向末端重复(ITR)区的密码子优化的FVIII编码序列(AAV-FVIII)的表达质粒AAV2-FVIIIco6XTEN用于体外和体内表达,如图1C中所示。基因盒还含有WPRE和bGHpA组件用于转基因的最佳表达(图1A-1C)。将ITR侧接的密码子优化的FVIII序列克隆至包含ColE1复制起点和赋予氨苄青霉素抗性的β-内酰胺酶的表达盒的质粒骨架中(图1C)。侧接于表达盒的限制性内切核酸酶PvuII的识别位点经工程化以允许在PvuII消化时准确切除AAV-FVIII构建体(图1C)。

实例1b.将密码子优化的FVIII基因和来自非AAV细小病毒的反向末端重复(ITR)区克隆至基因盒中。

基于AAV所属的病毒科细小病毒科的成员之间的种系发生关系(图2A),假设依赖病毒属的其他非AAV成员和红病毒属的成员利用类似的细胞机制维持病毒生命周期并建立持久的潜在性感染。因此,可以利用源自这些病毒的基因组的ITR区研发AAV样(但并非基于AAV)基因表达盒。测试以下细小病毒的ITR区对研发用于基因疗法应用的基因构建体的适合性:依赖病毒属鹅细小病毒(GPV)株B和红病毒属B19细小病毒(图2A)。

细小病毒ITR区在质粒载体于细菌细胞中繁殖期间的不稳定性对基因构建体的产生和操作造成挑战。已经成功产生一些含有全长AAV2 ITR(145nt)的基因构建体,但是这些构建体非常不稳定,并且大多数基于AAV2 ITR的质粒含有ITR区的截短的130nt形式(例示于表1中)。类似地,所产生的带有B19 ITR和GPV ITR二者的全长序列的质粒构建体在细菌宿主中展现高度不稳定性(数据未显示),这显著限制了这些ITR对于研发用于基因疗法应用的基因载体的实用性。

先前已经研发出用于拯救带有ITR的截短形式的重组B19病毒的反求遗传学系统(Manaresi等Virology 508(2017):54-62)(表2B,ITR ID:B19d135)。因此,利用B19d135ITR产生遗传上稳定的FVIII表达质粒B19-FVIIIco6XTEN(图1D)。为了进一步利用这种方法合成基于GPV ITR的构建体,比较B19 ITR、GPV ITR和AAV2 ITR的全长野生型序列(图3A)。分别基于与B19 ITR和AVV2 ITR序列中对于ITR功能非必要的前135个和前15个核苷酸的同源性,假设可以去除GPV ITR的前162个核苷酸以合成具有完整功能的ITR(图3A,加框序列)的稳定基因构建体。因此,与带有相应ITR的截短形式的构建体AAV2-FVIIIco6XTEN和B19-FVIIIco6XTEN类似,使用GPVd162(表2C)产生稳定FVIII表达质粒构建体GPV-FVIIIco6XTEN(图1E)。值得注意的是,全长B19 ITR和GPV ITR二者都比全长AAV2 ITR长得多(表1),并且不会形成AAV ITR的独特的T形发夹结构(图2B)。

含有全长B19 ITR序列的质粒在细菌宿主细胞中展现高度不稳定性,因为可能产生仅含有3’ITR的FVIIIco6XTEN表达构建体。使用标准分子克隆技术,可能无法获得含有5’和3’全长B19 ITR二者的阳性克隆。为了产生侧接有全长B19 ITR的FVIIIco6XTEN表达构建体B19wt-FVIIIco6XTEN(图1F),使用特定宿主大肠杆菌菌株PMC103。PMC103含有基因sbcC的缺失,所述基因编码识别并消除十字形DNA结构的外切核酸酶。不受理论束缚,认为使用缺少sbcC的菌株PMC103可允许复制长回文序列(即,含有复杂二级结构的序列)并成功克隆B19wt-FVIIIco6XTEN以及GPVwt-FVIIIco6XTEN。所得质粒编码383个碱基对的野生型B195’和3’ITR序列(表2D),并且另一种质粒编码444个碱基对的野生型GPV 5’和3’ITR序列(表2F)。

如实例1a中所述产生含有侧接有非AAV细小病毒ITR(B19d135、GPVd162和B19wt)的FVIII表达盒的质粒B19-FVIIIco6XTEN(图1D;表2B)、GPV-FVIIIco6XTEN(图1E;表2C)和B19wt-FVIIIco6XTEN(图1F,表2D)。使用限制性内切核酸酶LguI的识别位点侧接于所有FVIII表达盒(图1D-1F)。

实例1c.含有侧接有AAV和非AAV细小病毒ITR的FVIII表达盒的单链DNA片段的制备。

假设侧接于FVIII表达盒的ITR区内发夹结构的形成会驱动靶细胞的持久转导。对于概念验证研究,分别用PvuII和LguI消化基于AAV ITR的质粒AAV2-FVIIIco6XTEN以及基于非AAV ITR的质粒B19-FVIIIco6XTEN和GPV-FVIIIco6XTEN。具有形成的发夹ITR结构的单链(ss)AAV-FVIII、B19-FVIII或GPV-FVIII片段是通过以下方式来产生:在95℃下使PvuII或LguI消化的双链DNA片段产物(FVIII表达盒和质粒骨架)变性,然后在4℃下冷却以允许回文ITR序列折叠(图1A-1B)。在HemA(血友病A)小鼠模型中测试所得ssAAV-FVIII、ssB19-FVIII或ssGPV-FVIII建立肝细胞的持久转导的能力。

实例1d.使用杆状病毒表达系统产生FVIII表达构建体。

将利用描述于Li等,PLoS ONE 8(8):e69879(2013)中的杆状病毒表达系统在昆虫细胞中产生呈闭端DNA(ceDNA)分子形式的AAV-FVIII、B19-FVIII和GPV-FVIII构建体。已经证实ceDNA表达盒的全身递送建立肝细胞的持久转导,并驱动肝脏中的稳定长期转基因表达。

实例2.在HemA小鼠体内,包含侧接有AAV和非AAV细小病毒ITR的FVIII表达盒的基因构建体的全身注射导致长期FVIII表达。

实例2a.ssAAV-FVIII介导的FVIII表达的体内评价。

为了验证带有AAV ITR区的ssAAV-FVIII在体内介导持久转基因表达的能力,在5-12周龄血友病A(HemA)小鼠(4只动物/组)中以5μg、10μg、20μg ssDNA基因表达盒(ssAAV-FVIII)通过流体力学注射全身递送所述基因表达盒(图4A)。HDI导致所注射材料主要递送至实验动物的肝脏中。在单次流体力学注射ssAAV-FVIII后18小时、3天、2周、3周、1个月、2个月、3个月和4个月,从实验动物收集血浆样品。通过生色FVIII活性测定分析血液中的FVIII血浆活性。用5μg/小鼠的亲代表达质粒注射的对照动物在施用后不久即显示高FVIII血浆活性水平。然而,循环FVIII的水平快速下降,并且截至注射后(p.i.)15天变得无法侦检。相比之下,用5、10和20μg/小鼠的ssAAV-FVIII注射的实验动物产生了转基因的长期表达,循环FVIII的稳定水平分别为正常FVIII水平的约8%、16%和32%(图4A)。观察到强剂量反应,表明所注射剂量与治疗结果之间高度相关。

实例2b.ssB19-FVIII和ssGPV-FVIII介导的FVIII表达的体内评价。

为了评价来自分别带有非AAV细小病毒ITR区B19d135和GPVd162的ssB19-FVIII和ssGPV-FVIII的FVIII的体内表达,在5-12周龄血友病A(HemA)小鼠体内通过HDI全身递送10或20μg/小鼠的ssB19-FVIII以及10或50μg/小鼠的ssGPV-FVIII基因表达盒。在注射后1、3、7、14、21、28、42、56、84、112、140和168天收集血液样品,并通过生色FVIII活性测定分析血液中的FVIII活性。如在AAV-FVIII构建体的情况下所观察到的,用5μg/小鼠的亲代FVIII表达质粒注射的对照动物在注射后24小时显示高FVIII血浆活性水平,其快速下降,并且截至注射后14天变得无法侦检。用ssB19-FVIII注射的实验动物在注射后3天显示峰值FVIII血浆活性,其然后在21天期间逐渐下降,并且在注射后28天左右稳定。(图4B)另一方面,用ssGPV-FVIII注射的HemA小鼠在第112天左右产生稳定的FVIII血浆活性水平,其在剩余观察阶段期间维持(图4C)。值得注意的是,用10μg/小鼠的ssAAV-FVIII(图4A)或ssGPV-FVIII(图4C)注射的动物产生了非常相似的稳定FVIII血浆活性水平,表明AAV2 ITR和GPV ITR区二者都包含有效建立靶细胞的持久转导所需的遗传因子。

实例2c.FVIII在hemA小鼠体内的稳定长期表达的ITR和发夹需求的体内评价。

为了比较单链DNA盒与替代核酸治疗剂的稳定性和长期表达,用PvuII或AflII消化FVIIIco6XTEN质粒构建体(图1A)以产生具有或不具有AAV ITR序列的双链线性DNA。纯化不具有ITR的线性双链DNA以产生‘无ITR的dsDNA’构建体。最后,通过重迭AflII识别位点连接纯化的不具有ITR的dsDNA,导致形成微环DNA。这种小环状质粒样DNA构建体缺乏任何细菌序列和/或ITR序列。通过流体力学注射用等摩尔浓度的DNA构建体注射HemA小鼠,并根据在2-4个月期间收集的血浆确定FVIII活性水平。所有DNA构建体都产生了在30%-60%正常范围内的初始治疗水平的FVIII,然而,只有单链DNA在注射后持续4个月显示32%的转基因表达的稳定持久性(图5)。所有双链DNA和微环DNA都在第14-42天达到了6%-10%正常值的稳定表达水平,然而,这些平台期仅代表所观察到的初始FVIII活性的10%。因为瞬时升高水平的FVIII表达可以导致形成中和抗药物抗体,因此在血友病A环境中的免疫耐受性需要稳定表达。

实例2d.野生型与衍生B19 ITR的体内比较。

为了比较B19衍生ITR(B19d135,图1D,表2C)与全长B19 ITR(表2C)的作用,产生侧接有248个碱基对的ITR(图1F)的FVIIIco6XTEN表达盒。用30μg侧接有B19d135(图1D)、GPVd165(图1E)或野生型B19 ITR(图1F)的单链FVIII-DNA流体力学注射血友病A小鼠。在注射后3、7、14、21、28和35天收集所有群组的血浆,B19d135和GPVd165构建体的其他样品在第42天、第55天和第84天采集,并通过生色测定分析FVIII活性(图6)。与衍生B19 ITR相比,全长ITR导致FVIII表达增加约2.5倍。此外,来自野生型ITR的FVIII的表达一开始稳定。

实例2e.体内单链裸DNA的再次施用的评价。

当前基因治疗方式的关键限制是由于形成针对基因疗法载体的病毒衣壳的抗药物抗体而无法再次施用治疗剂。然而,不存在免疫原性蛋白质的基因疗法系统可以再次给药,以使患者逐步增加至所需治疗水平。为了评价我们的侧接非AAV ITR的单链盒是否可以再次施用,在第0天和第35天用30μg含有B19d135 ITR和GPVd165 ITR的ssDNA注射hemA小鼠(图6)。在观察的第一个月期间,施用GPVd165-FVIII的小鼠达到了大约5%正常值的稳定FVIII水平。在ssDNA的第二剂量后,FVIII水平上升至10%,之后略有下降,显示FVIII水平的2倍增加。在第一周期间,施用B19d135-FVIII的小鼠达到了8%的稳定FVIII水平,其上升约3.5倍至30%,之后下降至25%。这些数据证实,在血友病A小鼠体内,再次施用具有非AAVITR的单链DNA可以增加FVIII的稳定表达水平。

实例3.带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的FVIII表达构建体的产生和体内评价。

实例3a.B19 ITR和GPV ITR的最小必需序列的确定。

基于依赖病毒属AAV2和GPV以及红病毒属B19的ITR序列之间的比较(Gene Bank登录号分别为NC_001401.2、U25749.1和KY940273.1),设计用带有此类ITR的基因构建体持久转导真核细胞所需的GPV和B19细小病毒ITR的最小序列,其具有或不具有其他序列(间隔子、插入、倒位、添加和/或用其他细小病毒ITR的野生型序列重组)(图3A和3B)。AAV2 ITR、GPV ITR和B19 ITR的序列比对揭示了所有三种病毒物种之间的保守区B19v1和GPVv1(呈现于表2A-2C中),其作为连续序列而不含可变序列的间隔子区。同样,基于B19 ITR与GPV ITR之间的序列比较设计最小必需序列变异体B19v3和GPVv3。由于带有GPVd162 ITR的FVIII表达构建体在体内实验中的表达优于带有B19d135 ITR的基因构建体,假设B19v3序列包含在B19 ITR与GPV ITR序列之间保守的最小B19 ITR序列区,并且GPVv3序列包含在GPV ITR序列中存在并且在B19 ITR序列中缺少的最小GPV ITR序列区(表2B和2C)。序列B19v2和GPVv2分别是通过排除B19ITR和GPV ITR序列的ITR回文序列区中前135个和前162个核苷酸以及相应互补的135个和162个核苷酸来产生(表2B和2C)。

实例3b.B19 ITR和GPV ITR及其衍生物的回文区在功能性基因构建体上的定向。

细小病毒ITR的一部分是由自我互补的回文区组成。先前已证实,对于重组感染性B19细小病毒,所拯救的带有呈正向和反向定向的回文区的病毒展现类似的生长特性(Manaresi等Virology 508(2017):54-62)。因此,提出不管此类ITR的回文区关于基因表达盒是呈5’和3’ITR组合的正向、反向或任何可能组合,带有B19 ITR和GPV ITR及其衍生物的基因表达构建体保持功能性。为了验证这个假设,将使用相同物种ITR的相同以及反向的互补序列,将B19d135 ITR和GPVd162 ITR以及野生型B19 ITR和GPV ITR以正向、反向和倒转定向并入FVIIIco6XTEN表达盒中。将产生来自这些质粒的单链DNA并如实例2a、2b和2d中所述在血友病A小鼠体内测试由TTPp启动子驱动的肝脏定向的FVIII表达。除了研究相同物种ITR的所有定向以外,还将产生GPV和B19野生型ITR及其衍生物的组合并在血友病A小鼠体内测试FVIII表达。这些表达盒将含有1个B19来源的ITR和1个GPV来源的ITR,以确定非同源ITR序列是否可以增强所需转基因的附加型连环化以及长期表达。将通过流体力学注射用10、20或50μg含有前述表达盒的ssDNA注射血友病A小鼠,并且将从在注射后以每周间隔收集的鼠类血浆量测FVIII。将对施用这些表达盒的小鼠体内的FVIII表达和寿命的影响与施用B19d135、GPVd162和相应野生型ITR表达盒的小鼠体内的FVIII表达和寿命进行直接比较(表2B、2C、2D和2F)。

实例3c.在HemA小鼠体内带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的基因构建体的全身注射。

为了评价来自带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ssDNA构建体的FVIII体内表达,将在5-12周龄HemA小鼠体内通过HDI全身递送5、10、20或50μg/小鼠的每种ssDNA基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。

实例4.带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA表达构建体在昆虫细胞中的产生和体内评价。

实例4a.使用杆状病毒表达系统产生带有B19d135 ITR和GPVd162 ITR的ceDNA表达构建体。

与实例1d中所述的AAV-FVIII、B19-FVIII和GPV-FVIII构建体类似,将使用杆状病毒表达系统在昆虫细胞中产生呈ceDNA形式的带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的基因构建体的FVIII表达。

实例4b.在HemA小鼠体内带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA表达构建体的全身注射。

为了评价来自带有B19d135和GPVd162非AAV细小病毒ITR的衍生物的ceDNA构建体的FVIII体内表达,将在5-12周龄HemA小鼠体内通过HDI全身递送5、10、20或50μg/小鼠的每种ceDNA基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。

实例5.ssDNA和ceDNAFVIII表达构建体的脂质纳米颗粒配制物的产生。

在如实例1和4中所述产生每种ssDNA或ceDNA后,将使用适当的脂质组合物通过微流体混合将每种基因构建体配制到脂质纳米颗粒(LNP)中(LNP-ssDNA和LNP-ceDNA)。将调节脂质与DNA的比率(N/P)以优化细胞转导和FVIII表达。将使用配制到LNP中的编码侧接有AAV或非AAV细小病毒ITR的FVIII表达盒的亲代质粒作为转导效率的对照。

实例6.LNP-ssDNA和LNP-ceDNA的体外和体内评价。

实例6a.在所培养肝细胞中ssDNA和ceDNA介导的FVIII表达的体外评价。

如实例5中所述将ssDNA或ceDNA FVIII表达基因构建体和相应的亲代对照质粒配制到LNP中用于靶向基因递送。将Huh7细胞以1x 10

另外,文献中已经显示,细胞组蛋白沿rAAV附加体规则定位,从而产生与细胞染色体DNA核小体模式类似的染色质样结构。因此,还将通过Southern印迹来评估这些构建体建立持久转导靶细胞所需的染色质样核小体结构的能力。

实例6b.在HemA小鼠体内在静脉内施用后对LNP配制的ssDNA和ceDNA介导的长期FVIII表达的评价。

将以5、10、20、40、100ug/小鼠通过IV注射将LNP-ssDNA、LNP-ceDNA或LNP-pDNA(质粒对照)施用于5-12周龄HemA小鼠,N=4/组。将在注射后48小时开始长达6个月中的所选时间点收集血液样品,并将通过生色FVIII活性测定分析血液中的FVIII活性。将针对实例1和4中所述的每种基因构建体比较用LNP-ssDNA或LNP-ceDNA处理的小鼠体内的FVIII表达谱与用LNP-pDNA处理的小鼠的FVIII表达谱。

实例6c.在加强注射后ssDNA或ceDNA介导的FVIII表达的体内评价。

将在初始注射后2个月向实例6b中用LNP-ssDNA或LNP-ceDNA处理的小鼠的亚组施用相同剂量的相应LNP的额外IV注射加强。将在加强注射后48小时开始长达6个月中的所选时间点收集血液样品。将通过生色FVIII活性测定分析血液中的FVIII活性。将用LNP-ssDNA或LNP-ceDNA处理的小鼠体内的FVIII表达谱与用相应LNP-pDNA处理的小鼠的FVIII表达谱进行比较。

实例7.带有B19或GPV来源的ITR的基因表达构建体在基因疗法中的一般使用的实用性。

实例7a.带有B19或GPV来源的ITR的报告基因构建体的产生。

为了证实基于非AAV ITR的基因表达系统作为平台在基因疗法应用中的一般使用的实用性,基于实例1b中所述的构建体用侧接有B19d135 ITR或GPVd162 ITR的绿色荧光蛋白(GFP)或荧光素酶(luc)产生包含表达盒的报告基因构建体。因此,通过常规分子克隆技术用GFP或luc的ORF替代B19-FVIIIco6XTEN(图1C)和GPV-FVIIIco6XTEN(图1D)中FVIII的开放阅读框(ORF)。

还产生含有鼠类苯丙氨酸羟化酶(PAH)转基因的侧接有B19d135 ITR或GPVd162ITR的表达盒(图7A),使用其在苯丙酮尿的相关小鼠模型中评价PAH表达和血液苯丙氨酸浓度的降低。使用这个模型,通过流体力学注射将200μg侧接有非AAV ITR的ssDNA施用于PKU小鼠(n=3)用于肝脏表达。在第3、7、14、28、42、56、70和81天收集血液样品,并分离血浆用于苯丙氨酸浓度确定(图7B-7C)。接受含有B19d135 ITR的表达盒的小鼠在第3天展现苯丙氨酸水平从370μg/ml至210μg/ml的下降,所述水平稳定维持至第81天(图7B)。接受GPVd162ITR盒的小鼠在第14天显示血液苯丙氨酸水平从350μg/ml至310μg/ml的下降,所述水平继续下降至截至第42天的250μg/ml的稳定水平(图7C)。血液苯丙氨酸浓度的这些下降代表与注射前浓度相比45%和30%的降低(图7D)。为了确认鼠类PAH蛋白在肝脏中的存在,对在注射后第81天取自所处理小鼠的肝脏裂解物进行蛋白质印迹。使用抗FLAG标签抗体侦检鼠类PAH蛋白,图7E显示在6只所处理动物的5只中可侦检的鼠类PAH蛋白,并且在用含有B19d135ITR的ssDNA处理的小鼠体内观察到显著较高的蛋白质水平。这些数据与在图7B-7D中观察到的血液苯丙氨酸减少一致。总而言之,这些证实示,单链DNA递送可以导致功能性肝酶的长期表达。

实验中所用的各种PAH构建体的序列陈述于表10A和10B中。

表10A:带有B19d135 ITR的B19-PAH构建体(核苷酸1-4146;SEQ ID NO:197)

表10B:带有GPVd162 ITR的GPV-PAH构建体(核苷酸1-4214;SEQ ID NO:198)

实例7b.带有B19或GPV来源的ITR的ssDNA报告基因构建体的制备。

将如实例1c中所述制备ssDNA报告基因/PAH构建体。简言之,将用LguI消化质粒。具有形成的发夹ITR结构的ssDNA片段将通过以下方式来产生:使LguI消化的双链DNA片段产物(报告基因表达盒和质粒骨架)在95℃下变性,然后在4℃下冷却以允许回文ITR序列折叠(图1A)。将在小鼠体内测试所得ssDNA构建体建立肝脏、肌肉组织、眼睛中的光感受器和中枢神经系统(CNS)的持久转导的能力。

实例7c.ssDNA介导的报告基因表达的体内评价。

为了验证实例7b中所述的ssDNA报告基因构建体在体内介导持久转基因表达的能力,将用5、10或20μg/小鼠的报告基因ssDNA向5-12周龄小鼠(4只动物/组)全身注射,局部注射至靶肌肉组织和CNS细胞,和/或视网膜下注射至靶感光细胞。

为了评价来自基于B19 ITR和GPV ITR的表达构建体的PAH,将使用相关疾病的小鼠模型。这些基因构建体将通过HDI全身递送以靶向肝脏。

序列表

<110> 比奥维拉迪维治疗股份有限公司(BIOVERATIV THERAPEUTICS INC.)

<120> 核酸分子及其用于非病毒基因疗法的用途

<130> 615112: SA9-465TW

<150> 62/716,826

<151> 2018-08-09

<160> 198

<170> PatentIn 3.5版

<210> 1

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-5

<400> 1

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800

aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374

<210> 2

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-4

<400> 2

atgcagatcg agctgagcac gtgcttcttc ctgtgcctgc tgaggttctg cttcagcgcc 60

accaggaggt actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg 120

ggcgagctgc ccgtggacgc caggttcccc cccagggtgc ccaagagctt ccccttcaac 180

acgagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccatct gttcaatatc 240

gccaagccca ggcccccctg gatggggctg ctggggccca cgatccaggc cgaggtgtac 300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg 360

ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagagg 420

gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg 480

aaggagaatg ggcccatggc cagcgacccc ctgtgcctga cctactctta cctgagccac 540

gtggatctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgcagggag 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660

ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggatagggac 720

gccgccagcg ccagggcctg gcccaagatg cacaccgtga acggctacgt gaacaggtct 780

ctgcccggcc tgatcggctg ccacaggaag agcgtgtact ggcacgtgat cggcatgggg 840

accacccccg aggtgcacag catcttcctg gagggccaca cgttcctggt gaggaatcac 900

aggcaggcca gcctggagat cagcccgatc accttcctga ccgcccagac cctgctgatg 960

gacctggggc agttcctgct gttctgccat atcagctctc accagcacga cggcatggag 1020

gcctacgtga aggtggatag ctgccccgag gagccccagc tgaggatgaa gaacaacgag 1080

gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gaggttcgac 1140

gacgacaata gcccgagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200

tgggtgcatt acatcgccgc cgaggaggag gattgggact acgcccccct ggtgctggcc 1260

cccgacgaca ggtcttacaa gagccagtac ctgaacaacg ggccccagag gatcggcagg 1320

aagtacaaga aggtgaggtt catggcctac accgacgaga ccttcaagac cagggaggcg 1380

atccagcacg agagcgggat cctggggccc ctgctgtacg gcgaggtggg cgacacgctg 1440

ctgatcatct tcaagaacca ggccagcagg ccgtacaata tctaccccca cgggatcacc 1500

gacgtgaggc ccctgtactc taggaggctg cccaagggcg tgaagcacct gaaggacttc 1560

cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacgggccc 1620

acgaagagcg accccaggtg cctgaccagg tactacagct ctttcgtgaa catggagagg 1680

gacctggcca gcggcctgat cgggcccctg ctgatctgct acaaggagag cgtggatcag 1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttcagcgt gttcgacgag 1800

aataggtctt ggtacctgac cgagaatatc cagaggttcc tgcccaaccc cgccggcgtg 1860

cagctggagg atcccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg 1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980

atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag 2040

atggtgtacg aggataccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc 2100

atggagaacc ccggcctgtg gatcctgggc tgccataact ccgacttcag gaataggggc 2160

atgaccgccc tgctgaaggt gagctcttgc gacaagaaca ccggcgacta ctacgaggat 2220

agctacgagg atatcagcgc ctacctgctg agcaagaaca acgccatcga gcccaggtct 2280

ttcagccaga acccccccgt gctgaagagg caccagaggg agatcaccag gacgaccctg 2340

cagagcgacc aggaggagat cgactacgac gacacgatca gcgtggagat gaagaaggag 2400

gatttcgaca tctacgacga ggacgagaat cagagcccca ggtctttcca gaagaagacc 2460

aggcattact tcatcgccgc cgtggagagg ctgtgggact acggcatgag cagctctccc 2520

cacgtgctga ggaatagggc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc 2580

caggagttca ccgacggcag cttcacccag cccctgtaca ggggcgagct gaacgagcac 2640

ctgggcctgc tggggcccta catcagggcc gaggtggagg ataacatcat ggtgaccttc 2700

aggaatcagg ccagcaggcc ctatagcttc tatagctctc tgatcagcta cgaggaggat 2760

cagaggcagg gcgccgagcc caggaagaac ttcgtgaagc ccaacgagac caagacctac 2820

ttctggaagg tgcagcacca catggccccc acgaaggacg agttcgactg caaggcctgg 2880

gcctacttca gcgacgtgga tctggagaag gacgtgcaca gcggcctgat cgggcccctg 2940

ctggtgtgcc acaccaacac cctgaacccc gcccacggca ggcaggtgac cgtgcaggag 3000

ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaatatg 3060

gagaggaatt gcagggcccc ctgcaatatc cagatggagg acccgacctt caaggagaat 3120

tacaggttcc acgccatcaa cggctacatc atggacacgc tgcccggcct ggtcatggcc 3180

caggatcaga ggatcaggtg gtatctgctg agcatgggga gcaacgagaa tatccacagc 3240

atccacttca gcggccacgt gttcaccgtg aggaagaagg aggagtacaa gatggccctg 3300

tacaatctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccgggatc 3360

tggagggtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac gctgttcctg 3420

gtgtactcta acaagtgcca gacccccctg gggatggcca gcggccacat cagggacttc 3480

cagatcaccg ccagcggcca gtacggccag tgggccccca agctggccag gctgcactat 3540

tccggaagca tcaacgcctg gagcacgaag gagcccttca gctggatcaa ggtggatctg 3600

ctggccccca tgatcatcca cgggatcaag acccagggcg ccaggcagaa gttcagctct 3660

ctgtatatca gccagttcat catcatgtac tctctggacg gcaagaagtg gcagacctac 3720

aggggcaaca gcaccggcac gctgatggtg ttcttcggca acgtggactc tagcgggatc 3780

aagcacaata tcttcaaccc ccccatcatc gccaggtaca tcaggctgca ccccacccat 3840

tactctatca ggtctaccct gaggatggag ctgatgggct gcgacctgaa cagctgcagc 3900

atgcccctgg ggatggagag caaggccatc agcgacgccc agatcaccgc cagctcttac 3960

ttcaccaaca tgttcgccac ctggagcccg agcaaggcca ggctgcacct gcagggcagg 4020

tctaacgcct ggaggcccca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag 4080

aagaccatga aggtgaccgg cgtgaccacg cagggcgtga agagcctgct gaccagcatg 4140

tacgtgaagg agttcctgat cagctctagc caggacggcc accagtggac cctgttcttc 4200

cagaacggca aggtgaaggt gttccagggc aaccaggata gcttcacccc cgtggtgaac 4260

agcctggacc cccccctgct gaccaggtat ctgaggatcc acccccagag ctgggtgcac 4320

cagatcgccc tgaggatgga ggtgctgggc tgcgaggccc aggatctgta ttga 4374

<210> 3

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-52

<400> 3

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800

aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280

ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340

cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400

gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520

catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580

caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640

ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880

gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000

ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180

caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240

atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300

tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360

tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480

cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540

tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600

ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720

aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780

aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900

atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140

tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320

cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374

<210> 4

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-62

<400> 4

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800

aacagatcct ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280

ttctctcaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg 2340

cagtctgacc aggaggagat cgactatgat gacaccatca gcgtggagat gaagaaggag 2400

gacttcgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc 2460

aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgtc cagcagcccc 2520

catgtgctga ggaacagggc ccagtctggc agcgtgcccc agttcaagaa agtcgtgttc 2580

caggagttca ccgacggcag cttcacccag cccctgtaca gaggggagct gaacgagcac 2640

ctgggcctgc tgggccccta catcagggcc gaggtggagg acaacatcat ggtgaccttc 2700

aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta cgaggaggac 2760

cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac 2820

ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg 2880

gcctacttct ctgacgtgga cctggagaag gacgtgcact ctggcctgat tggccccctg 2940

ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag 3000

ttcgccctgt tcttcaccat cttcgatgaa accaagagct ggtacttcac tgagaacatg 3060

gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac 3120

tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtcatggcc 3180

caggaccaga ggatcaggtg gtatctgctg agcatgggca gcaacgagaa catccacagc 3240

atccacttct ctggccacgt gttcactgtg aggaagaagg aggagtacaa gatggccctg 3300

tacaacctgt accctggggt gttcgaaacc gtggagatgc tgcccagcaa ggccggcatc 3360

tggagggtgg agtgcctgat tggggagcac ctgcacgccg gcatgagcac cctgttcctg 3420

gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc 3480

cagatcactg cctctggcca gtacggccag tgggccccca agctggccag gctgcactac 3540

tccggaagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa agtggacctg 3600

ctggccccca tgatcatcca cggcatcaag acccaggggg ccaggcagaa gttctccagc 3660

ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac 3720

aggggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc 3780

aagcacaaca tcttcaaccc ccccatcatc gccagataca tcaggctgca ccccacccac 3840

tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc 3900

atgcccctgg gcatggagag caaggccatc tctgacgccc agatcactgc ctccagctac 3960

ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg 4020

agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag 4080

aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg 4140

tacgtgaagg agttcctgat ctccagcagc caggacggcc accagtggac cctgttcttc 4200

cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtcaac 4260

agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagag ctgggtgcac 4320

cagatcgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga 4374

<210> 5

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-25

<400> 5

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60

accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120

ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360

ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420

gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480

aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660

ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720

gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780

ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900

aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960

gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020

gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080

gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140

gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200

tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320

aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380

atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500

gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620

accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800

aacaggagct ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374

<210> 6

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-26

<400> 6

atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc 60

accaggagat actacctggg cgccgtggag ctgagctggg actacatgca gtctgacctg 120

ggcgagctgc cagtggacgc caggttcccc cccagagtgc ccaagagctt ccccttcaac 180

accagcgtgg tgtacaagaa gaccctgttc gtggagttca ctgaccacct gttcaacatc 240

gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac 300

gacaccgtgg tcatcaccct gaagaacatg gccagccacc ccgtctccct gcacgccgtg 360

ggggtgagct actggaaggc ctctgagggc gccgagtacg acgaccagac cagccagagg 420

gagaaggagg acgacaaggt gttccctggg ggcagccaca cctacgtgtg gcaggtcctg 480

aaggagaacg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccac 540

gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag 600

ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg 660

ttcgacgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggac 720

gccgcctctg ccagggcctg gcccaagatg cacaccgtca acggctacgt caacaggagc 780

ctgcctggcc tgattggctg ccacaggaag agcgtgtact ggcatgtgat cggcatgggc 840

accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac 900

aggcaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg 960

gacctgggcc agttcctgct gttctgccac atctccagcc accagcacga cggcatggag 1020

gcctacgtga aagtggacag ctgccctgag gagccccagc tgaggatgaa gaacaacgag 1080

gaggccgagg actatgatga cgacctgacc gacagcgaga tggacgtggt caggttcgac 1140

gacgacaaca gccccagctt catccagatc aggagcgtgg ccaagaagca ccccaagacc 1200

tgggtgcact acatcgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc 1260

cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg 1320

aagtacaaga aagtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc 1380

atccagcatg agtctggcat cctgggcccc ctgctgtacg gggaggtggg ggacaccctg 1440

ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcacc 1500

gacgtgaggc ccctgtacag caggaggctg cctaaggggg tgaagcacct gaaagacttc 1560

cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggacggcccc 1620

accaagagcg accccaggtg cctgaccaga tactacagca gcttcgtcaa catggagagg 1680

gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag 1740

aggggcaacc agatcatgag cgacaagagg aacgtgatcc tgttctctgt cttcgacgag 1800

aacaggagct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280

ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340

caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400

gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460

agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520

cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580

caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640

ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700

cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760

cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820

ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880

gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940

ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000

tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060

gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120

tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180

caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240

attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300

tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360

tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420

gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480

cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540

tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600

ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660

ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720

aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780

aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840

tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900

atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960

ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020

tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080

aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140

tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200

caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260

tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320

cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374

<210> 7

<211> 1734

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-52-NT58

<400> 7

gcgacccgcc gatactacct gggagcagtg gagctctcct gggattacat gcagagcgac 60

cttggggagc tgcccgtgga tgccaggttc cctccccggg tgccaaagtc gtttccgttc 120

aacacctccg tggtgtacaa gaaaactctg ttcgtggagt tcaccgacca cctgttcaat 180

atcgccaagc ccagacctcc ctggatgggg ctgttgggac ctaccatcca agcggaggtg 240

tacgacactg tggtcatcac tctgaagaac atggcctcgc atcccgtgtc cctgcacgcc 300

gtgggagtgt cttactggaa agcgtccgag ggggccgaat acgacgacca gacctcgcag 360

agagaaaagg aagatgacaa ggtgttccca ggaggatcgc acacctacgt gtggcaagtg 420

ttgaaggaga acggcccaat ggcctccgac ccgctgtgcc tgacctactc gtacctgtcc 480

cacgtggacc tcgtgaagga cctcaactcg ggactgattg gagccctgct ggtctgcagg 540

gaaggctcac tggcgaaaga aaagactcag accttgcaca agttcattct gctgttcgct 600

gtgttcgacg aggggaagtc gtggcacagc gagactaaga actccctgat gcaagataga 660

gatgccgcct ccgcccgggc ctggcctaag atgcacaccg tgaacggtta cgtgaaccgc 720

tccctccctg gcctgattgg atgccaccgg aagtccgtgt actggcacgt gatcgggatg 780

gggaccaccc ccgaggtgca cagcatcttc ctggaaggtc acacatttct cgtgcgcaac 840

caccggcagg cctccctgga aatcagcccc attaccttcc tcactgccca gactctgctg 900

atggacctgg gacagttcct gctgttctgc catatctcct cccaccaaca tgacggaatg 960

gaggcatacg tgaaggtcga ttcctgccct gaggaacccc agctccgcat gaagaacaat 1020

gaggaagccg aggactacga cgacgacctg acggatagcg agatggatgt ggtccggttc 1080

gatgacgata acagcccttc cttcatccaa attcgctcgg tggcaaagaa gcaccccaag 1140

acctgggtgc attacattgc ggcggaagaa gaggactggg attatgcccc gcttgtcctc 1200

gctcctgacg accggagcta caagagccag tacctgaaca acggtccaca gaggatcggt 1260

agaaagtaca agaaggtccg cttcatggcc tataccgacg aaaccttcaa aactagagag 1320

gccatccaac acgaatccgg catcctgggc ccgctcttgt acggagaagt cggcgacacc 1380

cttctcatta tcttcaagaa ccaggcttcc cggccgtaca acatctatcc gcatgggatc 1440

actgacgtgc gcccactgta ctcgcggcgc ctgcccaagg gtgtcaaaca cctgaaggat 1500

tttccgatcc ttccgggaga aatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560

ccaactaagt ctgaccctag atgcctcacc cgctactact catccttcgt caacatggag 1620

cgcgacctgg ccagcggact gatcggcccg ctgctgattt gctacaagga atcagtggac 1680

caacggggaa accagatcat gtcggataag aggaacgtca tcctcttctc cgtg 1734

<210> 8

<211> 2583

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-52-CT

<400> 8

tttgacgaaa accggtcgtg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60

gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120

ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180

atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240

aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300

ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360

aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420

tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480

cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540

accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600

aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720

agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780

gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840

aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080

aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200

gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380

gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440

atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500

atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560

gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680

agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740

ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800

gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860

ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920

cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980

agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100

agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160

tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340

accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460

gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520

tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580

tga 2583

<210> 9

<211> 1734

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-62-NT58

<400> 9

gccactcgcc ggtactacct tggagccgtg gagctttcat gggactacat gcagagcgac 60

ctgggcgaac tccccgtgga tgccagattc cccccccgcg tgccaaagtc cttccccttt 120

aacacctccg tggtgtacaa gaaaaccctc tttgtcgagt tcactgacca cctgttcaac 180

atcgccaagc cgcgcccacc ttggatgggc ctcctgggac cgaccattca agctgaagtg 240

tacgacaccg tggtgatcac cctgaagaac atggcgtccc accccgtgtc cctgcatgcg 300

gtcggagtgt cctactggaa ggcctccgaa ggagctgagt acgacgacca gactagccag 360

cgggaaaagg aggacgataa agtgttcccg ggcggctcgc atacttacgt gtggcaagtc 420

ctgaaggaaa acggacctat ggcatccgat cctctgtgcc tgacttactc ctacctttcc 480

catgtggacc tcgtgaagga cctgaacagc gggctgattg gtgcacttct cgtgtgccgc 540

gaaggttcgc tcgctaagga aaagacccag accctccata agttcatcct tttgttcgct 600

gtgttcgatg aaggaaagtc atggcattcc gaaactaaga actcgctgat gcaggaccgg 660

gatgccgcct cagcccgcgc ctggcctaaa atgcatacag tcaacggata cgtgaatcgg 720

tcactgcccg ggctcatcgg ttgtcacaga aagtccgtgt actggcacgt catcggcatg 780

ggcactacgc ctgaagtgca ctccatcttc ctggaagggc acaccttcct cgtgcgcaac 840

caccgccagg cctctctgga aatctccccg attacctttc tgaccgccca gactctgctc 900

atggacctgg ggcagttcct tctcttctgc cacatctcca gccatcagca cgacggaatg 960

gaggcctacg tgaaggtgga ctcatgcccg gaagaacctc agttgcggat gaagaacaac 1020

gaggaggccg aggactatga cgacgatttg actgactccg agatggacgt cgtgcggttc 1080

gatgacgaca acagccccag cttcatccag attcgcagcg tggccaagaa gcaccccaaa 1140

acctgggtgc actacatcgc ggccgaggaa gaagattggg actacgcccc gttggtgctg 1200

gcacccgatg accggtcgta caagtcccag tatctgaaca atggtccgca gcggattggc 1260

agaaagtaca agaaagtgcg gttcatggcg tacactgacg aaacgtttaa gacccgggag 1320

gccattcaac atgagagcgg cattctggga ccactgctgt acggagaggt cggcgatacc 1380

ctgctcatca tcttcaaaaa ccaggcctcc cggccttaca acatctaccc tcacggaatc 1440

accgacgtgc ggccactcta ctcgcggcgc ctgccgaagg gcgtcaagca cctgaaagac 1500

ttccctatcc tgccgggcga aatcttcaag tataagtgga ccgtcaccgt ggaggacggg 1560

cccaccaaga gcgatcctag gtgtctgact cggtactact ccagcttcgt gaacatggaa 1620

cgggacctgg catcgggact cattggaccg ctgctgatct gctacaaaga gtcggtggat 1680

caacgcggca accagatcat gtccgacaag cgcaacgtga tcctgttctc cgtg 1734

<210> 10

<211> 2583

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-62-CT

<400> 10

tttgatgaaa acagatcctg gtacctgacc gagaacatcc agaggttcct gcccaaccct 60

gctggggtgc agctggagga ccccgagttc caggccagca acatcatgca cagcatcaat 120

ggctacgtgt tcgacagcct gcagctgagc gtgtgcctgc acgaggtggc ctactggtac 180

atcctgagca tcggcgccca gaccgacttc ctgagcgtgt tcttctctgg ctacaccttc 240

aagcacaaga tggtgtatga ggacaccctg accctgttcc ccttcagcgg ggagactgtc 300

ttcatgagca tggagaaccc tggcctgtgg atcctgggct gccacaacag cgacttcagg 360

aacaggggca tgactgccct gctgaaagtc tccagctgtg acaagaacac cggggactac 420

tacgaggaca gctacgagga catcagcgcc tacctgctga gcaagaacaa tgccatcgag 480

cccaggagct tctctcagaa ccccccagtg ctgaagaggc accagaggga gatcaccagg 540

accaccctgc agtctgacca ggaggagatc gactatgatg acaccatcag cgtggagatg 600

aagaaggagg acttcgacat ctacgacgag gacgagaacc agagccccag gagcttccag 660

aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgtcc 720

agcagccccc atgtgctgag gaacagggcc cagtctggca gcgtgcccca gttcaagaaa 780

gtcgtgttcc aggagttcac cgacggcagc ttcacccagc ccctgtacag aggggagctg 840

aacgagcacc tgggcctgct gggcccctac atcagggccg aggtggagga caacatcatg 900

gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctac 960

gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc 1020

aagacctact tctggaaggt gcagcaccac atggccccca ccaaggacga gttcgactgc 1080

aaggcctggg cctacttctc tgacgtggac ctggagaagg acgtgcactc tggcctgatt 1140

ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact 1200

gtgcaggagt tcgccctgtt cttcaccatc ttcgatgaaa ccaagagctg gtacttcact 1260

gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc 1320

aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg 1380

gtcatggccc aggaccagag gatcaggtgg tatctgctga gcatgggcag caacgagaac 1440

atccacagca tccacttctc tggccacgtg ttcactgtga ggaagaagga ggagtacaag 1500

atggccctgt acaacctgta ccctggggtg ttcgaaaccg tggagatgct gcccagcaag 1560

gccggcatct ggagggtgga gtgcctgatt ggggagcacc tgcacgccgg catgagcacc 1620

ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc 1680

agggacttcc agatcactgc ctctggccag tacggccagt gggcccccaa gctggccagg 1740

ctgcactact ccggaagcat caatgcctgg agcaccaagg agcccttcag ctggatcaaa 1800

gtggacctgc tggcccccat gatcatccac ggcatcaaga cccagggggc caggcagaag 1860

ttctccagcc tgtacatcag ccagttcatc atcatgtaca gcctggacgg caagaagtgg 1920

cagacctaca ggggcaacag caccggcacc ctgatggtgt tcttcggcaa cgtggacagc 1980

agcggcatca agcacaacat cttcaacccc cccatcatcg ccagatacat caggctgcac 2040

cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac 2100

agctgcagca tgcccctggg catggagagc aaggccatct ctgacgccca gatcactgcc 2160

tccagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg 2220

cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg 2280

gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg 2340

accagcatgt acgtgaagga gttcctgatc tccagcagcc aggacggcca ccagtggacc 2400

ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct 2460

gtggtcaaca gcctggaccc ccccctgctg accagatacc tgaggatcca cccccagagc 2520

tgggtgcacc agatcgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac 2580

tga 2583

<210> 11

<211> 1734

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-25-NT58

<400> 11

gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60

ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180

atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240

tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300

gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360

agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420

ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480

cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540

gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600

gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660

gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720

agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780

ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840

cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900

atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960

gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020

gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080

gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140

acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200

gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260

aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320

gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380

ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440

accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500

ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560

cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620

agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680

cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734

<210> 12

<211> 2583

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-25-CT

<400> 12

ttcgacgaga acaggagctg gtacctgact gaaaacatcc agcggttcct ccccaacccc 60

gcgggcgtgc agctggaaga tcctgagttt caggcatcaa acatcatgca ctccattaac 120

ggctacgtgt tcgattcgct gcagctgagc gtgtgtctgc acgaagtggc ctactggtac 180

atcctgtcca ttggtgccca gactgacttc ctgtccgtgt ttttctccgg ctacacgttc 240

aagcacaaga tggtgtacga ggacaccctg accctcttcc ctttttccgg cgaaactgtg 300

tttatgagca tggagaatcc cggcctgtgg atcttgggct gccacaacag cgacttccgt 360

aacagaggaa tgactgcgct gctcaaggtg tccagctgcg acaagaacac cggagactat 420

tatgaggact catacgagga catctccgcc tacctcctgt ccaagaataa cgccattgaa 480

cctcggagct tcagccagaa cccacccgtg cttaagagac atcaacggga gatcactagg 540

accaccctgc agtcagacca ggaggaaatc gactacgatg acaccatctc ggtcgagatg 600

aagaaggagg actttgacat ctacgacgaa gatgaaaacc agagcccgag gtcgttccaa 660

aagaaaaccc gccactactt tattgctgct gtcgagcggc tgtgggacta cggaatgtcg 720

tcctcgccgc acgtgctccg caaccgagcc cagagcggct cggtgccgca attcaagaag 780

gtcgtgttcc aggagttcac tgacgggagc ttcactcagc ctttgtaccg gggagaactc 840

aatgaacatc tcggcctcct cggaccttac atcagagcag aagtggaaga taacatcatg 900

gtcactttcc gtaaccaagc cagccgcccg tactcgttct actcctccct catttcttac 960

gaagaggacc agcggcaggg cgcagaaccg cgcaagaact tcgtgaagcc caacgaaacc 1020

aagacctact tctggaaagt gcagcatcat atggccccga ctaaggacga gtttgactgc 1080

aaagcctggg cctacttctc cgatgtggac ttggagaagg acgtccactc cggcctcatc 1140

ggtcccctgc tcgtgtgcca taccaatacc ctgaaccccg cacacggtcg ccaggtcacc 1200

gtgcaggagt tcgctctgtt cttcactatc ttcgacgaaa ctaagtcctg gtacttcacc 1260

gagaacatgg agaggaactg cagagccccc tgtaacatcc agatggagga cccgacgttc 1320

aaggaaaact accggttcca cgccattaac ggatacatca tggatacgct gccgggtctt 1380

gtgatggccc aggatcaacg gatcagatgg tacttattgt cgatgggcag caacgagaac 1440

atccactcta ttcacttctc cggtcatgtg ttcactgtgc ggaagaagga agagtacaag 1500

atggccctgt acaaccttta tcccggagtg ttcgaaactg tggaaatgct gccgtcgaag 1560

gccggcattt ggcgcgtgga gtgtttgatt ggagaacatc tccatgcggg gatgtcaacc 1620

ctgttcctgg tgtatagcaa caagtgccag actccgcttg ggatggcgtc aggacacatt 1680

agggatttcc agatcactgc gtccggccag tacggccaat gggcccctaa gctggcccgc 1740

ctgcattact ccggatccat taacgcctgg tcaaccaagg agccattctc ctggatcaag 1800

gtggaccttc tggcccccat gattatccac ggaattaaga cccagggggc ccggcagaag 1860

ttctcctcac tgtacatcag ccagttcata atcatgtact ccctggacgg aaagaagtgg 1920

caaacctaca gggggaacag caccggcaca ctgatggtct ttttcggaaa tgtggactcc 1980

tccgggatta agcataacat cttcaaccct ccgattatcg ctcggtacat tagacttcac 2040

cctacccact acagcattcg ctccaccctg cggatggaac tgatgggctg cgatctgaac 2100

tcgtgcagca tgccgttggg aatggagtcc aaagcaattt ccgacgcgca gatcaccgcc 2160

tcgtcctact ttaccaacat gttcgccacg tggtcaccgt ccaaggcccg gctgcacctc 2220

cagggaagat ccaacgcatg gcggccacag gtcaacaacc ctaaggagtg gctccaggtg 2280

gacttccaga aaaccatgaa ggtcaccgga gtcacaaccc agggagtgaa gtcgctgctg 2340

acttctatgt acgtcaagga gttcctgatc tccagcagcc aggacgggca ccagtggacc 2400

ctgttcttcc aaaatggaaa ggtcaaggtg tttcagggca atcaggattc attcaccccg 2460

gtggtgaact cccttgatcc acccctcctg acccgctacc ttcgcatcca cccacagtcc 2520

tgggtgcacc agatcgcgct gaggatggag gtcctgggat gcgaagccca ggacctgtac 2580

tga 2583

<210> 13

<211> 1734

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-26-NT58

<400> 13

gccaccagga gatactacct gggcgccgtg gagctgagct gggactacat gcagtctgac 60

ctgggcgagc tgccagtgga cgccaggttc ccccccagag tgcccaagag cttccccttc 120

aacaccagcg tggtgtacaa gaagaccctg ttcgtggagt tcactgacca cctgttcaac 180

atcgccaagc ccaggccccc ctggatgggc ctgctgggcc ccaccatcca ggccgaggtg 240

tacgacaccg tggtcatcac cctgaagaac atggccagcc accccgtctc cctgcacgcc 300

gtgggggtga gctactggaa ggcctctgag ggcgccgagt acgacgacca gaccagccag 360

agggagaagg aggacgacaa ggtgttccct gggggcagcc acacctacgt gtggcaggtc 420

ctgaaggaga acggccccat ggcctctgac cccctgtgcc tgacctacag ctacctgagc 480

cacgtggacc tggtgaagga cctgaactct ggcctgattg gggccctgct ggtgtgcagg 540

gagggcagcc tggccaagga gaagacccag accctgcaca agttcatcct gctgttcgcc 600

gtgttcgacg agggcaagag ctggcactct gaaaccaaga acagcctgat gcaggacagg 660

gacgccgcct ctgccagggc ctggcccaag atgcacaccg tcaacggcta cgtcaacagg 720

agcctgcctg gcctgattgg ctgccacagg aagagcgtgt actggcatgt gatcggcatg 780

ggcaccaccc ctgaggtgca cagcatcttc ctggagggcc acaccttcct ggtcaggaac 840

cacaggcagg ccagcctgga gatcagcccc atcaccttcc tgaccgccca gaccctgctg 900

atggacctgg gccagttcct gctgttctgc cacatctcca gccaccagca cgacggcatg 960

gaggcctacg tgaaagtgga cagctgccct gaggagcccc agctgaggat gaagaacaac 1020

gaggaggccg aggactatga tgacgacctg accgacagcg agatggacgt ggtcaggttc 1080

gacgacgaca acagccccag cttcatccag atcaggagcg tggccaagaa gcaccccaag 1140

acctgggtgc actacatcgc tgctgaggag gaggactggg actatgcccc cctggtgctg 1200

gcccctgatg acaggagcta caagagccag tacctgaaca atggccccca gaggattggc 1260

aggaagtaca agaaagtcag gttcatggcc tacactgatg aaaccttcaa gaccagggag 1320

gccatccagc atgagtctgg catcctgggc cccctgctgt acggggaggt gggggacacc 1380

ctgctgatca tcttcaagaa ccaggccagc aggccctaca acatctaccc ccatggcatc 1440

accgacgtga ggcccctgta cagcaggagg ctgcctaagg gggtgaagca cctgaaagac 1500

ttccccatcc tgcctgggga gatcttcaag tacaagtgga ctgtgactgt ggaggacggc 1560

cccaccaaga gcgaccccag gtgcctgacc agatactaca gcagcttcgt caacatggag 1620

agggacctgg cctctggcct gattggcccc ctgctgatct gctacaagga gtctgtggac 1680

cagaggggca accagatcat gagcgacaag aggaacgtga tcctgttctc tgtc 1734

<210> 14

<211> 2583

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-26-CT

<400> 14

ttcgacgaga acaggagctg gtacctcact gaaaacatcc agaggttcct cccaaacccc 60

gcaggagtgc aactggagga ccctgagttt caggcctcga atatcatgca ctcgattaac 120

ggttacgtgt tcgactcgct gcagctgagc gtgtgcctcc atgaagtcgc ttactggtac 180

attctgtcca tcggcgccca gactgacttc ctgagcgtgt tcttttccgg ttacaccttt 240

aagcacaaga tggtgtacga agataccctg accctgttcc ctttctccgg cgaaacggtg 300

ttcatgtcga tggagaaccc gggtctgtgg attctgggat gccacaacag cgactttcgg 360

aaccgcggaa tgactgccct gctgaaggtg tcctcatgcg acaagaacac cggagactac 420

tacgaggact cctacgagga tatctcagcc tacctcctgt ccaagaacaa cgcgatcgag 480

ccgcgcagct tcagccagaa cccgcctgtg ctgaagaggc accagcgaga aattacccgg 540

accaccctcc aatcggatca ggaggaaatc gactacgacg acaccatctc ggtggaaatg 600

aagaaggaag atttcgatat ctacgacgag gacgaaaatc agtcccctcg ctcattccaa 660

aagaaaacta gacactactt tatcgccgcg gtggaaagac tgtgggacta tggaatgtca 720

tccagccctc acgtccttcg gaaccgggcc cagagcggat cggtgcctca gttcaagaaa 780

gtggtgttcc aggagttcac cgacggcagc ttcacccagc cgctgtaccg gggagaactg 840

aacgaacacc tgggcctgct cggtccctac atccgcgcgg aagtggagga taacatcatg 900

gtgaccttcc gtaaccaagc atccagacct tactccttct attcctccct gatctcatac 960

gaggaggacc agcgccaagg cgccgagccc cgcaagaact tcgtcaagcc caacgagact 1020

aagacctact tctggaaggt ccaacaccat atggccccga ccaaggatga gtttgactgc 1080

aaggcctggg cctacttctc cgacgtggac cttgagaagg atgtccattc cggcctgatc 1140

gggccgctgc tcgtgtgtca caccaacacc ctgaacccag cgcatggacg ccaggtcacc 1200

gtccaggagt ttgctctgtt cttcaccatt tttgacgaaa ctaagtcctg gtacttcacc 1260

gagaatatgg agcgaaactg tagagcgccc tgcaatatcc agatggaaga tccgactttc 1320

aaggagaact atagattcca cgccatcaac gggtacatca tggatactct gccggggctg 1380

gtcatggccc aggatcagag gattcggtgg tacttgctgt caatgggatc gaacgaaaac 1440

attcactcca ttcacttctc cggtcacgtg ttcactgtgc gcaagaagga ggagtacaag 1500

atggcgctgt acaatctgta ccccggggtg ttcgaaactg tggagatgct gccgtccaag 1560

gccggcatct ggagagtgga gtgcctgatc ggagagcacc tccacgcggg gatgtccacc 1620

ctcttcctgg tgtactcgaa taagtgccag accccgctgg gcatggcctc gggccacatc 1680

agagacttcc agatcacagc aagcggacaa tacggccaat gggcgccgaa gctggcccgc 1740

ttgcactact ccggatcgat caacgcatgg tccaccaagg aaccgttctc gtggattaag 1800

gtggacctcc tggcccctat gattatccac ggaattaaga cccagggcgc caggcagaag 1860

ttctcctccc tgtacatctc gcaattcatc atcatgtaca gcctggacgg gaagaagtgg 1920

cagacttaca ggggaaactc caccggcacc ctgatggtct ttttcggcaa cgtggattcc 1980

tccggcatta agcacaacat cttcaaccca ccgatcatag ccagatatat taggctccac 2040

cccactcact actcaatccg ctcaactctt cggatggaac tcatggggtg cgacctgaac 2100

tcctgctcca tgccgttggg gatggaatca aaggctatta gcgacgccca gatcaccgcg 2160

agctcctact tcactaacat gttcgccacc tggagcccct ccaaggccag gctgcacttg 2220

cagggacggt caaatgcctg gcggccgcaa gtgaacaatc cgaaggaatg gcttcaagtg 2280

gatttccaaa agaccatgaa agtgaccgga gtcaccaccc agggagtgaa gtcccttctg 2340

acctcgatgt atgtgaagga gttcctgatt agcagcagcc aggacgggca ccagtggacc 2400

ctgttcttcc aaaacggaaa ggtcaaggtg ttccagggga accaggactc gttcacaccc 2460

gtggtgaact ccctggaccc cccactgctg acgcggtact tgaggattca tcctcagtcc 2520

tgggtccatc agattgcatt gcgaatggaa gtcctgggct gcgaggccca ggacctgtac 2580

tga 2583

<210> 15

<211> 2332

<212> PRT

<213> 人(Homo sapiens)

<400> 15

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg

740 745 750

Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys

755 760 765

Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn

770 775 780

Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro

785 790 795 800

His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe

805 810 815

Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser

820 825 830

Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val

835 840 845

Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly

850 855 860

Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser

865 870 875 880

Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala

885 890 895

Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His

900 905 910

Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro

915 920 925

Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp

930 935 940

Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp

945 950 955 960

Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys

965 970 975

Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys

980 985 990

Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala

995 1000 1005

Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu

1010 1015 1020

Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu

1025 1030 1035

Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp

1040 1045 1050

Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr

1055 1060 1065

Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly

1070 1075 1080

Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys

1085 1090 1095

Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His

1100 1105 1110

Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln

1115 1120 1125

Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe

1130 1135 1140

Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr

1145 1150 1155

Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn

1160 1165 1170

Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His

1175 1180 1185

Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr

1190 1195 1200

Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr

1205 1210 1215

Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg

1220 1225 1230

Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu

1235 1240 1245

Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys

1250 1255 1260

His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu

1265 1270 1275

Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys

1280 1285 1290

Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr

1295 1300 1305

Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu

1310 1315 1320

Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr

1325 1330 1335

Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr

1340 1345 1350

Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser

1355 1360 1365

Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala

1370 1375 1380

Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser

1385 1390 1395

Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser

1400 1405 1410

Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val

1415 1420 1425

Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu

1430 1435 1440

Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu

1445 1450 1455

Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys

1460 1465 1470

Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr

1475 1480 1485

Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys

1490 1495 1500

Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu

1505 1510 1515

Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile

1520 1525 1530

Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg

1535 1540 1545

Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp

1550 1555 1560

Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu

1565 1570 1575

Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys

1580 1585 1590

Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His

1595 1600 1605

Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu

1610 1615 1620

Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln

1625 1630 1635

Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

1640 1645 1650

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile

1655 1660 1665

Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp

1670 1675 1680

Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr

1685 1690 1695

Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser

1700 1705 1710

Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro

1715 1720 1725

Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe

1730 1735 1740

Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

1745 1750 1755

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val

1760 1765 1770

Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

1775 1780 1785

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

1790 1795 1800

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

1805 1810 1815

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys

1820 1825 1830

Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His

1835 1840 1845

Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu

1850 1855 1860

Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu

1865 1870 1875

Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu

1880 1885 1890

Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu

1895 1900 1905

Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly

1910 1915 1920

Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln

1925 1930 1935

Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile

1940 1945 1950

His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys

1955 1960 1965

Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe

1970 1975 1980

Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val

1985 1990 1995

Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu

2000 2005 2010

Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala

2015 2020 2025

Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr

2030 2035 2040

Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser

2045 2050 2055

Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val

2060 2065 2070

Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly

2075 2080 2085

Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile

2090 2095 2100

Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn

2105 2110 2115

Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser

2120 2125 2130

Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr

2135 2140 2145

Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg

2150 2155 2160

Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu

2165 2170 2175

Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser

2180 2185 2190

Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala

2195 2200 2205

Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val

2210 2215 2220

Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met

2225 2230 2235

Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr

2240 2245 2250

Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly

2255 2260 2265

His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe

2270 2275 2280

Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp

2285 2290 2295

Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp

2300 2305 2310

Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala

2315 2320 2325

Gln Asp Leu Tyr

2330

<210> 16

<211> 4371

<212> DNA

<213> 人工序列

<220>

<223> BDD-FVIII(未优化;“亲代”),核苷酸序列

<400> 16

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280

ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt 2340

cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa 2400

gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca 2460

cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca 2520

catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc 2580

caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat 2640

ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc 2700

agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat 2760

cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac 2820

ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg 2880

gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt 2940

ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa 3000

tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg 3060

gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat 3120

tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct 3180

caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct 3240

attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg 3300

tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt 3360

tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg 3420

gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt 3480

cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat 3540

tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg 3600

ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc 3660

ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat 3720

cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata 3780

aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat 3840

tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc 3900

atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac 3960

tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg 4020

agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag 4080

aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg 4140

tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt 4200

cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac 4260

tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac 4320

cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta c 4371

<210> 17

<211> 1438

<212> PRT

<213> 人工序列

<220>

<223> BDD-FVIII(未优化;“亲代”),氨基酸序列

<400> 17

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His

740 745 750

Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile

755 760 765

Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp

770 775 780

Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys

785 790 795 800

Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly

805 810 815

Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser

820 825 830

Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser

835 840 845

Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

850 855 860

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr

865 870 875 880

Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile

885 890 895

Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe

900 905 910

Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His

915 920 925

Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe

930 935 940

Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro

945 950 955 960

Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln

965 970 975

Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr

980 985 990

Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro

995 1000 1005

Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg

1010 1015 1020

Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu

1025 1030 1035

Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met

1040 1045 1050

Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val

1055 1060 1065

Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn

1070 1075 1080

Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys

1085 1090 1095

Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His

1100 1105 1110

Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln

1115 1120 1125

Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile

1130 1135 1140

Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg

1145 1150 1155

Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro

1160 1165 1170

Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His

1175 1180 1185

Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr

1190 1195 1200

Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp

1205 1210 1215

Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe

1220 1225 1230

Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro

1235 1240 1245

Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser

1250 1255 1260

Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn

1265 1270 1275

Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp

1280 1285 1290

Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr

1295 1300 1305

Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn

1310 1315 1320

Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val

1325 1330 1335

Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly

1340 1345 1350

Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile

1355 1360 1365

Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn

1370 1375 1380

Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro

1385 1390 1395

Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg

1400 1405 1410

Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu

1415 1420 1425

Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1430 1435

<210> 18

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN核苷酸序列

<400> 18

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420

cccaccagca ctgaagaagg tgcctcgagc 450

<210> 19

<211> 4824

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-52-XTEN

<400> 19

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800

aaccggtcgt ggtacctgac cgagaacatc cagaggttcc tgcccaaccc tgctggggtg 1860

cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa tggctacgtg 1920

ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc 1980

atcggcgccc agaccgactt cctgagcgtg ttcttctctg gctacacctt caagcacaag 2040

atggtgtatg aggacaccct gaccctgttc cccttcagcg gggagactgt cttcatgagc 2100

atggagaacc ctggcctgtg gatcctgggc tgccacaaca gcgacttcag gaacaggggc 2160

atgactgccc tgctgaaagt ctccagctgt gacaagaaca ccggggacta ctacgaggac 2220

agctacgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccaggagc 2280

ttctctcaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccccccagt gctgaagagg 2760

caccagaggg agatcaccag gaccaccctg cagtctgacc aggaggagat cgactatgat 2820

gacaccatca gcgtggagat gaagaaggag gacttcgaca tctacgacga ggacgagaac 2880

cagagcccca ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg 2940

ctgtgggact atggcatgtc cagcagcccc catgtgctga ggaacagggc ccagtctggc 3000

agcgtgcccc agttcaagaa agtcgtgttc caggagttca ccgacggcag cttcacccag 3060

cccctgtaca gaggggagct gaacgagcac ctgggcctgc tgggccccta catcagggcc 3120

gaggtggagg acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc 3180

tacagcagcc tgatcagcta cgaggaggac cagaggcagg gggctgagcc caggaagaac 3240

tttgtgaagc ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc 3300

accaaggacg agttcgactg caaggcctgg gcctacttct ctgacgtgga cctggagaag 3360

gacgtgcact ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct 3420

gcccatggca ggcaggtgac tgtgcaggag ttcgccctgt tcttcaccat cttcgatgaa 3480

accaagagct ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc 3540

cagatggagg accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc 3600

atggacaccc tgcctggcct ggtcatggcc caggaccaga ggatcaggtg gtatctgctg 3660

agcatgggca gcaacgagaa catccacagc atccacttct ctggccacgt gttcactgtg 3720

aggaagaagg aggagtacaa gatggccctg tacaacctgt accctggggt gttcgaaacc 3780

gtggagatgc tgcccagcaa ggccggcatc tggagggtgg agtgcctgat tggggagcac 3840

ctgcacgccg gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg 3900

ggcatggcct ctggccacat cagggacttc cagatcactg cctctggcca gtacggccag 3960

tgggccccca agctggccag gctgcactac tccggaagca tcaatgcctg gagcaccaag 4020

gagcccttca gctggatcaa agtggacctg ctggccccca tgatcatcca cggcatcaag 4080

acccaggggg ccaggcagaa gttctccagc ctgtacatca gccagttcat catcatgtac 4140

agcctggacg gcaagaagtg gcagacctac aggggcaaca gcaccggcac cctgatggtg 4200

ttcttcggca acgtggacag cagcggcatc aagcacaaca tcttcaaccc ccccatcatc 4260

gccagataca tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag 4320

ctgatgggct gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc 4380

tctgacgccc agatcactgc ctccagctac ttcaccaaca tgtttgccac ctggagcccc 4440

agcaaggcca ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac 4500

cccaaggagt ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc 4560

cagggggtga agagcctgct gaccagcatg tacgtgaagg agttcctgat ctccagcagc 4620

caggacggcc accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc 4680

aaccaggaca gcttcacccc tgtggtcaac agcctggacc cccccctgct gaccagatac 4740

ctgaggatcc acccccagag ctgggtgcac cagatcgccc tgaggatgga ggtgctgggc 4800

tgtgaggccc aggacctgta ctga 4824

<210> 20

<211> 4824

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-1-XTEN

<400> 20

atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60

acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120

ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180

actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240

gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300

gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360

ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420

gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480

aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540

gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600

ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660

tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720

gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780

ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840

accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900

cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960

gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020

gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080

gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140

gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200

tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260

ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320

aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380

atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440

ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500

gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560

ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620

actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680

gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740

agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800

aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860

cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920

ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980

attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040

atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100

atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160

atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220

tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280

tttagtcaga atggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gccctccagt gctgaagcgg 2760

caccagcgcg agatcacccg cactaccctg cagagtgatc aggaagagat cgactacgac 2820

gatacaattt ctgtggaaat gaagaaagag gacttcgata tctatgacga agatgagaac 2880

cagagtcctc gatcattcca gaagaaaacc aggcattact ttattgccgc agtggagcgg 2940

ctgtgggatt atggcatgtc ctctagtcct cacgtgctgc gaaatagggc ccagtcagga 3000

agcgtcccac agttcaagaa agtggtcttc caggagttta cagacgggtc ctttactcag 3060

ccactgtaca ggggcgaact gaacgagcac ctgggactgc tggggcccta tatcagagca 3120

gaagtggagg ataacattat ggtcaccttc agaaatcagg cctctcggcc ttacagtttt 3180

tattcaagcc tgatctctta cgaagaggac cagcgacagg gagctgaacc acgaaaaaac 3240

ttcgtgaagc ctaatgagac caaaacatac ttttggaagg tgcagcacca tatggcccca 3300

acaaaagacg agttcgattg caaggcatgg gcctattttt ctgacgtgga tctggagaag 3360

gacgtgcaca gtggcctgat tggcccactg ctggtgtgcc atactaacac cctgaatcca 3420

gcccacggcc ggcaggtcac tgtccaggag ttcgctctgt tctttaccat ctttgatgag 3480

acaaagagct ggtacttcac cgaaaacatg gagcgaaatt gcagggctcc atgtaacatt 3540

cagatggaag accccacatt caaggagaac taccgctttc atgctatcaa tggatacatc 3600

atggatactc tgcccgggct ggtcatggca caggaccaga gaatccggtg gtatctgctg 3660

agcatgggca gcaacgagaa tatccactca attcatttca gcgggcacgt gtttactgtc 3720

aggaagaaag aagagtacaa gatggccctg tacaacctgt atcccggcgt gttcgaaacc 3780

gtcgagatgc tgcctagcaa ggccggaatc tggagagtgg aatgcctgat tggagagcac 3840

ctgcatgctg ggatgtctac cctgtttctg gtgtacagta ataagtgtca gacacccctg 3900

ggaatggcat ccgggcatat cagggatttc cagattaccg catctggaca gtacggacag 3960

tgggcaccta agctggctag actgcactat tccggatcta tcaacgcttg gtccacaaaa 4020

gagcctttct cttggattaa ggtggacctg ctggccccaa tgatcattca tggcatcaaa 4080

actcagggag ctcggcagaa gttctcctct ctgtacatct cacagtttat catcatgtac 4140

agcctggatg ggaagaaatg gcagacatac cgcggcaata gcacaggaac tctgatggtg 4200

ttctttggca acgtggacag cagcggaatc aagcacaaca ttttcaatcc ccctatcatt 4260

gctagataca tccggctgca cccaacccat tattctattc gaagtacact gaggatggaa 4320

ctgatgggat gcgatctgaa cagttgttca atgcccctgg ggatggagtc caaggcaatc 4380

tctgacgccc agattaccgc cagctcctac ttcactaata tgtttgctac ctggagccct 4440

tccaaagcaa gactgcacct gcaaggccgc agcaacgcat ggcgaccaca ggtgaacaat 4500

cccaaggagt ggttgcaggt cgattttcag aaaactatga aggtgaccgg ggtcacaact 4560

cagggcgtga aaagtctgct gacctcaatg tacgtcaagg agttcctgat ctctagttca 4620

caggacggac atcagtggac actgttcttt cagaacggga aggtgaaagt cttccagggc 4680

aatcaggatt cctttacacc tgtggtcaac agtctagacc ctccactgct gaccagatac 4740

ctgagaatcc accctcagtc ctgggtgcac cagattgccc tgagaatgga agtgctggga 4800

tgcgaggccc aggatctgta ctga 4824

<210> 21

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> MAR/ARS

<400> 21

atattt 6

<210> 22

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> MAR/ARS

<400> 22

aaatat 6

<210> 23

<211> 5

<212> DNA

<213> 人工序列

<220>

<223> 去稳定组件

<400> 23

attta 5

<210> 24

<211> 5

<212> DNA

<213> 人工序列

<220>

<223> 去稳定组件

<400> 24

taaat 5

<210> 25

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 多聚T位点

<400> 25

tttttt 6

<210> 26

<211> 7

<212> DNA

<213> 人工序列

<220>

<223> 多聚A位点

<400> 26

aaaaaaa 7

<210> 27

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 剪接位点

<400> 27

ggtgat 6

<210> 28

<211> 5

<212> DNA

<213> 人工序列

<220>

<223> TATA盒

<400> 28

tataa 5

<210> 29

<211> 5

<212> DNA

<213> 人工序列

<220>

<223> TATA盒

<400> 29

ttata 5

<210> 30

<211> 8

<212> DNA

<213> 人工序列

<220>

<223> 富含AU的序列组件

<400> 30

attttatt 8

<210> 31

<211> 8

<212> DNA

<213> 人工序列

<220>

<223> 富含AU的序列组件

<400> 31

atttttaa 8

<210> 32

<211> 13

<212> DNA

<213> 人工序列

<220>

<223> kozak共有序列

<400> 32

gccgccacca tgc 13

<210> 33

<211> 32

<212> PRT

<213> 人工序列

<220>

<223> CTP肽

<400> 33

Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser

1 5 10 15

Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu

20 25 30

<210> 34

<211> 28

<212> PRT

<213> 人工序列

<220>

<223> CTP肽

<400> 34

Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu Pro Ser Pro Ser Arg

1 5 10 15

Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro Gln

20 25

<210> 35

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> 白蛋白结合肽核心序列

<400> 35

Asp Ile Cys Leu Pro Arg Trp Gly Cys Leu Trp

1 5 10

<210> 36

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 36

Ala Ser Pro Ala Ala Pro Ala Pro Ala Ser Pro Ala Ala Pro Ala Pro

1 5 10 15

Ser Ala Pro Ala

20

<210> 37

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 37

Ala Ala Pro Ala Ser Pro Ala Pro Ala Ala Pro Ser Ala Pro Ala Pro

1 5 10 15

Ala Ala Pro Ser

20

<210> 38

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 38

Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala

1 5 10 15

Ser Pro Ser Ser

20

<210> 39

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 39

Ala Pro Ser Ser Pro Ser Pro Ser Ala Pro Ser Ser Pro Ser Pro Ala

1 5 10 15

Ser Pro Ser

<210> 40

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 40

Ser Ser Pro Ser Ala Pro Ser Pro Ser Ser Pro Ala Ser Pro Ser Pro

1 5 10 15

Ser Ser Pro Ala

20

<210> 41

<211> 24

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 41

Ala Ala Ser Pro Ala Ala Pro Ser Ala Pro Pro Ala Ala Ala Ser Pro

1 5 10 15

Ala Ala Pro Ser Ala Pro Pro Ala

20

<210> 42

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> PAS序列

<400> 42

Ala Ser Ala Ala Ala Pro Ala Ala Ala Ser Ala Ala Ala Ser Ala Pro

1 5 10 15

Ser Ala Ala Ala

20

<210> 43

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> miR142靶标

<400> 43

tccataaagt aggaaacact aca 23

<210> 44

<211> 2332

<212> PRT

<213> 人(Homo sapiens)

<400> 44

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys

485 490 495

His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys

500 505 510

Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys

515 520 525

Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala

530 535 540

Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp

545 550 555 560

Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe

565 570 575

Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln

580 585 590

Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe

595 600 605

Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser

610 615 620

Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu

625 630 635 640

Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr

645 650 655

Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro

660 665 670

Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp

675 680 685

Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala

690 695 700

Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu

705 710 715 720

Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala

725 730 735

Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg

740 745 750

Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys

755 760 765

Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn

770 775 780

Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro

785 790 795 800

His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe

805 810 815

Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser

820 825 830

Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val

835 840 845

Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly

850 855 860

Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser

865 870 875 880

Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala

885 890 895

Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His

900 905 910

Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro

915 920 925

Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp

930 935 940

Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp

945 950 955 960

Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys

965 970 975

Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys

980 985 990

Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala

995 1000 1005

Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu

1010 1015 1020

Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu

1025 1030 1035

Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp

1040 1045 1050

Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr

1055 1060 1065

Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly

1070 1075 1080

Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys

1085 1090 1095

Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His

1100 1105 1110

Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln

1115 1120 1125

Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe

1130 1135 1140

Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr

1145 1150 1155

Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn

1160 1165 1170

Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu Asn Asn Thr His

1175 1180 1185

Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr

1190 1195 1200

Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr Val Thr

1205 1210 1215

Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg

1220 1225 1230

Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu

1235 1240 1245

Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys

1250 1255 1260

His Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu

1265 1270 1275

Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys

1280 1285 1290

Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr

1295 1300 1305

Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu

1310 1315 1320

Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr

1325 1330 1335

Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr

1340 1345 1350

Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser

1355 1360 1365

Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala

1370 1375 1380

Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser

1385 1390 1395

Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser

1400 1405 1410

Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val

1415 1420 1425

Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu

1430 1435 1440

Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu

1445 1450 1455

Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys

1460 1465 1470

Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr

1475 1480 1485

Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys

1490 1495 1500

Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu

1505 1510 1515

Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile

1520 1525 1530

Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg

1535 1540 1545

Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp

1550 1555 1560

Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu

1565 1570 1575

Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys

1580 1585 1590

Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His

1595 1600 1605

Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu

1610 1615 1620

Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln

1625 1630 1635

Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

1640 1645 1650

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile

1655 1660 1665

Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp

1670 1675 1680

Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr

1685 1690 1695

Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser

1700 1705 1710

Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro

1715 1720 1725

Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe

1730 1735 1740

Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu

1745 1750 1755

Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val

1760 1765 1770

Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser

1775 1780 1785

Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg

1790 1795 1800

Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys

1805 1810 1815

Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys

1820 1825 1830

Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His

1835 1840 1845

Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu

1850 1855 1860

Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu

1865 1870 1875

Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu

1880 1885 1890

Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu

1895 1900 1905

Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly

1910 1915 1920

Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln

1925 1930 1935

Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile

1940 1945 1950

His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys

1955 1960 1965

Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe

1970 1975 1980

Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val

1985 1990 1995

Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu

2000 2005 2010

Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala

2015 2020 2025

Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr

2030 2035 2040

Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser

2045 2050 2055

Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val

2060 2065 2070

Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly

2075 2080 2085

Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile

2090 2095 2100

Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn

2105 2110 2115

Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser

2120 2125 2130

Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr

2135 2140 2145

Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg

2150 2155 2160

Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu

2165 2170 2175

Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser

2180 2185 2190

Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala

2195 2200 2205

Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val

2210 2215 2220

Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met

2225 2230 2235

Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr

2240 2245 2250

Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly

2255 2260 2265

His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe

2270 2275 2280

Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp

2285 2290 2295

Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp

2300 2305 2310

Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala

2315 2320 2325

Gln Asp Leu Tyr

2330

<210> 45

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 人IgG1的氨基酸233-236

<400> 45

Glu Leu Leu Gly

1

<210> 46

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE42-4,蛋白质序列

<400> 46

Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser

35 40

<210> 47

<211> 126

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE42-4,DNA序列

<400> 47

ggcgcgccag gttctcctgc tggctccccc acctcaacag aagaggggac aagcgaaagc 60

gctacgcctg agagtggccc tggctctgag ccagccacct ccggctctga aacccctgcc 120

tcgagc 126

<210> 48

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE144-2A,蛋白质序列

<400> 48

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

1 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

130 135 140

<210> 49

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE144-2A,DNA序列

<400> 49

ggcgcgccaa ccagtacgga gccgtccgag gggagcgcac caggaagccc ggctgggagc 60

ccgacttcta ccgaagaggg tacatctacc gaaccaagtg aaggttcagc accaggcacc 120

tcaacagaac cctctgaggg ctcggcgcct ggtacaagtg agtccgccac cccagaatcc 180

gggcctggga caagcacaga accttcggaa gggagtgccc ctggaacatc cgaatcggca 240

accccagaat cagggccagg atctgagccc gcgacttcgg gctccgagac gcctgggaca 300

tccaccgagc cctccgaagg atcagcccca ggcaccagca cggagccctc tgagggaagc 360

gcacctggta ccagcgaaag cgcaactccc gaatcaggtc ccggtacgag cgagtcggcg 420

accccggaga gcgggccagg tgcctcgagc 450

<210> 50

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE144-3B,蛋白质序列

<400> 50

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

65 70 75 80

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

100 105 110

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 51

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE144-3B,DNA序列

<400> 51

ggcgcgccaa gtcccgctgg aagcccaact agcaccgaag aggggacctc agagtccgcc 60

acccccgagt ccggccctgg ctctgagcct gccactagcg gctccgagac tcctggcaca 120

tccgaaagcg ctacacccga gagtggaccc ggcacctcta ccgagcccag tgagggctcc 180

gcccctggaa caagcaccga gcccagcgaa ggcagcgccc cagggacctc cacagagccc 240

agtgaaggca gtgctcctgg caccagcacc gaaccaagcg agggctctgc acccgggacc 300

tccaccgagc caagcgaagg ctctgcccct ggcacttcca ccgagcccag cgaaggcagc 360

gcccctggga gccccgctgg ctctcccacc agcactgagg agggcacatc taccgaacca 420

agtgaaggct ctgcaccagg tgcctcgagc 450

<210> 52

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE144-4A,蛋白质序列

<400> 52

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

85 90 95

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

100 105 110

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 53

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE144-4A,DNA序列

<400> 53

ggcgcgccaa cgtccgaaag tgctacccct gagtcaggcc ctggtagtga gcctgccaca 60

agcggaagcg aaactccggg gacctcagag tctgccactc ccgaatcggg gccaggctct 120

gaaccggcca cttcagggag cgaaacacca ggaacatcgg agagcgctac cccggagagc 180

gggccaggaa ctagtactga gcctagcgag ggaagtgcac ctggtacaag cgagtccgcc 240

acacccgagt ctggccctgg ctctccagcg ggctcaccca cgagcactga agagggctct 300

cccgctggca gcccaacgtc gacagaagaa ggatcaccag caggctcccc cacatcaaca 360

gaggagggta catcagaatc tgctactccc gagagtggac ccggtacctc cactgagccc 420

agcgagggga gtgcaccagg tgcctcgagc 450

<210> 54

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE144-5A,蛋白质序列

<400> 54

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

85 90 95

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

100 105 110

Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

115 120 125

Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

130 135 140

<210> 55

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE144-5A,DNA序列

<400> 55

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420

cccaccagca ctgaagaagg tgcctcgagc 450

<210> 56

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AE144-6B,蛋白质序列

<400> 56

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala

100 105 110

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 57

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AE144-6B,DNA序列

<400> 57

ggcgcgccaa catctaccga gccttccgaa ggctctgccc ctgggacctc agaatctgca 60

acccctgaaa gcggccctgg aacctccgaa agtgccactc ccgagagcgg cccagggaca 120

agcgagtcag caacccctga gtctggaccc ggcagcgagc ctgcaacctc tggctcagag 180

actcccggct cagaacccgc tacctcaggc tccgagacac ccggctctcc tgctgggagt 240

cccacttcca ccgaggaagg aacatccact gagcctagtg agggctctgc ccctggaacc 300

agcacagagc caagtgaggg cagtgcacca ggatccgagc cagcaaccag cgggtccgag 360

actcccggga cctctgagtc tgccacccca gagagcggac ccggcacttc aaccgagccc 420

tccgaaggat cagcaccagg tgcctcgagc 450

<210> 58

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AG144-1,蛋白质序列

<400> 58

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser

1 5 10 15

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

20 25 30

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

35 40 45

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser

50 55 60

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

65 70 75 80

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

85 90 95

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser

100 105 110

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

115 120 125

Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

130 135 140

<210> 59

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AG144-1,DNA序列

<400> 59

ggcgcgccac ccgggtcgtc cccgtcggcg tccaccggaa cagggccagg gtcatccccg 60

tcagcgtcga ctgggacggg acccgggaca cccggttcgg ggactgcatc ctcctcgcct 120

ggttcgtcca ccccgtcagg agccacgggt tcgccgggaa gcagcccaag cgcatccact 180

ggtacagggc ctggggcttc accgggtact tcatccacgg ggtcaccggg aacgcccgga 240

tcggggacgg cttcctcatc accaggatcg tcaacaccct cgggcgcaac gggcagcccc 300

ggaacccctg gttcgggtac ggcgtcgtcg agccccggtg cgagcccggg aacaagctcg 360

acaggatcgc ctggggcgtc acccggcacg tcgagcacag gcagccccgg aacccctgga 420

tcgggaaccg cgtcgtcaag cgcctcgagc 450

<210> 60

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AG144-A,蛋白质序列

<400> 60

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 61

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AG144-A,DNA序列

<400> 61

ggcgcgccag gtgcctcgcc gggaacatca tcaactggtt cacccgggtc atccccctcg 60

gcctcaaccg ggacgggtcc cggctcatcc cccagcgcca gcactggaac aggtcctggc 120

actcctggtt ccggtacggc atcgtcatcc ccgggaagct caacaccgtc cggagcgaca 180

ggatcacctg gctcgtcacc ttcggcgtca actggaacgg ggccaggggc ctcacccgga 240

acgtcctcga ctgggtcgcc tggtacgccg ggatcaggaa cggcctcatc ctcgcctggg 300

tcctcaacgc cctcgggtgc gactggttcg ccgggaactc ctggctcggg gacggcctcg 360

tcgtcgcctg gggcatcacc ggggacgagc tccacggggt cccctggagc gtcaccgggg 420

acctcctcga caggtagccc ggcctcgagc 450

<210> 62

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AG144-B,蛋白质序列

<400> 62

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

1 5 10 15

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

65 70 75 80

Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro

100 105 110

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 63

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AG144-B,DNA序列

<400> 63

ggcgcgccag gtacaccggg cagcggcacg gcttcgtcgt cacccggctc gtccacaccg 60

tcgggagcta cgggaagccc aggagcgtca ccgggaacgt cgtcaacggg gtcaccgggt 120

acgccaggta gcggcacggc cagcagctcg ccaggttcat cgaccccgtc gggagcgact 180

gggtcgcccg gatcaagccc gtcagcttcc actggaacag gacccgggtc gtcgccgtca 240

gcctcaacgg ggacaggacc tggttcatcg acgccgtcag gggcgacagg ctcgcccgga 300

tcgtcaacac cctcgggggc aacggggagc cctggtgcgt cgcctggaac ctcatccacc 360

ggaagcccgg gggcctcgcc gggtacgagc tccacgggat cgcccggagc gtcccccgga 420

acttcaagca cagggagccc tgcctcgagc 450

<210> 64

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AG144-C,蛋白质序列

<400> 64

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro

1 5 10 15

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

35 40 45

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

50 55 60

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

85 90 95

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

100 105 110

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 65

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AG144-C,DNA序列

<400> 65

ggcgcgccag gtacacccgg atcgggtaca gcgtcatcga gccccggtgc gtcacctggt 60

acgtcgagca cggggtcgcc aggggcgtcc cctgggacgt cctcaacagg ctcgcccggt 120

gcgtcacccg gcacgtcgtc cacgggttca cctggtagct ccccttccgc gtccactggc 180

accgggcctg gaactccggg gagcggcaca gcgagctcgt cgccgggagc atcgcctggg 240

acatcgagca ccgggtcgcc aggagcatcg cccggaacat ccagcacagg aagccccggc 300

gcgtcgcccg ggacatcaag cacaggttcc ccgggatcga gcacgccgtc cggagccact 360

ggatcaccag ggagctcgac accttccggc gcaacgggat cgcccggagc cagcccgggt 420

acgtcaagca ctggctcccc tgcctcgagc 450

<210> 66

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN AG144-F,蛋白质序列

<400> 66

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

1 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

20 25 30

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

85 90 95

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

100 105 110

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 67

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN AG144-F,DNA序列

<400> 67

ggcgcgccag gctccagccc ctccgcgagc acgggaaccg gaccaggttc gtcaccctca 60

gcatcaacgg ggacgggacc gggggcgtca ccaggaacgt cctccaccgg ctcgccgggt 120

gcatcacccg gaacgtcatc gaccggatcg ccagggagct cgacgccatc aggcgcaaca 180

ggatcacctg gctcaagccc tagcgcgtca accggcacgg gtccgggtgc ctcccctggc 240

acgtccagca ccggatcacc cggatcgagc ccatccgcct caaccggaac cggacccggt 300

acaccagggt cgggaacagc ctcctcgtca ccaggctcct caaccccctc gggagccacg 360

ggttcgcccg gttcgtcaac gccttccgga gcaactggta gccccggagc atcgccagga 420

acttcgagca cggggtcgcc cgcctcgagc 450

<210> 68

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-1 DNA序列

<400> 68

atgcagattg agctgtctac ttgctttttc ctgtgcctgc tgaggttttg cttttccgct 60

acacgaaggt attatctggg ggctgtggaa ctgtcttggg attacatgca gagtgacctg 120

ggagagctgc cagtggacgc aaggtttccc cctagagtcc ctaagtcatt ccccttcaac 180

actagcgtgg tctacaagaa aacactgttc gtggagttta ctgatcacct gttcaacatc 240

gcaaagccta ggccaccctg gatgggactg ctggggccaa caatccaggc cgaggtgtac 300

gacaccgtgg tcattacact taagaacatg gcctcacacc ccgtgagcct gcatgctgtg 360

ggcgtcagct actggaaggc ttccgaagga gcagagtatg acgatcagac ttcccagaga 420

gaaaaagagg acgataaggt gtttcctggc ggatctcata cctacgtgtg gcaggtcctg 480

aaagagaatg gccctatggc ctccgaccct ctgtgcctga cctactctta tctgagtcac 540

gtggacctgg tcaaggatct gaacagcggc ctgatcggag ccctgctggt gtgcagggaa 600

ggaagcctgg ctaaggagaa aacccagaca ctgcataagt tcattctgct gttcgccgtg 660

tttgacgaag ggaaatcatg gcacagcgag acaaagaata gtctgatgca ggacagggat 720

gccgcttcag ccagagcttg gcccaaaatg cacactgtga acggctacgt caatcgctca 780

ctgcctgggc tgatcggctg ccaccgaaag agcgtgtatt ggcatgtcat cgggatgggc 840

accacacctg aagtgcactc cattttcctg gagggacata cctttctggt ccgcaaccac 900

cgacaggctt ccctggagat ctctccaatt accttcctga cagcacagac tctgctgatg 960

gacctggggc agttcctgct gttttgccac atcagctccc accagcatga tggcatggag 1020

gcttacgtga aagtggactc ttgtcccgag gaacctcagc tgcggatgaa gaacaatgag 1080

gaagcagaag actatgacga tgacctgacc gactccgaga tggatgtggt ccgattcgat 1140

gacgataaca gcccctcctt tatccagatt agatctgtgg ccaagaaaca ccctaagaca 1200

tgggtccatt acatcgcagc cgaggaagag gactgggatt atgcaccact ggtgctggca 1260

ccagacgatc gctcctacaa atctcagtat ctgaacaatg ggccacagag gattggcaga 1320

aagtacaaga aagtgcggtt catggcatat accgatgaga ccttcaagac tcgcgaagcc 1380

atccagcacg agagcggcat cctgggacca ctgctgtacg gagaagtggg agacaccctg 1440

ctgatcattt tcaagaacca ggccagccgg ccttacaata tctatccaca tgggattaca 1500

gatgtgcgcc ctctgtacag caggagactg ccaaagggcg tcaaacacct gaaggacttc 1560

ccaatcctgc ccggagaaat cttcaagtac aagtggactg tcaccgtcga ggatggcccc 1620

actaagagcg accctcggtg cctgacccgc tactattcta gtttcgtgaa tatggaaaga 1680

gatctggcaa gcggactgat cggaccactg ctgatttgtt acaaagagag cgtggatcag 1740

agaggcaacc agatcatgtc cgacaagcgg aatgtgattc tgttcagtgt ctttgacgaa 1800

aacaggtcat ggtacctgac cgagaacatc cagagattcc tgcctaatcc agctggggtg 1860

cagctggaag atcctgagtt tcaggcatct aacatcatgc atagtattaa tggctacgtg 1920

ttcgacagtt tgcagctgag cgtgtgcctg cacgaggtcg cttactggta tatcctgagc 1980

attggggcac agacagattt cctgagcgtg ttcttttccg gctacacttt taagcataaa 2040

atggtctatg aggacacact gactctgttc cccttcagcg gcgaaaccgt gtttatgagc 2100

atggagaatc ccggactgtg gattctgggg tgccacaaca gcgatttcag aaatcgcgga 2160

atgactgccc tgctgaaagt gtcaagctgt gacaagaaca ccggggacta ctatgaagat 2220

tcatacgagg acatcagcgc atatctgctg tccaaaaaca atgccattga accccggtct 2280

tttagtcaga atcctccagt gctgaagagg caccagaggg agatcacccg cactaccctg 2340

cagagtgatc aggaagagat cgactacgac gatacaattt ctgtggaaat gaagaaagag 2400

gacttcgata tctatgacga agatgagaac cagagtcctc gatcattcca gaagaaaacc 2460

aggcattact ttattgccgc agtggagcgg ctgtgggatt atggcatgtc ctctagtcct 2520

cacgtgctgc gaaatagggc ccagtcagga agcgtcccac agttcaagaa agtggtcttc 2580

caggagttta cagacgggtc ctttactcag ccactgtaca ggggcgaact gaacgagcac 2640

ctgggactgc tggggcccta tatcagagca gaagtggagg ataacattat ggtcaccttc 2700

agaaatcagg cctctcggcc ttacagtttt tattcaagcc tgatctctta cgaagaggac 2760

cagcgacagg gagctgaacc acgaaaaaac ttcgtgaagc ctaatgagac caaaacatac 2820

ttttggaagg tgcagcacca tatggcccca acaaaagacg agttcgattg caaggcatgg 2880

gcctattttt ctgacgtgga tctggagaag gacgtgcaca gtggcctgat tggcccactg 2940

ctggtgtgcc atactaacac cctgaatcca gcccacggcc ggcaggtcac tgtccaggag 3000

ttcgctctgt tctttaccat ctttgatgag acaaagagct ggtacttcac cgaaaacatg 3060

gagcgaaatt gcagggctcc atgtaacatt cagatggaag accccacatt caaggagaac 3120

taccgctttc atgctatcaa tggatacatc atggatactc tgcccgggct ggtcatggca 3180

caggaccaga gaatccggtg gtatctgctg agcatgggca gcaacgagaa tatccactca 3240

attcatttca gcgggcacgt gtttactgtc aggaagaaag aagagtacaa gatggccctg 3300

tacaacctgt atcccggcgt gttcgaaacc gtcgagatgc tgcctagcaa ggccggaatc 3360

tggagagtgg aatgcctgat tggagagcac ctgcatgctg ggatgtctac cctgtttctg 3420

gtgtacagta ataagtgtca gacacccctg ggaatggcat ccgggcatat cagggatttc 3480

cagattaccg catctggaca gtacggacag tgggcaccta agctggctag actgcactat 3540

tccggatcta tcaacgcttg gtccacaaaa gagcctttct cttggattaa ggtggacctg 3600

ctggccccaa tgatcattca tggcatcaaa actcagggag ctcggcagaa gttctcctct 3660

ctgtacatct cacagtttat catcatgtac agcctggatg ggaagaaatg gcagacatac 3720

cgcggcaata gcacaggaac tctgatggtg ttctttggca acgtggacag cagcggaatc 3780

aagcacaaca ttttcaatcc ccctatcatt gctagataca tccggctgca cccaacccat 3840

tattctattc gaagtacact gaggatggaa ctgatgggat gcgatctgaa cagttgttca 3900

atgcccctgg ggatggagtc caaggcaatc tctgacgccc agattaccgc cagctcctac 3960

ttcactaata tgtttgctac ctggagccct tccaaagcaa gactgcacct gcaaggccgc 4020

agcaacgcat ggcgaccaca ggtgaacaat cccaaggagt ggttgcaggt cgattttcag 4080

aaaactatga aggtgaccgg ggtcacaact cagggcgtga aaagtctgct gacctcaatg 4140

tacgtcaagg agttcctgat ctctagttca caggacggac atcagtggac actgttcttt 4200

cagaacggga aggtgaaagt cttccagggc aatcaggatt cctttacacc tgtggtcaac 4260

agtctagacc ctccactgct gaccagatac ctgagaatcc accctcagtc ctgggtgcac 4320

cagattgccc tgagaatgga agtgctggga tgcgaggccc aggatctgta ctga 4374

<210> 69

<211> 577

<212> DNA

<213> 人工序列

<220>

<223> ET启动子,DNA序列

<400> 69

ctcgaggtca attcacgcga gttaataatt accagcgcgg gccaaataaa taatccgcga 60

ggggcaggtg acgtttgccc agcgcgcgct ggtaattatt aacctcgcga atattgattc 120

gaggccgcga ttgccgcaat cgcgaggggc aggtgacctt tgcccagcgc gcgttcgccc 180

cgccccggac ggtatcgata agcttaggag cttgggctgc aggtcgaggg cactgggagg 240

atgttgagta agatggaaaa ctactgatga cccttgcaga gacagagtat taggacatgt 300

ttgaacaggg gccgggcgat cagcaggtag ctctagagga tccccgtctg tctgcacatt 360

tcgtagagcg agtgttccga tactctaatc tccctaggca aggttcatat ttgtgtaggt 420

tacttattct ccttttgttg actaagtcaa taatcagaat cagcaggttt ggagtcagct 480

tggcagggat cagcagcctg ggttggaagg agggggtata aaagcccctt caccaggaga 540

agccgtcaca cagatccaca agctcctgcc accatgg 577

<210> 70

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-5

<400> 70

atgcaaatcg aactgagcac ctgtttcttc ctctgcctgc tgagattctg tttctccgcg 60

acccgccgat actacctggg agcagtggag ctctcctggg attacatgca gagcgacctt 120

ggggagctgc ccgtggatgc caggttccct ccccgggtgc caaagtcgtt tccgttcaac 180

acctccgtgg tgtacaagaa aactctgttc gtggagttca ccgaccacct gttcaatatc 240

gccaagccca gacctccctg gatggggctg ttgggaccta ccatccaagc ggaggtgtac 300

gacactgtgg tcatcactct gaagaacatg gcctcgcatc ccgtgtccct gcacgccgtg 360

ggagtgtctt actggaaagc gtccgagggg gccgaatacg acgaccagac ctcgcagaga 420

gaaaaggaag atgacaaggt gttcccagga ggatcgcaca cctacgtgtg gcaagtgttg 480

aaggagaacg gcccaatggc ctccgacccg ctgtgcctga cctactcgta cctgtcccac 540

gtggacctcg tgaaggacct caactcggga ctgattggag ccctgctggt ctgcagggaa 600

ggctcactgg cgaaagaaaa gactcagacc ttgcacaagt tcattctgct gttcgctgtg 660

ttcgacgagg ggaagtcgtg gcacagcgag actaagaact ccctgatgca agatagagat 720

gccgcctccg cccgggcctg gcctaagatg cacaccgtga acggttacgt gaaccgctcc 780

ctccctggcc tgattggatg ccaccggaag tccgtgtact ggcacgtgat cgggatgggg 840

accacccccg aggtgcacag catcttcctg gaaggtcaca catttctcgt gcgcaaccac 900

cggcaggcct ccctggaaat cagccccatt accttcctca ctgcccagac tctgctgatg 960

gacctgggac agttcctgct gttctgccat atctcctccc accaacatga cggaatggag 1020

gcatacgtga aggtcgattc ctgccctgag gaaccccagc tccgcatgaa gaacaatgag 1080

gaagccgagg actacgacga cgacctgacg gatagcgaga tggatgtggt ccggttcgat 1140

gacgataaca gcccttcctt catccaaatt cgctcggtgg caaagaagca ccccaagacc 1200

tgggtgcatt acattgcggc ggaagaagag gactgggatt atgccccgct tgtcctcgct 1260

cctgacgacc ggagctacaa gagccagtac ctgaacaacg gtccacagag gatcggtaga 1320

aagtacaaga aggtccgctt catggcctat accgacgaaa ccttcaaaac tagagaggcc 1380

atccaacacg aatccggcat cctgggcccg ctcttgtacg gagaagtcgg cgacaccctt 1440

ctcattatct tcaagaacca ggcttcccgg ccgtacaaca tctatccgca tgggatcact 1500

gacgtgcgcc cactgtactc gcggcgcctg cccaagggtg tcaaacacct gaaggatttt 1560

ccgatccttc cgggagaaat cttcaagtac aagtggaccg tgaccgtgga agatggccca 1620

actaagtctg accctagatg cctcacccgc tactactcat ccttcgtcaa catggagcgc 1680

gacctggcca gcggactgat cggcccgctg ctgatttgct acaaggaatc agtggaccaa 1740

cggggaaacc agatcatgtc ggataagagg aacgtcatcc tcttctccgt gtttgacgaa 1800

aaccggtcgt ggtacctgac tgaaaacatc cagcggttcc tccccaaccc cgcgggcgtg 1860

cagctggaag atcctgagtt tcaggcatca aacatcatgc actccattaa cggctacgtg 1920

ttcgattcgc tgcagctgag cgtgtgtctg cacgaagtgg cctactggta catcctgtcc 1980

attggtgccc agactgactt cctgtccgtg tttttctccg gctacacgtt caagcacaag 2040

atggtgtacg aggacaccct gaccctcttc cctttttccg gcgaaactgt gtttatgagc 2100

atggagaatc ccggcctgtg gatcttgggc tgccacaaca gcgacttccg taacagagga 2160

atgactgcgc tgctcaaggt gtccagctgc gacaagaaca ccggagacta ttatgaggac 2220

tcatacgagg acatctccgc ctacctcctg tccaagaata acgccattga acctcggagc 2280

ttcagccaga acccacccgt gcttaagaga catcaacggg agatcactag gaccaccctg 2340

cagtcagacc aggaggaaat cgactacgat gacaccatct cggtcgagat gaagaaggag 2400

gactttgaca tctacgacga agatgaaaac cagagcccga ggtcgttcca aaagaaaacc 2460

cgccactact ttattgctgc tgtcgagcgg ctgtgggact acggaatgtc gtcctcgccg 2520

cacgtgctcc gcaaccgagc ccagagcggc tcggtgccgc aattcaagaa ggtcgtgttc 2580

caggagttca ctgacgggag cttcactcag cctttgtacc ggggagaact caatgaacat 2640

ctcggcctcc tcggacctta catcagagca gaagtggaag ataacatcat ggtcactttc 2700

cgtaaccaag ccagccgccc gtactcgttc tactcctccc tcatttctta cgaagaggac 2760

cagcggcagg gcgcagaacc gcgcaagaac ttcgtgaagc ccaacgaaac caagacctac 2820

ttctggaaag tgcagcatca tatggccccg actaaggacg agtttgactg caaagcctgg 2880

gcctacttct ccgatgtgga cttggagaag gacgtccact ccggcctcat cggtcccctg 2940

ctcgtgtgcc ataccaatac cctgaacccc gcacacggtc gccaggtcac cgtgcaggag 3000

ttcgctctgt tcttcactat cttcgacgaa actaagtcct ggtacttcac cgagaacatg 3060

gagaggaact gcagagcccc ctgtaacatc cagatggagg acccgacgtt caaggaaaac 3120

taccggttcc acgccattaa cggatacatc atggatacgc tgccgggtct tgtgatggcc 3180

caggatcaac ggatcagatg gtacttattg tcgatgggca gcaacgagaa catccactct 3240

attcacttct ccggtcatgt gttcactgtg cggaagaagg aagagtacaa gatggccctg 3300

tacaaccttt atcccggagt gttcgaaact gtggaaatgc tgccgtcgaa ggccggcatt 3360

tggcgcgtgg agtgtttgat tggagaacat ctccatgcgg ggatgtcaac cctgttcctg 3420

gtgtatagca acaagtgcca gactccgctt gggatggcgt caggacacat tagggatttc 3480

cagatcactg cgtccggcca gtacggccaa tgggccccta agctggcccg cctgcattac 3540

tccggatcca ttaacgcctg gtcaaccaag gagccattct cctggatcaa ggtggacctt 3600

ctggccccca tgattatcca cggaattaag acccaggggg cccggcagaa gttctcctca 3660

ctgtacatca gccagttcat aatcatgtac tccctggacg gaaagaagtg gcaaacctac 3720

agggggaaca gcaccggcac actgatggtc tttttcggaa atgtggactc ctccgggatt 3780

aagcataaca tcttcaaccc tccgattatc gctcggtaca ttagacttca ccctacccac 3840

tacagcattc gctccaccct gcggatggaa ctgatgggct gcgatctgaa ctcgtgcagc 3900

atgccgttgg gaatggagtc caaagcaatt tccgacgcgc agatcaccgc ctcgtcctac 3960

tttaccaaca tgttcgccac gtggtcaccg tccaaggccc ggctgcacct ccagggaaga 4020

tccaacgcat ggcggccaca ggtcaacaac cctaaggagt ggctccaggt ggacttccag 4080

aaaaccatga aggtcaccgg agtcacaacc cagggagtga agtcgctgct gacttctatg 4140

tacgtcaagg agttcctgat ctccagcagc caggacgggc accagtggac cctgttcttc 4200

caaaatggaa aggtcaaggt gtttcagggc aatcaggatt cattcacccc ggtggtgaac 4260

tcccttgatc cacccctcct gacccgctac cttcgcatcc acccacagtc ctgggtgcac 4320

cagatcgcgc tgaggatgga ggtcctggga tgcgaagccc aggacctgta ctga 4374

<210> 71

<211> 4374

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-6

<400> 71

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280

ttcagccaga acccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc 2340

caatcggatc aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa 2400

gatttcgata tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact 2460

agacactact ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct 2520

cacgtccttc ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc 2580

caggagttca ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac 2640

ctgggcctgc tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc 2700

cgtaaccaag catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac 2760

cagcgccaag gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac 2820

ttctggaagg tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg 2880

gcctacttct ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg 2940

ctcgtgtgtc acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag 3000

tttgctctgt tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg 3060

gagcgaaact gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac 3120

tatagattcc acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc 3180

caggatcaga ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc 3240

attcacttct ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg 3300

tacaatctgt accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc 3360

tggagagtgg agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg 3420

gtgtactcga ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc 3480

cagatcacag caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac 3540

tccggatcga tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc 3600

ctggccccta tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc 3660

ctgtacatct cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac 3720

aggggaaact ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt 3780

aagcacaaca tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac 3840

tactcaatcc gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc 3900

atgccgttgg ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac 3960

ttcactaaca tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg 4020

tcaaatgcct ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa 4080

aagaccatga aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg 4140

tatgtgaagg agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc 4200

caaaacggaa aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac 4260

tccctggacc ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat 4320

cagattgcat tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctga 4374

<210> 72

<211> 4824

<212> DNA

<213> 人工序列

<220>

<223> coFVIII-6-XTEN

<400> 72

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920

ttcgactcgc tgcagctgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280

ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760

caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820

gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880

cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940

ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000

tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060

ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120

gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180

tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240

ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300

accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360

gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420

gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480

actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540

cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600

atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660

tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720

cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780

gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840

ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900

ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960

tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020

gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080

acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140

agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200

tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260

gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320

ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380

agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440

tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500

ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560

cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620

caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680

aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740

ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800

tgcgaggccc aggacctgta ctga 4824

<210> 73

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AD基序

<400> 73

Gly Glu Ser Pro Gly Gly Ser Ser Gly Ser Glu Ser

1 5 10

<210> 74

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AD基序

<400> 74

Gly Ser Glu Gly Ser Ser Gly Pro Gly Glu Ser Ser

1 5 10

<210> 75

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AD基序

<400> 75

Gly Ser Ser Glu Ser Gly Ser Ser Glu Gly Gly Pro

1 5 10

<210> 76

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AD基序

<400> 76

Gly Ser Gly Gly Glu Pro Ser Glu Ser Gly Ser Ser

1 5 10

<210> 77

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AE、AM基序

<400> 77

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

1 5 10

<210> 78

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AE、AM、AQ基序

<400> 78

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

1 5 10

<210> 79

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AE、AM、AQ基序

<400> 79

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

1 5 10

<210> 80

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AE、AM、AQ基序

<400> 80

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

1 5 10

<210> 81

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AF、AM基序

<400> 81

Gly Ser Thr Ser Glu Ser Pro Ser Gly Thr Ala Pro

1 5 10

<210> 82

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AF、AM基序

<400> 82

Gly Thr Ser Thr Pro Glu Ser Gly Ser Ala Ser Pro

1 5 10

<210> 83

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AF、AM基序

<400> 83

Gly Thr Ser Pro Ser Gly Glu Ser Ser Thr Ala Pro

1 5 10

<210> 84

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AF、AM基序

<400> 84

Gly Ser Thr Ser Ser Thr Ala Glu Ser Pro Gly Pro

1 5 10

<210> 85

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AG、AM基序

<400> 85

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

1 5 10

<210> 86

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AG、AM基序

<400> 86

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

1 5 10

<210> 87

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AG、AM基序

<400> 87

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

1 5 10

<210> 88

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AG、AM基序

<400> 88

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

1 5 10

<210> 89

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 89

Gly Glu Pro Ala Gly Ser Pro Thr Ser Thr Ser Glu

1 5 10

<210> 90

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 90

Gly Thr Gly Glu Pro Ser Ser Thr Pro Ala Ser Glu

1 5 10

<210> 91

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 91

Gly Ser Gly Pro Ser Thr Glu Ser Ala Pro Thr Glu

1 5 10

<210> 92

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 92

Gly Ser Glu Thr Pro Ser Gly Pro Ser Glu Thr Ala

1 5 10

<210> 93

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 93

Gly Pro Ser Glu Thr Ser Thr Ser Glu Pro Gly Ala

1 5 10

<210> 94

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> AQ基序

<400> 94

Gly Ser Pro Ser Glu Pro Thr Glu Gly Thr Ser Ala

1 5 10

<210> 95

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BC基序

<400> 95

Gly Ser Gly Ala Ser Glu Pro Thr Ser Thr Glu Pro

1 5 10

<210> 96

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BC基序

<400> 96

Gly Ser Glu Pro Ala Thr Ser Gly Thr Glu Pro Ser

1 5 10

<210> 97

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BC基序

<400> 97

Gly Thr Ser Glu Pro Ser Thr Ser Glu Pro Gly Ala

1 5 10

<210> 98

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BC基序

<400> 98

Gly Thr Ser Thr Glu Pro Ser Glu Pro Gly Ser Ala

1 5 10

<210> 99

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BD基序

<400> 99

Gly Ser Thr Ala Gly Ser Glu Thr Ser Thr Glu Ala

1 5 10

<210> 100

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BD基序

<400> 100

Gly Ser Glu Thr Ala Thr Ser Gly Ser Glu Thr Ala

1 5 10

<210> 101

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BD基序

<400> 101

Gly Thr Ser Glu Ser Ala Thr Ser Glu Ser Gly Ala

1 5 10

<210> 102

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> BD基序

<400> 102

Gly Thr Ser Thr Glu Ala Ser Glu Gly Ser Ala Ser

1 5 10

<210> 103

<211> 1607

<212> PRT

<213> 人工序列

<220>

<223> coFVIII-6-XTEN蛋白质序列

<400> 103

Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe

1 5 10 15

Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser

20 25 30

Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg

35 40 45

Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val

50 55 60

Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile

65 70 75 80

Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln

85 90 95

Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser

100 105 110

His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser

115 120 125

Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp

130 135 140

Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu

145 150 155 160

Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser

165 170 175

Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile

180 185 190

Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr

195 200 205

Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly

210 215 220

Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp

225 230 235 240

Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr

245 250 255

Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val

260 265 270

Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile

275 280 285

Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser

290 295 300

Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met

305 310 315 320

Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His

325 330 335

Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro

340 345 350

Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp

355 360 365

Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser

370 375 380

Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr

385 390 395 400

Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro

405 410 415

Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn

420 425 430

Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met

435 440 445

Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu

450 455 460

Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu

465 470 475 480

Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro

485 490 495

His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys

500 505 510

Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe

515 520 525

Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp

530 535 540

Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg

545 550 555 560

Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu

565 570 575

Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val

580 585 590

Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu

595 600 605

Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp

610 615 620

Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val

625 630 635 640

Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp

645 650 655

Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe

660 665 670

Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr

675 680 685

Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro

690 695 700

Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly

705 710 715 720

Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp

725 730 735

Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys

740 745 750

Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Gly Ala Pro Thr

755 760 765

Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr

770 775 780

Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser

785 790 795 800

Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr

805 810 815

Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro

820 825 830

Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

835 840 845

Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

850 855 860

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

865 870 875 880

Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr

885 890 895

Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ala

900 905 910

Ser Ser Pro Pro Val Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr

915 920 925

Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser

930 935 940

Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn

945 950 955 960

Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala

965 970 975

Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val

980 985 990

Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val

995 1000 1005

Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr

1010 1015 1020

Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile

1025 1030 1035

Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln

1040 1045 1050

Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu

1055 1060 1065

Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys

1070 1075 1080

Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met

1085 1090 1095

Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe

1100 1105 1110

Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly

1115 1120 1125

Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly

1130 1135 1140

Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe

1145 1150 1155

Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn

1160 1165 1170

Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys

1175 1180 1185

Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr

1190 1195 1200

Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr

1205 1210 1215

Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe

1220 1225 1230

Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met

1235 1240 1245

Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met

1250 1255 1260

Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly

1265 1270 1275

Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser

1280 1285 1290

Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg

1295 1300 1305

Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro

1310 1315 1320

Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser

1325 1330 1335

Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro

1340 1345 1350

Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe

1355 1360 1365

Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp

1370 1375 1380

Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu

1385 1390 1395

Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn

1400 1405 1410

Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro

1415 1420 1425

Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly

1430 1435 1440

Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys

1445 1450 1455

Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn

1460 1465 1470

Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln

1475 1480 1485

Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu

1490 1495 1500

Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val

1505 1510 1515

Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys

1520 1525 1530

Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu

1535 1540 1545

Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp

1550 1555 1560

Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr

1565 1570 1575

Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala

1580 1585 1590

Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

1595 1600 1605

<210> 104

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> AAV2的Rep结合位点(RBS)

<400> 104

gcgcgctcgc tcgctc 16

<210> 105

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> AAV2的末端解链位点(TRS)

<400> 105

agttgg 6

<210> 106

<211> 2328

<212> PRT

<213> 人工序列

<220>

<223> 成熟全长FVIII

<400> 106

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu

485 490 495

Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr

500 505 510

Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr

515 520 525

Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly

530 535 540

Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg

545 550 555 560

Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val

565 570 575

Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe

580 585 590

Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala

595 600 605

Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln

610 615 620

Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile

625 630 635 640

Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe

645 650 655

Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser

660 665 670

Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu

675 680 685

Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu

690 695 700

Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser

705 710 715 720

Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu

725 730 735

Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg Gln Lys

740 745 750

Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys Thr Asp

755 760 765

Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn Val Ser

770 775 780

Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro His Gly

785 790 795 800

Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe Ser Asp

805 810 815

Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser Glu Met

820 825 830

Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val Phe Thr

835 840 845

Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly Thr Thr

850 855 860

Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser Thr Ser

865 870 875 880

Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala Gly Thr

885 890 895

Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His Tyr Asp

900 905 910

Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro Leu Thr

915 920 925

Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp Ser Lys

930 935 940

Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp Gly Lys

945 950 955 960

Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys Arg Ala

965 970 975

His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys Val Ser

980 985 990

Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala Thr Asn

995 1000 1005

Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn Ser

1010 1015 1020

Pro Ser Val Trp Gln Asn Ile Ser Asp Thr Glu Phe Lys Lys Val

1025 1030 1035

Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala Thr

1040 1045 1050

Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys

1055 1060 1065

Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro

1070 1075 1080

Asp Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu

1085 1090 1095

Pro Glu Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser

1100 1105 1110

Leu Asn Ser Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu

1115 1120 1125

Gly Pro Glu Lys Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys

1130 1135 1140

Asn Lys Val Val Val Gly Lys Gly Glu Phe Thr Lys Asp Val Gly

1145 1150 1155

Leu Lys Glu Met Val Phe Pro Ser Ser Arg Asn Leu Phe Leu Thr

1160 1165 1170

Asn Leu Asp Asn Leu His Glu Asn Asn Thr His Asn Gln Glu Lys

1175 1180 1185

Lys Ile Gln Glu Glu Ile Glu Lys Lys Glu Thr Leu Ile Gln Glu

1190 1195 1200

Asn Val Val Leu Pro Gln Ile His Thr Val Thr Gly Thr Lys Asn

1205 1210 1215

Phe Met Lys Asn Leu Phe Leu Leu Ser Thr Arg Gln Asn Val Glu

1220 1225 1230

Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu Gln Asp Phe Arg

1235 1240 1245

Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His Thr Ala His

1250 1255 1260

Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu Gly Asn

1265 1270 1275

Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg Ile

1280 1285 1290

Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys

1295 1300 1305

Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu

1310 1315 1320

Glu Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys

1325 1330 1335

Asn Met Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr

1340 1345 1350

Asn Glu Lys Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp

1355 1360 1365

Cys Leu Thr Arg Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro

1370 1375 1380

Leu Pro Ile Ala Lys Val Ser Ser Phe Pro Ser Ile Arg Pro Ile

1385 1390 1395

Tyr Leu Thr Arg Val Leu Phe Gln Asp Asn Ser Ser His Leu Pro

1400 1405 1410

Ala Ala Ser Tyr Arg Lys Lys Asp Ser Gly Val Gln Glu Ser Ser

1415 1420 1425

His Phe Leu Gln Gly Ala Lys Lys Asn Asn Leu Ser Leu Ala Ile

1430 1435 1440

Leu Thr Leu Glu Met Thr Gly Asp Gln Arg Glu Val Gly Ser Leu

1445 1450 1455

Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr Lys Lys Val Glu Asn

1460 1465 1470

Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr Ser Gly Lys Val

1475 1480 1485

Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp Leu Phe Pro

1490 1495 1500

Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu Val Glu

1505 1510 1515

Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn Glu

1520 1525 1530

Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu

1535 1540 1545

Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp

1550 1555 1560

Asp Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser

1565 1570 1575

Gln Glu Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr

1580 1585 1590

Ile Leu Ser Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala

1595 1600 1605

Ile Asn Glu Gly Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala

1610 1615 1620

Lys Gln Gly Arg Thr Glu Arg Leu Cys Ser Gln Asn Pro Pro Val

1625 1630 1635

Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser

1640 1645 1650

Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met

1655 1660 1665

Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser

1670 1675 1680

Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala

1685 1690 1695

Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val

1700 1705 1710

Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys

1715 1720 1725

Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu

1730 1735 1740

Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr

1745 1750 1755

Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn

1760 1765 1770

Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr

1775 1780 1785

Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val

1790 1795 1800

Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His

1805 1810 1815

Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr

1820 1825 1830

Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile

1835 1840 1845

Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His

1850 1855 1860

Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile

1865 1870 1875

Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg

1880 1885 1890

Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe

1895 1900 1905

Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp

1910 1915 1920

Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp

1925 1930 1935

Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His

1940 1945 1950

Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys

1955 1960 1965

Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu

1970 1975 1980

Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile

1985 1990 1995

Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr

2000 2005 2010

Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile

2015 2020 2025

Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala

2030 2035 2040

Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp

2045 2050 2055

Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala

2060 2065 2070

Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys

2075 2080 2085

Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu

2090 2095 2100

Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr

2105 2110 2115

Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His

2120 2125 2130

Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His

2135 2140 2145

Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met

2150 2155 2160

Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser

2165 2170 2175

Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr

2180 2185 2190

Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu

2195 2200 2205

Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys

2210 2215 2220

Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly

2225 2230 2235

Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val

2240 2245 2250

Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr

2255 2260 2265

Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln

2270 2275 2280

Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu

2285 2290 2295

Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile

2300 2305 2310

Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr

2315 2320 2325

<210> 107

<211> 7053

<212> DNA

<213> 人工序列

<220>

<223> 成熟全长FVIII

<400> 107

atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc 60

accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc 120

ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac 180

acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc 240

gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat 300

gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt 360

ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg 420

gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg 480

aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat 540

gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa 600

gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta 660

tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat 720

gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct 780

ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc 840

accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat 900

cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg 960

gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa 1020

gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa 1080

gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat 1140

gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact 1200

tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc 1260

cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg 1320

aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct 1380

attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg 1440

ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact 1500

gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt 1560

ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca 1620

actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga 1680

gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa 1740

agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag 1800

aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg 1860

cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt 1920

tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc 1980

attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa 2040

atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg 2100

atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc 2160

atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac 2220

agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc 2280

ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt 2340

ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa 2400

atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat 2460

gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca 2520

cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc 2580

catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag 2640

aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca 2700

tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca 2760

agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta 2820

tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa 2880

aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga 2940

aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct 3000

gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac 3060

aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta 3120

attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa 3180

gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta 3240

aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa 3300

gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc 3360

ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg 3420

caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag 3480

aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta 3540

ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat 3600

ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag 3660

gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag 3720

aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac 3780

ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca 3840

aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga 3900

aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca 3960

agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca 4020

ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc 4080

aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag 4140

aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct 4200

caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct 4260

atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat 4320

agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat 4380

aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc 4440

ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg 4500

aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat 4560

cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg 4620

gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct 4680

ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta 4740

ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa 4800

tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg 4860

aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa 4920

atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca 4980

gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa 5040

attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 5100

gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 5160

gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 5220

gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 5280

tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 5340

tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 5400

ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 5460

cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 5520

catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 5580

gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 5640

acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 5700

atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 5760

ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 5820

aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 5880

tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 5940

gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 6000

gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 6060

attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 6120

cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 6180

caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 6240

tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 6300

cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 6360

atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 6420

accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 6480

cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 6540

cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 6600

agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 6660

acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 6720

caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 6780

ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 6840

atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 6900

gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 6960

ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 7020

gaggttctgg gctgcgaggc acaggacctc tac 7053

<210> 108

<400> 108

000

<210> 109

<211> 1718

<212> PRT

<213> 人工序列

<220>

<223> BIVV001 BDD-FVIII(XTEN)序列(无Fc)

<400> 109

Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr

1 5 10 15

Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro

20 25 30

Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys

35 40 45

Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro

50 55 60

Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val

65 70 75 80

Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val

85 90 95

Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala

100 105 110

Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val

115 120 125

Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn

130 135 140

Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser

145 150 155 160

His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu

165 170 175

Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu

180 185 190

His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp

195 200 205

His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser

210 215 220

Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg

225 230 235 240

Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His

245 250 255

Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu

260 265 270

Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile

275 280 285

Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly

290 295 300

Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met

305 310 315 320

Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg

325 330 335

Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp

340 345 350

Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe

355 360 365

Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His

370 375 380

Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu

385 390 395 400

Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro

405 410 415

Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr

420 425 430

Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile

435 440 445

Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile

450 455 460

Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile

465 470 475 480

Thr Asp Val Arg Pro Lys Arg Arg Leu Pro Lys Gly Val Lys His Leu

485 490 495

Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys Trp Thr

500 505 510

Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys Leu Thr

515 520 525

Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala Ser Gly

530 535 540

Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp Gln Arg

545 550 555 560

Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe Ser Val

565 570 575

Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln Arg Phe

580 585 590

Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe Gln Ala

595 600 605

Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser Leu Gln

610 615 620

Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu Ser Ile

625 630 635 640

Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr Thr Phe

645 650 655

Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro Phe Ser

660 665 670

Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp Ile Leu

675 680 685

Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala Leu Leu

690 695 700

Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu Asp Ser

705 710 715 720

Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala Ile Glu

725 730 735

Pro Arg Ser Phe Ser Gln Asn Gly Thr Ser Glu Ser Ala Thr Pro Glu

740 745 750

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

755 760 765

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

770 775 780

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

785 790 795 800

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

805 810 815

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

820 825 830

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

835 840 845

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

850 855 860

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

865 870 875 880

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

885 890 895

Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

900 905 910

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

915 920 925

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

930 935 940

Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

945 950 955 960

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

965 970 975

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

980 985 990

Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

995 1000 1005

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

1010 1015 1020

Glu Pro Ser Glu Gly Ser Ala Pro Ala Ser Ser Glu Ile Thr Arg

1025 1030 1035

Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr

1040 1045 1050

Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu

1055 1060 1065

Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His

1070 1075 1080

Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser

1085 1090 1095

Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val

1100 1105 1110

Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser

1115 1120 1125

Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly

1130 1135 1140

Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met

1145 1150 1155

Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser

1160 1165 1170

Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro

1175 1180 1185

Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp

1190 1195 1200

Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys

1205 1210 1215

Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val

1220 1225 1230

His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr

1235 1240 1245

Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala

1250 1255 1260

Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr

1265 1270 1275

Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met

1280 1285 1290

Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn

1295 1300 1305

Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp

1310 1315 1320

Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn

1325 1330 1335

Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys

1340 1345 1350

Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val

1355 1360 1365

Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg

1370 1375 1380

Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr

1385 1390 1395

Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met

1400 1405 1410

Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln

1415 1420 1425

Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly

1430 1435 1440

Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys

1445 1450 1455

Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln

1460 1465 1470

Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile

1475 1480 1485

Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly

1490 1495 1500

Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser

1505 1510 1515

Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg

1520 1525 1530

Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu

1535 1540 1545

Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro

1550 1555 1560

Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala

1565 1570 1575

Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys

1580 1585 1590

Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln

1595 1600 1605

Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr

1610 1615 1620

Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu

1625 1630 1635

Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp

1640 1645 1650

Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val

1655 1660 1665

Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu

1670 1675 1680

Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser

1685 1690 1695

Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu

1700 1705 1710

Ala Gln Asp Leu Tyr

1715

<210> 110

<211> 6526

<212> DNA

<213> 人工序列

<220>

<223> NB15.1v32构建体(AAV-FVIIIco6XTEN-ssDNA)

<400> 110

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180

cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240

cgcggccgcc tcgacgacta gcgtttaatt aaacgcgtgt ctgtctgcac atttcgtaga 300

gcgagtgttc cgatactcta atctccctag gcaaggttca tatttgtgta ggttacttat 360

tctccttttg ttgactaagt caataatcag aatcagcagg tttggagtca gcttggcagg 420

gatcagcagc ctgggttgga aggagggggt ataaaagccc cttcaccagg agaagccgtc 480

acacagatcc acaagctcct gaggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 540

ttacgggtta tggcccttgc gtgccttgaa ttactgacac tgacatccac tttttctttt 600

tctccacagc tagcgccacc atgcagattg agctgtccac ttgtttcttc ctgtgcctcc 660

tgcgcttctg tttctccgcc actcgccggt actaccttgg agccgtggag ctttcatggg 720

actacatgca gagcgacctg ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc 780

caaagtcctt cccctttaac acctccgtgg tgtacaagaa aaccctcttt gtcgagttca 840

ctgaccacct gttcaacatc gccaagccgc gcccaccttg gatgggcctc ctgggaccga 900

ccattcaagc tgaagtgtac gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc 960

ccgtgtccct gcatgcggtc ggagtgtcct actggaaggc ctccgaagga gctgagtacg 1020

acgaccagac tagccagcgg gaaaaggagg acgataaagt gttcccgggc ggctcgcata 1080

cttacgtgtg gcaagtcctg aaggaaaacg gacctatggc atccgatcct ctgtgcctga 1140

cttactccta cctttcccat gtggacctcg tgaaggacct gaacagcggg ctgattggtg 1200

cacttctcgt gtgccgcgaa ggttcgctcg ctaaggaaaa gacccagacc ctccataagt 1260

tcatcctttt gttcgctgtg ttcgatgaag gaaagtcatg gcattccgaa actaagaact 1320

cgctgatgca ggaccgggat gccgcctcag cccgcgcctg gcctaaaatg catacagtca 1380

acggatacgt gaatcggtca ctgcccgggc tcatcggttg tcacagaaag tccgtgtact 1440

ggcacgtcat cggcatgggc actacgcctg aagtgcactc catcttcctg gaagggcaca 1500

ccttcctcgt gcgcaaccac cgccaggcct ctctggaaat ctccccgatt acctttctga 1560

ccgcccagac tctgctcatg gacctggggc agttccttct cttctgccac atctccagcc 1620

atcagcacga cggaatggag gcctacgtga aggtggactc atgcccggaa gaacctcagt 1680

tgcggatgaa gaacaacgag gaggccgagg actatgacga cgatttgact gactccgaga 1740

tggacgtcgt gcggttcgat gacgacaaca gccccagctt catccagatt cgcagcgtgg 1800

ccaagaagca ccccaaaacc tgggtgcact acatcgcggc cgaggaagaa gattgggact 1860

acgccccgtt ggtgctggca cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg 1920

gtccgcagcg gattggcaga aagtacaaga aagtgcggtt catggcgtac actgacgaaa 1980

cgtttaagac ccgggaggcc attcaacatg agagcggcat tctgggacca ctgctgtacg 2040

gagaggtcgg cgataccctg ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca 2100

tctaccctca cggaatcacc gacgtgcggc cactctactc gcggcgcctg ccgaagggcg 2160

tcaagcacct gaaagacttc cctatcctgc cgggcgaaat cttcaagtat aagtggaccg 2220

tcaccgtgga ggacgggccc accaagagcg atcctaggtg tctgactcgg tactactcca 2280

gcttcgtgaa catggaacgg gacctggcat cgggactcat tggaccgctg ctgatctgct 2340

acaaagagtc ggtggatcaa cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc 2400

tgttctccgt gtttgatgaa aacagatcct ggtacctcac tgaaaacatc cagaggttcc 2460

tcccaaaccc cgcaggagtg caactggagg accctgagtt tcaggcctcg aatatcatgc 2520

actcgattaa cggttacgtg ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg 2580

cttactggta cattctgtcc atcggcgccc agactgactt cctgagcgtg ttcttttccg 2640

gttacacctt taagcacaag atggtgtacg aagataccct gaccctgttc cctttctccg 2700

gcgaaacggt gttcatgtcg atggagaacc cgggtctgtg gattctggga tgccacaaca 2760

gcgactttcg gaaccgcgga atgactgccc tgctgaaggt gtcctcatgc gacaagaaca 2820

ccggagacta ctacgaggac tcctacgagg atatctcagc ctacctcctg tccaagaaca 2880

acgcgatcga gccgcgcagc ttcagccaga acggcgcgcc aacatcagag agcgccaccc 2940

ctgaaagtgg tcccgggagc gagccagcca catctgggtc ggaaacgcca ggcacaagtg 3000

agtctgcaac tcccgagtcc ggacctggct ccgagcctgc cactagcggc tccgagactc 3060

cgggaacttc cgagagcgct acaccagaaa gcggacccgg aaccagtacc gaacctagcg 3120

agggctctgc tccgggcagc ccagccggct ctcctacatc cacggaggag ggcacttccg 3180

aatccgccac cccggagtca gggccaggat ctgaacccgc tacctcaggc agtgagacgc 3240

caggaacgag cgagtccgct acaccggaga gtgggccagg gagccctgct ggatctccta 3300

cgtccactga ggaagggtca ccagcgggct cgcccaccag cactgaagaa ggtgcctcga 3360

gcccgcctgt gctgaagagg caccagcgag aaattacccg gaccaccctc caatcggatc 3420

aggaggaaat cgactacgac gacaccatct cggtggaaat gaagaaggaa gatttcgata 3480

tctacgacga ggacgaaaat cagtcccctc gctcattcca aaagaaaact agacactact 3540

ttatcgccgc ggtggaaaga ctgtgggact atggaatgtc atccagccct cacgtccttc 3600

ggaaccgggc ccagagcgga tcggtgcctc agttcaagaa agtggtgttc caggagttca 3660

ccgacggcag cttcacccag ccgctgtacc ggggagaact gaacgaacac ctgggcctgc 3720

tcggtcccta catccgcgcg gaagtggagg ataacatcat ggtgaccttc cgtaaccaag 3780

catccagacc ttactccttc tattcctccc tgatctcata cgaggaggac cagcgccaag 3840

gcgccgagcc ccgcaagaac ttcgtcaagc ccaacgagac taagacctac ttctggaagg 3900

tccaacacca tatggccccg accaaggatg agtttgactg caaggcctgg gcctacttct 3960

ccgacgtgga ccttgagaag gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc 4020

acaccaacac cctgaaccca gcgcatggac gccaggtcac cgtccaggag tttgctctgt 4080

tcttcaccat ttttgacgaa actaagtcct ggtacttcac cgagaatatg gagcgaaact 4140

gtagagcgcc ctgcaatatc cagatggaag atccgacttt caaggagaac tatagattcc 4200

acgccatcaa cgggtacatc atggatactc tgccggggct ggtcatggcc caggatcaga 4260

ggattcggtg gtacttgctg tcaatgggat cgaacgaaaa cattcactcc attcacttct 4320

ccggtcacgt gttcactgtg cgcaagaagg aggagtacaa gatggcgctg tacaatctgt 4380

accccggggt gttcgaaact gtggagatgc tgccgtccaa ggccggcatc tggagagtgg 4440

agtgcctgat cggagagcac ctccacgcgg ggatgtccac cctcttcctg gtgtactcga 4500

ataagtgcca gaccccgctg ggcatggcct cgggccacat cagagacttc cagatcacag 4560

caagcggaca atacggccaa tgggcgccga agctggcccg cttgcactac tccggatcga 4620

tcaacgcatg gtccaccaag gaaccgttct cgtggattaa ggtggacctc ctggccccta 4680

tgattatcca cggaattaag acccagggcg ccaggcagaa gttctcctcc ctgtacatct 4740

cgcaattcat catcatgtac agcctggacg ggaagaagtg gcagacttac aggggaaact 4800

ccaccggcac cctgatggtc tttttcggca acgtggattc ctccggcatt aagcacaaca 4860

tcttcaaccc accgatcata gccagatata ttaggctcca ccccactcac tactcaatcc 4920

gctcaactct tcggatggaa ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg 4980

ggatggaatc aaaggctatt agcgacgccc agatcaccgc gagctcctac ttcactaaca 5040

tgttcgccac ctggagcccc tccaaggcca ggctgcactt gcagggacgg tcaaatgcct 5100

ggcggccgca agtgaacaat ccgaaggaat ggcttcaagt ggatttccaa aagaccatga 5160

aagtgaccgg agtcaccacc cagggagtga agtcccttct gacctcgatg tatgtgaagg 5220

agttcctgat tagcagcagc caggacgggc accagtggac cctgttcttc caaaacggaa 5280

aggtcaaggt gttccagggg aaccaggact cgttcacacc cgtggtgaac tccctggacc 5340

ccccactgct gacgcggtac ttgaggattc atcctcagtc ctgggtccat cagattgcat 5400

tgcgaatgga agtcctgggc tgcgaggccc aggacctgta ctgaatcagc ctgagctcgc 5460

tgatcataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 5520

tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 5580

ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 5640

ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 5700

ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 5760

cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 5820

tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 5880

gctgctcgcc tgtgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 5940

ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 6000

gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgctgat 6060

cagcctcgac tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt 6120

ccttgaccct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat 6180

cgcattgtct gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg 6240

gggaggattg ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggcttctg 6300

aggcggaaag aacgggctcg agaagcttct agatatcctc tcttaaggta gcatcgagat 6360

ttaaattagg gataacaggg taatggcgcg ggccgcagga acccctagtg atggagttgg 6420

ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac 6480

gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc gcgcag 6526

<210> 111

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 5'ITR(5'端AAV2反向末端重复)

<400> 111

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 112

<211> 142

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-1

<400> 112

gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct 60

taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt cgcggccgcc 120

tcgacgacta gcgtttaatt aa 142

<210> 113

<211> 229

<212> DNA

<213> 人工序列

<220>

<223> TTPp(肝脏特异性启动子)

<400> 113

acgcgtgtct gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc 60

aaggttcata tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa 120

tcagcaggtt tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat 180

aaaagcccct tcaccaggag aagccgtcac acagatccac aagctcctg 229

<210> 114

<211> 2

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-2

<400> 114

ag 2

<210> 115

<211> 106

<212> DNA

<213> 人工序列

<220>

<223> 合成内含子

<400> 115

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60

ccttgaatta ctgacactga catccacttt ttctttttct ccacag 106

<210> 116

<211> 11

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-3

<400> 116

ctagcgccac c 11

<210> 117

<211> 4824

<212> DNA

<213> 人工序列

<220>

<223> FVIIIco6XTEN(含有XTEN144的密码子优化的FVIII形式6的开放阅读框)

<400> 117

atgcagattg agctgtccac ttgtttcttc ctgtgcctcc tgcgcttctg tttctccgcc 60

actcgccggt actaccttgg agccgtggag ctttcatggg actacatgca gagcgacctg 120

ggcgaactcc ccgtggatgc cagattcccc ccccgcgtgc caaagtcctt cccctttaac 180

acctccgtgg tgtacaagaa aaccctcttt gtcgagttca ctgaccacct gttcaacatc 240

gccaagccgc gcccaccttg gatgggcctc ctgggaccga ccattcaagc tgaagtgtac 300

gacaccgtgg tgatcaccct gaagaacatg gcgtcccacc ccgtgtccct gcatgcggtc 360

ggagtgtcct actggaaggc ctccgaagga gctgagtacg acgaccagac tagccagcgg 420

gaaaaggagg acgataaagt gttcccgggc ggctcgcata cttacgtgtg gcaagtcctg 480

aaggaaaacg gacctatggc atccgatcct ctgtgcctga cttactccta cctttcccat 540

gtggacctcg tgaaggacct gaacagcggg ctgattggtg cacttctcgt gtgccgcgaa 600

ggttcgctcg ctaaggaaaa gacccagacc ctccataagt tcatcctttt gttcgctgtg 660

ttcgatgaag gaaagtcatg gcattccgaa actaagaact cgctgatgca ggaccgggat 720

gccgcctcag cccgcgcctg gcctaaaatg catacagtca acggatacgt gaatcggtca 780

ctgcccgggc tcatcggttg tcacagaaag tccgtgtact ggcacgtcat cggcatgggc 840

actacgcctg aagtgcactc catcttcctg gaagggcaca ccttcctcgt gcgcaaccac 900

cgccaggcct ctctggaaat ctccccgatt acctttctga ccgcccagac tctgctcatg 960

gacctggggc agttccttct cttctgccac atctccagcc atcagcacga cggaatggag 1020

gcctacgtga aggtggactc atgcccggaa gaacctcagt tgcggatgaa gaacaacgag 1080

gaggccgagg actatgacga cgatttgact gactccgaga tggacgtcgt gcggttcgat 1140

gacgacaaca gccccagctt catccagatt cgcagcgtgg ccaagaagca ccccaaaacc 1200

tgggtgcact acatcgcggc cgaggaagaa gattgggact acgccccgtt ggtgctggca 1260

cccgatgacc ggtcgtacaa gtcccagtat ctgaacaatg gtccgcagcg gattggcaga 1320

aagtacaaga aagtgcggtt catggcgtac actgacgaaa cgtttaagac ccgggaggcc 1380

attcaacatg agagcggcat tctgggacca ctgctgtacg gagaggtcgg cgataccctg 1440

ctcatcatct tcaaaaacca ggcctcccgg ccttacaaca tctaccctca cggaatcacc 1500

gacgtgcggc cactctactc gcggcgcctg ccgaagggcg tcaagcacct gaaagacttc 1560

cctatcctgc cgggcgaaat cttcaagtat aagtggaccg tcaccgtgga ggacgggccc 1620

accaagagcg atcctaggtg tctgactcgg tactactcca gcttcgtgaa catggaacgg 1680

gacctggcat cgggactcat tggaccgctg ctgatctgct acaaagagtc ggtggatcaa 1740

cgcggcaacc agatcatgtc cgacaagcgc aacgtgatcc tgttctccgt gtttgatgaa 1800

aacagatcct ggtacctcac tgaaaacatc cagaggttcc tcccaaaccc cgcaggagtg 1860

caactggagg accctgagtt tcaggcctcg aatatcatgc actcgattaa cggttacgtg 1920

ttcgactcgc tgcaactgag cgtgtgcctc catgaagtcg cttactggta cattctgtcc 1980

atcggcgccc agactgactt cctgagcgtg ttcttttccg gttacacctt taagcacaag 2040

atggtgtacg aagataccct gaccctgttc cctttctccg gcgaaacggt gttcatgtcg 2100

atggagaacc cgggtctgtg gattctggga tgccacaaca gcgactttcg gaaccgcgga 2160

atgactgccc tgctgaaggt gtcctcatgc gacaagaaca ccggagacta ctacgaggac 2220

tcctacgagg atatctcagc ctacctcctg tccaagaaca acgcgatcga gccgcgcagc 2280

ttcagccaga acggcgcgcc aacatcagag agcgccaccc ctgaaagtgg tcccgggagc 2340

gagccagcca catctgggtc ggaaacgcca ggcacaagtg agtctgcaac tcccgagtcc 2400

ggacctggct ccgagcctgc cactagcggc tccgagactc cgggaacttc cgagagcgct 2460

acaccagaaa gcggacccgg aaccagtacc gaacctagcg agggctctgc tccgggcagc 2520

ccagccggct ctcctacatc cacggaggag ggcacttccg aatccgccac cccggagtca 2580

gggccaggat ctgaacccgc tacctcaggc agtgagacgc caggaacgag cgagtccgct 2640

acaccggaga gtgggccagg gagccctgct ggatctccta cgtccactga ggaagggtca 2700

ccagcgggct cgcccaccag cactgaagaa ggtgcctcga gcccgcctgt gctgaagagg 2760

caccagcgag aaattacccg gaccaccctc caatcggatc aggaggaaat cgactacgac 2820

gacaccatct cggtggaaat gaagaaggaa gatttcgata tctacgacga ggacgaaaat 2880

cagtcccctc gctcattcca aaagaaaact agacactact ttatcgccgc ggtggaaaga 2940

ctgtgggact atggaatgtc atccagccct cacgtccttc ggaaccgggc ccagagcgga 3000

tcggtgcctc agttcaagaa agtggtgttc caggagttca ccgacggcag cttcacccag 3060

ccgctgtacc ggggagaact gaacgaacac ctgggcctgc tcggtcccta catccgcgcg 3120

gaagtggagg ataacatcat ggtgaccttc cgtaaccaag catccagacc ttactccttc 3180

tattcctccc tgatctcata cgaggaggac cagcgccaag gcgccgagcc ccgcaagaac 3240

ttcgtcaagc ccaacgagac taagacctac ttctggaagg tccaacacca tatggccccg 3300

accaaggatg agtttgactg caaggcctgg gcctacttct ccgacgtgga ccttgagaag 3360

gatgtccatt ccggcctgat cgggccgctg ctcgtgtgtc acaccaacac cctgaaccca 3420

gcgcatggac gccaggtcac cgtccaggag tttgctctgt tcttcaccat ttttgacgaa 3480

actaagtcct ggtacttcac cgagaatatg gagcgaaact gtagagcgcc ctgcaatatc 3540

cagatggaag atccgacttt caaggagaac tatagattcc acgccatcaa cgggtacatc 3600

atggatactc tgccggggct ggtcatggcc caggatcaga ggattcggtg gtacttgctg 3660

tcaatgggat cgaacgaaaa cattcactcc attcacttct ccggtcacgt gttcactgtg 3720

cgcaagaagg aggagtacaa gatggcgctg tacaatctgt accccggggt gttcgaaact 3780

gtggagatgc tgccgtccaa ggccggcatc tggagagtgg agtgcctgat cggagagcac 3840

ctccacgcgg ggatgtccac cctcttcctg gtgtactcga ataagtgcca gaccccgctg 3900

ggcatggcct cgggccacat cagagacttc cagatcacag caagcggaca atacggccaa 3960

tgggcgccga agctggcccg cttgcactac tccggatcga tcaacgcatg gtccaccaag 4020

gaaccgttct cgtggattaa ggtggacctc ctggccccta tgattatcca cggaattaag 4080

acccagggcg ccaggcagaa gttctcctcc ctgtacatct cgcaattcat catcatgtac 4140

agcctggacg ggaagaagtg gcagacttac aggggaaact ccaccggcac cctgatggtc 4200

tttttcggca acgtggattc ctccggcatt aagcacaaca tcttcaaccc accgatcata 4260

gccagatata ttaggctcca ccccactcac tactcaatcc gctcaactct tcggatggaa 4320

ctcatggggt gcgacctgaa ctcctgctcc atgccgttgg ggatggaatc aaaggctatt 4380

agcgacgccc agatcaccgc gagctcctac ttcactaaca tgttcgccac ctggagcccc 4440

tccaaggcca ggctgcactt gcagggacgg tcaaatgcct ggcggccgca agtgaacaat 4500

ccgaaggaat ggcttcaagt ggatttccaa aagaccatga aagtgaccgg agtcaccacc 4560

cagggagtga agtcccttct gacctcgatg tatgtgaagg agttcctgat tagcagcagc 4620

caggacgggc accagtggac cctgttcttc caaaacggaa aggtcaaggt gttccagggg 4680

aaccaggact cgttcacacc cgtggtgaac tccctggacc ccccactgct gacgcggtac 4740

ttgaggattc atcctcagtc ctgggtccat cagattgcat tgcgaatgga agtcctgggc 4800

tgcgaggccc aggacctgta ctga 4824

<210> 118

<211> 450

<212> DNA

<213> 人工序列

<220>

<223> XTEN144

<400> 118

ggcgcgccaa catcagagag cgccacccct gaaagtggtc ccgggagcga gccagccaca 60

tctgggtcgg aaacgccagg cacaagtgag tctgcaactc ccgagtccgg acctggctcc 120

gagcctgcca ctagcggctc cgagactccg ggaacttccg agagcgctac accagaaagc 180

ggacccggaa ccagtaccga acctagcgag ggctctgctc cgggcagccc agccggctct 240

cctacatcca cggaggaggg cacttccgaa tccgccaccc cggagtcagg gccaggatct 300

gaacccgcta cctcaggcag tgagacgcca ggaacgagcg agtccgctac accggagagt 360

gggccaggga gccctgctgg atctcctacg tccactgagg aagggtcacc agcgggctcg 420

cccaccagca ctgaagaagg tgcctcgagc 450

<210> 119

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-4

<400> 119

atcagcctga gctcgctga 19

<210> 120

<211> 595

<212> DNA

<213> 人工序列

<220>

<223> WPRE(突变的土拨鼠肝炎病毒转录后调控组件)

<400> 120

tcataatcaa cctctggatt acaaaatttg tgaaagattg actggtattc ttaactatgt 60

tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg ctattgcttc 120

ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc tttatgagga 180

gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg acgcaacccc 240

cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg ctttccccct 300

ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga caggggctcg 360

gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct ttccttggct 420

gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg tcccttcggc 480

cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc ctcttccgcg 540

tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc cgctg 595

<210> 121

<211> 8

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-5

<400> 121

atcagcct 8

<210> 122

<211> 211

<212> DNA

<213> 人工序列

<220>

<223> bGHpA(牛生长激素多聚腺苷酸化信号)

<400> 122

cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga 60

ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt 120

gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg 180

attgggaaga caatagcagg catgctgggg a 211

<210> 123

<211> 119

<212> DNA

<213> 人工序列

<220>

<223> 质粒骨架序列(PBS)-6

<400> 123

tgcggtgggc tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc 60

ctctcttaag gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgc 119

<210> 124

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 3'ITR(3'端AAV2反向末端重复)

<400> 124

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag 130

<210> 125

<211> 415

<212> PRT

<213> 人工序列

<220>

<223> 成熟FIX多肽

<400> 125

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 126

<211> 415

<212> PRT

<213> 人工序列

<220>

<223> 成熟Padua(R338L)FIX多肽

<400> 126

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 127

<211> 46

<212> PRT

<213> 人工序列

<220>

<223> FIX信号多肽和前肽

<400> 127

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg

35 40 45

<210> 128

<211> 8442

<212> DNA

<213> 人工序列

<220>

<223> 人VWF

<400> 128

atgattcctg ccagatttgc cggggtgctg cttgctctgg ccctcatttt gccagggacc 60

ctttgtgcag aaggaactcg cggcaggtca tccacggccc gatgcagcct tttcggaagt 120

gacttcgtca acacctttga tgggagcatg tacagctttg cgggatactg cagttacctc 180

ctggcagggg gctgccagaa acgctccttc tcgattattg gggacttcca gaatggcaag 240

agagtgagcc tctccgtgta tcttggggaa ttttttgaca tccatttgtt tgtcaatggt 300

accgtgacac agggggacca aagagtctcc atgccctatg cctccaaagg gctgtatcta 360

gaaactgagg ctgggtacta caagctgtcc ggtgaggcct atggctttgt ggccaggatc 420

gatggcagcg gcaactttca agtcctgctg tcagacagat acttcaacaa gacctgcggg 480

ctgtgtggca actttaacat ctttgctgaa gatgacttta tgacccaaga agggaccttg 540

acctcggacc cttatgactt tgccaactca tgggctctga gcagtggaga acagtggtgt 600

gaacgggcat ctcctcccag cagctcatgc aacatctcct ctggggaaat gcagaagggc 660

ctgtgggagc agtgccagct tctgaagagc acctcggtgt ttgcccgctg ccaccctctg 720

gtggaccccg agccttttgt ggccctgtgt gagaagactt tgtgtgagtg tgctgggggg 780

ctggagtgcg cctgccctgc cctcctggag tacgcccgga cctgtgccca ggagggaatg 840

gtgctgtacg gctggaccga ccacagcgcg tgcagcccag tgtgccctgc tggtatggag 900

tataggcagt gtgtgtcccc ttgcgccagg acctgccaga gcctgcacat caatgaaatg 960

tgtcaggagc gatgcgtgga tggctgcagc tgccctgagg gacagctcct ggatgaaggc 1020

ctctgcgtgg agagcaccga gtgtccctgc gtgcattccg gaaagcgcta ccctcccggc 1080

acctccctct ctcgagactg caacacctgc atttgccgaa acagccagtg gatctgcagc 1140

aatgaagaat gtccagggga gtgccttgtc actggtcaat cccacttcaa gagctttgac 1200

aacagatact tcaccttcag tgggatctgc cagtacctgc tggcccggga ttgccaggac 1260

cactccttct ccattgtcat tgagactgtc cagtgtgctg atgaccgcga cgctgtgtgc 1320

acccgctccg tcaccgtccg gctgcctggc ctgcacaaca gccttgtgaa actgaagcat 1380

ggggcaggag ttgccatgga tggccaggac atccagctcc ccctcctgaa aggtgacctc 1440

cgcatccagc atacagtgac ggcctccgtg cgcctcagct acggggagga cctgcagatg 1500

gactgggatg gccgcgggag gctgctggtg aagctgtccc ccgtctatgc cgggaagacc 1560

tgcggcctgt gtgggaatta caatggcaac cagggcgacg acttccttac cccctctggg 1620

ctggcrgagc cccgggtgga ggacttcggg aacgcctgga agctgcacgg ggactgccag 1680

gacctgcaga agcagcacag cgatccctgc gccctcaacc cgcgcatgac caggttctcc 1740

gaggaggcgt gcgcggtcct gacgtccccc acattcgagg cctgccatcg tgccgtcagc 1800

ccgctgccct acctgcggaa ctgccgctac gacgtgtgct cctgctcgga cggccgcgag 1860

tgcctgtgcg gcgccctggc cagctatgcc gcggcctgcg cggggagagg cgtgcgcgtc 1920

gcgtggcgcg agccaggccg ctgtgagctg aactgcccga aaggccaggt gtacctgcag 1980

tgcgggaccc cctgcaacct gacctgccgc tctctctctt acccggatga ggaatgcaat 2040

gaggcctgcc tggagggctg cttctgcccc ccagggctct acatggatga gaggggggac 2100

tgcgtgccca aggcccagtg cccctgttac tatgacggtg agatcttcca gccagaagac 2160

atcttctcag accatcacac catgtgctac tgtgaggatg gcttcatgca ctgtaccatg 2220

agtggagtcc ccggaagctt gctgcctgac gctgtcctca gcagtcccct gtctcatcgc 2280

agcaaaagga gcctatcctg tcggcccccc atggtcaagc tggtgtgtcc cgctgacaac 2340

ctgcgggctg aagggctcga gtgtaccaaa acgtgccaga actatgacct ggagtgcatg 2400

agcatgggct gtgtctctgg ctgcctctgc cccccgggca tggtccggca tgagaacaga 2460

tgtgtggccc tggaaaggtg tccctgcttc catcagggca aggagtatgc ccctggagaa 2520

acagtgaaga ttggctgcaa cacttgtgtc tgtcgggacc ggaagtggaa ctgcacagac 2580

catgtgtgtg atgccacgtg ctccacgatc ggcatggccc actacctcac cttcgacggg 2640

ctcaaatacc tgttccccgg ggagtgccag tacgttctgg tgcaggatta ctgcggcagt 2700

aaccctggga cctttcggat cctagtgggg aataagggat gcagccaccc ctcagtgaaa 2760

tgcaagaaac gggtcaccat cctggtggag ggaggagaga ttgagctgtt tgacggggag 2820

gtgaatgtga agaggcccat gaaggatgag actcactttg aggtggtgga gtctggccgg 2880

tacatcattc tgctgctggg caaagccctc tccgtggtct gggaccgcca cctgagcatc 2940

tccgtggtcc tgaagcagac ataccaggag aaagtgtgtg gcctgtgtgg gaattttgat 3000

ggcatccaga acaatgacct caccagcagc aacctccaag tggaggaaga ccctgtggac 3060

tttgggaact cctggaaagt gagctcgcag tgtgctgaca ccagaaaagt gcctctggac 3120

tcatcccctg ccacctgcca taacaacatc atgaagcaga cgatggtgga ttcctcctgt 3180

agaatcctta ccagtgacgt cttccaggac tgcaacaagc tggtggaccc cgagccatat 3240

ctggatgtct gcatttacga cacctgctcc tgtgagtcca ttggggactg cgcctgcttc 3300

tgcgacacca ttgctgccta tgcccacgtg tgtgcccagc atggcaaggt ggtgacctgg 3360

aggacggcca cattgtgccc ccagagctgc gaggagagga atctccggga gaacgggtat 3420

gagtgtgagt ggcgctataa cagctgtgca cctgcctgtc aagtcacgtg tcagcaccct 3480

gagccactgg cctgccctgt gcagtgtgtg gagggctgcc atgcccactg ccctccaggg 3540

aaaatcctgg atgagctttt gcagacctgc gttgaccctg aagactgtcc agtgtgtgag 3600

gtggctggcc ggcgttttgc ctcaggaaag aaagtcacct tgaatcccag tgaccctgag 3660

cactgccaga tttgccactg tgatgttgtc aacctcacct gtgaagcctg ccaggagccg 3720

ggaggcctgg tggtgcctcc cacagatgcc ccggtgagcc ccaccactct gtatgtggag 3780

gacatctcgg aaccgccgtt gcacgatttc tactgcagca ggctactgga cctggtcttc 3840

ctgctggatg gctcctccag gctgtccgag gctgagtttg aagtgctgaa ggcctttgtg 3900

gtggacatga tggagcggct gcgcatctcc cagaagtggg tccgcgtggc cgtggtggag 3960

taccacgacg gctcccacgc ctacatcggg ctcaaggacc ggaagcgacc gtcagagctg 4020

cggcgcattg ccagccaggt gaagtatgcg ggcagccagg tggcctccac cagcgaggtc 4080

ttgaaataca cactgttcca aatcttcagc aagatcgacc gccctgaagc ctcccgcatc 4140

gccctgctcc tgatggccag ccaggagccc caacggatgt cccggaactt tgtccgctac 4200

gtccagggcc tgaagaagaa gaaggtcatt gtgatcccgg tgggcattgg gccccatgcc 4260

aacctcaagc agatccgcct catcgagaag caggcccctg agaacaaggc cttcgtgctg 4320

agcagtgtgg atgagctgga gcagcaaagg gacgagatcg ttagctacct ctgtgacctt 4380

gcccctgaag cccctcctcc tactctgccc cccgacatgg cacaagtcac tgtgggcccg 4440

gggctcttgg gggtttcgac cctggggccc aagaggaact ccatggttct ggatgtggcg 4500

ttcgtcctgg aaggatcgga caaaattggt gaagccgact tcaacaggag caaggagttc 4560

atggaggagg tgattcagcg gatggatgtg ggccaggaca gcatccacgt cacggtgctg 4620

cagtactcct acatggtgac cgtggagtac cccttcagcg aggcacagtc caaaggggac 4680

atcctgcagc gggtgcgaga gatccgctac cagggcggca acaggaccaa cactgggctg 4740

gccctgcggt acctctctga ccacagcttc ttggtcagcc agggtgaccg ggagcaggcg 4800

cccaacctgg tctacatggt caccggaaat cctgcctctg atgagatcaa gaggctgcct 4860

ggagacatcc aggtggtgcc cattggagtg ggccctaatg ccaacgtgca ggagctggag 4920

aggattggct ggcccaatgc ccctatcctc atccaggact ttgagacgct cccccgagag 4980

gctcctgacc tggtgctgca gaggtgctgc tccggagagg ggctgcagat ccccaccctc 5040

tcccctgcac ctgactgcag ccagcccctg gacgtgatcc ttctcctgga tggctcctcc 5100

agtttcccag cttcttattt tgatgaaatg aagagtttcg ccaaggcttt catttcaaaa 5160

gccaatatag ggcctcgtct cactcaggtg tcagtgctgc agtatggaag catcaccacc 5220

attgacgtgc catggaacgt ggtcccggag aaagcccatt tgctgagcct tgtggacgtc 5280

atgcagcggg agggaggccc cagccaaatc ggggatgcct tgggctttgc tgtgcgatac 5340

ttgacttcag aaatgcatgg tgccaggccg ggagcctcaa aggcggtggt catcctggtc 5400

acggacgtct ctgtggattc agtggatgca gcagctgatg ccgccaggtc caacagagtg 5460

acagtgttcc ctattggaat tggagatcgc tacgatgcag cccagctacg gatcttggca 5520

ggcccagcag gcgactccaa cgtggtgaag ctccagcgaa tcgaagacct ccctaccatg 5580

gtcaccttgg gcaattcctt cctccacaaa ctgtgctctg gatttgttag gatttgcatg 5640

gatgaggatg ggaatgagaa gaggcccggg gacgtctgga ccttgccaga ccagtgccac 5700

accgtgactt gccagccaga tggccagacc ttgctgaaga gtcatcgggt caactgtgac 5760

cgggggctga ggccttcgtg ccctaacagc cagtcccctg ttaaagtgga agagacctgt 5820

ggctgccgct ggacctgccc ctgygtgtgc acaggcagct ccactcggca catcgtgacc 5880

tttgatgggc agaatttcaa gctgactggc agctgttctt atgtcctatt tcaaaacaag 5940

gagcaggacc tggaggtgat tctccataat ggtgcctgca gccctggagc aaggcagggc 6000

tgcatgaaat ccatcgaggt gaagcacagt gccctctccg tcgagstgca cagtgacatg 6060

gaggtgacgg tgaatgggag actggtctct gttccttacg tgggtgggaa catggaagtc 6120

aacgtttatg gtgccatcat gcatgaggtc agattcaatc accttggtca catcttcaca 6180

ttcactccac aaaacaatga gttccaactg cagctcagcc ccaagacttt tgcttcaaag 6240

acgtatggtc tgtgtgggat ctgtgatgag aacggagcca atgacttcat gctgagggat 6300

ggcacagtca ccacagactg gaaaacactt gttcaggaat ggactgtgca gcggccaggg 6360

cagacgtgcc agcccatcct ggaggagcag tgtcttgtcc ccgacagctc ccactgccag 6420

gtcctcctct taccactgtt tgctgaatgc cacaaggtcc tggctccagc cacattctat 6480

gccatctgcc agcaggacag ttgccaccag gagcaagtgt gtgaggtgat cgcctcttat 6540

gcccacctct gtcggaccaa cggggtctgc gttgactgga ggacacctga tttctgtgct 6600

atgtcatgcc caccatctct ggtctacaac cactgtgagc atggctgtcc ccggcactgt 6660

gatggcaacg tgagctcctg tggggaccat ccctccgaag gctgtttctg ccctccagat 6720

aaagtcatgt tggaaggcag ctgtgtccct gaagaggcct gcactcagtg cattggtgag 6780

gatggagtcc agcaccagtt cctggaagcc tgggtcccgg accaccagcc ctgtcagatc 6840

tgcacatgcc tcagcgggcg gaaggtcaac tgcacaacgc agccctgccc cacggccaaa 6900

gctcccacgt gtggcctgtg tgaagtagcc cgcctccgcc agaatgcaga ccagtgctgc 6960

cccgagtatg agtgtgtgtg tgacccagtg agctgtgacc tgcccccagt gcctcactgt 7020

gaacgtggcc tccagcccac actgaccaac cctggcgagt gcagacccaa cttcacctgc 7080

gcctgcagga aggaggagtg caaaagagtg tccccaccct cctgcccccc gcaccgtttg 7140

cccacccttc ggaagaccca gtgctgtgat gagtatgagt gtgcctgcaa ctgtgtcaac 7200

tccacagtga gctgtcccct tgggtacttg gcctcaaccg ccaccaatga ctgtggctgt 7260

accacaacca cctgccttcc cgacaaggtg tgtgtccacc gaagcaccat ctaccctgtg 7320

ggccagttct gggaggaggg ctgcgatgtg tgcacctgca ccgacatgga ggatgccgtg 7380

atgggcctcc gcgtggccca gtgctcccag aagccctgtg aggacagctg tcggtcgggc 7440

ttcacttacg ttctgcatga aggcgagtgc tgtggaaggt gcctgccatc tgcctgtgag 7500

gtggtgactg gctcaccgcg gggggactcc cagtcttcct ggaagagtgt cggctcccag 7560

tgggcctccc cggagaaccc ctgcctcatc aatgagtgtg tccgagtgaa ggaggaggtc 7620

tttatacaac aaaggaacgt ctcctgcccc cagctggagg tccctgtctg cccctcgggc 7680

tttcagctga gctgtaagac ctcagcgtgc tgcccaagct gtcgctgtga gcgcatggag 7740

gcctgcatgc tcaatggcac tgtcattggg cccgggaaga ctgtgatgat cgatgtgtgc 7800

acgacctgcc gctgcatggt gcaggtgggg gtcatctctg gattcaagct ggagtgcagg 7860

aagaccacct gcaacccctg ccccctgggt tacaaggaag aaaataacac aggtgaatgt 7920

tgtgggagat gtttgcctac ggcttgcacc attcagctaa gaggaggaca gatcatgaca 7980

ctgaagcgtg atgagacgct ccaggatggc tgtgatactc acttctgcaa ggtcaatgag 8040

agaggagagt acttctggga gaagagggtc acaggctgcc caccctttga tgaacacaag 8100

tgtcttgctg agggaggtaa aattatgaaa attccaggca cctgctgtga cacatgtgag 8160

gagcctgagt gcaacgacat cactgccagg ctgcagtatg tcaaggtggg aagctgtaag 8220

tctgaagtag aggtggatat ccactactgc cagggcaaat gtgccagcaa agccatgtac 8280

tccattgaca tcaacgatgt gcaggaccag tgctcctgct gctctccgac acggacggag 8340

cccatgcagg tggccctgca ctgcaccaat ggctctgttg tgtaccatga ggttctcaat 8400

gccatggagt gcaaatgctc ccccaggaag tgcagcaagt ga 8442

<210> 129

<211> 2809

<212> PRT

<213> 人工序列

<220>

<223> 人VWF

<220>

<221> 尚未归类的特征

<222> (540)..(540)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> 尚未归类的特征

<222> (1944)..(1944)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> 尚未归类的特征

<222> (2012)..(2012)

<223> Xaa可以是任何天然存在的氨基酸

<400> 129

Met Ile Pro Ala Arg Phe Ala Gly Val Leu Leu Ala Leu Ala Leu Ile

1 5 10 15

Leu Pro Gly Thr Leu Cys Ala Glu Gly Thr Arg Gly Arg Ser Ser Thr

20 25 30

Ala Arg Cys Ser Leu Phe Gly Ser Asp Phe Val Asn Thr Phe Asp Gly

35 40 45

Ser Met Tyr Ser Phe Ala Gly Tyr Cys Ser Tyr Leu Leu Ala Gly Gly

50 55 60

Cys Gln Lys Arg Ser Phe Ser Ile Ile Gly Asp Phe Gln Asn Gly Lys

65 70 75 80

Arg Val Ser Leu Ser Val Tyr Leu Gly Glu Phe Phe Asp Ile His Leu

85 90 95

Phe Val Asn Gly Thr Val Thr Gln Gly Asp Gln Arg Val Ser Met Pro

100 105 110

Tyr Ala Ser Lys Gly Leu Tyr Leu Glu Thr Glu Ala Gly Tyr Tyr Lys

115 120 125

Leu Ser Gly Glu Ala Tyr Gly Phe Val Ala Arg Ile Asp Gly Ser Gly

130 135 140

Asn Phe Gln Val Leu Leu Ser Asp Arg Tyr Phe Asn Lys Thr Cys Gly

145 150 155 160

Leu Cys Gly Asn Phe Asn Ile Phe Ala Glu Asp Asp Phe Met Thr Gln

165 170 175

Glu Gly Thr Leu Thr Ser Asp Pro Tyr Asp Phe Ala Asn Ser Trp Ala

180 185 190

Leu Ser Ser Gly Glu Gln Trp Cys Glu Arg Ala Ser Pro Pro Ser Ser

195 200 205

Ser Cys Asn Ile Ser Ser Gly Glu Met Gln Lys Gly Leu Trp Glu Gln

210 215 220

Cys Gln Leu Leu Lys Ser Thr Ser Val Phe Ala Arg Cys His Pro Leu

225 230 235 240

Val Asp Pro Glu Pro Phe Val Cys Glu Lys Thr Leu Cys Glu Cys Ala

245 250 255

Gly Gly Leu Glu Cys Ala Cys Pro Ala Leu Leu Glu Tyr Ala Arg Thr

260 265 270

Cys Ala Gln Glu Gly Met Val Leu Tyr Gly Trp Thr Asp His Ser Ala

275 280 285

Cys Ser Pro Val Cys Pro Ala Gly Met Glu Tyr Arg Gln Cys Val Ser

290 295 300

Pro Cys Ala Arg Thr Cys Gln Ser Leu His Ile Asn Glu Met Cys Gln

305 310 315 320

Glu Arg Cys Val Asp Gly Cys Ser Cys Pro Glu Gly Gln Leu Leu Asp

325 330 335

Glu Gly Leu Cys Val Glu Ser Thr Glu Cys Pro Cys Val His Ser Gly

340 345 350

Lys Arg Tyr Pro Pro Gly Thr Ser Leu Ser Arg Asp Cys Asn Thr Cys

355 360 365

Ile Cys Arg Asn Ser Gln Trp Ile Cys Ser Asn Glu Glu Cys Pro Gly

370 375 380

Glu Cys Leu Val Thr Gly Gln Ser His Phe Lys Ser Phe Asp Asn Arg

385 390 395 400

Tyr Phe Thr Phe Ser Gly Ile Cys Gln Tyr Leu Leu Ala Arg Asp Cys

405 410 415

Gln Asp His Ser Phe Ser Ile Val Ile Glu Thr Val Gln Cys Ala Asp

420 425 430

Asp Arg Asp Ala Val Cys Thr Arg Ser Val Thr Val Arg Leu Pro Gly

435 440 445

Leu His Asn Ser Leu Val Lys Leu Lys His Gly Ala Gly Val Ala Met

450 455 460

Asp Gly Gln Asp Ile Gln Leu Pro Leu Leu Lys Gly Asp Leu Arg Ile

465 470 475 480

Gln His Thr Val Thr Ala Ser Val Arg Leu Ser Tyr Gly Glu Asp Leu

485 490 495

Gln Met Asp Trp Asp Gly Arg Gly Arg Leu Leu Val Lys Leu Ser Pro

500 505 510

Val Tyr Ala Gly Lys Thr Cys Gly Leu Cys Gly Asn Tyr Asn Gly Asn

515 520 525

Gln Gly Asp Asp Phe Leu Thr Pro Ser Gly Leu Xaa Glu Pro Arg Val

530 535 540

Glu Asp Phe Gly Asn Ala Trp Lys Leu His Gly Asp Cys Gln Asp Leu

545 550 555 560

Gln Lys Gln His Ser Asp Pro Cys Ala Leu Asn Pro Arg Met Thr Arg

565 570 575

Phe Ser Glu Glu Ala Cys Ala Val Leu Thr Ser Pro Thr Phe Glu Ala

580 585 590

Cys His Arg Ala Val Ser Pro Leu Pro Tyr Leu Arg Asn Cys Arg Tyr

595 600 605

Asp Val Cys Ser Cys Ser Asp Gly Arg Glu Cys Leu Cys Gly Ala Ser

610 615 620

Tyr Ala Ala Ala Cys Ala Gly Arg Gly Val Arg Val Ala Trp Arg Glu

625 630 635 640

Pro Gly Arg Cys Glu Leu Asn Cys Pro Lys Gly Gln Val Tyr Leu Gln

645 650 655

Cys Gly Thr Pro Cys Asn Leu Thr Cys Arg Ser Leu Ser Tyr Pro Asp

660 665 670

Glu Glu Cys Asn Glu Ala Cys Leu Glu Gly Cys Phe Cys Pro Pro Gly

675 680 685

Leu Tyr Met Asp Glu Arg Gly Asp Cys Val Pro Lys Ala Gln Cys Pro

690 695 700

Cys Tyr Tyr Asp Gly Glu Ile Phe Gln Pro Glu Asp Ile Phe Ser Asp

705 710 715 720

His His Thr Met Cys Tyr Cys Glu Asp Gly Phe Met His Cys Thr Met

725 730 735

Ser Gly Val Pro Gly Ser Leu Leu Pro Asp Ala Val Leu Ser Ser Pro

740 745 750

Leu Ser His Arg Ser Lys Arg Ser Leu Ser Cys Arg Pro Pro Met Val

755 760 765

Lys Leu Val Cys Pro Ala Asp Asn Leu Arg Ala Glu Gly Leu Glu Cys

770 775 780

Thr Lys Thr Cys Gln Asn Tyr Asp Leu Glu Cys Met Ser Met Gly Cys

785 790 795 800

Val Ser Gly Cys Leu Cys Pro Pro Gly Met Val Arg His Glu Asn Arg

805 810 815

Cys Val Ala Leu Glu Arg Cys Pro Cys Phe His Gln Gly Lys Glu Tyr

820 825 830

Ala Pro Gly Glu Thr Val Lys Ile Gly Cys Asn Thr Cys Val Cys Arg

835 840 845

Asp Arg Lys Trp Asn Cys Thr Asp His Val Cys Asp Ala Thr Cys Ser

850 855 860

Thr Ile Gly Met Ala His Tyr Leu Thr Phe Asp Gly Leu Lys Tyr Leu

865 870 875 880

Phe Pro Gly Glu Cys Gln Tyr Val Leu Val Gln Asp Tyr Cys Gly Ser

885 890 895

Asn Pro Gly Thr Phe Arg Ile Leu Val Gly Asn Lys Gly Cys Ser His

900 905 910

Pro Ser Val Lys Cys Lys Lys Arg Val Thr Ile Leu Val Glu Gly Gly

915 920 925

Glu Ile Glu Leu Phe Asp Gly Glu Val Asn Val Lys Arg Pro Met Lys

930 935 940

Asp Glu Thr His Phe Glu Val Val Glu Ser Gly Arg Tyr Ile Ile Leu

945 950 955 960

Leu Leu Gly Lys Ala Leu Ser Val Val Trp Asp Arg His Leu Ser Ile

965 970 975

Ser Val Val Leu Lys Gln Thr Tyr Gln Glu Lys Val Cys Gly Leu Cys

980 985 990

Gly Asn Phe Asp Gly Ile Gln Asn Asn Asp Leu Thr Ser Ser Asn Leu

995 1000 1005

Gln Val Glu Glu Asp Pro Val Asp Phe Gly Asn Ser Trp Lys Val

1010 1015 1020

Ser Ser Gln Cys Ala Asp Thr Arg Lys Val Pro Leu Asp Ser Ser

1025 1030 1035

Pro Ala Thr Cys His Asn Asn Ile Met Lys Gln Thr Met Val Asp

1040 1045 1050

Ser Ser Cys Arg Ile Leu Thr Ser Asp Val Phe Gln Asp Cys Asn

1055 1060 1065

Lys Leu Val Asp Pro Glu Pro Tyr Leu Asp Val Cys Ile Tyr Asp

1070 1075 1080

Thr Cys Ser Cys Glu Ser Ile Gly Asp Cys Ala Cys Phe Cys Asp

1085 1090 1095

Thr Ile Ala Ala Tyr Ala His Val Cys Ala Gln His Gly Lys Val

1100 1105 1110

Val Thr Trp Arg Thr Ala Thr Leu Cys Pro Gln Ser Cys Glu Glu

1115 1120 1125

Arg Asn Leu Arg Glu Asn Gly Tyr Glu Cys Glu Trp Arg Tyr Asn

1130 1135 1140

Ser Cys Ala Pro Ala Cys Gln Val Thr Cys Gln His Pro Glu Pro

1145 1150 1155

Leu Ala Cys Pro Val Gln Cys Val Glu Gly Cys His Ala His Cys

1160 1165 1170

Pro Pro Gly Lys Ile Leu Asp Glu Leu Leu Gln Thr Cys Val Asp

1175 1180 1185

Pro Glu Asp Cys Pro Val Cys Glu Val Ala Gly Arg Arg Phe Ala

1190 1195 1200

Ser Gly Lys Lys Val Thr Leu Asn Pro Ser Asp Pro Glu His Cys

1205 1210 1215

Gln Ile Cys His Cys Asp Val Val Asn Leu Thr Cys Glu Ala Cys

1220 1225 1230

Gln Glu Pro Gly Gly Leu Val Val Pro Pro Thr Asp Ala Pro Val

1235 1240 1245

Ser Pro Thr Thr Leu Tyr Val Glu Asp Ile Ser Glu Pro Pro Leu

1250 1255 1260

His Asp Phe Tyr Cys Ser Arg Leu Leu Asp Leu Val Phe Leu Leu

1265 1270 1275

Asp Gly Ser Ser Arg Leu Ser Glu Ala Glu Phe Glu Val Leu Lys

1280 1285 1290

Ala Phe Val Val Asp Met Met Glu Arg Leu Arg Ile Ser Gln Lys

1295 1300 1305

Trp Val Arg Val Ala Val Val Glu Tyr His Asp Gly Ser His Ala

1310 1315 1320

Tyr Ile Gly Leu Lys Asp Arg Lys Arg Pro Ser Glu Leu Arg Arg

1325 1330 1335

Ile Ala Ser Gln Val Lys Tyr Ala Gly Ser Gln Val Ala Ser Thr

1340 1345 1350

Ser Glu Val Leu Lys Tyr Thr Leu Phe Gln Ile Phe Ser Lys Ile

1355 1360 1365

Asp Arg Pro Glu Ala Ser Arg Ile Ala Leu Leu Leu Met Ala Ser

1370 1375 1380

Gln Glu Pro Gln Arg Met Ser Arg Asn Phe Val Arg Tyr Val Gln

1385 1390 1395

Gly Leu Lys Lys Lys Lys Val Ile Val Ile Pro Val Gly Ile Gly

1400 1405 1410

Pro His Ala Asn Leu Lys Gln Ile Arg Leu Ile Glu Lys Gln Ala

1415 1420 1425

Pro Glu Asn Lys Ala Phe Val Leu Ser Ser Val Asp Glu Leu Glu

1430 1435 1440

Gln Gln Arg Asp Glu Ile Val Ser Tyr Leu Cys Asp Leu Ala Pro

1445 1450 1455

Glu Ala Pro Pro Pro Thr Leu Pro Pro Asp Met Ala Gln Val Thr

1460 1465 1470

Val Gly Pro Gly Leu Leu Gly Val Ser Thr Leu Gly Pro Lys Arg

1475 1480 1485

Asn Ser Met Val Leu Asp Val Ala Phe Val Leu Glu Gly Ser Asp

1490 1495 1500

Lys Ile Gly Glu Ala Asp Phe Asn Arg Ser Lys Glu Phe Met Glu

1505 1510 1515

Glu Val Ile Gln Arg Met Asp Val Gly Gln Asp Ser Ile His Val

1520 1525 1530

Thr Val Leu Gln Tyr Ser Tyr Met Val Thr Val Glu Tyr Pro Phe

1535 1540 1545

Ser Glu Ala Gln Ser Lys Gly Asp Ile Leu Gln Arg Val Arg Glu

1550 1555 1560

Ile Arg Tyr Gln Gly Gly Asn Arg Thr Asn Thr Gly Leu Ala Leu

1565 1570 1575

Arg Tyr Leu Ser Asp His Ser Phe Leu Val Ser Gln Gly Asp Arg

1580 1585 1590

Glu Gln Ala Pro Asn Leu Val Tyr Met Val Thr Gly Asn Pro Ala

1595 1600 1605

Ser Asp Glu Ile Lys Arg Leu Pro Gly Asp Ile Gln Val Val Pro

1610 1615 1620

Ile Gly Val Gly Pro Asn Ala Asn Val Gln Glu Leu Glu Arg Ile

1625 1630 1635

Gly Trp Pro Asn Ala Pro Ile Leu Ile Gln Asp Phe Glu Thr Leu

1640 1645 1650

Pro Arg Glu Ala Pro Asp Leu Val Leu Gln Arg Cys Cys Ser Gly

1655 1660 1665

Glu Gly Leu Gln Ile Pro Thr Leu Ser Pro Ala Pro Asp Cys Ser

1670 1675 1680

Gln Pro Leu Asp Val Ile Leu Leu Leu Asp Gly Ser Ser Ser Phe

1685 1690 1695

Pro Ala Ser Tyr Phe Asp Glu Met Lys Ser Phe Ala Lys Ala Phe

1700 1705 1710

Ile Ser Lys Ala Asn Ile Gly Pro Arg Leu Thr Gln Val Ser Val

1715 1720 1725

Leu Gln Tyr Gly Ser Ile Thr Thr Ile Asp Val Pro Trp Asn Val

1730 1735 1740

Val Pro Glu Lys Ala His Leu Leu Ser Leu Val Asp Val Met Gln

1745 1750 1755

Arg Glu Gly Gly Pro Ser Gln Ile Gly Asp Ala Leu Gly Phe Ala

1760 1765 1770

Val Arg Tyr Leu Thr Ser Glu Met His Gly Ala Arg Pro Gly Ala

1775 1780 1785

Ser Lys Ala Val Val Ile Leu Val Thr Asp Val Ser Val Asp Ser

1790 1795 1800

Val Asp Ala Ala Ala Asp Ala Ala Arg Ser Asn Arg Val Thr Val

1805 1810 1815

Phe Pro Ile Gly Ile Gly Asp Arg Tyr Asp Ala Ala Gln Leu Arg

1820 1825 1830

Ile Leu Ala Gly Pro Ala Gly Asp Ser Asn Val Val Lys Leu Gln

1835 1840 1845

Arg Ile Glu Asp Leu Pro Thr Met Val Thr Leu Gly Asn Ser Phe

1850 1855 1860

Leu His Lys Leu Cys Ser Gly Phe Val Arg Ile Cys Met Asp Glu

1865 1870 1875

Asp Gly Asn Glu Lys Arg Pro Gly Asp Val Trp Thr Leu Pro Asp

1880 1885 1890

Gln Cys His Thr Val Thr Cys Gln Pro Asp Gly Gln Thr Leu Leu

1895 1900 1905

Lys Ser His Arg Val Asn Cys Asp Arg Gly Leu Arg Pro Ser Cys

1910 1915 1920

Pro Asn Ser Gln Ser Pro Val Lys Val Glu Glu Thr Cys Gly Cys

1925 1930 1935

Arg Trp Thr Cys Pro Xaa Val Cys Thr Gly Ser Ser Thr Arg His

1940 1945 1950

Ile Val Thr Phe Asp Gly Gln Asn Phe Lys Leu Thr Gly Ser Cys

1955 1960 1965

Ser Tyr Val Leu Phe Gln Asn Lys Glu Gln Asp Leu Glu Val Ile

1970 1975 1980

Leu His Asn Gly Ala Cys Ser Pro Gly Ala Arg Gln Gly Cys Met

1985 1990 1995

Lys Ser Ile Glu Val Lys His Ser Ala Leu Ser Val Glu Xaa His

2000 2005 2010

Ser Asp Met Glu Val Thr Val Asn Gly Arg Leu Val Ser Val Pro

2015 2020 2025

Tyr Val Gly Gly Asn Met Glu Val Asn Val Tyr Gly Ala Ile Met

2030 2035 2040

His Glu Val Arg Phe Asn His Leu Gly His Ile Phe Thr Phe Thr

2045 2050 2055

Pro Gln Asn Asn Glu Phe Gln Leu Gln Leu Ser Pro Lys Thr Phe

2060 2065 2070

Ala Ser Lys Thr Tyr Gly Leu Cys Gly Ile Cys Asp Glu Asn Gly

2075 2080 2085

Ala Asn Asp Phe Met Leu Arg Asp Gly Thr Val Thr Thr Asp Trp

2090 2095 2100

Lys Thr Leu Val Gln Glu Trp Thr Val Gln Arg Pro Gly Gln Thr

2105 2110 2115

Cys Gln Pro Ile Leu Glu Glu Gln Cys Leu Val Pro Asp Ser Ser

2120 2125 2130

His Cys Gln Val Leu Leu Leu Pro Leu Phe Ala Glu Cys His Lys

2135 2140 2145

Val Leu Ala Pro Ala Thr Phe Tyr Ala Ile Cys Gln Gln Asp Ser

2150 2155 2160

Cys His Gln Glu Gln Val Cys Glu Val Ile Ala Ser Tyr Ala His

2165 2170 2175

Leu Cys Arg Thr Asn Gly Val Cys Val Asp Trp Arg Thr Pro Asp

2180 2185 2190

Phe Cys Ala Met Ser Cys Pro Pro Ser Leu Val Tyr Asn His Cys

2195 2200 2205

Glu His Gly Cys Pro Arg His Cys Asp Gly Asn Val Ser Ser Cys

2210 2215 2220

Gly Asp His Pro Ser Glu Gly Cys Phe Cys Pro Pro Asp Lys Val

2225 2230 2235

Met Leu Glu Gly Ser Cys Val Pro Glu Glu Ala Cys Thr Gln Cys

2240 2245 2250

Ile Gly Glu Asp Gly Val Gln His Gln Phe Leu Glu Ala Trp Val

2255 2260 2265

Pro Asp His Gln Pro Cys Gln Ile Cys Thr Cys Leu Ser Gly Arg

2270 2275 2280

Lys Val Asn Cys Thr Thr Gln Pro Cys Pro Thr Ala Lys Ala Pro

2285 2290 2295

Thr Cys Gly Leu Cys Glu Val Ala Arg Leu Arg Gln Asn Ala Asp

2300 2305 2310

Gln Cys Cys Pro Glu Tyr Glu Cys Val Cys Asp Pro Val Ser Cys

2315 2320 2325

Asp Leu Pro Pro Val Pro His Cys Glu Arg Gly Leu Gln Pro Thr

2330 2335 2340

Leu Thr Asn Pro Gly Glu Cys Arg Pro Asn Phe Thr Cys Ala Cys

2345 2350 2355

Arg Lys Glu Glu Cys Lys Arg Val Ser Pro Pro Ser Cys Pro Pro

2360 2365 2370

His Arg Leu Pro Thr Leu Arg Lys Thr Gln Cys Cys Asp Glu Tyr

2375 2380 2385

Glu Cys Ala Cys Asn Cys Val Asn Ser Thr Val Ser Cys Pro Leu

2390 2395 2400

Gly Tyr Leu Ala Ser Thr Ala Thr Asn Asp Cys Gly Cys Thr Thr

2405 2410 2415

Thr Thr Cys Leu Pro Asp Lys Val Cys Val His Arg Ser Thr Ile

2420 2425 2430

Tyr Pro Val Gly Gln Phe Trp Glu Glu Gly Cys Asp Val Cys Thr

2435 2440 2445

Cys Thr Asp Met Glu Asp Ala Val Met Gly Leu Arg Val Ala Gln

2450 2455 2460

Cys Ser Gln Lys Pro Cys Glu Asp Ser Cys Arg Ser Gly Phe Thr

2465 2470 2475

Tyr Val Leu His Glu Gly Glu Cys Cys Gly Arg Cys Leu Pro Ser

2480 2485 2490

Ala Cys Glu Val Val Thr Gly Ser Pro Arg Gly Asp Ser Gln Ser

2495 2500 2505

Ser Trp Lys Ser Val Gly Ser Gln Trp Ala Ser Pro Glu Asn Pro

2510 2515 2520

Cys Leu Ile Asn Glu Cys Val Arg Val Lys Glu Glu Val Phe Ile

2525 2530 2535

Gln Gln Arg Asn Val Ser Cys Pro Gln Leu Glu Val Pro Val Cys

2540 2545 2550

Pro Ser Gly Phe Gln Leu Ser Cys Lys Thr Ser Ala Cys Cys Pro

2555 2560 2565

Ser Cys Arg Cys Glu Arg Met Glu Ala Cys Met Leu Asn Gly Thr

2570 2575 2580

Val Ile Gly Pro Gly Lys Thr Val Met Ile Asp Val Cys Thr Thr

2585 2590 2595

Cys Arg Cys Met Val Gln Val Gly Val Ile Ser Gly Phe Lys Leu

2600 2605 2610

Glu Cys Arg Lys Thr Thr Cys Asn Pro Cys Pro Leu Gly Tyr Lys

2615 2620 2625

Glu Glu Asn Asn Thr Gly Glu Cys Cys Gly Arg Cys Leu Pro Thr

2630 2635 2640

Ala Cys Thr Ile Gln Leu Arg Gly Gly Gln Ile Met Thr Leu Lys

2645 2650 2655

Arg Asp Glu Thr Leu Gln Asp Gly Cys Asp Thr His Phe Cys Lys

2660 2665 2670

Val Asn Glu Arg Gly Glu Tyr Phe Trp Glu Lys Arg Val Thr Gly

2675 2680 2685

Cys Pro Pro Phe Asp Glu His Lys Cys Leu Ala Glu Gly Gly Lys

2690 2695 2700

Ile Met Lys Ile Pro Gly Thr Cys Cys Asp Thr Cys Glu Glu Pro

2705 2710 2715

Glu Cys Asn Asp Ile Thr Ala Arg Leu Gln Tyr Val Lys Val Gly

2720 2725 2730

Ser Cys Lys Ser Glu Val Glu Val Asp Ile His Tyr Cys Gln Gly

2735 2740 2745

Lys Cys Ala Ser Lys Ala Met Tyr Ser Ile Asp Ile Asn Asp Val

2750 2755 2760

Gln Asp Gln Cys Ser Cys Cys Ser Pro Thr Arg Thr Glu Pro Met

2765 2770 2775

Gln Val Ala Leu His Cys Thr Asn Gly Ser Val Val Tyr His Glu

2780 2785 2790

Val Leu Asn Ala Met Glu Cys Lys Cys Ser Pro Arg Lys Cys Ser

2795 2800 2805

Lys

<210> 130

<211> 36

<212> PRT

<213> 人工序列

<220>

<223> AE36

<400> 130

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro

35

<210> 131

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> AE42

<400> 131

Gly Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

1 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Ala Ser Ser

35 40

<210> 132

<211> 78

<212> PRT

<213> 人工序列

<220>

<223> AE72

<400> 132

Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

1 5 10 15

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

20 25 30

Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu

35 40 45

Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr

50 55 60

Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

65 70 75

<210> 133

<211> 78

<212> PRT

<213> 人工序列

<220>

<223> AE78

<400> 133

Gly Ala Pro Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser

1 5 10 15

Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala

20 25 30

Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu

35 40 45

Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr

50 55 60

Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

65 70 75

<210> 134

<211> 143

<212> PRT

<213> 人工序列

<220>

<223> AE144

<400> 134

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

1 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

50 55 60

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly

65 70 75 80

Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

100 105 110

Ser Ala Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

115 120 125

Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

<210> 135

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> AE144_6B

<400> 135

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

65 70 75 80

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

85 90 95

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro Ala

100 105 110

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 136

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> AG144

<400> 136

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

1 5 10 15

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

35 40 45

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro

50 55 60

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

65 70 75 80

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

85 90 95

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

100 105 110

Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala

115 120 125

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

130 135 140

<210> 137

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> AG144_A

<400> 137

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

<210> 138

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> AE288

<400> 138

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

1 5 10 15

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

20 25 30

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

35 40 45

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

65 70 75 80

Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

100 105 110

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr

115 120 125

Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

145 150 155 160

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro

165 170 175

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

180 185 190

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro

195 200 205

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr

210 215 220

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

245 250 255

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

275 280 285

<210> 139

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> AE288_2

<400> 139

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

20 25 30

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

65 70 75 80

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

85 90 95

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

100 105 110

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

115 120 125

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

145 150 155 160

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

165 170 175

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

225 230 235 240

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

245 250 255

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

275 280 285

<210> 140

<211> 288

<212> PRT

<213> 人工序列

<220>

<223> AG288

<400> 140

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

1 5 10 15

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

20 25 30

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

35 40 45

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

50 55 60

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr

65 70 75 80

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

85 90 95

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

100 105 110

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser

115 120 125

Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

130 135 140

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

145 150 155 160

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser

165 170 175

Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

180 185 190

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

195 200 205

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly

210 215 220

Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

225 230 235 240

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser

245 250 255

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

260 265 270

Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

275 280 285

<210> 141

<211> 576

<212> PRT

<213> 人工序列

<220>

<223> AE576

<400> 141

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu

20 25 30

Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

65 70 75 80

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala

100 105 110

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

115 120 125

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

145 150 155 160

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

165 170 175

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

245 250 255

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

275 280 285

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

290 295 300

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

305 310 315 320

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

325 330 335

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

340 345 350

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

355 360 365

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

370 375 380

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

385 390 395 400

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

405 410 415

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

420 425 430

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

435 440 445

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

450 455 460

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

465 470 475 480

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

485 490 495

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

500 505 510

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

515 520 525

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

530 535 540

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

545 550 555 560

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

565 570 575

<210> 142

<211> 576

<212> PRT

<213> 人工序列

<220>

<223> AG576

<400> 142

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser

1 5 10 15

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser

20 25 30

Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly

35 40 45

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

50 55 60

Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

65 70 75 80

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

85 90 95

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

100 105 110

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser

115 120 125

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

130 135 140

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser

145 150 155 160

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr

165 170 175

Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

180 185 190

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser

195 200 205

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly

210 215 220

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

225 230 235 240

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

245 250 255

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

260 265 270

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

275 280 285

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

290 295 300

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser

305 310 315 320

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

325 330 335

Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser

340 345 350

Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser

355 360 365

Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

370 375 380

Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro

385 390 395 400

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

405 410 415

Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

420 425 430

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro

435 440 445

Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly

450 455 460

Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser

465 470 475 480

Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser

485 490 495

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser

500 505 510

Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser

515 520 525

Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser

530 535 540

Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser

545 550 555 560

Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser

565 570 575

<210> 143

<211> 864

<212> PRT

<213> 人工序列

<220>

<223> AE864

<400> 143

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

1 5 10 15

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu

20 25 30

Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

35 40 45

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

50 55 60

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

65 70 75 80

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

85 90 95

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala

100 105 110

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

115 120 125

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

130 135 140

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala

145 150 155 160

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

165 170 175

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

180 185 190

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

195 200 205

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

210 215 220

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

225 230 235 240

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

245 250 255

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

260 265 270

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

275 280 285

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

290 295 300

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

305 310 315 320

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

325 330 335

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

340 345 350

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

355 360 365

Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

370 375 380

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr

385 390 395 400

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

405 410 415

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

420 425 430

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

435 440 445

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

450 455 460

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

465 470 475 480

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

485 490 495

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro

500 505 510

Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

515 520 525

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

530 535 540

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro

545 550 555 560

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

565 570 575

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

580 585 590

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

595 600 605

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

610 615 620

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

625 630 635 640

Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr

645 650 655

Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

660 665 670

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu

675 680 685

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly Ser Pro Thr

690 695 700

Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu

705 710 715 720

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu

725 730 735

Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro

740 745 750

Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

755 760 765

Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro

770 775 780

Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr

785 790 795 800

Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

805 810 815

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Glu Pro

820 825 830

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

835 840 845

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

850 855 860

<210> 144

<211> 864

<212> PRT

<213> 人工序列

<220>

<223> AG864

<400> 144

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Pro

1 5 10 15

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

20 25 30

Gly Thr Gly Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

35 40 45

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

50 55 60

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

65 70 75 80

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

85 90 95

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

100 105 110

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

115 120 125

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

130 135 140

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

145 150 155 160

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

165 170 175

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

180 185 190

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

195 200 205

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

210 215 220

Gly Thr Gly Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

225 230 235 240

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ala Ser Pro

245 250 255

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

260 265 270

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

275 280 285

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro

290 295 300

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

305 310 315 320

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

325 330 335

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

340 345 350

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

355 360 365

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

370 375 380

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

385 390 395 400

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

405 410 415

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

420 425 430

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

435 440 445

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

450 455 460

Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

465 470 475 480

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro

485 490 495

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

500 505 510

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

515 520 525

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro

530 535 540

Gly Thr Ser Ser Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser

545 550 555 560

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

565 570 575

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

580 585 590

Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala

595 600 605

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

610 615 620

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

625 630 635 640

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

645 650 655

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

660 665 670

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro

675 680 685

Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala

690 695 700

Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

705 710 715 720

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

725 730 735

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

740 745 750

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

755 760 765

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

770 775 780

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

785 790 795 800

Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro

805 810 815

Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr

820 825 830

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

835 840 845

Thr Gly Ser Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

850 855 860

<210> 145

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_2A_1

<400> 145

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

1 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 146

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_2A_2

<400> 146

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

50 55 60

Ala Thr Pro Glu Ser Gly Pro Gly

65 70

<210> 147

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_3B_1

<400> 147

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 148

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_3B_2

<400> 148

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

1 5 10 15

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

35 40 45

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 149

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_4A_2

<400> 149

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly

1 5 10 15

Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser

20 25 30

Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 150

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_5A_2

<400> 150

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly

50 55 60

Ser Pro Thr Ser Thr Glu Glu Gly

65 70

<210> 151

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_6B_1

<400> 151

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

20 25 30

Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

35 40 45

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

50 55 60

Thr Ser Gly Ser Glu Thr Pro Gly

65 70

<210> 152

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_6B_2

<400> 152

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu

1 5 10 15

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 153

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_1A_1

<400> 153

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 154

<211> 72

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE72_1A_2

<400> 154

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

1 5 10 15

Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

20 25 30

Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly

65 70

<210> 155

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> XTEN_AE144_1A

<400> 155

Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser

1 5 10 15

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

20 25 30

Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly

35 40 45

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu

50 55 60

Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

65 70 75 80

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

85 90 95

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly

100 105 110

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

115 120 125

Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

130 135 140

<210> 156

<211> 150

<212> PRT

<213> 人工序列

<220>

<223> AE150

<400> 156

Gly Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

1 5 10 15

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

20 25 30

Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser

35 40 45

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

50 55 60

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala

65 70 75 80

Thr Ser Gly Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

85 90 95

Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

100 105 110

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala

115 120 125

Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

130 135 140

Ser Ala Pro Ala Ser Ser

145 150

<210> 157

<211> 150

<212> PRT

<213> 人工序列

<220>

<223> G150

<400> 157

Gly Ala Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro Gly

1 5 10 15

Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser

20 25 30

Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly

35 40 45

Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly

50 55 60

Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr Pro

65 70 75 80

Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr Gly

85 90 95

Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly

100 105 110

Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly Ser

115 120 125

Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr

130 135 140

Gly Ser Pro Ala Ser Ser

145 150

<210> 158

<211> 294

<212> PRT

<213> 人工序列

<220>

<223> AE294

<400> 158

Gly Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

1 5 10 15

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

20 25 30

Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser

35 40 45

Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly

50 55 60

Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly

65 70 75 80

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu

85 90 95

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

100 105 110

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Pro Ala Gly

115 120 125

Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala Gly Ser Pro Thr Ser

130 135 140

Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

145 150 155 160

Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser

165 170 175

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu

180 185 190

Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly

195 200 205

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Ser Pro Ala Gly

210 215 220

Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly

225 230 235 240

Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly

245 250 255

Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser

260 265 270

Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly

275 280 285

Ser Ala Pro Ala Ser Ser

290

<210> 159

<211> 294

<212> PRT

<213> 人工序列

<220>

<223> AG294

<400> 159

Gly Ala Pro Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

1 5 10 15

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Thr Pro Gly

20 25 30

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

35 40 45

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

50 55 60

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Thr Pro Gly

65 70 75 80

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

85 90 95

Thr Gly Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro

100 105 110

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro

115 120 125

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser

130 135 140

Thr Gly Ser Pro Gly Thr Pro Gly Ser Gly Thr Ala Ser Ser Ser Pro

145 150 155 160

Gly Ser Ser Thr Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro

165 170 175

Ser Ala Ser Thr Gly Thr Gly Pro Gly Ser Ser Pro Ser Ala Ser Thr

180 185 190

Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

195 200 205

Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro Gly Ser Ser Thr

210 215 220

Pro Ser Gly Ala Thr Gly Ser Pro Gly Ser Ser Pro Ser Ala Ser Thr

225 230 235 240

Gly Thr Gly Pro Gly Ala Ser Pro Gly Thr Ser Ser Thr Gly Ser Pro

245 250 255

Gly Ser Ser Pro Ser Ala Ser Thr Gly Thr Gly Pro Gly Thr Pro Gly

260 265 270

Ser Gly Thr Ala Ser Ser Ser Pro Gly Ser Ser Thr Pro Ser Gly Ala

275 280 285

Thr Gly Ser Ala Ser Ser

290

<210> 160

<211> 1016

<212> PRT

<213> 人工序列

<220>

<223> FIX-连接符-白蛋白

<400> 160

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro

405 410 415

Val Ser Gln Thr Ser Lys Leu Thr Arg Ala Glu Thr Val Phe Pro Asp

420 425 430

Val Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly

435 440 445

Glu Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu

450 455 460

Gln Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr

465 470 475 480

Glu Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp

485 490 495

Lys Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr

500 505 510

Leu Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu

515 520 525

Pro Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn

530 535 540

Leu Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe

545 550 555 560

His Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala

565 570 575

Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys

580 585 590

Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala

595 600 605

Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala

610 615 620

Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly

625 630 635 640

Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe

645 650 655

Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr

660 665 670

Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp

675 680 685

Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile

690 695 700

Ser Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser

705 710 715 720

His Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro

725 730 735

Ser Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr

740 745 750

Ala Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala

755 760 765

Arg Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys

770 775 780

Thr Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Phe Cys

785 790 795 800

Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln

805 810 815

Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr

820 825 830

Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln

835 840 845

Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val

850 855 860

Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala

865 870 875 880

Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu

885 890 895

Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu

900 905 910

Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr

915 920 925

Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile

930 935 940

Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu

945 950 955 960

Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys

965 970 975

Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala

980 985 990

Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala

995 1000 1005

Ala Ser Gln Ala Ala Leu Gly Leu

1010 1015

<210> 161

<211> 424

<212> PRT

<213> 人工序列

<220>

<223> FIX

<400> 161

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Pro

405 410 415

Val Ser Gln Thr Ser Lys Leu Thr

420

<210> 162

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> 连接符

<400> 162

Arg Ala Glu Thr Val Phe Pro Asp Val

1 5

<210> 163

<211> 585

<212> PRT

<213> 人工序列

<220>

<223> 白蛋白

<400> 163

Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu

1 5 10 15

Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln

20 25 30

Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu

35 40 45

Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys

50 55 60

Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu

65 70 75 80

Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro

85 90 95

Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu

100 105 110

Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His

115 120 125

Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg

130 135 140

Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg

145 150 155 160

Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala

165 170 175

Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser

180 185 190

Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu

195 200 205

Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro

210 215 220

Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys

225 230 235 240

Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp

245 250 255

Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser

260 265 270

Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His

275 280 285

Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser

290 295 300

Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala

305 310 315 320

Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg

325 330 335

Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr

340 345 350

Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu

355 360 365

Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro

370 375 380

Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu

385 390 395 400

Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro

405 410 415

Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys

420 425 430

Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys

435 440 445

Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His

450 455 460

Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser

465 470 475 480

Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr

485 490 495

Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp

500 505 510

Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala

515 520 525

Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu

530 535 540

Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys

545 550 555 560

Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val

565 570 575

Ala Ala Ser Gln Ala Ala Leu Gly Leu

580 585

<210> 164

<211> 763

<212> PRT

<213> 人工序列

<220>

<223> FIX(XTEN )-Fc

<400> 164

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Gly Pro Ser Pro Gly Ser Pro Thr Ser Thr Glu Glu

210 215 220

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

225 230 235 240

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

245 250 255

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

260 265 270

Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ala Ser Ser

275 280 285

Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe Thr Arg Val Val

290 295 300

Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp Gln Val Val Leu

305 310 315 320

Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile Val Asn Glu Lys

325 330 335

Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly Val Lys Ile Thr

340 345 350

Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu His Thr Glu Gln

355 360 365

Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn Tyr Asn Ala Ala

370 375 380

Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro

385 390 395 400

Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile Ala Asp Lys Glu

405 410 415

Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp

420 425 430

Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val Leu Gln Tyr Leu

435 440 445

Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu Ser Thr Lys Phe

450 455 460

Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His Glu Gly Gly Arg

465 470 475 480

Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val Thr Glu Val Glu

485 490 495

Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala

500 505 510

Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn

515 520 525

Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr His Thr Cys Pro

530 535 540

Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe

545 550 555 560

Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val

565 570 575

Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe

580 585 590

Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro

595 600 605

Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr

610 615 620

Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val

625 630 635 640

Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala

645 650 655

Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg

660 665 670

Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly

675 680 685

Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro

690 695 700

Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser

705 710 715 720

Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln

725 730 735

Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His

740 745 750

Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

755 760

<210> 165

<211> 712

<212> PRT

<213> 人工序列

<220>

<223> FIX-FXIa-AE288

<400> 165

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Gly

405 410 415

Lys Leu Thr Arg Ala Glu Thr Gly Gly Thr Ser Glu Ser Ala Thr Pro

420 425 430

Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

435 440 445

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro

450 455 460

Ala Thr Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro

465 470 475 480

Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro

485 490 495

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu

500 505 510

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

515 520 525

Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

530 535 540

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Ser Pro Ala

545 550 555 560

Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu

565 570 575

Gly Ser Ala Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro

580 585 590

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Glu

595 600 605

Ser Ala Thr Pro Glu Ser Gly Pro Gly Ser Glu Pro Ala Thr Ser Gly

610 615 620

Ser Glu Thr Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

625 630 635 640

Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr

645 650 655

Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu

660 665 670

Gly Ser Ala Pro Gly Ser Glu Pro Ala Thr Ser Gly Ser Glu Thr Pro

675 680 685

Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr

690 695 700

Glu Pro Ser Glu Gly Ser Ala Pro

705 710

<210> 166

<211> 944

<212> PRT

<213> 人工序列

<220>

<223> FIX-Fc-Fc

<400> 166

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe

210 215 220

Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp

225 230 235 240

Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile

245 250 255

Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly

260 265 270

Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu

275 280 285

His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn

290 295 300

Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu

305 310 315 320

Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile

325 330 335

Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr

340 345 350

Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val

355 360 365

Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg

370 375 380

Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His

385 390 395 400

Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val

405 410 415

Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly

420 425 430

Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser

435 440 445

Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr Asp Lys Thr

450 455 460

His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

465 470 475 480

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

485 490 495

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro

500 505 510

Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

515 520 525

Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val

530 535 540

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

545 550 555 560

Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

565 570 575

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

580 585 590

Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

595 600 605

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

610 615 620

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

625 630 635 640

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser

645 650 655

Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

660 665 670

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

675 680 685

Arg Arg Arg Arg Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

690 695 700

Gly Gly Gly Ser Gly Gly Gly Gly Ser Arg Arg Arg Arg Asp Lys Thr

705 710 715 720

His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser

725 730 735

Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg

740 745 750

Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro

755 760 765

Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala

770 775 780

Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val

785 790 795 800

Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr

805 810 815

Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr

820 825 830

Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu

835 840 845

Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys

850 855 860

Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser

865 870 875 880

Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp

885 890 895

Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser

900 905 910

Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala

915 920 925

Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

930 935 940

<210> 167

<211> 383

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒B19 KY940273.1

<400> 167

ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60

aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120

cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180

gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240

ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300

taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360

tttggtgtct tcttttaaat ttt 383

<210> 168

<211> 248

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒B19 d135

<400> 168

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240

taaatttt 248

<210> 169

<211> 129

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒v1 AAV2

<400> 169

cggcgcgccg cttgatctta gtggcacgtc aaccagcgct ggcccagagc caaccctaat 60

tccggaagtc ctcagtccgc catcttgccc gcctaccggc ggcgaccggc ggcatcattt 120

ggtgttctt 129

<210> 170

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒V2

<400> 170

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60

ttagtggcac gtcaacccca agcgctggcc cagagtgtct tcttttaaat ttt 113

<210> 171

<211> 340

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒V3

<400> 171

caaatcagat gccgccggtc gccgccggta ggcgggactt ccggtacaag atggcggaca 60

attacgtcat ttcctgtgac gtatttcctg tgacgtactt ccggtggcgg gacttccgga 120

attttggctc tgggccagct tgcttggggt tgccttgacc aagcgcgcgc cgcttgatca 180

ccccaagcgc tggcccagag ccacctaacc ggaagtcccc ccaccggaag tgacgtcaca 240

ggaaagacgt cacaggaagt aattgtccgc catcttgtac cggaagtccc gcaccggcgg 300

cgaccggcgg catctgattt ggtgtcttct tttaaatttt 340

<210> 172

<211> 444

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒U25749.1

<400> 172

ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60

tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120

gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180

tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240

accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300

cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360

cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420

ggatattttg cgcgccagga agtg 444

<210> 173

<211> 282

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒GPV AAV2 V1

<400> 173

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282

<210> 174

<211> 145

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒GPV AAV2 V1

<400> 174

ttgaccacgc gcatgccgcg cggtcagccc aatagttaag ccgggtgacc acacgtgaca 60

ggaagcacgg gatgtgcgtc accggaagca gtgaccgggc tggttcgaac gaacgaaccc 120

tccaactcaa ggacaagagg atatt 145

<210> 175

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒GPV V2

<400> 175

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60

ttaagccgga aacacgtcac cgactcaagg acaagaggat attttgcgcg ccaggaagtg 120

<210> 176

<211> 102

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒GPV V3

<400> 176

gggaacaatc aggggaagtg accggtgacg tcatgtaact tgcgtcactt cccgttcgaa 60

cgaacgaacg agactcaagg acaagaggcg cgccaggaag tg 102

<210> 177

<211> 145

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒AAV2 NC_001401.2

<400> 177

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 178

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 细小病毒Gtx

<400> 178

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 179

<211> 6762

<212> DNA

<213> 人工序列

<220>

<223> B19-FVIII构建体

<400> 179

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240

taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300

cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360

cggccgcctc gacgactagc gtttaattaa acgcgtgtct gtctgcacat ttcgtagagc 420

gagtgttccg atactctaat ctccctaggc aaggttcata tttgtgtagg ttacttattc 480

tccttttgtt gactaagtca ataatcagaa tcagcaggtt tggagtcagc ttggcaggga 540

tcagcagcct gggttggaag gagggggtat aaaagcccct tcaccaggag aagccgtcac 600

acagatccac aagctcctga ggtaagtgcc gtgtgtggtt cccgcgggcc tggcctcttt 660

acgggttatg gcccttgcgt gccttgaatt actgacactg acatccactt tttctttttc 720

tccacagcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 780

cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 840

tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 900

aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 960

gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1020

attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1080

gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1140

gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1200

tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1260

tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1320

cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1380

atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1440

ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1500

ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1560

cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1620

ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1680

gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1740

cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1800

cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 1860

gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 1920

aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 1980

gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2040

ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2100

tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2160

gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2220

taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2280

aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2340

accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2400

ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2460

aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2520

ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2580

ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2640

tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2700

tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2760

tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 2820

gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 2880

gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 2940

ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3000

gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3060

gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3120

tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3180

ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3240

ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3300

tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3360

ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3420

tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3480

ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3540

gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3600

tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3660

atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3720

aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3780

gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 3840

ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 3900

tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 3960

gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4020

caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4080

gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4140

accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4200

ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4260

agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4320

gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4380

attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4440

ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4500

cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4560

tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4620

aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4680

agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4740

aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4800

attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 4860

caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 4920

accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 4980

ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5040

tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5100

atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5160

ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5220

cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5280

gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5340

ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5400

gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5460

ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5520

cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5580

atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5640

ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5700

cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5760

agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 5820

ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 5880

tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 5940

ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6000

tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6060

ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6120

gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6180

gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6240

ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6300

cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6360

gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6420

gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6480

aaattaggga taacagggta atggcgcggg ccgcaaaatt taaaagaaga caccaaatca 6540

gatgccgccg gtcgccgccg gtaggcggga cttccggtac aagatggcgg acaattacgt 6600

catttcctgt gacgtcattt cctgtgacgt cacttccggt gggcgggact tccggaatta 6660

gggttggctc tgggccagcg cttggggttg acgtgccact aagatcaagc ggcgcgccgc 6720

ttgtcttagt gtcaaggcaa ccccaagcaa gctggcccag ag 6762

<210> 180

<211> 248

<212> DNA

<213> 人工序列

<220>

<223> 5' ITR

<400> 180

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240

taaatttt 248

<210> 181

<211> 248

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 181

aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60

cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120

tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180

gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240

gcccagag 248

<210> 182

<211> 6830

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 182

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300

actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360

cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttaa 420

ttaaacgcgt gtctgtctgc acatttcgta gagcgagtgt tccgatactc taatctccct 480

aggcaaggtt catatttgtg taggttactt attctccttt tgttgactaa gtcaataatc 540

agaatcagca ggtttggagt cagcttggca gggatcagca gcctgggttg gaaggagggg 600

gtataaaagc cccttcacca ggagaagccg tcacacagat ccacaagctc ctgaggtaag 660

tgccgtgtgt ggttcccgcg ggcctggcct ctttacgggt tatggccctt gcgtgccttg 720

aattactgac actgacatcc actttttctt tttctccaca gctagcgcca ccatgcagat 780

tgagctgtcc acttgtttct tcctgtgcct cctgcgcttc tgtttctccg ccactcgccg 840

gtactacctt ggagccgtgg agctttcatg ggactacatg cagagcgacc tgggcgaact 900

ccccgtggat gccagattcc ccccccgcgt gccaaagtcc ttccccttta acacctccgt 960

ggtgtacaag aaaaccctct ttgtcgagtt cactgaccac ctgttcaaca tcgccaagcc 1020

gcgcccacct tggatgggcc tcctgggacc gaccattcaa gctgaagtgt acgacaccgt 1080

ggtgatcacc ctgaagaaca tggcgtccca ccccgtgtcc ctgcatgcgg tcggagtgtc 1140

ctactggaag gcctccgaag gagctgagta cgacgaccag actagccagc gggaaaagga 1200

ggacgataaa gtgttcccgg gcggctcgca tacttacgtg tggcaagtcc tgaaggaaaa 1260

cggacctatg gcatccgatc ctctgtgcct gacttactcc tacctttccc atgtggacct 1320

cgtgaaggac ctgaacagcg ggctgattgg tgcacttctc gtgtgccgcg aaggttcgct 1380

cgctaaggaa aagacccaga ccctccataa gttcatcctt ttgttcgctg tgttcgatga 1440

aggaaagtca tggcattccg aaactaagaa ctcgctgatg caggaccggg atgccgcctc 1500

agcccgcgcc tggcctaaaa tgcatacagt caacggatac gtgaatcggt cactgcccgg 1560

gctcatcggt tgtcacagaa agtccgtgta ctggcacgtc atcggcatgg gcactacgcc 1620

tgaagtgcac tccatcttcc tggaagggca caccttcctc gtgcgcaacc accgccaggc 1680

ctctctggaa atctccccga ttacctttct gaccgcccag actctgctca tggacctggg 1740

gcagttcctt ctcttctgcc acatctccag ccatcagcac gacggaatgg aggcctacgt 1800

gaaggtggac tcatgcccgg aagaacctca gttgcggatg aagaacaacg aggaggccga 1860

ggactatgac gacgatttga ctgactccga gatggacgtc gtgcggttcg atgacgacaa 1920

cagccccagc ttcatccaga ttcgcagcgt ggccaagaag caccccaaaa cctgggtgca 1980

ctacatcgcg gccgaggaag aagattggga ctacgccccg ttggtgctgg cacccgatga 2040

ccggtcgtac aagtcccagt atctgaacaa tggtccgcag cggattggca gaaagtacaa 2100

gaaagtgcgg ttcatggcgt acactgacga aacgtttaag acccgggagg ccattcaaca 2160

tgagagcggc attctgggac cactgctgta cggagaggtc ggcgataccc tgctcatcat 2220

cttcaaaaac caggcctccc ggccttacaa catctaccct cacggaatca ccgacgtgcg 2280

gccactctac tcgcggcgcc tgccgaaggg cgtcaagcac ctgaaagact tccctatcct 2340

gccgggcgaa atcttcaagt ataagtggac cgtcaccgtg gaggacgggc ccaccaagag 2400

cgatcctagg tgtctgactc ggtactactc cagcttcgtg aacatggaac gggacctggc 2460

atcgggactc attggaccgc tgctgatctg ctacaaagag tcggtggatc aacgcggcaa 2520

ccagatcatg tccgacaagc gcaacgtgat cctgttctcc gtgtttgatg aaaacagatc 2580

ctggtacctc actgaaaaca tccagaggtt cctcccaaac cccgcaggag tgcaactgga 2640

ggaccctgag tttcaggcct cgaatatcat gcactcgatt aacggttacg tgttcgactc 2700

gctgcaactg agcgtgtgcc tccatgaagt cgcttactgg tacattctgt ccatcggcgc 2760

ccagactgac ttcctgagcg tgttcttttc cggttacacc tttaagcaca agatggtgta 2820

cgaagatacc ctgaccctgt tccctttctc cggcgaaacg gtgttcatgt cgatggagaa 2880

cccgggtctg tggattctgg gatgccacaa cagcgacttt cggaaccgcg gaatgactgc 2940

cctgctgaag gtgtcctcat gcgacaagaa caccggagac tactacgagg actcctacga 3000

ggatatctca gcctacctcc tgtccaagaa caacgcgatc gagccgcgca gcttcagcca 3060

gaacggcgcg ccaacatcag agagcgccac ccctgaaagt ggtcccggga gcgagccagc 3120

cacatctggg tcggaaacgc caggcacaag tgagtctgca actcccgagt ccggacctgg 3180

ctccgagcct gccactagcg gctccgagac tccgggaact tccgagagcg ctacaccaga 3240

aagcggaccc ggaaccagta ccgaacctag cgagggctct gctccgggca gcccagccgg 3300

ctctcctaca tccacggagg agggcacttc cgaatccgcc accccggagt cagggccagg 3360

atctgaaccc gctacctcag gcagtgagac gccaggaacg agcgagtccg ctacaccgga 3420

gagtgggcca gggagccctg ctggatctcc tacgtccact gaggaagggt caccagcggg 3480

ctcgcccacc agcactgaag aaggtgcctc gagcccgcct gtgctgaaga ggcaccagcg 3540

agaaattacc cggaccaccc tccaatcgga tcaggaggaa atcgactacg acgacaccat 3600

ctcggtggaa atgaagaagg aagatttcga tatctacgac gaggacgaaa atcagtcccc 3660

tcgctcattc caaaagaaaa ctagacacta ctttatcgcc gcggtggaaa gactgtggga 3720

ctatggaatg tcatccagcc ctcacgtcct tcggaaccgg gcccagagcg gatcggtgcc 3780

tcagttcaag aaagtggtgt tccaggagtt caccgacggc agcttcaccc agccgctgta 3840

ccggggagaa ctgaacgaac acctgggcct gctcggtccc tacatccgcg cggaagtgga 3900

ggataacatc atggtgacct tccgtaacca agcatccaga ccttactcct tctattcctc 3960

cctgatctca tacgaggagg accagcgcca aggcgccgag ccccgcaaga acttcgtcaa 4020

gcccaacgag actaagacct acttctggaa ggtccaacac catatggccc cgaccaagga 4080

tgagtttgac tgcaaggcct gggcctactt ctccgacgtg gaccttgaga aggatgtcca 4140

ttccggcctg atcgggccgc tgctcgtgtg tcacaccaac accctgaacc cagcgcatgg 4200

acgccaggtc accgtccagg agtttgctct gttcttcacc atttttgacg aaactaagtc 4260

ctggtacttc accgagaata tggagcgaaa ctgtagagcg ccctgcaata tccagatgga 4320

agatccgact ttcaaggaga actatagatt ccacgccatc aacgggtaca tcatggatac 4380

tctgccgggg ctggtcatgg cccaggatca gaggattcgg tggtacttgc tgtcaatggg 4440

atcgaacgaa aacattcact ccattcactt ctccggtcac gtgttcactg tgcgcaagaa 4500

ggaggagtac aagatggcgc tgtacaatct gtaccccggg gtgttcgaaa ctgtggagat 4560

gctgccgtcc aaggccggca tctggagagt ggagtgcctg atcggagagc acctccacgc 4620

ggggatgtcc accctcttcc tggtgtactc gaataagtgc cagaccccgc tgggcatggc 4680

ctcgggccac atcagagact tccagatcac agcaagcgga caatacggcc aatgggcgcc 4740

gaagctggcc cgcttgcact actccggatc gatcaacgca tggtccacca aggaaccgtt 4800

ctcgtggatt aaggtggacc tcctggcccc tatgattatc cacggaatta agacccaggg 4860

cgccaggcag aagttctcct ccctgtacat ctcgcaattc atcatcatgt acagcctgga 4920

cgggaagaag tggcagactt acaggggaaa ctccaccggc accctgatgg tctttttcgg 4980

caacgtggat tcctccggca ttaagcacaa catcttcaac ccaccgatca tagccagata 5040

tattaggctc caccccactc actactcaat ccgctcaact cttcggatgg aactcatggg 5100

gtgcgacctg aactcctgct ccatgccgtt ggggatggaa tcaaaggcta ttagcgacgc 5160

ccagatcacc gcgagctcct acttcactaa catgttcgcc acctggagcc cctccaaggc 5220

caggctgcac ttgcagggac ggtcaaatgc ctggcggccg caagtgaaca atccgaagga 5280

atggcttcaa gtggatttcc aaaagaccat gaaagtgacc ggagtcacca cccagggagt 5340

gaagtccctt ctgacctcga tgtatgtgaa ggagttcctg attagcagca gccaggacgg 5400

gcaccagtgg accctgttct tccaaaacgg aaaggtcaag gtgttccagg ggaaccagga 5460

ctcgttcaca cccgtggtga actccctgga ccccccactg ctgacgcggt acttgaggat 5520

tcatcctcag tcctgggtcc atcagattgc attgcgaatg gaagtcctgg gctgcgaggc 5580

ccaggacctg tactgaatca gcctgagctc gctgatcata atcaacctct ggattacaaa 5640

atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac 5700

gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc 5760

ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt 5820

ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc 5880

tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc 5940

gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg 6000

gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt 6060

ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc 6120

cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt 6180

cggatctccc tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca 6240

gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac 6300

tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat 6360

tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca 6420

tgctggggat gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt 6480

ctagatatcc tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg 6540

cgggccgcca cttcctggcg cgcaaaatat cctcttgtcc ttgagtctca ttggagggtt 6600

cgttcgttcg aaccagccaa tcaggggagg gggaagtgac gcaagttccg gtcacatgct 6660

tccggtgacg cacatccggt gacgtagttc cggtcacgtg cttcctgtca cgtgtttccg 6720

gtcacgtgac ttccggtcat gtgacttccg gtgacgtgtt tccggcttaa ctattgggct 6780

gaccgcgcgg catgcgcgtg gtcaacctaa cagccggaaa cacgtcaccg 6830

<210> 183

<211> 282

<212> DNA

<213> 人工序列

<220>

<223> 5' ITR

<400> 183

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tg 282

<210> 184

<211> 282

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 184

cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60

cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120

cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180

acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240

ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cg 282

<210> 185

<211> 383

<212> DNA

<213> 人工序列

<220>

<223> 5' ITR

<400> 185

ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60

aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120

cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180

gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240

ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300

taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360

tttggtgtct tcttttaaat ttt 383

<210> 186

<211> 383

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 186

aaaatttaaa agaagacacc aaatcagatg ccgccggtcg ccgccggtag gcgggacttc 60

cggtacaaga tggcggacaa ttacgtcatt tcctgtgacg tcatttcctg tgacgtcact 120

tccggtgggc gggacttccg gaattagggt tggctctggg ccagcgcttg gggttgacgt 180

gccactaaga tcaagcggcg cgccgcttgt cttagtgtca aggcaacccc aagcaagctg 240

gcccagagcc aaccctaatt ccggaagtcc cgcccaccgg aagtgacgtc acaggaaatg 300

acgtcacagg aaatgacgta attgtccgcc atcttgtacc ggaagtcccg cctaccggcg 360

gcgaccggcg gcatctgatt tgg 383

<210> 187

<211> 444

<212> DNA

<213> 人工序列

<220>

<223> 5' ITR

<400> 187

ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60

tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120

gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180

tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240

accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300

cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360

cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420

ggatattttg cgcgccagga agtg 444

<210> 188

<211> 444

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 188

cacttcctgg cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt 60

cgaaccagcc aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga 120

cgcacatccg gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg 180

acttccggtc atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc 240

ggcatgcgcg tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa 300

gtcacgtgac cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg 360

cgtcaccgga agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt 420

cgaacgaacg aaccctccaa tgag 444

<210> 189

<211> 7032

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 189

ccaaatcaga tgccgccggt cgccgccggt aggcgggact tccggtacaa gatggcggac 60

aattacgtca tttcctgtga cgtcatttcc tgtgacgtca cttccggtgg gcgggacttc 120

cggaattagg gttggctctg ggccagcttg cttggggttg ccttgacact aagacaagcg 180

gcgcgccgct tgatcttagt ggcacgtcaa ccccaagcgc tggcccagag ccaaccctaa 240

ttccggaagt cccgcccacc ggaagtgacg tcacaggaaa tgacgtcaca ggaaatgacg 300

taattgtccg ccatcttgta ccggaagtcc cgcctaccgg cggcgaccgg cggcatctga 360

tttggtgtct tcttttaaat tttgcggcaa ttcagtcgat aactataacg gtcctaaggt 420

agcgatttaa atacgcgctc tcttaaggta gccccgggac gcgtcaattg agatctggat 480

ccggtaccga attcgcggcc gcctcgacga ctagcgttta attaaacgcg tgtctgtctg 540

cacatttcgt agagcgagtg ttccgatact ctaatctccc taggcaaggt tcatatttgt 600

gtaggttact tattctcctt ttgttgacta agtcaataat cagaatcagc aggtttggag 660

tcagcttggc agggatcagc agcctgggtt ggaaggaggg ggtataaaag ccccttcacc 720

aggagaagcc gtcacacaga tccacaagct cctgaggtaa gtgccgtgtg tggttcccgc 780

gggcctggcc tctttacggg ttatggccct tgcgtgcctt gaattactga cactgacatc 840

cactttttct ttttctccac agctagcgcc accatgcaga ttgagctgtc cacttgtttc 900

ttcctgtgcc tcctgcgctt ctgtttctcc gccactcgcc ggtactacct tggagccgtg 960

gagctttcat gggactacat gcagagcgac ctgggcgaac tccccgtgga tgccagattc 1020

cccccccgcg tgccaaagtc cttccccttt aacacctccg tggtgtacaa gaaaaccctc 1080

tttgtcgagt tcactgacca cctgttcaac atcgccaagc cgcgcccacc ttggatgggc 1140

ctcctgggac cgaccattca agctgaagtg tacgacaccg tggtgatcac cctgaagaac 1200

atggcgtccc accccgtgtc cctgcatgcg gtcggagtgt cctactggaa ggcctccgaa 1260

ggagctgagt acgacgacca gactagccag cgggaaaagg aggacgataa agtgttcccg 1320

ggcggctcgc atacttacgt gtggcaagtc ctgaaggaaa acggacctat ggcatccgat 1380

cctctgtgcc tgacttactc ctacctttcc catgtggacc tcgtgaagga cctgaacagc 1440

gggctgattg gtgcacttct cgtgtgccgc gaaggttcgc tcgctaagga aaagacccag 1500

accctccata agttcatcct tttgttcgct gtgttcgatg aaggaaagtc atggcattcc 1560

gaaactaaga actcgctgat gcaggaccgg gatgccgcct cagcccgcgc ctggcctaaa 1620

atgcatacag tcaacggata cgtgaatcgg tcactgcccg ggctcatcgg ttgtcacaga 1680

aagtccgtgt actggcacgt catcggcatg ggcactacgc ctgaagtgca ctccatcttc 1740

ctggaagggc acaccttcct cgtgcgcaac caccgccagg cctctctgga aatctccccg 1800

attacctttc tgaccgccca gactctgctc atggacctgg ggcagttcct tctcttctgc 1860

cacatctcca gccatcagca cgacggaatg gaggcctacg tgaaggtgga ctcatgcccg 1920

gaagaacctc agttgcggat gaagaacaac gaggaggccg aggactatga cgacgatttg 1980

actgactccg agatggacgt cgtgcggttc gatgacgaca acagccccag cttcatccag 2040

attcgcagcg tggccaagaa gcaccccaaa acctgggtgc actacatcgc ggccgaggaa 2100

gaagattggg actacgcccc gttggtgctg gcacccgatg accggtcgta caagtcccag 2160

tatctgaaca atggtccgca gcggattggc agaaagtaca agaaagtgcg gttcatggcg 2220

tacactgacg aaacgtttaa gacccgggag gccattcaac atgagagcgg cattctggga 2280

ccactgctgt acggagaggt cggcgatacc ctgctcatca tcttcaaaaa ccaggcctcc 2340

cggccttaca acatctaccc tcacggaatc accgacgtgc ggccactcta ctcgcggcgc 2400

ctgccgaagg gcgtcaagca cctgaaagac ttccctatcc tgccgggcga aatcttcaag 2460

tataagtgga ccgtcaccgt ggaggacggg cccaccaaga gcgatcctag gtgtctgact 2520

cggtactact ccagcttcgt gaacatggaa cgggacctgg catcgggact cattggaccg 2580

ctgctgatct gctacaaaga gtcggtggat caacgcggca accagatcat gtccgacaag 2640

cgcaacgtga tcctgttctc cgtgtttgat gaaaacagat cctggtacct cactgaaaac 2700

atccagaggt tcctcccaaa ccccgcagga gtgcaactgg aggaccctga gtttcaggcc 2760

tcgaatatca tgcactcgat taacggttac gtgttcgact cgctgcaact gagcgtgtgc 2820

ctccatgaag tcgcttactg gtacattctg tccatcggcg cccagactga cttcctgagc 2880

gtgttctttt ccggttacac ctttaagcac aagatggtgt acgaagatac cctgaccctg 2940

ttccctttct ccggcgaaac ggtgttcatg tcgatggaga acccgggtct gtggattctg 3000

ggatgccaca acagcgactt tcggaaccgc ggaatgactg ccctgctgaa ggtgtcctca 3060

tgcgacaaga acaccggaga ctactacgag gactcctacg aggatatctc agcctacctc 3120

ctgtccaaga acaacgcgat cgagccgcgc agcttcagcc agaacggcgc gccaacatca 3180

gagagcgcca cccctgaaag tggtcccggg agcgagccag ccacatctgg gtcggaaacg 3240

ccaggcacaa gtgagtctgc aactcccgag tccggacctg gctccgagcc tgccactagc 3300

ggctccgaga ctccgggaac ttccgagagc gctacaccag aaagcggacc cggaaccagt 3360

accgaaccta gcgagggctc tgctccgggc agcccagccg gctctcctac atccacggag 3420

gagggcactt ccgaatccgc caccccggag tcagggccag gatctgaacc cgctacctca 3480

ggcagtgaga cgccaggaac gagcgagtcc gctacaccgg agagtgggcc agggagccct 3540

gctggatctc ctacgtccac tgaggaaggg tcaccagcgg gctcgcccac cagcactgaa 3600

gaaggtgcct cgagcccgcc tgtgctgaag aggcaccagc gagaaattac ccggaccacc 3660

ctccaatcgg atcaggagga aatcgactac gacgacacca tctcggtgga aatgaagaag 3720

gaagatttcg atatctacga cgaggacgaa aatcagtccc ctcgctcatt ccaaaagaaa 3780

actagacact actttatcgc cgcggtggaa agactgtggg actatggaat gtcatccagc 3840

cctcacgtcc ttcggaaccg ggcccagagc ggatcggtgc ctcagttcaa gaaagtggtg 3900

ttccaggagt tcaccgacgg cagcttcacc cagccgctgt accggggaga actgaacgaa 3960

cacctgggcc tgctcggtcc ctacatccgc gcggaagtgg aggataacat catggtgacc 4020

ttccgtaacc aagcatccag accttactcc ttctattcct ccctgatctc atacgaggag 4080

gaccagcgcc aaggcgccga gccccgcaag aacttcgtca agcccaacga gactaagacc 4140

tacttctgga aggtccaaca ccatatggcc ccgaccaagg atgagtttga ctgcaaggcc 4200

tgggcctact tctccgacgt ggaccttgag aaggatgtcc attccggcct gatcgggccg 4260

ctgctcgtgt gtcacaccaa caccctgaac ccagcgcatg gacgccaggt caccgtccag 4320

gagtttgctc tgttcttcac catttttgac gaaactaagt cctggtactt caccgagaat 4380

atggagcgaa actgtagagc gccctgcaat atccagatgg aagatccgac tttcaaggag 4440

aactatagat tccacgccat caacgggtac atcatggata ctctgccggg gctggtcatg 4500

gcccaggatc agaggattcg gtggtacttg ctgtcaatgg gatcgaacga aaacattcac 4560

tccattcact tctccggtca cgtgttcact gtgcgcaaga aggaggagta caagatggcg 4620

ctgtacaatc tgtaccccgg ggtgttcgaa actgtggaga tgctgccgtc caaggccggc 4680

atctggagag tggagtgcct gatcggagag cacctccacg cggggatgtc caccctcttc 4740

ctggtgtact cgaataagtg ccagaccccg ctgggcatgg cctcgggcca catcagagac 4800

ttccagatca cagcaagcgg acaatacggc caatgggcgc cgaagctggc ccgcttgcac 4860

tactccggat cgatcaacgc atggtccacc aaggaaccgt tctcgtggat taaggtggac 4920

ctcctggccc ctatgattat ccacggaatt aagacccagg gcgccaggca gaagttctcc 4980

tccctgtaca tctcgcaatt catcatcatg tacagcctgg acgggaagaa gtggcagact 5040

tacaggggaa actccaccgg caccctgatg gtctttttcg gcaacgtgga ttcctccggc 5100

attaagcaca acatcttcaa cccaccgatc atagccagat atattaggct ccaccccact 5160

cactactcaa tccgctcaac tcttcggatg gaactcatgg ggtgcgacct gaactcctgc 5220

tccatgccgt tggggatgga atcaaaggct attagcgacg cccagatcac cgcgagctcc 5280

tacttcacta acatgttcgc cacctggagc ccctccaagg ccaggctgca cttgcaggga 5340

cggtcaaatg cctggcggcc gcaagtgaac aatccgaagg aatggcttca agtggatttc 5400

caaaagacca tgaaagtgac cggagtcacc acccagggag tgaagtccct tctgacctcg 5460

atgtatgtga aggagttcct gattagcagc agccaggacg ggcaccagtg gaccctgttc 5520

ttccaaaacg gaaaggtcaa ggtgttccag gggaaccagg actcgttcac acccgtggtg 5580

aactccctgg accccccact gctgacgcgg tacttgagga ttcatcctca gtcctgggtc 5640

catcagattg cattgcgaat ggaagtcctg ggctgcgagg cccaggacct gtactgaatc 5700

agcctgagct cgctgatcat aatcaacctc tggattacaa aatttgtgaa agattgactg 5760

gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta atgcctttgt 5820

atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa tcctggttgc 5880

tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt 5940

ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc ctttccggga 6000

ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc cttgcccgct 6060

gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg gggaaatcat 6120

cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg acgtccttct 6180

gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg ctgccggctc 6240

tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc ctttgggccg 6300

cctccccgct gatcagcctc gactgtgcct tctagttgcc agccatctgt tgtttgcccc 6360

tcccccgtgc cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat 6420

gaggaaattg catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg 6480

caggacagca agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc 6540

tctatggctt ctgaggcgga aagaacgggc tcgagaagct tctagatatc ctctcttaag 6600

gtagcatcga gatttaaatt agggataaca gggtaatggc gcgggccgca aaatttaaaa 6660

gaagacacca aatcagatgc cgccggtcgc cgccggtagg cgggacttcc ggtacaagat 6720

ggcggacaat tacgtcattt cctgtgacgt catttcctgt gacgtcactt ccggtgggcg 6780

ggacttccgg aattagggtt ggctctgggc cagcgcttgg ggttgacgtg ccactaagat 6840

caagcggcgc gccgcttgtc ttagtgtcaa ggcaacccca agcaagctgg cccagagcca 6900

accctaattc cggaagtccc gcccaccgga agtgacgtca caggaaatga cgtcacagga 6960

aatgacgtaa ttgtccgcca tcttgtaccg gaagtcccgc ctaccggcgg cgaccggcgg 7020

catctgattt gg 7032

<210> 190

<211> 6824

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 190

ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata 180

cgcgctctct taaggtagcc ccgggacgcg tcaattgaga tctggatccg gtaccgaatt 240

cgcggccgcc tcgacgacta gcgtttaatt aaatcgaggt gagccccacg ttctgcttca 300

ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt ttttaattat 360

tttgtgcagc gatgggggcg gggggggggg gggggcgcgc gccaggcggg gcggggcggg 420

gcgaggggcg gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc 480

tccgaaagtt tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg 540

cgcggcgggc gggagtcgct gcgcgctgcc ttcgccccgt gccccgctcc gccgccgcct 600

cgcgccgccc gccccggctc tgactgaccg cgttactccc acaggtgagc gggcgggacg 660

gcccttctcc ttcgggctgt aattagcgct tggtttaatg acggcttgtt tcttttctgt 720

ggctgcgtga aagccttgag gggctccggg agggcccttt gtgcgggggg agcggctcgg 780

ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 840

tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 900

ctacaggcta gcgccaccat gcagattgag ctgtccactt gtttcttcct gtgcctcctg 960

cgcttctgtt tctccgccac tcgccggtac taccttggag ccgtggagct ttcatgggac 1020

tacatgcaga gcgacctggg cgaactcccc gtggatgcca gattcccccc ccgcgtgcca 1080

aagtccttcc cctttaacac ctccgtggtg tacaagaaaa ccctctttgt cgagttcact 1140

gaccacctgt tcaacatcgc caagccgcgc ccaccttgga tgggcctcct gggaccgacc 1200

attcaagctg aagtgtacga caccgtggtg atcaccctga agaacatggc gtcccacccc 1260

gtgtccctgc atgcggtcgg agtgtcctac tggaaggcct ccgaaggagc tgagtacgac 1320

gaccagacta gccagcggga aaaggaggac gataaagtgt tcccgggcgg ctcgcatact 1380

tacgtgtggc aagtcctgaa ggaaaacgga cctatggcat ccgatcctct gtgcctgact 1440

tactcctacc tttcccatgt ggacctcgtg aaggacctga acagcgggct gattggtgca 1500

cttctcgtgt gccgcgaagg ttcgctcgct aaggaaaaga cccagaccct ccataagttc 1560

atccttttgt tcgctgtgtt cgatgaagga aagtcatggc attccgaaac taagaactcg 1620

ctgatgcagg accgggatgc cgcctcagcc cgcgcctggc ctaaaatgca tacagtcaac 1680

ggatacgtga atcggtcact gcccgggctc atcggttgtc acagaaagtc cgtgtactgg 1740

cacgtcatcg gcatgggcac tacgcctgaa gtgcactcca tcttcctgga agggcacacc 1800

ttcctcgtgc gcaaccaccg ccaggcctct ctggaaatct ccccgattac ctttctgacc 1860

gcccagactc tgctcatgga cctggggcag ttccttctct tctgccacat ctccagccat 1920

cagcacgacg gaatggaggc ctacgtgaag gtggactcat gcccggaaga acctcagttg 1980

cggatgaaga acaacgagga ggccgaggac tatgacgacg atttgactga ctccgagatg 2040

gacgtcgtgc ggttcgatga cgacaacagc cccagcttca tccagattcg cagcgtggcc 2100

aagaagcacc ccaaaacctg ggtgcactac atcgcggccg aggaagaaga ttgggactac 2160

gccccgttgg tgctggcacc cgatgaccgg tcgtacaagt cccagtatct gaacaatggt 2220

ccgcagcgga ttggcagaaa gtacaagaaa gtgcggttca tggcgtacac tgacgaaacg 2280

tttaagaccc gggaggccat tcaacatgag agcggcattc tgggaccact gctgtacgga 2340

gaggtcggcg ataccctgct catcatcttc aaaaaccagg cctcccggcc ttacaacatc 2400

taccctcacg gaatcaccga cgtgcggcca ctctactcgc ggcgcctgcc gaagggcgtc 2460

aagcacctga aagacttccc tatcctgccg ggcgaaatct tcaagtataa gtggaccgtc 2520

accgtggagg acgggcccac caagagcgat cctaggtgtc tgactcggta ctactccagc 2580

ttcgtgaaca tggaacggga cctggcatcg ggactcattg gaccgctgct gatctgctac 2640

aaagagtcgg tggatcaacg cggcaaccag atcatgtccg acaagcgcaa cgtgatcctg 2700

ttctccgtgt ttgatgaaaa cagatcctgg tacctcactg aaaacatcca gaggttcctc 2760

ccaaaccccg caggagtgca actggaggac cctgagtttc aggcctcgaa tatcatgcac 2820

tcgattaacg gttacgtgtt cgactcgctg caactgagcg tgtgcctcca tgaagtcgct 2880

tactggtaca ttctgtccat cggcgcccag actgacttcc tgagcgtgtt cttttccggt 2940

tacaccttta agcacaagat ggtgtacgaa gataccctga ccctgttccc tttctccggc 3000

gaaacggtgt tcatgtcgat ggagaacccg ggtctgtgga ttctgggatg ccacaacagc 3060

gactttcgga accgcggaat gactgccctg ctgaaggtgt cctcatgcga caagaacacc 3120

ggagactact acgaggactc ctacgaggat atctcagcct acctcctgtc caagaacaac 3180

gcgatcgagc cgcgcagctt cagccagaac ggcgcgccaa catcagagag cgccacccct 3240

gaaagtggtc ccgggagcga gccagccaca tctgggtcgg aaacgccagg cacaagtgag 3300

tctgcaactc ccgagtccgg acctggctcc gagcctgcca ctagcggctc cgagactccg 3360

ggaacttccg agagcgctac accagaaagc ggacccggaa ccagtaccga acctagcgag 3420

ggctctgctc cgggcagccc agccggctct cctacatcca cggaggaggg cacttccgaa 3480

tccgccaccc cggagtcagg gccaggatct gaacccgcta cctcaggcag tgagacgcca 3540

ggaacgagcg agtccgctac accggagagt gggccaggga gccctgctgg atctcctacg 3600

tccactgagg aagggtcacc agcgggctcg cccaccagca ctgaagaagg tgcctcgagc 3660

ccgcctgtgc tgaagaggca ccagcgagaa attacccgga ccaccctcca atcggatcag 3720

gaggaaatcg actacgacga caccatctcg gtggaaatga agaaggaaga tttcgatatc 3780

tacgacgagg acgaaaatca gtcccctcgc tcattccaaa agaaaactag acactacttt 3840

atcgccgcgg tggaaagact gtgggactat ggaatgtcat ccagccctca cgtccttcgg 3900

aaccgggccc agagcggatc ggtgcctcag ttcaagaaag tggtgttcca ggagttcacc 3960

gacggcagct tcacccagcc gctgtaccgg ggagaactga acgaacacct gggcctgctc 4020

ggtccctaca tccgcgcgga agtggaggat aacatcatgg tgaccttccg taaccaagca 4080

tccagacctt actccttcta ttcctccctg atctcatacg aggaggacca gcgccaaggc 4140

gccgagcccc gcaagaactt cgtcaagccc aacgagacta agacctactt ctggaaggtc 4200

caacaccata tggccccgac caaggatgag tttgactgca aggcctgggc ctacttctcc 4260

gacgtggacc ttgagaagga tgtccattcc ggcctgatcg ggccgctgct cgtgtgtcac 4320

accaacaccc tgaacccagc gcatggacgc caggtcaccg tccaggagtt tgctctgttc 4380

ttcaccattt ttgacgaaac taagtcctgg tacttcaccg agaatatgga gcgaaactgt 4440

agagcgccct gcaatatcca gatggaagat ccgactttca aggagaacta tagattccac 4500

gccatcaacg ggtacatcat ggatactctg ccggggctgg tcatggccca ggatcagagg 4560

attcggtggt acttgctgtc aatgggatcg aacgaaaaca ttcactccat tcacttctcc 4620

ggtcacgtgt tcactgtgcg caagaaggag gagtacaaga tggcgctgta caatctgtac 4680

cccggggtgt tcgaaactgt ggagatgctg ccgtccaagg ccggcatctg gagagtggag 4740

tgcctgatcg gagagcacct ccacgcgggg atgtccaccc tcttcctggt gtactcgaat 4800

aagtgccaga ccccgctggg catggcctcg ggccacatca gagacttcca gatcacagca 4860

agcggacaat acggccaatg ggcgccgaag ctggcccgct tgcactactc cggatcgatc 4920

aacgcatggt ccaccaagga accgttctcg tggattaagg tggacctcct ggcccctatg 4980

attatccacg gaattaagac ccagggcgcc aggcagaagt tctcctccct gtacatctcg 5040

caattcatca tcatgtacag cctggacggg aagaagtggc agacttacag gggaaactcc 5100

accggcaccc tgatggtctt tttcggcaac gtggattcct ccggcattaa gcacaacatc 5160

ttcaacccac cgatcatagc cagatatatt aggctccacc ccactcacta ctcaatccgc 5220

tcaactcttc ggatggaact catggggtgc gacctgaact cctgctccat gccgttgggg 5280

atggaatcaa aggctattag cgacgcccag atcaccgcga gctcctactt cactaacatg 5340

ttcgccacct ggagcccctc caaggccagg ctgcacttgc agggacggtc aaatgcctgg 5400

cggccgcaag tgaacaatcc gaaggaatgg cttcaagtgg atttccaaaa gaccatgaaa 5460

gtgaccggag tcaccaccca gggagtgaag tcccttctga cctcgatgta tgtgaaggag 5520

ttcctgatta gcagcagcca ggacgggcac cagtggaccc tgttcttcca aaacggaaag 5580

gtcaaggtgt tccaggggaa ccaggactcg ttcacacccg tggtgaactc cctggacccc 5640

ccactgctga cgcggtactt gaggattcat cctcagtcct gggtccatca gattgcattg 5700

cgaatggaag tcctgggctg cgaggcccag gacctgtact gaatcagcct gagctcgctg 5760

atcataatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 5820

ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 5880

cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 5940

agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 6000

ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 6060

tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 6120

ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 6180

tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 6240

ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 6300

gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgctgatca 6360

gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 6420

ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 6480

cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 6540

gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 6600

gcggaaagaa cgggctcgag aagcttctag atatcctctc ttaaggtagc atcgagattt 6660

aaattaggga taacagggta atggcgcggg ccgcaggaac ccctagtgat ggagttggcc 6720

actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 6780

ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcag 6824

<210> 191

<211> 278

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 191

tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60

ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 120

ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180

cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240

ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 278

<210> 192

<211> 262

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 192

gtgagcgggc gggacggccc ttctccttcg ggctgtaatt agcgcttggt ttaatgacgg 60

cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc 120

ggggggagcg gctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag 180

ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgttca 240

tgccttcttc tttttcctac ag 262

<210> 193

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 193

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag 130

<210> 194

<211> 7154

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 194

ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag tgacgcaagt 60

tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca cgtgcttcct 120

gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg tgtttccggc 180

tgttaggttg accacgcgca tgccgcgcgg tcagcccaat agttaagccg gaaacacgtc 240

accggaagtc acatgaccgg aagtcacgtg accggaaaca cgtgacagga agcacgtgac 300

cggaactacg tcaccggatg tgcgtcaccg gaagcatgtg accggaactt gcgtcacttc 360

cccctcccct gattggctgg ttcgaacgaa cgaaccctcc aatgagactc aaggacaaga 420

ggatattttg cgcgccagga agtggcggca attcagtcga taactataac ggtcctaagg 480

tagcgattta aatacgcgct ctcttaaggt agccccggga cgcgtcaatt gagatctgga 540

tccggtaccg aattcgcggc cgcctcgacg actagcgttt aattaaacgc gtgtctgtct 600

gcacatttcg tagagcgagt gttccgatac tctaatctcc ctaggcaagg ttcatatttg 660

tgtaggttac ttattctcct tttgttgact aagtcaataa tcagaatcag caggtttgga 720

gtcagcttgg cagggatcag cagcctgggt tggaaggagg gggtataaaa gccccttcac 780

caggagaagc cgtcacacag atccacaagc tcctgaggta agtgccgtgt gtggttcccg 840

cgggcctggc ctctttacgg gttatggccc ttgcgtgcct tgaattactg acactgacat 900

ccactttttc tttttctcca cagctagcgc caccatgcag attgagctgt ccacttgttt 960

cttcctgtgc ctcctgcgct tctgtttctc cgccactcgc cggtactacc ttggagccgt 1020

ggagctttca tgggactaca tgcagagcga cctgggcgaa ctccccgtgg atgccagatt 1080

ccccccccgc gtgccaaagt ccttcccctt taacacctcc gtggtgtaca agaaaaccct 1140

ctttgtcgag ttcactgacc acctgttcaa catcgccaag ccgcgcccac cttggatggg 1200

cctcctggga ccgaccattc aagctgaagt gtacgacacc gtggtgatca ccctgaagaa 1260

catggcgtcc caccccgtgt ccctgcatgc ggtcggagtg tcctactgga aggcctccga 1320

aggagctgag tacgacgacc agactagcca gcgggaaaag gaggacgata aagtgttccc 1380

gggcggctcg catacttacg tgtggcaagt cctgaaggaa aacggaccta tggcatccga 1440

tcctctgtgc ctgacttact cctacctttc ccatgtggac ctcgtgaagg acctgaacag 1500

cgggctgatt ggtgcacttc tcgtgtgccg cgaaggttcg ctcgctaagg aaaagaccca 1560

gaccctccat aagttcatcc ttttgttcgc tgtgttcgat gaaggaaagt catggcattc 1620

cgaaactaag aactcgctga tgcaggaccg ggatgccgcc tcagcccgcg cctggcctaa 1680

aatgcataca gtcaacggat acgtgaatcg gtcactgccc gggctcatcg gttgtcacag 1740

aaagtccgtg tactggcacg tcatcggcat gggcactacg cctgaagtgc actccatctt 1800

cctggaaggg cacaccttcc tcgtgcgcaa ccaccgccag gcctctctgg aaatctcccc 1860

gattaccttt ctgaccgccc agactctgct catggacctg gggcagttcc ttctcttctg 1920

ccacatctcc agccatcagc acgacggaat ggaggcctac gtgaaggtgg actcatgccc 1980

ggaagaacct cagttgcgga tgaagaacaa cgaggaggcc gaggactatg acgacgattt 2040

gactgactcc gagatggacg tcgtgcggtt cgatgacgac aacagcccca gcttcatcca 2100

gattcgcagc gtggccaaga agcaccccaa aacctgggtg cactacatcg cggccgagga 2160

agaagattgg gactacgccc cgttggtgct ggcacccgat gaccggtcgt acaagtccca 2220

gtatctgaac aatggtccgc agcggattgg cagaaagtac aagaaagtgc ggttcatggc 2280

gtacactgac gaaacgttta agacccggga ggccattcaa catgagagcg gcattctggg 2340

accactgctg tacggagagg tcggcgatac cctgctcatc atcttcaaaa accaggcctc 2400

ccggccttac aacatctacc ctcacggaat caccgacgtg cggccactct actcgcggcg 2460

cctgccgaag ggcgtcaagc acctgaaaga cttccctatc ctgccgggcg aaatcttcaa 2520

gtataagtgg accgtcaccg tggaggacgg gcccaccaag agcgatccta ggtgtctgac 2580

tcggtactac tccagcttcg tgaacatgga acgggacctg gcatcgggac tcattggacc 2640

gctgctgatc tgctacaaag agtcggtgga tcaacgcggc aaccagatca tgtccgacaa 2700

gcgcaacgtg atcctgttct ccgtgtttga tgaaaacaga tcctggtacc tcactgaaaa 2760

catccagagg ttcctcccaa accccgcagg agtgcaactg gaggaccctg agtttcaggc 2820

ctcgaatatc atgcactcga ttaacggtta cgtgttcgac tcgctgcaac tgagcgtgtg 2880

cctccatgaa gtcgcttact ggtacattct gtccatcggc gcccagactg acttcctgag 2940

cgtgttcttt tccggttaca cctttaagca caagatggtg tacgaagata ccctgaccct 3000

gttccctttc tccggcgaaa cggtgttcat gtcgatggag aacccgggtc tgtggattct 3060

gggatgccac aacagcgact ttcggaaccg cggaatgact gccctgctga aggtgtcctc 3120

atgcgacaag aacaccggag actactacga ggactcctac gaggatatct cagcctacct 3180

cctgtccaag aacaacgcga tcgagccgcg cagcttcagc cagaacggcg cgccaacatc 3240

agagagcgcc acccctgaaa gtggtcccgg gagcgagcca gccacatctg ggtcggaaac 3300

gccaggcaca agtgagtctg caactcccga gtccggacct ggctccgagc ctgccactag 3360

cggctccgag actccgggaa cttccgagag cgctacacca gaaagcggac ccggaaccag 3420

taccgaacct agcgagggct ctgctccggg cagcccagcc ggctctccta catccacgga 3480

ggagggcact tccgaatccg ccaccccgga gtcagggcca ggatctgaac ccgctacctc 3540

aggcagtgag acgccaggaa cgagcgagtc cgctacaccg gagagtgggc cagggagccc 3600

tgctggatct cctacgtcca ctgaggaagg gtcaccagcg ggctcgccca ccagcactga 3660

agaaggtgcc tcgagcccgc ctgtgctgaa gaggcaccag cgagaaatta cccggaccac 3720

cctccaatcg gatcaggagg aaatcgacta cgacgacacc atctcggtgg aaatgaagaa 3780

ggaagatttc gatatctacg acgaggacga aaatcagtcc cctcgctcat tccaaaagaa 3840

aactagacac tactttatcg ccgcggtgga aagactgtgg gactatggaa tgtcatccag 3900

ccctcacgtc cttcggaacc gggcccagag cggatcggtg cctcagttca agaaagtggt 3960

gttccaggag ttcaccgacg gcagcttcac ccagccgctg taccggggag aactgaacga 4020

acacctgggc ctgctcggtc cctacatccg cgcggaagtg gaggataaca tcatggtgac 4080

cttccgtaac caagcatcca gaccttactc cttctattcc tccctgatct catacgagga 4140

ggaccagcgc caaggcgccg agccccgcaa gaacttcgtc aagcccaacg agactaagac 4200

ctacttctgg aaggtccaac accatatggc cccgaccaag gatgagtttg actgcaaggc 4260

ctgggcctac ttctccgacg tggaccttga gaaggatgtc cattccggcc tgatcgggcc 4320

gctgctcgtg tgtcacacca acaccctgaa cccagcgcat ggacgccagg tcaccgtcca 4380

ggagtttgct ctgttcttca ccatttttga cgaaactaag tcctggtact tcaccgagaa 4440

tatggagcga aactgtagag cgccctgcaa tatccagatg gaagatccga ctttcaagga 4500

gaactataga ttccacgcca tcaacgggta catcatggat actctgccgg ggctggtcat 4560

ggcccaggat cagaggattc ggtggtactt gctgtcaatg ggatcgaacg aaaacattca 4620

ctccattcac ttctccggtc acgtgttcac tgtgcgcaag aaggaggagt acaagatggc 4680

gctgtacaat ctgtaccccg gggtgttcga aactgtggag atgctgccgt ccaaggccgg 4740

catctggaga gtggagtgcc tgatcggaga gcacctccac gcggggatgt ccaccctctt 4800

cctggtgtac tcgaataagt gccagacccc gctgggcatg gcctcgggcc acatcagaga 4860

cttccagatc acagcaagcg gacaatacgg ccaatgggcg ccgaagctgg cccgcttgca 4920

ctactccgga tcgatcaacg catggtccac caaggaaccg ttctcgtgga ttaaggtgga 4980

cctcctggcc cctatgatta tccacggaat taagacccag ggcgccaggc agaagttctc 5040

ctccctgtac atctcgcaat tcatcatcat gtacagcctg gacgggaaga agtggcagac 5100

ttacagggga aactccaccg gcaccctgat ggtctttttc ggcaacgtgg attcctccgg 5160

cattaagcac aacatcttca acccaccgat catagccaga tatattaggc tccaccccac 5220

tcactactca atccgctcaa ctcttcggat ggaactcatg gggtgcgacc tgaactcctg 5280

ctccatgccg ttggggatgg aatcaaaggc tattagcgac gcccagatca ccgcgagctc 5340

ctacttcact aacatgttcg ccacctggag cccctccaag gccaggctgc acttgcaggg 5400

acggtcaaat gcctggcggc cgcaagtgaa caatccgaag gaatggcttc aagtggattt 5460

ccaaaagacc atgaaagtga ccggagtcac cacccaggga gtgaagtccc ttctgacctc 5520

gatgtatgtg aaggagttcc tgattagcag cagccaggac gggcaccagt ggaccctgtt 5580

cttccaaaac ggaaaggtca aggtgttcca ggggaaccag gactcgttca cacccgtggt 5640

gaactccctg gaccccccac tgctgacgcg gtacttgagg attcatcctc agtcctgggt 5700

ccatcagatt gcattgcgaa tggaagtcct gggctgcgag gcccaggacc tgtactgaat 5760

cagcctgagc tcgctgatca taatcaacct ctggattaca aaatttgtga aagattgact 5820

ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt aatgcctttg 5880

tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa atcctggttg 5940

ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt gtgcactgtg 6000

tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct cctttccggg 6060

actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg ccttgcccgc 6120

tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc ggggaaatca 6180

tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg gacgtccttc 6240

tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct gctgccggct 6300

ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc cctttgggcc 6360

gcctccccgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 6420

ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 6480

tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 6540

gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg 6600

ctctatggct tctgaggcgg aaagaacggg ctcgagaagc ttctagatat cctctcttaa 6660

ggtagcatcg agatttaaat tagggataac agggtaatgg cgcgggccgc cacttcctgg 6720

cgcgcaaaat atcctcttgt ccttgagtct cattggaggg ttcgttcgtt cgaaccagcc 6780

aatcagggga gggggaagtg acgcaagttc cggtcacatg cttccggtga cgcacatccg 6840

gtgacgtagt tccggtcacg tgcttcctgt cacgtgtttc cggtcacgtg acttccggtc 6900

atgtgacttc cggtgacgtg tttccggctt aactattggg ctgaccgcgc ggcatgcgcg 6960

tggtcaacct aacagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac 7020

cggaaacacg tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga 7080

agcatgtgac cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg 7140

aaccctccaa tgag 7154

<210> 195

<211> 648

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 195

ctagttatta atagtaatca attacggggt cattagttca tagcccatat atggagttcc 60

gcgttacata acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat 120

tgacgtcaat aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc 180

aatgggtgga gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc 240

caagtacgcc ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt 300

acatgacctt atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta 360

ccatgcatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc 420

ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg 480

gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg 540

cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg 600

aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcg 648

<210> 196

<211> 1428

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 196

atggactaca aagaccatga cggtgattat aaagatcatg atatcgatta caaggatgac 60

gatgacaagg ctgctgtggt tctggaaaat ggcgtgctga gccggaagct gagcgacttc 120

ggacaagaga caagctacat cgaggacaac agcaaccaga atggcgccgt gtctctgatc 180

ttcagcctga aagaagaagt gggcgccctg gccaaggtgc tgagactgtt cgaggaaaac 240

gagatcaatc tgacccacat cgagagcaga cccagcagac tgaacaagga cgagtacgag 300

ttcttcacct acctggacaa gcggagcaag cctgtgctgg gcagcatcat caagagcctg 360

agaaacgaca tcggcgccac cgtgcacgag ctgagcagag acaaagaaaa gaacaccgtg 420

ccatggttcc ccaggaccat ccaagagctg gacagattcg ccaaccagat cctgagctat 480

ggcgccgagc tggacgctga tcaccctggc tttaaggacc ccgtgtaccg ggccagaaga 540

aagcagtttg ccgatatcgc ctacaactac cggcacggcc agcctattcc tcgggtcgag 600

tacaccgagg aagagagaaa gacctggggc accgtgttca gaaccctgaa ggccctgtac 660

aagacccacg cctgctacga gcacaaccac atcttcccac tgctggaaaa gtactgcggc 720

ttccgcgagg acaatatccc tcagctcgaa gacgtgtccc agttcctgca gacctgcacc 780

ggctttagac tgaggcctgt tgccggactg ctgagcagca gagattttct cggcggcctg 840

gccttcagag tgttccactg tacccagtac atcagacacg gcagcaagcc catgtacacc 900

cctgagcctg atatctgcca cgagctgctg ggacatgtgc ccctgttcag cgatagaagc 960

ttcgcccagt tcagccaaga gatcggactg gcttctctgg gagcccctga cgagtacatt 1020

gagaagctgg ccaccatcta ctggttcacc gtggaattcg gcctgtgcaa agagggcgac 1080

agcatcaagg cttatggcgc tggactgctg tctagcttcg gcgagctgca gtactgtctg 1140

agcgacaagc ctaagctgct gcccctggaa ctggaaaaga ccgcctgcca agagtacaca 1200

gtgaccgagt tccagcctct gtactacgtg gccgagagct tcaacgacgc caaagaaaaa 1260

gtgcggacct tcgccgccac cattcctcgg ccttttagcg tcagatacga cccctacaca 1320

cagcgcgtgg aagtgctgga caacacacag cagctgaaga ttctggccga ctccatcaac 1380

agcgaagtgg gcattctgtg tcacgccctg cagaagatca agagctga 1428

<210> 197

<211> 4146

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 197

ctctgggcca gcttgcttgg ggttgccttg acactaagac aagcggcgcg ccgcttgatc 60

ttagtggcac gtcaacccca agcgctggcc cagagccaac cctaattccg gaagtcccgc 120

ccaccggaag tgacgtcaca ggaaatgacg tcacaggaaa tgacgtaatt gtccgccatc 180

ttgtaccgga agtcccgcct accggcggcg accggcggca tctgatttgg tgtcttcttt 240

taaattttgc ggcaattcag tcgataacta taacggtcct aaggtagcga tttaaatacg 300

cgctctctta aggtagcccc gggacgcgtc aattgagatc tggatccggt accgaattcg 360

cggccgcctc gacgactagc gtttagtaat gagacgcaca aactaatatc acaaactgga 420

aatgtctatc aatatatagt tgctctagtt attaatagta atcaattacg gggtcattag 480

ttcatagccc atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct 540

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 600

caatagggac tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg 660

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 720

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 780

tctacgtatt agtcatcgct attaccatgc atggtcgagg tgagccccac gttctgcttc 840

actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 900

ttttgtgcag cgatgggggc gggggggggg ggggggcgcg cgccaggcgg ggcggggcgg 960

ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg cagccaatca gagcggcgcg 1020

ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc ggccctataa aaagcgaagc 1080

gcgcggcggg cgggagtcgc tgcgcgctgc cttcgccccg tgccccgctc cgccgccgcc 1140

tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 1200

ggcccttctc cttcgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 1260

tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 1320

gggctgtccg cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt 1380

ctggcgtgtg accggcggct ctagagcctc tgctaaccat gttcatgcct tcttcttttt 1440

cctacagctc ctgggcaacg tgctggttat tgtgctgtct catcattttg gcaaagaatt 1500

ggatcgcgaa gccgccacca tggactacaa agaccatgac ggtgattata aagatcatga 1560

tatcgattac aaggatgacg atgacaaggc tgctgtggtt ctggaaaatg gcgtgctgag 1620

ccggaagctg agcgacttcg gacaagagac aagctacatc gaggacaaca gcaaccagaa 1680

tggcgccgtg tctctgatct tcagcctgaa agaagaagtg ggcgccctgg ccaaggtgct 1740

gagactgttc gaggaaaacg agatcaatct gacccacatc gagagcagac ccagcagact 1800

gaacaaggac gagtacgagt tcttcaccta cctggacaag cggagcaagc ctgtgctggg 1860

cagcatcatc aagagcctga gaaacgacat cggcgccacc gtgcacgagc tgagcagaga 1920

caaagaaaag aacaccgtgc catggttccc caggaccatc caagagctgg acagattcgc 1980

caaccagatc ctgagctatg gcgccgagct ggacgctgat caccctggct ttaaggaccc 2040

cgtgtaccgg gccagaagaa agcagtttgc cgatatcgcc tacaactacc ggcacggcca 2100

gcctattcct cgggtcgagt acaccgagga agagagaaag acctggggca ccgtgttcag 2160

aaccctgaag gccctgtaca agacccacgc ctgctacgag cacaaccaca tcttcccact 2220

gctggaaaag tactgcggct tccgcgagga caatatccct cagctcgaag acgtgtccca 2280

gttcctgcag acctgcaccg gctttagact gaggcctgtt gccggactgc tgagcagcag 2340

agattttctc ggcggcctgg ccttcagagt gttccactgt acccagtaca tcagacacgg 2400

cagcaagccc atgtacaccc ctgagcctga tatctgccac gagctgctgg gacatgtgcc 2460

cctgttcagc gatagaagct tcgcccagtt cagccaagag atcggactgg cttctctggg 2520

agcccctgac gagtacattg agaagctggc caccatctac tggttcaccg tggaattcgg 2580

cctgtgcaaa gagggcgaca gcatcaaggc ttatggcgct ggactgctgt ctagcttcgg 2640

cgagctgcag tactgtctga gcgacaagcc taagctgctg cccctggaac tggaaaagac 2700

cgcctgccaa gagtacacag tgaccgagtt ccagcctctg tactacgtgg ccgagagctt 2760

caacgacgcc aaagaaaaag tgcggacctt cgccgccacc attcctcggc cttttagcgt 2820

cagatacgac ccctacacac agcgcgtgga agtgctggac aacacacagc agctgaagat 2880

tctggccgac tccatcaaca gcgaagtggg cattctgtgt cacgccctgc agaagatcaa 2940

gagctgagca agtaatgagc gctgatcata atcaacctct ggattacaaa atttgtgaaa 3000

gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 3060

tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 3120

cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 3180

gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 3240

tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 3300

ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 3360

ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 3420

cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 3480

tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 3540

tttgggccgc ctccccgctg atcagcctcg actgtgcctt ctagttgcca gccatctgtt 3600

gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 3660

taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tctggggggt 3720

ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tgctggggat 3780

gcggtgggct ctatggcttc tgaggcggaa agaacgggct cgagaagctt ctagatatcc 3840

tctcttaagg tagcatcgag atttaaatta gggataacag ggtaatggcg cgggccgcaa 3900

aatttaaaag aagacaccaa atcagatgcc gccggtcgcc gccggtaggc gggacttccg 3960

gtacaagatg gcggacaatt acgtcatttc ctgtgacgtc atttcctgtg acgtcacttc 4020

cggtgggcgg gacttccgga attagggttg gctctgggcc agcgcttggg gttgacgtgc 4080

cactaagatc aagcggcgcg ccgcttgtct tagtgtcaag gcaaccccaa gcaagctggc 4140

ccagag 4146

<210> 198

<211> 4214

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸序列

<400> 198

cggtgacgtg tttccggctg ttaggttgac cacgcgcatg ccgcgcggtc agcccaatag 60

ttaagccgga aacacgtcac cggaagtcac atgaccggaa gtcacgtgac cggaaacacg 120

tgacaggaag cacgtgaccg gaactacgtc accggatgtg cgtcaccgga agcatgtgac 180

cggaacttgc gtcacttccc cctcccctga ttggctggtt cgaacgaacg aaccctccaa 240

tgagactcaa ggacaagagg atattttgcg cgccaggaag tggcggcaat tcagtcgata 300

actataacgg tcctaaggta gcgatttaaa tacgcgctct cttaaggtag ccccgggacg 360

cgtcaattga gatctggatc cggtaccgaa ttcgcggccg cctcgacgac tagcgtttag 420

taatgagacg cacaaactaa tatcacaaac tggaaatgtc tatcaatata tagttgctct 480

agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat ggagttccgc 540

gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc ccgcccattg 600

acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca ttgacgtcaa 660

tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta tcatatgcca 720

agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta tgcccagtac 780

atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat cgctattacc 840

atgcatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc 900

acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg 960

gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg 1020

gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag 1080

gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgcg 1140

ctgccttcgc cccgtgcccc gctccgccgc cgcctcgcgc cgcccgcccc ggctctgact 1200

gaccgcgtta ctcccacagg tgagcgggcg ggacggccct tctccttcgg gctgtaatta 1260

gcgcttggtt taatgacggc ttgtttcttt tctgtggctg cgtgaaagcc ttgaggggct 1320

ccgggagggc cctttgtgcg gggggagcgg ctcggggctg tccgcggggg gacggctgcc 1380

ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 1440

cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 1500

ttattgtgct gtctcatcat tttggcaaag aattggatcg cgaagccgcc accatggact 1560

acaaagacca tgacggtgat tataaagatc atgatatcga ttacaaggat gacgatgaca 1620

aggctgctgt ggttctggaa aatggcgtgc tgagccggaa gctgagcgac ttcggacaag 1680

agacaagcta catcgaggac aacagcaacc agaatggcgc cgtgtctctg atcttcagcc 1740

tgaaagaaga agtgggcgcc ctggccaagg tgctgagact gttcgaggaa aacgagatca 1800

atctgaccca catcgagagc agacccagca gactgaacaa ggacgagtac gagttcttca 1860

cctacctgga caagcggagc aagcctgtgc tgggcagcat catcaagagc ctgagaaacg 1920

acatcggcgc caccgtgcac gagctgagca gagacaaaga aaagaacacc gtgccatggt 1980

tccccaggac catccaagag ctggacagat tcgccaacca gatcctgagc tatggcgccg 2040

agctggacgc tgatcaccct ggctttaagg accccgtgta ccgggccaga agaaagcagt 2100

ttgccgatat cgcctacaac taccggcacg gccagcctat tcctcgggtc gagtacaccg 2160

aggaagagag aaagacctgg ggcaccgtgt tcagaaccct gaaggccctg tacaagaccc 2220

acgcctgcta cgagcacaac cacatcttcc cactgctgga aaagtactgc ggcttccgcg 2280

aggacaatat ccctcagctc gaagacgtgt cccagttcct gcagacctgc accggcttta 2340

gactgaggcc tgttgccgga ctgctgagca gcagagattt tctcggcggc ctggccttca 2400

gagtgttcca ctgtacccag tacatcagac acggcagcaa gcccatgtac acccctgagc 2460

ctgatatctg ccacgagctg ctgggacatg tgcccctgtt cagcgataga agcttcgccc 2520

agttcagcca agagatcgga ctggcttctc tgggagcccc tgacgagtac attgagaagc 2580

tggccaccat ctactggttc accgtggaat tcggcctgtg caaagagggc gacagcatca 2640

aggcttatgg cgctggactg ctgtctagct tcggcgagct gcagtactgt ctgagcgaca 2700

agcctaagct gctgcccctg gaactggaaa agaccgcctg ccaagagtac acagtgaccg 2760

agttccagcc tctgtactac gtggccgaga gcttcaacga cgccaaagaa aaagtgcgga 2820

ccttcgccgc caccattcct cggcctttta gcgtcagata cgacccctac acacagcgcg 2880

tggaagtgct ggacaacaca cagcagctga agattctggc cgactccatc aacagcgaag 2940

tgggcattct gtgtcacgcc ctgcagaaga tcaagagctg agcaagtaat gagcgctgat 3000

cataatcaac ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt 3060

gctcctttta cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc 3120

cgtatggctt tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag 3180

ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc 3240

actggttggg gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc 3300

cctattgcca cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg 3360

ctgttgggca ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg 3420

ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc 3480

ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt 3540

cttcgccttc gccctcagac gagtcggatc tccctttggg ccgcctcccc gctgatcagc 3600

ctcgactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt 3660

gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca 3720

ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga 3780

ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cttctgaggc 3840

ggaaagaacg ggctcgagaa gcttctagat atcctctctt aaggtagcat cgagatttaa 3900

attagggata acagggtaat ggcgcgggcc gccacttcct ggcgcgcaaa atatcctctt 3960

gtccttgagt ctcattggag ggttcgttcg ttcgaaccag ccaatcaggg gagggggaag 4020

tgacgcaagt tccggtcaca tgcttccggt gacgcacatc cggtgacgta gttccggtca 4080

cgtgcttcct gtcacgtgtt tccggtcacg tgacttccgg tcatgtgact tccggtgacg 4140

tgtttccggc ttaactattg ggctgaccgc gcggcatgcg cgtggtcaac ctaacagccg 4200

gaaacacgtc accg 4214

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号