法律状态公告日
法律状态信息
法律状态
2023-08-15
专利权的转移 IPC(主分类):C07H21/04 专利号:ZL2007800521967 登记生效日:20230803 变更事项:专利权人 变更前权利人:惠觅宙 变更后权利人:青岛惠诺德生物科技有限公司 变更事项:地址 变更前权利人:310016 浙江省杭州市江干区运河东路运新花苑五区五幢801 变更后权利人:266000 山东省青岛市莱西市姜山镇工业园
专利申请权、专利权的转移
2017-09-15
授权
授权
2017-08-04
专利申请权的转移 IPC(主分类):C07H21/04 登记生效日:20170717 变更前: 变更后: 申请日:20070621
专利申请权、专利权的转移
2011-08-24
实质审查的生效 IPC(主分类):C07H21/04 申请日:20070621
实质审查的生效
2011-07-13
公开
公开
相关申请
本申请要求2007年1月25日提交的序列号No.60/897,394的美国临时申请的优先权,其内容在此全部纳入作为参考。
发明领域
本发明涉及鸡β肌动蛋白基因内含子1(Intron-1)的用途,其作为哺乳动物基因表达启动子的5’或3’侧翼区上的基因表达增强子或基因表达“热点”以构建新的哺乳动物表达载体或重新构建既存的基因表达载体,用于重组蛋白的极高水平的表达和哺乳动物细胞系的产生,该哺乳动物细胞系生产极高水平的重组蛋白。
发明背景
重组蛋白可通过首先将编码该重组蛋白的表达载体引入宿主细胞,然后在该宿主细胞内表达该重组蛋白来制备。传统的宿主细胞包括未被选择用于无血清悬浮培养基中最佳强劲增长的原始CHO、NSO和293细胞。传统的表达载体可用SV40或CMV基启动子以控制重组蛋白的表达。常规表达体系中采用的宿主细胞生长相对缓慢,倍增时间约24-36小时,并且最佳生长细胞浓度为3-5x106细胞/ml。
为了增大重组蛋白的生产速度并维持高的生产率,本发明人发现可优选地使用某些具有较短倍增时间和较高细胞密度的强劲的宿主细胞。该强劲的细胞系通常是通过筛选快速和高密度生长的细胞系来选择,或者从基于快速和高密度生长的任何类型的细胞系中筛选。然而,对于高水平的基因表达来说,用于常规表达载体中的启动子在这些快速和高密度生长的细胞系中不够强壮。此外,并没有多少载体能普遍地用于大多数类型的细胞系。
因此,需要寻找极强的通用的基因表达载体,它们适合用于大部分强劲的快速生长的宿主细胞,该宿主细胞有较短的倍增时间和高密度生长。
已知植物基因5’调控区通常包含高的丰富的GC含量(CpG岛)。植物基因表达常常是在比哺乳动物表达更高的水平上构建的。或许,在5’调控区带有强DNA结构的高的丰富的GC含量作为一种通用的机制对所有基因表达起着关键作用。通过基因组DNA序列的研究和该领域中以往的实验室经验,鉴别出鸡β肌动蛋白基因内含子1(1.006kb片段,SEQ ID No:1)中极高的丰富的GC含量。这1006个碱基对序列包含平均74.8%的GC含量,具有的130个碱基对片段的最高GC含量90.8%。通过我们的实验方法,我们还发现该区域有极强的DNA二级结构,其通过无法对PCR通读的极困难的测序以及困难的连接反应而被证实。因此,假设带有强DNA结构的高度富含GC的基因组DNA,通过调控染色质浓缩和核小体形成,可能持有所有哺乳动物基因表达的高构建水平的秘密,其调控了基因转录。
本发明基于一个惊人的发现,即高度富含GC的鸡β肌动蛋白基因内含子1作为5’-和/或3’-侧翼基因表达增强子或基因表达“热点”位点的用途,以构建新的哺乳动物表达载体或修饰既存的载体,用于重组蛋白的高水平表达。令人惊讶地,鸡肌动蛋白基因内含子1修饰的哺乳动物表达载体在快速生长的CHO细胞系中产生极高的基因表达水平。
简单地说,鸡β肌动蛋白基因内含子1(1.006kb片段,SEQ ID No:1)被用作增强子元件或表达“热点”序列,并围绕给定的哺乳动物基因启动子构建,如下所示:
1)对照(肌动蛋白启动子-多位点接头-polyA(聚A));
2)pMH1(内含子1-肌动蛋白启动子-多位点接头-polyA);
3)pMH2(肌动蛋白启动子-多位点接头-polyA-内含子1);
4)pMH3(内含子1-肌动蛋白启动子-多位点接头-polyA-内含子1);
5)pMH4(pCMV启动子-内含子1-多位点接头-polyA);
6)pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1);
7)pMH6(p内含子1-CMV启动子-内含子1-多位点接头-polyA-内含子1);
8)pMH7(p内含子1-PGK启动子-多位点接头-polyA);
9)pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA);
10)pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段)。
发明概述
本发明公开了鸡β肌动蛋白内含子1或其功能等同体作为增强子元件或表达“热点”序列用于构建极强的哺乳动物表达载体的用途。本发明还公开了一套极强的基因表达载体的组成。
附图简要说明
图1:对照质粒,p肌动蛋白启动子-多位点接头-polyA,是天然的基于鸡β肌动蛋白启动子的表达载体。它是通过用全长鸡β肌动蛋白基因启动子的1.272kb XhoI/HindIII片段(SEQ ID No:2)插入SalI/HindIII开启的pBR322载体骨架而构成,该骨载体架上有EcoRI/NotI多位点接头,随后为polyA位点。
图2:内含子1修饰的质粒pMH1(内含子1-肌动蛋白启动子-多位点接头-polyA)(SEQ ID No:4),是通过将1.006kb SalI/PstI衔接子修饰的内含子1插到紧邻肌动蛋白启动子序列上游的SalI/PstI位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在正义方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
图3:内含子1修饰的质粒pMH2(肌动蛋白启动子-多位点接头-polyA-内含子1)(SEQ ID No:5),是通过将PstI/HindIII衔接子修饰的1.006kb内含子序列插到紧邻polyA信号序列下游的PstI/Hind III位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在正义方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
图4:内含子1修饰的质粒pMH3(内含子1-肌动蛋白启动子-多位点接头-polyA-内含子1)(SEQ ID No:6),是通过将包含pMH1(SEQ IDNo:5)的肌动蛋白启动子的PvuI/NotI片段与包含pMH2(SEQ ID No:4)的pBR322骨架的PvuI/NotI片段相结合而构成。
图5:内含子1修饰的质粒pMH4(pCMV启动子-内含子1-多位点接头-polyA)(SEQ ID No:7),是通过将带有SalI/PstI位点的PCR扩增的0.82kbCMV启动子序列与PstI/HindII修饰的内含子1片段结合在一起而构成。然后,将它插到SalI/HindIII开启的pBR322载体骨架的SalI/Hind III位点,该载体骨架上带有EcoRI/NotI多位点接头,随后为polyA位点。
图6:内含子1修饰的质粒pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)(SEQ ID No:8),是通过将包含pMH4(SEQ ID No:7)的肌动蛋白启动子的PvuI/NotI片段与含有pMH2(SEQ ID No:5)的pBR322骨架的PvuI/NotI片段相结合而构成。
图7:内含子1修饰的质粒pMH6(p内含子1-CMV启动子-内含子1-多位点接头-polyA-内含子1)(SEQ ID No:9),是通过将SalI修饰的1.006kb内含子1序列在正义方向上插到pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)的CMV启动子上游的SalI位点而构成。
图8:内含子1修饰的质粒pMH7(p内含子1-PGK启动子-多位点接头-polyA)(SEQ ID No:10),是通过将带有PstI/HindIII位点的0.572kb PCR扩增的PGK启动子序列插到PstI/HIndIII开启的pBR322载体骨架,该载体骨架带有EcoRI/NotI接头,随后有polyA位点。然后将带有衔接子修饰的SalI/PstI位点的内含子1序列插到紧邻PGK启动子上游的SalI/PstI位点。
图9:富含GC的DNA片段修饰的质粒pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA)(SEQ ID No:11),是通过将带有SalI/PstI位点的合成的1.337kb富含GC的片段(SEQ ID No:13)插到紧邻pBR322载体骨架的肌动蛋白启动子序列上游的SalI/PstI位点,该载体骨架带有EcoRI/NotI接头,随后有polyA位点。
图10:富含GC的DNA片段修饰的质粒pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段)(SEQ ID No:12),是通过将PstI/HindIII衔接子修饰的合成的1.337kb富含GC的片段(SEQ ID No:13)插到polyA信号序列下游的PstI/HindIII位点而构成。
发明详细说明
本发明基于对鸡β肌动蛋白基因内含子1的用途的发现,其作为增强子元素或表达“热点”序列以构建哺乳动物表达载体,用于重组蛋白的极高水平的表达。简单地说,鸡β肌动蛋白基因内含子1(1.006kb片段SEQNo:1)被用作增强子序列或热点,并围绕给定的哺乳动物基因启动子构建,如下所示:
1)对照(肌动蛋白启动子-多位点接头-polyA);
2)pMH1(内含子1-肌动蛋白启动子-多位点接头-polyA);
3)pMH2(肌动蛋白启动子-的多位点接头-polyA-内含子1);
4)pMH3(内含子1-肌动蛋白启动子-多位点接头-polyA-内含子1)
5)pMH4(pCMV启动子-内含子1-多位点接头-polyA);
6)pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1);
7)pMH6(p内含子1-CMV启动子-内含子1-多位点接头-polyA-内含子1);
8)pMH7(p内含子1-PGK启动子-多位点接头-polyA);
9)pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA);
10)pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段);
全长鸡β肌动蛋白基因5’侧翼调控元件来自Dr.N Fregien(ATCC37507)(Fregien N and Davidson N,1986)。它通过限制性酶定位测序和定性,并与公布的序列相匹配(Kost等人,1983)。1.494kb鸡肌动蛋白基因启动子片段是通过Pst I与Hind III消化,并通过SDS凝胶纯化。该1.494kbPst I/Hind III启动子片段进一步被HinfI消化以获得1.006kb内含子1,并且用磷酸化的Pst I/HinfI衔接子修饰以使内含子1(SEQ No:1)的5’端有Pst I以及在3’端有Hind III。
天然的基于鸡β肌动蛋白启动子的表达载体(图1)(SEQ ID NO:3)是通过将含有内含子1的全长鸡β肌动蛋白基因5’侧翼调控元件的1.272kbXho I/Hind III片段(SEQ ID No:2)插到SalI/HindIII开启的基于pBR322的载体骨架而构成,以形成对照(肌动蛋白启动子-多位点接头-polyA)(SEQ IDNO:3),该载体骨架带有EcoRI/NotI位点,随后有polyA位点。
对照质粒,p肌动蛋白启动子-多位点接头-polyA(图1)是天然的基于鸡β肌动蛋白启动子的表达载体。它是通过用全长鸡β肌动蛋白基因启动子的1.272kb XhoI/HindIII片段(SEQ ID No:2)插到SalI/HindIII开启的pBR322载体骨架而构成,该载体骨架上有EcoRI/NotI多位点接头,随后为polyA位点。
内含子1修饰的质粒pMH1(内含子1-肌动蛋白启动子-多位点接头-polyA)(图2)(SEQ ID No:4)是通过将1.006kb SalI/PstI衔接子修饰的内含子1插到紧邻肌动蛋白启动子序列上游的SalI/PstI位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在正义方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
内含子1修饰的质粒pMH2(肌动蛋白启动子-多位点接头-polyA-内含子1)(图3)(SEQ ID No:5)是通过将PstI/HindIII衔接子修饰的1.006kb内含子序列插到紧邻polyA信号序列下游的PstI/Hind III位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在正义方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
内含子1修饰的质粒pMH3(内含子1-肌动蛋白启动子-多位点接头-polyA-内含子1)(图4)(SEQ ID No:6)是通过将包含pMH1(SEQ IDNo:5)的肌动蛋白启动子的PvuI/NotI片段与包含pMH2(SEQ ID No:4)的pBR322骨架的PvuI/NotI片段相结合而构成。
内含子1修饰的质粒pMH4(pCMV启动子-内含子1-多位点接头-polyA)(图5)(SEQ ID No:7)是通过将带有SalI/PstI位点的PCR扩增的0.82kb CMV启动子序列与PstI/HindII修饰的内含子1片段结合在一起而构成。然后,将它插到SalI/HindIII开启的pBR322载体骨架的SalI/Hind III位点,该载体骨架上带有EcoRI/NotI多位点接头,随后为polyA位点。
内含子1修饰的质粒pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)(图6)(SEQ ID No:8)是通过将包含pMH4(SEQ ID No:7)的肌动蛋白启动子的PvuI/NotI片段与含有pMH2(SEQ ID No:5)的pBR322骨架的PvuI/NotI片段相结合而构成。
内含子1修饰的质粒pMH6(p内含子1-CMV启动子-内含子-1-多位点接头-polyA-内含子1)(图7)(SEQ ID No:9)是通过将SalI修饰的1.006kb内含子1序列在正义方向上插到pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)的CMV启动子上游的SalI位点而构成。
内含子1修饰的质粒pMH7(p内含子1-PGK启动子-多位点接头-polyA)(图8)(SEQ ID No:10),是通过将带有PstI/HindIII位点的0.572kb PCR扩增的PGK启动子序列插到PstI/HIndIII开启的pBR322载体骨架,该载体骨架带有EcoRI/NotI接头,随后有polyA位点。然后,将带有衔接子修饰的SalI/PstI位点的内含子1序列插到紧邻PGK启动子上游的SalI/PstI位点。
富含GC的DNA片段(SEQ ID No:13)修饰的质粒pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA)(图9)(SEQ ID No:11)是通过将带有SalI/PstI位点的合成的1.337kb富含GC的片段(SEQ ID No:13)插到紧邻pBR322载体骨架的肌动蛋白启动子序列上游的SalI/PstI位点,该载体骨架带有EcoRI/NotI连接,随后有polyA位点。
富含GC的DNA片段(SEQ ID No:13)修饰的质粒pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段)(图10)(SEQ ID No:12)是通过将PstI/HindIII衔接子修饰的合成的1.337kb富含GC的片段(SEQ IDNo:13)插到polyA信号序列下游的PstI/HindIII位点而构成。
cDNA编码EcoRI位点-TNFR2-Fc-Not I位点(SEQ ID No:14)被从先前的质粒载体中除去(在内部),并插到图1-10所示的上述构建的哺乳动物表达载体(SEQ ID No:3、4、5、6、7、8、9、10、11、12)的EcoRI/Not I位点。这些质粒cDNA通过PvuI线性化,并利用Gene Pulser(Bio-Rad)稳定地转染至快速增长的CHO亲代宿主系。通过共转染或通过将PGK-Neo抗性基因-pA盒插入到各个载体的SalI位点,将PGK启动子驱动的新霉素抗性基因用于稳定的细胞克隆筛选。
将该稳定的细胞克隆置于96孔板(NUNC)。重复转染。所有基因表达于37℃下在CO2孵箱96孔板中在0.1ml新添加的无血清培养基中处理3小时。
利用点渍法(dot-blot)或Elisa检测新鲜的无血清培养基中3小时的TNFR2-Fc表达。与HRP(PIERCE)结合的抗-IgGl Fc片段抗体被用于特异性结合。从上述2x96孔板的两个转染的最佳克隆的表达滴度被用于比较各个构建物的表达滴度。
简单地说,收获的条件性培养基严格地在0、2、4、8、16、32倍下稀释。利用与HRP(PIERCE)结合的抗人Ig Fc抗血清对稀释的条件性培养基进行点渍法半定量检测。此外,用于标准Elisa的96孔微板利用0.1ml稀释的条件性培养基涂覆,接着用与HRP(PIERCE)结合的抗人Ig Fc抗血清孵育,冲洗,发色,并用酶标仪测数量。将商业上购买的TNFR2-Fc(Enbrel)添加到我们的无血清培养基中,并用作定量标准。
表1:
表1的结果显示,该1.006kb鸡β肌动蛋白基因内含子1可用作哺乳动物基因表达启动子的5’或3’侧翼的通用基因表达增强子元件或基因表达“热点”序列,以构建新的哺乳动物表达载体或重建既存的基因表达载体,用于重组蛋白的高水平表达和哺乳动物细胞系的产生,该细胞系生产高水平的重组蛋白。结果还显示它不仅是增强子元件,而且是“热点”序列,因为它在表达载体的不同位点都运作良好。此外还显示,合成的富含GC的片段也能用作哺乳动物基因表达启动子的5’或3’侧翼的通用基因表达增强子元件或基因“热点”序列。所有表达滴度均达到或超过当前工业水平的高端(15-45pg/细胞/天),表明这些载体有巨大的商业价值。我们相信我们已经一次性解决了哺乳动物的基因表达,并大概发现了所有基因表达的通用方法或机制,即带有强的二级结构的、自然产生或合成的富含GC的DNA作为增强子或表达“热点”序列在高水平构建的哺乳动物基因表达中的用途。
如我们在本发明前面所讨论,植物基因5’调控区通常包含称作CpG岛的高的丰富的GC含量。植物基因表达通常是在更高水平上构建。表1的结果显示,自然产生的鸡β肌动蛋白基因的内含子1,带有极高的GC含量,并可能有强大的DNA结构,对CHO细胞基因表达起着关键作用。这表明,为真核基因表达寻找高GC含量的内含子或表达增强子或绝缘子将是构建或重建有效的基因表达载体的通用工具。其他选择是根据该通用机制来合成人工的富含GC的内含子、“热点”、增强子,用于构建和重建有效的基因表达载体。
表1的结果还显示,带有高GC含量并可能有强DNA结构的、非特异性合成的DNA片段的整合支持CHO细胞中高水平的构建基因表达,提示将来合成或修饰的基因表达增强子或“热点”序列作为通用工具,用于基因表达载体构建。我们的结论是,富含高GC的DNA序列可作为一种用于基因表达的通用方法,用于构造以重建基因表达载体。很可能,带有强DNA结构的高GC含量的DNA片段是调控染色质浓缩和核小体形成的通用机制,用于高水平的基因转录和表达。
本说明书全文中使用的术语“富含GC的片段”(除非另有规定)是指自然发生或合成的一段DNA(长度100-2000bp),其中碱基数目的不低于百分之六十八(68%)是由胞嘧啶(C)和/或鸟嘌呤(G)组成,并且更优选地,百分之八十(80%)或更多的数目是由胞嘧啶和/或鸟嘌呤组成。
实施例1:鸡β肌动蛋白基因的5’侧翼区的测序
鸡β肌动蛋白基因的5’侧翼区是来自Dr.N Fregien(ATCC 37507)(Fregien N和Davidson N,1986),并由商业服务提供商Laragen Inc.测序。完整序列如下:
CACCGGTGTTATTGCTGCTCGGTGCGTGCATGCACATCAGTGTCGCTGC
AGCTCAGTGCATGCACGCTCATTGCCCATCGCTATCCCTGCCTCTCCTGC
TGGCGCTCCCCGGGAGGTGACTTCAAGGGGACCGCAGGACCACCTCGG
GGGTGGGGGGAGGGCTGCACACGCGGACCCCGCTCCCCCTCCCCAACA
AAGCACTGTGGAATCAAAAAGGGGGGAGGGGGGATGGAGGGGCGCGT
CACACCCCCGCCCCACACCCTCACCTCGAGGTGAGCCCCACGTTCTGCT
TCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTA
TTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCG
CGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGG
AGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCT
TTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCG
CGGCGGGCGGGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCG
CCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACA
GGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTG
GTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGG
GCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGT
GCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGC
GGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGT
GCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGG
CTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTG
AGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACC
CCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCG
TGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCA
GGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTC
GGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCG
GCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGG
GACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGC
CGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGA
AGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCC
TTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGG
GGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATC
TTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTTCATCCTGAGCGCTAAT
CGGGTATTGTTCGGTTCCATTTAACCGAAGAATTCATGCTAGCTCTGTTA
GCCAATGCGGCCGCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGA
CATCATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTT
ATTTTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAG
GACATATGGGAGGGCAAATCATTTAAAACATCAGAATGAGTATTTGGTT
TAGAGTTTGGCAACATATGCCCATATGCTGGCTGCCATGAACAAAGGTT
GGCTATAAAGAGGTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTC
CTTATTCCATAGAAAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTT
GTTTTGTGTTATTTTTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTT
TACTAGCCAGATTTTTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTC
CCTCTTCTCTTATGGAGATCCCTCGACCTGGCGTAATCATGGTCATAGCT
GTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGA
GCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAA
CTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCT
GTCGTGCCAGCGGATCCGCATCTCAATTAGTCAGCAACCATAGTCCCGC
CCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCT
CCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCG
CCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGG
CCTAGGCTTTTGCAAAAAGCTAACTTGTTTATTGCAGCTTATAATGGTTA
CAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCA
CTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGT
CTGGATCCGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGT
TTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTC
GGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATA
CGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCA
AAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCG
TTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCT
CAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGT
TTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTT
ACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCA
TAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAG
CTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTAT
CCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCC
ACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGG
CGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGA
AGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAA
AAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCG
GTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATC
TCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAAC
GAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCT
TCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAG
TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAG
GCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACT
CCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCC
AGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTAT
CAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTG
CAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAG
AGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCT
ACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTC
CGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAA
AAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGG
CCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACT
GTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCA
AGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGC
GTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTC
ATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGC
TGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTC
AGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGG
CAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATA
CTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTG
TCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATA
GGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGG
实施例2:哺乳动物表达载体的构建
全长鸡β肌动蛋白基因的5’侧翼调控元件是来自Dr.N Fregien(ATCC37507)(Fregien N和Davidson N,1986)。它是通过限制性酶定位测序和定性,并且与公布的序列相匹配(Kost等人,1983)。1.494kb鸡肌动蛋白基因启动子片段通过Pst I和Hind III消化,并通过SDS凝胶纯化。该1.494kb Pst I/Hind III启动子片段进一步通过HinfI消化以获得1.006kb内含子1,并利用磷酸化Pst I/HinfI衔接子修饰,以使该内含子1(SEQ No:1)在5’端有Pst I并在3’端有Hind III。
天然的基于鸡β肌动蛋白启动子的表达载体(图1)(SEQ ID NO:3)是通过将含有内含子1的全长鸡β肌动蛋白基因5’侧翼调控元件的1.272kbXho I/Hind III片段插到SalI/HindIII开启的基于pBR322的载体骨架而构成,以形成对照(肌动蛋白启动子-多位点接头-polyA)(SEQ ID NO:3),该载体骨架带有EcoRI/NotI位点,随后有polyA位点。
对照质粒,p肌动蛋白启动子-多位点接头-polyA(图1)是天然的基于鸡β肌动蛋白启动子的表达载体。它是通过用全长鸡β肌动蛋白基因启动子的1.272kb XhoI/HindIII片段(SEQ ID No:2)插到SalI/HindIII开启的pBR322载体骨架而构成,该骨载体架上有EcoRI/NotI多位点接头,随后为polyA位点。
内含子1修饰的质粒pMH1(内含子1-肌动蛋白启动子-多位点接头-polyA)(图2)(SEQ ID No:4)是通过将1.006kb SalI/PstI衔接子修饰的内含子1插到紧邻肌动蛋白启动子序列上游的SalI/PstI位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在正义方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
内含子1修饰的质粒pMH2(肌动蛋白启动子-多位点接头-polyA-内含子1)(图3)(SEQ ID No:5)是通过将PstI/HindIII衔接子修饰的1.006kb内含子序列插到紧邻polyA信号序列下游的PstI/Hind III位点而构成。然后,将0.331kb间隔片段(无CMV启动子的CMV增强子)在感觉方向上插到内含子1和肌动蛋白启动子之间的PstI位点。
内含子1修饰的质粒pMH3(内含子1-肌动蛋白启动子-多位点接头-polyA-内含子1)(图4)(SEQ ID No:6)是通过将包含pMH1(SEQ IDNo:5)的肌动蛋白启动子的PvuI/NotI片段与包含pMH2(SEQ ID No:4)的pBR322骨架的PvuI/NotI片段相结合而构成。
内含子1修饰的质粒pMH4(pCMV启动子-内含子1-多位点接头-polyA)(图5)(SEQ ID No:7)是通过将带有SalI/PstI位点的PCR扩增的0.82kb CMV启动子序列与PstI/HindII修饰的内含子1片段结合而构成。然后,将它插到SalI/HindIII开启的pBR322载体骨架的SalI/Hind III位点,该载体骨架上带有EcoRI/NotI接头,随后为polyA位点。
内含子1修饰的质粒pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)(图6)(SEQ ID No:8)是通过将包含pMH4(SEQ ID No:7)的肌动蛋白启动子的PvuI/NotI片段与含有pMH2(SEQ ID No:5)的pBR322骨架的PvuI/NotI片段相结合而构成。
内含子1修饰的pMH6的质粒(p内含子1-CMV启动子-内含子-1-多位点接头-polyA-内含子1)(图7)(SEQ ID No:9)是通过将SalI修饰的1.006kb内含子1序列在正义方向上插到pMH5(pCMV启动子-内含子1-多位点接头-polyA-内含子1)的CMV启动子上游的SalI位点而构成。
内含子1修饰的质粒pMH7(p内含子1-PGK启动子-多位点接头-polyA)(图8)(SEQ ID No:10),是通过将带有PstI/HindIII位点的0.572kb PCR扩增的PGK启动子序列插到PstI/HIndIII开启的pBR322载体骨架,该载体骨架带有EcoRI/NotI连接,随后有polyA位点。然后,将带有衔接子修饰的SalI/PstI位点的内含子1序列插到紧邻PGK启动子上游的SalI/PstI位点。
富含GC的DNA片段修饰的质粒pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA)(图9)(SEQ ID No:11)是通过将带有SalI/PstI位点的合成的1.337kb富含GC的片段(SEQ ID No:13)插到紧邻pBR322载体骨架的肌动蛋白启动子序列上游的SalI/PstI位点,该载体骨架带有EcoRI/NotI连接,随后有polyA位点。
富含GC的DNA片段(SEQ ID No:13)修饰的质粒pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段)(图10)(SEQ ID No:12)是通过将PstI/HindIII衔接子修饰的合成的1.337kb富含GC的片段(SEQ IDNo:13)插到polyA信号序列下游的PstI/HindIII位点而构成。
实施例3:鸡β肌动蛋白基因内含子1的GC含量分析
下面列出鸡β肌动蛋白基因内含子1(SEQ ID No:1):
CTGCAGTGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCG
CGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCA
CAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCT
TGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAA
GGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGC
GTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCG
GCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGT
GTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGG
GCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGT
GAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCAC
CCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCC
GTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGC
AGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCT
CGGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGC
GGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAG
GGACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCG
CCGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGG
AAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCC
CTTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCG
GGGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATAT
CTTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTT
鸡β肌动蛋白基因内含子1的高GC含量区被分析并总结于下表2中。
表2:
在最小DNA长度100个碱基对的内含子1中识别出高达90.8%的极高的GC含量。该极高的GC含量在哺乳动物基因组中是罕见的。这在鸡基因组的进化中如何发生是未知的。通过实验的方法,我们发现该区域有极强的DNA二级结构,其通过极困难的无法PCR通读的测序以及困难的连接反应被证实。我们假设带有强DNA结构的高度富含GC的基因组DNA,通过调控染色质浓缩和核小体形成,可能持有所有哺乳动物基因表达的高构建水平的秘密,其调控了基因转录。由此,我们合成了以下的非特异性高GC含量1337个碱基对的DNA片段(SEQ ID No:13),用于证明这一概念。该富含GC的DNA片段包含类似量的GC含量(SEQ ID No:13)(表3)。因此,当整合到哺乳动物表达载体时,测试增强子或“热点”的活性是有用的。
合成的高GC含量的DNA片段如下所列(SEQ ID No:13):
GGGGGCTGCGGAGGAACAGAGAAGGGAAGATATAAACCCCGCCGGCG
CCGACGAACCCCGCCCTGCCCCGTCCCCCCCGAAGGCAGCCGTCCCCCT
GCGGCAGCCCCGAGGCTGGAGATGGAGAAGGGGACGGCGGCGCGGCG
ACGCACGAAGGCCCTCCCCGCCCATTTCCTTCCTGCCGGCGCCGCACCG
CTTCGCCCGCGCCCGCTAGAGGGGGTGCGGCGGCGCCTCCCAGATTTCG
GCTCCGCCAGATTTGGGACAAAGGAAGTCCCTGCGCCCTCTCGCACGAT
TACCATAAAAGGCAATGGCTGCGGCTCGCCGCGCCTCGACAGCCGCCG
GCGCTCCGGGGCCGCCGCGCCCCTCCCCCGAGCCCTCCCCGGCCCGAGG
CGGCCCCGCCCCGCCCGGCACCCCCACCTGCCGCCACCCCCCGCCCGGC
ACGGCGAGCCCCGCGCCACGCCCCGCACGGAGCCCCGCACCCGAAGCC
GGGCCGTGCTCAGCAACTCGGGGAGGGGGGTGCAGGGGGGGGTTACAG
CCCGACCGCCGCGCCCACACCCCCTGCTCACCCCCCCACGCACACACCC
CGCACGCAGCCTTTGTTCCCCTCGCAGCCCCCCCGCACCGCGGGGCACC
GCCCCCGGCCGCGCTCCCCTCGCGCACACGCGGAGCGCACAAAGCCCC
GCGCCGCGCCCGCAGCGCTCACAGCCGCCGGGCAGCGCGGGCCGCACG
CGGCGCTCCCCACGCACACACACACGCACGCACCCCCCGAGCCGCTCCC
CCCCGCACAAAGGGCCCTCCCGGAGCCCTTTAAGGCTTTCACGCAGCCA
CAGAAAAGAAACGAGCCGTCATTAAACCAAGCGCTAATTACAGCCCGG
AGGAGAAGGGCCGTCCCGCCCGCTCACCTGTGGGAGTAACGCGGTCAG
TCAGAGCCGGGGCGGGCGGCGCGAGGCGGCGCGGAGCGGGGCACGGG
GCGAAGGCAACGCAGCGACGTCGAGCTGCAGCGGCCGATCCCTTCCTG
GGACTGGCCATGGCCAACTCACTTCTGAACCCCATCATCTACACGCTCA
CCAACCGCGACCTGCGCCACGCGCTCCTGCGCCTGGTCTGCTGCGGACG
CCACTCCTGCGGCAGAGACCCGAGTGGCTCCCAGCAGTCGGCGAGCGC
GGCTGAGGCTTCCGGGGGCCTGCGCCGCTGCCTGCCCCCGGGCCTTGAT
GGGAGCTTCAGCGGCTCGGAGCGCTCATCGCCCCAGCGCGACGGGCTG
GACACCAGCGGCTCCACAGGCAGCCCCGGTGCACCCACAGCCGCCCGG
ACTCTGGTATCAGAACCGGCTGCACTGCA
该富含GC的DNA片段(SEQ ID No:13)的高GC含量区被分析并总结于下表3中。
表3:
通过利用该富含GC的DNA片段(SEQ ID No:13),我们构建了pMH8(p富含GC的片段-肌动蛋白启动子-多位点接头-polyA)(图9)(SEQ IDNo:11)和pMH9(p肌动蛋白启动子-多位点接头-polyA-富含GC的片段)(图10)(SEQ ID No:12)(见实施例2)。表达结果在实施例4中被显示并且清楚地表明,它的强的增强子或“热点”活性与鸡β肌动蛋白基因内含子1类似。我们的结论是,高度富含GC的DNA序列可作为高度基因表达的通用方法,用于构造以重建基因表达载体。可能地,它是支配所有真核基因表达的通用机制。
本说明书全文中使用的术语“富含GC的片段”(除非另有规定)是指自然发生或合成的一段DNA(长度100-2000bp),其中碱基数目的不低于百分之六十八(68%)是由胞嘧啶(C)和/或鸟嘌呤(G)组成,并且更优选地,百分之八十(80%)或更多的数目是由胞嘧啶和/或鸟嘌呤组成。
实施例4:表达TNFR2-Fc以比较表达载体的强度
cDNA编码EcoRI位点-TNFR2-Fc-Not I位点(SEQ ID No:14)被从先前的质粒载体中除去(在内部),并插到图1-10所示的上述构建的哺乳动物表达载体(SEQ ID No:3、4、5、6、7、8、9、10、11、12)的EcoRI/Not I位点。这些质粒cDNA通过PvuI线性化,并利用Gene Pulser(Bio-Rad)稳定地转染至快速增长的CHO亲代宿主系。通过共转染或通过将PGK-Neo抗性基因-pA盒插入到各个载体的SalI位点,将PGK启动子驱动的新霉素抗性基因用于稳定的细胞克隆筛选。
将该稳定的细胞克隆置于96孔板(NUNC)。重复转染。所有基因表达于37℃下在CO2孵箱96孔板中在0.1ml新添加的无血清培养基中处理3小时。
利用点渍法(dot-blot)或Elisa检测新鲜的无血清培养基中3小时的TNFR2-Fc表达。与HRP(PIERCE)结合的抗-IgGl Fc片段抗体被用于特异性结合。从上述2x96孔板的两个转染的最佳克隆的表达滴度被用于比较各个构建物的表达滴度。
简单地说,收获的条件性培养基严格地在0、2、4、8、16、32倍下稀释。利用与HRP(PIERCE)结合的抗人Ig Fc抗血清对稀释的条件性培养基进行点渍法半定量检测。此外,用于标准Elisa的96孔微板利用0.1ml稀释的条件性培养基涂覆,接着用与HRP(PIERCE)结合的抗人Ig Fc抗血清孵育,冲洗,发色,并用酶标仪测数量。将商业上购买的TNFR2-Fc(Enbrel)添加到我们的无血清培养基中,并用作定量标准。
表1中如下结果显示,该1.006kb鸡β肌动蛋白基因内含子1可用作哺乳动物基因表达启动子的5’或3’侧翼的通用基因表达增强子元件或基因表达“热点”序列,以构建新的哺乳动物表达载体或重建既存的基因表达载体,用于重组蛋白的高水平表达和哺乳动物细胞系的产生,该细胞系生产高水平的重组蛋白。
该结果还清楚地显示它不仅是增强子元件,而且是“热点”序列,因为它在表达载体的不同位点都运作良好。
此外还显示,合成的富含GC的片段也能用作哺乳动物基因表达启动子的5’或3’侧翼的通用基因表达增强子元件或基因“热点”序列。
所有表达滴度均达到或超过当前工业水平的高端(15-45pg/cell/day),表明这些载体有巨大的商业价值。我们相信我们已经一次性解决了哺乳动物的基因表达,并大概发现了所有基因表达的通用方法或机制,即带有强的二级结构的、自然产生或合成的富含GC的DNA作为增强子或表达“热点”序列在高水平构建的哺乳动物基因表达中的用途。
表1:
如我们在本发明前面所讨论,植物基因5’调控区通常包含称作CpG岛的高的丰富的GC含量。植物基因表达通常是在更高水平上构建。表1的结果显示,自然产生的鸡β肌动蛋白基因的内含子1带有极高的GC含量,并可能有强大的DNA结构,对CHO细胞基因表达起着关键作用。这表明,为真核基因表达寻找高GC含量的内含子或表达增强子或绝缘子将是构建或重建有效的基因表达载体的通用工具。其他选择是根据该通用机制来合成人工的富含GC的内含子、“热点”、增强子,用于构建和重建有效的基因表达载体。
表1的结果还显示,非特异性合成的富含GC的DNA片段的整合支持着CHO细胞中高水平的构建基因表达,表明富含GC的DNA序列的将来的用途,作为一种用于基因表达的通用方法,用于合成的基因表达增强子或“热点”。很可能,带有强DNA结构的高GC含量的DNA片段是调控染色质浓缩和核小体形成的通用机制,用于高水平的基因转录和表达。
实施例5:对照载体和pMH4的启动子强度分析
天然的基于鸡β肌动蛋白启动子的表达载体(图1)(SEQ ID NO:3)由于某种原因不足以用作商业目的,虽然它包含内含子(SEQ ID NO:1)。我们因此分析它的启动子序列如下:
鸡β肌动蛋白启动子序列
CTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTC
CCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGAT
GGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGC
GAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCA
GAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCG
GCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTT
GCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGG
CTCTGACTGACCGCGTTACTCCCACAG
它仅包含一个TATA盒和两个转录因子结合位点CAAT盒。很明显,它不是典型的强启动子。因此我们用典型的CMV启动子(pMH4)(图5)(SEQ ID NO:7)代替该肌动蛋白启动子。CMV启动子的序列如下所列供分析。
CMV启动子序列
ACGCGTCGACGGATCGGGAGATCTCCCGATCCCCTATGGTGCACTCTCA
GTACAATCTGCTCTGATGCCGCATAGTTAAGCCAGTATCTGCTCCCTGC
TTGTGTGTTGGAGGTCGCTGAGTAGTGCGCGAGCAAAATTTAAGCTACA
ACAAGGCAAGGCTTGACCGACAATTGCATGAAGAATCTGCTTAGGGTT
AGGCGTTTTGCGCTGCTTCGCGATGTACGGGCCAGATATACGCGTTGAC
ATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGT
TCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGC
CCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGA
CGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATG
GGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTAT
CATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCG
CCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCA
GTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGC
AGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAA
GTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCA
ACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATG
GGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTGG
CTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACTC
ACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTCTGCAGAACCAA
TGCATTGGAT
两个TATA盒和十个CAAT盒被发现。当与肌动蛋白启动子比较时,不仅CAAT盒的数目增长,而且这些CAAT盒与富含GC的内含子1区之间的距离也增大。通过避免富含GC的内含子1形成强结构,该增大的距离可能使转录因子结合更有效。
表1显示出基因表达的8倍增长。这提示,鸡β肌动蛋白启动子在进化过程中由于某种原因变异到当前的强度,虽然它包含现代已知的最强的启动子元件,即内含子1。从全长β肌动蛋白基因启动子分离出的鸡β肌动蛋白内含子1的用途是构建和重建哺乳动物表达载体以产生重组蛋白的关键。
实施例6:3’侧翼区polyA位点的用途
与对照比较时,polyA位点的3’侧翼区的增加内含子1(pMH3)(图4)显著地增强了基因表达(表1)。该内含子1位置远离肌动蛋白启动子序列,因为之间存在重组的TNFR2-Fc编码基因和polyA序列。最有可能地,该内含子1不仅是增强子元件,而且是“热点”序列。它通过它的富含GC的DNA结构增强了基因表达水平,其打开基因组DNA结构或染色质,以增强核转录因子的可接近性。
序列表
基本信息:
(i)申请人:米祖·惠。
(ii)发明名称:鸡β肌动蛋白内含子1的用途。
(iii)序列编号:14
(iv)通讯地址:
(A)安普罗泰恩公司
(B)街道:355北兰塔纳大街220号
(C)市:卡马里奥
(D)州:加利福尼亚
(E)国家:美国
(F)邮编:93010
SEQ ID No:1的信息:
(i)序列特征:(A)长度:1006bp;(B)类型:核酸;(c)拓扑:线性
(ii)分子类型:cDNA
(iii)序列说明:SEQ ID No:1:鸡β肌动蛋白内含子1(Pst I/HindIII片段)
CTGCAGTGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCG
CGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCA
CAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCT
TGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAA
GGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGC
GTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCG
GCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGT
GTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGG
GCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGT
GAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCAC
CCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCC
GTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGC
AGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCT
CGGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGC
GGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAG
GGACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCG
CCGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGG
AAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCC
CTTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCG
GGGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATAT
CTTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTT
SEQ ID No:2的信息:
(iv)序列特征:(A)长度:1272bp;(B)类型:核酸;(c)拓扑:线性
(v)分子类型:cDNA
(vi)序列说明:SEQ ID No:2:全长鸡β肌动蛋白基因5’侧翼调控元件的
XhoI/HindIII片段
CTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTC
CCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGAT
GGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGC
GAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCA
GAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCG
GCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTT
GCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGG
CTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTT
CTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTT
CTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCG
GGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGC
GCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCG
GCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGG
GGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGC
GTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCG
GTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCAC
GGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTC
GCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCG
GGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCC
GGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTT
ATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGG
CGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCG
GGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCC
TTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGC
TGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGT
TCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGC
CCCCAAGCTT
SEQ ID No:3的信息:
(vii)序列特征:(A)长度:4324bp;(B)类型:核酸;(c)拓扑:线
性
(viii)分子类型:cDNA
(ix)序列说明:SEQ ID No:3:对照(肌动蛋白启动子-多位点接头-
polyA)
GTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTC
CCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGAT
GGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGC
GAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCA
GAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCG
GCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTT
GCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGG
CTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTT
CTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTT
CTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCG
GGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGC
GCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCG
GCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGG
GGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGC
GTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCG
GTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCAC
GGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTC
GCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCG
GGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCC
GGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTT
ATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGG
CGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCG
GGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCC
TTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGC
TGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGT
TCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGC
CCCCAAGCTTCATCCTGAGCGCTAATCGGGTATTGTTCGGTTCCATTTAA
CCGAAGAATTCATGCTAGCTCTGTTAGCCAATGCGGCCGCATAGATCTT
TTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGAGCATC
TGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGG
AATTTTTTGTGTCTCTCACTCGGAAGGACATATGGGAGGGCAAATCATT
TAAAACATCAGAATGAGTATTTGGTTTAGAGTTTGGCAACATATGCCCA
TATGCTGGCTGCCATGAACAAAGGTTGGCTATAAAGAGGTCATCAGTAT
ATGAAACAGCCCCCTGCTGTCCATTCCTTATTCCATAGAAAAGCCTTGA
CTTGAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATTTTTTTCTTTAAC
ATCCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATTTTTCCTCCTCTC
CTGACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATGGAGATCCCTCG
ACCTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCG
CTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCC
TGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCAC
TGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCCGCATCTC
AATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCC
TAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTT
TTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGA
AGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTAAC
TTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAA
ATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCC
AAACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAATGAATC
GGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTT
CCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGT
ATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGA
TAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGA
ACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCC
TGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCC
GACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTG
CGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCT
CCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTC
AGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCC
CCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC
AACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAAC
AGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAG
TGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCG
CTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATC
CGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAG
CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTT
CTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTT
GGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAA
AAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTG
ACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCT
ATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGA
TACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGA
CCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGA
AGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGT
CTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAG
TTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGT
CGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGT
TACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCT
CCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTA
TGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTT
TCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGC
GGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCC
ACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGG
CGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAAC
CCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTT
TCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAAT
AAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATAT
TATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTG
AATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCG
AAAAGTGCCACCTGG
SEQ ID No:4的信息:
(x)序列特征:(A)长度:5925bp;(B)类型:核酸;(c)拓扑:线性
(xi)分子类型:cDNA
(xii)序列说明:SEQ ID No:4:pMH1(内含子1-肌动蛋白启动子-多位点
接头-polyA)
TCGACATGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCG
CGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCA
CAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCT
TGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAA
GGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGC
GTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCG
GCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGT
GTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGG
GCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGT
GAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCAC
CCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCC
GTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGC
AGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCT
CGGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGC
GGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAG
GGACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCG
CCGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGG
AAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCC
CTTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCG
GGGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATAT
CTTCCCTTCTCTGTTCCTCCGCAGCCCCCTCACTGCAGATTGATTATTGA
CTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATA
TATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGA
CCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCA
TAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTT
ACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGT
ACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATG
CCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGT
ATTAGTCATCGCTATTCTGCAGCTCAGTGCATGCACGCTCATTGCCCATC
GCTATCCCTGCCTCTCCTGCTGGCGCTCCCCGGGAGGTGACTTCAAGGG
GACCGCAGGACCACCTCGGGGGTGGGGGGAGGGCTGCACACGCGGACC
CCGCTCCCCCTCCCCAACAAAGCACTGTGGAATCAAAAAGGGGGGAGG
GGGGATGGAGGGGCGCGTCACACCCCCGCCCCACACCCTCACCTCGAG
GTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACC
CCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGG
CGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGG
GCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCG
GCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCC
CTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGTTGCCTTC
GCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGA
CTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTC
CGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGG
CTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGG
GAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGC
GTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCG
GGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCG
GTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCG
GGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGG
GCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCC
GGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGT
GCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGC
CGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCGGAG
CGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGG
TAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGGCGGA
GCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGCG
AAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGT
GCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGCTGCC
GCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGT
CGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGCCCCC
AAGCTTCATCCTGAGCGCTAATCGGGTATTGTTCGGTTCCATTTAACCG
AAGAATTCATGCTAGCTCTGTTAGCCAATGCGGCCGCATAGATCTTTTT
CCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGAGCATCTGA
CTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGGAAT
TTTTTGTGTCTCTCACTCGGAAGGACATATGGGAGGGCAAATCATTTAA
AACATCAGAATGAGTATTTGGTTTAGAGTTTGGCAACATATGCCCATAT
GCTGGCTGCCATGAACAAAGGTTGGCTATAAAGAGGTCATCAGTATATG
AAACAGCCCCCTGCTGTCCATTCCTTATTCCATAGAAAAGCCTTGACTT
GAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATTTTTTTCTTTAACAT
CCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATTTTTCCTCCTCTCCT
GACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATGGAGATCCCTCGAC
CTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCT
CACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTG
GGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTG
CCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCCGCATCTCAA
TTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTA
ACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTT
TATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAG
TAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTAACTT
GTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAAT
TTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAA
ACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAATGAATCGG
CCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCC
TCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTAT
CAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATA
ACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAAC
CGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTG
ACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGA
CAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCG
CTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCC
CTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAG
TTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCC
GTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCA
ACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACA
GGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGT
GGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGC
TCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCC
GGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGC
AGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTC
TACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTG
GTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAA
AATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGA
CAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTA
TTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGAT
ACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGA
CCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGA
AGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGT
CTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAG
TTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGT
CGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGT
TACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCT
CCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTA
TGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTT
TCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGC
GGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCC
ACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGG
CGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAAC
CCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTT
TCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAAT
AAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATAT
TATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTG
AATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCG
AAAAGTGCCACCTGG
SEQ ID No:5的信息:
(xiii)序列特征:(A)长度:5677bp;(B)类型:核酸;(c)拓扑:线
性
(xiv)分子类型:cDNA
(xv)序列说明:SEQ ID No:5:pMH2(肌动蛋白启动子-多位点接头-polyA
-内含子1)
TCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCA
TTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAA
ATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAAT
AATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGT
CAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAG
TGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATG
GCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTT
GGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAG
CCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAA
TTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGG
GGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCG
GGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCG
CGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTA
TAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGCGCTGCCTTCG
CCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGA
CTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTC
CGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGG
CTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGG
AGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCG
TGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCG
GGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGC
GGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTG
CGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTC
GGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCC
CGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCG
TGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGG
CCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGG
AGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTAT
GGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGC
GGAGCCGAAATCTGGGAGGCGCCGCGCACCCCCTCTAGCGGGCGCGGG
GCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCT
TCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCT
GTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGT
TCGGCTTCTGGCGTGTGACCGGCGGTAGGTTTATATCTTCCCTTCTCTGT
TCCTCCGCAGGAATTCATGCTAGCTCTGTTAGCCAATGCGGCCGCATAG
ATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGA
GCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGT
GTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACATATGGGAGGGCAAA
TCATTTAAAACATCAGAATGAGTATTTGGTTTAGAGTTTGGCAACATAT
GCCCATATGCTGGCTGCCATGAACAAAGGTTGGCTATAAAGAGGTCATC
AGTATATGAAACAGCCCCCTGCTGTCCATTCCTTATTCCATAGAAAAGC
CTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATTTTTTTCT
TTAACATCCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATTTTTCCT
CCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATGGAGAT
CCCTCGACCTCTGCAGTGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGC
CCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCG
TTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTA
ATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAA
AGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTC
GGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCC
GCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGT
GCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGC
GGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTG
CGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACC
CCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGG
TGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGG
GGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGC
CGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGG
CTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGC
GAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAAT
CTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTG
CGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCC
GCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGG
ACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCG
GCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTTGG
GCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCAC
AATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGG
TGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCC
GCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCCGCATCTCAATTA
GTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACT
CCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTAT
TTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAG
TGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTAACTTGTT
TATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTC
ACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACT
CATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAATGAATCGGCC
AACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTC
GCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCA
GCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAAC
GCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCG
TAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGAC
GAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACA
GGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCT
CTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCT
TCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTT
CGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGT
TCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAAC
CCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGG
ATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGT
GGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCT
GCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGC
AAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGA
TTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTAC
GGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTC
ATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAAT
GAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAG
TTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTC
GTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACG
GGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCA
CGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGG
GCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTA
TTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTT
GCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCG
TTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTA
CATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCC
GATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATG
GCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTC
TGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGG
CGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCAC
ATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCG
AAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCC
ACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTC
TGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAA
GGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTAT
TGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAAT
GTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAA
AGTGCCACCTGG
SEQ ID No:6的信息:
(xvi)序列特征:(A)长度:6557bp;(B)类型:核酸;(c)拓扑:线
性
(xvii)分子类型:cDNA
(xviii)序列说明:SEQ ID No:6:pMH3(内含子1-肌动蛋白启动子-多位点
接头-polyA-内含子1)
TCGACTGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGC
GCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCAC
AGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTT
GGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAG
GGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCG
TGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGG
CGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTG
TGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGG
CTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTG
AGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACC
CCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCG
TGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCA
GGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTC
GGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCG
GCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGG
GACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGC
CGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGA
AGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCC
TTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGG
GGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATC
TTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTTCTGCAGGTCAGTGCAT
GCACGCTCATTGCCCATCGCTATCCCTGCCTCTCCTGCTGGCGCTCCCCG
GGAGGTGACTTCAAGGGGACCGCAGGACCACCTCGGGGGTGGGGGGAG
GGCTGCACACGCGGACCCCGCTCCCCCTCCCCAACAAAGCACTGTGGAA
TCAAAAAGGGGGGAGGGGGGATGGAGGGGCGCGTCACACCCCCGCCCC
ACACCCTCACCTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCT
CCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTT
GTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGC
GGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGG
CAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCG
GCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGT
CGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGC
CCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGG
ACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTC
GTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCC
CTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCG
TGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTG
CGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGC
GCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACA
AAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGG
GCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTG
CTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCG
CGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGG
GCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGC
GGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCC
ATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTC
CCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCT
AGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGC
GGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCC
AGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGG
CAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTG
TTCCTCCGCAGCCCCCAAGCTTCATCCTGAGCGCTAATCGGGTATTGTTC
GGTTCCATTTAACCGAAGAATTCATGCTAGCTCTGTTAGCCAATGCGGC
CGCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGC
CCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCA
ATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACATATGGGA
GGGCAAATCATTTAAAACATCAGAATGAGTATTTGGTTTAGAGTTTGGC
AACATATGCCCATATGCTGGCTGCCATGAACAAAGGTTGGCTATAAAGA
GGTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTCCTTATTCCATAG
AAAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATT
TTTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATT
TTTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATG
GAGATCCCTCGACCTCTGCAGTGACTCGAGTCGCTGCGTTGCCTTCGCC
CCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTG
ACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGG
GCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTG
CGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAG
CGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTG
CGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGG
CTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTG
CCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGG
TGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCT
GTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGC
TTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCC
GGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGC
CTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCGGAGCGC
CGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAA
TCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGGCGGAGCC
GAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGCGAAG
CGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCG
TCGCCGCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGCTGCCGCA
GGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGTCGG
CGCCGGCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGCCCCCAAG
CTTGGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCG
CTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCC
TGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCAC
TGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCCGCATCTC
AATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCC
TAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTT
TTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGA
AGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTAAC
TTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAA
ATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCC
AAACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAATGAATC
GGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTT
CCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGT
ATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGA
TAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGA
ACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCC
TGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCC
GACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTG
CGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCT
CCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTC
AGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCC
CCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC
AACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAAC
AGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAG
TGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCG
CTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATC
CGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAG
CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTT
CTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTT
GGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAA
AAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTG
ACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCT
ATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGA
TACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGA
CCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGA
AGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGT
CTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAG
TTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGT
CGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGT
TACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCT
CCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTA
TGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTT
TCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGC
GGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCC
ACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGG
CGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAAC
CCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTT
TCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAAT
AAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATAT
TATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTG
AATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCG
AAAAGTGCCACCTGG
SEQ ID No:7的信息:
(xix)序列特征:(A)长度:4688bp;(B)类型:核酸;(c)拓扑:线
性
(xx)分子类型:cDNA
(xxi)序列说明:SEQ ID No:6:pMH4(pCMV启动子-内含子1-多位点接
头-polyA)
GTCGACGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATT
AGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAAT
GGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAA
TGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCA
ATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTG
TATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGC
CCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGG
CAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTG
GCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCA
AGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATC
AACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAT
GGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTG
GCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACT
CACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTCTGCAGTGACTC
GAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCG
CCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGG
CGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGAC
GGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGA
GGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTG
TGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGA
GCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAG
GGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGG
GGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGG
GTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCC
GAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGC
GTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGG
TGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGG
GGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCG
CAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCT
TTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCC
CTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATG
GGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATC
TCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACG
GGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCT
CTGTTCCTCCGCAGCCCCCAAGCTTGAATTCATGCTAGCTCTGTTAGCCA
ATGCGGCCGCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATC
ATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTT
TCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACA
TATGGGAGGGCAAATCATTTAAAACATCAGAATGAGTATTTGGTTTAGA
GTTTGGCAACATATGCCCATATGCTGGCTGCCATGAACAAAGGTTGGCT
ATAAAGAGGTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTCCTTA
TTCCATAGAAAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTT
TGTGTTATTTTTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTTTACT
AGCCAGATTTTTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTC
TTCTCTTATGGAGATCCCTCGACCTGGCGTAATCATGGTCATAGCTGTTT
CCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCG
GAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCA
CATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTC
GTGCCAGCGGATCCGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCC
TAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCG
CCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTC
GGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTA
GGCTTTTGCAAAAAGCTAACTTGTTTATTGCAGCTTATAATGGTTACAA
ATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTG
CATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTG
GATCCGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTG
CGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGT
CGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACG
GTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA
AGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTT
TTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCA
AGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTT
CCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTAC
CGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATA
GCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCT
GGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCC
GGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCAC
TGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCG
GTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAG
AACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAA
AGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTG
GTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCA
AGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAA
AACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCA
CCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTAT
ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCA
CCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCC
CGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGT
GCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAG
CAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAA
CTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTA
AGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAG
GCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGT
TCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAG
CGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGC
AGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCA
TGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTC
ATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCA
ATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCA
TTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTT
GAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCA
TCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAA
ATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCA
TACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTC
ATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGG
GTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGG
SEQ ID No:8的信息:
(xxii)序列特征:(A)长度:5695bp;(B)类型:核酸;(c)拓扑:
线性
(xxiii)分子类型:cDNA
(xxiv)序列说明:SEQ ID No:8:pMH5(pCMV启动子-内含子1-多位点接
头-polyA-内含子1)
GTCGACGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATT
AGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAAT
GGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAA
TGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCA
ATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTG
TATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGC
CCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGG
CAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTG
GCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCA
AGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATC
AACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAT
GGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCTG
GCTAACTAGAGAACCCACTGCTTACTGGCTTATCGAAATTAATACGACT
CACTATAGGGAGACCCAAGCTGGCTAGCGTTTAAACTCTGCAGTGACTC
GAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCG
CCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGG
CGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGAC
GGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGA
GGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTG
TGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGA
GCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAG
GGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGG
GGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGG
GTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCC
GAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGC
GTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGG
TGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGG
GGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCG
CAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCT
TTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCC
CTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATG
GGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATC
TCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACG
GGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCT
CTGTTCCTCCGCAGCCCCCAAGCTTGAATTCATGCTAGCTCTGTTAGCCA
ATGCGGCCGCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATC
ATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTT
TCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACA
TATGGGAGGGCAAATCATTTAAAACATCAGAATGAGTATTTGGTTTAGA
GTTTGGCAACATATGCCCATATGCTGGCTGCCATGAACAAAGGTTGGCT
ATAAAGAGGTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTCCTTA
TTCCATAGAAAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTT
TGTGTTATTTTTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTTTACT
AGCCAGATTTTTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTC
TTCTCTTATGGAGATCCCTCGACCTCTGCAGTGACTCGAGTCGCTGCGTT
GCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCCCGCCCCGG
CTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTT
CTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCGTTTCTTTT
CTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCCTTTGTGCG
GGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGC
GCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCG
GCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCGCGGCCGG
GGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAAAGGCTGC
GTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGGCG
GTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCAC
GGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGCGGGGCTC
GCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCG
GGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCC
GGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTT
ATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGG
CGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCG
GGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCC
TTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCCAGCCTCGGGGC
TGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGT
TCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTGTTCCTCCGCAGC
CCCCAAGCTTGGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATT
GTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTG
TAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTG
CGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCC
GCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATC
CCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACT
AATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTAT
TCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAA
GCTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCA
TCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGT
TTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAA
TGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTT
CCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCG
AGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCA
GGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGC
CAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGC
CCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGA
AACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCC
TCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCC
TTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTA
TCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAA
CCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGA
GTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGT
AACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTG
AAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCT
GCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTG
ATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAG
CAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATC
TTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGA
TTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAAT
TAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGT
CTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTG
TCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTA
CGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCG
AGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCC
GGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCC
AGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAA
TAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGC
TCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGC
GAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGG
TCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATG
GTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGAT
GCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTG
TATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACC
GCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTT
CGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGAT
GTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCA
GCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGG
GAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCA
ATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATA
TTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTC
CCCGAAAAGTGCCACCTGG
SEQ ID No:9的信息:
(xxv)序列特征:(A)长度:6683bp;(B)类型:核酸;(c)拓扑:线
性
(xxvi)分子类型:cDNA
(xxvii)序列说明:SEQ ID No:9:pMH6(p内含子1-CMV启动子-内含子
1-多位点接头-polyA-内含子1)
GGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGC
CGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGC
GGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACG
GCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAG
GGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGT
GTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAG
CGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGG
GGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGG
GAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGG
TGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCG
AGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGT
GGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTG
CCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGG
GCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGC
AGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTT
TGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCC
CTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATG
GGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATC
TCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACG
GGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCT
CTGTTCCTCCGCAGCCCCCAGTCGACGATTATTGACTAGTTATTAATAGT
AATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGT
TACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCC
CGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAG
GGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCA
CTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGAC
GTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCT
TATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATT
ACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGT
TTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAG
TTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAAC
TCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCT
ATATAAGCAGAGCTCTCTGGCTAACTAGAGAACCCACTGCTTACTGGCT
TATCGAAATTAATACGACTCACTATAGGGAGACCCAAGCTGGCTAGCGT
TTAAACTCTGCAGTGACTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCC
GCTCCGCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTA
CTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATT
AGCGCTTGGTTTAATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGC
CTTAAAGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGG
GGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCG
CTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGC
TCCGCGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTG
CGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTG
GGGGGGTGAGCAGGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCC
CCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCG
GGGCTCCGTGCGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGG
TGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGG
GAGGGCTCGGGGGAGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTC
GAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAG
GGCGCAGGGACTTCCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGA
GGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGC
CGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCG
CCGTCCCCTTCTCCATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCT
GCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGG
TTTATATCTTCCCTTCTCTGTTCCTCCGCAGCCCCCAAGCTTGAATTCAT
GCTAGCTCTGTTAGCCAATGCGGCCGCATAGATCTTTTTCCCTCTGCCAA
AAATTATGGGGACATCATGAAGCCCCTTGAGCATCTGACTTCTGGCTAA
TAAAGGAAATTTATTTTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCT
CTCACTCGGAAGGACATATGGGAGGGCAAATCATTTAAAACATCAGAA
TGAGTATTTGGTTTAGAGTTTGGCAACATATGCCCATATGCTGGCTGCC
ATGAACAAAGGTTGGCTATAAAGAGGTCATCAGTATATGAAACAGCCC
CCTGCTGTCCATTCCTTATTCCATAGAAAAGCCTTGACTTGAGGTTAGAT
TTTTTTTATATTTTGTTTTGTGTTATTTTTTTCTTTAACATCCCTAAAATTT
TCCTTACATGTTTTACTAGCCAGATTTTTCCTCCTCTCCTGACTACTCCCA
GTCATAGCTGTCCCTCTTCTCTTATGGAGATCCCTCGACCTCTGCAGTGA
CTCGAGTCGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTC
GCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGC
GGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAAT
GACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCG
GGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGT
GTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGT
GAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCG
AGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGA
GGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGG
GGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCC
CCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGG
GCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGG
GGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGA
GGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGC
CGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTC
CTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACC
CCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAA
TGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCA
TCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGA
CGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTT
CTCTGTTCCTCCGCAGCCCCCAAGCTTGGGCGTAATCATGGTCATAGCT
GTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGA
GCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAA
CTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCT
GTCGTGCCAGCGGATCCGCATCTCAATTAGTCAGCAACCATAGTCCCGC
CCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCT
CCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCG
CCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGG
CCTAGGCTTTTGCAAAAAGCTAACTTGTTTATTGCAGCTTATAATGGTTA
CAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCA
CTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGT
CTGGATCCGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGT
TTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTC
GGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATA
CGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCA
AAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCG
TTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCT
CAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGT
TTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTT
ACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCA
TAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAG
CTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTAT
CCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCC
ACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGG
CGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGA
AGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAA
AAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCG
GTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATC
TCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAAC
GAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCT
TCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAG
TATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAG
GCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACT
CCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCC
AGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTAT
CAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTG
CAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAG
AGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCT
ACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTC
CGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAA
AAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGG
CCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACT
GTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCA
AGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGC
GTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTC
ATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGC
TGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTC
AGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGG
CAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATA
CTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTG
TCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATA
GGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGG
SEQ ID No:10的信息:
(xxviii)序列特征:(A)长度:4554bp;(B)类型:核酸;(c)拓扑:
线性
(xxix)分子类型:cDNA
序列说明:SEQ ID No:10:pMH7(p内含子1-PGK启动子-多位点接头-
polyA)
GTCGACGTGACGCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGC
CTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTG
AGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTT
AATGACGGCTCGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCT
CCGGGAGGGCCCTTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCG
TGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGC
TGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCG
CGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGC
GAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCA
GGGGGTGTGGGCGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCT
CCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGG
GGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGG
GGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGG
AGGGGCGCGGCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAG
CCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTT
CCTTTGTCCCAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCAC
CCCCTCTAGCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAA
ATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCC
ATCTCCAGCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGG
ACGGGGCAGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCT
TCTCTGTTCCTCCGCAGCCTGCAGGGATATCGAATTTCGAGGGCCCGTC
AATTCTACCGGGTAGGGGAGGCGCTTTTCCCAAGGCAGTCTGGAGCATG
CGCTTTAGCAGCCCCGCTGGCACTTGGCGCTACACAAGTGGCCTCTGGC
CTCGCACACATTCCACATCCACCGGTAGCGCCAACCGGCTCCGTTCTTT
GGTGGCCCCTTCGCGCCACCTTCTACTCCTCCCCTAGTCAGGAAGTTCCC
CCCCGCCCCGCAGCTCGCGTCGTGCAGGACGTGACAAATGGAAGTAGC
ACGTCTCACTAGTCTCGTGCAGATGGACAGCACCGCTGAGCAATGGAA
GCGGGTAGGCCTTTGGGGCAGCGGCCAATAGCAGCTTTGCTCCTTCGCT
TTCTGGGCTCAGAGGCTGGGAAGGGGTGGGTCCGGGGCGGGCTCAGGG
GCGGGCTCAGGGGCGGGGCGGGCGCGAAGGTCCTCCCGAGGCCCGGCA
TTCTCGCACGCTTCAAAAGCGCACGTCTGCCGCGCTGTTCTCCTCTTCCT
CTCCGGCCTTTCAAGCTTACCAGCTTGAATTCATGCTAGCTCTGTTAGCC
AATGCGGCCGCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGACAT
CATGAAGCCCCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATT
TTCATTGCAATAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGGAC
ATATGGGAGGGCAAATCATTTAAAACATCAGAATGAGTATTTGGTTTAG
AGTTTGGCAACATATGCCCATATGCTGGCTGCCATGAACAAAGGTTGGC
TATAAAGAGGTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTCCTT
ATTCCATAGAAAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTTGTT
TTGTGTTATTTTTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTTTAC
TAGCCAGATTTTTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTCCCT
CTTCTCTTATGGAGATCCCTCGACCTGGCGTAATCATGGTCATAGCTGTT
TCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCC
GGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTC
ACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGT
CGTGCCAGCGGATCCGCATCTCAATTAGTCAGCAACCATAGTCCCGCCC
CTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCC
GCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCT
CGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCT
AGGCTTTTGCAAAAAGCTAACTTGTTTATTGCAGCTTATAATGGTTACA
AATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACT
GCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCT
GGATCCGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTT
GCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGG
TCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACG
GTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAA
AGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTT
TTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCA
AGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTT
CCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTAC
CGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATA
GCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCT
GGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCC
GGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCAC
TGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCG
GTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAG
AACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAA
AGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTG
GTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCA
AGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAA
AACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCA
CCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTAT
ATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCA
CCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCC
CGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGT
GCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAG
CAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAA
CTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTA
AGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAG
GCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGT
TCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAG
CGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGC
AGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCA
TGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTC
ATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCA
ATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCA
TTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTT
GAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCA
TCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAA
ATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCA
TACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTC
ATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGG
GTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGGCCGGTATCGATG
SEQ ID No:11的信息:
(xxx)序列特征:(A)长度:5882bp;(B)类型:核酸;(c)拓扑:线
性
(xxxi)分子类型:cDNA
序列说明:SEQ ID No:11:pMH8(p富含GC的DNA片段-肌动蛋白启动
子-多位点接头-polyA)
GTCGACTGGGGGCTGCGGAGGAACAGAGAAGGGAAGATATAAACCCCG
CCGGCGCCGACGAACCCCGCCCTGCCCCGTCCCCCCCGAAGGCAGCCGT
CCCCCTGCGGCAGCCCCGAGGCTGGAGATGGAGAAGGGGACGGCGGCG
CGGCGACGCACGAAGGCCCTCCCCGCCCATTTCCTTCCTGCCGGCGCCG
CACCGCTTCGCCCGCGCCCGCTAGAGGGGGTGCGGCGGCGCCTCCCAG
ATTTCGGCTCCGCCAGATTTGGGACAAAGGAAGTCCCTGCGCCCTCTCG
CACGATTACCATAAAAGGCAATGGCTGCGGCTCGCCGCGCCTCGACAG
CCGCCGGCGCTCCGGGGCCGCCGCGCCCCTCCCCCGAGCCCTCCCCGGC
CCGAGGCGGCCCCGCCCCGCCCGGCACCCCCACCTGCCGCCACCCCCCG
CCCGGCACGGCGAGCCCCGCGCCACGCCCCGCACGGAGCCCCGCACCC
GAAGCCGGGCCGTGCTCAGCAACTCGGGGAGGGGGGTGCAGGGGGGG
GTTACAGCCCGACCGCCGCGCCCACACCCCCTGCTCACCCCCCCACGCA
CACACCCCGCACGCAGCCTTTGTTCCCCTCGCAGCCCCCCCGCACCGCG
GGGCACCGCCCCCGGCCGCGCTCCCCTCGCGCACACGCGGAGCGCACA
AAGCCCCGCGCCGCGCCCGCAGCGCTCACAGCCGCCGGGCAGCGCGGG
CCGCACGCGGCGCTCCCCACGCACACACACACGCACGCACCCCCCGAG
CCGCTCCCCCCCGCACAAAGGGCCCTCCCGGAGCCCTTTAAGGCTTTCA
CGCAGCCACAGAAAAGAAACGAGCCGTCATTAAACCAAGCGCTAATTA
CAGCCCGGAGGAGAAGGGCCGTCCCGCCCGCTCACCTGTGGGAGTAAC
GCGGTCAGTCAGAGCCGGGGCGGGCGGCGCGAGGCGGCGCGGAGCGG
GGCACGGGGCGAAGGCAACGCAGCGACGTCGAGCTGCAGCGGCCGATC
CCTTCCTGGGACTGGCCATGGCCAACTCACTTCTGAACCCCATCATCTA
CACGCTCACCAACCGCGACCTGCGCCACGCGCTCCTGCGCCTGGTCTGC
TGCGGACGCCACTCCTGCGGCAGAGACCCGAGTGGCTCCCAGCAGTCG
GCGAGCGCGGCTGAGGCTTCCGGGGGCCTGCGCCGCTGCCTGCCCCCGG
GCCTTGATGGGAGCTTCAGCGGCTCGGAGCGCTCATCGCCCCAGCGCGA
CGGGCTGGACACCAGCGGCTCCACAGGCAGCCCCGGTGCACCCACAGC
CGCCCGGACTCTGGTATCAGAACCGGCTGCACTGCAGCTCAGTGCATGC
ACGCTCATTGCCCATCGCTATCCCTGCCTCTCCTGCTGGCGCTCCCCGGG
AGGTGACTTCAAGGGGACCGCAGGACCACCTCGGGGGTGGGGGGAGGG
CTGCACACGCGGACCCCGCTCCCCCTCCCCAACAAAGCACTGTGGAATC
AAAAAGGGGGGAGGGGGGATGGAGGGGCGCGTCACACCCCCGCCCCA
CACCCTCACCTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTC
CCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTG
TGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCG
GGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGC
AGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGG
CGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGAGTC
GCTGCGTTGCCTTCGCCCCGTGCCCCGCTCCGCGCCGCCTCGCGCCGCC
CGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGA
CGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTCG
TTTCTTTTCTGTGGCTGCGTGAAAGCCTTAAAGGGCTCCGGGAGGGCCC
TTTGTGCGGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGT
GGGGAGCGCCGCGTGCGGCCCGCGCTGCCCGGCGGCTGTGAGCGCTGC
GGGCGCGGCGCGGGGCTTTGTGCGCTCCGCGTGTGCGCGAGGGGAGCG
CGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGCTGCGAGGGGAACAA
AGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGG
CGCGGCGGTCGGGCTGTAACCCCCCCCTGCACCCCCCTCCCCGAGTTGC
TGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTGCGGGGCGTGGCGC
GGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGG
CGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCG
GCGGCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCA
TTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCC
CAAATCTGGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTA
GCGGGCGCGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCG
GGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCATCTCCA
GCCTCGGGGCTGCCGCAGGGGGACGGCTGCCTTCGGGGGGGACGGGGC
AGGGCGGGGTTCGTCGGCGCCGGCGGGGTTTATATCTTCCCTTCTCTGTT
CCTCCGCAGCCCCCAAGCTTCATCCTGAGCGCTAATCGGGTATTGTTCG
GTTCCATTTAACCGAAGAATTCATGCTAGCTCTGTTAGCCAATGCGGCC
GCATAGATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCC
CCTTGAGCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAA
TAGTGTGTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACATATGGGAG
GGCAAATCATTTAAAACATCAGAATGAGTATTTGGTTTAGAGTTTGGCA
ACATATGCCCATATGCTGGCTGCCATGAACAAAGGTTGGCTATAAAGAG
GTCATCAGTATATGAAACAGCCCCCTGCTGTCCATTCCTTATTCCATAGA
AAAGCCTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATTT
TTTTCTTTAACATCCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATTT
TTCCTCCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATGG
AGATCCCTCGACCTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAA
ATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAA
GTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCG
TTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGA
TCCGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCC
ATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTG
ACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGC
TATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAA
AAAGCTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATA
GCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGT
GGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCAT
TAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGC
TCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCG
GCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGA
ATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAA
AGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCT
CCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTG
GCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAG
CTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGT
CCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGT
AGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGC
ACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCG
TCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCC
ACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAG
TTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTG
GTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAG
CTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTT
GCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTT
TGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTA
AGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTT
TTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAA
CTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGC
GATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGA
TAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGAT
ACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAG
CCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCC
AGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTG
TCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATC
AAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCC
TTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCAC
TCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTA
AGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAAT
AGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAA
TACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGT
TCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTT
CGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTC
ACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAA
AAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTT
TTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATAC
ATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACAT
TTCCCCGAAAAGTGCCACCTGG
SEQ ID No:12的信息:
(xxxii)序列特征:(A)长度:6022bp;(B)类型:核酸;(c)拓扑:
线性
(xxxiii)分子类型:cDNA
序列说明:SEQ ID No:12:pMH9(p肌动蛋白启动子-多位点接头-polyA-富
含GC的DNA片段)
TCGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCA
TTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAA
ATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAAT
AATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGT
CAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAG
TGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATG
GCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTT
GGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAG
CCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAA
TTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGG
GGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCG
GGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCG
CGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTA
TAAAAAGCGAAGCGCGCGGCGGGCGGGAGTCGCTGCGCGCTGCCTTCG
CCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGA
CTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTC
CGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGG
CTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGG
AGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCG
TGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCG
GGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGC
GGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTG
CGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTC
GGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCC
CGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCG
TGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGG
CCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGG
AGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTAT
GGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGC
GGAGCCGAAATCTGGGAGGCGCCGCGCACCCCCTCTAGCGGGCGCGGG
GCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCT
TCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCT
GTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGT
TCGGCTTCTGGCGTGTGACCGGCGGTAGGTTTATATCTTCCCTTCTCTGT
TCCTCCGCAGGAATTCATGCTAGCTCTGTTAGCCAATGCGGCCGCATAG
ATCTTTTTCCCTCTGCCAAAAATTATGGGGACATCATGAAGCCCCTTGA
GCATCTGACTTCTGGCTAATAAAGGAAATTTATTTTCATTGCAATAGTGT
GTTGGAATTTTTTGTGTCTCTCACTCGGAAGGACATATGGGAGGGCAAA
TCATTTAAAACATCAGAATGAGTATTTGGTTTAGAGTTTGGCAACATAT
GCCCATATGCTGGCTGCCATGAACAAAGGTTGGCTATAAAGAGGTCATC
AGTATATGAAACAGCCCCCTGCTGTCCATTCCTTATTCCATAGAAAAGC
CTTGACTTGAGGTTAGATTTTTTTTATATTTTGTTTTGTGTTATTTTTTTCT
TTAACATCCCTAAAATTTTCCTTACATGTTTTACTAGCCAGATTTTTCCT
CCTCTCCTGACTACTCCCAGTCATAGCTGTCCCTCTTCTCTTATGGAGAT
CCCTCGACCTCTCTGCAGTGGGGGCTGCGGAGGAACAGAGAAGGGAAG
ATATAAACCCCGCCGGCGCCGACGAACCCCGCCCTGCCCCGTCCCCCCC
GAAGGCAGCCGTCCCCCTGCGGCAGCCCCGAGGCTGGAGATGGAGAAG
GGGACGGCGGCGCGGCGACGCACGAAGGCCCTCCCCGCCCATTTCCTTC
CTGCCGGCGCCGCACCGCTTCGCCCGCGCCCGCTAGAGGGGGTGCGGC
GGCGCCTCCCAGATTTCGGCTCCGCCAGATTTGGGACAAAGGAAGTCCC
TGCGCCCTCTCGCACGATTACCATAAAAGGCAATGGCTGCGGCTCGCCG
CGCCTCGACAGCCGCCGGCGCTCCGGGGCCGCCGCGCCCCTCCCCCGAG
CCCTCCCCGGCCCGAGGCGGCCCCGCCCCGCCCGGCACCCCCACCTGCC
GCCACCCCCCGCCCGGCACGGCGAGCCCCGCGCCACGCCCCGCACGGA
GCCCCGCACCCGAAGCCGGGCCGTGCTCAGCAACTCGGGGAGGGGGGT
GCAGGGGGGGGTTACAGCCCGACCGCCGCGCCCACACCCCCTGCTCAC
CCCCCCACGCACACACCCCGCACGCAGCCTTTGTTCCCCTCGCAGCCCC
CCCGCACCGCGGGGCACCGCCCCCGGCCGCGCTCCCCTCGCGCACACGC
GGAGCGCACAAAGCCCCGCGCCGCGCCCGCAGCGCTCACAGCCGCCGG
GCAGCGCGGGCCGCACGCGGCGCTCCCCACGCACACACACACGCACGC
ACCCCCCGAGCCGCTCCCCCCCGCACAAAGGGCCCTCCCGGAGCCCTTT
AAGGCTTTCACGCAGCCACAGAAAAGAAACGAGCCGTCATTAAACCAA
GCGCTAATTACAGCCCGGAGGAGAAGGGCCGTCCCGCCCGCTCACCTGT
GGGAGTAACGCGGTCAGTCAGAGCCGGGGCGGGCGGCGCGAGGCGGC
GCGGAGCGGGGCACGGGGCGAAGGCAACGCAGCGACGTCGAGCTGCA
GCGGCCGATCCCTTCCTGGGACTGGCCATGGCCAACTCACTTCTGAACC
CCATCATCTACACGCTCACCAACCGCGACCTGCGCCACGCGCTCCTGCG
CCTGGTCTGCTGCGGACGCCACTCCTGCGGCAGAGACCCGAGTGGCTCC
CAGCAGTCGGCGAGCGCGGCTGAGGCTTCCGGGGGCCTGCGCCGCTGC
CTGCCCCCGGGCCTTGATGGGAGCTTCAGCGGCTCGGAGCGCTCATCGC
CCCAGCGCGACGGGCTGGACACCAGCGGCTCCACAGGCAGCCCCGGTG
CACCCACAGCCGCCCGGACTCTGGTATCAGAACCGGCTGCACTGCACAA
GCTTGGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCC
GCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGC
CTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCA
CTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCGGATCCGCATCT
CAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCC
CTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTT
TTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAG
AAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTAA
CTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACA
AATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTC
CAAACTCATCAATGTATCTTATCATGTCTGGATCCGCTGCATTAATGAAT
CGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCT
TCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGG
TATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGG
ATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGG
AACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCC
CTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACC
CGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGT
GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTC
TCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTC
AGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCC
CCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCC
AACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAAC
AGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAG
TGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCG
CTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATC
CGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAG
CAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTT
CTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTT
GGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAA
AAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTG
ACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCT
ATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGA
TACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGA
CCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGA
AGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGT
CTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAG
TTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGT
CGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGT
TACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCT
CCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTA
TGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTT
TCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGC
GGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCC
ACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGG
CGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAAC
CCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTT
TCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAAT
AAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATAT
TATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTG
AATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCG
AAAAGTGCCACCTGG
SEQ ID No:13的信息:
(xxxiv)序列特征:(A)长度:1337bp;(B)类型:核酸;(c)拓扑:
线性
(xxxv)分子类型:cDNA
(xxxvi)序列说明:SEQ ID No:13:富含GC的DNA片段
GGGGGCTGCGGAGGAACAGAGAAGGGAAGATATAAACCCCGCCGGCG
CCGACGAACCCCGCCCTGCCCCGTCCCCCCCGAAGGCAGCCGTCCCCCT
GCGGCAGCCCCGAGGCTGGAGATGGAGAAGGGGACGGCGGCGCGGCG
ACGCACGAAGGCCCTCCCCGCCCATTTCCTTCCTGCCGGCGCCGCACCG
CTTCGCCCGCGCCCGCTAGAGGGGGTGCGGCGGCGCCTCCCAGATTTCG
GCTCCGCCAGATTTGGGACAAAGGAAGTCCCTGCGCCCTCTCGCACGAT
TACCATAAAAGGCAATGGCTGCGGCTCGCCGCGCCTCGACAGCCGCCG
GCGCTCCGGGGCCGCCGCGCCCCTCCCCCGAGCCCTCCCCGGCCCGAGG
CGGCCCCGCCCCGCCCGGCACCCCCACCTGCCGCCACCCCCCGCCCGGC
ACGGCGAGCCCCGCGCCACGCCCCGCACGGAGCCCCGCACCCGAAGCC
GGGCCGTGCTCAGCAACTCGGGGAGGGGGGTGCAGGGGGGGGTTACAG
CCCGACCGCCGCGCCCACACCCCCTGCTCACCCCCCCACGCACACACCC
CGCACGCAGCCTTTGTTCCCCTCGCAGCCCCCCCGCACCGCGGGGCACC
GCCCCCGGCCGCGCTCCCCTCGCGCACACGCGGAGCGCACAAAGCCCC
GCGCCGCGCCCGCAGCGCTCACAGCCGCCGGGCAGCGCGGGCCGCACG
CGGCGCTCCCCACGCACACACACACGCACGCACCCCCCGAGCCGCTCCC
CCCCGCACAAAGGGCCCTCCCGGAGCCCTTTAAGGCTTTCACGCAGCCA
CAGAAAAGAAACGAGCCGTCATTAAACCAAGCGCTAATTACAGCCCGG
AGGAGAAGGGCCGTCCCGCCCGCTCACCTGTGGGAGTAACGCGGTCAG
TCAGAGCCGGGGCGGGCGGCGCGAGGCGGCGCGGAGCGGGGCACGGG
GCGAAGGCAACGCAGCGACGTCGAGCTGCAGCGGCCGATCCCTTCCTG
GGACTGGCCATGGCCAACTCACTTCTGAACCCCATCATCTACACGCTCA
CCAACCGCGACCTGCGCCACGCGCTCCTGCGCCTGGTCTGCTGCGGACG
CCACTCCTGCGGCAGAGACCCGAGTGGCTCCCAGCAGTCGGCGAGCGC
GGCTGAGGCTTCCGGGGGCCTGCGCCGCTGCCTGCCCCCGGGCCTTGAT
GGGAGCTTCAGCGGCTCGGAGCGCTCATCGCCCCAGCGCGACGGGCTG
GACACCAGCGGCTCCACAGGCAGCCCCGGTGCACCCACAGCCGCCCGG
ACTCTGGTATCAGAACCGGCTGCACTGCA
SEQ ID No:14的信息:
(xxxvii)序列特征:(A)长度:1505bp;(B)类型:核酸;(c)拓
扑:线性
(xxxviii)分子类型:cDNA
(xxxix)序列说明:SEQ ID No:14:EcoRI-TNFR2-Fc-NotI
CCGGAATTCCCACCATGGCGCCCGTCGCCGTCTGGGCCGCGCTGGCCGT
CGGACTGGAGCTCTGGGCTGCGGCGCACGCCTTGCCCGCCCAGGTGGCA
TTTACACCCTACGCCCCGGAGCCCGGGAGCACATGCCGGCTCAGAGAAT
ACTATGACCAGACAGCTCAGATGTGCTGCAGCAAATGCTCGCCGGGCC
AACATGCAAAAGTCTTCTGTACCAAGACCTCGGACACCGTGTGTGACTC
CTGTGAGGACAGCACATACACCCAGCTCTGGAACTGGGTTCCCGAGTGC
TTGAGCTGTGGCTCCCGCTGTAGCTCTGACCAGGTGGAAACTCAAGCCT
GCACTCGGGAACAGAACCGCATCTGCACCTGCAGGCCCGGCTGGTACT
GCGCGCTGAGCAAGCAGGAGGGGTGCCGGCTGTGCGCGCCGCTGCGCA
AGTGCCGCCCGGGCTTCGGCGTGGCCAGACCAGGAACTGAAACATCAG
ACGTGGTGTGCAAGCCCTGTGCCCCGGGGACGTTCTCCAACACGACTTC
ATCCACGGATATTTGCAGGCCCCACCAGATCTGTAACGTGGTGGCCATC
CCTGGGAATGCAAGCATGGATGCAGTCTGCACGTCCACGTCCCCCACCC
GGAGTATGGCCCCAGGGGCAGTACACTTACCCCAGCCAGTGTCCACAC
GATCCCAACACACGCAGCCAACTCCAGAACCCAGCACTGCTCCAAGCA
CCTCCTTCCTGCTCCCAATGGGCCCCAGCCCCCCAGCTGAAGGGAGCAC
TGGCGACGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGC
CCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAA
AACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGT
GGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTA
CGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGA
GCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCAC
CAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAA
GCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAG
CCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGA
CCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAG
CGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTA
CAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTAC
AGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTC
TCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGA
GCCTCTCCCTGTCTCCGGGTAAATGATAAGCGGCCGCAAAAGGAAAA
参考文献
Fregien N and Davidson N(1986)Activating elements in the promoter region of
the chicken beta-actin gene.Gene,48:1-11.
Kost TA,Theodorackis N,Hughes SH(1983)The nucleotide sequence of the chick
cytoplasmic beta-actin gene.Nucleic Acids Research,11(23):8287-8301.
机译: 鸡β-肌动蛋白基因内含子-1的用途
机译: pCAGGS矢量,包含导致鸡基因有趣的基因表达的鸡贝塔蛋白内含子中的829个碱基对缺失
机译: 来自玉米的h3c4基因启动子,与水稻的第一个肌动蛋白-内含子相连; chim u00e4res基因和涉及该基因的转化植物