首页> 中国专利> 具有肌醇六磷酸酶活性且该酶活性的温度稳定性增强的多肽及编码所述多肽的核苷酸序列

具有肌醇六磷酸酶活性且该酶活性的温度稳定性增强的多肽及编码所述多肽的核苷酸序列

摘要

本发明涉及一重组DNA分子,其在原核宿主细胞或真核宿主细胞中表达之后编码具有肌醇六磷酸酶活性的多肽。所述重组DNA分子包括选自以下的DNA序列:a)编码具有肌醇六磷酸酶活性的多肽并可通过改变成熟的野生型大肠杆菌肌醇六磷酸酶序列获得DNA序列,所述改变选自:i)第74位赖氨酸→天冬氨酸(K74D)的突变,和/或ii)第139位的天冬酰胺→精氨酸(N139R)和第142位的天冬氨酸→谷氨酸(D142E)的组合突变,和/或iii)第145位的亮氨酸→异亮氨酸(L145I)和第198位的亮氨酸→异亮氨酸(L198I)的组合突变,和/或iv)第200位的缬氨酸→脯氨酸(V200P)的突变,和/或v)在N端或C端或者N端和C端两端增加黑曲霉变种泡盛黑曲霉的酸性磷酸酶或黑曲霉的肌醇六磷酸酶的序列片段,b)与a)列出的序列具有70-100%同源性的DNA序列,c)因遗传密码子的简并性而与a)和b)列出的序列有关的DNA序列。该重组DNA分子在合适的宿主细胞中表达时,其所编码的蛋白的酶活性的温度抗性增强并且蛋白酶稳定性增强。改变iii)和iv)仅与改变i)、ii)和v)联合提供。本发明还涉及由此编码得到的蛋白。

著录项

  • 公开/公告号CN101631855A

    专利类型发明专利

  • 公开/公告日2010-01-20

    原文格式PDF

  • 申请/专利权人 AB酶有限公司;

    申请/专利号CN200780049750.6

  • 发明设计人 K·Q·阮;B·温特;

    申请日2007-11-02

  • 分类号C12N9/16;

  • 代理机构北京北翔知识产权代理有限公司;

  • 代理人张广育

  • 地址 德国达姆施塔特

  • 入库时间 2023-12-17 23:22:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-08-06

    授权

    授权

  • 2010-03-24

    实质审查的生效

    实质审查的生效

  • 2010-01-20

    公开

    公开

说明书

技术领域

本发明涉及编码一多肽的重组DNA分子以及被编码多肽自身,所 述多肽具有肌醇六磷酸酶活性并且该酶活性的温度稳定性增强且蛋白 水解稳定性增强。具体而言,本发明涉及编码一多肽的重组DNA分子, 所述多肽具有肌醇六磷酸酶活性并且该酶活性的温度稳定性被增强且 蛋白水解稳定性被增强,其中所述DNA序列通过改变成熟的野生型大 肠杆菌肌醇六磷酸酶序列获得,该DNA序列与野生型序列相比,确定 氨基酸位置发生改变或者使该序列分别具有N端和/或C端延长。本发 明还涉及一种表达重组肌醇六磷酸酶的方法及该肌醇六磷酸酶在食品 和动物饲料技术中的用途。

背景技术

肌醇六磷酸或肌醇-1,2,3,4,5,6-六磷酸二氢盐(缩写为肌醇-六磷酸 盐)是植物种子中肌醇的主要来源以及磷酸盐的主要贮藏形式。在豆科 植物的种子中,磷酸盐含量的约70%以肌醇六磷酸的钾盐、镁盐和钙 盐的混合物形式存在。种子、谷类和豆科植物是食品和饲料制品尤其是 动物饲料制品的重要组成,同时在人类营养学中,谷类和豆科植物也变 得越来越重要。

肌醇六磷酸的磷酸单位与二价和三价的阳离子(即营养生理学上重 要的离子例如钙、铁、锌和镁以及微量元素锰、铜和钼)结合成为复合 物。此外,肌醇六磷酸还经由静电相互作用结合某些范围内的蛋白。

通常,由于肌醇六磷酸及其盐肌醇六磷酸盐不会被代谢,因为它们 不会被胃肠道吸收;也就是说,从营养生理学层面上讲,不管是其中所 含有的磷还是被螯合的金属离子还是所结合的蛋白均得不到利用。

由于磷是所有生物体生长的必需元素,因而必须向食品和动物饲料 中补充无机磷。通常,还必须补充营养生理学方面必需的离子,如铁或 钙。另外,由于蛋白被肌醇六磷酸结合,因而每种饮食在营养生理学层 面上的价值有所减少。因此,肌醇六磷酸通常被描述为营养对抗因子。

另外,由于肌醇六磷酸不会被代谢,因此肌醇六磷酸盐的磷经由动 物的胃肠道被排出,致使对环境造成不受欢迎的磷酸盐污染,这会引起 例如水体富营养化并造成海藻的过度生长。

肌醇六磷酸或肌醇六磷酸盐(除非另外指出,否则这些术语在下文 中用作同义词)可由肌醇六磷酸酶分解。肌醇六磷酸酶催化肌醇六磷酸 盐水解成为肌醇和/或单磷酸盐、二磷酸盐、三磷酸盐、四磷酸盐和/或 五磷酸盐以及无机磷酸盐。人们区分出两种不同形式的微生物肌醇六磷 酸酶:1)3-肌醇六磷酸酶/肌醇六磷酸盐-3-磷酸水解酶,EC 3.1.3.8;2)6- 肌醇六磷酸酶/肌醇六磷酸盐-6-磷酸水解酶,EC 3.1.3.26。3-肌醇六磷酸 酶优选地首先水解3位的酯键,而6-肌醇六磷酸酶优选地首选水解6 位的酯键。含有肌醇六磷酸的植物种子含有内源性肌醇六磷酸酶。在消 化该植物种子时,食品或动物饲料中的肌醇六磷酸盐理论上能被内源性 植物肌醇六磷酸酶、来自肠内微生物区系的肌醇六磷酸酶以及来自肠黏 膜的肌醇六磷酸酶水解。然而,事实上,内源性植物肌醇六磷酸酶和存 在于肠内的肌醇六磷酸酶——如若存在——的水解潜力显然不足以显 著地确保肌醇六磷酸盐所结合的磷的生物利用度。因此,通常将外源性 肌醇六磷酸酶加入食品和动物饲料中。

肌醇六磷酸酶可由植物和微生物产生。在微生物中,产生肌醇六磷 酸酶的细菌以及产生肌醇六磷酸酶的真菌和酵母是已知的。

然而,天然存在的肌醇六磷酸酶生产者具有这样的缺点,即肌醇六 磷酸酶仅以一定的量并以确定的特征形成。但是,正如上文所述,对肌 醇六磷酸酶的需求尤其是食品和动物饲料产业对其的需求正与日俱增。

尽管食品和动物饲料产业对肌醇六磷酸酶的需求与日俱增,并且肌 醇六磷酸酶的使用也可能是有利的,但是仅有少数已知的肌醇六磷酸酶 广为食品和动物饲料产业所接受。普遍的关注点涉及到相对高的生产成 本和/或该酶在所需施用环境中的稳定性或者活性较差。此外,为了在 工业上得到使用,这类酶不得不达到某些标准。这些标准包括高度特异 的总体活性、较低的最佳pH、对胃肠蛋白酶的抗性以及温度稳定性即 热稳定性。温度稳定性是工业应用成功的一个重要先决条件,这是因为 例如在制粒过程中酶会被暴露于温度60℃-95℃之间。

所有已知的微生物肌醇六磷酸酶在温度56℃-78℃之间会解折叠 (Lehman et al.,2000),因而它们会丧失活性。因此,特别需要在较高温 度下也具有技术上足够的活性或者不会失活的肌醇六磷酸酶。

发明内容

因此,本发明的一个目的在于提供具有肌醇六磷酸酶活性的多肽, 所述多肽具有得到增强的热稳定性,或者在较高温度下它具有技术上足 够的活性。此外,具有肌醇六磷酸酶活性的多肽还应该具有得到增强的 蛋白水解稳定性。

需要以经济的方式产生该多肽。具体而言,该肌醇六磷酸酶应该较 野生型酶具有更高的热稳定性。此外,肌醇六磷酸酶应该保留天然大肠 杆菌野生型肌醇六磷酸酶的基本特征,但是也要具有得到增强的热稳定 性这一特征。天然野生型肌醇六磷酸酶的基本特征具体有:通过其作为 肌醇六磷酸酶和磷酸酶的活性增强磷酸盐在体内外的利用度的能力、其 在酸性环境中的最佳pH(在高度酸化的环境中具有更高的残留活性) 以及作为烘焙添加剂的可利用性。

本发明的一个目的还在于提供一多肽的基因,所述多肽具有肌醇六 磷酸酶活性,并具有得到增强的热稳定性以及得到增强的蛋白水解稳定 性。该多肽应以经济的和具有成本效益的方式生产。具体而言,该多肽 在真核微生物中的表达应该得到这样的多肽,即该多肽与以相似方式产 生的野生型肌醇六磷酸酶相比具有得到增强的热稳定性。还提供了:编 码该多肽的DNA序列,相应的DNA构建体和载体以及适合在工业加 工中商业化应用于食品和动物饲料的重组酶源和含有本发明酶的组合 物。

现意外地发现,在大肠杆菌野生型肌醇六磷酸酶序列某些位置的突 变会本质上增强蛋白肌醇磷酸酶的热稳定性即温度稳定性,并且会增强 其蛋白水解稳定性,而不会不利地影响野生型大肠杆菌肌醇六磷酸酶的 其他效用和基本特征。

意外地发现,在大肠杆菌野生型肌醇六磷酸酶的氨基酸序列第74 位(K74D)的突变和/或第139位(N139R)和第142位(D142E)的突变组 合,和/或第145位(L145I)和第198位(L198I)的突变组合和/或第200 位(V200P)的突变以及这些突变的组合会增强蛋白肌醇六磷酸酶的热 稳定性,而不会损害野生型大肠杆菌肌醇六磷酸酶的有利效用和基本特 征。还发现,大肠杆菌肌醇六磷酸酶在N端或C端或者在N端和C端 两端延伸出黑曲霉(Aspergillus niger)变种泡盛黑曲霉(awamori)的 酸性磷酸酶序列并同时具有上述突变时,该酶的热稳定性和蛋白水解稳 定性会增强。

因此,本发明涉及一重组DNA分子以及由此DNA编码的多肽序 列,该重组DNA分子在原核宿主细胞或真核宿主细胞中表达之后编码 具有肌醇六磷酸酶活性的多肽,其中所述重组DNA分子包括选自以下 的DNA序列:

a)编码一具有肌醇六磷酸酶活性的多肽的DNA序列,该DNA序 列通过改变成熟的野生型大肠杆菌肌醇六磷酸酶序列获得,其 中所述改变选自:

i)第74位赖氨酸→天冬氨酸(K74D)的突变,和/或

ii)第139位的天冬酰胺→精氨酸(N139R)和第142位的天冬 氨酸→谷氨酸(D142E)的组合突变,和/或

iii)第145位的亮氨酸→异亮氨酸(L145I)和第198位的亮氨 酸→异亮氨酸(L198I)的组合突变,和/或

iv)第200位的缬氨酸→脯氨酸(V200P)的突变,和/或

v)N端或C端或者N端和C端两端增加黑曲霉变种泡盛黑曲 霉的酸性磷酸酶的序列片段或黑曲霉的肌醇六磷酸酶的序 列片段,

b)与a)列出的序列具有70-100%同源性的DNA序列,

c)因遗传密码子的简并性而与a)和b)列出的序列有关的DNA序 列,

其中所述重组DNA分子在合适的宿主细胞中表达时,会使如此编码得 到的蛋白的酶活性具有增强的温度稳定性和蛋白酶稳定性,其中改变iii) 和iv)仅与改变i)、ii)和v)联合提供。

文献中记载了几种来自大肠杆菌的肌醇六磷酸酶,如来自大肠杆菌 K-12的编码肌醇六磷酸酶的appA-gene((Dassa et al.,J.Bacteriol. 172:5497-5500(1990))。该基因编码既具有酸性磷酸酶活性又具有肌醇 六磷酸酶活性的周质酶(参见Greiner et al.,Arch.Biochim,Biophys. 303:107-113(1993))。该酶的天然突变体是已知的(参见例如Rodriguez et al.,Biochem.Biophys.Res.Comm.257:117-123(1999))。还描述了大 肠杆菌肌醇六磷酸酶经遗传修饰使温度稳定性增强和/或比活性增强的 突变体。Rodriguez等人(Arch.Biochem.Biophys.382:105-112(2000)) 对巴斯德毕赤酵母(Pichia pastoris)试验了野生型AppA和几种通过定点 诱变形成的突变体,其目的是确定N糖基化对AppA蛋白的温度稳定 性的影响。尽管糖基化作用并未得到增强,但是突变体在pH 3.5-5.5之 间活性更强,并且在热处理之后具有与在巴斯德毕赤酵母中产生的野生 型蛋白相比更高的活性。

WO 03/057248的同族专利包括专利申请US 2003/0170293 A1和 US 2003/0157646 A1。其中记载了用于动物饲料的耐热肌醇六磷酸酶的 微生物生产法。大肠杆菌菌株B肌醇六磷酸酶(appA)的突变体(Nov9X) 在大肠杆菌、巴斯德毕赤酵母和粟酒裂殖酵母(Schizosaccaromyces pombe)中表达。与野生型酶相比,突变体Nov9X具有8个氨基酸突变。 与野生型酶相比,液体形式的突变体在70℃下具有更好的热稳定性。 产生酶的宿主同样对其热稳定性有影响,正如同一研究小组在美国专利 申请US 2003/0157646 A1所指出的那样。其中NOV9X的氨基酸位置计 数方法比本发明中要高两位(W48NOV9X对应本发明中的W46)。

在专利申请WO 02/095003和WO 2004/015084中,记载了大量大 肠杆菌肌醇六磷酸酶的点突变,然而,其中没有一个增强了热稳定性。 与本发明相比,WO 2004/015084中的编号高出30个氨基酸位置。

公开文献DE 10 2004 050 410也记载了大肠杆菌肌醇六磷酸酶突变 体,但是其目的是提高丝状真菌生产过程中的分泌效率。该文献并未给 出有关增强该突变体热稳定性的信息。

此外,文献Garrett et al.;Applied Environ.Microbiol.,2004,70(5), 3041-3046记载了热稳定性和胃肠稳定性增强的大肠杆菌肌醇六磷酸酶 突变体。

几乎不可能预测一种或多种突变体对酶活性在较高温度条件下的 特征的影响。较高温度通常会导致蛋白的二级结构和三级结构变性或者 解折叠。

蛋白的温度稳定性或热稳定性有赖于多种相互作用。蛋白的构象可 通过繁多的弱相互作用来维持。稳定性可包括所有等级的蛋白结构:多 肽链的局部堆积、二级和超二级结构单元、结构域和多亚基蛋白 (multimeric protein)的亚基。所记载的有关蛋白温度稳定性增强的原 因有很多,其中最常见的是:(a)亚基内和/或亚基之间离子对的缔合; (b)得到改善的疏水核心堆积(范德华相互作用);(c)其他氢键网络;(d) 形成二级结构的趋势增加;(e)螺旋内偶极稳定性的增强;(f)极性表面增 加;(g)空腔的数量减少及总体积减少;(h)构象压力(环稳定性)降低 以及(i)针对化学修饰(甲硫氨酸残基的氧化和/或天冬氨酸残基和谷氨 酸残基的去氨基化)的抗性。

现有技术并未提供有关如何更可取地改变大肠杆菌野生型肌醇六 磷酸酶序列从而增强热稳定性的暗示。此外,现有技术也没有提供大肠 杆菌肌醇六磷酸酶序列中的上述突变方面的暗示。

具体而言,现有技术并未提供这样的暗示:在大肠杆菌野生型肌醇 六磷酸酶的氨基酸序列第74位(K74D)的突变或者第139位(N139R)和 第142位(D142E)的突变组合或者第145位(L145I)和第198位(L198I) 的突变组合或者第200位(V200P)的突变或者这些突变的组合会增强蛋 白肌醇六磷酸酶的热稳定性,而不影响野生型大肠杆菌肌醇六磷酸酶的 有利效用和基本特征。此外,现有技术也没有提供这样的暗示:通过将 黑曲霉变种泡盛黑曲霉的酸性磷酸酶序列加到大肠杆菌肌醇六磷酸酶 的N端或C端或者N端和C端两端,同时结合上述突变,会增强该酶 的热稳定性。

具有本发明的成熟的野生型大肠杆菌肌醇六磷酸酶序列变体的优 选的本发明重组DNA分子为构建体PhyM2、PhyM3、PhyM9和 PhyM10。它们在下表1中给出。构建体PhyM1被选作参照产物。

表1:突变的基因型PhyM1、PhyM2、PhyM3、PhyM7、PhyM9 和PhyM10

根据布达佩斯条约的规定,以下质粒于2006年10月18日保藏在 德国微生物与细胞培养物保藏中心(DSMZ,Mascheroder Weg 1b, 38124 Braunschweig)。

  质粒   获取号   pET-PhyM2   DSM 18715   pUC-PhyM3   DSM 18717   pET-PhyM7   DSM 18716   pUC-PhyM9   DSM 18718   pUC-PhyM10   DSM 18719   pPhy2005   DSM 18720   pPhy2006   DSM 18721

出人意料的是,影响蛋白疏水表面的突变(PhyM3、PhyM7和 PhyM9)以及在螺旋D中插入离子键的突变(PhyM2)或经由离子键稳定 环B4的突变(PhyM7)均明显有助于大肠杆菌肌醇六磷酸酶热稳定性 的增强。

同时,黑曲霉变种泡盛黑曲霉酸性磷酸酶的序列部分的加入可导致 形成酸性磷酸酶的二聚体和四聚体,这一序列部分的加入对大肠杆菌肌 醇六磷酸酶有稳定作用。黑曲霉肌醇六磷酸酶的序列部分的加入有着异 曲同工之妙。

本发明具有肌醇六磷酸酶活性的多肽与大肠杆菌野生型酶相比,其 酶活性的温度稳定性或热稳定性增强。热稳定性的这一增强可通过以液 体形式经由差示扫描量热法(DSC)测量。具体而言,热稳定性的这一 增强可显现于以下观察结果:在暴露于热应力(thermal stress)时,例 如使动物饲料粒化而使用的热应力时,与野生型酶相比,酶突变体的残 留活性显著增强。另外,本发明的多肽针对蛋白水解性分解(尤其是出 现在家禽和单胃动物的胃中的蛋白水解性分解)有着得到增强的稳定 性。由于在动物营养摄入中,尤其是在通过胃期间,肌醇六磷酸酶需从 肌醇六磷酸及其分解产物中释放磷酸,因此所述稳定性尤其受到关注, 其目的是保持酶的剂量尽可能低。由于温度和/或蛋白水解稳定性增强, 本发明的肌醇六磷酸酶尤其适合应用于温度升高的条件或预计蛋白水 解性分解会增加的条件。应用实例有生产必须使其免受宿主菌株的蛋白 酶破坏的酶、生产颗粒化的动物饲料,同时还可在颗粒化的动物饲料的 粒化后应用中用作液体酶。温度稳定性增强使得可以更早地将酶施用到 尚未被冷却的颗粒上,这一举措缩短了被施用液体的蒸发时间。同时, 从微生物学的角度上来看也有优点,原因是,藉此,高的水含量仅在大 部分病原菌都不能生长的高温下暂时存在。

本发明编码肌醇六磷酸酶的DNA序列包含以下突变或者突变组合 和/或被编码多肽的N端或C端或者N端和C端两端增加中的至少一者:

i)第74位赖氨酸→天冬氨酸(K74D)的突变,和/或

ii)第139位的天冬酰胺→精氨酸(N139R)和第142位的天冬 氨酸→谷氨酸(D142E)的组合突变,和/或

iii)第145位的亮氨酸→异亮氨酸(L145I)和第198位的亮氨 酸→异亮氨酸(L198I)的组合突变,和/或

iv)第200位的缬氨酸→脯氨酸(V200P)的突变,和/或

v)在N端或C端或者N端和C端两端增加黑曲霉变种泡盛黑 曲霉的酸性磷酸酶序列片段或黑曲霉的肌醇六磷酸酶的 序列片段。

本发明的肌醇六磷酸酶序列优选地包含至少一个上述改变,并且非 常优选地包含至少两个上述改变。为了使肌醇六磷酸酶的热稳定性适应 本发明的上述具体的应用条件,突变变体的任何组合都是可能存在的。 优选的可能的组合是i)、ii)和iv)的组合,该组合在下文被称为基因型 PhyM10。

此外,除了上述突变或突变组合之外,或者替代上述突变或突变组 合,可在N端或C端或N端和C端两端增加黑曲霉变种泡盛黑曲霉的 酸性磷酸酶序列片段。当只存在这些序列部分时,热稳定性也能得到增 强。黑曲霉变种泡盛黑曲霉的酸性磷酸酶N端部分为成熟蛋白的前51 个氨基酸(FSYGAAIPQS TQEKQFSQEF RDGYSILKHY GGNGPYSERV SYGIARDPPTS)。该多肽的后四个氨基酸代替了成熟 大肠杆菌肌醇六磷酸酶的前4个氨基酸(QSEP)。此外,酸性磷酸酶的 这些片段的多个部分的增加也是可能的。或者,可使用黑曲霉肌醇六磷 酸酶的成熟蛋白的前40个氨基酸(SCDTVDQGYQ CFSETSHLWG QYAPFFSLAN ESVISPEVPA)的N端部分或其多个部分。只要酶活性 得到维持,还可在所述第4位以外的其他位点实行对大肠杆菌肌醇六磷 酸酶的增加。对于C端伸长,黑曲霉变种泡盛黑曲霉酸性磷酸酶的后 29个氨基酸(LSFWWNYNTT TELNYRSSPI ACQEGDAMD)直接融 合在大肠杆菌肌醇六磷酸酶的C端上。这一融合或这些融合还可伴有 大肠杆菌肌醇六磷酸酶的其他突变,且不局限于本申请所述的其他突 变。突变Lys43Cys会在新的C端部分和大肠杆菌肌醇六磷酸酶核心之 间形成二硫键,并因此增强二聚化作用。其他有利于或可稳定范德华力、 疏水性或离子型分子间键位并由此增强或进一步提高热稳定性的突变 也是可能的。N端或C端序列伸长的实例可参见下文所述的实施方案 Phy2005和Phy2006。

本发明肌醇六磷酸酶的热稳定性可在产品中进一步增强,例如通过 在干燥或粒化之前向超滤浓缩物中添加物质来实现。例如,本发明肌醇 六磷酸酶的稳定制剂可通过如下方式产生:将由液体酶溶液制成的混合 物喷于填充材料如麦芽糊精之上,然后干燥所述混合物;或者在干燥之 前向该液体酶溶液中加入20%-60%的脱脂奶粉(w/w,以酶溶液的总 蛋白为基准)和/或1%-5%的丙酸钙(w/w,以酶溶液的总蛋白为基准), 并将pH值调至一确定值,具体调至pH 5.2±0.5。除了由结构确定的稳 定性之外,湿度的降低以及肌醇六磷酸酶与填充材料的结合相互作用还 可保护该酶由其结构确定的稳定性,使其免受环境影响,例如在动物饲 料生产期间可能产生的极端温度。如果降低潜在蛋白水解酶的活性,干 粉制剂和液体制剂可被进一步稳定,所述蛋白水解酶可以作为用于产生 本发明酶的液体发酵混合物的副产物形式存在。

对应于本发明的突变的肌醇六磷酸酶序列的DNA序列可通过使用 任何密码子用法来产生。例如,可以使用表达用的微生物的密码子用法, 还可使用大肠杆菌密码子用法或其变化形式。另外,本发明被突变的大 肠杆菌肌醇六磷酸酶序列还可含有其它序列改变。因此,除了上述突变 之外的任何改变形式均可实行,只要对得到增强的稳定温度性这一性质 没有不利影响并且只要大肠杆菌野生型肌醇六磷酸酶的酶活性和其他 基本特征得以维持。

相应的改变为重组DNA技术领域的技术人员所熟知,它们包括上 述突变以及下述示例性改变。

根据本发明,可使用本发明经修饰得到的多肽的增加和/或缺失分 子。因此,依据本发明修饰的具有肌醇六磷酸酶活性的多肽可通过在N 端和/或C端增加其他的序列得以延长。因此,可产生具有其他有利特 征的杂合分子。例如,可添加融合蛋白或天然的强分泌蛋白,由此提高 分泌效率。基于此目的,优选使用来自里氏木霉(Trichoderma reesei) 的CBH2蛋白Met 1至Ser 86的氨基酸部分。

根据本发明,只要在保持肌醇六磷酸酶的活性的同时不影响增强的 温度稳定性这一性质,还可使得具有肌醇六磷酸酶活性的多肽的序列片 段缺失。

突变、延长以及缩短可通过公知手段以及特定领域所熟知的方法来 实现。

对具有肌醇六磷酸酶活性的多肽的上述改变对应于相应DNA分子 的相应突变或修饰。根据本发明,甚至还考虑到了在宽松和严格条件下 与本发明的序列杂交的那些序列。严格条件如下:在硫酸葡聚糖溶液 (GenescreenPlus,DuPont)中于65℃杂交18小时,然后清洗滤器,每次 30分钟,即在65℃下先用6×SSC清洗,2×SSC清洗两次,含0.1%SDS 的2×SSC清洗两次,然后用0.2×SSC清洗(转膜和检测方法, Amersham)。

此外,本发明还涉及那些包含与要求保护的核苷酸序列或其要求保 护的部分具有至少70%、优选至少80%、更优选至少90%并且尤其优 选至少95%同源性的那些序列,只要相应的序列会使其所编码的具有 肌醇六磷酸酶活性的多肽的温度稳定性增强。优选地,同源性为70% 至100%。同源性被定义为同一程度。基于此目的,同一程度优选地以 这样的方式确定,即确定参与比较并在其他序列中具有“相应”互补序 列的较短序列的残基数。就本发明的目的而言,同源性通常优选通过使 用普通算法确定。依据本发明,仅相应的成熟蛋白的cDNA被考虑用于 比较。依据本发明,相似的优选同一的互补序列借助于已知的计算机程 序被确定为同源序列。这种程序的一个实例是程序Clone Manager Suite,它包括程序部分Align Plus,并由Scientific&Educational Software,Durham,NC,USA发布。基于此目的,对两条上文定义的DNA 序列的比较是经由方法FastScan-MaxScore或经由方法 Needleman-Wunsch在可选的局部比对条件下使用默认值进行的。根据 本发明,具有函数“Compare Two Sequences/Local Fast Scan-Max Score/Compare DNA sequences”的程序版本“Clone Manager 7 Align Plus 5”已被特别地用于确定同源性。基于此目的,使用了获自以下来源 的算法:Hirschberg,D.S.(1975)A linear space algorithm for computing longest common subsequences,Commun Assoc Comput Mach 18:341-343;Myers,E.W.and W.Miller.(1988)Optimal alignments in linear space,CABIOS 4:1,11-17;Chao,K-M,W.R.Pearson and W. Miller.(1992)Aligning two sequences within a specified diagonal band, CABIOS 8:5,481-487。

本发明还涉及这样的DNA序列,其由于遗传密码子的简并性而涉 及本发明的序列及其等位基因的变化形式。遗传密码的简并性是由天然 的简并性所致或是由于专门选择的密码子用法所致。天然存在的等位基 因变体可通过使用分子生物学中的已知技术例如聚合酶链式反应 (PCR)和杂交技术来鉴定。

可使用编码本发明多肽的DNA序列来转化任何宿主细胞,例如真 菌细胞、酵母细胞、细菌细胞、植物细胞或哺乳动物细胞。这类被转化 的细胞可能会产生并分泌热稳定性得到增强的肌醇六磷酸酶。以这种方 式产生的热稳定性得到增强的肌醇六磷酸酶还可从肌醇六磷酸盐有效 地释放出磷酸。

术语蛋白、肽或多肽可互换使用。具有肌醇六磷酸活性的多肽或酶 或肌醇六磷酸酶各自可为能使无机磷酸从各种肌醇磷酸盐中释放出来 的酶。这类肌醇磷酸盐(肌醇六磷酸酶)底物的实例为肌醇六磷酸及其 各种盐,例如肌醇六磷酸钠或肌醇六磷酸钾或混合的盐。另外,肌醇的 二磷酸盐、三磷酸盐、四磷酸盐或五磷酸盐的各种位置异构体也可作为 肌醇六磷酸酶的底物。肌醇六磷酸酶活性可通过使用任何采用这其中的 一种底物的分析法来确定。本发明肌醇六磷酸酶变体包括通过如下方式 自特定的肌醇六磷酸酶获得的多肽变体:通过在天然蛋白的N端和/或 C端缺失或增加一个或多个氨基酸,通过在天然蛋白的一个或多个位点 上缺失或增加一个或多个氨基酸,或者在肌醇六磷酸酶上的一个或多个 位点上替换一个或多个氨基酸。这类变体的产生通常是本领域所熟知 的。例如,该多肽的氨基酸序列变体通过在DNA中进行突变来产生。 诱变方法和核苷酸序列改变方法为本领域所熟知(参见例如Kunkel, Proc.Natl.Acad.Sci.USA,82:488(1985),Kunkel et al.,Methods in Enzymol.,154:367(1987),美国专利4,873,192,Walker und Gaastra, eds.,Techniques in Molecular Biology,Mac Millan Publishing Company, New York(1983))。有关合适的氨基酸替换——其不会影响目的蛋白的 生物学活性——的指示可参见Dayhoff等人(Dayhoff et al.,Atlas of Protein Sequence and Structure,Natl.Biomed.Res.Found., Washington,D.C.(1978))的模型。优选保守替换,例如用一氨基酸来 置换具有相似特征的另一氨基酸。

在某一组内可以互换的氨基酸包括但不限于下表所示例的氨基酸:

本发明还涉及分离的或基本纯化的核酸或蛋白组合物。因此,分离 的和纯化的多核苷酸/多肽或其区段是指从其天然环境分离出的多核苷 酸或多肽或其片段。分离的多核酸区段或多肽可以以纯化形式存在,或 者存在于非天然环境如转基因宿主细胞中。例如,分离的或纯化的多核 苷酸片段或蛋白或其具有生物学活性的部分基本不含重组技术制备中 的任何其他细胞物质或培养基,或者基本不含化学前体或其他化合物。 优选的是一不含下述序列(优选编码蛋白的序列)的分离的多核苷酸, 所述不含的序列天然地位于核酸来源生物体的基因组DNA的核酸(即 位于所述核酸序列5’端和3’端的序列)的侧翼。例如,根据不同的实施 方案,分离的核酸分子可含有少于约5kb、4kb、3kb、2kb、1kb、 0.5kb或0.1kb的核苷酸序列,所述核苷酸序列天然地位于核酸分子所 来源的细胞的基因组DNA的核酸分子的侧翼。基本不含细胞物质的蛋 白包含具有少于约70%、50%、30%、20%、10%、5%(以干重为基 准)的污染蛋白的蛋白或多肽组成。本发明蛋白或其活性片段以重组方 式产生时,所述培养基优选地含有少于约70%、50%、30%、20%、10% 或5%(以干重为基准)的化学前体物或非蛋白化学物质。本发明还包 括本发明核苷酸序列的片段和变体及其所编码的蛋白或蛋白区段。片段 是指核苷酸序列的一部分或者氨基酸序列的一部分,因而也指其所编码 的多肽或蛋白的一部分。

本发明还涉及可用于将编码本发明肌醇六磷酸酶的开放阅读框引 入宿主细胞的表达盒。它们优选地包含与开放阅读框连接的转录起始区 域。这种表达盒可含有多个插入开放阅读框和/或其他DNA例如转录调 控区域和/或选择性遗传标记的限制性酶切位点。转录盒从转录的5’→3’ 方向包含在微生物细胞中发挥功能的转录和翻译起始区域、目的DNA 序列以及转录和翻译终止区域。终止区域可相对于转录起始区域而言为 天然的,可相对于目的DNA序列为天然的,或者可来源于任何其他来 源。

术语“开放阅读框”(ORF)是指编码序列的翻译起始密码子和终止 密码子之间被编码的氨基酸序列。术语“起始密码子”和“终止密码子” 是指限定了蛋白合成(mRNA翻译)的链起点和终点的编码序列中的 三个邻接核苷酸单位(密码子)。

就核酸而言,“功能性连接”或“有效连接”是指以相对于启动子 的转录起始合适的位置和方向、作为核酸分子的一部分与该核酸分子连 接。与启动子有效连接的DNA受到启动子的转录起始调控。编码序列 可与调控序列以正义或反义方向有效连接。就多肽而言,“功能性连接/ 有效连接”是指作为同一多肽的一部分的连接,即通过多肽连接。

根据本发明,可使用任何启动子。启动子通常是指位于编码序列上 游(5’)的核苷酸序列,它通过识别正确转录所需的RNA聚合酶和其 他因子来控制编码序列表达。本发明的启动子可包括最小启动子,即来 自TATA盒的短DNA序列和其他增加了控制表达的调控单元的表示转 录起始位点的序列。

本发明启动子还可包含含有可控制编码序列或功能性RNA表达的 最小启动子和调控单元的核酸序列。这类启动子序列由近端和远端上游 单元组成,其中远端上游单元通常被称为增强子。因此,增强子为这样 的DNA序列,即它可刺激启动子活性,并可为一种本质上是启动子的 单元或插入的异源单元,以增强表达峰或启动子的组织特异性。它在两 个方向均起作用,甚至本身在置于启动子的上游或下游时也会起作用。 增强子以及其他上游启动子单元可结合介导其作用的序列特异性DNA 结合蛋白。完整的启动子可来源于天然基因或由来自不同的天然启动子 的不同单元构成,或者甚至可由合成DNA区段构成。启动子还可含有 参与了与针对生理或发育条件来控制转录起始效率的蛋白因子连接的 DNA序列。

启动子单元,尤其是没有活性或者缺少上游活性的具有严重降低的 启动子活性的TATA单元,被称为最小启动子或核心启动子。在分别 存在一个或多个合适的转录因子的情况下,最小启动子能启动转录。因 此,最小启动子或核心启动子仅由转录起始所必需的所有基本单元如 TATA盒和/或抑制子组成。

本发明还涉及含有本发明DNA的载体。这些载体包括双链或单链、 线性或环状形式的各种质粒、粘粒、噬菌体和其他载体,如果需要,它 们自身是可转化的或可移动的,并且能通过整合到细胞基因组来转化原 核或真核宿主,或者以染色体外形式存在(如具有复制起点的自动复制 的质粒)。

用于细胞转化的载体、质粒、粘粒、人工酵母染色体(YAC)、人工 细菌染色体(BAC)和DNA区段通常包含本发明编码肌醇六磷酸酶的 DNA以及其他DNA如cDNA、应被引入细胞中的一个或多个基因。这 些DNA构建体可包含其他的结构例如启动子、增强子、聚合接头,或 者,如果需要时还可含有调控基因。被选择来进行细胞导入的DNA区 段的一种或基因通常编码一种这样的蛋白,其在由此得到的转化(重组) 细胞中表达并赋予一个可筛选或可选择的特征,并且/或者为所述被转 化的细胞提供了一个更好的表型。

本发明中可以使用的载体构建方法在本领域的技术人员在参阅现 有公开的情况下是可获悉的(参见例如Sambrook et al.,Molecular Cloning:A Laboratory Manual(2.ed.,Coldspring Harbor Laboratory Press,Plainview,N.Y.(1989))。本发明的表达盒可含有一个或多个限制 性酶切位点,其目的是使编码肌醇六磷酸酶的核苷酸受调控序列的调 控。表达盒还可含有与多核苷酸和多核苷酸正确翻译所需的调控序列有 效连接的终止信号。含有本发明多核苷酸的表达盒可以为嵌合的,即其 至少一个组件相对于至少一种其他组件而言是异源的。多核苷酸在表达 盒中的表达可由组成型启动子、诱导型启动子、受调控启动子、病毒启 动子或合成启动子控制。

载体可含有调控单元如启动子,或者,可对本发明的DNA序列进 得处理使其含有这类单元。可被使用的合适的启动子单元为本领域所 知,如里氏木霉的cbh 1或cbh-2启动子,或米曲霉(Aspergillus oryzae) 的amy启动子,黑曲霉的xyl、glaA、alcA、aphA、tpiA、gpdA、sucl 和pkiA启动子。可用于在酵母中表达的合适的启动子单元为本领域所 知悉,如用于在酿酒酵母菌(Saccharomyces cerevisiae)中表达的pho5 启动子或gap启动子,对于巴斯德毕赤酵母,如aoxl启动子或fmd启 动子,或者用于在汉森酵母(H.polymorpha)中mox启动子。

除了本发明所述的DNA之外,适合导入细胞的DNA还包括来源 于任何来源或从其中分离得到的DNA。所来源的DNA的一个实例是被 鉴定为给定生物体中的有用片段并且可以基本上纯的形式经化学合成 的DNA序列。这类DNA的一个实例这样的合适的DNA序列,其例如 通过使用限制性内切酶获得,从而使其可依据本发明被进一步处理例如 被扩增。这种DNA通常被称为重组DNA。因此,合适的DNA包括全 合成DNA、半合成DNA、从生物来源分离的DNA以及来源于被引入 的RNA的DNA。通常,被引入的DNA没有受体DNA基因型的原始 组分,但是依据本发明,来自给定基因型的基因可被分离并最终被改变, 并且在此之后可将多个拷贝的该基因引入同一基因型,例如为了加强给 定基因产物的产生。

被引入的DNA包括但不限于来自例如细菌、酵母、真菌或病毒的 基因的DNA。被引入的DNA可包含经修饰基因或合成基因、包括来自 相同或来自不同基因型的基因在内的基因或嵌合基因的一部分。

本发明用于转化的DNA可为环形或线形、双链或单链的。通常, 该DNA以嵌合DNA例如质粒DNA的形式存在,所述质粒DNA含有 编码区域,该编码区域的侧翼具有支持转化细胞中所含的重组DNA表 达的调控序列。例如,DNA自身可含有一种启动子或由该启动子组成, 所述启动子在细胞中有活性,或者来源于不同于该细胞的来源,或者可 使用业已包含在细胞即转化靶细胞中的启动子。

通常,被引入的DNA相对较小,不到30kb,其目的是使针对物 理、化学或酶学分解的敏感度降至最低,所述分解随着DNA的大小增 加而增加。

合适表达载体的选择取决于宿主细胞。酵母或真菌表达载体可包括 复制起点、合适的启动子和增强子,还可包括各种所需核糖体结合位点、 多腺苷酸化位点、剪接供体和受体位点、转录终止序列和非转录的5’ 侧翼序列。

合适宿主细胞的实例有:真菌类曲霉属(Aspergillus)、根霉属 (Rhizopus)、木霉属(Trichoderma)、脉孢霉属(Neurospora)、毛霉 属(Mucor)、青霉属(Penicillium)等的细胞,例如克鲁维酵母菌属 (Kluyveromyce)、酵母属(Saccharomyce)、裂殖酵母属 (Schizosaccharomyce)、丝孢酵母属(Trichosporon)、Schwanniomyce、 汉森酵母属(Hansenula)、毕赤酵母属(Pichia)等的酵母。合适的宿 主系统有例如真菌如曲霉(如黑曲霉(ATCC 9142)或无花果曲霉 (Aspergillus ficuum)(NRLL 3135))、或木霉(如里氏木霉QM6a)、以及 酵母如酵母属如酿酒酵母、或毕赤酵母例如巴斯德毕赤酵母、或汉森酵 母如汉森酵母(DSMZ 70277)。这类微生物可通过得到公认的保藏机构 例如美国典型培养物保藏中心(ATCC)、荷兰真菌保藏所(CBS)或德 国微生物与细胞培养物保藏中心(DSMZ)或任何其他保藏机构获得。

在5’→3’转录方向,表达盒可含有本发明多核苷酸的转录和翻译起 始区域以及在体内或体外起作用的转录和终止区域。相对于转录起始区 域而言,终止区域可以是天然的,或者,相对于该多核苷酸,终止区域 可以是天然的或者来自不同来源。调控序列可位于编码序列的上游(5’ 非编码序列)、编码序列内(内含子)或编码序列下游(3’非编码序列), 并且可影响相关编码序列的转录、RNA加工或稳定性和/或翻译。调控 序列可不受限制地包括增强子、启动子、阻遏蛋白结合位点、翻译前导 序列、内含子或多腺苷酸化信号序列。它们可包括天然序列或合成序列 以及合成序列和天然序列结合的序列。

本发明所使用的载体还可包含用于扩增表达的合适序列。

本发明所使用的启动子的实例为以其控制在真核细胞中的表达而 著称的启动子。可使用具有在丝状真菌中表达的能力的各启动子。实例 有受淀粉或纤维素强烈诱导的启动子,例如来自曲霉属的葡糖淀粉酶或 α-淀粉酶或者来自木霉属的纤维素酶(纤维二糖水解酶)的启动子,糖 酵解代谢中的酶的启动子,所述酶例如磷酸甘油酸激酶(PGK)和甘油醛 -3-磷酸-脱氢酶(GPD)等。优选纤维二糖水解酶I的启动子、纤维二糖水 解酶II的启动子、淀粉酶的启动子、葡糖淀粉酶的启动子、木聚糖酶 的启动子或者烯醇酶的启动子。

两种控制表达的主要方法是已知的,即过表达和低表达。过表达可 通过插入一个或多个额外拷贝的所选基因来实现。低表达有两种主要的 方法,它们在本领域通常被称为“反义下调”和“正义下调”。通常, 这些方法均被称为“基因沉默”。两种方法均会抑制靶基因的表达。

除了使用特定启动子之外,其他类型的单元也可影响转基因表达。 具体而言,已表明内含子具有强化转基因表达的潜力。

表达盒可包含其他单元,例如受内源性或外源性单元例如锌指蛋白 (包括天然存在的锌指蛋白或嵌合型锌指蛋白)调控的那些单元。

此外,本发明所使用的表达盒可含有增强子单元或上游启动子单 元。

用于本发明的载体可构建成含有增强子单元。因而,本发明构建体 可包含目的基因以及3’-DNA序列,所述3’-DNA序列起到终止转录并 使由此获得的mRNA多腺苷酸化的信号序列的作用。任何可使所选宿 主生物体能够进行分泌的信号序列均可使用。优选的信号序列为黑曲霉 的肌醇六磷酸酶信号序列或者来自丝状真菌的分泌信号序列。

因为转录起始位点和编码序列的起点之间的DNA序列即非翻译前 导序列可影响基因的表达,还可使用特定的前导序列。优选的前导序列 可包含对所连接基因的最佳表达进行调控的序列,即它们包含增强或维 持mRNA稳定性并防止不合适翻译起始的优选共有前导序列。对于这 类序列的选择是本领域技术人员所熟知的。

为了提高鉴定转化体的几率,可将可选择或可筛选的遗传标记引入 (插入)表达盒内。这类遗传标记为本领域技术人员所熟知。

将表达盒或含有该表达盒的载体构建体引入宿主细胞中。为将构建 体引入宿主细胞领域中,可利用本领域技术人员所熟知的多种技术。微 生物细胞的转化可通过使用聚乙二醇、氯化钙、病毒感染、DEAE-葡聚 糖、噬菌体感染、电穿孔和其他本领域已知的方法来实现。真菌的转化 可依据et al.,Gene 61:155-164,1987所述内容来实现。将重组 载体引入酵母可通过包括电穿孔、使用原生质体、醋酸锂等的已知方法 来实现。

一旦获得本发明表达盒或DNA序列,即可依据已知方法将其插入 载体中,从而使被编码的多肽在合适的宿主系统中过表达。然而,也可 以同样方式使用DNA序列来转化本发明的合适的宿主系统,以实现被 编码多肽的过表达。

一旦本发明的DNA序列在合适培养基中在合适宿主细胞中表达, 即可依据已知方法,使被编码的肌醇六磷酸酶从培养基(在肌醇六磷酸 酶被分泌到培养基的情况下)或从宿主生物体(在肌醇六磷酸酶以胞内 形式存在即存在于周质空间的情况下)富集和/或分离。可先使用分离 培养基和生物量的不可溶组分的已知方法,然后使用富集肌醇六磷酸酶 的方法,产生肌醇六磷酸酶的浓缩液,或者产生肌醇六磷酸酶的干粉制 剂。例如,可先将过滤方法或离心方法用于分离不可溶组分,然后将超 滤方法用于浓缩,或者使用错流式过滤法。干燥可通过冷冻干燥和喷雾 干燥、粒化过程、挤压法或其他方法来实现。已知的蛋白纯化方法可用 于分离本发明的肌醇六磷酸酶。例如,可分别地或彼此结合地使用不同 的色谱法或凝胶色谱法。根据重组生产方法中所使用的宿主细胞,可通 过糖基化以共价方式来修饰本发明的酶或对其不作糖基化修饰。在真核 细胞中,被分泌蛋白的糖基化起到调控蛋白折叠、构象稳定性、热稳定 性以及蛋白水解抗性的作用。就肌醇六磷酸酶的特定用途来看,与该酶 的非糖基化变体相比,其糖基化变体是优选的。例如,在动物饲料中使 用糖基化的肌醇六磷酸酶可起到使该酶免受饲料粒化期间的热变性以 及通过胃期间的蛋白水解失活的作用,从而使得活性酶在肠道中以及抵 达作用位点的的分布是有利的。关于在食品加工中的使用(其中仅在加 工期间需要而在终产品中不需要酶活性),不耐热即非糖基化并且对蛋 白水解性分解/消化敏感的肌醇六磷酸酶是优选的。

本发明还涉及含有本发明多肽的肌醇六磷酸酶组合物。通常,肌醇 六磷酸酶组合物为液体或干粉。液体组合物优选地含有纯化或富集形式 的肌醇六磷酸酶。但是,可加入助剂例如稳定剂(如甘油、山梨醇或丙 二醇)、添加剂(如盐、糖)、防腐剂、pH值调节剂、蛋白和肌醇六磷 酸盐或肌醇磷酸盐(肌醇六磷酸酶的底物)。常规的液体组合物为水性 或油性悬液。液体组合物可于可能的粒化步骤或加工步骤之前或之后加 入食品或动物饲料中。

干粉组合物可为冷冻干燥的、喷雾干燥的、颗粒化的或挤压得到的 只含有该酶的组合物。在干燥之前,还可加入调节pH值的物质以及其 他的添加剂和填充材料如麦芽糊精、乳糖、脱脂奶粉、二价阳离子例如 Mg、Ca、Zn等的盐。干粉组合物可为容易与例如食品或饲料组分混合 的颗粒,或者,优选地,可形成预混料的组分。酶颗粒的颗粒大小优选 地与混合物的其他组分相一致。这使其成为将酶掺入被加工食品、预混 料或动物饲料中的安全有益的试剂。

例如,本发明肌醇六磷酸酶的稳定制剂可通过将液体酶溶液的混合 物喷于填充材料如麦芽糊精之上并在之后干燥该混合物来产生,或者通 过在干燥之前向液体酶溶液中加入20%-60%的脱脂奶粉(w/w,以酶 溶液的总蛋白为基准)和/或1%-5%的丙酸钙(w/w,以酶溶液的总蛋 白为基准),并将pH值调至一确定值,具体调至pH 5.2±0.5。除了由 结构确定的稳定性之外,湿度的降低以及肌醇六磷酸酶与填充材料的结 合相互作用也会使该酶免受环境,例如在动物饲料生产期间可能出现的 极端温度的破坏。干粉制剂和液体制剂可通过降低潜在蛋白水解酶的活 性而被进一步稳定,所述蛋白水解酶可能是用于产生本发明酶的液体发 酵混合物中的副产物。由此产生的干酶混合物可用作用于家禽饲养和猪 饲养中的动物饲料添加剂。另外,磷补充的减少会减少磷污染,从而显 著减少由于集约家畜饲养所引起的环境污染。

一旦获得干酶制剂,即可在其他步骤中产生结块颗粒。基于此目的, 使用具有高剪切力的搅拌机,由此填充材料和酶发生凝聚并形成颗粒。 可通过用本发明的酶包被载体核心来产生吸附颗粒。常用的填充材料为 盐例如硫酸二钠盐。其他填充材料包括高岭土、滑石、硅酸镁铝和纤维 素纤维。如果需要,还可将结合材料如葡聚糖掺入凝聚颗粒中。

常规载体包括淀粉,其形式为例如木薯淀粉、土豆淀粉和谷物淀粉, 尤其是玉米淀粉、稻淀粉和小麦淀粉或者含有蛋白如大豆蛋白的产品。 还可使用盐。如果需要,颗粒可由包被混合物包被。这种混合物包括包 被材料,优选疏水性包被材料、无水棕榈油和滑石,并且如果需要,可 包括其他添加剂例如碳酸钙或高岭土,其目的是增强在作用位点的生物 利用度。

此外,含有肌醇六磷酸酶的混合物可含有其他物质如着色剂、调味 剂、稳定剂、维生素、矿物质、其他食品酶或动物饲料酶等。具体而言, 这涉及到所谓的预混料。

食品添加剂或动物饲料添加剂为适合被添加到食品或动物饲料中 的基本纯的化合物或者几种化合物的组合物。具体而言,它是依据其指 定目的成为食品或动物饲料的组分或者影响食品或动物饲料产品的特 征的物质。因此,肌醇六磷酸酶添加剂应该指这样的肌醇六磷酸酶,其 不是主要用于食品和动物饲料中的天然组分,或者其并不以其天然浓缩 物的形式存在于食品和动物饲料中。例如,肌醇六磷酸酶与动物饲料物 质分开被单独加至动物饲料中或与其他动物饲料添加剂结合加入动物 饲料中。一种典型的预混料通常包含一种或几种化合物如维生素、矿物 质或饲料强化酶和合适的载体和/或赋形剂。

即用型肌醇六磷酸酶添加剂为并非是在动物饲料或加工食品中原 位产生的添加剂。可将即用型肌醇六磷酸酶添加剂直接地给予人类或动 物,或者优选地,在与动物饲料或食品的其他组分混合之后直接给予人 类或动物。例如,本发明这一方面的动物饲料添加剂与其他动物饲料和 动物饲料添加剂混合,从而获得预混料或补充型动物饲料。这类其他动 物饲料组分包括一种或多种其他(优选热稳定的)酶补充物、其他动物 饲料添加剂、矿物质性动物饲料和氨基酸。由此获得的(相结合的)动 物饲料添加剂可包括几种不同类别的化合物,并且随后可通过形成复合 型动物饲料将其以合适的量与动物饲料如谷物和蛋白载体混合。在混合 之后可通过已知的加工设备例如双造粒机(double pelletizer)、蒸汽造 粒机(steam pelletizer)、膨胀器(expander)或挤压机(extruder)来 将这些组分加工成为动物饲料。

类似地,本发明这一实施方案的食品添加剂可与其他食品组分混 合,由此产生加工得到的食品产品。这类其他食品组分包括一种或多种 酶补充物、维生素、矿物质和微量元素。然后将由此获得的结合型食品 添加剂以合适的量与其他食品组分如谷物和植物蛋白混合,从而提供加 工食品。可通过使用已知的加工设备将这些组分加工成为加工食品。

在一个优选的实施方案中,本发明的肌醇六磷酸酶组合物可另外包 括有效量的一种或多种用于食品或动物饲料的酶,所述酶优选地选自α- 半乳糖苷酶、β-半乳糖苷酶、漆酶(laccase)、其他肌醇六磷酸酶、磷 酸酶、内切葡聚糖酶(尤其是内切型-β-1,4-葡聚糖酶、内切型-β-1,3(4)- 葡聚糖酶、内切型-1,2-β-葡聚糖酶和内切型-1,3-α-葡聚糖酶)、纤维素 酶、木糖酶、半乳聚糖酶(尤其是阿拉伯半乳聚糖-内切型-1,4-β-半乳糖 苷酶和阿拉伯半乳聚糖-内切型-1,3-β-半乳糖苷酶)、果胶降解酶(尤其 是果胶酶、果胶酯酶、果胶裂解酶)、聚半乳糖醛酸酶、阿拉伯聚糖酶、 鼠李糖半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖乙酰酯酶、鼠李糖半乳糖 醛酸聚糖-α-鼠李糖苷酶、果胶酸裂解酶(pectate lyase)和α-半乳糖 醛酸酶(alpha-galacturonidase)、甘露聚糖酶、β-甘露糖苷酶、甘露聚 糖乙酰酯酶、木聚糖乙酰酯酶、蛋白酶、木聚糖酶、阿拉伯木聚糖酶和 脂肪水解酶如脂肪酶、磷酸酯酶和角质酶(cutinase)。

本发明动物饲料添加剂在饲料之前或与饲料一起被给予动物。优选 地,本发明动物饲料添加剂与饲料一起被给予动物。

食品或动物饲料中有效量的肌醇六磷酸酶由约10-20.000PPU/kg、 优选地约10-15.000PPU/kg、更优选地约10-10.000PPU/kg、甚至更优 选地约50-5.000PPU/kg、尤其是50-2.000PPU/kg的动物饲料或食品组 成。

本发明还涉及肌醇六磷酸酶用于加工和生产食品和动物饲料的用 途。食品用谷物和面粉可用肌醇六磷酸酶进行酶学处理,以减少原料中 肌醇六磷酸钙镁的含量。肌醇六磷酸钙镁含量的减少通过增加必需矿物 质如铁、钙和锌的利用度来提高食品质量。除了食品质量的改进之外, 在加工期间使用肌醇六磷酸酶还可提高食品生产的整体效率。例如,在 生产大豆蛋白分离物期间将肌醇六磷酸酶添加到白色大豆薄片中,可显 著地提高可提取蛋白的产量和质量。因此,肌醇六磷酸酶仅在生产和加 工期间有活性,而在终产品中不再有活性。对于生产生面团和烘焙以及 生产其他基于谷物的即食型产品而言,这一方面尤其重要。类似地,动 物饲料组分如烤制大豆粉或芸苔(canola)粉可在实际生产过程之前用 肌醇六磷酸酶预处理。在生产之前消除动物饲料组分中的营养对抗因子 会在生理学层面上提高质量,并且会使得动物饲料成分得到富集/更有 价值。在此加工期间,肌醇六磷酸酶在生产期间是有活性的,并且通常 在动物摄取经处理的动物饲料之后在其肠道中不再有活性。

除了将肌醇六磷酸酶用作动物饲料加工助剂之外,本发明还涉及将 本发明肌醇六磷酸酶用作消化助剂。片剂形式的肌醇六磷酸酶可与营养 品一起被摄入,目的是将活性酶分布到胃肠道内。

本发明肌醇六磷酸酶还可优选地用于单胃动物和多胃动物,尤其优 选地用于牛犊。还可向鱼饲料和甲壳动物饲料补充肌醇六磷酸酶,从而 提高动物饲料的利用度,并减少集约型动物饲养中分泌磷的含量。还可 将本发明动物饲料给予动物如家禽如肉鸡、火鸡、鹅、鸭,并且还可给 予猪、马、牛、绵羊、山羊、狗和猫,以及鱼类和甲壳类。尤其优选的 是将本发明动物饲料给予猪和家禽。

本发明肌醇六磷酸酶制剂还可与其他成分组合,从而形成新的并且 特别有利的动物饲料组合物。正如此前所述,由于大豆粉和谷物中的植 物性磷的利用度因与肌醇六磷酸的连接而较低,所以将无机磷加入动物 饲料中,从而使得能够为动物提供充足的磷。但是,这些动物饲料总磷 酸盐含量太高,因而导致对环境的磷酸盐污染。具体而言,本发明动物 饲料含有本发明肌醇六磷酸酶与动物饲料成分的组合,其目的是获得所 添加的无机磷的含量显著较低的动物饲料。在一个优选的实施方案中, 本发明动物饲料含有常规动物饲料成分、微量营养素、微量元素、维生 素等以及有效量的肌醇六磷酸酶和无机磷,其中肌醇六磷酸酶和磷的含 量为介于50-20.000单位的肌醇六磷酸酶/kg动物饲料和低于0.45%的无 机磷,优选地含量介于100-10.000单位的肌醇六磷酸酶/kg动物饲料和 低于0.225%的无机磷,更优选地含量为150-10.000单位的肌醇六磷酸 酶/kg动物饲料和低于0.15%的无机磷,甚至更优选地含量为200-20.000 单位的肌醇六磷酸酶/kg动物饲料并且没有额外添加无机磷。

本发明还涉及促进动物营养学中的增重和提高饲料转化率(FCR) 的方法,以及本发明肌醇六磷酸酶在该方法中的用途。本发明肌醇六磷 酸酶能促进增重,并且使饲料转化率能够得到提高,尤其是针对几乎不 含无机磷的动物饲料而言。根据本发明的方法,动物饲料中的无机磷含 量可降低至含量低于0.45%,优选地低于0.255%。优选地,不加入无 机磷。通过添加本发明的酶来提高磷酸盐的利用度,动物的骨骼矿化可 被显著增强,这对于快速生长的动物而言尤其重要。

根据另一个实施方案,本发明涉及本发明酶在烘焙中的用途,其中 涉及生面团的成形、弹性和/或稳定性和/或烘焙产品的体积、团粒结构 和/或腐败抗性。尽管本发明酶制剂可用于生产由面粉得到的任何类型 的生面团或烘焙产品,如黑麦粉、大麦粉、燕麦粉或玉米粉,但是已经 发现本发明的酶制品尤其适用于生产由小麦制成或主要由小麦制成的 生面团或烘焙产品。可通过使用本发明酶制品生产的烘焙产品包括面 包、小面包、法棍面包等。对于烘焙而言,可使用除了具有肌醇六磷酸 酶活性之外还具有另一酶活性例如木聚糖酶、脂肪酶、淀粉酶、氧化酶 或漆酶的本发明酶制品,或者本发明酶制品可与其他酶例如脂肪酶、淀 粉酶、氧化酶(如葡萄糖氧化酶、过氧化物酶)联合使用。

附图说明

附图将进一步阐述本发明:

图1:pET-PhyM2的质粒图

图2:pAB490-PhyM2的质粒图

图3:pUC-PhyM3的质粒图

图4:pAB489-PhyM3的质粒图

图5:pUC-PhyM10的质粒图

图6:pAB600-PhyM10的质粒图

图7:pPhy2005的质粒图

图8:pAB-Phy2005的质粒图

图9:pPhy2006的质粒图

图10:pAB-Phy2006的质粒图

图11:本发明的单突变体以及以野生型序列(Dassa)为基础的变 体之间的序列比较。突变或变体被标识。

具体实施方式

以下实施例对本发明进行进一步阐释。

实施例

实施例1-肌醇六磷酸酶活性的测定

肌醇六磷酸酶的活性在由0.5%的肌醇六磷酸(约5mM)、200mM 柠檬酸钠(pH 5.0)制得的分析混合物中测量。在37℃温育15分钟之 后,通过加入等体积15%的三氯乙酸来终止反应。所释放出的磷酸根 离子通过将100μl的分析混合物与900μl的H2O和1ml的0.6M H2SO4、2%的抗坏血酸和0.5%的钼酸铵混合,之后于50℃下温育20 分钟在820nm处进行了定量测量。使用磷酸钾标准溶液作为参照。

实施例2-质粒pET-PhyM2和pAB490-PhyM2(基因型PhyM2)的构建

通过以下步骤来实现质粒pAB490-PhyM2的构建:

1.pET-PhyM2的构建

质粒pET-PhyM2含有使用里氏木霉的密码子用法 (http://www.kazusa.or.jp/codon)并具有额外氨基酸变化N139R和 D142E的大肠杆菌肌醇六磷酸酶序列(Dassa et al.1990,获取号为 M58740,具有V200Y)。

通过使用里氏木霉的密码子用法(http://www.kazusa.or.jp/codon), 将这样的一种DNA序列插入质粒pET26b(+)(Novagen,Germany,经 Brain,Germany改进)中:该DNA序列含有1230bp的开放阅读框且第 一位为CAG(Gln)密码子,并且编码具有410个氨基酸的酶。为实现诱 变,使用了基于PCR的寡核苷酸指导的方法。在含有野生型Dassa氨 基酸序列的编码基因的质粒的基础上,针对每个待置换的三联体,合成 了具有相应突变的两个互补引物,其中所述突变总是位于引物中间。通 过这两个引物对整个质粒进行了扩增。所获得的具有针对基因型M2的 突变的质粒被称为pET-PhyM2。

为了构建,使用了以下引物。

a)对于第139位的突变:

ccaactggataacgcccgggtgaccgacgccat  (SEQ ID NO:1)

atggcgtcggtcacccgggcgttatccagttgg  (SEQ ID NO:2)

b)对于随后在第142位插入的额外突变:

gcccgggtgaccgaggccatcctcagc    (SEQ ID NO:3)

gctgaggatggcctcggtcacccgggc    (SEQ ID NO:4)

质粒示于图1,并且已于2006年10月18日保藏,获取号为DSM 18715。

2.pAB490-PhyM2的构建

为了构建质粒pAB490-PhyM2,已通过PCR从质粒pET-PhyM2 对编码大肠杆菌肌醇六磷酸酶的PhyM2编码基因进行了扩增。PCR产 物由限制性内切酶SpeI和PacI进行了剪切,并且插入到质粒pAB490 中里氏木霉cbhlI基因片段之后的SpeI和PacI限制性酶切位点中。由 此形成了编码融合蛋白CBHII-Kexll-PhyM2的开放阅读框。

所获得的质粒被称为pAB490-PhyM2(图2),且已通过限制性内 切酶制作了图谱。该肌醇六磷酸酶序列已通过测序进行确认。

质粒pAB490的基础是pUC18,并且含有cbhII基因片段(核苷酸 1-307对应于氨基酸M1-S86,Teeri et al,1987,Gene 51:43-52,获取号 为16190),由来自质粒pALK487(WO 94/28117)的cbhI启动子和cbhI 终止子控制。质粒pALK424(WO 93/24621)的长度为4,78kb、含有 amdS遗传标记和3’cbhI侧翼序列的平头EcoRI/SpeI片段被插入至 cbhI终止子3’末端的StuI限制性位点。另外,还将其他限制性位点(SpeI 和PacI)插入到cbhII-基因片段的下游。这些限制性位点已被用于直接 克隆肌醇六磷酸酶变体。

自质粒pAB490-PhyM2分离的表达盒含有以下遗传物质:

cbhI(纤维二糖水解酶I)启动子:该含有cbhI启动子的2.2kb EcoRI/SacII片段来源于里氏木霉QM6a。该启动子区域(连同cbhI 3’ 片段;参见下文)还起同源DNA的作用,从而控制转化的DNA向cbhI 基因座中的引入。

cbhII基因片段:具有其信号序列的307bp cbhII基因片段直接由 cbhI启动子控制。

含有氨基酸突变N139R和D142E和V200Y的大肠杆菌肌醇六磷 酸酶序列借助于KexII限制性酶切位点被融合至cbhII基因片段的3’ 端。kex序列含有以下氨基酸:RTLVKR。

cbhI终止子:含有cbhI终止子的长度为0.75kb的BamHI/StuI片 段被添加至大肠杆菌肌醇六磷酸酶之后,目的是确保转录的终止。

amdS基因:该基因(包括其启动子和终止子)分离自构巢曲霉 (Aspergillus nidulans)VH1-TRSX6,编码乙酰胺酶(acetamidase) (Hynes et al.,1983,Mol.Cell.Biol.3:1430-1439;Kelly and Hynes,1985, EMBO J.4:475-479)。乙酰胺酶使得菌株能够通过使用作为唯一氮源的 乙酰胺来生长,并且这一特征已被用于筛选转化体。

cbhI 3’片段:该片段(1,7kb,BamHI/EcoRI,始于该基因终止密 码子之后的1.4kb处)分离自里氏木霉ALKO2466。菌株ALKO2466来 源于菌株ALKO233(Harkki et al.,1991,Enzyme Microb.Technol.13: 227-233)。该3’片段连同启动子区域一起用于经由同源重组将肌醇六磷 酸酶表达盒靶向整合至cbhI基因座。

质粒pAB490-PhyM2的序列通过采用限制性酶制作图谱以及测序 来确认。

实施例3-质粒pET-PhyM7和pAB490-PhyM7(基因型PhyM7)的构建

质粒pET-PhyM7含有通过使用里氏木霉的密码子用法 (http://www.kazusa.or.jp/codon)修饰并且具有额外突变K74D的大肠杆 菌肌醇六磷酸酶(Dassa et al.1990,获取号为M58740,具有V200Y) 序列。质粒pET-PhyM7的构建和克隆的实现与实施例2中所述的质粒 pET-PhyM2的产生相似。用于将突变引入第74位氨基酸的引物为:

cggactcctggctgacaagggatgcccgc  (SEQ ID NO:5)

gcgggcatcccttgtcagccaggagtccg  (SEQ ID NO:6)

已在2006年10月18日保藏了质粒pET-PhyM7,获取号为DSM 18716。

质粒pAB490-PhyM7的构建和克隆的实现类似于实施例2所述质 粒pAB490-PhyM2的产生。质粒pAB490-PhyM7的序列已经通过测序 确认。因而,分离自质粒pAB490-PhyM7的表达盒含有与实施例2所 述相同的单元,不同的是含有基因型PhyM7的新的特异性肌醇六磷酸 酶序列。

实施例4-质粒pUC-PhyM3和pAB489-PhyM3(基因型PhyM3)的构建

肌醇六磷酸酶变体PhyM3含有使用里氏木霉的密码子用法 (http://www.kazusa.or.jp/codon)且具有突变V200P的大肠杆菌肌醇六 磷酸酶(Dassa et al.1990,获取号为M58740)序列。在第1位具有CAG (Gln)密码子的DNA序列含有具有1230bp的开放阅读框,并编码具有 410个氨基酸的酶。黑曲霉肌醇六磷酸酶的长度为18个氨基酸的信号 肽被用于从里氏木霉分泌大肠杆菌的肌醇六磷酸酶突变体。

在含有编码野生型Dassa氨基酸序列的基因的质粒的基础之上,可 经由与Tomic et al.(1990,Nucleic Acids Research,18(6),1656)和 Vallette et al.(1989,Nucleic Acids Research,17(2),723-733)所述的原理 类似的PCR来实现突变V200P。PCR产物由AvrII和PacI剪切,并且 被插入质粒pAB489中的里氏木霉cbhI启动子之后的SpeI和PacI限 制性酶切位点内。在新获得的质粒pAB489-PhyM3中,大肠杆菌肌醇 六磷酸酶变体PhyM3的具有经改变的黑曲霉肌醇六磷酸酶信号序列 -MGVSAILLPLYLLSGVTS-(Mullaney et al.,Appl Microbiol Biotechnol,1991,35(5),611-614,获取号为M94550)的基因直接由 cbh1启动子控制。黑曲霉肌醇六磷酸酶的长度为18个氨基酸的信号肽 被用于自里氏木霉分泌大肠杆菌的肌醇六磷酸酶突变体。起始密码子上 游的属于里氏木霉启动子(Shoemaker et al.1983,Bio/Technology 1, 691-696)的16个碱基对(CCGCGGACTGCGCATC atg)在将 AvrII-PacI肌醇六磷酸酶片段引入质粒pAB489中的SpeI和PacI限制 性酶切位点内后变成CCGCGGACTAGGCATC atg。

已通过制作图谱和测序确认了构建体pAB489-PhyM3(图4)。

可通过如下步骤来实现质粒pAB489的构建:

通过将其他限制性酶切位点(SpeI和PacI, CCGCGGACTAGTCCTTAATTAACCGCGG)插入cbhI启动子和cbhI 终止子之间的SacII位置,可由质粒pALK487(WO94/28117)产生质 粒pAB487。SpeI-PacI限制性酶切位点用于直接克隆肌醇六磷酸酶变 体。质粒pALK424(WO 93/24621)的长度为4.78kb、含有amdS遗 传标记和3’侧翼的cbhI序列的平头EcoRI/SpeI片段被插入至pAB487 的StuI限制性酶切位点,由此获得了载体pAB489。

自pAB489-PhyM3分离的表达盒含有以下遗传物质:

cbhI(纤维二糖水解酶I)启动子:该含有cbhI启动子的2.2kb EcoRI/SacII片段来源于里氏木霉QM6a。该启动子区域(连同cbhI 3’ 片段;参见下文)还起同源DNA的作用,从而控制转化DNA在cbhI 基因座中的引入。

信号序列:黑曲霉肌醇六磷酸酶的经修饰的信号肽已被用于从里氏 木霉分泌大肠杆菌肌醇六磷酸酶。

具有突变V200P的大肠杆菌肌醇六磷酸酶序列(包含黑曲霉肌醇 六磷酸酶信号序列)已被插入cbhI启动子和cbhI终止子之间。

cbhI终止子:含有cbhI终止子的长度为0.75kb的BamHI/StuI片 段被添加到大肠杆菌肌醇六磷酸酶之后,其目的是确保转录的终止。

amdS基因:包括其启动子和终止子在内的基因分离自构巢曲霉 VH1-TRSX6,并编码乙酰胺酶(Hynes et al.,1983,Mol.Cell.Biol.3: 1430-1439;Kelly and Hynes,1985,EMBO J.4:475-479)。乙酰胺酶使 菌株能够通过使用作为唯一氮源的乙酰胺来生长,并且这一特征已被用 于筛选转化体。

cbhI 3’片段:该片段(1.7kb,BamHI/EcoRI,始于该基因终止密码 子之后的1.4kb处)分离自里氏木霉ALKO2466。菌株ALKO2466来源 于菌株ALKO233(Harkki et al.,1991,Enzyme Microb.Technol.13: 227-233)。该3’片段连同启动子区域一起用于通过同源重组将肌醇六磷 酸酶表达盒靶向整合至cbhI基因座。

已将肌醇六磷酸酶变体PhyM3Gen克隆至质粒pAB2004。所获得 的质粒被称为pUC-PhyM3(图3),并根据上述条件保藏,获取号为DSM 18717。

质粒pAB2004以质粒pUC18为基础,通过将其他限制性酶切位点 插入HindIII-EcoRI位点来产生。

实施例5-对质粒pUC-PhyM9和pAB489-PhyM9(基因型PhyM9)的构建

肌醇六磷酸酶变体PhyM9含有通过使用里氏木霉的密码子用法 (http://www.kazusa.or.jp/codon)的作为合成基因并具有突变L145I和 L198I的大肠杆菌肌醇六磷酸酶(Dassa et al.1990,获取号为M58740) 序列。在第一位具有CAG(Gln)密码子的DNA序列含有具有1230bp 的开放阅读框,并编码具有410个氨基酸的酶。

在质粒pAB489-PhyM9中,具有黑曲霉肌醇六磷酸酶信号序列 (MGVSAVLLPLYLLSGVTS)的编码大肠杆菌肌醇六磷酸酶变体 PhyM9(Mullaney et al.,Appl Microbiol Biotechnol,1991,35(5), 611-614,获取号为M94550)的基因直接由cbh1启动子控制。黑曲霉 肌醇六磷酸酶的长度为18个氨基酸的信号肽被用于从里氏木霉分泌大 肠杆菌的肌醇六磷酸酶突变体。

pAB489-PhyM9和pUC-PhyM9的构建可以以与实施例4中的质粒 pAB489-PhyM3和pUC-PhyM3的构建方法相似的方法实现,因此除黑 曲霉信号肽和特殊的大肠杆菌肌醇六磷酸酶序列之外,含有相同的遗传 单元。

质粒pUC-PhyM9保藏于2006年10月18日,获取号为DSM 18718。

实施例6-对编码多种突变体的质粒pUC-PhyM10和pAB600-PhyM10(基因型PhyM10)的构建

质粒pAB600-PhyM10含有具有氨基酸变化K74D、N139R、D142E 和V200P的大肠杆菌肌醇六磷酸酶序列。以类似于Tomic等人(1990, Nucleic Acids Research,18(6),1656)和Vallette等人(1989,Nucleic Acids Research,17(2),723-733)的原理通过PCR法从质粒 pAB490-PhyM2、pAB490-PhyM7和pAB489-PhyM3产生编码肌醇六 磷酸酶变体PhyM10的基因。PCR产物由SpeI和PacI切割,并被插 入质粒pAB600的SpeI和PacI限制性酶切位点。

已通过制作图谱和测序确认了所获得的质粒pAB600-PhyM10(图 6)。

在质粒pAB600-PhyM10中,大肠杆菌肌醇六磷酸酶序列已通过 kexII限制性酶切位点被融合至CBHII基因片段的3’末端。kex序列含 有如下氨基酸:RTLVKR。

质粒pAB600的构建通过如下步骤来实现:

质粒pAB1280以pUC18为基础,含有cbhII基因片段(核苷酸1-307 对应于氨基酸M1至S86,Teeri et al,1987,Gene 51:43-52,获取号为 16190),由来自质粒pALK487(WO 94/28117)的cbhI启动子和cbhI 终止子控制的。另外,还已将其他限制性酶切位点(SpeI和PacI)插 入cbhII基因片段的下游。这些限制性酶切位点被用于直接克隆肌醇六 磷酸酶变体。

已经通过PCR方法从质粒p3SR2(Hynes et al.,1983,Mol.Cell. Biol.3,1430-1439;Kelly and Hynes,1985,EMBO J.4,475-479)分离 出AscI-NruI片段形式的乙酰胺酶(amdS)基因,并将其插入至由 AscI/StuI切割的质粒pAB1280中。

对于amdS基因的扩增而言,以下引物得自构巢曲霉乙酰胺酶基因 的序列信息:

AmdS-AscI aggcgcgccctagtcatcattggataggcagattactcag  (SEQ ID NO:7)

AmdS-NruI ggaattctcgcgaaaggcaacaaccagctcacccctgag   (SEQ ID NO:8)

所获得的质粒被称为pAB600,并已通过制作图谱和测序确认。

已将肌醇六磷酸酶变体PhyM10的基因克隆至质粒pAB2004中。 质粒pUC-PhyM10示于图5,并与2006年10月18日保藏,获取号为 DSM 18719。

实施例7-质粒pPhy2005和pAB-Phy2005(基因型Phy2005)的构建

质粒pAB-Phy2005的构建可通过如下步骤来实现:

1.pPhy2005的构建

质粒pPhy2005含有黑曲霉变种泡盛黑曲霉的酸性磷酸酶(ap)基 因(Piddington et al.,1993,Gene 133(1),55-62;获取号为L02420)和 通过使用里氏木霉的密码子用法(http://www.kazusa.or.jp/codon)的大 肠杆菌肌醇六磷酸酶基因(Dassa et al.1990,获取号为M58740)的融 合物。由此获得了编码具有457个氨基酸的肌醇六磷酸酶变体的开放阅 读框,其中该大肠杆菌肌醇六磷酸酶基因的前四(4)个氨基酸由酸性磷酸 酶基因的前五十一(51)个氨基酸替代。为了在里氏木霉中分泌由酸性磷 酸酶和大肠杆菌肌醇六磷酸酶的融合物组成的蛋白,使用了该酸性磷酸 酶的信号序列。

合成了黑曲霉变种泡盛黑曲霉的酸性磷酸酶(ap)序列和通过使用 里氏木霉的密码子用法产生的大肠杆菌肌醇六磷酸酶序列的融合物,并 已将其克隆至质粒pUC18中。所获得的质粒pPhy2005通过测序确认。

该质粒示于图7,并于2006年10月18日保藏,获取号为DSM 18720。

2.pAB-Phy2005的构建

为构建质粒pAB-Phy2005,将来自质粒pPhy2005的磷酸酶-肌醇六 磷酸酶的融合物序列用AvrII和PacI限制性酶切,并将其插入至质粒 pAB489中的里氏木霉cbhI启动子之后的SpeI和PacI限制性酶切位 点。所获得的质粒被称为pAB-Phy2005(图8),并已通过限制性内切 酶制作图谱,并通过测序确认。

分离自pAB-Phy2005的表达盒含有如下遗传物质:

cbhI(纤维二糖水解酶I)启动子:该含有cbhI启动子的2.2kb EcoRI/SacII片段来源于里氏木霉QM6a。该启动子区域(连同cbhI 3’ 片段;参见下文)还起同源DNA的作用,从而控制转化的DNA向cbhI 基因座中的整合。

酸性磷酸酶基因片段:具有其信号序列的酸性磷酸酶基因片段直接 受控于cbhI启动子。起始密码子上游的属于里氏木霉启动子 (Shoemaker et al.1983,Bio/Technology 1,691-696)的16个碱基对 (CCGCGGACTGCGCATC atg)在掺入AvrII-PacI融合磷酸酶肌醇六磷 酸酶片段内后变成CCGCGGACTAGGCATC atg。

大肠杆菌肌醇六磷酸酶基因:合成的大肠杆菌肌醇六磷酸酶基因直 接融合至酸性磷酸酶序列3’末端形成一个开放阅读框。

cbhI终止子:含有cbhI终止子的长度为0.75kb的BamHI/StuI 片段被添加至大肠杆菌肌醇六磷酸酶之后,目的是确保转录的终止。

amdS基因:该基因(包括其启动子和终止子)分离自构巢曲霉 VH1-TRSX6,编码乙酰胺酶(Hynes et al.,1983,Mol.Cell.Biol.3: 1430-1439;Kelly and Hynes,1985,EMBO J.4:475-479)。乙酰胺酶使 得菌株能够通过使用乙酰胺作为唯一氮源来生长,并且这一特征已被用 于筛选转化体。

cbhI 3’片段:该片段(1.7kb,BamHI/EcoRI,始于该基因终止密 码子之后的1.4kb处)分离自里氏木霉ALKO2466。菌株ALKO2466来 源于菌株ALKO233(Harkki et al.,1991,Enzyme Microb.Technol.13: 227-233)。该3’片段连同启动子区域一起用于经由同源重组将肌醇六磷 酸酶表达盒靶向整合至cbhI基因座。

实施例8-质粒pPhy2006和pAB-Phy2006(基因型Phy2006)的构建

质粒pAB-Phy2006的构建已通过如下步骤实现:

1.pPhy2006的构建

为构建质粒pPhy2006,、将用于编码属于黑曲霉泡盛黑曲霉的酸性 磷酸酶ap-基因C端的29个氨基酸的长度为87bp的ap-基因片段直接 融合至质粒pPhy2005中编码大肠杆菌肌醇六磷酸酶的DNA序列的最 后一个氨基酸(亮氨酸)上。藉此,获得了具有486个氨基酸的开放阅 读框。

黑曲霉变种泡盛黑曲霉的酸性磷酸酶序列和通过里氏木霉的密码 子用法产生的大肠杆菌肌醇六磷酸酶序列的融合体Phy2006被合成,并 被克隆至质粒pUC18。包含在所获得质粒pPhy2006中的新序列通过测 序确认。

该质粒示于图9,并于2006年10月18日保藏,获取号为DSM 18721。

2.pAB-Phy2006的构建

质粒pAB-Phy2006的构建以及克隆与实施例7所述质粒 pAB-Phy2005的产生相同。

肌醇六磷酸酶变体pAB-Phy2006(图10)的序列已通过测序确认。

实施例9-里氏木霉的转化

里氏木霉RH 3780d已分别由分离自质粒pAB489-PhyM3、 pAB490-PhyM2、pAB490-PhyM7、pAB489-PhyM9、pAB600-PhyM10、 pAB-Phy2005和pAB-Phy2006的线化表达盒转化。用于转化和操纵里 氏木霉的技术是依据等人(1987,Gene 61:155-164)的那些技术。 已通过单孢子分离对转化体进行了两轮筛选和纯化。在所有转化体中选 出了分泌效能最高的转化体,并在实施例10中进一步用于产生酶物质。 所使用的转化体列于下表2。

表2:用于在实施例10-13中进行进一步实验的转化体列表

  基因型   转化体   Wt(pKDa4)   RH 31071   pKDa2(V200Y;M1)   RH 31068   PhyM2   RH 31575   PhyM3   RH 31545   PhyM7   RH 31507   PhyM9   RH 31686   PhyM10   RH 31898   Phy2005   RH 31676   Phy2006   RH 31677

实施例10-使用各突变体产生酶

A)通过在振荡培养瓶中发酵来产生酶溶液

携带实施例2-8的表达盒的转化体,或者具有源于DE 10 2004 050 410的质粒pKDa2(M1)和pKDa4(Dassa的野生型大肠杆菌肌醇六 磷酸酶的氨基酸序列)的转化体,在DASGIP公司的具有pH控制的振 荡培养瓶中培养,培养基为纤维素酶诱导的具有如下组成的培养基:乳 糖10.5%(w/v)、DSG 5.25%(w/v)、(NH4)2SO4 0.63%(w/v)、余量为自 来水,灭菌之前先将该培养基的pH值调为4.5。接种之后,5小时内振 荡培养瓶中的pH增加升高到pH为3.3。在pH值被控制为3.3的情况 下培养6天之后所获得的培养物滤液用于确定肌醇六磷酸酶的活性,并 用于通过差示扫描量热仪(DSC)分析热稳定性(实施例11)。

B)通过在30L生物反应器中发酵并在ProCell5中干燥来生产酶颗粒

将实施例10A)的转化体在30L生物反应器中于实施例10A中的 培养基中培养,pH值为pH 3.2±0.2,200至400upm,并且通气速率 为0.5vvm。6天发酵结束时,通过过滤分离生物量,并通过超滤(30kDa 的截留膜)将澄清的培养剩余物浓缩六倍。将浓缩物无菌过滤,然后用 于后续酶颗粒的生产。

通过在型号为ProCell5的喷雾制粒器(Firma Glatt Systemtechnik GmbH,Dresden,Germany)中干燥从而由UF浓缩物生产颗粒。为此, 将UF浓缩物的pH值调至pH 5.2,并且在干燥之前,加入乳糖含量为 30%的50%(w/w)脱脂奶粉和9.2%(w/w)的丙酸钙(两种成分均以UF 浓缩物的总蛋白含量为基准)。在80℃-90℃的进气温度下,通过气压从 1.2巴升至2.2巴的直径为1.2mm的二元喷嘴来干燥混合物。干燥时的 活性产率范围在89至99%内。由此生产的颗粒已被用于实施例12中 的测试。

实施例11-通过DSC确定温度稳定性

通过一个PD 10柱(Pharmacia),将实施例10A)的样本缓冲至100 mM乙酸钠缓冲液(pH 5.2)中。为此,使用1.5ml的样本,并依据生 产商的说明书由3.5ml的缓冲液进行洗脱。所有DSC测试均在VP-DSC 设备(MicroCal Inc.,Northampton,MA,USA)上进行,并将数据输入 PC中,其目的是通过软件Origin v7.0383(OriginLab Corp. Northampton,MA,USA)来进行评估。

测量之前,用ThermoVac2(MicroCal Inc.,Northampton,MA; USA)对样本脱气20分钟并使样本在水浴中于25℃回温。

测量可通过如下参数实现:

A)恒定设备参数

样品池体积:0.51231ml

参照热阻:1009.1欧

样品池热阻:1002.7欧

绝热率:0.88181

ΔT读数:3.676

B)VP-DSC扫描参数如下:

扫描速率(上行和下行):1℃ min-1

扫描循环之前的温度:25℃

循环之前的平衡时间:15min

循环之后的平衡时间:0min

过滤:10s

反馈:无

起始温度:25℃

结束温度:105℃

样品池压力:26.1至28.7psi

下表3给出了突变型大肠杆菌肌醇六磷酸酶(依据上述实施例产 生)、与之作比较的野生型大肠杆菌肌醇六磷酸酶(Dassa et al.,1990, 由与产生突变型大肠杆菌肌醇六磷酸酶变体相同的宿主系统产生)和具 有非本发明的突变(M1)的大肠杆菌肌醇六磷酸酶(同样由与产生本 发明突变型大肠杆菌肌醇六磷酸酶变体相同的宿主系统产生)的熔融温 度Tm(摄氏度)和熔融温度的偏移ΔT(摄氏度)。

表3:与野生型蛋白相比,大肠杆菌肌醇六磷酸酶突变体的熔融温 度Tm[℃]和熔融温度的偏移ΔT[℃],它们全都根据实施例10A在里 氏木霉中产生。

结果表明,本发明的任一突变体中蛋白的熔融温度升高,这表明熔 点温度的正偏移。熔点温度的升高等价于温度稳定性的增强。因此,双 突变M2的热稳定性得到最大程度增强,ΔT=+1.11℃。相反,在DE 10 2004 050 410中描述的用于增强分泌丰度的突变(V200Y=M1)表现出热 稳定性下降(ΔT=-0.63℃)。

N端或N端和C端的延长也表现出热稳定性得到增强,其数量级 与点突变M3的相同。

实施例12-粒化法中热稳定性的测量

依据实施例10B)生产的酶颗粒与550型小麦粉预先混合,其目的 是为了获得300g含有酶的预混料。在丹麦Kolding的食品和分子生物 技术研究所的生物技术所内,将该预混料与15kg动物饲料混合,其目 的是确保添加物在285kg的动物饲料中的最佳稀释度,以及可容易地 确定粒化物质中酶的活性。所使用的酶颗粒的量使在进行测试之前混合 物中的肌醇六磷酸酶活性为约3至6酶单位/克动物饲料。已在中试粒 化设备中处理的300kg动物饲料具有表4的组成。

表4:准备粒化的动物饲料的组成

组分   [%] 小麦   Ad 75 Hipro大豆48   20 大豆油   4.75 维生素/矿物质,Beta Avitren 90   0.25 酶预混料  300g

含有基因型为野生型、PhyM1、PhyM2、PhyM3、PhyM7、PhyM9、Phy2005 或Phy2006的肌醇六磷酸酶

粒化条件:

体积为700L、48upm的水平搅拌机。用于混合的量范围在80至 300kg/h。

与搅拌机连接的是用于清空搅拌机的水平输送螺杆,调整该输送螺 杆的速度使其适应后续步骤。

在水平搅拌机中混合之后,在长度为130cm、直径为30cm、155 upm并具有37个小室的Kahl阶式搅拌机(Conditioner)中进行热处 理。吞吐量为300kg/h。动物饲料和酶与饱和蒸气接触约30s,因而被 加热至70℃和95℃之间的温度。由Dan Stoker高压汽锅提供的蒸气以 2巴的超压流过阶式搅拌器中的压力调节阀。该阀调节流入阶式搅拌机 中并将动物饲料(包括酶)加热的蒸气量。

经处理的物质由Simon Heesen压力机粒化,之后在以1500m3h-1灌流的多孔盒中经空气冷却。粒化压力机以500upm运行,输入功率 为7.5kW,因而产得3×20mm的颗粒。

在阶式搅拌机中的处理致使对包含在粒化物质中的酶进行了热负 载。在产生颗粒之后,测定了粒化动物饲料中肌醇六磷酸酶活性回收率。 在下表5中,示出了粒化动物饲料中与处理期间温度相关的肌醇六磷酸 酶活性回收率。

表5:在70℃至95℃下处理并接着进行粒化之后动物饲料中肌醇 六磷酸酶活性回收率。所有的酶均使用里氏木霉进行重组表达。

结果表明,借助于DSC在液体测量时发现的热稳定性的改变也在 “干”粒化测试中发现。因此,相对于野生型酶,并非所有突变体的热 稳定性改善在整个测量的温度范围内是恒定不变的。M2已在DSC测试 中表现出最高的温度稳定性。同样在粒化测试中,最佳稳定性通过在分 离区域中由双突变M2实现,所述突变向大肠杆菌肌醇六磷酸酶的螺旋 D中插入离子键/桥。与在里氏木霉中表达的野生型酶相比,非本发明 的突变体M1表现出正如在DSC测试中示出的热稳定性下降。突变3, 其自身也并非依据本发明,表现出与野生型酶相似的热稳定性特征。只 有N端延长具有由黑曲霉变种泡盛黑曲霉的酸性磷酸酶的相应部分的 变体Phy2005在较高温度下不如既有N端延长又有C端延长的Phy2006 那样稳定。这可被认为提示了,这些延长可有助于大肠杆菌肌醇六磷酸 酶分子以与正常条件下酸性磷酸酶的二聚化相似的方式进行缔合,从而 增强热稳定性。

实施例13-体外法测量蛋白水解稳定性

为了测定蛋白水解的体外稳定性,使用了实施例10A)的酶样本, 即转化体M1(非本发明的突变)、M2、M3、M7、Phy2005和Phy2006 的样本,以及由表2转化体产生的样本。

将每毫升含有20个蛋白酶单位的20ml胃蛋白酶溶液(Merck 7190,溶于甘氨酸-HCL缓冲液,pH 2.5)——其中所述活性根据生产 商提供的说明书是指25℃时pH为1.6的血红蛋白的活性——在40℃加 热。加入10ml肌醇六磷酸酶溶液(1∶100稀释)并将该溶液用缓冲液 补足至50ml,之后在40℃,pH 2.5温育30分钟。通过浸入冰/水浴中 终止反应,随即用氢氧化钠溶液使pH值升至pH 5,随后将溶液稀释至 100ml。然后依据实施例1测量肌醇六磷酸酶的活性。

将已由胃蛋白酶处理的10ml溶液调至pH为7。加入含有30个蛋 白酶单位(酪蛋白,pH 8.0,35℃)的30ml胰酶制剂溶液(Merck 7130, 溶于0.05M Tris-HCl缓冲液(pH 7.0)),将该溶液用Tris-HCl缓冲液(pH 7)稀释至50ml,并在40℃水浴中温育30分钟。通过浸入冰/水浴中终 止反应,随即用HCl使pH值降至pH 5,随后将溶液稀释至100ml。 然后依据实施例1测量肌醇六磷酸酶的活性。结果示于表6。

表6.用胃蛋白酶接着用胰酶制剂处理酶突变体之后的活性回收率

  基因型   胃蛋白酶处理后的残留活   性[%]   胃蛋白酶和胰酶制剂处理   后的残留活性[%]   PhyM1   84   71   PhyM2   111   85   PhyM3   112   80   PhyM7   101   75   Phy2005   110   99   Phy2006   109   78

结果表明,在体外条件,如单胃动物例如猪的胃中的条件下,与参 照突变体PhyM1相比,本发明所有突变体在存在胃蛋白酶和胰蛋白酶 的情况下均表现出非常高的蛋白水解稳定性。在此表现出的高蛋白水解 稳定性表明酶突变体特别适用于动物饲料领域。

国际承认用于专利程序的微生物保存布达佩斯条约

                          国际表

AB Enzymes GmbH

Feldbergstr.78            原始保藏的情况下的收据

64293 Darmstadt           由本页底部说明的国际保藏单位

                          根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                               国际表

AB Enzymes GmbH

Feldbergstr.78                 存活证明

64293 Darmstadt                由下述国际保藏单位

                               根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        原始保藏的情况下的收据

64293 Darmstadt       由本页底部说明的国际保藏单位

                      根据规则第7条第1款发布

1如果应用规则6/4(d),这些数据的日期是国际保藏单位收到的日期

表DSMZ-BP/4(单页)08/2006

国际承认用于专利程序的微生物保存布达佩斯条约

                      国际表

AB Enzymes GmbH

Feldbergstr.78        存活证明

64293 Darmstadt       由下述国际保藏单位

                      根据规则第10条第2款公布

1表示所述原保藏的日期,如果已经进行新保藏或转移则表示最近的相关日期(所述新保藏或所述转 移的日期)。

2在规则第10条第2款(a)(ii)和(iii)的转移的情况,指的是最近的活力测试。

3如果适用以十字叉标记。

4如果测试结果为阴性,需要填写相关信息。

表DSMZ-BP/9(单页)08/2006

序列表

<110>AB酶有限公司

<120>具有肌醇六磷酸酶活性且该酶活性的温度稳定性增强的多肽及编码所述多肽的核苷酸序列

<130>16936DE

<160>22

<170>PatentIn version 3.1

<210>1

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>1

ccaactggat aacgcccggg tgaccgacgc cat                        33

<210>2

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>2

atggcgtcgg tcacccgggc gttatccagt tgg                        33

<210>3

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>3

gccaacgtga ccgaggccat cctcagc                              27

<210>4

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>4

gctgaggatg gcctcggtca cgttggc                              27

<210>5

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>5

cggactcctg gctgacaagg gatgcccgc                            29

<210>6

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>6

gcgggcatcc cttgtcagcc aggagtccg                            29

<210>7

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>7

aggcgcgccc tagtcatcat tggataggca gattactcag                         40

<210>8

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>8

ggaattctcg cgaaaggcaa caaccagctc acccctgag                          39

<210>9

<211>1230

<212>DNA

<213>人工序列

<220>

<223>DNA PhyM2

<220>

<221>CDS

<222>(1)..(1230)

<223>

<400>9

cag agc gag ccc gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc     48

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

cac ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc     96

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

acc cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act    144

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

cct cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag    192

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

cgt ctg gtt gcc gac gga ctc ctg gct aag aag gga tgc ccg cag tct    240

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

ggc cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc    288

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

ggc gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc    336

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

cac acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc    384

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

aag act ggc gtc tgc caa ctg gat aac gcc cgg gtg acc gag gcc atc    432

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Arg Val Thr Glu Ala Ile

    130                 135                 140

ctc agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag    480

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

acg gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac    528

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

ctg tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag    576

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

gca ctc ccg tcg gaa ctc aag tac agc gcc gac aac gtc tcc ctt acc    624

Ala Leu Pro Ser Glu Leu Lys Tyr Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

ggt gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag    672

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

caa gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct    720

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

cac cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg    768

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

ctc caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc    816

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

gac ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct    864

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

tac ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac    912

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

acc aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt     960

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

ccc gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa    1008

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

cgc tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg    1056

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

gtc ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc    1104

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

aat acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag    1152

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

cgc aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg    1200

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

aac gag gcc cgc atc ccc gct tgc tct ctg                            1230

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>10

<211>410

<212>PRT

<213>人工序列

<220>

<223>DNA PhyM2

<400>10

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Arg Val Thr Glu Ala Ile

    130                 135                 140

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

Ala Leu Pro Ser Glu Leu Lys Tyr Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>11

<211>1230

<212>DNA

<213>人工序列

<220>

<223>DNA PhyM3

<220>

<221>CDS

<222>(1)..(1230)

<223>

<400>11

cag agc gag ccc gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc     48

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

cac ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc     96

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

acc cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act    144

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

cct cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag    192

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

cgt ctg gtt gcc gac gga ctc ctg gct aag aag gga tgc ccg cag tct    240

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

ggc cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc    288

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

ggc gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc    336

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

cac acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc    384

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

aag act ggc gtc tgc caa ctg gat aac gcc aac gtg acc gac gcc atc    432

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

ctc agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag    480

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

acg gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac    528

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

ctg tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag    576

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

gca ctc ccg tcg gaa ctc aag ccc tcc gcg gac aac gtc tcc ctt acc    624

Ala Leu Pro Ser Glu Leu Lys Pro Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

ggt gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag    672

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

caa gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct    720

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

cac cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg    768

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

ctc caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc    816

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

gac ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct    864

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

tac ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac    912

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

acc aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt    960

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

ccc gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa   1008

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

cgc tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg   1056

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

gtc ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc   1104

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

aat acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag   1152

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

cgc aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg    1200

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

aac gag gcc cgc atc ccc gct tgc tct ctg                            1230

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>12

<211>410

<212>PRT

<213>人工序列

<220>

<223>DNA PhyM3

<400>12

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

Ala Leu Pro Ser Glu Leu Lys Pro Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>13

<211>1230

<212>DNA

<213>人工序列

<220>

<223>DNA PhyM7

<220>

<221>CDS

<222>(1)..(1230)

<223>

<400>13

cag agc gag ccc gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc     48

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

cac ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc     96

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

acc cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act    144

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

cct cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag    192

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

cgt ctg gtt gcc gac gga ctc ctg gct gac aag gga tgc ccg cag tct    240

Arg Leu Val Ala Asp Gly Leu Leu Ala Asp Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

ggc cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc    288

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

ggc gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc    336

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

cac acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc    384

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

aag act ggc gtc tgc caa ctg gat aac gcc aac gtg acc gac gcc atc    432

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

ctc agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag    480

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

acg gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac    528

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

ctg tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag    576

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

gca ctc ccg tcg gaa ctc aag tac agc gcc gac aac gtc tcc ctt acc    624

Ala Leu Pro Ser Glu Leu Lys Tyr Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

ggt gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag    672

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

caa gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct    720

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

cac cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg    768

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

ctc caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc    816

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

gac ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct    864

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

tac ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac    912

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

acc aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt    960

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

ccc gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa   1008

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

cgc tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg   1056

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

gtc ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc   1104

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

aat acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag   1152

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

cgc aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg   1200

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

aac gag gcc cgc atc ccc gct tgc tct ctg                           1230

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>14

<211>410

<212>PRT

<213>人工序列

<220>

<223>DNA PhyM7

<400>14

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

Arg Leu Val Ala Asp Gly Leu Leu Ala Asp Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

Ala Leu Pro Ser Glu Leu Lys Tyr Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>15

<211>1230

<212>DNA

<213>人工序列

<220>

<223>DNA PhyM9

<220>

<221>CDS

<222>(1)..(1230)

<223>

<400>15

cag agc gag ccc gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc     48

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

cac ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc     96

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

acc cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act    144

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

cct cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag    192

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

cgt ctg gtt gcc gac gga ctc ctg gct aag aag gga tgc ccg cag tct    240

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

ggc cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc    288

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

ggc gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc    336

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

cac acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc    384

His Thr Gln A1a Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

aag act ggc gtc tgc caa ctg gat aac gcc aac gtg acc gac gcc atc    432

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

atc tct aga gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag    480

Ile Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

acg gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac    528

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

ctg tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag    576

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

gca ctc ccg tcg gaa atc aag gtg tcc gcg gac aac gtc tcc ctt acc    624

Ala Leu Pro Ser Glu Ile Lys Val Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

ggt gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag    672

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

caa gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct    720

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

cac cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg    768

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

ctc caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc     816

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

gac ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct     864

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

tac ggt gtc acc ctc ccc act tcc gtc ttg ttt atc gcc ggt cac gac     912

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

acc aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt     960

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

ccc gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa    1008

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

cgc tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg    1056

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

gtc ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc    1104

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

aat acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag    1152

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

cgc aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg    1200

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

aac gag gcc cgc atc ccc gct tgc tct ctg                            1230

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>16

<211>410

<212>PRT

<213>人工序列

<220>

<223>DNA PhyM9

<400>16

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

Arg Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile

    130                 135                 140

Ile Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

Ala Leu Pro Ser Glu Ile Lys Val Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>17

<211>1230

<212>DNA

<213>人工序列

<220>

<223>DNA PhyM10

<220>

<221>CDS

<222>(1)..(1230)

<223>

<400>17

cag agc gag ccc gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc     48

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

cac ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc     96

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

acc cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act    144

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

cct cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag    192

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

cgt ctg gtt gcc gac gga ctc ctg gct gac aag gga tgc ccg cag tct    240

Arg Leu Val Ala Asp Gly Leu Leu Ala Asp Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

ggc cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc    288

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

ggc gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc    336

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

cac acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc    384

His Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu

        115                 120                 125

aag act ggc gtc tgc caa ctg gat aac gcc cgg gtg acc gag gcc atc    432

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Arg Val Thr Glu Ala Ile

    130                 135                 140

ctc agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag    480

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

acg gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac    528

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

ctg tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag    576

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

gca ctc ccg tcg gaa ctc aag ccc tcc gcg gac aac gtc tcc ctt acc    624

Ala Leu Pro Ser Glu Leu Lys Pro Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

ggt gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag    672

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

caa gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct    720

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

cac cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg    768

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

ctc caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc    816

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

gac ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct    864

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

tac ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac    912

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

acc aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt    960

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

ccc gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa   1008

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

cgc tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg    1056

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

gtc ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc    1104

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

aat acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag    1152

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

cgc aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg    1200

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

aac gag gcc cgc atc ccc gct tgc tct ctg                            1230

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>18

<211>410

<212>PRT

<213>人工序列

<220>

<223>DNA PhyM10

<400>18

Gln Ser Glu Pro Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg

1               5                   10                  15

His Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val

            20                  25                  30

Thr Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr

        35                  40                  45

Pro Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln

    50                  55                  60

Arg Leu Val Ala Asp Gly Leu Leu Ala Asp Lys Gly Cys Pro Gln Ser

65                  70                  75                  80

Gly Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr

                85                  90                  95

Gly Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val

            100                 105                 110

His Thr Gln Ala Asp Thr Ser Ser Pro Asp pro Leu Phe Asn Pro Leu

        115                 120                 125

Lys Thr Gly Val Cys Gln Leu Asp Asn Ala Arg Val Thr Glu Ala Ile

    130                 135                 140

Leu Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln

145                 150                 155                 160

Thr Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn

                165                 170                 175

Leu Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln

            180                 185                 190

Ala Leu Pro Ser Glu Leu Lys Pro Ser Ala Asp Asn Val Ser Leu Thr

        195                 200                 205

Gly Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln

    210                 215                 220

Gln Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser

225                 230                 235                 240

His Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu

                245                 250                 255

Leu Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu

            260                 265                 270

Asp Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala

        275                 280                 285

Tyr Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp

    290                 295                 300

Thr Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu

305                 310                 315                 320

Pro Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu

                325                 330                 335

Arg Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu

            340                 345                 350

Val Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu

        355                 360                 365

Asn Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu

    370                 375                 380

Arg Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val

385                 390                 395                 400

Asn Glu Ala Arg Ile Pro Ala Cys Ser Leu

                405                 410

<210>19

<211>1371

<212>DNA

<213>人工序列

<220>

<223>DNA Phy2005

<220>

<221>CDS

<222>(1)..(1371)

<223>

<400>19

ttc tcc tac ggc gct gcc att cct cag tca acc cag gag aag cag ttc     48

Phe Ser Tyr Gly Ala Ala Ile Pro Gln Ser Thr Gln Glu Lys Gln Phe

1               5                   10                  15

tct cag gag ttc cgc gat ggc tac agc atc ctc aag cac tac ggt ggt     96

Ser Gln Glu Phe Arg Asp Gly Tyr Ser Ile Leu Lys His Tyr Gly Gly

            20                  25                  30

aac gga ccc tac tcc gag cgt gtg tcc tac ggt atc gcc cgc gat ccc    144

Asn Gly Pro Tyr Ser Glu Arg Val Ser Tyr Gly Ile Ala Arg Asp Pro

        35                  40                  45

ccg act agt gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc cac    192

Pro Thr Ser Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg His

    50                  55                  60

ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc acc    240

Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val Thr

65                  70                  75                  80

cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act cct    288

Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr Pro

                85                  90                  95

cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag cgt    336

Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln Arg

            100                 105                 110

ctg gtt gcc gac gga ctc ctg gct aag aag gga tgc ccg cag tct ggc    384

Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser Gly

        115                 120                 125

cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc ggc    432

Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr Gly

    130                 135                 140

gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc cac    480

Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val His

145                 150                 155                 160

acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc aag    528

Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu Lys

                165                 170                 175

act ggc gtc tgc caa ctg gat aac gcc aac gtg acc gac gcc atc ctc    576

Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile Leu

            180                 185                 190

agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag acg    624

Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln Thr

        195                 200                 205

gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac ctg    672

Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn Leu

    210                 215                 220

tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag gca    720

Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln Ala

225                 230                 235                 240

ctc ccg tcg gaa ctc aag gtg agc gcc gac aac gtc tcc ctt acc ggt    768

Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr Gly

                245                 250                 255

gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag caa    816

Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln Gln

            260                 265                 270

gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct cac    864

Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser His

        275                 280                 285

cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg ctc    912

Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu Leu

    290                 295                 300

caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc gac    960

Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu Asp

305                 310                 315                 320

ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct tac   1008

Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala Tyr

                325                 330                 335

ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac acc   1056

Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp Thr

            340                 345                 350

aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt ccc   1104

Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu Pro

        355                 360                 365

gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa cgc   1152

Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu Arg

    370                 375                 380

tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg gtc   1200

Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu Val

385                 390                 395                 400

ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc aat    1248

Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu Asn

                405                 410                 415

acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag cgc    1296

Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu Arg

            420                 425                 430

aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg aac    1344

Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val Asn

        435                 440                 445

gag gcc cgc atc ccc gct tgc tct ctg                                1371

Glu Ala Arg Ile Pro Ala Cys Ser Leu

    450                 455

<210>20

<211>457

<212>PRT

<213>人工序列

<220>

<223>DNA Phy2005

<400>20

Phe Ser Tyr Gly Ala Ala Ile Pro Gln Ser Thr Gln Glu Lys Gln Phe

1               5                   10                  15

Ser Gln Glu Phe Arg Asp Gly Tyr Ser Ile Leu Lys His Tyr Gly Gly

            20                  25                  30

Asn Gly Pro Tyr Ser Glu Arg Val Ser Tyr Gly Ile Ala Arg Asp Pro

        35                  40                  45

Pro Thr Ser Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg His

    50                  55                  60

Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val Thr

65                  70                  75                  80

Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr Pro

                85                  90                  95

Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln Arg

            100                 105                 110

Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser Gly

        115                 120                 125

Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr Gly

    130                 135                 140

Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val His

145                 150                 155                 160

Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu Lys

                165                 170                 175

Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile Leu

            180                 185                 190

Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln Thr

        195                 200                 205

Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn Leu

    210                 215                 220

Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln Ala

225                 230                 235                 240

Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr Gly

                245                 250                 255

Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln Gln

            260                 265                 270

Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser His

        275                 280                 285

Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu Leu

    290                 295                 300

Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu Asp

305                 310                 315                 320

Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala Tyr

                325                 330                 335

Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp Thr

            340                 345                 350

Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu Pro

        355                 360                 365

Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu Arg

    370                 375                 380

Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu Val

385                 390                 395                 400

Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu Asn

                405                 410                 415

Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu Arg

            420                 425                 430

Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val Asn

        435                 440                 445

Glu Ala Arg Ile Pro Ala Cys Ser Leu

    450                 455

<210>21

<211>1458

<212>DNA

<213>人工序列

<220>

<223>DNA Phy2006

<220>

<221>CDS

<222>(1)..(1458)

<223>

<400>21

ttc tcc tac ggc gct gcc att cct cag tca acc cag gag aag cag ttc     48

Phe Ser Tyr Gly Ala Ala Ile Pro Gln Ser Thr Gln Glu Lys Gln Phe

1               5                   10                  15

tct cag gag ttc cgc gat ggc tac agc atc ctc aag cac tac ggt ggt     96

Ser Gln Glu Phe Arg Asp Gly Tyr Ser Ile Leu Lys His Tyr Gly Gly

            20                  25                  30

aac gga ccc tac tcc gag cgt gtg tcc tac ggt atc gcc cgc gat ccc    144

Asn Gly Pro Tyr Ser Glu Arg Val Ser Tyr Gly Ile Ala Arg Asp Pro

        35                  40                  45

ccg act agt gag ctg aag ctg gag tcg gtc gtg atc gtc agc cgc cac    192

Pro Thr Ser Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg His

    50                  55                  60

ggc gtg cgt gct cct acc aag gcc acg cag ctg atg cag gac gtc acc    240

Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val Thr

65                  70                  75                  80

cct gac gcc tgg ccc acc tgg ccc gtc aag ctt ggc tgg ctg act cct    288

Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr Pro

                85                  90                  95

cgc ggc ggt gag ctc atc gcc tac ctc gga cac tac caa cgc cag cgt    336

Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln Arg

            100                 105                 110

ctg gtt gcc gac gga ctc ctg gct aag aag gga tgc ccg cag tct ggc    384

Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser Gly

        115                 120                 125

cag gtc gcg att atc gcc gat gtc gac gag cgt acc cgt aag acc ggc    432

Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr Gly

    130                 135                 140

gaa gcc ttc gct gcc ggc ctc gct cct gac tgt gcc atc acg gtc cac    480

Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val His

145                 150                 155                 160

acc cag gca gac acg tcc agc ccc gat ccg ctg ttt aac cct ctc aag    528

Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu Lys

                165                 170                 175

act ggc gtc tgc caa ctg gat aac gcc aac gtg acc gac gcc atc ctc    576

Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile Leu

            180                 185                 190

agc agg gct gga ggt tcc atc gcc gac ttc acc ggc cat cgg cag acg    624

Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln Thr

        195                 200                 205

gcg ttc cgc gag ctg gag cgg gtc ctt aat ttt ccc cag tcg aac ctg    672

Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn Leu

    210                 215                 220

tgc ctc aag cgt gag aag cag gac gag agc tgt tcc ctg acc cag gca    720

Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln Ala

225                 230                 235                 240

ctc ccg tcg gaa ctc aag gtg agc gcc gac aac gtc tcc ctt acc ggt    768

Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr Gly

                245                 250                 255

gcc gtt agc ctc gct tcc atg ctg acg gag atc ttc ctc ctg cag caa    816

Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln Gln

            260                 265                 270

gcg cag gga atg ccc gag cct ggg tgg ggc cgc att acc gat tct cac    864

Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser His

        275                 280                 285

cag tgg aac acc ctg ctc tcg ctt cac aac gcc cag ttc tat ctg ctc    912

Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu Leu

    290                 295                 300

caa cgc acg ccc gag gtt gcc cgc agc cgc gcc acc ccg ctg ctc gac    960

Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu Asp

305                 310                 315                 320

ctc atc aag act gcg ctg acg ccc cac cct ccg cag aag cag gct tac   1008

Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala Tyr

                325                 330                 335

ggt gtc acc ctc ccc act tcc gtc ctg ttt atc gcc ggt cac gac acc   1056

Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp Thr

            340                 345                 350

aac ctg gcc aat ctc ggc ggc gct ctg gag ctc aac tgg acg ctt ccc   1104

Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu Pro

        355                 360                 365

gga cag ccg gat aac act ccc cct ggc ggt gag ctg gtg ttc gaa cgc   1152

Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu Arg

    370                 375                 380

tgg cgt cgg ctc agc gac aac tcc cag tgg att cag gtt tcg ctg gtc    1200

Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu Val

385                 390                 395                 400

ttc cag acc ctg cag cag atg cgc gac aaa acg ccc ctg tcc ctc aat    1248

Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu Asn

                405                 410                 415

acc cct ccc ggc gag gtc aag ctg acc ctg gca ggc tgt gaa gag cgc    1296

Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu Arg

            420                 425                 430

aac gcc cag ggc atg tgc tct ctc gct ggc ttt acg caa atc gtg aac    1344

Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val Asn

        435                 440                 445

gag gcc cgg atc ccc gct tgc tct ctg ttg agc ttc tgg tgg aac tac    1392

Glu Ala Arg Ile Pro Ala Cys Ser Leu Leu Ser Phe Trp Trp Asn Tyr

    450                 455                 460

aac acc acg acg gag ctg aac tac cgc tct agc cct att gcc tgc cag    1440

Asn Thr Thr Thr Glu Leu Asn Tyr Arg Ser Ser Pro Ile Ala Cys Gln

465                 470                 475                 480

gag ggt gat gct atg gac                                            1458

Glu Gly Asp Ala Met Asp

                485

<210>22

<211>486

<212>PRT

<213>人工序列

<220>

<223>DNA Phy2006

<400>22

Phe Ser Tyr Gly Ala Ala Ile Pro Gln Ser Thr Gln Glu Lys Gln Phe

1               5                   10                  15

Ser Gln Glu Phe Arg Asp Gly Tyr Ser Ile Leu Lys His Tyr Gly Gly

            20                  25                  30

Asn Gly Pro Tyr Ser Glu Arg Val Ser Tyr Gly Ile Ala Arg Asp Pro

        35                  40                  45

Pro Thr Ser Glu Leu Lys Leu Glu Ser Val Val Ile Val Ser Arg His

    50                  55                  60

Gly Val Arg Ala Pro Thr Lys Ala Thr Gln Leu Met Gln Asp Val Thr

65                  70                  75                  80

Pro Asp Ala Trp Pro Thr Trp Pro Val Lys Leu Gly Trp Leu Thr Pro

                85                  90                  95

Arg Gly Gly Glu Leu Ile Ala Tyr Leu Gly His Tyr Gln Arg Gln Arg

            100                 105                 110

Leu Val Ala Asp Gly Leu Leu Ala Lys Lys Gly Cys Pro Gln Ser Gly

        115                 120                 125

Gln Val Ala Ile Ile Ala Asp Val Asp Glu Arg Thr Arg Lys Thr Gly

    130                 135                 140

Glu Ala Phe Ala Ala Gly Leu Ala Pro Asp Cys Ala Ile Thr Val His

145                 150                 155                 160

Thr Gln Ala Asp Thr Ser Ser Pro Asp Pro Leu Phe Asn Pro Leu Lys

                165                 170                 175

Thr Gly Val Cys Gln Leu Asp Asn Ala Asn Val Thr Asp Ala Ile Leu

            180                 185                 190

Ser Arg Ala Gly Gly Ser Ile Ala Asp Phe Thr Gly His Arg Gln Thr

        195                 200                 205

Ala Phe Arg Glu Leu Glu Arg Val Leu Asn Phe Pro Gln Ser Asn Leu

    210                 215                 220

Cys Leu Lys Arg Glu Lys Gln Asp Glu Ser Cys Ser Leu Thr Gln Ala

225                 230                 235                 240

Leu Pro Ser Glu Leu Lys Val Ser Ala Asp Asn Val Ser Leu Thr Gly

                245                 250                 255

Ala Val Ser Leu Ala Ser Met Leu Thr Glu Ile Phe Leu Leu Gln Gln

            260                 265                 270

Ala Gln Gly Met Pro Glu Pro Gly Trp Gly Arg Ile Thr Asp Ser His

        275                 280                 285

Gln Trp Asn Thr Leu Leu Ser Leu His Asn Ala Gln Phe Tyr Leu Leu

    290                 295                 300

Gln Arg Thr Pro Glu Val Ala Arg Ser Arg Ala Thr Pro Leu Leu Asp

305                 310                 315                 320

Leu Ile Lys Thr Ala Leu Thr Pro His Pro Pro Gln Lys Gln Ala Tyr

                325                 330                 335

Gly Val Thr Leu Pro Thr Ser Val Leu Phe Ile Ala Gly His Asp Thr

            340                 345                 350

Asn Leu Ala Asn Leu Gly Gly Ala Leu Glu Leu Asn Trp Thr Leu Pro

        355                 360                 365

Gly Gln Pro Asp Asn Thr Pro Pro Gly Gly Glu Leu Val Phe Glu Arg

    370                 375                 380

Trp Arg Arg Leu Ser Asp Asn Ser Gln Trp Ile Gln Val Ser Leu Val

385                 390                 395                 400

Phe Gln Thr Leu Gln Gln Met Arg Asp Lys Thr Pro Leu Ser Leu Asn

                405                 410                 415

Thr Pro Pro Gly Glu Val Lys Leu Thr Leu Ala Gly Cys Glu Glu Arg

            420                 425                 430

Asn Ala Gln Gly Met Cys Ser Leu Ala Gly Phe Thr Gln Ile Val Asn

        435                 440                 445

Glu Ala Arg Ile Pro Ala Cys Ser Leu Leu Ser Phe Trp Trp Asn Tyr

    450                 455                 460

Asn Thr Thr Thr Glu Leu Asn Tyr Arg Ser Ser Pro Ile Ala Cys Gln

465                 470                 475                 480

Glu Gly Asp Ala Met Asp

                485

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号