首页> 中国专利> 芳香烃受体蛋白稳定高效表达的方法及其应用

芳香烃受体蛋白稳定高效表达的方法及其应用

摘要

本发明属于基因工程技术领域,涉及重组蛋白的生产方法和用途,具体为一种芳香烃受体蛋白稳定高效表达的方法及其应用。在芳香烃受体蛋白(AhR)表达中利用分子伴侣辅助AhR蛋白共同表达,即可实现AhR稳定高效表达。该方法制备得到的AhR蛋白性质均一,稳定性好,具有结合污染物小分子的活性,可用于开发成为环境污染物检测的各种设备等用途。

著录项

  • 公开/公告号CN114957488A

    专利类型发明专利

  • 公开/公告日2022-08-30

    原文格式PDF

  • 申请/专利权人 中国科学院生物物理研究所;

    申请/专利号CN202210573159.7

  • 发明设计人 翟宇佳;温作令;孙飞;朱赟;

    申请日2022-05-19

  • 分类号C07K19/00(2006.01);C12N15/85(2006.01);C12N5/10(2006.01);G01N33/53(2006.01);G01N33/68(2006.01);

  • 代理机构北京中强智尚知识产权代理有限公司 11448;

  • 代理人黄耀威

  • 地址 100101 北京市朝阳区大屯路15号

  • 入库时间 2023-06-19 16:33:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-16

    实质审查的生效 IPC(主分类):C07K19/00 专利申请号:2022105731597 申请日:20220519

    实质审查的生效

说明书

技术领域

本发明属于基因工程技术领域,涉及重组蛋白的生产方法和用途,具体为一种芳香烃受体蛋白稳定高效表达的方法及其应用。

背景技术

二恶英类化学物是一类毒性作用广泛,难以降解的物质,并且在环境中广泛存在,对人体危害很大。其中最典型的二恶英类污染物是2,3,7,8四氯二苯并二恶英(TCDD)。二恶英的高灵敏度检测对于我国环境保护和人体健康保护都有重要意义,尤其在国际贸易日益频繁的趋势下,可以减少外来货物携带二恶英的危害。传统二恶英检测方法主要是色谱和质谱技术,但是存在明显缺陷,例如检测费用昂贵,精度低,难度大等。近年来逐渐发展起来的生物芯片检测方法能够很好的弥补这些缺点,但是生物芯片中的核心组分——特异性结合二恶英类物质的蛋白质分子——却很难获得。其最佳的候选蛋白是芳香烃受体(Arylhydrocarbon receptor,AhR)蛋白,是生物体中天然结合二恶英类物质的蛋白质。因此,研究一种能够稳定制备芳香烃受体的工艺方法对于我国环境污染物的检测具有重要的意义。

AhR蛋白属于PER-ARNT-SIM(PAS)家族蛋白,是一类转录因子,介导了细胞对很多细胞代谢物和环境污染物的响应,与细胞毒性,血管发育,免疫发育等有着密切关系,是二恶英在生物体中唯一的响应分子。AhR在细胞胞质中,与分子伴侣等结合形成静息态复合物。当底物分子(如二恶英等)进入细胞后,AhR可以特异性结合底物,暴露出核定位信号,随后转移到细胞核内,与核转运蛋白ARNT形成激活态复合物,进而调节下游响应基因的表达。长久以来,AhR作为明星分子得到了广泛的研究,但是多数研究发现AhR的受体结构域(PAS-B)很难通过重组表达纯化获得稳定的蛋白产物,包含这段区域的蛋白原子结构也一直没有得到解析。最近,有一些研究组通过原核表达得到全长的AhR蛋白或者包含结合底物区域的AhR截短体蛋白(S.Uemura et al.,2020,J.Biochem;A.Stinn et al.,2021,Biosensors)。但是,这些研究要么是通过特殊的宿主细胞制备得到少量的AhR蛋白,要么是制备AhR结合ARNT蛋白的激活态复合体,都没有制备得到大量表达的稳定状态下的AhR静息态蛋白,无法用于生物芯片的用途。

发明内容

本发明目的在于提供一种芳香烃受体蛋白稳定高效表达的方法及其应用。

为实现上述目的,本发明采用技术方案为:

一种芳香烃受体蛋白稳定高效表达的方法,在芳香烃受体蛋白(AhR)表达中利用分子伴侣辅助AhR蛋白共同表达,即可实现AhR稳定高效表达;其中,芳香烃受体蛋白(AhR)与分子伴侣之间的质量比为1:1。

所述AhR蛋白为包含PAS-B结构域的氨基酸序列。

所述AhR蛋白为人源AhR或鼠源AhR。

所述分子伴侣为人源或鼠源的Hsp90,XAP2,p23中的一种或几种。

上述记载的AhR蛋白的序列选择。不同物种来源的AhR蛋白具有类似的结构域组成,从N端到C端分别包括bHLH结构域、PAS-A结构域,PAS-B结构域和TAD转录激活结构域。其中,PAS-B结构域是结合污染物小分子的功能区,因此重组表达的蛋白产物中必须包含PAS-B结构域。而其它的功能区可以根据目的的不同有所调整。比如bHLH/PAS-A/PAS-B的截短体(见实施例1),PAS-A/PAS-B的截短体,PAS-B/TAD的截短体,等等。而不同物种的AhR蛋白分子具有类似的功能和较高的序列同源性,可以根据具体的使用场景和使用需求选择不同物种来源的AhR蛋白序列,比如人源AhR(seq ID No.1),鼠源AhR(seq ID No.2,见实施例1)、牛源AhR等等。

同时,分子伴侣蛋白选择。生物体中的AhR蛋白能与多种分子伴侣结合形成稳定的静息态复合体结构,包括Hsp90,XAP2和p23等。其中,申请人发现Hsp90蛋白对于AhR的表达效率和蛋白稳定性具有最重要的辅助作用。不同物种来源的Hsp90蛋白具有类似的序列和结构,可以根据具体的使用场景和使用需求选择不同物种来源的Hsp90蛋白,比如人源Hsp90,鼠源Hsp90(seq ID No.3,见实施例1),牛源Hsp90等。

进一步的所述的芳香烃受体AhR蛋白为SEQ ID No.1、SEQ ID No.2的任一个所示的氨基酸序列,或前述任一个氨基酸序列中取代、添加、或缺失了1或多个氨基酸残基的氨基酸序列,或者与SEQ ID No.1、SEQ ID No.2的任一个所示的氨基酸序列具有80%以上序列同一性的序列;或SEQ ID No.1、SEQ ID No.2分别进一步优化的氨基酸序列,其中所述AhR蛋白具有结合污染物小分子的活性。

所述的分子伴侣,其可以选择不同物种来源的不同种类分子伴侣蛋白。优选的,所述分子伴侣包括Hsp90(SEQ ID No.3),XPA2(SEQ ID No.4),P23(SEQ ID No.5)等,包括SEQID No.3,SEQ ID No.4和SEQ ID No.5的任一个所示的氨基酸序列,或前述任一个氨基酸序列中取代、添加、或缺失了1或多个氨基酸的氨基酸序列,或者与SEQ ID No.3,SEQ ID No.4和SEQ ID No.5的任一个所示的氨基酸序列具有80%以上序列同一性的序列,或SEQ IDNo.3,SEQ ID No.4、SEQ ID No.5分别进一步优化的氨基酸序列。

所述芳香烃受体蛋白进一步优选包含SEQ ID No.6、SEQ ID No.7、SEQ ID No.8、SEQ ID No.9、或SEQ ID No.10所示的核苷酸序列。

芳香烃受体蛋白稳定高效表达的方法,所述将分子伴侣与AhR蛋白共同构建到同一载体上共同表达;或,将分子伴侣与AhR蛋白分别构建到相同的载体上,而后共转染宿主细胞进行共同表达;或,在表达体系中加入纯化的分子伴侣蛋白和AhR蛋白进行共表达。

一种稳定高效表达的芳香烃受体蛋白,按所述的方法获得稳定高效表达的芳香烃受体蛋白。

一种所述方法稳定高效表达的芳香烃受体蛋白的应用,上述所述的方法获得稳定高效表达的芳香烃受体蛋白在检测污染物中的应用。

一种检测污染物二恶英类化学物质的表达载体,所述载体含上述所述方法获得稳定高效表达的芳香烃受体蛋白。

所述将分子伴侣与AhR蛋白分别或共同构建到相同的载体上共同表达,其中,载体为pFastBac-Dual载体,pETDuet-1载体,pBudCE4.1载体。

一种检测污染物二恶英类化学物质的宿主细胞,所述宿主细胞含上述所述方法获得稳定高效表达的芳香烃受体蛋白。

所述宿主细胞为昆虫细胞、大肠杆菌或酵母菌。

上述检测二恶英类化学物质的蛋白可以制备成药物组合物、医疗器材、生物芯片产品、组织工程产品、化妆品或保健品,检测用品等。

与现有技术相比,本发明具有以下特点:

本发明利用特定分子伴侣Hsp90辅助AhR蛋白使其稳定高效表达,利用所得蛋白具有特异性结合污染物小分子的活性,用于环境污染物的检测,本发明生产工艺简单,易于推广,对于开发成为环境污染物检测的各种设备具有广泛应的应用前景;具体为:

(1)本发明首次通过优选分子伴侣辅助实现AhR蛋白受体结合区的稳定高效表达。

(2)本发明制备的AhR蛋白复合体处于静息态,实验证实其可以识别结合污染物小分子,具有生物活性。

(3)本发明制备工艺简单,蛋白性质良好,在环境污染物检测等方面有广泛的应用前景。

附图说明

图1为利用本发明纯化得到的AhR蛋白与分子伴侣结合复合体的SDS-PAGE电泳图,Hsp90,XAP2和p23分子伴侣与AhR稳定结合并一同纯化得到。

图2为利用本发明纯化得到的AhR蛋白复合体Native-Page电泳图,显示出分子伴侣与AhR蛋白稳定结合成为均一的蛋白复合体。

图3为利用本发明纯化得到的AhR蛋白复合体在分子排阻色谱检测中呈现单一主峰,显示出分子伴侣与AhR蛋白稳定结合成为均一的蛋白复合体。

图4为利用本发明纯化得到的AhR蛋白复合体的肽指纹图谱检测结果。红色表示MALDI质谱检测到的肽段,序列为AhR目的蛋白的理论序列,证明蛋白复合体中存在AhR目的蛋白,尤其是包含PAS-B结构域。

图5为利用Orbitrap质谱分析本发明纯化得到的AhR蛋白复合体中的蛋白组成,显示出复合体中存在AhR,Hsp90,XAP2和P23等组分。

图6为利用微量热泳动MST分析本发明纯化得到的AhR蛋白复合体结合污染物小分子TCDD的检测结果。显示出复合体中的AhR蛋白可以高效结合TCDD小分子。

图7为冻存细胞图。

具体实施方式

提供以下实施例来阐述本发明。本领域技术人员应当理解实施例仅仅是例示性的而非限制性的。本发明仅仅由所附权利要求书的范围限定。

同时下文提供进一步的描述以便于理解本发明。

本发明针对AhR蛋白单独表达容易形成包涵体的问题,通过在表达体系中加入合适的分子伴侣蛋白(如Hsp90),可以实现可溶性稳定表达AhR蛋白的目的。其中,AhR蛋白可以选择不同物种来源的包含PAS-B结构域的氨基酸序列,分子伴侣可以选择不同物种来源的Hsp90蛋白,XAP2蛋白和P23蛋白等氨基酸序列。该方法制备得到的AhR蛋白性质均一,稳定性好,具有结合污染物小分子的活性,可用于开发成为环境污染物检测的各种设备等用途。

在本发明中,所选的AhR蛋白可以来源于多种物种,因为不同物种来源的AhR蛋白都包含有结合污染物小分子的PAS-B结构域,都可以发挥类似的功能。例如,对于人AhR蛋白的序列,参考Uniprot数据库中的序列(

上述序列中粗体下划线部分即为本发明选择的氨基酸序列(SEQ ID No.1),包含PAS-B受体结合区,命名为hAhR-1序列。其对应的根据昆虫表达系统优化的DNA序列为SEQID No.6。

对于鼠AhR蛋白的序列,参考Uniprot数据库中的序列(

上述序列中粗体下划线部分即为本发明选择的氨基酸序列(SEQ ID No.2),包含PAS-B受体结合区,命名为mAhR-1序列。其对应的根据昆虫表达系统优化的DNA序列为SEQID No.7。

在本发明中,所选的分子伴侣可以为来源于不同物种不同种类的分子伴侣,都可以帮助AhR可溶性表达,包括Hsp90,XAP2和p23等。其中,本申请选用Hsp90蛋白,同时不同物种的Hsp90蛋白,其结构和功能基本相同,都可以起到类似的效果。

下述实施例1中选用的是鼠源AhR蛋白序列,参考Uniprot数据库中的序列(

MPEEVHHGEEEVETFAFQAEIAQLMSLIINTFYSNKEIFLRELISNASDALDKIRYESLTDPSKLDSGKELKIDIIPNPQERTLTLVDTGIGMTKADLINNLGTIAKSGTKAFMEALQAGADISMIGQFGVGFYSAYLVAEKVVVITKHNDDEQYAWESSAGGSFTVRADHGEPIGRGTKVILHLKEDQTEYLEERRVKEVVKKHSQFIGYPITLYLEKEREKEISDDEAEEEKGEKEEEDKEDEEKPKIEDVGSDEEDDSGKDKKKKTKKIKEKYIDQEELNKTKPIWTRNPDDITQEEYGEFYKSLTNDWEDHLAVKHFSVEGQLEFRALLFIPRRAPFDLFENKKKKNNIKLYVRRVFIMDSCDELIPEYLNFIRGVVDSEDLPLNISREMLQQSKILKVIRKNIVKKCLELFSELAEDKENYKKFYEAFSKNLKLGIHEDSTNRRRLSELLRYHTSQSGDEMTSLSEYVSRMKETQKSIYYITGESKEQVANSAFVERVRKRGFEVVYMTEPIDEYCVQQLKEFDGKSLVSVTKEGLELPEDEEEKKKMEESKAKFENLCKLMKEILDKKVEKVTISNRLVSSPCCIVTSTYGWTANMERIMKAQALRDNSTMGYMMAKKHLEINPDHPIVETLRQKAEADKNDKAVKDLVVLLFETALLSSGFSLEDPQTHSNRIYRMIKLGLGIDEDEVTAEEPSAAVPDEIPPLEGDEDASRMEEVD

上述序列即为本发明选择的氨基酸序列(SEQ ID No.3),命名为mHsp90,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.8。

此外,不同物种来源的XAP2和P23也对AhR的重组表达有辅助作用。例如,实施例1中选用的是鼠源的XAP2蛋白,参考Uniprot数据库中的序列(

MADLIARLREDGIQKRVIQEGRGELPDFQDGTKATFHFRTLHSDNEGSVIDDSRTRGKPMELIVGKKFKLPVWETIVCTMREGEIAQFLCDIKHVVLYPLVAKSLRNIAEGKDPLEGQRHCCGIAQMHEHSSLGHADLDALQQNPQPLIFHIEMLKVESPGTYQQDPWAMTDEEKAKAVPVIHQEGNRLYREGQVKEAAAKYYDAIACLKNLQMKEQPGSPDWIQLDLQITPLLLNYCQCKLVAQEYYEVLDHCSSILNKYDDNVKAYFKRGKAHAAVWNAQEAQADFAKVLELDPALAPVVSRELRALETRIRQKDEEDKARFRGIFSH

上述粗体下划线部分序列即为本发明选择的氨基酸序列(SEQ ID No.4),命名为mXAP2,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.9。

实施例1中还选用了是鼠源的P23蛋白,参考Uniprot数据库中的序列(

MQPASAKWYDRRDYVFIEFCVEDSKDVNVNFEKSKLTFSCLGGSDNFKHLNEIDLFHCIDPNDSKHKRTDRSILCCLRKGESGQSWPRLTKERAKLNWLSVDFNNWKDWEDDSDEDMSNFDRFSEMMDHMGGDEDVDLPEVDGADDDSQDSDDEKMPDLE

上述序列即为本发明选择的氨基酸序列(SEQ ID No.5),命名为mP23,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.10。

实施例1 AhR蛋白的昆虫细胞表达方法

1.根据昆虫表达系统偏好的密码子特点,对mAhR-1(SEQ ID No.2),mHsp90(SEQID No.3),mXAP2(SEQ ID No.4),mP23(SEQ ID No.5)蛋白对应的基因序列进行优化,进行基因合成,即,优化后序列依次为SEQ ID No.7,SEQ ID No.8,SEQ ID No.9,SEQ ID No.10。

2.将pFastBac-Dual载体质粒用限制性内切酶XhoI线性化,37℃酶切3小时,随后加入碱性磷酸酶37℃孵育0.5小时,再用DNA胶回收试剂盒进行纯化。

3.用引物SEQ ID No.11和SEQ ID No.12PCR扩增mAhR-1的DNA序列片段(SEQ IDNo.7),扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃45秒(步骤②,③循环30次);④72℃5分钟。保证目的序列两端与线性化后的载体两端有26-30个碱基的重合区域,并且在序列的N端直接合成Strep标签用于纯化蛋白。将线性化的载体与mAhR-1的DNA序列片段按摩尔比1:1.2混合,加入NEBuilder DNA自组装混合液试剂,50℃孵育1小时,70℃孵育10分钟,随后将自组装的DNA产物转化到DH5α感受态。

4.挑取转化后的单菌落,并鉴定阳性克隆菌,提取得到pFastBac-Dual-mAhR质粒。

5.在制得pFastBac-Dual-mAhR质粒的基础上,将该载体用限制性内切酶NotI线性化,用引物SEQ ID No.13和SEQ ID No.14PCR扩增mHsp90的DNA序列片段(SEQ ID No.8),扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃75秒(步骤②,③循环30次);④72℃5分钟。随后用DNA自组装混合液试剂组装pFastBac-Dual-mAhR质粒和mHsp90DNA片段,并转化到DH5α感受态。挑取转化后的单菌落,并鉴定阳性克隆菌,提取得到pFastBac-Dual-mAhR-mHsp90质粒。

6.用类似的方法将mXAP2(引物SEQ ID No.15和SEQ ID No.16),mP23(引物SEQ IDNo.17和SEQ ID No.18)蛋白的DNA序列构建到另一个pFastBac-Dual载体质粒上,扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃60秒(步骤②,③循环30次);④72℃5分钟。构建质粒的其他实验流程均与步骤3,4,5中相同,得到pFastBac-Dual-mXAP2-mP23质粒。

7.将上述制得的pFastBac-Dual-mAhR-mHsp90和pFastBac-Dual-mXAP2-mP23质粒分别转化到DH10Bac感受态中,经过蓝白斑筛选得到阳性克隆,并提取杆粒。

8.取2毫升培养在昆虫细胞培养基(壹生科IB905培养基;货号L11001;后续所述培养基均为此培养基)中的健康的昆虫细胞(本实施例采用草地贪夜蛾sf9细胞),加入到35毫米塑料平皿中,静置2小时使细胞贴壁。2小时后将平皿中的培养基吸出,加入1毫升上述记载昆虫细胞培养基培养基。取3微克两种不同构建的杆粒分别与8微升转染试剂(GibcoCellfectin试剂,货号10362100)混合孵育20分钟,随后将混合液加入到铺满昆虫细胞(本实施例采用草地贪夜蛾sf9细胞)的平皿中,过夜后分别往平皿添加1毫升添加链霉素和青霉素的上述记载昆虫细胞培养基培养基。

9. 6-7天后收取上清液,即为P1病毒浓缩液。取100微升加入200毫升健康的昆虫细胞(本实施例采用草地贪夜蛾sf9细胞)中,4-5天后待细胞死亡率达到50%,收取上清液,即为P2病毒浓缩液。

10.两种杆粒制得的P2病毒浓缩液各取10毫升,加入到600毫升健康的昆虫细胞中进行大量表达,48小时后2000g离心收取细胞,可以立即使用或冻于负80℃冰箱保存(参见图7)。

实施例2 AhR蛋白的提纯

1.用缓冲液(30mM HEPES,PH7.5,20mM NaCl,10mM MgCl

2.超声完后破碎液用高速离心机16000转离心30分钟,弃去沉淀,留下上清液。将装有Strep介质的重力柱用缓冲液清洗两遍,放到4℃冰箱冷却。

3.离心后的将不同分子伴侣辅助表达AhR蛋白的昆虫细胞的上清液加入到装有Strep介质的直径1厘米,长度20厘米的重力柱中自然流穿,流穿液再次加到重力柱中,重复3-4次,使mAhR充分结合到Strep介质上。然后将缓冲液(30mM HEPES,PH7.5,20mM NaCl,10mM MgCl

4.将洗脱的蛋白浓缩至300微升过分子筛(如Superdex

5.将分子筛出峰位置的组分浓缩后进行SDS-PAGE电泳(参见图1)和Native-PAGE电泳(参见图2),可以证实经过上述步骤得到的是mAhR复合物,且在非变性条件下组分均一。

实施例3 AhR蛋白及完整复合物的鉴定

1)将SDS-PAGE胶上对应于50KD左右的条带切下来,经DTT还原和碘代乙酰胺烷基化处理后,加入胰蛋白酶酶解过夜。酶解后得到的肽段再经C18ZipTip脱盐后,与基质α-cyano-4-hydroxycinnamic acid(CHCA)混合点板。最后用基质辅助激光解析电离-飞行时间质谱仪MALDI-TOF/TOF UltraflextremeTM,Brucker,Germany进行分析。

2)通过从www.matrixscience.com网站上Peptide Mass Fingerprint页面进行数据库检索。蛋白质鉴定结果根据酶解后所产生的肽段的一级质谱得到。检索参数:Trypsin酶解,设两个漏切位点。设定半胱氨酸的烷基化为固定修饰,甲硫氨酸的氧化为可变修饰。鉴定所用的数据库为Swissprot NCBIProt(参见图4)。

3)将Native-PAGE胶上蛋白复合物的那条带切下来,经脱色、DTT还原和碘代乙酰胺烷基化处理后,加入胰蛋白酶酶解过夜,再利用60%乙腈萃取肽段。酶解后得到的肽段混合物通过液相色谱-线性离子阱-轨道阱(nanoLC-LTQ-Orbitrap XL,Thermo,San Jose,CA)质谱联用仪进行分析。色谱分析柱为实验室填制C18反相柱,分析柱内径75微米长15厘米,采用3微米ReproSil-Pur C18-AQ((Dr.Maisch GmbH,Ammerbuch)填料填充,上样柱为内径150微米长3厘米,采用5u ReproSil-Pur C18-AQ((Dr.Maisch GmbH,Ammerbuch)填料填充。流动相为A:0.1%FA/H2O,B:0.1%FA/80%ACN,流速为300纳升每分钟。采用90分钟梯度。

4)数据分析采用Proteome Discoverer(version 1.4.0.288,Thermo FischerScientific)软件分析。MS2谱图使用SEQUEST搜索引擎搜索Uniprot_proteome_mouse_2019数据库。检索参数:Trypsin酶解,设两个漏切位点,前体离子质量误差小于20ppm,碎片离子质量误差小于0.6Da。设定半光氨酸的烷基化为固定修饰,甲硫氨酸的氧化为可变修饰。检索的肽段和谱图匹配(PSM)采用Percolator算法进行过滤,q值小于1%(1%的FDR)。检索后的肽段利用严格的最大简约原则合并成蛋白(参见图5)。

进而,由图5可见,本技术可以成功纯化出AhR与分子伴侣的复合体。

实施例4 AhR蛋白的活性验证

1.用MonolithTM RED-NHS二代蛋白标记试剂盒(nanotemper公司试剂盒;货号:MO-L011)标记上述获得蛋白复合物。

2.准备16个EP管,依次标记1-16号。取5微升缓冲液(30mM HEPES,PH7.5,20mMNaCl,10mM MgCl

3.每个EP管加入5微升1微摩尔的标记好的蛋白复合物混匀,用毛细管上样。用MonolithTM NT.115仪器的Binding Affinity模式测定kd值(参见图6)。

由图6可见,本技术纯化出的AhR与分子伴侣的复合体有结合底物小分子TCDD的活性。

序列

SEQ ID NO.1(hAhR-1)

VKPIPAEGIKSNPSKRHRDRLNTELDRLASLLPFPQDVINKLDKLSVLRLSVSYLRAKSFFDVALKSSPTERNGGQDNCRAANFREGLNLQEGEFLLQALNGFVLVVTTDALVFYASSTIQDYLGFQQSDVIHQSVYELIHTEDRAEFQRQLHWALNPSQCTESGQGIEEATGLPQTVVCYNPDQIPPENSPLMERCFICRLRCLLDNSSGFLAMNFQGKLKYLHGQKKKGKDGSILPPQLALFAIATPLQPPSILEIRTKNFIFRTKHKLDFTPIGCDAKGRIVLGYTEAELCTRGSGYQFIHAADMLYCAESHIRMIKTGESGMIVFRLLTKNNRWTWVQSNARLLYKNGRPDYIIVTQRPLTDEEGTEHLRKRNTKLPFMFTTGEAVLYEATNPFPAIMDPLPLRTKNGTSGKDSATTSTLSKDSLNPSSLLAAMMQQDESIYLYPASST

SEQ ID NO.2(mAhR-1)

MSSGANITYASRKRRKPVQKTVKPIPAEGIKSNPSKRHRDRLNTELDRLASLLPFPQDVINKLDKLSVLRLSVSYLRAKSFFDVALKSTPADRNGGQDQCRAQIRDWQDLQEGEFLLQALNGFVLVVTADALVFYASSTIQDYLGFQQSDVIHQSVYELIHTEDRAEFQRQLHWALNPDSAQGVDEAHGPPQAAVYYTPDQLPPENASFMERCFRCRLRCLLDNSSGFLAMNFQGRLKYLHGQNKKGKDGALLPPQLALFAIATPLQPPSILEIRTKNFIFRTKHKLDFTPIGCDAKGQLILGYTEVELCTRGSGYQFIHAADMLHCAESHIRMIKTGESGMTVFRLFAKHSRWRWVQSNARLIYRNGRPDYIIATQRPLTDEEGREHLQKRSTSLPF

SEQ ID NO.3(mHsp90)

MPEEVHHGEEEVETFAFQAEIAQLMSLIINTFYSNKEIFLRELISNASDALDKIRYESLTDPSKLDSGKELKIDIIPNPQERTLTLVDTGIGMTKADLINNLGTIAKSGTKAFMEALQAGADISMIGQFGVGFYSAYLVAEKVVVITKHNDDEQYAWESSAGGSFTVRADHGEPIGRGTKVILHLKEDQTEYLEERRVKEVVKKHSQFIGYPITLYLEKEREKEISDDEAEEEKGEKEEEDKEDEEKPKIEDVGSDEEDDSGKDKKKKTKKIKEKYIDQEELNKTKPIWTRNPDDITQEEYGEFYKSLTNDWEDHLAVKHFSVEGQLEFRALLFIPRRAPFDLFENKKKKNNIKLYVRRVFIMDSCDELIPEYLNFIRGVVDSEDLPLNISREMLQQSKILKVIRKNIVKKCLELFSELAEDKENYKKFYEAFSKNLKLGIHEDSTNRRRLSELLRYHTSQSGDEMTSLSEYVSRMKETQKSIYYITGESKEQVANSAFVERVRKRGFEVVYMTEPIDEYCVQQLKEFDGKSLVSVTKEGLELPEDEEEKKKMEESKAKFENLCKLMKEILDKKVEKVTISNRLVSSPCCIVTSTYGWTANMERIMKAQALRDNSTMGYMMAKKHLEINPDHPIVETLRQKAEADKNDKAVKDLVVLLFETALLSSGFSLEDPQTHSNRIYRMIKLGLGIDEDEVTAEEPSAAVPDEIPPLEGDEDASRMEEVD

SEQ ID NO.4(mXAP2)

MADLIARLREDGIQKRVIQEGRGELPDFQDGTKATFHFRTLHSDNEGSVIDDSRTRGKPMELIVGKKFKLPVWETIVCTMREGEIAQFLCDIKHVVLYPLVAKSLRNIAEGKDPLEGQRHCCGIAQMHEHSSLGHADLDALQQNPQPLIFHIEMLKVESPGTYQQDPWAMTDEEKAKAVPVIHQEGNRLYREGQVKEAAAKYYDAIACLKNLQMKEQPGSPDWIQLDLQITPLLLNYCQCKLVAQEYYEVLDHCSSILNKYDDNVKAYFKRGKAHAAVWNAQEAQADFAKVLELDPALAPVVSRELRALETRIRQKDEEDKARFRGIFSH

SEQ ID NO.5(mP23)

MQPASAKWYDRRDYVFIEFCVEDSKDVNVNFEKSKLTFSCLGGSDNFKHLNEIDLFHCIDPNDSKHKRTDRSILCCLRKGESGQSWPRLTKERAKLNWLSVDFNNWKDWEDDSDEDMSNFDRFSEMMDHMGGDEDVDLPEVDGADDDSQDSDDEKMPDLE

SEQ ID No.6(hAhR-1-DNA)

GTAAAACCTATTCCGGCAGAAGGCATTAAAAGCAACCCGAGCAAAAGACATCGTGACCGGTTAAATACAGAGCTGGATCGTCTGGCAAGCCTTTTACCGTTCCCGCAGGATGTTATTAATAAACTGGACAAACTGAGTGTACTGCGCCTGAGCGTTAGCTATTTACGTGCTAAAAGTTTTTTCGACGTGGCTCTGAAATCTAGTCCGACCGAGCGTAATGGTGGGCAGGATAACTGCCGGGCAGCAAACTTTCGCGAAGGTCTGAATTTACAGGAGGGGGAATTTCTTCTGCAGGCTCTGAATGGTTTTGTTCTGGTTGTTACAACCGATGCACTGGTTTTTTATGCAAGCTCTACAATTCAGGATTATTTAGGGTTTCAACAGAGCGATGTGATACATCAGTCTGTTTATGAATTAATCCACACCGAGGACCGTGCAGAGTTTCAAAGACAACTGCATTGGGCACTGAACCCAAGCCAGTGTACCGAGAGCGGGCAAGGTATCGAGGAAGCAACCGGTCTTCCACAGACCGTGGTTTGTTATAATCCGGATCAGATTCCGCCAGAAAATAGCCCCCTGATGGAACGCTGTTTTATTTGTCGCCTGAGATGTTTACTGGACAATAGCTCAGGCTTTCTGGCAATGAACTTTCAGGGTAAACTGAAATATCTTCACGGTCAGAAGAAAAAGGGTAAAGATGGAAGTATTCTGCCGCCGCAACTTGCACTGTTTGCAATTGCAACCCCCCTGCAGCCTCCGTCTATCCTGGAAATTCGCACCAAAAATTTTATCTTTCGTACCAAACACAAGCTGGATTTTACCCCCATTGGTTGTGATGCCAAAGGTCGTATTGTTTTAGGCTATACCGAAGCAGAACTGTGCACCCGGGGTTCAGGCTATCAGTTTATTCATGCAGCAGATATGCTGTATTGTGCCGAAAGCCACATTCGGATGATTAAGACAGGTGAAAGTGGGATGATTGTTTTTCGTCTGCTTACCAAAAATAACCGTTGGACCTGGGTGCAGAGCAATGCACGTTTATTATATAAGAATGGTCGTCCGGACTATATTATTGTTACACAGCGGCCGTTAACCGACGAGGAGGGTACCGAACATCTGCGTAAACGCAACACCAAATTACCATTTATGTTTACCACCGGTGAGGCGGTGCTGTATGAAGCAACCAACCCGTTTCCGGCAATTATGGACCCTTTACCGCTGCGTACCAAAAACGGTACCTCAGGTAAAGACAGCGCGACCACCAGCACCTTAAGCAAAGATAGCCTGAATCCCAGCAGTCTGCTGGCAGCTATGATGCAGCAGGATGAAAGCATTTATCTGTATCCAGCAAGCAGCACC

SEQ ID No.7(mAhR-1-DNA)

ATGAGCAGTGGAGCTAACATTACTTACGCCTCCAGGAAGAGAAGGAAGCCTGTTCAGAAGACTGTGAAGCCAATCCCTGCCGAGGGTATTAAATCCAACCCCTCCAAGCGCCACAGGGACAGATTGAACACCGAGCTGGACCGCCTGGCTAGTTTGTTGCCATTCCCCCAGGACGTGATCAACAAGCTCGACAAACTGTCCGTGCTGCGCCTGTCTGTCTCCTACTTGCGTGCAAAGTCCTTCTTCGACGTGGCTTTGAAATCCACCCCCGCTGACCGTAACGGTGGTCAAGATCAATGCCGCGCTCAGATCCGCGACTGGCAAGATTTGCAGGAGGGTGAGTTCCTCCTGCAGGCTTTGAACGGATTCGTGTTGGTGGTCACCGCTGACGCTCTGGTTTTCTACGCTTCCTCCACCATTCAGGACTACCTGGGATTCCAACAGAGCGACGTGATTCATCAGTCCGTTTACGAGCTGATCCACACCGAGGACCGCGCTGAATTTCAGCGTCAATTGCACTGGGCTCTGAACCCTGACAGTGCTCAGGGTGTGGACGAGGCTCATGGTCCTCCTCAAGCAGCTGTGTACTACACCCCCGACCAGTTGCCTCCAGAAAACGCTTCCTTCATGGAGCGCTGTTTCCGCTGCCGTCTGAGATGTCTCCTGGATAACTCCTCCGGTTTCCTCGCTATGAACTTCCAGGGTCGCCTGAAGTACCTCCACGGTCAAAACAAAAAGGGTAAGGACGGAGCTTTGCTCCCTCCCCAACTGGCTTTGTTCGCTATTGCCACCCCTCTGCAGCCTCCTTCTATCTTGGAAATTCGCACCAAGAACTTCATCTTCCGCACCAAGCACAAGCTCGACTTCACCCCTATCGGTTGCGACGCTAAGGGTCAGCTGATCCTGGGATACACCGAAGTCGAGCTGTGCACCCGTGGTTCTGGATACCAATTCATCCACGCTGCCGACATGCTGCACTGCGCTGAATCTCACATCCGTATGATCAAGACTGGTGAGTCCGGTATGACCGTGTTCCGCTTGTTCGCTAAGCATTCTCGCTGGCGCTGGGTCCAATCAAACGCTAGACTGATCTACCGTAACGGTCGCCCCGACTACATCATCGCAACCCAAAGACCTCTGACCGACGAGGAGGGTAGGGAACATCTGCAGAAGAGGAGCACCTCCCTGCCTTTC

SEQ ID No.8(mHsp90-DNA)

ATGCCTGAGGAGGTGCACCACGGTGAAGAAGAAGTGGAAACCTTCGCTTTCCAGGCTGAGATTGCTCAACTGATGTCCCTCATCATCAACACCTTCTACAGCAACAAGGAGATCTTCCTGAGAGAGCTGATCAGCAACGCTTCCGACGCTCTGGACAAAATCCGTTACGAGTCCCTGACCGATCCTTCCAAACTGGACTCCGGCAAAGAACTGAAGATCGACATCATCCCTAACCCTCAGGAGCGCACCCTCACATTGGTGGATACCGGTATCGGCATGACAAAGGCAGACCTCATCAACAACCTGGGCACCATTGCTAAAAGCGGAACCAAAGCCTTCATGGAGGCTCTGCAAGCAGGTGCTGACATCTCCATGATTGGTCAATTCGGCGTGGGTTTCTACTCCGCTTACCTCGTGGCCGAGAAGGTGGTTGTGATCACAAAGCACAACGACGACGAGCAGTACGCTTGGGAGAGCAGTGCTGGTGGTTCCTTCACTGTCAGGGCTGATCACGGTGAGCCTATCGGTCGTGGTACCAAAGTGATCCTGCATCTGAAGGAGGACCAAACCGAGTACCTCGAAGAGCGCAGGGTGAAGGAGGTGGTTAAGAAGCACAGCCAGTTCATCGGTTACCCCATCACACTGTACTTGGAGAAAGAGCGCGAAAAAGAGATCAGCGACGACGAAGCAGAGGAAGAAAAGGGTGAGAAGGAAGAGGAAGATAAGGAGGACGAGGAGAAGCCAAAGATCGAGGACGTGGGAAGCGACGAGGAGGATGATAGCGGAAAGGACAAGAAGAAGAAGACAAAGAAGATCAAGGAGAAGTACATCGACCAGGAGGAGCTGAACAAGACAAAGCCAATCTGGACAAGGAACCCTGACGACATCACACAGGAGGAGTACGGAGAGTTCTACAAGAGCCTCACAAACGACTGGGAGGACCACCTGGCTGTGAAGCATTTCAGCGTGGAGGGACAGCTGGAGTTCAGGGCTTTGCTGTTCATCCCAAGGAGAGCCCCTTTCGACCTGTTCGAGAACAAAAAGAAGAAGAACAACATCAAACTGTACGTGCGCCGCGTCTTCATTATGGACTCCTGCGACGAGCTGATCCCTGAGTACCTGAACTTCATCCGTGGTGTGGTGGACTCCGAAGACCTGCCTTTGAACATCTCCCGCGAGATGCTGCAGCAGTCCAAGATCCTGAAGGTGATCAGGAAGAACATCGTGAAGAAATGCCTGGAGTTGTTCTCCGAGTTGGCTGAAGACAAAGAGAACTACAAGAAGTTCTACGAGGCATTCTCCAAGAACCTGAAGCTGGGTATCCATGAGGACTCCACCAACCGCCGTCGTTTGTCTGAGCTGCTGCGTTACCACACCAGCCAGTCTGGTGACGAGATGACCTCCCTGTCCGAATACGTGTCCCGCATGAAGGAAACTCAGAAATCAATTTACTACATCACTGGTGAATCCAAGGAGCAAGTGGCTAACTCCGCTTTCGTCGAGCGTGTGCGTAAGAGAGGTTTCGAGGTGGTGTACATGACCGAGCCCATCGACGAATACTGCGTCCAGCAGCTGAAGGAGTTCGACGGTAAGTCCTTGGTGAGCGTCACCAAGGAGGGTCTGGAGTTGCCAGAGGATGAGGAGGAGAAGAAGAAGATGGAAGAGAGCAAGGCAAAGTTCGAGAACCTCTGCAAGTTGATGAAGGAGATCCTGGACAAGAAGGTGGAGAAGGTGACTATCAGCAACAGGCTGGTGAGCAGTCCATGCTGCATCGTGACCAGCACCTACGGATGGACCGCAAACATGGAGAGGATCATGAAGGCACAAGCCCTGCGCGACAACAGCACAATGGGATACATGATGGCAAAAAAGCACCTGGAGATCAACCCTGACCACCCTATCGTGGAGACCCTGCGCCAGAAGGCTGAGGCTGACAAGAACGACAAGGCTGTGAAGGACCTGGTGGTGCTGCTGTTCGAGACCGCTCTGCTGTCCTCCGGTTTCTCCCTGGAGGACCCTCAGACCCACTCCAACCGCATCTACCGCATGATCAAGCTGGGTCTGGGTATCGACGAGGACGAGGTGACCGCTGAGGAGCCTTCCGCTGCTGTGCCTGACGAGATCCCTCCTCTGGAGGGTGACGAGGACGCTTCCCGCATGGAGGAGGTGGAC

SEQ ID No.9(mXAP2-DNA)

ATGGCCGATCTGATTGCTCGCTTGCGTGAGGACGGTATTCAGAAGAGGGTGATCCAGGAGGGTCGCGGTGAATTGCCTGACTTCCAGGATGGTACAAAAGCCACCTTCCACTTCCGCACCTTGCACTCTGACAACGAGGGTAGTGTGATCGATGACAGCAGAACGAGGGGCAAACCTATGGAGTTGATCGTGGGTAAAAAGTTCAAACTGCCCGTGTGGGAGACCATCGTGTGTACTATGCGCGAGGGTGAGATCGCTCAGTTCTTGTGCGACATCAAGCATGTGGTGCTGTACCCTCTGGTGGCGAAGTCTCTCCGTAACATCGCTGAAGGTAAGGACCCACTGGAGGGTCAACGCCATTGTTGTGGAATCGCTCAAATGCACGAGCACAGCTCCCTCGGTCACGCTGATTTGGACGCTCTGCAGCAGAACCCACAACCGTTGATCTTCCACATCGAAATGCTGAAGGTGGAATCCCCTGGAACTTACCAGCAGGACCCCTGGGCTATGACCGATGAAGAGAAGGCTAAAGCAGTGCCTGTGATCCACCAAGAAGGTAACCGCCTGTACCGCGAGGGTCAAGTTAAGGAGGCTGCCGCTAAATACTACGACGCTATCGCTTGTTTGAAGAACCTGCAGATGAAGGAGCAGCCTGGTAGCCCTGACTGGATTCAACTGGATCTGCAGATTACACCTCTCCTGCTGAACTACTGTCAGTGCAAGCTGGTGGCTCAGGAATACTACGAGGTGCTGGATCACTGCAGCTCCATCCTGAACAAATACGACGACAACGTGAAAGCTTACTTCAAACGCGGTAAAGCTCACGCTGCTGTCTGGAACGCTCAGGAAGCTCAGGCTGACTTCGCTAAAGTGCTCGAACTCGACCCCGCCTTGGCACCTGTTGTTTCAAGGGAGTTGCGCGCTCTCGAAACTCGCATCCGTCAGAAAGATGAGGAGGACAAGGCTCGTTTCCGCGGAATCTTCTCCCAC

SEQ ID No.10(mP23-DNA)

ATGCAGCCTGCCTCCGCTAAGTGGTACGACAGAAGGGACTACGTGTTCATCGAGTTCTGCGTGGAGGACTCCAAGGACGTGAACGTGAACTTCGAGAAGTCCAAATTGACCTTCAGCTGCCTGGGCGGTTCCGATAACTTCAAGCACCTGAACGAAATCGACCTCTTCCATTGTATCGATCCAAACGACTCCAAACACAAGAGGACTGACCGCTCCATCCTGTGCTGCTTGCGTAAGGGTGAGTCTGGTCAGTCCTGGCCAAGACTGACAAAGGAGAGAGCTAAGCTCAACTGGCTGTCCGTGGACTTCAACAACTGGAAAGACTGGGAAGACGACTCCGACGAGGACATGAGCAACTTCGACAGGTTCAGTGAGATGATGGACCACATGGGAGGAGATGAAGACGTGGATCTGCCTGAGGTGGACGGAGCTGATGACGATAGCCAGGACAGCGACGACGAGAAGATGCCAGACCTGGAG

SEQ ID No.11

CTATGCATCAGCTGCTAGCACCATGGCTCGAATGGGCGCTTGGAGCCACCCTCAGTTCG

SEQ ID No.12

TCGACGAAGACTTGATCACCCGGGATCGAAAGGCAGGGAGGTGCTCCTCTTCTG

SEQ ID No.13

GCCTACGTCGACGAGCTCACTAGTCGCGGCCATGCCTGAGGAGGTGCACCACGGTGAAG

SEQ ID No.14

GAGACTGCAGGCTCTAGATTCGAAAGCGTCCACCTCCTCCATGCGGGAAGCGTC

SEQ ID No.15

CTATGCATCAGCTGCTAGCACCATGGCTCGAATGGCCGATCTGATTGCTCGCTTGCGTG

SEQ ID No.16

TCGACGAAGACTTGATCACCCGGGATCGTGGGAGAAGATTCCGCGGAAACGAGC

SEQ ID No.17

GCCTACGTCGACGAGCTCACTAGTCGCGGCCATGCAGCCTGCCTCCGCTAAGTGGTACG

SEQ ID No.18

GAGACTGCAGGCTCTAGATTCGAAAGCCTCCAGGTCTGGCATCTTCTCGTCGTC

序列表

<110> 中国科学院生物物理研究所

<120> 芳香烃受体蛋白稳定高效表达的方法及其应用

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 453

<212> PRT

<213> hAhR-1

<400> 1

Val Lys Pro Ile Pro Ala Glu Gly Ile Lys Ser Asn Pro Ser Lys Arg

1 5 10 15

His Arg Asp Arg Leu Asn Thr Glu Leu Asp Arg Leu Ala Ser Leu Leu

20 25 30

Pro Phe Pro Gln Asp Val Ile Asn Lys Leu Asp Lys Leu Ser Val Leu

35 40 45

Arg Leu Ser Val Ser Tyr Leu Arg Ala Lys Ser Phe Phe Asp Val Ala

50 55 60

Leu Lys Ser Ser Pro Thr Glu Arg Asn Gly Gly Gln Asp Asn Cys Arg

65 70 75 80

Ala Ala Asn Phe Arg Glu Gly Leu Asn Leu Gln Glu Gly Glu Phe Leu

85 90 95

Leu Gln Ala Leu Asn Gly Phe Val Leu Val Val Thr Thr Asp Ala Leu

100 105 110

Val Phe Tyr Ala Ser Ser Thr Ile Gln Asp Tyr Leu Gly Phe Gln Gln

115 120 125

Ser Asp Val Ile His Gln Ser Val Tyr Glu Leu Ile His Thr Glu Asp

130 135 140

Arg Ala Glu Phe Gln Arg Gln Leu His Trp Ala Leu Asn Pro Ser Gln

145 150 155 160

Cys Thr Glu Ser Gly Gln Gly Ile Glu Glu Ala Thr Gly Leu Pro Gln

165 170 175

Thr Val Val Cys Tyr Asn Pro Asp Gln Ile Pro Pro Glu Asn Ser Pro

180 185 190

Leu Met Glu Arg Cys Phe Ile Cys Arg Leu Arg Cys Leu Leu Asp Asn

195 200 205

Ser Ser Gly Phe Leu Ala Met Asn Phe Gln Gly Lys Leu Lys Tyr Leu

210 215 220

His Gly Gln Lys Lys Lys Gly Lys Asp Gly Ser Ile Leu Pro Pro Gln

225 230 235 240

Leu Ala Leu Phe Ala Ile Ala Thr Pro Leu Gln Pro Pro Ser Ile Leu

245 250 255

Glu Ile Arg Thr Lys Asn Phe Ile Phe Arg Thr Lys His Lys Leu Asp

260 265 270

Phe Thr Pro Ile Gly Cys Asp Ala Lys Gly Arg Ile Val Leu Gly Tyr

275 280 285

Thr Glu Ala Glu Leu Cys Thr Arg Gly Ser Gly Tyr Gln Phe Ile His

290 295 300

Ala Ala Asp Met Leu Tyr Cys Ala Glu Ser His Ile Arg Met Ile Lys

305 310 315 320

Thr Gly Glu Ser Gly Met Ile Val Phe Arg Leu Leu Thr Lys Asn Asn

325 330 335

Arg Trp Thr Trp Val Gln Ser Asn Ala Arg Leu Leu Tyr Lys Asn Gly

340 345 350

Arg Pro Asp Tyr Ile Ile Val Thr Gln Arg Pro Leu Thr Asp Glu Glu

355 360 365

Gly Thr Glu His Leu Arg Lys Arg Asn Thr Lys Leu Pro Phe Met Phe

370 375 380

Thr Thr Gly Glu Ala Val Leu Tyr Glu Ala Thr Asn Pro Phe Pro Ala

385 390 395 400

Ile Met Asp Pro Leu Pro Leu Arg Thr Lys Asn Gly Thr Ser Gly Lys

405 410 415

Asp Ser Ala Thr Thr Ser Thr Leu Ser Lys Asp Ser Leu Asn Pro Ser

420 425 430

Ser Leu Leu Ala Ala Met Met Gln Gln Asp Glu Ser Ile Tyr Leu Tyr

435 440 445

Pro Ala Ser Ser Thr

450

<210> 2

<211> 398

<212> PRT

<213> mAhR-1

<400> 2

Met Ser Ser Gly Ala Asn Ile Thr Tyr Ala Ser Arg Lys Arg Arg Lys

1 5 10 15

Pro Val Gln Lys Thr Val Lys Pro Ile Pro Ala Glu Gly Ile Lys Ser

20 25 30

Asn Pro Ser Lys Arg His Arg Asp Arg Leu Asn Thr Glu Leu Asp Arg

35 40 45

Leu Ala Ser Leu Leu Pro Phe Pro Gln Asp Val Ile Asn Lys Leu Asp

50 55 60

Lys Leu Ser Val Leu Arg Leu Ser Val Ser Tyr Leu Arg Ala Lys Ser

65 70 75 80

Phe Phe Asp Val Ala Leu Lys Ser Thr Pro Ala Asp Arg Asn Gly Gly

85 90 95

Gln Asp Gln Cys Arg Ala Gln Ile Arg Asp Trp Gln Asp Leu Gln Glu

100 105 110

Gly Glu Phe Leu Leu Gln Ala Leu Asn Gly Phe Val Leu Val Val Thr

115 120 125

Ala Asp Ala Leu Val Phe Tyr Ala Ser Ser Thr Ile Gln Asp Tyr Leu

130 135 140

Gly Phe Gln Gln Ser Asp Val Ile His Gln Ser Val Tyr Glu Leu Ile

145 150 155 160

His Thr Glu Asp Arg Ala Glu Phe Gln Arg Gln Leu His Trp Ala Leu

165 170 175

Asn Pro Asp Ser Ala Gln Gly Val Asp Glu Ala His Gly Pro Pro Gln

180 185 190

Ala Ala Val Tyr Tyr Thr Pro Asp Gln Leu Pro Pro Glu Asn Ala Ser

195 200 205

Phe Met Glu Arg Cys Phe Arg Cys Arg Leu Arg Cys Leu Leu Asp Asn

210 215 220

Ser Ser Gly Phe Leu Ala Met Asn Phe Gln Gly Arg Leu Lys Tyr Leu

225 230 235 240

His Gly Gln Asn Lys Lys Gly Lys Asp Gly Ala Leu Leu Pro Pro Gln

245 250 255

Leu Ala Leu Phe Ala Ile Ala Thr Pro Leu Gln Pro Pro Ser Ile Leu

260 265 270

Glu Ile Arg Thr Lys Asn Phe Ile Phe Arg Thr Lys His Lys Leu Asp

275 280 285

Phe Thr Pro Ile Gly Cys Asp Ala Lys Gly Gln Leu Ile Leu Gly Tyr

290 295 300

Thr Glu Val Glu Leu Cys Thr Arg Gly Ser Gly Tyr Gln Phe Ile His

305 310 315 320

Ala Ala Asp Met Leu His Cys Ala Glu Ser His Ile Arg Met Ile Lys

325 330 335

Thr Gly Glu Ser Gly Met Thr Val Phe Arg Leu Phe Ala Lys His Ser

340 345 350

Arg Trp Arg Trp Val Gln Ser Asn Ala Arg Leu Ile Tyr Arg Asn Gly

355 360 365

Arg Pro Asp Tyr Ile Ile Ala Thr Gln Arg Pro Leu Thr Asp Glu Glu

370 375 380

Gly Arg Glu His Leu Gln Lys Arg Ser Thr Ser Leu Pro Phe

385 390 395

<210> 3

<211> 724

<212> PRT

<213> mHsp90

<400> 3

Met Pro Glu Glu Val His His Gly Glu Glu Glu Val Glu Thr Phe Ala

1 5 10 15

Phe Gln Ala Glu Ile Ala Gln Leu Met Ser Leu Ile Ile Asn Thr Phe

20 25 30

Tyr Ser Asn Lys Glu Ile Phe Leu Arg Glu Leu Ile Ser Asn Ala Ser

35 40 45

Asp Ala Leu Asp Lys Ile Arg Tyr Glu Ser Leu Thr Asp Pro Ser Lys

50 55 60

Leu Asp Ser Gly Lys Glu Leu Lys Ile Asp Ile Ile Pro Asn Pro Gln

65 70 75 80

Glu Arg Thr Leu Thr Leu Val Asp Thr Gly Ile Gly Met Thr Lys Ala

85 90 95

Asp Leu Ile Asn Asn Leu Gly Thr Ile Ala Lys Ser Gly Thr Lys Ala

100 105 110

Phe Met Glu Ala Leu Gln Ala Gly Ala Asp Ile Ser Met Ile Gly Gln

115 120 125

Phe Gly Val Gly Phe Tyr Ser Ala Tyr Leu Val Ala Glu Lys Val Val

130 135 140

Val Ile Thr Lys His Asn Asp Asp Glu Gln Tyr Ala Trp Glu Ser Ser

145 150 155 160

Ala Gly Gly Ser Phe Thr Val Arg Ala Asp His Gly Glu Pro Ile Gly

165 170 175

Arg Gly Thr Lys Val Ile Leu His Leu Lys Glu Asp Gln Thr Glu Tyr

180 185 190

Leu Glu Glu Arg Arg Val Lys Glu Val Val Lys Lys His Ser Gln Phe

195 200 205

Ile Gly Tyr Pro Ile Thr Leu Tyr Leu Glu Lys Glu Arg Glu Lys Glu

210 215 220

Ile Ser Asp Asp Glu Ala Glu Glu Glu Lys Gly Glu Lys Glu Glu Glu

225 230 235 240

Asp Lys Glu Asp Glu Glu Lys Pro Lys Ile Glu Asp Val Gly Ser Asp

245 250 255

Glu Glu Asp Asp Ser Gly Lys Asp Lys Lys Lys Lys Thr Lys Lys Ile

260 265 270

Lys Glu Lys Tyr Ile Asp Gln Glu Glu Leu Asn Lys Thr Lys Pro Ile

275 280 285

Trp Thr Arg Asn Pro Asp Asp Ile Thr Gln Glu Glu Tyr Gly Glu Phe

290 295 300

Tyr Lys Ser Leu Thr Asn Asp Trp Glu Asp His Leu Ala Val Lys His

305 310 315 320

Phe Ser Val Glu Gly Gln Leu Glu Phe Arg Ala Leu Leu Phe Ile Pro

325 330 335

Arg Arg Ala Pro Phe Asp Leu Phe Glu Asn Lys Lys Lys Lys Asn Asn

340 345 350

Ile Lys Leu Tyr Val Arg Arg Val Phe Ile Met Asp Ser Cys Asp Glu

355 360 365

Leu Ile Pro Glu Tyr Leu Asn Phe Ile Arg Gly Val Val Asp Ser Glu

370 375 380

Asp Leu Pro Leu Asn Ile Ser Arg Glu Met Leu Gln Gln Ser Lys Ile

385 390 395 400

Leu Lys Val Ile Arg Lys Asn Ile Val Lys Lys Cys Leu Glu Leu Phe

405 410 415

Ser Glu Leu Ala Glu Asp Lys Glu Asn Tyr Lys Lys Phe Tyr Glu Ala

420 425 430

Phe Ser Lys Asn Leu Lys Leu Gly Ile His Glu Asp Ser Thr Asn Arg

435 440 445

Arg Arg Leu Ser Glu Leu Leu Arg Tyr His Thr Ser Gln Ser Gly Asp

450 455 460

Glu Met Thr Ser Leu Ser Glu Tyr Val Ser Arg Met Lys Glu Thr Gln

465 470 475 480

Lys Ser Ile Tyr Tyr Ile Thr Gly Glu Ser Lys Glu Gln Val Ala Asn

485 490 495

Ser Ala Phe Val Glu Arg Val Arg Lys Arg Gly Phe Glu Val Val Tyr

500 505 510

Met Thr Glu Pro Ile Asp Glu Tyr Cys Val Gln Gln Leu Lys Glu Phe

515 520 525

Asp Gly Lys Ser Leu Val Ser Val Thr Lys Glu Gly Leu Glu Leu Pro

530 535 540

Glu Asp Glu Glu Glu Lys Lys Lys Met Glu Glu Ser Lys Ala Lys Phe

545 550 555 560

Glu Asn Leu Cys Lys Leu Met Lys Glu Ile Leu Asp Lys Lys Val Glu

565 570 575

Lys Val Thr Ile Ser Asn Arg Leu Val Ser Ser Pro Cys Cys Ile Val

580 585 590

Thr Ser Thr Tyr Gly Trp Thr Ala Asn Met Glu Arg Ile Met Lys Ala

595 600 605

Gln Ala Leu Arg Asp Asn Ser Thr Met Gly Tyr Met Met Ala Lys Lys

610 615 620

His Leu Glu Ile Asn Pro Asp His Pro Ile Val Glu Thr Leu Arg Gln

625 630 635 640

Lys Ala Glu Ala Asp Lys Asn Asp Lys Ala Val Lys Asp Leu Val Val

645 650 655

Leu Leu Phe Glu Thr Ala Leu Leu Ser Ser Gly Phe Ser Leu Glu Asp

660 665 670

Pro Gln Thr His Ser Asn Arg Ile Tyr Arg Met Ile Lys Leu Gly Leu

675 680 685

Gly Ile Asp Glu Asp Glu Val Thr Ala Glu Glu Pro Ser Ala Ala Val

690 695 700

Pro Asp Glu Ile Pro Pro Leu Glu Gly Asp Glu Asp Ala Ser Arg Met

705 710 715 720

Glu Glu Val Asp

<210> 4

<211> 330

<212> PRT

<213> mXAP2

<400> 4

Met Ala Asp Leu Ile Ala Arg Leu Arg Glu Asp Gly Ile Gln Lys Arg

1 5 10 15

Val Ile Gln Glu Gly Arg Gly Glu Leu Pro Asp Phe Gln Asp Gly Thr

20 25 30

Lys Ala Thr Phe His Phe Arg Thr Leu His Ser Asp Asn Glu Gly Ser

35 40 45

Val Ile Asp Asp Ser Arg Thr Arg Gly Lys Pro Met Glu Leu Ile Val

50 55 60

Gly Lys Lys Phe Lys Leu Pro Val Trp Glu Thr Ile Val Cys Thr Met

65 70 75 80

Arg Glu Gly Glu Ile Ala Gln Phe Leu Cys Asp Ile Lys His Val Val

85 90 95

Leu Tyr Pro Leu Val Ala Lys Ser Leu Arg Asn Ile Ala Glu Gly Lys

100 105 110

Asp Pro Leu Glu Gly Gln Arg His Cys Cys Gly Ile Ala Gln Met His

115 120 125

Glu His Ser Ser Leu Gly His Ala Asp Leu Asp Ala Leu Gln Gln Asn

130 135 140

Pro Gln Pro Leu Ile Phe His Ile Glu Met Leu Lys Val Glu Ser Pro

145 150 155 160

Gly Thr Tyr Gln Gln Asp Pro Trp Ala Met Thr Asp Glu Glu Lys Ala

165 170 175

Lys Ala Val Pro Val Ile His Gln Glu Gly Asn Arg Leu Tyr Arg Glu

180 185 190

Gly Gln Val Lys Glu Ala Ala Ala Lys Tyr Tyr Asp Ala Ile Ala Cys

195 200 205

Leu Lys Asn Leu Gln Met Lys Glu Gln Pro Gly Ser Pro Asp Trp Ile

210 215 220

Gln Leu Asp Leu Gln Ile Thr Pro Leu Leu Leu Asn Tyr Cys Gln Cys

225 230 235 240

Lys Leu Val Ala Gln Glu Tyr Tyr Glu Val Leu Asp His Cys Ser Ser

245 250 255

Ile Leu Asn Lys Tyr Asp Asp Asn Val Lys Ala Tyr Phe Lys Arg Gly

260 265 270

Lys Ala His Ala Ala Val Trp Asn Ala Gln Glu Ala Gln Ala Asp Phe

275 280 285

Ala Lys Val Leu Glu Leu Asp Pro Ala Leu Ala Pro Val Val Ser Arg

290 295 300

Glu Leu Arg Ala Leu Glu Thr Arg Ile Arg Gln Lys Asp Glu Glu Asp

305 310 315 320

Lys Ala Arg Phe Arg Gly Ile Phe Ser His

325 330

<210> 5

<211> 160

<212> PRT

<213> mP23

<400> 5

Met Gln Pro Ala Ser Ala Lys Trp Tyr Asp Arg Arg Asp Tyr Val Phe

1 5 10 15

Ile Glu Phe Cys Val Glu Asp Ser Lys Asp Val Asn Val Asn Phe Glu

20 25 30

Lys Ser Lys Leu Thr Phe Ser Cys Leu Gly Gly Ser Asp Asn Phe Lys

35 40 45

His Leu Asn Glu Ile Asp Leu Phe His Cys Ile Asp Pro Asn Asp Ser

50 55 60

Lys His Lys Arg Thr Asp Arg Ser Ile Leu Cys Cys Leu Arg Lys Gly

65 70 75 80

Glu Ser Gly Gln Ser Trp Pro Arg Leu Thr Lys Glu Arg Ala Lys Leu

85 90 95

Asn Trp Leu Ser Val Asp Phe Asn Asn Trp Lys Asp Trp Glu Asp Asp

100 105 110

Ser Asp Glu Asp Met Ser Asn Phe Asp Arg Phe Ser Glu Met Met Asp

115 120 125

His Met Gly Gly Asp Glu Asp Val Asp Leu Pro Glu Val Asp Gly Ala

130 135 140

Asp Asp Asp Ser Gln Asp Ser Asp Asp Glu Lys Met Pro Asp Leu Glu

145 150 155 160

<210> 6

<211> 1359

<212> DNA

<213> hAhR-1-DNA

<400> 6

gtaaaaccta ttccggcaga aggcattaaa agcaacccga gcaaaagaca tcgtgaccgg 60

ttaaatacag agctggatcg tctggcaagc cttttaccgt tcccgcagga tgttattaat 120

aaactggaca aactgagtgt actgcgcctg agcgttagct atttacgtgc taaaagtttt 180

ttcgacgtgg ctctgaaatc tagtccgacc gagcgtaatg gtgggcagga taactgccgg 240

gcagcaaact ttcgcgaagg tctgaattta caggaggggg aatttcttct gcaggctctg 300

aatggttttg ttctggttgt tacaaccgat gcactggttt tttatgcaag ctctacaatt 360

caggattatt tagggtttca acagagcgat gtgatacatc agtctgttta tgaattaatc 420

cacaccgagg accgtgcaga gtttcaaaga caactgcatt gggcactgaa cccaagccag 480

tgtaccgaga gcgggcaagg tatcgaggaa gcaaccggtc ttccacagac cgtggtttgt 540

tataatccgg atcagattcc gccagaaaat agccccctga tggaacgctg ttttatttgt 600

cgcctgagat gtttactgga caatagctca ggctttctgg caatgaactt tcagggtaaa 660

ctgaaatatc ttcacggtca gaagaaaaag ggtaaagatg gaagtattct gccgccgcaa 720

cttgcactgt ttgcaattgc aacccccctg cagcctccgt ctatcctgga aattcgcacc 780

aaaaatttta tctttcgtac caaacacaag ctggatttta cccccattgg ttgtgatgcc 840

aaaggtcgta ttgttttagg ctataccgaa gcagaactgt gcacccgggg ttcaggctat 900

cagtttattc atgcagcaga tatgctgtat tgtgccgaaa gccacattcg gatgattaag 960

acaggtgaaa gtgggatgat tgtttttcgt ctgcttacca aaaataaccg ttggacctgg 1020

gtgcagagca atgcacgttt attatataag aatggtcgtc cggactatat tattgttaca 1080

cagcggccgt taaccgacga ggagggtacc gaacatctgc gtaaacgcaa caccaaatta 1140

ccatttatgt ttaccaccgg tgaggcggtg ctgtatgaag caaccaaccc gtttccggca 1200

attatggacc ctttaccgct gcgtaccaaa aacggtacct caggtaaaga cagcgcgacc 1260

accagcacct taagcaaaga tagcctgaat cccagcagtc tgctggcagc tatgatgcag 1320

caggatgaaa gcatttatct gtatccagca agcagcacc 1359

<210> 7

<211> 1194

<212> DNA

<213> mAhR-1-DNA

<400> 7

atgagcagtg gagctaacat tacttacgcc tccaggaaga gaaggaagcc tgttcagaag 60

actgtgaagc caatccctgc cgagggtatt aaatccaacc cctccaagcg ccacagggac 120

agattgaaca ccgagctgga ccgcctggct agtttgttgc cattccccca ggacgtgatc 180

aacaagctcg acaaactgtc cgtgctgcgc ctgtctgtct cctacttgcg tgcaaagtcc 240

ttcttcgacg tggctttgaa atccaccccc gctgaccgta acggtggtca agatcaatgc 300

cgcgctcaga tccgcgactg gcaagatttg caggagggtg agttcctcct gcaggctttg 360

aacggattcg tgttggtggt caccgctgac gctctggttt tctacgcttc ctccaccatt 420

caggactacc tgggattcca acagagcgac gtgattcatc agtccgttta cgagctgatc 480

cacaccgagg accgcgctga atttcagcgt caattgcact gggctctgaa ccctgacagt 540

gctcagggtg tggacgaggc tcatggtcct cctcaagcag ctgtgtacta cacccccgac 600

cagttgcctc cagaaaacgc ttccttcatg gagcgctgtt tccgctgccg tctgagatgt 660

ctcctggata actcctccgg tttcctcgct atgaacttcc agggtcgcct gaagtacctc 720

cacggtcaaa acaaaaaggg taaggacgga gctttgctcc ctccccaact ggctttgttc 780

gctattgcca cccctctgca gcctccttct atcttggaaa ttcgcaccaa gaacttcatc 840

ttccgcacca agcacaagct cgacttcacc cctatcggtt gcgacgctaa gggtcagctg 900

atcctgggat acaccgaagt cgagctgtgc acccgtggtt ctggatacca attcatccac 960

gctgccgaca tgctgcactg cgctgaatct cacatccgta tgatcaagac tggtgagtcc 1020

ggtatgaccg tgttccgctt gttcgctaag cattctcgct ggcgctgggt ccaatcaaac 1080

gctagactga tctaccgtaa cggtcgcccc gactacatca tcgcaaccca aagacctctg 1140

accgacgagg agggtaggga acatctgcag aagaggagca cctccctgcc tttc 1194

<210> 8

<211> 2172

<212> DNA

<213> mHsp90-DNA

<400> 8

atgcctgagg aggtgcacca cggtgaagaa gaagtggaaa ccttcgcttt ccaggctgag 60

attgctcaac tgatgtccct catcatcaac accttctaca gcaacaagga gatcttcctg 120

agagagctga tcagcaacgc ttccgacgct ctggacaaaa tccgttacga gtccctgacc 180

gatccttcca aactggactc cggcaaagaa ctgaagatcg acatcatccc taaccctcag 240

gagcgcaccc tcacattggt ggataccggt atcggcatga caaaggcaga cctcatcaac 300

aacctgggca ccattgctaa aagcggaacc aaagccttca tggaggctct gcaagcaggt 360

gctgacatct ccatgattgg tcaattcggc gtgggtttct actccgctta cctcgtggcc 420

gagaaggtgg ttgtgatcac aaagcacaac gacgacgagc agtacgcttg ggagagcagt 480

gctggtggtt ccttcactgt cagggctgat cacggtgagc ctatcggtcg tggtaccaaa 540

gtgatcctgc atctgaagga ggaccaaacc gagtacctcg aagagcgcag ggtgaaggag 600

gtggttaaga agcacagcca gttcatcggt taccccatca cactgtactt ggagaaagag 660

cgcgaaaaag agatcagcga cgacgaagca gaggaagaaa agggtgagaa ggaagaggaa 720

gataaggagg acgaggagaa gccaaagatc gaggacgtgg gaagcgacga ggaggatgat 780

agcggaaagg acaagaagaa gaagacaaag aagatcaagg agaagtacat cgaccaggag 840

gagctgaaca agacaaagcc aatctggaca aggaaccctg acgacatcac acaggaggag 900

tacggagagt tctacaagag cctcacaaac gactgggagg accacctggc tgtgaagcat 960

ttcagcgtgg agggacagct ggagttcagg gctttgctgt tcatcccaag gagagcccct 1020

ttcgacctgt tcgagaacaa aaagaagaag aacaacatca aactgtacgt gcgccgcgtc 1080

ttcattatgg actcctgcga cgagctgatc cctgagtacc tgaacttcat ccgtggtgtg 1140

gtggactccg aagacctgcc tttgaacatc tcccgcgaga tgctgcagca gtccaagatc 1200

ctgaaggtga tcaggaagaa catcgtgaag aaatgcctgg agttgttctc cgagttggct 1260

gaagacaaag agaactacaa gaagttctac gaggcattct ccaagaacct gaagctgggt 1320

atccatgagg actccaccaa ccgccgtcgt ttgtctgagc tgctgcgtta ccacaccagc 1380

cagtctggtg acgagatgac ctccctgtcc gaatacgtgt cccgcatgaa ggaaactcag 1440

aaatcaattt actacatcac tggtgaatcc aaggagcaag tggctaactc cgctttcgtc 1500

gagcgtgtgc gtaagagagg tttcgaggtg gtgtacatga ccgagcccat cgacgaatac 1560

tgcgtccagc agctgaagga gttcgacggt aagtccttgg tgagcgtcac caaggagggt 1620

ctggagttgc cagaggatga ggaggagaag aagaagatgg aagagagcaa ggcaaagttc 1680

gagaacctct gcaagttgat gaaggagatc ctggacaaga aggtggagaa ggtgactatc 1740

agcaacaggc tggtgagcag tccatgctgc atcgtgacca gcacctacgg atggaccgca 1800

aacatggaga ggatcatgaa ggcacaagcc ctgcgcgaca acagcacaat gggatacatg 1860

atggcaaaaa agcacctgga gatcaaccct gaccacccta tcgtggagac cctgcgccag 1920

aaggctgagg ctgacaagaa cgacaaggct gtgaaggacc tggtggtgct gctgttcgag 1980

accgctctgc tgtcctccgg tttctccctg gaggaccctc agacccactc caaccgcatc 2040

taccgcatga tcaagctggg tctgggtatc gacgaggacg aggtgaccgc tgaggagcct 2100

tccgctgctg tgcctgacga gatccctcct ctggagggtg acgaggacgc ttcccgcatg 2160

gaggaggtgg ac 2172

<210> 9

<211> 990

<212> DNA

<213> mXAP2-DNA

<400> 9

atggccgatc tgattgctcg cttgcgtgag gacggtattc agaagagggt gatccaggag 60

ggtcgcggtg aattgcctga cttccaggat ggtacaaaag ccaccttcca cttccgcacc 120

ttgcactctg acaacgaggg tagtgtgatc gatgacagca gaacgagggg caaacctatg 180

gagttgatcg tgggtaaaaa gttcaaactg cccgtgtggg agaccatcgt gtgtactatg 240

cgcgagggtg agatcgctca gttcttgtgc gacatcaagc atgtggtgct gtaccctctg 300

gtggcgaagt ctctccgtaa catcgctgaa ggtaaggacc cactggaggg tcaacgccat 360

tgttgtggaa tcgctcaaat gcacgagcac agctccctcg gtcacgctga tttggacgct 420

ctgcagcaga acccacaacc gttgatcttc cacatcgaaa tgctgaaggt ggaatcccct 480

ggaacttacc agcaggaccc ctgggctatg accgatgaag agaaggctaa agcagtgcct 540

gtgatccacc aagaaggtaa ccgcctgtac cgcgagggtc aagttaagga ggctgccgct 600

aaatactacg acgctatcgc ttgtttgaag aacctgcaga tgaaggagca gcctggtagc 660

cctgactgga ttcaactgga tctgcagatt acacctctcc tgctgaacta ctgtcagtgc 720

aagctggtgg ctcaggaata ctacgaggtg ctggatcact gcagctccat cctgaacaaa 780

tacgacgaca acgtgaaagc ttacttcaaa cgcggtaaag ctcacgctgc tgtctggaac 840

gctcaggaag ctcaggctga cttcgctaaa gtgctcgaac tcgaccccgc cttggcacct 900

gttgtttcaa gggagttgcg cgctctcgaa actcgcatcc gtcagaaaga tgaggaggac 960

aaggctcgtt tccgcggaat cttctcccac 990

<210> 10

<211> 480

<212> DNA

<213> mP23-DNA

<400> 10

atgcagcctg cctccgctaa gtggtacgac agaagggact acgtgttcat cgagttctgc 60

gtggaggact ccaaggacgt gaacgtgaac ttcgagaagt ccaaattgac cttcagctgc 120

ctgggcggtt ccgataactt caagcacctg aacgaaatcg acctcttcca ttgtatcgat 180

ccaaacgact ccaaacacaa gaggactgac cgctccatcc tgtgctgctt gcgtaagggt 240

gagtctggtc agtcctggcc aagactgaca aaggagagag ctaagctcaa ctggctgtcc 300

gtggacttca acaactggaa agactgggaa gacgactccg acgaggacat gagcaacttc 360

gacaggttca gtgagatgat ggaccacatg ggaggagatg aagacgtgga tctgcctgag 420

gtggacggag ctgatgacga tagccaggac agcgacgacg agaagatgcc agacctggag 480

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号