公开/公告号CN114957488A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 中国科学院生物物理研究所;
申请/专利号CN202210573159.7
申请日2022-05-19
分类号C07K19/00(2006.01);C12N15/85(2006.01);C12N5/10(2006.01);G01N33/53(2006.01);G01N33/68(2006.01);
代理机构北京中强智尚知识产权代理有限公司 11448;
代理人黄耀威
地址 100101 北京市朝阳区大屯路15号
入库时间 2023-06-19 16:33:23
法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):C07K19/00 专利申请号:2022105731597 申请日:20220519
实质审查的生效
技术领域
本发明属于基因工程技术领域,涉及重组蛋白的生产方法和用途,具体为一种芳香烃受体蛋白稳定高效表达的方法及其应用。
背景技术
二恶英类化学物是一类毒性作用广泛,难以降解的物质,并且在环境中广泛存在,对人体危害很大。其中最典型的二恶英类污染物是2,3,7,8四氯二苯并二恶英(TCDD)。二恶英的高灵敏度检测对于我国环境保护和人体健康保护都有重要意义,尤其在国际贸易日益频繁的趋势下,可以减少外来货物携带二恶英的危害。传统二恶英检测方法主要是色谱和质谱技术,但是存在明显缺陷,例如检测费用昂贵,精度低,难度大等。近年来逐渐发展起来的生物芯片检测方法能够很好的弥补这些缺点,但是生物芯片中的核心组分——特异性结合二恶英类物质的蛋白质分子——却很难获得。其最佳的候选蛋白是芳香烃受体(Arylhydrocarbon receptor,AhR)蛋白,是生物体中天然结合二恶英类物质的蛋白质。因此,研究一种能够稳定制备芳香烃受体的工艺方法对于我国环境污染物的检测具有重要的意义。
AhR蛋白属于PER-ARNT-SIM(PAS)家族蛋白,是一类转录因子,介导了细胞对很多细胞代谢物和环境污染物的响应,与细胞毒性,血管发育,免疫发育等有着密切关系,是二恶英在生物体中唯一的响应分子。AhR在细胞胞质中,与分子伴侣等结合形成静息态复合物。当底物分子(如二恶英等)进入细胞后,AhR可以特异性结合底物,暴露出核定位信号,随后转移到细胞核内,与核转运蛋白ARNT形成激活态复合物,进而调节下游响应基因的表达。长久以来,AhR作为明星分子得到了广泛的研究,但是多数研究发现AhR的受体结构域(PAS-B)很难通过重组表达纯化获得稳定的蛋白产物,包含这段区域的蛋白原子结构也一直没有得到解析。最近,有一些研究组通过原核表达得到全长的AhR蛋白或者包含结合底物区域的AhR截短体蛋白(S.Uemura et al.,2020,J.Biochem;A.Stinn et al.,2021,Biosensors)。但是,这些研究要么是通过特殊的宿主细胞制备得到少量的AhR蛋白,要么是制备AhR结合ARNT蛋白的激活态复合体,都没有制备得到大量表达的稳定状态下的AhR静息态蛋白,无法用于生物芯片的用途。
发明内容
本发明目的在于提供一种芳香烃受体蛋白稳定高效表达的方法及其应用。
为实现上述目的,本发明采用技术方案为:
一种芳香烃受体蛋白稳定高效表达的方法,在芳香烃受体蛋白(AhR)表达中利用分子伴侣辅助AhR蛋白共同表达,即可实现AhR稳定高效表达;其中,芳香烃受体蛋白(AhR)与分子伴侣之间的质量比为1:1。
所述AhR蛋白为包含PAS-B结构域的氨基酸序列。
所述AhR蛋白为人源AhR或鼠源AhR。
所述分子伴侣为人源或鼠源的Hsp90,XAP2,p23中的一种或几种。
上述记载的AhR蛋白的序列选择。不同物种来源的AhR蛋白具有类似的结构域组成,从N端到C端分别包括bHLH结构域、PAS-A结构域,PAS-B结构域和TAD转录激活结构域。其中,PAS-B结构域是结合污染物小分子的功能区,因此重组表达的蛋白产物中必须包含PAS-B结构域。而其它的功能区可以根据目的的不同有所调整。比如bHLH/PAS-A/PAS-B的截短体(见实施例1),PAS-A/PAS-B的截短体,PAS-B/TAD的截短体,等等。而不同物种的AhR蛋白分子具有类似的功能和较高的序列同源性,可以根据具体的使用场景和使用需求选择不同物种来源的AhR蛋白序列,比如人源AhR(seq ID No.1),鼠源AhR(seq ID No.2,见实施例1)、牛源AhR等等。
同时,分子伴侣蛋白选择。生物体中的AhR蛋白能与多种分子伴侣结合形成稳定的静息态复合体结构,包括Hsp90,XAP2和p23等。其中,申请人发现Hsp90蛋白对于AhR的表达效率和蛋白稳定性具有最重要的辅助作用。不同物种来源的Hsp90蛋白具有类似的序列和结构,可以根据具体的使用场景和使用需求选择不同物种来源的Hsp90蛋白,比如人源Hsp90,鼠源Hsp90(seq ID No.3,见实施例1),牛源Hsp90等。
进一步的所述的芳香烃受体AhR蛋白为SEQ ID No.1、SEQ ID No.2的任一个所示的氨基酸序列,或前述任一个氨基酸序列中取代、添加、或缺失了1或多个氨基酸残基的氨基酸序列,或者与SEQ ID No.1、SEQ ID No.2的任一个所示的氨基酸序列具有80%以上序列同一性的序列;或SEQ ID No.1、SEQ ID No.2分别进一步优化的氨基酸序列,其中所述AhR蛋白具有结合污染物小分子的活性。
所述的分子伴侣,其可以选择不同物种来源的不同种类分子伴侣蛋白。优选的,所述分子伴侣包括Hsp90(SEQ ID No.3),XPA2(SEQ ID No.4),P23(SEQ ID No.5)等,包括SEQID No.3,SEQ ID No.4和SEQ ID No.5的任一个所示的氨基酸序列,或前述任一个氨基酸序列中取代、添加、或缺失了1或多个氨基酸的氨基酸序列,或者与SEQ ID No.3,SEQ ID No.4和SEQ ID No.5的任一个所示的氨基酸序列具有80%以上序列同一性的序列,或SEQ IDNo.3,SEQ ID No.4、SEQ ID No.5分别进一步优化的氨基酸序列。
所述芳香烃受体蛋白进一步优选包含SEQ ID No.6、SEQ ID No.7、SEQ ID No.8、SEQ ID No.9、或SEQ ID No.10所示的核苷酸序列。
芳香烃受体蛋白稳定高效表达的方法,所述将分子伴侣与AhR蛋白共同构建到同一载体上共同表达;或,将分子伴侣与AhR蛋白分别构建到相同的载体上,而后共转染宿主细胞进行共同表达;或,在表达体系中加入纯化的分子伴侣蛋白和AhR蛋白进行共表达。
一种稳定高效表达的芳香烃受体蛋白,按所述的方法获得稳定高效表达的芳香烃受体蛋白。
一种所述方法稳定高效表达的芳香烃受体蛋白的应用,上述所述的方法获得稳定高效表达的芳香烃受体蛋白在检测污染物中的应用。
一种检测污染物二恶英类化学物质的表达载体,所述载体含上述所述方法获得稳定高效表达的芳香烃受体蛋白。
所述将分子伴侣与AhR蛋白分别或共同构建到相同的载体上共同表达,其中,载体为pFastBac-Dual载体,pETDuet-1载体,pBudCE4.1载体。
一种检测污染物二恶英类化学物质的宿主细胞,所述宿主细胞含上述所述方法获得稳定高效表达的芳香烃受体蛋白。
所述宿主细胞为昆虫细胞、大肠杆菌或酵母菌。
上述检测二恶英类化学物质的蛋白可以制备成药物组合物、医疗器材、生物芯片产品、组织工程产品、化妆品或保健品,检测用品等。
与现有技术相比,本发明具有以下特点:
本发明利用特定分子伴侣Hsp90辅助AhR蛋白使其稳定高效表达,利用所得蛋白具有特异性结合污染物小分子的活性,用于环境污染物的检测,本发明生产工艺简单,易于推广,对于开发成为环境污染物检测的各种设备具有广泛应的应用前景;具体为:
(1)本发明首次通过优选分子伴侣辅助实现AhR蛋白受体结合区的稳定高效表达。
(2)本发明制备的AhR蛋白复合体处于静息态,实验证实其可以识别结合污染物小分子,具有生物活性。
(3)本发明制备工艺简单,蛋白性质良好,在环境污染物检测等方面有广泛的应用前景。
附图说明
图1为利用本发明纯化得到的AhR蛋白与分子伴侣结合复合体的SDS-PAGE电泳图,Hsp90,XAP2和p23分子伴侣与AhR稳定结合并一同纯化得到。
图2为利用本发明纯化得到的AhR蛋白复合体Native-Page电泳图,显示出分子伴侣与AhR蛋白稳定结合成为均一的蛋白复合体。
图3为利用本发明纯化得到的AhR蛋白复合体在分子排阻色谱检测中呈现单一主峰,显示出分子伴侣与AhR蛋白稳定结合成为均一的蛋白复合体。
图4为利用本发明纯化得到的AhR蛋白复合体的肽指纹图谱检测结果。红色表示MALDI质谱检测到的肽段,序列为AhR目的蛋白的理论序列,证明蛋白复合体中存在AhR目的蛋白,尤其是包含PAS-B结构域。
图5为利用Orbitrap质谱分析本发明纯化得到的AhR蛋白复合体中的蛋白组成,显示出复合体中存在AhR,Hsp90,XAP2和P23等组分。
图6为利用微量热泳动MST分析本发明纯化得到的AhR蛋白复合体结合污染物小分子TCDD的检测结果。显示出复合体中的AhR蛋白可以高效结合TCDD小分子。
图7为冻存细胞图。
具体实施方式
提供以下实施例来阐述本发明。本领域技术人员应当理解实施例仅仅是例示性的而非限制性的。本发明仅仅由所附权利要求书的范围限定。
同时下文提供进一步的描述以便于理解本发明。
本发明针对AhR蛋白单独表达容易形成包涵体的问题,通过在表达体系中加入合适的分子伴侣蛋白(如Hsp90),可以实现可溶性稳定表达AhR蛋白的目的。其中,AhR蛋白可以选择不同物种来源的包含PAS-B结构域的氨基酸序列,分子伴侣可以选择不同物种来源的Hsp90蛋白,XAP2蛋白和P23蛋白等氨基酸序列。该方法制备得到的AhR蛋白性质均一,稳定性好,具有结合污染物小分子的活性,可用于开发成为环境污染物检测的各种设备等用途。
在本发明中,所选的AhR蛋白可以来源于多种物种,因为不同物种来源的AhR蛋白都包含有结合污染物小分子的PAS-B结构域,都可以发挥类似的功能。例如,对于人AhR蛋白的序列,参考Uniprot数据库中的序列(
上述序列中粗体下划线部分即为本发明选择的氨基酸序列(SEQ ID No.1),包含PAS-B受体结合区,命名为hAhR-1序列。其对应的根据昆虫表达系统优化的DNA序列为SEQID No.6。
对于鼠AhR蛋白的序列,参考Uniprot数据库中的序列(
上述序列中粗体下划线部分即为本发明选择的氨基酸序列(SEQ ID No.2),包含PAS-B受体结合区,命名为mAhR-1序列。其对应的根据昆虫表达系统优化的DNA序列为SEQID No.7。
在本发明中,所选的分子伴侣可以为来源于不同物种不同种类的分子伴侣,都可以帮助AhR可溶性表达,包括Hsp90,XAP2和p23等。其中,本申请选用Hsp90蛋白,同时不同物种的Hsp90蛋白,其结构和功能基本相同,都可以起到类似的效果。
下述实施例1中选用的是鼠源AhR蛋白序列,参考Uniprot数据库中的序列(
MPEEVHHGEEEVETFAFQAEIAQLMSLIINTFYSNKEIFLRELISNASDALDKIRYESLTDPSKLDSGKELKIDIIPNPQERTLTLVDTGIGMTKADLINNLGTIAKSGTKAFMEALQAGADISMIGQFGVGFYSAYLVAEKVVVITKHNDDEQYAWESSAGGSFTVRADHGEPIGRGTKVILHLKEDQTEYLEERRVKEVVKKHSQFIGYPITLYLEKEREKEISDDEAEEEKGEKEEEDKEDEEKPKIEDVGSDEEDDSGKDKKKKTKKIKEKYIDQEELNKTKPIWTRNPDDITQEEYGEFYKSLTNDWEDHLAVKHFSVEGQLEFRALLFIPRRAPFDLFENKKKKNNIKLYVRRVFIMDSCDELIPEYLNFIRGVVDSEDLPLNISREMLQQSKILKVIRKNIVKKCLELFSELAEDKENYKKFYEAFSKNLKLGIHEDSTNRRRLSELLRYHTSQSGDEMTSLSEYVSRMKETQKSIYYITGESKEQVANSAFVERVRKRGFEVVYMTEPIDEYCVQQLKEFDGKSLVSVTKEGLELPEDEEEKKKMEESKAKFENLCKLMKEILDKKVEKVTISNRLVSSPCCIVTSTYGWTANMERIMKAQALRDNSTMGYMMAKKHLEINPDHPIVETLRQKAEADKNDKAVKDLVVLLFETALLSSGFSLEDPQTHSNRIYRMIKLGLGIDEDEVTAEEPSAAVPDEIPPLEGDEDASRMEEVD
上述序列即为本发明选择的氨基酸序列(SEQ ID No.3),命名为mHsp90,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.8。
此外,不同物种来源的XAP2和P23也对AhR的重组表达有辅助作用。例如,实施例1中选用的是鼠源的XAP2蛋白,参考Uniprot数据库中的序列(
MADLIARLREDGIQKRVIQEGRGELPDFQDGTKATFHFRTLHSDNEGSVIDDSRTRGKPMELIVGKKFKLPVWETIVCTMREGEIAQFLCDIKHVVLYPLVAKSLRNIAEGKDPLEGQRHCCGIAQMHEHSSLGHADLDALQQNPQPLIFHIEMLKVESPGTYQQDPWAMTDEEKAKAVPVIHQEGNRLYREGQVKEAAAKYYDAIACLKNLQMKEQPGSPDWIQLDLQITPLLLNYCQCKLVAQEYYEVLDHCSSILNKYDDNVKAYFKRGKAHAAVWNAQEAQADFAKVLELDPALAPVVSRELRALETRIRQKDEEDKARFRGIFSH
上述粗体下划线部分序列即为本发明选择的氨基酸序列(SEQ ID No.4),命名为mXAP2,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.9。
实施例1中还选用了是鼠源的P23蛋白,参考Uniprot数据库中的序列(
MQPASAKWYDRRDYVFIEFCVEDSKDVNVNFEKSKLTFSCLGGSDNFKHLNEIDLFHCIDPNDSKHKRTDRSILCCLRKGESGQSWPRLTKERAKLNWLSVDFNNWKDWEDDSDEDMSNFDRFSEMMDHMGGDEDVDLPEVDGADDDSQDSDDEKMPDLE
上述序列即为本发明选择的氨基酸序列(SEQ ID No.5),命名为mP23,其对应的根据昆虫表达系统优化的DNA序列为SEQ ID No.10。
实施例1 AhR蛋白的昆虫细胞表达方法
1.根据昆虫表达系统偏好的密码子特点,对mAhR-1(SEQ ID No.2),mHsp90(SEQID No.3),mXAP2(SEQ ID No.4),mP23(SEQ ID No.5)蛋白对应的基因序列进行优化,进行基因合成,即,优化后序列依次为SEQ ID No.7,SEQ ID No.8,SEQ ID No.9,SEQ ID No.10。
2.将pFastBac-Dual载体质粒用限制性内切酶XhoI线性化,37℃酶切3小时,随后加入碱性磷酸酶37℃孵育0.5小时,再用DNA胶回收试剂盒进行纯化。
3.用引物SEQ ID No.11和SEQ ID No.12PCR扩增mAhR-1的DNA序列片段(SEQ IDNo.7),扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃45秒(步骤②,③循环30次);④72℃5分钟。保证目的序列两端与线性化后的载体两端有26-30个碱基的重合区域,并且在序列的N端直接合成Strep标签用于纯化蛋白。将线性化的载体与mAhR-1的DNA序列片段按摩尔比1:1.2混合,加入NEBuilder DNA自组装混合液试剂,50℃孵育1小时,70℃孵育10分钟,随后将自组装的DNA产物转化到DH5α感受态。
4.挑取转化后的单菌落,并鉴定阳性克隆菌,提取得到pFastBac-Dual-mAhR质粒。
5.在制得pFastBac-Dual-mAhR质粒的基础上,将该载体用限制性内切酶NotI线性化,用引物SEQ ID No.13和SEQ ID No.14PCR扩增mHsp90的DNA序列片段(SEQ ID No.8),扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃75秒(步骤②,③循环30次);④72℃5分钟。随后用DNA自组装混合液试剂组装pFastBac-Dual-mAhR质粒和mHsp90DNA片段,并转化到DH5α感受态。挑取转化后的单菌落,并鉴定阳性克隆菌,提取得到pFastBac-Dual-mAhR-mHsp90质粒。
6.用类似的方法将mXAP2(引物SEQ ID No.15和SEQ ID No.16),mP23(引物SEQ IDNo.17和SEQ ID No.18)蛋白的DNA序列构建到另一个pFastBac-Dual载体质粒上,扩增时所用PCR酶为NEB产品Q5聚合酶,扩增条件为①98℃,2分钟;②98℃,10秒;③72℃60秒(步骤②,③循环30次);④72℃5分钟。构建质粒的其他实验流程均与步骤3,4,5中相同,得到pFastBac-Dual-mXAP2-mP23质粒。
7.将上述制得的pFastBac-Dual-mAhR-mHsp90和pFastBac-Dual-mXAP2-mP23质粒分别转化到DH10Bac感受态中,经过蓝白斑筛选得到阳性克隆,并提取杆粒。
8.取2毫升培养在昆虫细胞培养基(壹生科IB905培养基;货号L11001;后续所述培养基均为此培养基)中的健康的昆虫细胞(本实施例采用草地贪夜蛾sf9细胞),加入到35毫米塑料平皿中,静置2小时使细胞贴壁。2小时后将平皿中的培养基吸出,加入1毫升上述记载昆虫细胞培养基培养基。取3微克两种不同构建的杆粒分别与8微升转染试剂(GibcoCellfectin试剂,货号10362100)混合孵育20分钟,随后将混合液加入到铺满昆虫细胞(本实施例采用草地贪夜蛾sf9细胞)的平皿中,过夜后分别往平皿添加1毫升添加链霉素和青霉素的上述记载昆虫细胞培养基培养基。
9. 6-7天后收取上清液,即为P1病毒浓缩液。取100微升加入200毫升健康的昆虫细胞(本实施例采用草地贪夜蛾sf9细胞)中,4-5天后待细胞死亡率达到50%,收取上清液,即为P2病毒浓缩液。
10.两种杆粒制得的P2病毒浓缩液各取10毫升,加入到600毫升健康的昆虫细胞中进行大量表达,48小时后2000g离心收取细胞,可以立即使用或冻于负80℃冰箱保存(参见图7)。
实施例2 AhR蛋白的提纯
1.用缓冲液(30mM HEPES,PH7.5,20mM NaCl,10mM MgCl
2.超声完后破碎液用高速离心机16000转离心30分钟,弃去沉淀,留下上清液。将装有Strep介质的重力柱用缓冲液清洗两遍,放到4℃冰箱冷却。
3.离心后的将不同分子伴侣辅助表达AhR蛋白的昆虫细胞的上清液加入到装有Strep介质的直径1厘米,长度20厘米的重力柱中自然流穿,流穿液再次加到重力柱中,重复3-4次,使mAhR充分结合到Strep介质上。然后将缓冲液(30mM HEPES,PH7.5,20mM NaCl,10mM MgCl
4.将洗脱的蛋白浓缩至300微升过分子筛(如Superdex
5.将分子筛出峰位置的组分浓缩后进行SDS-PAGE电泳(参见图1)和Native-PAGE电泳(参见图2),可以证实经过上述步骤得到的是mAhR复合物,且在非变性条件下组分均一。
实施例3 AhR蛋白及完整复合物的鉴定
1)将SDS-PAGE胶上对应于50KD左右的条带切下来,经DTT还原和碘代乙酰胺烷基化处理后,加入胰蛋白酶酶解过夜。酶解后得到的肽段再经C18ZipTip脱盐后,与基质α-cyano-4-hydroxycinnamic acid(CHCA)混合点板。最后用基质辅助激光解析电离-飞行时间质谱仪MALDI-TOF/TOF UltraflextremeTM,Brucker,Germany进行分析。
2)通过从www.matrixscience.com网站上Peptide Mass Fingerprint页面进行数据库检索。蛋白质鉴定结果根据酶解后所产生的肽段的一级质谱得到。检索参数:Trypsin酶解,设两个漏切位点。设定半胱氨酸的烷基化为固定修饰,甲硫氨酸的氧化为可变修饰。鉴定所用的数据库为Swissprot NCBIProt(参见图4)。
3)将Native-PAGE胶上蛋白复合物的那条带切下来,经脱色、DTT还原和碘代乙酰胺烷基化处理后,加入胰蛋白酶酶解过夜,再利用60%乙腈萃取肽段。酶解后得到的肽段混合物通过液相色谱-线性离子阱-轨道阱(nanoLC-LTQ-Orbitrap XL,Thermo,San Jose,CA)质谱联用仪进行分析。色谱分析柱为实验室填制C18反相柱,分析柱内径75微米长15厘米,采用3微米ReproSil-Pur C18-AQ((Dr.Maisch GmbH,Ammerbuch)填料填充,上样柱为内径150微米长3厘米,采用5u ReproSil-Pur C18-AQ((Dr.Maisch GmbH,Ammerbuch)填料填充。流动相为A:0.1%FA/H2O,B:0.1%FA/80%ACN,流速为300纳升每分钟。采用90分钟梯度。
4)数据分析采用Proteome Discoverer(version 1.4.0.288,Thermo FischerScientific)软件分析。MS2谱图使用SEQUEST搜索引擎搜索Uniprot_proteome_mouse_2019数据库。检索参数:Trypsin酶解,设两个漏切位点,前体离子质量误差小于20ppm,碎片离子质量误差小于0.6Da。设定半光氨酸的烷基化为固定修饰,甲硫氨酸的氧化为可变修饰。检索的肽段和谱图匹配(PSM)采用Percolator算法进行过滤,q值小于1%(1%的FDR)。检索后的肽段利用严格的最大简约原则合并成蛋白(参见图5)。
进而,由图5可见,本技术可以成功纯化出AhR与分子伴侣的复合体。
实施例4 AhR蛋白的活性验证
1.用MonolithTM RED-NHS二代蛋白标记试剂盒(nanotemper公司试剂盒;货号:MO-L011)标记上述获得蛋白复合物。
2.准备16个EP管,依次标记1-16号。取5微升缓冲液(30mM HEPES,PH7.5,20mMNaCl,10mM MgCl
3.每个EP管加入5微升1微摩尔的标记好的蛋白复合物混匀,用毛细管上样。用MonolithTM NT.115仪器的Binding Affinity模式测定kd值(参见图6)。
由图6可见,本技术纯化出的AhR与分子伴侣的复合体有结合底物小分子TCDD的活性。
序列
SEQ ID NO.1(hAhR-1)
VKPIPAEGIKSNPSKRHRDRLNTELDRLASLLPFPQDVINKLDKLSVLRLSVSYLRAKSFFDVALKSSPTERNGGQDNCRAANFREGLNLQEGEFLLQALNGFVLVVTTDALVFYASSTIQDYLGFQQSDVIHQSVYELIHTEDRAEFQRQLHWALNPSQCTESGQGIEEATGLPQTVVCYNPDQIPPENSPLMERCFICRLRCLLDNSSGFLAMNFQGKLKYLHGQKKKGKDGSILPPQLALFAIATPLQPPSILEIRTKNFIFRTKHKLDFTPIGCDAKGRIVLGYTEAELCTRGSGYQFIHAADMLYCAESHIRMIKTGESGMIVFRLLTKNNRWTWVQSNARLLYKNGRPDYIIVTQRPLTDEEGTEHLRKRNTKLPFMFTTGEAVLYEATNPFPAIMDPLPLRTKNGTSGKDSATTSTLSKDSLNPSSLLAAMMQQDESIYLYPASST
SEQ ID NO.2(mAhR-1)
MSSGANITYASRKRRKPVQKTVKPIPAEGIKSNPSKRHRDRLNTELDRLASLLPFPQDVINKLDKLSVLRLSVSYLRAKSFFDVALKSTPADRNGGQDQCRAQIRDWQDLQEGEFLLQALNGFVLVVTADALVFYASSTIQDYLGFQQSDVIHQSVYELIHTEDRAEFQRQLHWALNPDSAQGVDEAHGPPQAAVYYTPDQLPPENASFMERCFRCRLRCLLDNSSGFLAMNFQGRLKYLHGQNKKGKDGALLPPQLALFAIATPLQPPSILEIRTKNFIFRTKHKLDFTPIGCDAKGQLILGYTEVELCTRGSGYQFIHAADMLHCAESHIRMIKTGESGMTVFRLFAKHSRWRWVQSNARLIYRNGRPDYIIATQRPLTDEEGREHLQKRSTSLPF
SEQ ID NO.3(mHsp90)
MPEEVHHGEEEVETFAFQAEIAQLMSLIINTFYSNKEIFLRELISNASDALDKIRYESLTDPSKLDSGKELKIDIIPNPQERTLTLVDTGIGMTKADLINNLGTIAKSGTKAFMEALQAGADISMIGQFGVGFYSAYLVAEKVVVITKHNDDEQYAWESSAGGSFTVRADHGEPIGRGTKVILHLKEDQTEYLEERRVKEVVKKHSQFIGYPITLYLEKEREKEISDDEAEEEKGEKEEEDKEDEEKPKIEDVGSDEEDDSGKDKKKKTKKIKEKYIDQEELNKTKPIWTRNPDDITQEEYGEFYKSLTNDWEDHLAVKHFSVEGQLEFRALLFIPRRAPFDLFENKKKKNNIKLYVRRVFIMDSCDELIPEYLNFIRGVVDSEDLPLNISREMLQQSKILKVIRKNIVKKCLELFSELAEDKENYKKFYEAFSKNLKLGIHEDSTNRRRLSELLRYHTSQSGDEMTSLSEYVSRMKETQKSIYYITGESKEQVANSAFVERVRKRGFEVVYMTEPIDEYCVQQLKEFDGKSLVSVTKEGLELPEDEEEKKKMEESKAKFENLCKLMKEILDKKVEKVTISNRLVSSPCCIVTSTYGWTANMERIMKAQALRDNSTMGYMMAKKHLEINPDHPIVETLRQKAEADKNDKAVKDLVVLLFETALLSSGFSLEDPQTHSNRIYRMIKLGLGIDEDEVTAEEPSAAVPDEIPPLEGDEDASRMEEVD
SEQ ID NO.4(mXAP2)
MADLIARLREDGIQKRVIQEGRGELPDFQDGTKATFHFRTLHSDNEGSVIDDSRTRGKPMELIVGKKFKLPVWETIVCTMREGEIAQFLCDIKHVVLYPLVAKSLRNIAEGKDPLEGQRHCCGIAQMHEHSSLGHADLDALQQNPQPLIFHIEMLKVESPGTYQQDPWAMTDEEKAKAVPVIHQEGNRLYREGQVKEAAAKYYDAIACLKNLQMKEQPGSPDWIQLDLQITPLLLNYCQCKLVAQEYYEVLDHCSSILNKYDDNVKAYFKRGKAHAAVWNAQEAQADFAKVLELDPALAPVVSRELRALETRIRQKDEEDKARFRGIFSH
SEQ ID NO.5(mP23)
MQPASAKWYDRRDYVFIEFCVEDSKDVNVNFEKSKLTFSCLGGSDNFKHLNEIDLFHCIDPNDSKHKRTDRSILCCLRKGESGQSWPRLTKERAKLNWLSVDFNNWKDWEDDSDEDMSNFDRFSEMMDHMGGDEDVDLPEVDGADDDSQDSDDEKMPDLE
SEQ ID No.6(hAhR-1-DNA)
GTAAAACCTATTCCGGCAGAAGGCATTAAAAGCAACCCGAGCAAAAGACATCGTGACCGGTTAAATACAGAGCTGGATCGTCTGGCAAGCCTTTTACCGTTCCCGCAGGATGTTATTAATAAACTGGACAAACTGAGTGTACTGCGCCTGAGCGTTAGCTATTTACGTGCTAAAAGTTTTTTCGACGTGGCTCTGAAATCTAGTCCGACCGAGCGTAATGGTGGGCAGGATAACTGCCGGGCAGCAAACTTTCGCGAAGGTCTGAATTTACAGGAGGGGGAATTTCTTCTGCAGGCTCTGAATGGTTTTGTTCTGGTTGTTACAACCGATGCACTGGTTTTTTATGCAAGCTCTACAATTCAGGATTATTTAGGGTTTCAACAGAGCGATGTGATACATCAGTCTGTTTATGAATTAATCCACACCGAGGACCGTGCAGAGTTTCAAAGACAACTGCATTGGGCACTGAACCCAAGCCAGTGTACCGAGAGCGGGCAAGGTATCGAGGAAGCAACCGGTCTTCCACAGACCGTGGTTTGTTATAATCCGGATCAGATTCCGCCAGAAAATAGCCCCCTGATGGAACGCTGTTTTATTTGTCGCCTGAGATGTTTACTGGACAATAGCTCAGGCTTTCTGGCAATGAACTTTCAGGGTAAACTGAAATATCTTCACGGTCAGAAGAAAAAGGGTAAAGATGGAAGTATTCTGCCGCCGCAACTTGCACTGTTTGCAATTGCAACCCCCCTGCAGCCTCCGTCTATCCTGGAAATTCGCACCAAAAATTTTATCTTTCGTACCAAACACAAGCTGGATTTTACCCCCATTGGTTGTGATGCCAAAGGTCGTATTGTTTTAGGCTATACCGAAGCAGAACTGTGCACCCGGGGTTCAGGCTATCAGTTTATTCATGCAGCAGATATGCTGTATTGTGCCGAAAGCCACATTCGGATGATTAAGACAGGTGAAAGTGGGATGATTGTTTTTCGTCTGCTTACCAAAAATAACCGTTGGACCTGGGTGCAGAGCAATGCACGTTTATTATATAAGAATGGTCGTCCGGACTATATTATTGTTACACAGCGGCCGTTAACCGACGAGGAGGGTACCGAACATCTGCGTAAACGCAACACCAAATTACCATTTATGTTTACCACCGGTGAGGCGGTGCTGTATGAAGCAACCAACCCGTTTCCGGCAATTATGGACCCTTTACCGCTGCGTACCAAAAACGGTACCTCAGGTAAAGACAGCGCGACCACCAGCACCTTAAGCAAAGATAGCCTGAATCCCAGCAGTCTGCTGGCAGCTATGATGCAGCAGGATGAAAGCATTTATCTGTATCCAGCAAGCAGCACC
SEQ ID No.7(mAhR-1-DNA)
ATGAGCAGTGGAGCTAACATTACTTACGCCTCCAGGAAGAGAAGGAAGCCTGTTCAGAAGACTGTGAAGCCAATCCCTGCCGAGGGTATTAAATCCAACCCCTCCAAGCGCCACAGGGACAGATTGAACACCGAGCTGGACCGCCTGGCTAGTTTGTTGCCATTCCCCCAGGACGTGATCAACAAGCTCGACAAACTGTCCGTGCTGCGCCTGTCTGTCTCCTACTTGCGTGCAAAGTCCTTCTTCGACGTGGCTTTGAAATCCACCCCCGCTGACCGTAACGGTGGTCAAGATCAATGCCGCGCTCAGATCCGCGACTGGCAAGATTTGCAGGAGGGTGAGTTCCTCCTGCAGGCTTTGAACGGATTCGTGTTGGTGGTCACCGCTGACGCTCTGGTTTTCTACGCTTCCTCCACCATTCAGGACTACCTGGGATTCCAACAGAGCGACGTGATTCATCAGTCCGTTTACGAGCTGATCCACACCGAGGACCGCGCTGAATTTCAGCGTCAATTGCACTGGGCTCTGAACCCTGACAGTGCTCAGGGTGTGGACGAGGCTCATGGTCCTCCTCAAGCAGCTGTGTACTACACCCCCGACCAGTTGCCTCCAGAAAACGCTTCCTTCATGGAGCGCTGTTTCCGCTGCCGTCTGAGATGTCTCCTGGATAACTCCTCCGGTTTCCTCGCTATGAACTTCCAGGGTCGCCTGAAGTACCTCCACGGTCAAAACAAAAAGGGTAAGGACGGAGCTTTGCTCCCTCCCCAACTGGCTTTGTTCGCTATTGCCACCCCTCTGCAGCCTCCTTCTATCTTGGAAATTCGCACCAAGAACTTCATCTTCCGCACCAAGCACAAGCTCGACTTCACCCCTATCGGTTGCGACGCTAAGGGTCAGCTGATCCTGGGATACACCGAAGTCGAGCTGTGCACCCGTGGTTCTGGATACCAATTCATCCACGCTGCCGACATGCTGCACTGCGCTGAATCTCACATCCGTATGATCAAGACTGGTGAGTCCGGTATGACCGTGTTCCGCTTGTTCGCTAAGCATTCTCGCTGGCGCTGGGTCCAATCAAACGCTAGACTGATCTACCGTAACGGTCGCCCCGACTACATCATCGCAACCCAAAGACCTCTGACCGACGAGGAGGGTAGGGAACATCTGCAGAAGAGGAGCACCTCCCTGCCTTTC
SEQ ID No.8(mHsp90-DNA)
ATGCCTGAGGAGGTGCACCACGGTGAAGAAGAAGTGGAAACCTTCGCTTTCCAGGCTGAGATTGCTCAACTGATGTCCCTCATCATCAACACCTTCTACAGCAACAAGGAGATCTTCCTGAGAGAGCTGATCAGCAACGCTTCCGACGCTCTGGACAAAATCCGTTACGAGTCCCTGACCGATCCTTCCAAACTGGACTCCGGCAAAGAACTGAAGATCGACATCATCCCTAACCCTCAGGAGCGCACCCTCACATTGGTGGATACCGGTATCGGCATGACAAAGGCAGACCTCATCAACAACCTGGGCACCATTGCTAAAAGCGGAACCAAAGCCTTCATGGAGGCTCTGCAAGCAGGTGCTGACATCTCCATGATTGGTCAATTCGGCGTGGGTTTCTACTCCGCTTACCTCGTGGCCGAGAAGGTGGTTGTGATCACAAAGCACAACGACGACGAGCAGTACGCTTGGGAGAGCAGTGCTGGTGGTTCCTTCACTGTCAGGGCTGATCACGGTGAGCCTATCGGTCGTGGTACCAAAGTGATCCTGCATCTGAAGGAGGACCAAACCGAGTACCTCGAAGAGCGCAGGGTGAAGGAGGTGGTTAAGAAGCACAGCCAGTTCATCGGTTACCCCATCACACTGTACTTGGAGAAAGAGCGCGAAAAAGAGATCAGCGACGACGAAGCAGAGGAAGAAAAGGGTGAGAAGGAAGAGGAAGATAAGGAGGACGAGGAGAAGCCAAAGATCGAGGACGTGGGAAGCGACGAGGAGGATGATAGCGGAAAGGACAAGAAGAAGAAGACAAAGAAGATCAAGGAGAAGTACATCGACCAGGAGGAGCTGAACAAGACAAAGCCAATCTGGACAAGGAACCCTGACGACATCACACAGGAGGAGTACGGAGAGTTCTACAAGAGCCTCACAAACGACTGGGAGGACCACCTGGCTGTGAAGCATTTCAGCGTGGAGGGACAGCTGGAGTTCAGGGCTTTGCTGTTCATCCCAAGGAGAGCCCCTTTCGACCTGTTCGAGAACAAAAAGAAGAAGAACAACATCAAACTGTACGTGCGCCGCGTCTTCATTATGGACTCCTGCGACGAGCTGATCCCTGAGTACCTGAACTTCATCCGTGGTGTGGTGGACTCCGAAGACCTGCCTTTGAACATCTCCCGCGAGATGCTGCAGCAGTCCAAGATCCTGAAGGTGATCAGGAAGAACATCGTGAAGAAATGCCTGGAGTTGTTCTCCGAGTTGGCTGAAGACAAAGAGAACTACAAGAAGTTCTACGAGGCATTCTCCAAGAACCTGAAGCTGGGTATCCATGAGGACTCCACCAACCGCCGTCGTTTGTCTGAGCTGCTGCGTTACCACACCAGCCAGTCTGGTGACGAGATGACCTCCCTGTCCGAATACGTGTCCCGCATGAAGGAAACTCAGAAATCAATTTACTACATCACTGGTGAATCCAAGGAGCAAGTGGCTAACTCCGCTTTCGTCGAGCGTGTGCGTAAGAGAGGTTTCGAGGTGGTGTACATGACCGAGCCCATCGACGAATACTGCGTCCAGCAGCTGAAGGAGTTCGACGGTAAGTCCTTGGTGAGCGTCACCAAGGAGGGTCTGGAGTTGCCAGAGGATGAGGAGGAGAAGAAGAAGATGGAAGAGAGCAAGGCAAAGTTCGAGAACCTCTGCAAGTTGATGAAGGAGATCCTGGACAAGAAGGTGGAGAAGGTGACTATCAGCAACAGGCTGGTGAGCAGTCCATGCTGCATCGTGACCAGCACCTACGGATGGACCGCAAACATGGAGAGGATCATGAAGGCACAAGCCCTGCGCGACAACAGCACAATGGGATACATGATGGCAAAAAAGCACCTGGAGATCAACCCTGACCACCCTATCGTGGAGACCCTGCGCCAGAAGGCTGAGGCTGACAAGAACGACAAGGCTGTGAAGGACCTGGTGGTGCTGCTGTTCGAGACCGCTCTGCTGTCCTCCGGTTTCTCCCTGGAGGACCCTCAGACCCACTCCAACCGCATCTACCGCATGATCAAGCTGGGTCTGGGTATCGACGAGGACGAGGTGACCGCTGAGGAGCCTTCCGCTGCTGTGCCTGACGAGATCCCTCCTCTGGAGGGTGACGAGGACGCTTCCCGCATGGAGGAGGTGGAC
SEQ ID No.9(mXAP2-DNA)
ATGGCCGATCTGATTGCTCGCTTGCGTGAGGACGGTATTCAGAAGAGGGTGATCCAGGAGGGTCGCGGTGAATTGCCTGACTTCCAGGATGGTACAAAAGCCACCTTCCACTTCCGCACCTTGCACTCTGACAACGAGGGTAGTGTGATCGATGACAGCAGAACGAGGGGCAAACCTATGGAGTTGATCGTGGGTAAAAAGTTCAAACTGCCCGTGTGGGAGACCATCGTGTGTACTATGCGCGAGGGTGAGATCGCTCAGTTCTTGTGCGACATCAAGCATGTGGTGCTGTACCCTCTGGTGGCGAAGTCTCTCCGTAACATCGCTGAAGGTAAGGACCCACTGGAGGGTCAACGCCATTGTTGTGGAATCGCTCAAATGCACGAGCACAGCTCCCTCGGTCACGCTGATTTGGACGCTCTGCAGCAGAACCCACAACCGTTGATCTTCCACATCGAAATGCTGAAGGTGGAATCCCCTGGAACTTACCAGCAGGACCCCTGGGCTATGACCGATGAAGAGAAGGCTAAAGCAGTGCCTGTGATCCACCAAGAAGGTAACCGCCTGTACCGCGAGGGTCAAGTTAAGGAGGCTGCCGCTAAATACTACGACGCTATCGCTTGTTTGAAGAACCTGCAGATGAAGGAGCAGCCTGGTAGCCCTGACTGGATTCAACTGGATCTGCAGATTACACCTCTCCTGCTGAACTACTGTCAGTGCAAGCTGGTGGCTCAGGAATACTACGAGGTGCTGGATCACTGCAGCTCCATCCTGAACAAATACGACGACAACGTGAAAGCTTACTTCAAACGCGGTAAAGCTCACGCTGCTGTCTGGAACGCTCAGGAAGCTCAGGCTGACTTCGCTAAAGTGCTCGAACTCGACCCCGCCTTGGCACCTGTTGTTTCAAGGGAGTTGCGCGCTCTCGAAACTCGCATCCGTCAGAAAGATGAGGAGGACAAGGCTCGTTTCCGCGGAATCTTCTCCCAC
SEQ ID No.10(mP23-DNA)
ATGCAGCCTGCCTCCGCTAAGTGGTACGACAGAAGGGACTACGTGTTCATCGAGTTCTGCGTGGAGGACTCCAAGGACGTGAACGTGAACTTCGAGAAGTCCAAATTGACCTTCAGCTGCCTGGGCGGTTCCGATAACTTCAAGCACCTGAACGAAATCGACCTCTTCCATTGTATCGATCCAAACGACTCCAAACACAAGAGGACTGACCGCTCCATCCTGTGCTGCTTGCGTAAGGGTGAGTCTGGTCAGTCCTGGCCAAGACTGACAAAGGAGAGAGCTAAGCTCAACTGGCTGTCCGTGGACTTCAACAACTGGAAAGACTGGGAAGACGACTCCGACGAGGACATGAGCAACTTCGACAGGTTCAGTGAGATGATGGACCACATGGGAGGAGATGAAGACGTGGATCTGCCTGAGGTGGACGGAGCTGATGACGATAGCCAGGACAGCGACGACGAGAAGATGCCAGACCTGGAG
SEQ ID No.11
CTATGCATCAGCTGCTAGCACCATGGCTCGAATGGGCGCTTGGAGCCACCCTCAGTTCG
SEQ ID No.12
TCGACGAAGACTTGATCACCCGGGATCGAAAGGCAGGGAGGTGCTCCTCTTCTG
SEQ ID No.13
GCCTACGTCGACGAGCTCACTAGTCGCGGCCATGCCTGAGGAGGTGCACCACGGTGAAG
SEQ ID No.14
GAGACTGCAGGCTCTAGATTCGAAAGCGTCCACCTCCTCCATGCGGGAAGCGTC
SEQ ID No.15
CTATGCATCAGCTGCTAGCACCATGGCTCGAATGGCCGATCTGATTGCTCGCTTGCGTG
SEQ ID No.16
TCGACGAAGACTTGATCACCCGGGATCGTGGGAGAAGATTCCGCGGAAACGAGC
SEQ ID No.17
GCCTACGTCGACGAGCTCACTAGTCGCGGCCATGCAGCCTGCCTCCGCTAAGTGGTACG
SEQ ID No.18
GAGACTGCAGGCTCTAGATTCGAAAGCCTCCAGGTCTGGCATCTTCTCGTCGTC
序列表
<110> 中国科学院生物物理研究所
<120> 芳香烃受体蛋白稳定高效表达的方法及其应用
<160> 10
<170> SIPOSequenceListing 1.0
<210> 1
<211> 453
<212> PRT
<213> hAhR-1
<400> 1
Val Lys Pro Ile Pro Ala Glu Gly Ile Lys Ser Asn Pro Ser Lys Arg
1 5 10 15
His Arg Asp Arg Leu Asn Thr Glu Leu Asp Arg Leu Ala Ser Leu Leu
20 25 30
Pro Phe Pro Gln Asp Val Ile Asn Lys Leu Asp Lys Leu Ser Val Leu
35 40 45
Arg Leu Ser Val Ser Tyr Leu Arg Ala Lys Ser Phe Phe Asp Val Ala
50 55 60
Leu Lys Ser Ser Pro Thr Glu Arg Asn Gly Gly Gln Asp Asn Cys Arg
65 70 75 80
Ala Ala Asn Phe Arg Glu Gly Leu Asn Leu Gln Glu Gly Glu Phe Leu
85 90 95
Leu Gln Ala Leu Asn Gly Phe Val Leu Val Val Thr Thr Asp Ala Leu
100 105 110
Val Phe Tyr Ala Ser Ser Thr Ile Gln Asp Tyr Leu Gly Phe Gln Gln
115 120 125
Ser Asp Val Ile His Gln Ser Val Tyr Glu Leu Ile His Thr Glu Asp
130 135 140
Arg Ala Glu Phe Gln Arg Gln Leu His Trp Ala Leu Asn Pro Ser Gln
145 150 155 160
Cys Thr Glu Ser Gly Gln Gly Ile Glu Glu Ala Thr Gly Leu Pro Gln
165 170 175
Thr Val Val Cys Tyr Asn Pro Asp Gln Ile Pro Pro Glu Asn Ser Pro
180 185 190
Leu Met Glu Arg Cys Phe Ile Cys Arg Leu Arg Cys Leu Leu Asp Asn
195 200 205
Ser Ser Gly Phe Leu Ala Met Asn Phe Gln Gly Lys Leu Lys Tyr Leu
210 215 220
His Gly Gln Lys Lys Lys Gly Lys Asp Gly Ser Ile Leu Pro Pro Gln
225 230 235 240
Leu Ala Leu Phe Ala Ile Ala Thr Pro Leu Gln Pro Pro Ser Ile Leu
245 250 255
Glu Ile Arg Thr Lys Asn Phe Ile Phe Arg Thr Lys His Lys Leu Asp
260 265 270
Phe Thr Pro Ile Gly Cys Asp Ala Lys Gly Arg Ile Val Leu Gly Tyr
275 280 285
Thr Glu Ala Glu Leu Cys Thr Arg Gly Ser Gly Tyr Gln Phe Ile His
290 295 300
Ala Ala Asp Met Leu Tyr Cys Ala Glu Ser His Ile Arg Met Ile Lys
305 310 315 320
Thr Gly Glu Ser Gly Met Ile Val Phe Arg Leu Leu Thr Lys Asn Asn
325 330 335
Arg Trp Thr Trp Val Gln Ser Asn Ala Arg Leu Leu Tyr Lys Asn Gly
340 345 350
Arg Pro Asp Tyr Ile Ile Val Thr Gln Arg Pro Leu Thr Asp Glu Glu
355 360 365
Gly Thr Glu His Leu Arg Lys Arg Asn Thr Lys Leu Pro Phe Met Phe
370 375 380
Thr Thr Gly Glu Ala Val Leu Tyr Glu Ala Thr Asn Pro Phe Pro Ala
385 390 395 400
Ile Met Asp Pro Leu Pro Leu Arg Thr Lys Asn Gly Thr Ser Gly Lys
405 410 415
Asp Ser Ala Thr Thr Ser Thr Leu Ser Lys Asp Ser Leu Asn Pro Ser
420 425 430
Ser Leu Leu Ala Ala Met Met Gln Gln Asp Glu Ser Ile Tyr Leu Tyr
435 440 445
Pro Ala Ser Ser Thr
450
<210> 2
<211> 398
<212> PRT
<213> mAhR-1
<400> 2
Met Ser Ser Gly Ala Asn Ile Thr Tyr Ala Ser Arg Lys Arg Arg Lys
1 5 10 15
Pro Val Gln Lys Thr Val Lys Pro Ile Pro Ala Glu Gly Ile Lys Ser
20 25 30
Asn Pro Ser Lys Arg His Arg Asp Arg Leu Asn Thr Glu Leu Asp Arg
35 40 45
Leu Ala Ser Leu Leu Pro Phe Pro Gln Asp Val Ile Asn Lys Leu Asp
50 55 60
Lys Leu Ser Val Leu Arg Leu Ser Val Ser Tyr Leu Arg Ala Lys Ser
65 70 75 80
Phe Phe Asp Val Ala Leu Lys Ser Thr Pro Ala Asp Arg Asn Gly Gly
85 90 95
Gln Asp Gln Cys Arg Ala Gln Ile Arg Asp Trp Gln Asp Leu Gln Glu
100 105 110
Gly Glu Phe Leu Leu Gln Ala Leu Asn Gly Phe Val Leu Val Val Thr
115 120 125
Ala Asp Ala Leu Val Phe Tyr Ala Ser Ser Thr Ile Gln Asp Tyr Leu
130 135 140
Gly Phe Gln Gln Ser Asp Val Ile His Gln Ser Val Tyr Glu Leu Ile
145 150 155 160
His Thr Glu Asp Arg Ala Glu Phe Gln Arg Gln Leu His Trp Ala Leu
165 170 175
Asn Pro Asp Ser Ala Gln Gly Val Asp Glu Ala His Gly Pro Pro Gln
180 185 190
Ala Ala Val Tyr Tyr Thr Pro Asp Gln Leu Pro Pro Glu Asn Ala Ser
195 200 205
Phe Met Glu Arg Cys Phe Arg Cys Arg Leu Arg Cys Leu Leu Asp Asn
210 215 220
Ser Ser Gly Phe Leu Ala Met Asn Phe Gln Gly Arg Leu Lys Tyr Leu
225 230 235 240
His Gly Gln Asn Lys Lys Gly Lys Asp Gly Ala Leu Leu Pro Pro Gln
245 250 255
Leu Ala Leu Phe Ala Ile Ala Thr Pro Leu Gln Pro Pro Ser Ile Leu
260 265 270
Glu Ile Arg Thr Lys Asn Phe Ile Phe Arg Thr Lys His Lys Leu Asp
275 280 285
Phe Thr Pro Ile Gly Cys Asp Ala Lys Gly Gln Leu Ile Leu Gly Tyr
290 295 300
Thr Glu Val Glu Leu Cys Thr Arg Gly Ser Gly Tyr Gln Phe Ile His
305 310 315 320
Ala Ala Asp Met Leu His Cys Ala Glu Ser His Ile Arg Met Ile Lys
325 330 335
Thr Gly Glu Ser Gly Met Thr Val Phe Arg Leu Phe Ala Lys His Ser
340 345 350
Arg Trp Arg Trp Val Gln Ser Asn Ala Arg Leu Ile Tyr Arg Asn Gly
355 360 365
Arg Pro Asp Tyr Ile Ile Ala Thr Gln Arg Pro Leu Thr Asp Glu Glu
370 375 380
Gly Arg Glu His Leu Gln Lys Arg Ser Thr Ser Leu Pro Phe
385 390 395
<210> 3
<211> 724
<212> PRT
<213> mHsp90
<400> 3
Met Pro Glu Glu Val His His Gly Glu Glu Glu Val Glu Thr Phe Ala
1 5 10 15
Phe Gln Ala Glu Ile Ala Gln Leu Met Ser Leu Ile Ile Asn Thr Phe
20 25 30
Tyr Ser Asn Lys Glu Ile Phe Leu Arg Glu Leu Ile Ser Asn Ala Ser
35 40 45
Asp Ala Leu Asp Lys Ile Arg Tyr Glu Ser Leu Thr Asp Pro Ser Lys
50 55 60
Leu Asp Ser Gly Lys Glu Leu Lys Ile Asp Ile Ile Pro Asn Pro Gln
65 70 75 80
Glu Arg Thr Leu Thr Leu Val Asp Thr Gly Ile Gly Met Thr Lys Ala
85 90 95
Asp Leu Ile Asn Asn Leu Gly Thr Ile Ala Lys Ser Gly Thr Lys Ala
100 105 110
Phe Met Glu Ala Leu Gln Ala Gly Ala Asp Ile Ser Met Ile Gly Gln
115 120 125
Phe Gly Val Gly Phe Tyr Ser Ala Tyr Leu Val Ala Glu Lys Val Val
130 135 140
Val Ile Thr Lys His Asn Asp Asp Glu Gln Tyr Ala Trp Glu Ser Ser
145 150 155 160
Ala Gly Gly Ser Phe Thr Val Arg Ala Asp His Gly Glu Pro Ile Gly
165 170 175
Arg Gly Thr Lys Val Ile Leu His Leu Lys Glu Asp Gln Thr Glu Tyr
180 185 190
Leu Glu Glu Arg Arg Val Lys Glu Val Val Lys Lys His Ser Gln Phe
195 200 205
Ile Gly Tyr Pro Ile Thr Leu Tyr Leu Glu Lys Glu Arg Glu Lys Glu
210 215 220
Ile Ser Asp Asp Glu Ala Glu Glu Glu Lys Gly Glu Lys Glu Glu Glu
225 230 235 240
Asp Lys Glu Asp Glu Glu Lys Pro Lys Ile Glu Asp Val Gly Ser Asp
245 250 255
Glu Glu Asp Asp Ser Gly Lys Asp Lys Lys Lys Lys Thr Lys Lys Ile
260 265 270
Lys Glu Lys Tyr Ile Asp Gln Glu Glu Leu Asn Lys Thr Lys Pro Ile
275 280 285
Trp Thr Arg Asn Pro Asp Asp Ile Thr Gln Glu Glu Tyr Gly Glu Phe
290 295 300
Tyr Lys Ser Leu Thr Asn Asp Trp Glu Asp His Leu Ala Val Lys His
305 310 315 320
Phe Ser Val Glu Gly Gln Leu Glu Phe Arg Ala Leu Leu Phe Ile Pro
325 330 335
Arg Arg Ala Pro Phe Asp Leu Phe Glu Asn Lys Lys Lys Lys Asn Asn
340 345 350
Ile Lys Leu Tyr Val Arg Arg Val Phe Ile Met Asp Ser Cys Asp Glu
355 360 365
Leu Ile Pro Glu Tyr Leu Asn Phe Ile Arg Gly Val Val Asp Ser Glu
370 375 380
Asp Leu Pro Leu Asn Ile Ser Arg Glu Met Leu Gln Gln Ser Lys Ile
385 390 395 400
Leu Lys Val Ile Arg Lys Asn Ile Val Lys Lys Cys Leu Glu Leu Phe
405 410 415
Ser Glu Leu Ala Glu Asp Lys Glu Asn Tyr Lys Lys Phe Tyr Glu Ala
420 425 430
Phe Ser Lys Asn Leu Lys Leu Gly Ile His Glu Asp Ser Thr Asn Arg
435 440 445
Arg Arg Leu Ser Glu Leu Leu Arg Tyr His Thr Ser Gln Ser Gly Asp
450 455 460
Glu Met Thr Ser Leu Ser Glu Tyr Val Ser Arg Met Lys Glu Thr Gln
465 470 475 480
Lys Ser Ile Tyr Tyr Ile Thr Gly Glu Ser Lys Glu Gln Val Ala Asn
485 490 495
Ser Ala Phe Val Glu Arg Val Arg Lys Arg Gly Phe Glu Val Val Tyr
500 505 510
Met Thr Glu Pro Ile Asp Glu Tyr Cys Val Gln Gln Leu Lys Glu Phe
515 520 525
Asp Gly Lys Ser Leu Val Ser Val Thr Lys Glu Gly Leu Glu Leu Pro
530 535 540
Glu Asp Glu Glu Glu Lys Lys Lys Met Glu Glu Ser Lys Ala Lys Phe
545 550 555 560
Glu Asn Leu Cys Lys Leu Met Lys Glu Ile Leu Asp Lys Lys Val Glu
565 570 575
Lys Val Thr Ile Ser Asn Arg Leu Val Ser Ser Pro Cys Cys Ile Val
580 585 590
Thr Ser Thr Tyr Gly Trp Thr Ala Asn Met Glu Arg Ile Met Lys Ala
595 600 605
Gln Ala Leu Arg Asp Asn Ser Thr Met Gly Tyr Met Met Ala Lys Lys
610 615 620
His Leu Glu Ile Asn Pro Asp His Pro Ile Val Glu Thr Leu Arg Gln
625 630 635 640
Lys Ala Glu Ala Asp Lys Asn Asp Lys Ala Val Lys Asp Leu Val Val
645 650 655
Leu Leu Phe Glu Thr Ala Leu Leu Ser Ser Gly Phe Ser Leu Glu Asp
660 665 670
Pro Gln Thr His Ser Asn Arg Ile Tyr Arg Met Ile Lys Leu Gly Leu
675 680 685
Gly Ile Asp Glu Asp Glu Val Thr Ala Glu Glu Pro Ser Ala Ala Val
690 695 700
Pro Asp Glu Ile Pro Pro Leu Glu Gly Asp Glu Asp Ala Ser Arg Met
705 710 715 720
Glu Glu Val Asp
<210> 4
<211> 330
<212> PRT
<213> mXAP2
<400> 4
Met Ala Asp Leu Ile Ala Arg Leu Arg Glu Asp Gly Ile Gln Lys Arg
1 5 10 15
Val Ile Gln Glu Gly Arg Gly Glu Leu Pro Asp Phe Gln Asp Gly Thr
20 25 30
Lys Ala Thr Phe His Phe Arg Thr Leu His Ser Asp Asn Glu Gly Ser
35 40 45
Val Ile Asp Asp Ser Arg Thr Arg Gly Lys Pro Met Glu Leu Ile Val
50 55 60
Gly Lys Lys Phe Lys Leu Pro Val Trp Glu Thr Ile Val Cys Thr Met
65 70 75 80
Arg Glu Gly Glu Ile Ala Gln Phe Leu Cys Asp Ile Lys His Val Val
85 90 95
Leu Tyr Pro Leu Val Ala Lys Ser Leu Arg Asn Ile Ala Glu Gly Lys
100 105 110
Asp Pro Leu Glu Gly Gln Arg His Cys Cys Gly Ile Ala Gln Met His
115 120 125
Glu His Ser Ser Leu Gly His Ala Asp Leu Asp Ala Leu Gln Gln Asn
130 135 140
Pro Gln Pro Leu Ile Phe His Ile Glu Met Leu Lys Val Glu Ser Pro
145 150 155 160
Gly Thr Tyr Gln Gln Asp Pro Trp Ala Met Thr Asp Glu Glu Lys Ala
165 170 175
Lys Ala Val Pro Val Ile His Gln Glu Gly Asn Arg Leu Tyr Arg Glu
180 185 190
Gly Gln Val Lys Glu Ala Ala Ala Lys Tyr Tyr Asp Ala Ile Ala Cys
195 200 205
Leu Lys Asn Leu Gln Met Lys Glu Gln Pro Gly Ser Pro Asp Trp Ile
210 215 220
Gln Leu Asp Leu Gln Ile Thr Pro Leu Leu Leu Asn Tyr Cys Gln Cys
225 230 235 240
Lys Leu Val Ala Gln Glu Tyr Tyr Glu Val Leu Asp His Cys Ser Ser
245 250 255
Ile Leu Asn Lys Tyr Asp Asp Asn Val Lys Ala Tyr Phe Lys Arg Gly
260 265 270
Lys Ala His Ala Ala Val Trp Asn Ala Gln Glu Ala Gln Ala Asp Phe
275 280 285
Ala Lys Val Leu Glu Leu Asp Pro Ala Leu Ala Pro Val Val Ser Arg
290 295 300
Glu Leu Arg Ala Leu Glu Thr Arg Ile Arg Gln Lys Asp Glu Glu Asp
305 310 315 320
Lys Ala Arg Phe Arg Gly Ile Phe Ser His
325 330
<210> 5
<211> 160
<212> PRT
<213> mP23
<400> 5
Met Gln Pro Ala Ser Ala Lys Trp Tyr Asp Arg Arg Asp Tyr Val Phe
1 5 10 15
Ile Glu Phe Cys Val Glu Asp Ser Lys Asp Val Asn Val Asn Phe Glu
20 25 30
Lys Ser Lys Leu Thr Phe Ser Cys Leu Gly Gly Ser Asp Asn Phe Lys
35 40 45
His Leu Asn Glu Ile Asp Leu Phe His Cys Ile Asp Pro Asn Asp Ser
50 55 60
Lys His Lys Arg Thr Asp Arg Ser Ile Leu Cys Cys Leu Arg Lys Gly
65 70 75 80
Glu Ser Gly Gln Ser Trp Pro Arg Leu Thr Lys Glu Arg Ala Lys Leu
85 90 95
Asn Trp Leu Ser Val Asp Phe Asn Asn Trp Lys Asp Trp Glu Asp Asp
100 105 110
Ser Asp Glu Asp Met Ser Asn Phe Asp Arg Phe Ser Glu Met Met Asp
115 120 125
His Met Gly Gly Asp Glu Asp Val Asp Leu Pro Glu Val Asp Gly Ala
130 135 140
Asp Asp Asp Ser Gln Asp Ser Asp Asp Glu Lys Met Pro Asp Leu Glu
145 150 155 160
<210> 6
<211> 1359
<212> DNA
<213> hAhR-1-DNA
<400> 6
gtaaaaccta ttccggcaga aggcattaaa agcaacccga gcaaaagaca tcgtgaccgg 60
ttaaatacag agctggatcg tctggcaagc cttttaccgt tcccgcagga tgttattaat 120
aaactggaca aactgagtgt actgcgcctg agcgttagct atttacgtgc taaaagtttt 180
ttcgacgtgg ctctgaaatc tagtccgacc gagcgtaatg gtgggcagga taactgccgg 240
gcagcaaact ttcgcgaagg tctgaattta caggaggggg aatttcttct gcaggctctg 300
aatggttttg ttctggttgt tacaaccgat gcactggttt tttatgcaag ctctacaatt 360
caggattatt tagggtttca acagagcgat gtgatacatc agtctgttta tgaattaatc 420
cacaccgagg accgtgcaga gtttcaaaga caactgcatt gggcactgaa cccaagccag 480
tgtaccgaga gcgggcaagg tatcgaggaa gcaaccggtc ttccacagac cgtggtttgt 540
tataatccgg atcagattcc gccagaaaat agccccctga tggaacgctg ttttatttgt 600
cgcctgagat gtttactgga caatagctca ggctttctgg caatgaactt tcagggtaaa 660
ctgaaatatc ttcacggtca gaagaaaaag ggtaaagatg gaagtattct gccgccgcaa 720
cttgcactgt ttgcaattgc aacccccctg cagcctccgt ctatcctgga aattcgcacc 780
aaaaatttta tctttcgtac caaacacaag ctggatttta cccccattgg ttgtgatgcc 840
aaaggtcgta ttgttttagg ctataccgaa gcagaactgt gcacccgggg ttcaggctat 900
cagtttattc atgcagcaga tatgctgtat tgtgccgaaa gccacattcg gatgattaag 960
acaggtgaaa gtgggatgat tgtttttcgt ctgcttacca aaaataaccg ttggacctgg 1020
gtgcagagca atgcacgttt attatataag aatggtcgtc cggactatat tattgttaca 1080
cagcggccgt taaccgacga ggagggtacc gaacatctgc gtaaacgcaa caccaaatta 1140
ccatttatgt ttaccaccgg tgaggcggtg ctgtatgaag caaccaaccc gtttccggca 1200
attatggacc ctttaccgct gcgtaccaaa aacggtacct caggtaaaga cagcgcgacc 1260
accagcacct taagcaaaga tagcctgaat cccagcagtc tgctggcagc tatgatgcag 1320
caggatgaaa gcatttatct gtatccagca agcagcacc 1359
<210> 7
<211> 1194
<212> DNA
<213> mAhR-1-DNA
<400> 7
atgagcagtg gagctaacat tacttacgcc tccaggaaga gaaggaagcc tgttcagaag 60
actgtgaagc caatccctgc cgagggtatt aaatccaacc cctccaagcg ccacagggac 120
agattgaaca ccgagctgga ccgcctggct agtttgttgc cattccccca ggacgtgatc 180
aacaagctcg acaaactgtc cgtgctgcgc ctgtctgtct cctacttgcg tgcaaagtcc 240
ttcttcgacg tggctttgaa atccaccccc gctgaccgta acggtggtca agatcaatgc 300
cgcgctcaga tccgcgactg gcaagatttg caggagggtg agttcctcct gcaggctttg 360
aacggattcg tgttggtggt caccgctgac gctctggttt tctacgcttc ctccaccatt 420
caggactacc tgggattcca acagagcgac gtgattcatc agtccgttta cgagctgatc 480
cacaccgagg accgcgctga atttcagcgt caattgcact gggctctgaa ccctgacagt 540
gctcagggtg tggacgaggc tcatggtcct cctcaagcag ctgtgtacta cacccccgac 600
cagttgcctc cagaaaacgc ttccttcatg gagcgctgtt tccgctgccg tctgagatgt 660
ctcctggata actcctccgg tttcctcgct atgaacttcc agggtcgcct gaagtacctc 720
cacggtcaaa acaaaaaggg taaggacgga gctttgctcc ctccccaact ggctttgttc 780
gctattgcca cccctctgca gcctccttct atcttggaaa ttcgcaccaa gaacttcatc 840
ttccgcacca agcacaagct cgacttcacc cctatcggtt gcgacgctaa gggtcagctg 900
atcctgggat acaccgaagt cgagctgtgc acccgtggtt ctggatacca attcatccac 960
gctgccgaca tgctgcactg cgctgaatct cacatccgta tgatcaagac tggtgagtcc 1020
ggtatgaccg tgttccgctt gttcgctaag cattctcgct ggcgctgggt ccaatcaaac 1080
gctagactga tctaccgtaa cggtcgcccc gactacatca tcgcaaccca aagacctctg 1140
accgacgagg agggtaggga acatctgcag aagaggagca cctccctgcc tttc 1194
<210> 8
<211> 2172
<212> DNA
<213> mHsp90-DNA
<400> 8
atgcctgagg aggtgcacca cggtgaagaa gaagtggaaa ccttcgcttt ccaggctgag 60
attgctcaac tgatgtccct catcatcaac accttctaca gcaacaagga gatcttcctg 120
agagagctga tcagcaacgc ttccgacgct ctggacaaaa tccgttacga gtccctgacc 180
gatccttcca aactggactc cggcaaagaa ctgaagatcg acatcatccc taaccctcag 240
gagcgcaccc tcacattggt ggataccggt atcggcatga caaaggcaga cctcatcaac 300
aacctgggca ccattgctaa aagcggaacc aaagccttca tggaggctct gcaagcaggt 360
gctgacatct ccatgattgg tcaattcggc gtgggtttct actccgctta cctcgtggcc 420
gagaaggtgg ttgtgatcac aaagcacaac gacgacgagc agtacgcttg ggagagcagt 480
gctggtggtt ccttcactgt cagggctgat cacggtgagc ctatcggtcg tggtaccaaa 540
gtgatcctgc atctgaagga ggaccaaacc gagtacctcg aagagcgcag ggtgaaggag 600
gtggttaaga agcacagcca gttcatcggt taccccatca cactgtactt ggagaaagag 660
cgcgaaaaag agatcagcga cgacgaagca gaggaagaaa agggtgagaa ggaagaggaa 720
gataaggagg acgaggagaa gccaaagatc gaggacgtgg gaagcgacga ggaggatgat 780
agcggaaagg acaagaagaa gaagacaaag aagatcaagg agaagtacat cgaccaggag 840
gagctgaaca agacaaagcc aatctggaca aggaaccctg acgacatcac acaggaggag 900
tacggagagt tctacaagag cctcacaaac gactgggagg accacctggc tgtgaagcat 960
ttcagcgtgg agggacagct ggagttcagg gctttgctgt tcatcccaag gagagcccct 1020
ttcgacctgt tcgagaacaa aaagaagaag aacaacatca aactgtacgt gcgccgcgtc 1080
ttcattatgg actcctgcga cgagctgatc cctgagtacc tgaacttcat ccgtggtgtg 1140
gtggactccg aagacctgcc tttgaacatc tcccgcgaga tgctgcagca gtccaagatc 1200
ctgaaggtga tcaggaagaa catcgtgaag aaatgcctgg agttgttctc cgagttggct 1260
gaagacaaag agaactacaa gaagttctac gaggcattct ccaagaacct gaagctgggt 1320
atccatgagg actccaccaa ccgccgtcgt ttgtctgagc tgctgcgtta ccacaccagc 1380
cagtctggtg acgagatgac ctccctgtcc gaatacgtgt cccgcatgaa ggaaactcag 1440
aaatcaattt actacatcac tggtgaatcc aaggagcaag tggctaactc cgctttcgtc 1500
gagcgtgtgc gtaagagagg tttcgaggtg gtgtacatga ccgagcccat cgacgaatac 1560
tgcgtccagc agctgaagga gttcgacggt aagtccttgg tgagcgtcac caaggagggt 1620
ctggagttgc cagaggatga ggaggagaag aagaagatgg aagagagcaa ggcaaagttc 1680
gagaacctct gcaagttgat gaaggagatc ctggacaaga aggtggagaa ggtgactatc 1740
agcaacaggc tggtgagcag tccatgctgc atcgtgacca gcacctacgg atggaccgca 1800
aacatggaga ggatcatgaa ggcacaagcc ctgcgcgaca acagcacaat gggatacatg 1860
atggcaaaaa agcacctgga gatcaaccct gaccacccta tcgtggagac cctgcgccag 1920
aaggctgagg ctgacaagaa cgacaaggct gtgaaggacc tggtggtgct gctgttcgag 1980
accgctctgc tgtcctccgg tttctccctg gaggaccctc agacccactc caaccgcatc 2040
taccgcatga tcaagctggg tctgggtatc gacgaggacg aggtgaccgc tgaggagcct 2100
tccgctgctg tgcctgacga gatccctcct ctggagggtg acgaggacgc ttcccgcatg 2160
gaggaggtgg ac 2172
<210> 9
<211> 990
<212> DNA
<213> mXAP2-DNA
<400> 9
atggccgatc tgattgctcg cttgcgtgag gacggtattc agaagagggt gatccaggag 60
ggtcgcggtg aattgcctga cttccaggat ggtacaaaag ccaccttcca cttccgcacc 120
ttgcactctg acaacgaggg tagtgtgatc gatgacagca gaacgagggg caaacctatg 180
gagttgatcg tgggtaaaaa gttcaaactg cccgtgtggg agaccatcgt gtgtactatg 240
cgcgagggtg agatcgctca gttcttgtgc gacatcaagc atgtggtgct gtaccctctg 300
gtggcgaagt ctctccgtaa catcgctgaa ggtaaggacc cactggaggg tcaacgccat 360
tgttgtggaa tcgctcaaat gcacgagcac agctccctcg gtcacgctga tttggacgct 420
ctgcagcaga acccacaacc gttgatcttc cacatcgaaa tgctgaaggt ggaatcccct 480
ggaacttacc agcaggaccc ctgggctatg accgatgaag agaaggctaa agcagtgcct 540
gtgatccacc aagaaggtaa ccgcctgtac cgcgagggtc aagttaagga ggctgccgct 600
aaatactacg acgctatcgc ttgtttgaag aacctgcaga tgaaggagca gcctggtagc 660
cctgactgga ttcaactgga tctgcagatt acacctctcc tgctgaacta ctgtcagtgc 720
aagctggtgg ctcaggaata ctacgaggtg ctggatcact gcagctccat cctgaacaaa 780
tacgacgaca acgtgaaagc ttacttcaaa cgcggtaaag ctcacgctgc tgtctggaac 840
gctcaggaag ctcaggctga cttcgctaaa gtgctcgaac tcgaccccgc cttggcacct 900
gttgtttcaa gggagttgcg cgctctcgaa actcgcatcc gtcagaaaga tgaggaggac 960
aaggctcgtt tccgcggaat cttctcccac 990
<210> 10
<211> 480
<212> DNA
<213> mP23-DNA
<400> 10
atgcagcctg cctccgctaa gtggtacgac agaagggact acgtgttcat cgagttctgc 60
gtggaggact ccaaggacgt gaacgtgaac ttcgagaagt ccaaattgac cttcagctgc 120
ctgggcggtt ccgataactt caagcacctg aacgaaatcg acctcttcca ttgtatcgat 180
ccaaacgact ccaaacacaa gaggactgac cgctccatcc tgtgctgctt gcgtaagggt 240
gagtctggtc agtcctggcc aagactgaca aaggagagag ctaagctcaa ctggctgtcc 300
gtggacttca acaactggaa agactgggaa gacgactccg acgaggacat gagcaacttc 360
gacaggttca gtgagatgat ggaccacatg ggaggagatg aagacgtgga tctgcctgag 420
gtggacggag ctgatgacga tagccaggac agcgacgacg agaagatgcc agacctggag 480
机译: 用于稳定PRODH / POX蛋白编码基因表达的双歧核酸及其应用,表达载体,宿主细胞,细胞克隆,药物组合物,用于稳定PRODH / POX蛋白编码基因表达的体外方法,用于使PRODH / POX蛋白编码基因的表达稳定的单丝核酸PRODH / POX蛋白编码基因及其应用
机译: 增加生物活性ig-受体融合蛋白表达的方法,高表达tnf受体家族成员fc fc蛋白的方法,以及获得具有活性并最小化无活性ig表达的ig-ltbr的fc fc蛋白的方法-ltbr fc融合蛋白。
机译: 逆转或预防细胞对死亡受体激动剂的抗性的方法,为细胞筛选对死亡受体激动剂的抗性的生物标志物,监测个体对死亡受体激动剂的抗性,以选择性地诱导靶标中的细胞凋亡的方法表达死亡受体的细胞,治疗患有癌症的个体,治疗患有炎性或自身免疫性疾病的个体,阻止含卡蛋白与细胞中死亡受体的结合,阻止iap与死亡受体并筛选蛋白质的调节剂,该蛋白质包含卡片,成分,分离的核酸,载体,细胞和分离的多肽