首页> 中文学位 >HLA-I类分子超型特异性表位预测及设计工具的研究
【6h】

HLA-I类分子超型特异性表位预测及设计工具的研究

代理获取

目录

声明

缩略语表

摘要

第一章 前言

第二章 HLA-I类分子超型特异性表位数据库:HLASSB_DB

2.1 材料与方法

2.2 结果

2.3 讨论

2.4 小结

第三章 采用基于超型(supertype-based)的建模方法改进HLA-I类分子结合肽预测算法的性能

3.1 材料与方法

3.2 结果

3.3 讨论

3.4 小结

第四章 HLA-I类分子超型特异性表位预测及设计工具HLASSB_PreD

4.1 基于mARB矩阵的HLA超型表位预测及设计工具HLASSB_PreD

4.2 HLASSB_PreD预测性能的实验验证

4.3 讨论

4.4 小结

第五章 HLA-I类分子结合肽的Pan特异性预测方法的建立及初步验证

5.1 HLA-I类分子结合肽Pan特异性预测方法的建立

5.2 HLA-I类分子结合肽Pan特异性预测模型的初步验证

5.3 讨论

5.4 小结

全文总结

参考文献

文献综述 T细胞表位预测方法的综述

附件1 基于mARB算法的预测模型的性能

附件2 基于SVM算法的预测模型的性能

附件3 基于YK算法的预测模型的性能

附件4 基于Profile算法的预测模型的性能

博士研究生期间发表的论文

致谢

展开▼

摘要

在细胞免疫中,主要组织相容性复合物(Majorhistocompatibilitycomplex,MHC)结合抗原多肽并将其提呈至细胞表面从而被T细胞受体(T-cellreceptor,TCR)识别。与MHC分子结合并引起T细胞应答的多肽称之为T细胞表位(epitope),是研究免疫系统特异性的重要组件,表位肽的鉴定可以促进防治病毒感染、自身免疫性疾病以及肿瘤等疾病的多肽疫苗的研究和开发。多肽与MHC分子的结合具有高度特异性,是其被T细胞识别的必要条件,然而实验室鉴定MHC分子结合肽是个费时费力的过程;采用计算机预测方法可以大大降低需要合成和检测的多肽的数量,使得抗原表位的大规模筛选成为可能。  人MHC基因称为白细胞抗原(Humanleukocyteantigen,HLA),其中多数HLA-(I)类分子根据其结合肽的特异性划分为特定的超型(supertype),与特定HLA分子结合的多肽往往可以与对应超型中多个HLA分子结合,这种泛宿主性的结合多肽称为超型特异性结合肽(supertypespecificbinders),是开发具有高人群覆盖率疫苗的优先选择对象。然而,每个HLA分子都有自己独特的多肽结合倾向,一条多肽与特定HLA分子结合并不意味着该肽就可以和对应超型中其他HLA分子结合。因此,预测HLA-I类分子超型特异性结合肽需要区分多肽与同超型不同HLA分子间的交叉结合能力。同时,理解多肽各位点残基对其与同超型HLA分子交叉结合能力的贡献将为高人群覆盖率疫苗的设计提供重要的参考。  预测模型的建立依赖于可利用的实验数据。在本研究中,我们首先遍历当前互联网上的免疫表位数据库,提取HLA-I类分子限制性的多肽结合数据,根据HLA-I类分子超型对多肽数据整合,采用多肽与同超型不同HLA分子的交叉结合能力来描述多肽序列,建立了HLA-I类分子超型特异性表位(结合肽)数据库(HLASupertypeSpecificBinderDatabase,HLASSBDB)。该数据库收录了18157条多肽与同超型HLA分子交叉结合的数据,涵盖了10个HLA-I类超型的主要38种等位基因限制性。HLASSB_DB提供了三种检索方式:多肽序列检索、超型及其等位基因检索、蛋白序列检索,为基于表位的疫苗设计,尤其是具有高人群覆盖率的疫苗的设计提供参考。  预测模型的性能取决于建模过程中多肽数据的性质,然而当前可用的多肽数据多是不均衡的,因为免疫学家更倾向于鉴定带特定HLA结合基序的候选多肽与对应HLA分子的结合能力。我们在此研究中探索了多肽性质对建模性能的影响。结果显示,采用不均衡多肽数据建立的模型对生物学数据(biologicaldataset)的预测性能较差(从指定抗原分子中预测特定HLA分子限制性结合肽的能力)。同时我们发现预测模型在预测生物数据和区分含基序多肽时存在冲突:多肽数据中不含超基序的非结合肽(non-motifcontainingnon-binders,NMNs)的存在可以改善预测模型对生物学数据的预测性能却降低了对含基序多肽的预测准确率(区分多肽与同超型HLA分子交叉结合的能力)。目前多数HLA-I类分子可以划分为特定的超型,同超型HLA分子具有相似的结合特异性,为了克服多肽数据带来的负面影响,我们提出一种基于超型(supertype-based)的建模方法:首先采用超基序筛选与同超型中HLA分子结合的候选肽,然后采用含超基序多肽建立的模型预测多肽与超型中特定HLA分子的结合能力。我们分别采用三种基于矩阵和一种基于机器语言的算法建立了A1、A2、A3、A24、B44和B7超型20种等位基因的预测模型,采用标准化数据评估对应模型的性能,结果显示这种基于超型的建模方法可以改善HLA-I类分子结合肽预测模型的性能,且对基于分类算法的预测模型具有普适性。  将这种基于超型的建模方法应用于平均相对结合能力矩阵算法mARB(mulfiplicafiveAverageRelativeBinding)中,我们建立了预测和设计HLA超型特异性结合肽的在线工具HLASSB_PreD(PredictionandDesignofHLASupertypeSpecificBinders)。基于标准化数据的比较研究显示HLASSB_PreD对HLA-I类分子结合肽的预测能力要比一般常用的基于分类算法的预测工具(SVMHC、RANKPEP、YKW)性能好。更重要的是,HLASSB_PreD中同超型尤其是多肽数据比较丰富的A2和A3超型中不同等位基因的预测模型存在收敛的阈值,使得HLASSB_PreD的矩阵模型可以用来分析多肽中各个位点残基对多肽与同超型HLA分子交叉结合贡献,从而来指导HLA超型表位的设计。我们采用HLASSB_PreD中的结合矩阵定义了A2及A3超型的多肽交叉结合基序,并在具有不同交叉结合能力的多肽数据集中得到了验证。为了进一步验证此工具的性能,我们评估了HLASSB_PreD对聚丙氨酸点突变类似物以及表位HBcAg18-27的点突变类似物的预测性能,结果显示HLASSB_PreD对聚丙氨酸点突变类似物结合能力的预测准确率为93%,对表位HBcAg18-27的点突变类似物的预测准确率为100%。此外,我们采用HLASSB_PreD筛选HBV相关抗原HBcAg和HBsAg的A3超型特异性表位,预测得到的5条候选表位经酶联免疫斑点(ELISPOT)实验检测后,证实每条多肽均可以引起两种或两种以上A3超型等位基因限制性的T细胞应答。此结果提示HLASSB_PreD可以有效地从抗原蛋白分子中筛选HLA-I类分子超型特异性表位。  HLA分子具有高度多态性,每个编码的HLA分子都识别一系列不同的多肽,而大多数HLA分子的结合多肽的特异性没有得到实验验证。建立只有极少或者没有多肽结合数据的HLA分子结合肽预测模型的方法,又称为pan特异性预测方法,成为此领域的研究热点。Pan特异性预测方法是采用多个HLA分子(来源等位基因)的多肽数据建立不仅可以预测来源等位基因又可以预测只有很少或者没有结合数据的等位基因(目标等位基因)限制性多肽的方法。在本研究中,我们提出了一种基于超型模块(modular)实现pan特异性预测的方法,参考结合肽各个位点残基在对应HLA分子中结合环境的相似性(modular),采用A2和A3超型中已建立的等位基因矩阵模型生成pan特异性预测模型。我们建立的pan特异性预测模型可以分别实现A2超型35种和A3超型37种等位基因限制性多肽的预测。留一(等位基因)交叉验证法的结果显示,当给定的HLA分子只有极少已鉴定的多肽结合数据时,建立的pan特异性预测模型的性能要优于采用自身多肽数据建立的allele特异性模型的性能;应用建立的pan特异性预测模型筛选HBcAg的HLA-A*3303限制性表位,ELISPOT检测结果显示采用此模型预测得到的10条候选表位肽中有7条可以诱导HLA-A*3303阳性的健康人PBMC应答,证实了所建pan特异性模型的有效性。  本研究中提出的方法及结果对如何提高表位预测模型的性能有着重要提示。其中建立的超型特异性表位数据库(HLASSB_DB)和预测工具(HLASSB_PreD)可以通过http://www.immunoinformatic.net访问,且对所有用户免费。相信我们的研究对加速基于表位的疫苗设计和开发,尤其是对具有高人群覆盖率疫苗的设计有重要的推动作用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号