首页> 中文学位 >关于提高T细胞表位预测性能的智能计算方法的研究
【6h】

关于提高T细胞表位预测性能的智能计算方法的研究

代理获取

目录

文摘

英文文摘

华南理工大学学位论文原创性声明及学位论文版权使用授权书

第一章绪论

1.1研究背景

1.2 T细胞表位预测的概念及意义

1.3 T细胞表位预测的研究现状

1.4智能计算概述

1.4.1人工神经网络

1.4.2演化计算

1.4.3粗集理论

1.5本文的主要工作

第二章肽的预处理

2.1 T细胞表位预测的分子基础

2.2问题描述

2.3系统原型

2.3.1数据来源

2.3.2肽的预处理

2.3.3分类

2.4本章小结

第三章基于SLAM模型的增量学习算法的研究

3.1动态神经网络模型的研究现状

3.2排序学习前向掩蔽模型的选取

3.3神经网络增量学习的研究现状

3.4基于SLAM模型的快速增量学习算法

3.5实验结果和讨论

3.5.1 Benchmark实验

3.5.2 T细胞表位预测实验

3.6本章小结

第四章神经网络集成在T细胞表位预测系统中的应用

4.1神经网络集成的国内外研究现状

4.2神经网络集成系统的构造

4.2.1个体网络的生成

4.2.2各个体网络输出结果的合成

4.3试验结果和讨论

4.4本章小结

第五章基于粗集的T细胞表位预测模型

5.1粗集理论简介及其知识发现方法的研究现状

5.1.1粗集理论简介

5.1.2基于粗集理论的知识获取方法的研究现状

5.2方法

5.2.1决策表的构造

5.2.2 顺序规则获取算法

5.3实验结果和讨论

5.4本章小结

第六章基于规则集集成的T细胞表位预测模型

6.1规则集集成的研究现状

6.2方法

6.2.1初始规则集生成子算法

6.2.2规则集筛选子算法

6.2.3决策融合子算法

6.3实验结果和讨论

6.4本章小结

第七章顺序规则预剪枝方法及应用研究

7.1国内外研究现状

7.2方法

7.2.1质量指标的设计

7.2.2顺序规则预剪枝算法

7.3实验结果和讨论

7.4本章小结

第八章基于粗集理论和主成分分析的知识获取

8.1引言

8.2相关的研究成果

8.3总体相关系数

8.3.1主成分分析

8.3.2总体相关系数的计算

8.4基于粗集和主成分分析的知识获取方法

8.4.1基于粗集和主成分分析的属性约简

8.4.2基于粗集和主成分分析的属性值顺序约简

8.4.3运行实例

8.5实验结果和讨论

8.5.1试验一

8.5.1试验二

8.6本章小结

结论与展望

结论

进一步的工作与展望

参考文献

在攻读博士学位期间发表的与学位论文内容相关的学术论文

致谢

展开▼

摘要

大量研究表明:病原体感染、肿瘤发生发展、自身免疫性疾病的发生发展和组织器官移植排斥都与T细胞抗原识别和活化异常或偏离相关。T细胞表位(Tcellepitope)是指抗原经过抗原提呈细胞(APC)加工后,由主要组织相容性复合体(MHC)分子提呈给T细胞受体(TCR)的短肽。T细胞表位预测是指借助于计算机的海量数据处理能力,从数百万的蛋白质里找出既能与特定的MHC分子结合,又能与特定TCR结合的抗原肽;并在此基础上通过生物实验判断找到的抗原肽能否使得T细胞活化;若能,则确定该抗原肽为T细胞抗原表位。T细胞表位预测技术对于减少实验合成重叠肽、理解T细胞介导的免疫特异性和研制亚单位多肽及基因疫苗具有重要意义。  本课题是国家自然科学基金重点项目“T细胞特异性识别和活化信息数量化和可视化研究(No.30230350)”中的一个重要子课题。  本文针对现有基于机器学习的T细胞表位预测中亟待解决的4个问题(即预测模型的收敛速度慢、预测错误率尚可降低、可理解性差和增量学习难)进行了研究。本论文的研究工作是在利用初级锚点知识和遗传算法将MHC结合肽的亲和力预测问题转化成为一个可供计算的模式分类问题的基础上展开的。其主要创新性成果如下:  1)针对目前比较流行的基于误差反传神经网络(BPNN)的T细胞表位预测模型存在训练速度慢和难以增量学习等不足,本文选取了排序学习前向掩蔽模型(SLAM)作为预测模型,极大加快了模型的收敛速度。与此同时,本文还基于SLAM模型提出了快速增量学习算法,成功实现了对新增样本的快速增量学习。实验结果表明,基于SLAM模型的T细胞表位预测模型能够在很短的时间内快速实现增量学习。  2)为进一步降低T细胞表位预测错误率,本文首次提出了基于神经网络集成的预测模型。实验结果显示该模型在预测错误率上较单个神经网络模型有明显降低。  3)模型的可理解性对于帮助生物学专家理解MHC分子与抗原肽的结合机理肓着重要意义。于是,本文提出了基于粗集的T细胞表位预测模型,其中包含了基于信息熵的属性约简完备算法和结合锚点知识的属性值顺序约简算法。该模型将MHC结合肽的领域知识巧妙地融入到了基于粗集理论的知识获取方法中,从而使得该模型在基本维持了与神经网络预测模型同等预测错误率的情况下,提取出了易于专家理解的产生式规则。这些规则有助于生物学专家将其注意力集中于某些很可能的关键模式上,并便于生物学专家通过对这些很可能的关键模式的验证和分析来进一步理解蕴含于其中的免疫学机理。  4)为了进一步降低预测错误率,受神经网络集成思想的启发,本文提出了规则集集成算法(RSEN),并构造出了基于该算法的T细胞表位预测模型。该模型能够充分利用来自各种不同的属性约简和属性值约简算法的多样性优势。实验结果表明,基于RSEN算法的T细胞表位预测模型不仅继续保持了所获取到的规则的易理解性,而且具有比基于BPNN或粗集的T细胞表位预测模型更低的预测错误率。  5)为了进一步增强T细胞表位预测模型的可理解性,本文在设计出了一整套描述规则与决策表的定量指标的基础上,提出了基于粗集的顺序规则预剪枝算法,并将MHC结合肽的领域知识融合到了该算法中。MHCⅡ类分子结合肽的实验结果表明,该算法能够在降低或维持原有预测错误率的同时,大大减少了所获取到的顺序规则集中规则的数目和长度。  6)在研究基于粗集理论的知识获取方法的过程中,本文发现了现有大部分属性约简算法的共同特征(即过度依赖“保持决策表的原有分类能力不变”的基本思想)在一定程度上会削弱获取到的规则的推广能力,于是,提出了一种新颖的基于粗集和主成分分析的知识获取方法。该方法在进行知识获取的过程中,利用主成分分析方法所获得的信息(我们把它称为总体相关系数)来有重点地保留原始决策表中较为重要的某些条件属性和属性值,以便最大限度地降低属性约简和属性值约简对原始决策表中条件属性包含的“因”信息所造成的损耗,以期增强获取到的规则集的推广能力。最后,实验验证了该方法所获得的规则集的推广能力比其他方法所获得的规则集的推广能力更强。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号